Mejores prácticas para la publicación de Listados Taxonómicos

Versión 2.1

cover art stilt

Control del documento

Version Descripción Fecha de lanzamiento Autor(es)

1.0

Versión de lanzamiento

1° Abril 2011

David Remsen

1.11

Cambios editoriales menores

28 Abril 2011

David Remsen

2.0

Transferido a wiki, cambios importantes

30 Marzo 2017

Kyle Braak

2.1

Transferido a AsciiDoctor

24 Mayo 2021

Matthew Blissett

Citación sugerida

GBIF (2017) Mejores Prácticas en la Publicación de Listados de Especies, versión 2.1. Copenhague: Secretariado de GBIF. https://ipt.gbif.org/manual/en/ipt/2.5/best-practices-checklists

Imagen de portada: Gregory Basco, Tero Real, Himantopus mexicanus

Introducción

Esta guía proporciona detalles sobre cómo utilizar el formato Darwin Core Archive (DwC-A) como un medio para compartir información de listados taxonómicos de manera estándar. Se centra en componentes específicos del formato Darwin Core Archive y en algunas de las extensiones de apoyo a la clase de datos taxonómicos básicos, y ofrece recomendaciones sobre cómo utilizar mejor estos componentes para maximizar el valor de los datos compartidos. Esta guía no proporciona una descripción detallada del formato de Darwin Core Archive; en su lugar, consulte la Guía práctica e Darwin Core Archives.

El formato DwC-A y el perfil específico aquí descripto representan un formato de intercambio de datos ratificado y reconocido internacionalmente para compartir datos taxonómicos. Todos los estándares de intercambio de datos deben lograr un equilibrio entre el alcance técnico y la capacidad, por un lado, y la aceptación y aceptación social por el otro. Las soluciones simples sacrifican la cobertura y la complejidad a favor de la facilidad de uso. Los formatos muy complejos proporcionan soluciones más completas para representar cualquier tipo de datos, pero a expensas de la simplicidad y requieren software de apoyo y experiencia. El formato Darwin Core Archive representa una posición intermedia entre los dos extremos de este espectro. Se centra en los elementos clave de los listados taxonómicos y permite vincular un conjunto enriquecido de tipos de datos a esta estructura central. Los datos contenidos en un archivo pueden ser fácilmente comprendidos y utilizados por muchos biólogos y administradores de datos familiarizados con archivos de texto estructurados básicos. Al proporcionar un estándar internacional que sea relativamente fácil de producir y consumir, y que respalde muchos de los elementos clave que componen un recurso de datos taxonómicos, GBIF espera brindar a los creadores y administradores de listados taxonómicos un enfoque estandarizado para compartir sus datos y promover enfoques a la posterior cita y reconocimiento de su trabajo. Un formato estándar también aumenta la relevancia y la utilidad.

Alcance

Los términos "listados taxonómicos" y "catálogo" taxonómico pueden referirse a una gama superpuesta de recursos taxonómicos. Todos estos productos contienen conjuntos de nombres científicos que se refieren implícita o explícitamente a taxones. El conjunto de nombres incluidos en dicha lista puede estar restringido por grupo taxonómico, región geográfica o por un tema, como especies invasoras, o alguna combinación de los tres. En orden de mayor detalle, se incluyen los siguientes tipos de recursos en nota al pie: [Estas categorías y descripciones se derivan directamente de “Hyam. R., Normalización del Intercambio de Datos en la Infraestructura Paneuropea de Directorios de Especies (PESI) Entregable D 4.1 ”].

  1. Listas de nombres – Listas simples de nombres de especies sin una indicación explícita del estado taxonómico, pero generalmente se supone que consisten en nombres aceptados de taxones. Por lo general, estas listas están destinadas a identificar un conjunto de taxones incluidos en algún contexto regional o temático.

  2. Listas nomenclaturales (Nomencladores) - Listas de nombres que incluyen los taxones nominales, es decir, el registro de usos publicados de nombres científicos que representan actos de nomenclatura según se rigen por los respectivos Códigos de Nomenclatura. La mayoría de estos actos son "descripciones originales" de nuevos nombres científicos, pero otros actos pueden incluir enmiendas, lectotipificaciones y otros actos regidos por los Códigos. La sinonimia no se incluye en estas listas como concepto taxonómico, sino solo como una combinación recién establecida (para los botánicos) vinculada a un basiónimo, proporcionando así un sinónimo nomenclatural.

  3. Listado taxonómico – Estas listas amplían las listas de nomenclatura al agregar opiniones taxonómicas en forma de información explícita sobre el estado taxonómico y la inclusión de nombres colocados en sinonimia. Los listados taxonómicos simples en esta categoría no proporcionan detalles de circunscripción específicos con respecto a la base de la sinonimia. Los taxones a menudo se organizan en clasificaciones. El término "catálogo taxonómico" también puede usarse para referirse a instancias de este y las categorías restantes, particularmente si el recurso incluye publicación verificada y detalles del estado taxonómico.

  4. Listados taxonómicos anotados - Esta categoría amplía los listados taxonómicos al agregar otros tipos de datos (anotaciones) al listado taxonómico central, sinonimizado, como nombres comunes, estado de amenaza, distribución e información descriptiva básica. Cuando los tipos de anotaciones proporcionan suficiente detalle para definir o circunscribir de forma eficaz un taxón, como descripciones e ilustraciones de diagnóstico detalladas, datos moleculares, especímenes, etc., el listado anotado puede pertenecer a una de las dos categorías definidas a continuación.

  5. Listas de Flora o Fauna – Estas suelen ser libros que proporcionan cuentas detalladas de especies para una región en particular. Los detalles pueden incluir muchos de los tipos de datos incluidos en los listados taxonómicos anotados, pero incluyen tipos de datos específicos, como descripciones e ilustraciones detalladas, referencias de especímenes y otros detalles que definen (circunscriben) explícitamente el taxón dentro del alcance de la región, que no es necesariamente global.

  6. Monografías - Las monografías son relatos detallados de especies que a menudo se publican como libros para un grupo taxonómico en particular a escala mundial. Contendrá nomenclatura detallada y detalles de sinonimia y circunscripción de taxón, que incluyen descripciones textuales e ilustraciones, detalles de especímenes examinados e incluidos en la definición, y una bibliografía de la literatura examinada.

El formato Darwin Core Archive con [GBIF Checklist Extensions] admite el intercambio de elementos de datos clave dentro de todos estos tipos de datos del listado taxonómico . El grado específico de cobertura depende mucho del recurso individual. En este documento usaremos el término "listado taxonómico" en el sentido amplio como un término general para referirnos a cualquiera o todas las categorías de recursos descritas anteriormente. Los tipos de categoría específicos se utilizarán cuando se haga referencia a un recurso específico.

Formato del Archivo Darwin Core

Archivo Darwin Core (DwC-A) es un estándar de datos informáticos que utiliza los términos de Darwin Core para producir un conjunto de datos único e independiente para los datos del listado taxonómico. La recopilación de archivos en un archivo forma un conjunto de datos autónomo, que se puede proporcionar como un solo archivo comprimido (Zip o Gzip). Un conjunto de datos se compone de un documento de metadatos descriptivo y un conjunto de uno o más archivos de datos. Para obtener más información sobre DwC-A, consulte la Guía práctica de los archivos de Darwin Core.

Metadatos de Listado Taxonómico

Es necesario documentar la procedencia y el alcance de los conjuntos de datos para publicar los datos del listado taxonómico a través de la red GBIF. La documentación del conjunto de datos se denomina "metadatos de recursos" y permite a los usuarios evaluar la idoneidad para el uso de un conjunto de datos. Puede describir el alcance y la función prevista del listados, las metodologías y los recursos utilizados para su compilación, y las personas y organizaciones involucradas en su creación y gestión. Los metadatos se comparten en un Archivo Darwin Core como un documento XML. GBIF proporciona un perfil de metadatos para listados taxonómicos de especies basado en el lenguaje de metadatos ecológicos. Una guía práctica describe todas las opciones para describir un listado taxonómico de especies utilizando este formato. Consulte Perfil de metadatos de GBIF - Guía práctica.

Datos del Listado Taxonómico

El formato Archivo Darwin Core proporciona el marco estructural para publicar listados taxonómicos de especies. Los Archivos de Darwin Core constan de una serie de uno o más archivos de texto, en formato estándar delimitado por comas o tabuladores. Los archivos están organizados lógicamente en forma de estrella con un archivo central, que contiene los elementos básicos del listado taxonómico (lista de especies, clasificación, sinonimia) rodeados por una serie de 'extensiones', que describen tipos de datos relacionados (como nombres comunes). Los vínculos entre los registros centrales y de extensión se realizan utilizando un elemento de datos de identificador de taxón (taxonID). De esta manera, pueden existir muchos registros de extensión para cada registro de taxón principal. Este "esquema en estrella" proporciona un modelo de datos relacional simple que admite muchos tipos de anotaciones que son comunes a los listados taxonómicos de especies.

dwc a checklist
Figure 1. Archivos de datos de Archivo Darwin Core en 'esquema en estrella'

Recomendaciones de formato de archivo de datos

Para facilitar la comprensión, podemos utilizar los términos campo en esta guía para hacer referencia al conjunto de términos de Darwin Core en el perfil de publicación taxonómica al que se asignarán los datos de un usuario. Por ejemplo, nos referiremos al uso del campo dwc:scientificName cuando nos refiramos al término Darwin Core, scientificName.

  • Se recomienda utilizar tabulaciones o valores separados por comas (CSV) en lugar de delimitadores de campo personalizados y comillas.

  • Sea cuidadoso y consistente con el uso de las comillas.

  • Codifique los archivos de texto como UTF-8

  • Asegúrese de reemplazar todos los saltos de línea en un campo de datos, es decir, \r \n o \r\n con espacios simples o use 2 caracteres como $$ para reemplazar \r para escapar del salto de línea si la intención es preservarlos. Otra opción es reemplazar los saltos de línea con la etiqueta HTML <br> .

  • Codifique los valores nulos como cadenas vacías, es decir, sin caracteres entre 2 delimitadores, o \N o` \NULL`, ¡pero ninguna otra secuencia de texto!

Compartir Nombres Científicos

Darwin Core admite más de una forma de compartir un nombre científico. Esto incluye las siguientes opciones:

A. Concatenado en el campo scientificName

scientificName

Gerardia paupercula var. borealis (Pennell) Deam

El campo dwc:scientificName almacena el nombre científico completo de un taxón, incluida la autoría. Este campo siempre debe llenarse con datos incluso si los nombres están divididos en partes componentes (como en C. a continuación). Las bases de datos que no proporcionan una separación clara entre la parte del nombre y la parte de la autoría del nombre deben usar este campo para toda la cadena de nombres concatenados. Esto puede ser necesario para fórmulas híbridas, nombres sensu stricto, autónimos y otros binomios no triviales. Este campo se utiliza generalmente en combinación con el campo dwc:taxonRank para almacenar las partes del nombre científico de un listado taxonómico completo que incluye los taxones superiores.

B. Partes Separadas de Nombre y Autoría

scientificName scientificNameAuthorship

Gerardia paupercula var. borealis

(Pennell) Deam

Algunas bases de datos separan un nombre científico en una parte de nombre y una parte de autoría. En este caso, deben usarse los campos dwc:scientificName y dwc:scientificNameAuthorship.

C. Separado en Partes de Nombre

Genus specificEpithet taxonRank infraspecificEpithet scientificNameAuthorship

Gerardia

paupercula

var.

borealis

(Pennell) Deam

Darwin Core proporciona una serie de términos que permiten separar los nombres científicos en partes componentes. Algunas bases de datos almacenan listas de especies en dichos componentes analizados. En este caso, compartir datos en este formulario puede ser una opción. Sin embargo, si es así, se recomienda encarecidamente que se componga un nombre adicional y completo a partir de las partes y se comparta en el campo dwc:scientificName (como en la sección A anterior). Tenga en cuenta que en la tabla anterior, el término Darwin Core, dwc:subgenus, no se muestra pero representa un componente de nombre adicional.

Marcadores Infragenéricos

Si es posible, proporcione un marcador de rango infragenérico como parte del nombre científico para evitar confusiones con el autor original / basónimo. Por ejemplo “Ageratina subgen. Apoda R.M.King & H.Rob" es preferible a "Ageratina (Apoda) R.M.King & H.Rob". ya que el posterior Apoda podría interpretarse como un subgénero o como el autor del basónimo.

Publicar Clasificaciones

Darwin Core proporciona dos opciones básicas para publicar clasificaciones o jerarquías taxonómicas; normalizado y desnormalizado. Estas dos opciones representan el medio principal por el que la mayoría de las clasificaciones se gestionan en las bases de datos.

Clasificaciones Normalizadas (Padre/Hijo)

La forma recomendada de compartir una clasificación es en formato normalizado. Esto también se puede denominar en una base de datos como una "relación padre-hijo" o una "lista de adyacencia". En una jerarquía taxonómica normalizada, cada taxón está representado por una única fila. Esto incluye tanto las especies como todos los taxones superiores de la clasificación. Cada fila tiene al menos los siguientes elementos de datos de componentes.

  • A dwc:taxonID se refiere al taxón actual. Puede utilizar los identificadores que tenga.

  • El dwc:scientificName del taxón actual. Ejemplo: "Panthera tigris"

  • El dwc:taxonRank * del taxón de referencia. Ejemplo: "*especie"

  • Una referencia al identificador de taxón del taxón padre inmediato almacenado en dwc:parentNameUsageID. En el siguiente ejemplo, el padre del registro 7, para "Panthera tigris (Linnaeus)" es el registro 6, el género "Panthera".

A continuación se ilustra una clasificación de muestra para una sola especie, el tigre, “Panthera tigris”. Tenga en cuenta que el miembro superior de una jerarquía no tiene padre, por lo que el identificador principal debe estar vacío. Tenga en cuenta que dwc:scientificName proporciona un campo común para almacenar el nombre en este caso, pero que el conjunto completo de opciones para los nombres se describe anteriormente en Compartir Nombre Científicos.

taxonID taxonRank scientificName parentNameUsageID

1

Reino

Animalia

2

Filo

Chordata

1

3

Clase

Mammalia

2

4

Orden

Carnivora

3

5

Familia

Felidae

4

6

Género

Panthera

5

7

Especie

Panthera tigris (Linnaeus)

6

Ventajas

  • Eficiencia – Una clasificación normalizada almacena una única referencia para cada taxón en la jerarquía.

  • Integridad referencial – Cada componente de taxón tiene un identificador distinto que hace referencia explícita a su padre inmediato. Es fácil verificar que la jerarquía taxonómica esté completa y debidamente formada.

  • Extensibilidad– Todos los taxones se identifican con identificadores de taxón distintos. Esto permite que los taxones superiores estén mejor documentados mediante el uso de extensiones de la misma manera que los registros de especies.

Desventajas

  • Conveniencia - Una clasificación normalizada no proporciona una vista intuitiva de la jerarquía de clasificación cuando se ve en forma tabular sin procesar. Muchos biólogos gestionan las clasificaciones en un formato desnormalizado menos eficiente, pero visualmente más intuitivo, que se describe a continuación. La transformación de una clasificación desnormalizada a la forma normalizada es difícil de realizar manualmente.

Un dwc:parentNameUsageID debe apuntar a un registro existente en el conjunto de datos. No es válido señalar identificadores de taxón superiores que no existen como registros.

Clasificaciones Desnormalizadas

Este formato es familiar para cualquiera que maneje información de especies en hojas de cálculo. En una clasificación desnormalizada, cada fila de la tabla de datos se refiere a uno de los taxones terminales, como una especie, y un conjunto completo de taxones parentales como un conjunto de columnas, una para cada taxón parental.

Este formato no es el método recomendado para compartir datos taxonómicos utilizando Archivo Darwin Core, pero es compatible con GBIF, ya que es de uso común en muchas listas de especies. Si este es el método por el cual se compartirán los datos, se recomienda encarecidamente que

  1. cada columna de taxón superior está completamente poblada. Evite los espacios en blanco como en el ejemplo de Plantae a continuación.

  2. Asegurar la integridad taxonómica de la lista. Por ejemplo, asegúrese de que dos especies de un género común compartan la misma familia. Asegúrese de que, si se incluyen sinónimos en filas separadas, su clasificación coincide con la del taxón aceptado.

taxonID kingdom phylum class order family scientificName

1001

Animalia

Chordata

Mammalia

Carnivora

Felidae

Panthera tigris

1002

Animalia

Chordata

Mammalia

Carnivora

Felidae

Panthera leo

1003

Animalia

Arthropoda

Insecta

Hymenoptera

Apidae

Apis mellifera

1004

Plantae

 — 

 — 

 — 

Poales

Poa annularis

Ventajas

  • Legibilidad - La principal ventaja de este formato es que es fácil de leer y la jerarquía taxonómica se puede evaluar simplemente leyendo columnas.

  • Conveniente - Las aplicaciones de hojas de cálculo y muchas bases de datos relacionales facilitan la implementación de esta estructura para almacenar datos jerárquicos.

Desventajas

  • Mayor probabilidad de pérdida de integridad referencial - Los taxones más altos se repiten en este formato, lo que puede aumentar la posibilidad de que dos taxones idénticos se escriban de manera diferente. Otros riesgos similares son posibles con este formato. Por ejemplo, es posible que dos instancias del mismo taxón (por ejemplo, "Felidae") se asignen a dos padres diferentes, lo que da como resultado un conflicto de integridad jerárquica.

  • Falta de detalles para taxones superiores – este formato trata a los taxones superiores como propiedades de una especie, no como registros de taxones separados en sí mismos. Por lo tanto, este formato no permite que las propiedades de taxones superiores se compartan ni en el archivo principal ni en ninguna extensión.

Otras recomendaciones relacionadas con clasificaciones

  • Intente incluir un Reino y una referencia de código de nomenclatura para todos los registros, incluso para las listas de especies básicas.

  • Intente incluir Reino, Filo y Familia como una clasificación mínima para las clasificaciones desnormalizadas.

  • Si es el mismo en todo el conjunto de datos, considere usar un mapeo estático del término y el valor. Consulte la Guía práctica de Darwin Core Archive en Archivos Darwin Core - Guía Práctica para obtener detalles sobre el mapeo de valores globales.

Formatos de Clasificación no recomendados para publicación

Los siguientes ejemplos ilustran configuraciones de datos que pueden ajustarse al perfil pero que GBIF no recomienda ni admite (es decir, los analizadores de GBIF no manejarían estos casos correctamente)

  1. Este ejemplo identifica el taxón de referencia como la última columna que contiene los valores del taxón.

    taxonID kingdom phylum class order family scientificName

    997

    Animalia

    998

    Animalia

    Chordata

    999

    Animalia

    Chordata

    Mammalia

    1000

    Animalia

    Chordata

    Mammalia

    Carnivora

    1001

    Animalia

    Chordata

    Mammalia

    Carnivora

    Felidae

    1002

    Animalia

    Chordata

    Mammalia

    Carnivora

    Felidae

    Panthera tigris

    1003

    Animalia

    Chordata

    Mammalia

    Carnivora

    Felidae

    Panthera tigris

  2. Este ejemplo intenta es similar al anterior, pero intenta reducir los errores de integridad registrando solo los nombres de taxón más altos una vez.

    taxonID kingdom phylum class order family scientificName

    997

    Animalia

    998

    Chordata

    999

    Mammalia

    1000

    Carnivora

    1001

    Felidae

    1002

    Panthera tigris

    1003

    Panthera leo

Por favor, evite publicar datos en estas configuraciones.

Publicación de Sinonimias

El Archivo Darwin Core apoya la publicación de sinónimos en listados taxonómicos de especies. Un sinónimo se publica como un registro separado en el archivo de datos principal. Un sinónimo hace referencia al registro de taxón aceptado mediante el uso del campo dwc:acceptNameUsageID. Este campo contiene el dwc:taxonID que representa el registro de taxón aceptado. En el ejemplo simplificado a continuación, el primer registro representa el nombre aceptado para un taxón y los registros 2 y 3 son sinónimos.

taxonID scientificName acceptedNameID taxonomicStatus nomenclaturalStatus

1

Coeligena helianthea (Lesson 1838)

1

accepted

2

Ornismya helianthea Lesson 1838

1

Homotypic synonym

3

Helianthea helianthea (Lesson 1838) J. Gould 1848

1

Homotypic synonym

4

Helianthea typica Bonaparte 1850

1

Heterotypic synonym

nomen dubium

5

Helianthea porphyrogaster Mulsant 1876

1

Heterotypic synonym

nomen dubium

6

Coeligena helianthea tamai Berlioz & Phelps 1953

1

Heterotypic synonym

nomen dubium

Se recomienda que un registro de sinónimos contenga un dwc:taxonID distinto o puede que no tenga dwc:taxonID en absoluto. No debe usar el mismo dwc:taxonID que el registro de taxón aceptado. La representación más simple de la sinonimia es la que se proporciona en el ejemplo anterior, donde los sinónimos se enumeran como registros distintos y "apuntan" al registro de taxón aceptado mediante dwc:acceptNameUsageID. Esta sinonimia simple apoya la publicación de listados taxonómicos básicos con detalles de sinónimos limitados a los elementos de la clase de taxón principal. El campo dwc:taxonomicStatus afirma el estado del registro. Un vocabulario recomendado para este campo es disponible. Se pueden incluir detalles de nomenclatura adicionales que también pueden respaldar la justificación detrás de la sinonimia utilizando el campo dwc:nomenclaturalStatus y vocabulario de apoyo.

La sinonimia detallada se puede respaldar asegurando que se incluya un dwc:taxonID único en cada registro de sinónimos y utilizando las extensiones disponibles para respaldar el intercambio de anotaciones de listados taxonómicos. Esto admite la vinculación de uno o más registros bibliográficos, registros de muestras y otros tipos de datos admitidos por las [GBIF Checklist Extensions] a un solo registro de sinónimo en el archivo de datos principal. Si no se proporciona un dwc:taxonID para un registro de sinónimo, no se pueden usar extensiones ya que se basan en dwc:taxonID para proporcionar el enlace al registro de taxón en el archivo principal. Un ejemplo simplificado a continuación ilustra el uso de dos archivos (expresados como tablas) para proporcionar una bibliografía para un sinónimo usando la extensión References. El dwc:taxonID compartido se resalta en el ejemplo.

Archivo de datos Taxon.txt

taxonID scientificName acceptedNameUsageID taxonomicStatus

1

Coeligena helianthea

1

aceptado

2

Ornismya helianthea

1

sinónimo

3

Helianthea helianthea

1

sinónimo

Archivo de datos References.txt

taxonID Cita bibliográfica

2

Schmidt, O. 1870. Grundzüge einer Spongien-Fauna des atlantischen Gebietes. (Wilhelm Engelmann: Leipzig): iii-iv, 1-88, pls I-VI.

2

Laubenfels, M.W. De 1942. Porifera from Greenland and Baffinland collected by Capt. Robert A. Bartlett. Journal of the Washington Academy of Sciences 32(9): 263-269.

Otras Sinonimias, que se debe y que no se debe hacer

  • Un dwc:parentNameUsageID debe apuntar a un registro existente en el conjunto de datos. No es válido señalar identificadores de taxón superiores que no existen como registros.

  • No confunda el dwc:higherTaxonID utilizado para describir una clasificación con el dwc:acceptedNameUsageID utilizado para describir el estatus taxonómico de un registro.

  • No “encadene” sinónimos. Un sinónimo solo debe apuntar a registros de taxón aceptados a través de dwc:acceptNameUsageID. Nunca deben apuntar a otro sinónimo.

Sinonimia Nomenclatural

Sinonimia Nomenclatural está soportada en el archivo de datos principal mediante el uso del campo dwc:originalNameUsageID. Este campo se refiere a la fila que representa la referencia de taxón original para el nombre. Se recomienda este registro para proporcionar una cita bibliográfica en el campo dwc:namePublishedIn, que hace referencia a la publicación en la que se estableció originalmente el nombre.

taxonID scientificName originalNameID namePublishedIn

1

Tetrao afer Müller 1778

1

J. Syst. Nat 7:31

2

Pternistes afer (Müller 1778)

1

3

Francolinus afer afer (Müller 1778)

1

Los sinónimos nomenclaturales y taxonómicos pueden designarse en el mismo registro de taxón.

Un dwc:originalNameUsageID debe apuntar a un registro existente en el conjunto de datos. No es válido señalar taxones aceptados que no existen como registros.

Sinonimia Pro-parte

A veces, el mismo nombre puede ser sinónimo de más de un taxón aceptado o puede ser tanto un nombre de taxón aceptado como un sinónimo. Estos son causados por divisiones y cambios de circunscripción donde, por ejemplo, una serie de tipos puede dividirse entre múltiples taxones. La práctica recomendada para compartir sinónimos pro-parte se representa en el ejemplo. En este ejemplo, Vireo solitarius es un nombre de taxón aceptado y también se incluye en la sinonimia de Vireo cassinii y Vireo plumbeus. En el caso de los sinónimos, se representan como un solo registro con la referencia de taxón aceptada concatenada en el campo dwc:acceptNameUsageID y separados por un carácter de barra vertical ("|").

taxonID scientificName acceptedNameUsageID taxonomicStatus

1

Vireo solitarius

1

aceptado

2

Vireo cassinii

2

aceptado

3

Vireo plumbeus

3

aceptado

4

Vireo solitarius

2|3

pro-parte

Los usuarios de IPT deben definir el delimitador de valores múltiples para cada archivo de origen en el IPT. Consulte sección de Datos de origen del Manual de usuario de IPT para obtener orientación adicional.

Citación y Atribución

Los listados taxonómicos a menudo representan importantes esfuerzos intelectuales y financieros por parte de las personas y organizaciones que los compilan. Algunos listados taxonómicos pueden derivarse de, o pueden hacer referencia a, otros listados taxonómicos de fuentes para crear nuevas vistas temáticas, regionales o taxonómicas distintas de la misma autoridad fuente. Por lo tanto, la atribución y visibilidad adecuadas de estas fuentes es una alta prioridad.

El formato DwC-A proporciona una variedad de opciones y recomendaciones para proporcionar citas y atribuciones adecuadas. Este rango se extiende desde la información global de citas y atribuciones que forman parte de los metadatos del recurso hasta los elementos de datos a nivel de registro. Estas opciones respaldan la provisión de múltiples niveles de atribución.

Citación y Atribución de Metadatos

El perfil de metadatos de GBIF admite elementos de datos a nivel de recursos que contribuyen a la cita y atribución y permiten una descripción detallada del alcance y la procedencia de un listado taxonómico. Una lista de referencia completa de todos los elementos de metadatos está más allá del alcance de este documento y diponible, pero los elementos específicos relacionados con la cita y la atribución incluyen:

  • Derechos de Propiedad Intelectual – El perfil de metadatos contiene una declaración de gestión de derechos para el recurso o una referencia a un servicio que proporciona dicha información, como una licencia Creative Commons. También incluye un elemento que describe el uso previsto y el propósito del conjunto de datos.

  • Individuos y organizaciones – El perfil de metadatos permite la descripción de todas y cada una de los individuos, instituciones u organizaciones que pueden estar asociados con un conjunto de datos. A estos agentes se les pueden asignar diferentes roles en relación con el conjunto de datos y pueden incluir URL a cada recurso. Esta sección proporciona un método para describir y vincular a individuos y organizaciones que han contribuido a un listado taxonómico.

  • URL de la fuente – Enlaces a la página de inicio de la fuente

  • Información del proyecto – Si el listado taxonómico está vinculado a un proyecto en particular (por ejemplo, "El Catálogo de la Vida"), hay un conjunto de campos para describir el proyecto en detalle.

  • Citación – Este elemento permite al editor del listado taxonómico especificar exactamente cómo se deben citar los datos del listado taxonómico cuando se utilicen. Ejemplo “Apelantes W, Bouchet P, Boxshall GA, Fauchald K, Gordon DP, Hoeksema BW, Poore GCB, van Soest RWM, Stöhr S, Walter TC, Costello MJ. (eds) (2011). Registro mundial de especies marinas. Consultado en http://www.marinespecies.org el 22 de febrero de 2011”.

  • Bibliografía - Se puede describir e incluir una bibliografía completa de fuentes en el documento de metadatos.

Citación y Atribución a nivel de Datos

La información sobre atribuciones y citas registrada en el documento de metadatos es común a todos los registros de datos de un conjunto de datos. En algunos casos, se necesita una granularidad adicional incluso en los registros individuales. En estos casos, existen términos a nivel de registro que se recomiendan para su uso al especificar la información de citas y atribuciones.

  • dwc:nameAccordingTo: Este término puede usarse para identificar al individuo o cita que sirve como referencia taxonómica autorizada para el registro. (Ejemplo “Erpenbeck, D .; Van Soest, RWM 2002. Familia Halichondriidae Gray, 1867. Pp. 787-816. En Hooper, JNA & Van Soest, RWM (ed.) Systema Porifera. Una guía para la clasificación de esponjas.")

  • dwc:nameAccordingToID: Un identificador único que devuelve la referencia nameAccordingTo como se describe arriba. Podría ser una URL, por ejemplo.

  • dwc:datasetName: Si el registro se deriva de un conjunto de datos externo, este conjunto de datos se puede citar como una cadena de texto. (Ejemplo, "Registro mundial de especies marinas, citado el 12 de abril de 2011")

  • dwc:datasetID – Un identificador que se refiere a un conjunto de datos, preferiblemente que se pueda resolver.

  • dc:source - Enlace a la página web de la fuente

Caso de Uso 1 - Listado taxonómico compuestos por múltiples conjuntos de datos que contribuyen (por ejemplo, Catálogo de la Vida, PESI, WoRMS)

Un conjunto de datos taxonómicos puede ser una combinación de múltiples fuentes contribuyentes, cada una de las cuales debe reconocerse además del recurso colectivo en sí. Hay muchos ejemplos de esto. Quizás el mayor esfuerzo colectivo de este tipo es el listado taxonómico anual del Catálogo de la Vida, que tiene como objetivo proporcionar una lista completa de todas las especies vivientes del mundo. El listado taxonómico en sí está compuesto por conjuntos de datos individuales que representan los principales grupos taxonómicos. Cada uno de estos recursos, a su vez, puede estar compuesto por contribuciones de una subred de especialistas.

Otros ejemplos incluyen la Lista Pan-Europea de Especies, que se compone de varios conjuntos de datos contribuyentes que incluyen Fauna Europaea, el Registro Europeo de Especies Marinas, Euro + Med PlantBase y otros. El Registro Mundial de Especies Marinas (WoRMS) representa otra red de este tipo.

La práctica recomendada para documentar eficazmente la procedencia de este tipo de recursos se puede resumir de la siguiente manera.

  1. Se crea un único documento de metadatos para representar el recurso colectivo en sí (por ejemplo, el Catálogo de la Vida, el Registro Mundial de Especies Marinas, etc.). Este documento de metadatos proporciona la cita, los agentes, los derechos y otros elementos adecuados identificados anteriormente. El nombre de archivo de este documento se hace referencia al archivo descriptor del Archivo Darwin Core, meta.xml. Esto vincula el documento a todo el conjunto de datos DwC-A. La mejor práctica recomendada es que este archivo utilice el perfil de metadatos GBIF y se denomine EML.xml. En este caso, el XML del descriptor de metadatos se vería así:

    <archive xmlns="http://rs.tdwg.org/dwc/text/" metadata="eml.xml">
  2. Se pueden crear documentos de metadatos adicionales para cada uno de los conjuntos de datos de componentes e incluirlos en el archivo. Esto permite que cada conjunto de datos de subcomponentes se documente tan completamente como el conjunto de datos "principal" con su propia cita recomendada, personas contribuyentes, etc. Como estos conjuntos de datos no documentan la colección completa, no se hace referencia a ellos en el archivo descriptor meta.xml. En su lugar, se hace referencia a ellos desde registros de datos individuales a través del término dwc:datasetID. Si los documentos de metadatos están incluidos en el archivo en sí, dwc:datasetID es igual al nombre de archivo del documento. Alternativamente, podría hacer referencia a una URL o algún otro identificador único y que se pueda resolver para la información. Un enfoque menos recomendado pero alternativo sería agregar una URL a una página web simple que describa el conjunto de datos en lugar de un documento de metadatos estructurado.

  3. Para citar individuos a nivel de registro, proporcionando un tercer nivel de cita, se recomienda utilizar el campo dwc:nameAccordingTo. Más arriba se proporcionan términos adicionales a nivel de registro.

Caso de Uso 2 - Listados taxonómicos derivados de una o más fuentes de autoridad

En este caso de uso, un listado taxonómico de especies se compila para un propósito específico, pero su estructura taxonómica básica deriva de uno o más listados taxonómicos externos que sirven como archivos de autoridad. La nueva compilación puede incluir anotaciones adicionales al registro de origen básico que se aplican al enfoque de los nuevos listados. Un ejemplo podría ser listado taxonómicos de especies nacionales europeos derivado de una base de datos como Fauna Europaea o el Catálogo de la Vida, que, en principio, proporcionan la lista completa de un país como un subconjunto de su propia cobertura. Una lista nacional puede agregar detalles regionales adicionales, como un estado de amenaza nacional o alguna otra propiedad de interés, lo que da como resultado un nuevo conjunto de datos derivado. En este caso, es importante poder proporcionar atribuciones y vínculos a nivel de registro con el conjunto de datos de origen. Los medios recomendados para hacer esto son los siguientes.

  1. Se crea un único documento de metadatos para representar el nuevo recurso derivado en sí mismo (por ejemplo, Listado Taxonómico Nacional de los Países Bajos). Los conjuntos de datos a los que se hace referencia se pueden citar en este documento de metadatos.

    1. Completamente descritas como organizaciones con un rol de Colaborador y enlaces al sitio web de origen.

    2. Citado en la sección bibliográfica con la cita representada según lo recomendado por el conjunto de datos referenciado.

  2. En los archivos de datos, se pueden realizar atribuciones y vínculos adicionales a nivel de registro. Esto incluye:

    1. Hacer referencia al conjunto de datos por nombre en dwc:datasetName

    2. Hacer referencia al conjunto de datos por ID (como URL) en dwc:datasetID y vincularlo a la página de inicio del conjunto de datos

    3. Proporcionar un enlace a la página de la especie correspondiente en el sitio web del conjunto de datos al que se hace referencia utilizando dc:source

      1. Si dc:source está reservado para apuntar a la URL de la base de datos derivada, aún se puede agregar un enlace a la base de datos de origen utilizando la extensión de Identificadores Alternativos.

    4. Si el conjunto de datos de origen proporciona identificadores únicos a nivel mundial para los taxones a los que se hace referencia en la lista, se pueden utilizar como taxonID en el conjunto de datos derivado. Esto asegura un enlace explícito al taxón de origen y es muy recomendable si está disponible.

    5. Utilice dwc:nameAccordingTo o dwc:nameAccordingToID para hacer referencia a la definición de taxón en el registro de origen correspondiente como una cita o una URL.

Compartiendo Nombres Vernáculos

Se apoya el intercambio de datos de nombres vernáculos asociados con taxones en listados taxonómicos. Los nombres vernáculos se comparten como un archivo relacionado separado usando la extensión de nombres vernáculos. La extensión admite un rico conjunto de propiedades para describir usos de nombres vernáculos que incluyen calificadores regionales y morfológicos.

myristica fragrans

Los nombres vernáculos se referencian a través de una extensión, por lo tanto, deben estar vinculados a un taxón con nombre en el archivo de datos principal. Se recomienda además que un registro de nombres vernáculos proporcione una referencia de idioma que identifique el idioma representado por el uso del nombre vernáculo. La mejor práctica es utilizar el Código de idioma ISO 693 para compartir información sobre el idioma. Los nombres vernáculos también pueden tener distintos usos regionales y esto se puede especificar mediante un elemento dwc:locality o, en un nivel menos preciso, utilizando un término dwc:country. Se recomienda que los nombres de países utilicen los ISO 6133 country codes.

Compartiendo Descripciones de Especies

Se admite el intercambio de información descriptiva relacionada con un taxón. Los datos descriptivos se comparten como un archivo relacionado separado mediante la extensión de descripción de taxón. Los datos descriptivos pueden asignarse a distintos tipos de descripción y, dado que los datos se publican en una extensión, se pueden vincular varios registros descriptivos a un solo taxón, lo que respalda un conjunto relativamente rico de datos por taxón. Se recomienda que se utilice vocabulario del tipo de descripción para describir la información descriptiva.

Descripciones de múltiples líneas

La información descriptiva debe limitarse a bloques de texto de un solo párrafo. Se deben evitar o administrar con cuidado varios párrafos que contengan saltos de línea para mantener la integridad de la salida del archivo de texto resultante como Archivo Darwin Core. Los campos de datos de varias líneas que se sirven como archivos de texto requieren que los delimitadores de registro, que normalmente son caracteres de salto de línea, sean distintos de los saltos de línea utilizados en un campo de varias líneas. El mejor método para admitir varias líneas en un solo campo es reemplazar los caracteres que se rompen con un carácter o un conjunto de caracteres que no se rompen y que el usuario puede reemplazar con los cortes adecuados cuando se analizan y utilizan los datos. Una opción es utilizar la etiqueta de interrupción HTML <br>.

Compartiendo Distribuciones de Especies

Se admite el intercambio de datos de distribución. Los datos de distribución se comparten como un archivo relacionado independiente utilizando la extensión de distribución de especies. Esto permite publicar varios registros de distribución por taxón. La extensión de distribución no solo se utiliza para designar descripciones de distribución nacionales o regionales, sino que también respalda la calificación de la distribución referenciada con respecto al estado de amenaza del taxón, ya sea introducido, nativo, etc., y otras propiedades que podrían ser vinculado a un área definida específica.

La mejor práctica recomendada para especificar un área distinta es a través de un identificador de área conocido o que se pueda resolver y que se publique mediante el elemento dwc:localityID.

Si se utiliza el elemento dwc:country, se recomienda utilizar los ISO 6133 country codes.

Compartir Referencias

Se apoya el intercambio de citas bibliográficas. Los datos bibliográficos se comparten como un archivo relacionado separado utilizando la {latest-reference}[extensión de referencias]. La extensión References se recomienda y está diseñada para su uso en el intercambio de información sobre sinonimia en monografías y listados taxonómicos anotados. Admite compartir una cita analizada y, por lo tanto, proporciona un formato de cita más granular que algunos de los elementos de datos de almacenamiento de citas en el archivo de datos principal, como dwc:namePublishedIn. Esta extensión admite la calificación taxonómica y nomenclatural de una referencia a través de la propiedad dc:type, que, cuando se usa con el vocabulario del tipo de referencia, se puede usar para distinguir un conjunto de referencias relacionadas con un taxón.

Compartir información de Tipos

Se apoya el intercambio de información sobre tipos y especímenes. Estos datos se comparten como un archivo relacionado independiente utilizando la extensión de tipos y muestras. Apoya el intercambio de información básica sobre especímenes tipo, especies tipo y géneros.

Compartir Enlaces e Identificadores

Es posible compartir y describir varios enlaces a recursos externos relacionados utilizando Alternate Identifier Extension. Permite a los editores de datos incorporar enlaces a la base de datos o al documento de origen a través de identificadores que se pueden resolver. Se pueden proporcionar múltiples identificadores, quizás vinculando tanto a una página web como a una respuesta de servicio web más legible por máquina, para un solo taxón. Se recomienda que se incluya un formato para cada registro para permitir al usuario saber cómo interpretar la información de respuesta si un identificador se puede resolver. Esto generalmente se hace incluyendo el tipo de medio (o tipo MIME) en este campo. Está disponible una lista completa de tipos de medio.

Creando un enlace dinámico a páginas de especie

A menudo, un enlace a una base de datos de origen sigue un formato común, que difiere solo en el número de identificación o el nombre de taxón utilizado en la URL. Esto puede resultar en un archivo de extensión extenso y detallado. El formato del Archivo Darwin Core admite una forma más eficiente de definir una plantilla de URL, que solo debe definirse una vez, y permite que se incruste una variable en la plantilla, lo que elimina la necesidad de repetir repetidamente un conjunto de URL para cada taxón del archivo de datos. Esto se hace a través del componente de metarchivo XML del Archivo Darwin Core. No usa la extensión References. Esto requiere editar el metarchivo XML, lo que requiere cierto grado de familiaridad con XML. GBIF proporciona una guía completa del metarchivo de Darwin Core.

El metarchivo admite la creación de variables en el metarchivo que pueden hacer referencia a una página web o una llamada de servicio web. Esta variable puede estar incrustada en la URL e incluir un identificador de taxón o el nombre de taxón como uno de los parámetros en la URL. Se puede hacer referencia a cualquier columna de los datos publicados encerrando el número de índice entre llaves “{}”. El identificador de taxón en el archivo de datos centrales también se puede hacer referencia a través de la variable "{id}". Los siguientes ejemplos ilustran estas características:

  1. El Sistema Integrado de Información Taxonómica (ITIS) utiliza números de serie taxonómicos (TSN) para proporcionar enlaces a las páginas de taxones en su sitio web.

    Si un archivo de datos núcleo se publica utilizando el sistema ITIS TSN, se puede componer y vincular un enlace al término "identificador" en el estándar de datos básicos utilizando la siguiente sintaxis.

    <field default="http://www.itis.gov/servlet/SingleRpt/SingleRpt?search_topic=TSN&search_value={id}" term="http://purl.org/dc/terms/identifier"/>

    donde el valor numérico original se reemplaza por la variable {id}. Este valor se derivaría del ID del núcleo.

  2. El Listado Taxonómico Anual del Catálogo de Vida 2010 proporciona identificadores similares. También admite búsquedas basadas en nombres que también se pueden codificar como URL. Por ejemplo,

    http://www.catalogueoflife.org/annual-checklist/2010/search/all/key/Struthio+camelus/match/1

    incrusta un nombre científico "Struthio camelus" en una URL. Las combinaciones de nombres científicos completos se pueden publicar en el archivo de datos principales utilizando el término básico de Darwin "scientificName". Si asumimos que este término representa la duodécima columna en nuestro archivo de datos central, podríamos usar la sintaxis

    <field default="http://www.catalogueoflife.org/annual-checklist/2010/search/all/key/{12}/match/1" term="http://purl.org/dc/terms/identifier"/>

    donde {12} representa el valor de la duodécima columna que se sustituirá en la URL.

Extensiones de Listados Taxonómicos de GBIF

El archivo de datos núcleo en un listado taxonómico contiene registros de taxón. El conjunto de términos que se pueden utilizar para describir un registro de taxón está definido por la Extensión Taxon (Core).

Cada registro de taxón se puede ampliar con uno o más registros en un archivo de extensión. El conjunto de términos que se pueden utilizar para describir cada registro de extensión está definido por su Extensión.

A continuación se muestra la lista completa de extensiones que se pueden utilizar para proporcionar información adicional sobre un registro de taxón:

Extensión de Taxón (Core)

Última versión publicada: 2015-04-24

Utilice este conjunto de términos para proporcionar la información fundamental para un listado taxonómico de especies, incluida la clasificación, la sinonimia y otros elementos clave. Cada fila de esta lista representa un nombre de taxón, ya sea un nombre aceptado o un sinónimo. Los términos de esta clase admiten diferentes métodos para representar información de clasificación. Las clasificaciones se pueden compartir "estilo hoja de cálculo" con columnas para Reino, Filo, Clase, etc. o se pueden compartir "estilo base de datos" con cada fila de taxón que posee un campo que contiene el ID de su padre inmediato. Tenga en cuenta que las tablas contienen la lista completa de términos aceptables. El requisito mínimo para compartir un listado taxonómico es tan pequeño como una lista de especies, aunque se recomienda encarecidamente una identificación adjunta. Utilice esta lista de términos para identificar los términos que mejor coincidan con los datos que se compartirán. No se deje intimidar por los nombres de los términos. Lea la descripción para localizar los términos relevantes.

Extensión de Nombres Vernáculos

Última versión publicada: 2015-02-13

Esta extensión proporciona los medios para compartir información relacionada con nombres comunes (vernáculos) vinculados a taxones en el archivo de datos central. Se pueden vincular varios nombres vernáculos al mismo taxón a través del taxonID.

Extensión de Referencias

Última versión publicada: 2015-02-13

Utilice esta extensión para describir una o más referencias bibliográficas relacionadas con un taxón en el archivo de datos núcleo. Utilice el campo de tipo para calificar las referencias. Esta extensión admite el intercambio de listados taxonómicos de sinónimos referenciadas.

Extensión de Distribución de Especies

Última versión publicada: 2015-02-13

Utilice esta extensión para compartir información sobre una o más referencias de distribución para un taxón. Uno o más registros de localidad pueden estar vinculados al mismo taxón. Por ejemplo, se pueden enumerar varias localidades, regiones o países. Utilice esta extensión para describir el estado de amenaza de un taxón, los cambios de distribución estacionales y otras propiedades vinculadas a un taxón en una región en particular.

Extensión de Descripción de Especies

Última versión publicada: 2015-02-13

Utilice esta extensión para proporcionar texto descriptivo de un taxón. Por lo general, se presenta en forma de un solo párrafo por registro, como se almacenaría normalmente en una base de datos. Las descripciones se pueden calificar por un tipo para indicar, por ejemplo, que la descripción está relacionada, por ejemplo, con la conservación de la morfología, reproducción, etc. Varias descripciones equivalen a múltiples registros en un archivo de descripciones.

Identificadores Alternativos

Última versión publicada: 2015-02-13

Utilice esta extensión si tiene más de un identificador o enlace a información sobre el taxón. Una base de datos de origen puede, por ejemplo, proporcionar acceso a los registros de datos de origen a través de una página web, un servicio web y un identificador que se puede resolver como LSID, DOI u otros medios.

Extensión de Tipos y Especímenes

Última versión publicada: 2015-02-13

Utilice esta extensión para compartir datos relacionados con uno o más especímenes o referencias de tipo vinculadas al taxón principal

Extensión de Relación de Recursos

Última versión publicada: 2018_01_18

Esta extensión se utiliza para describir una o más relaciones que el taxón principal tiene con otros taxones, ya sea en la lista de origen o incluidos en el registro. Esta extensión podría usarse, por ejemplo, para proporcionar una lista de especies de plantas (un registro por especie) polinizadas por una especie de abeja incluida en la lista de especies principales.