Política del control de versiones del conjunto de datos

El IPT rastrea de manera cuidadosa los cambios de las versiones principales y secundarias de un conjunto de datos, para que cada versión publicada pueda identificarse sin ambigüedades y los usuarios puedan ver fácilmente cuándo sucedieron cambios significativos en el conjunto de datos. La relación entre las versiones es visible en la tabla de la historia de las versiones (en su página de inicio) y también se documenta en los metadatos DOI.

La política del control de versiones que utiliza el IPT se describe a continuación. Es importante mencionar que la política del control de versiones del IPT se basa en Recomendaciones de DataCite, el cual se basa en el trabajo de Asociados de la Información sobre ciencias de la tierra (ESIP).

Política del control de versiones

  • Las versiones principales y secundarias son usadas para realizar un seguimiento de los cambios de un conjunto de datos a través del tiempo.

  • El número de versión utiliza la sintaxis versión_principal.versión_secundaria.

  • Se asigna una nueva versión principal al conjunto de datos (a) la primera vez que este es publicado o (b) después de que el conjunto de datos se ha vuelto a publicar con uno o más cambios científicamente significativos. El publicador debe decidir qué constituye un cambio científicamente significativo (consulte la definición a continuación para obtener ayuda).

  • Un cambio científicamente significativo (a) generalmente afecta a la mayoría de los registros del conjunto de datos y (b) puede cambiar el resultado de un análisis científico al utilizar el conjunto de datos.

  • Una nueva versión principal deriva la creación de un nuevo DOI, mientras que una nueva versión secundaria no.

  • Una nueva versión secundaria se asigna al conjunto de datos cada vez que es publicado y no es adecuado asignarle una nueva versión principal.

  • Para los conjuntos de datos que se actualizan continuamente (p. ej. conjuntos de datos de series de tiempo), se asigna una nueva versión secundaria cada vez que se vuelve a publicar, siempre que las adiciones continuas no cambien los registros preexistentes de una manera científicamente significativa. Esta decisión debe tomarla el publicador.

  • Idealmente, un resumen detallado acerca de qué cambió desde la última publicación debería ser ingresado por el publicador antes de que alguna nueva versión principal o secundaria del conjunto de datos sea publicada.

  • Cada versión principal y secundaria de un conjunto de datos tiene su propia página de IPT, permitiendo que la versión archivada del conjunto de datos (DwC-A, EML) esté disponible para su libre descarga. Por supuesto, solo las páginas de las versiones disponibles públicamente serán de libre acceso en internet.

  • Las páginas del IPT incluirán un registro de metadatos completo que describa los conjuntos de datos y proporcionan acceso directo a los datos o a la información respecto de cómo acceder a ellos.

  • La página de destino de la anterior versión principal apunta (tiene un enlace) a la nueva versión, con una explicación de el estado de la versión anterior.

  • Los conjuntos de datos eliminados tienen una página IPT que explica que se eliminó el conjunto de datos. Si el conjunto de datos eliminado tenía asignado un DOI, todas sus versiones son almacenadas, de lo contrario es eliminado permanentemente.

  • Los metadatos con DOI deben ser tan valiosos como sea posible, incluyendo si es posible (a) identificadores alternos del conjunto de datos, (b) relaciones con otras versiones, (c) relaciones con artículos que citan al conjunto de datos, (c) ORCID donde los contactos son mencionados, etc.

  • La cita del conjunto de datos, siempre incluye el número de versión, reemplazando la necesidad de usar una fecha y hora de acceso para citar conjuntos de datos de series temporales, por ejemplo.