Diferencia entre revisiones de «Persistent identifiers for heritage objects»

De TallerDocumental on Wiki
Saltar a: navegación, buscar
(Tipos de sistemas PID)
(Sistema de manija.)
Línea 46: Línea 46:
 
==== NBN ====
 
==== NBN ====
  
==== Sistema de manija. ====
+
==== Sistema de manija ====
Las manijas son identificadores únicos a nivel internacional que pueden asignarse y administrarse de forma descentralizada mediante autoridades de nombres en sus propios servidores de identificadores locales para prefijos específicos. En este caso, destaca ''[http://Global%20Handle%20Registry Global Handle Registry]'' se trata de un servicio operativo habilitado por la Fundación DONA para que los clientes resuelvan registros de prefijo. También, hay que considerar que los identificadores al ser independientes de la arquitectura de DNS y la sintaxis de URL permiten su resolución en la web a través de la ''[http://hdl.handle.net/ Global Handle Resolver]''  
+
Las manijas son identificadores únicos a nivel internacional que pueden asignarse y administrarse de forma descentralizada mediante autoridades de nombres en sus propios servidores de identificadores locales para prefijos específicos. En este caso, destaca ''[http://Global%20Handle%20Registry Global Handle Registry]'' se trata de un servicio operativo habilitado por la Fundación DONA para que los clientes resuelvan registros de prefijo. También, hay que considerar que los identificadores al ser independientes de la arquitectura de DNS y la sintaxis de URL permiten su resolución en la web a través de la ''[http://hdl.handle.net/ Global Handle Resolver]''
  
 
==== Sistema DOI ====  
 
==== Sistema DOI ====  

Revisión del 12:39 16 dic 2020

Referencia del artículo

Koster, L. (2020). Persistent identifiers for heritage objects. The Code4Lib Journal, (47). Recuperado de https://journal.code4lib.org/articles/14978

Resumen original

Persistent identifiers (PID’s) are essential for getting access and referring to library, archive and museum (LAM) collection objects in a sustainable and unambiguous way, both internally and externally. Heritage institutions need a universal policy for the use of PID’s in order to have an efficient digital infrastructure at their disposal and to achieve optimal interoperability, leading to open data, open collections and efficient resource management.

Here the discussion is limited to PID’s that institutions can assign to objects they own or administer themselves. PID’s for people, subjects etc. can be used by heritage institutions, but are generally managed by other parties.

The first part of this article consists of a general theoretical description of persistent identifiers. First of all, I discuss the questions of what persistent identifiers are and what they are not, and what is needed to administer and use them. The most commonly used existing PID systems are briefly characterized. Then I discuss the types of objects PID’s can be assigned to. This section concludes with an overview of the requirements that apply if PIDs should also be used for linked data.

The second part examines current infrastructural practices, and existing PID systems and their advantages and shortcomings. Based on these practical issues and the pros and cons of existing PID systems a list of requirements for PID systems is presented which is used to address a number of practical considerations. This section concludes with a number of recommendations.

Resumen original traducido

Los identificadores persistentes (PID) son esenciales para obtener acceso y hacer referencia a los objetos de la colección de bibliotecas, archivos y museos (LAM) de una manera sostenible e inequívoca, tanto interna como externamente. Las instituciones patrimoniales necesitan una política universal para el uso de PID para tener una infraestructura digital eficiente a su disposición y lograr una interoperabilidad óptima, que conduzca a datos abiertos, colecciones abiertas y una gestión eficiente de los recursos.

Aquí la discusión se limita a los PID que las instituciones pueden asignar a los objetos que poseen o administran ellos mismos. Los PID para personas, sujetos, etc. pueden ser utilizados por instituciones patrimoniales, pero generalmente son administrados por otras partes.

La primera parte de este artículo consiste en una descripción teórica general de identificadores persistentes. En primer lugar, analizo las preguntas sobre qué son y qué no son los identificadores persistentes, y qué se necesita para administrarlos y usarlos. Se describen brevemente los sistemas PID existentes más utilizados. Luego hablo de los tipos de objetos a los que se pueden asignar los PID. Esta sección concluye con una descripción general de los requisitos que se aplican si los PID también deben usarse para datos vinculados.

La segunda parte examina las prácticas de infraestructura actuales y los sistemas PID existentes y sus ventajas y deficiencias. Sobre la base de estas cuestiones prácticas y los pros y contras de los sistemas PID existentes, se presenta una lista de requisitos para los sistemas PID que se utiliza para abordar una serie de consideraciones prácticas. Esta sección concluye con una serie de recomendaciones.

Resumen detallado

En este artículo, el sociólogo holandés Lukas Koster, nos explica la importancia de los identificadores persistentes a la hora de ser aplicados a objetos procedentes de colecciones bibliotecarias, archivísticas o museísticas, con el fin de garantizar tanto acceso abierto como adecuada gestión a dichos recursos.

Identificadores persistentes: conceptos básicos

Las definiciones disponibles sobre identificadores persistentes se diferencian teniendo en cuenta dos formas: la naturaleza de los objetos que se van a identificar y el grado de persistencia. En este caso, un identificador persistente (PID) se entiende como un "identificador persistente universal único", teniendo en cuenta que un "identificador" es una cadena que se utiliza para referirse a un objeto, que "único" significa que cada identificador solo es útil para referirse a un objeto, que "universal" implica que el identificador es válido para la red mundial y que "persistente" hace referencia a que el identificador permanece disponible independientemente de instituciones, sistemas o implementaciones de sistemas individuales. En la práctica, un identificador persistente tiene dos funciones: identificar un objeto de forma única y poner a disposición un objeto y/o información sobre ese objeto en la web.

Existen algunas definiciones que establecen que los identificadores persistentes siempre se refieren a objetos digitales, como son el caso del Manual de Preservación Digital que indica que "Un identificador persistente es una referencia duradera a un recurso digital" o el sitio web holandés PIDwijzer: "Un identificador persistente (PID) es un código de identificación único adjunto a un objeto digital y registrado en una ubicación acordada".

No obstante, otras definiciones de identificadores persistentes hacen referencia a objetos físicos y conceptos abstractos, como ocurre en Wikipedia en inglés: "Un identificador persistente (PI o PID) es una referencia duradera a un documento, archivo, página web u otro objeto. El término "identificador persistente" se utiliza generalmente en el contexto de objetos digitales que son accesibles a través de Internet". Cabe destacar el DOI ("Identificador de Objeto Digital"), tratándose de un sistema PID muy utilizado para "cualquier entidad: física, digital o abstracta", entendiéndose que un DOI sirve para identificar digitalmente a un objeto.

La universalidad de un identificador persistente implica que el identificador es único dentro del universo conocido, y esto significa que el identificador es único dentro de un contexto específico. Los PID se asignan dentro de "espacios de nombres web" (PID-URI), específicos administrados por una institución, como uva.nl, doi.org o handle.net. Una sola cadena puede aparecer más de una vez, pero solo una vez dentro de un espacio de nombres reservado, lo que hace que esta cadena sea única. En caso de que varias instituciones tengan derecho a asignar identificadores dentro de un espacio de nombres específico, a estas instituciones se les asignan un código propio que, además, forma parte de la cadena de identificadores total. El código único real es único para el código institucional dentro de espacios de nombres. A menudo, al código institucional se denomina prefijo y al código real, sufijo.

La persistencia puede entenderse como algo "permanente" o "eterno", pero en realidad esto no es así, pues un PID solo sigue siendo único y utilizable siempre que alguien asegure que ese es el caso. Se trata de una institución que administra identificadores y garantiza su unicidad dentro de un espacio de nombres único en la web. Cuando se habla de persistencia, se refiere tanto a la existencia continuada como a la continua búsqueda y accesibilidad del objeto identificado en la web. Un PID independiente de la ubicación en la web también realiza la función de resolución.

El método estándar para resolver identificadores persistentes es el empleo de una tabla de mapeo, pues por cada PID-URI se registra una URL de destino. De forma alternativa, también se puede utilizar un "mapeo basado en reglas", donde la URL base y la sintaxis de la URL de destino se generan dinámicamente aplicando una plantilla, un patrón y/o una expresión regular y agregando el identificador distintivo. Esto sólo es posible si el identificador antiguo está disponible en el nuevo sistema o si está disponible una tabla de mapeo de los identificadores del sistema antiguo al nuevo, y si este identificador se puede utilizar en una consulta. Y hay que tener en cuenta que, tanto la persistencia como la resolución, sólo están garantizadas en virtud de la administración permanente, por lo que, generalmente, es la institución aquella encargada de garantizar la existencia continua de los identificadores y el mantenimiento de resoluciones actualizadas sobre las ubicaciones reales de los objetos.

Hay cierta tendencia a considerar identificadores persistentes a los enlaces permanentes, pero esto conduce al error, pues los enlaces permanentes son siempre URLs completos que contienen identificadores internos del sistema generados por el mismo. Un identificador interno del sistema solo es válido y único dentro de una instalación de sistema específica y, por lo tanto, si se produce una migración a un sistema diferente, el antiguo enlace permanente ya no funcionará a menos que sea posible la redirección a las URL en el nuevo sistema.

Tipos de sistemas PID

NBN

Sistema de manija

Las manijas son identificadores únicos a nivel internacional que pueden asignarse y administrarse de forma descentralizada mediante autoridades de nombres en sus propios servidores de identificadores locales para prefijos específicos. En este caso, destaca Global Handle Registry se trata de un servicio operativo habilitado por la Fundación DONA para que los clientes resuelvan registros de prefijo. También, hay que considerar que los identificadores al ser independientes de la arquitectura de DNS y la sintaxis de URL permiten su resolución en la web a través de la Global Handle Resolver

Sistema DOI

Se basa en el sistema de manijas y es administrado por la IDF. Los DOI son asignados por agencias de registro (RA) de DOI descentralizadas, como DataCite, Crossref y Zenodo. El identificador DOI se compone e un prefijo para el registrante y un sufijo como identificador único dentro del prefijo y éstos últimos, a su vez, pueden tener una subdivisión jerárquica. Además, se pueden asignar a cualquier tipo de objeto físico, digital o abstracto.

ARCKS

Se trata de un protocolo para identificadores persistentes que incluye la resolución de varios tipos de objetos de información digitales, físicos, abstractos, personas o instituciones. Éste se encuentra desarrollado y mantenido por la Biblioteca Digital de California. Un principio fundamental de ARK es que la persistencia es una cuestión de servicio y en dicho protocolo, un identificador es una asociación entre una cadena de datos y un objeto. Este protocolo consta de tres partes obligatorias: la cadena "ark: /", el NAAN y el "nombre" (el identificador real dentro del contexto NAA, el sufijo). Los identificadores existentes se pueden utilizar para la parte Nombre / sufijo. Existe una herramienta que puede generar cadena ARK únicas (además de otros identificadores y DOI) como es NOID, el cual se puede utilizar como resolución local que puede proporcionar un mapeo basado en reglas, además de la redirección estándar. También, para administrar y almacenar ARK se utiliza el servicio EZID, proporcionado por CDL.

PURL (URL persistente)

Es un servicio de resolución y redirección de recursos web. Fue desarrollado y administrado por OCLC, aunque en el año 2016, The Internet Archive se hizo cargo del mantenimiento. PURL utiliza servicios de redireccionamiento HTTP estándar mediante códigos de estado HTTP estándar y son URL completas de las cuales la URL base puede ser purl.org, purl.net, purl.info, purl.com. Hay que tener en cuenta que los PURL no son identificadores persistentes por sí mismos, pero se pueden utilizar como tales.

PID privados

Las instituciones tienen la opción de crear sus propios PID privados, teniendo éstas una herramienta a su disposición para generar identificadores únicos dentro de un espacio de nombre específico, así como una herramienta para resolver y redirigir estos PID. Una ventaja, que hay destacar, sobre estos sistemas es que tienen una mayor flexibilidad en las políticas, aplicaciones y opciones de redireccionamiento. Una opción para generar PID privados es el empleo de UUID (Identificador Único Universal) como sufijo, el cual es independiente de una autoridad central. Los UUID se utilizan en el sistema de repositorios PURE y se pueden resolver mediante el uso de un solucionador y asignaciones de redirección.

Tipos de objetos elegibles para PID

Artículos únicos y producción académica

Para estos objetos se puede hacer una distinción entre objetos únicos (objetos de museo, manuscritos, conjuntos de datos de investigación, etc.)., artículos no únicos (objetos publicados en grandes ediciones como libros, artículos, etc.), y salida institucional (producción académica del personal institucional como libros, disertaciones, artículos, capítulos, etc.).

Físico/digital

La regla básica es que se asigna un PID al objeto original ya sea físico o digital. Pueden estar disponibles una o más copias digitales o versiones de un objeto físico y también es habitual que el PID de un objeto físico se resuelva en una descripción de ese objeto en la web que incluya al menos información sobre su ubicación actual y opciones de acceso, así como las representaciones de las versiones digitales disponibles.

Casos especiales

La distinción entre objetos únicos y no únicos no es tan rígida como parece, pues se tratan de objetos publicados en varios tamaños de volumen con o sin pequeñas diferencias, por ejemplo, aguafuertes, grabados, litografías o mapas antiguos. Con este tipo de objetos se realizan numerosas impresiones a partir de una fuente (placa, piedra, etc.)., de diversa calidad causada por roturas y desgaste y las planchas utilizadas pueden tener varias versiones con ajustes realizados en las planchas originales como sucede, por ejemplo, en los mapas antiguos grabados en cobre. Una institución patrimonial puede tener múltiples copias idénticas o diferentes de un objeto impreso en su poder. Es por ello, que si las copias individuales se tratan como objetos únicos u obras individuales, merecen sus propios PID y deben estar vinculadas entre sí de una forma u otra como versiones diferentes de un objeto fuente. Esto se puede lograr de varias formas en catálogos y metadatos. A menudo, los objetos al ser parte de una entidad más grande pueden dividirse en partes más pequeñas, como es el caso de archivos, secciones, capítulos de libros, series, mapas murales, etc. Y en lo referente a las representaciones digitales, es necesario utilizar URL estables para las representaciones digitales del objeto original.

Versiones de objetos

En algunos sistemas PID no se permiten cambiar los objetos a los que se hace referencia, no aplicándose, por lo general, a los objetos físicos. En cambio para textos o conjuntos de datos, esta es una posibilidad real, aplicándose a cada versión un nuevo identificador persistente, siendo una de las opciones, la ampliación del PID original con un sufijo de numeración de versión o se le puede asignar nuevos PID a cada nueva versión apuntando al objeto original.

PID y datos vinculados

Los datos vinculados, éstos son una forma de vincular datos estructurados en diferentes conjuntos de datos entre sí por medio de identificadores para presentar información enriquecida tanto para el uso humano como para procesamiento de software. La metodología básica consiste en "triples", donde dos cosas se relacionan entre sí, presentando ambas cosas y la relación como PID-URI especiales, HTTP-URI.