Persistent identifiers for heritage objects

De TallerDocumental on Wiki
Saltar a: navegación, buscar

Referencia del artículo

Koster, L. (2020). Persistent identifiers for heritage objects. The Code4Lib Journal, (47). Recuperado de https://journal.code4lib.org/articles/14978

Resumen original

Persistent identifiers (PID’s) are essential for getting access and referring to library, archive and museum (LAM) collection objects in a sustainable and unambiguous way, both internally and externally. Heritage institutions need a universal policy for the use of PID’s in order to have an efficient digital infrastructure at their disposal and to achieve optimal interoperability, leading to open data, open collections and efficient resource management.

Here the discussion is limited to PID’s that institutions can assign to objects they own or administer themselves. PID’s for people, subjects etc. can be used by heritage institutions, but are generally managed by other parties.

The first part of this article consists of a general theoretical description of persistent identifiers. First of all, I discuss the questions of what persistent identifiers are and what they are not, and what is needed to administer and use them. The most commonly used existing PID systems are briefly characterized. Then I discuss the types of objects PID’s can be assigned to. This section concludes with an overview of the requirements that apply if PIDs should also be used for linked data.

The second part examines current infrastructural practices, and existing PID systems and their advantages and shortcomings. Based on these practical issues and the pros and cons of existing PID systems a list of requirements for PID systems is presented which is used to address a number of practical considerations. This section concludes with a number of recommendations.

Resumen original traducido

Los identificadores persistentes (PID) son esenciales para obtener acceso y hacer referencia a los objetos de la colección de bibliotecas, archivos y museos (LAM) de una manera sostenible e inequívoca, tanto interna como externamente. Las instituciones patrimoniales necesitan una política universal para el uso de PID para tener una infraestructura digital eficiente a su disposición y lograr una interoperabilidad óptima, que conduzca a datos abiertos, colecciones abiertas y una gestión eficiente de los recursos.

Aquí la discusión se limita a los PID que las instituciones pueden asignar a los objetos que poseen o administran ellos mismos. Los PID para personas, sujetos, etc. pueden ser utilizados por instituciones patrimoniales, pero generalmente son administrados por otras partes.

La primera parte de este artículo consiste en una descripción teórica general de identificadores persistentes. En primer lugar, analizo las preguntas sobre qué son y qué no son los identificadores persistentes, y qué se necesita para administrarlos y usarlos. Se describen brevemente los sistemas PID existentes más utilizados. Luego hablo de los tipos de objetos a los que se pueden asignar los PID. Esta sección concluye con una descripción general de los requisitos que se aplican si los PID también deben usarse para datos vinculados.

La segunda parte examina las prácticas de infraestructura actuales y los sistemas PID existentes y sus ventajas y deficiencias. Sobre la base de estas cuestiones prácticas y los pros y contras de los sistemas PID existentes, se presenta una lista de requisitos para los sistemas PID que se utiliza para abordar una serie de consideraciones prácticas. Esta sección concluye con una serie de recomendaciones.

Resumen detallado

En este artículo, el sociólogo holandés Lukas Koster, nos explica la importancia de los identificadores persistentes a la hora de ser aplicados a objetos procedentes de colecciones bibliotecarias, archivísticas o museísticas, con el fin de garantizar tanto acceso abierto como adecuada gestión a dichos recursos.

Las definiciones disponibles sobre identificadores persistentes se diferencian teniendo en cuenta dos formas: la naturaleza de los objetos que se van a identificar y el grado de persistencia. En este caso, un identificador persistente (PID) se entiende como un "identificador persistente universal único", teniendo en cuenta que un "identificador" es una cadena que se utiliza para referirse a un objeto, que "único" significa que cada identificador solo es útil para referirse a un objeto, que "universal" implica que el identificador es válido para la red mundial y que "persistente" hace referencia a que el identificador permanece disponible independientemente de instituciones, sistemas o implementaciones de sistemas individuales. En la práctica, un identificador persistente tiene dos funciones: identificar un objeto de forma única y poner a disposición un objeto y/o información sobre ese objeto en la web. También, cabe destacar que existen algunas definiciones que establecen que los identificadores persistentes siempre se refieren a objetos digitales, como son el caso del Manual de Preservación Digital que indica que "Un identificador persistente es una referencia duradera a un recurso digital" o el sitio web holandés PIDwijzer: "Un identificador persistente (PID) es un código de identificación único adjunto a un objeto digital y registrado en una ubicación acordada".

No obstante, otras definiciones de identificadores persistentes hacen referencia a objetos físicos y conceptos abstractos, como ocurre en Wikipedia en inglés: "Un identificador persistente (PI o PID) es una referencia duradera a un documento, archivo, página web u otro objeto. El término "identificador persistente" se utiliza generalmente en el contexto de objetos digitales que son accesibles a través de Internet". Cabe destacar el DOI ("Identificador de Objeto Digital"), tratándose de un sistema PID muy utilizado para "cualquier entidad: física, digital o abstracta", entendiéndose que un DOI sirve para identificar digitalmente a un objeto.

La universalidad de un identificador persistente implica que el identificador es único dentro del universo conocido, y esto significa que el identificador es único dentro de un contexto específico. Los PID se asignan dentro de "espacios de nombres web" (PID-URI), específicos administrados por una institución, como uva.nl, doi.org o handle.net. Una sola cadena puede aparecer más de una vez, pero solo una vez dentro de un espacio de nombres reservado, lo que hace que esta cadena sea única. En caso de que varias instituciones tengan derecho a asignar identificadores dentro de un espacio de nombres específico, a estas instituciones se les asignan un código propio que, además, forma parte de la cadena de identificadores total. El código único real es único para el código institucional dentro de espacios de nombres. A menudo, al código institucional se denomina prefijo y al código real, sufijo.

La persistencia puede entenderse como algo "permanente" o "eterno", pero en realidad esto no es así, pues un PID solo sigue siendo único y utilizable siempre que alguien asegure que ese es el caso. Se trata de una institución que administra identificadores y garantiza su unicidad dentro de un espacio de nombres único en la web. Cuando se habla de persistencia, se refiere tanto a la existencia continuada como a la continua búsqueda y accesibilidad del objeto identificado en la web. Un PID independiente de la ubicación en la web también realiza la función de resolución. El método estándar para resolver identificadores persistentes es el empleo de una tabla de mapeo, pues por cada PID-URI se registra una URL de destino. De forma alternativa, también se puede utilizar un "mapeo basado en reglas", donde la URL base y la sintaxis de la URL de destino se generan dinámicamente aplicando una plantilla, un patrón y/o una expresión regular y agregando el identificador distintivo. Esto sólo es posible si el identificador antiguo está disponible en el nuevo sistema o si está disponible una tabla de mapeo de los identificadores del sistema antiguo al nuevo, y si este identificador se puede utilizar en una consulta. Y hay que tener en cuenta que, tanto la persistencia como la resolución, sólo están garantizadas en virtud de la adminsitración permanente, por lo que, generalmente, es la institución aquella encargada de garantizar la existencia continua de los identificadores y el mantenimiento de resoluciones actualizadas sobre las ubicaciones reales de los objetos.

Por otra parte, cabe indicar que existe cierta tendencia a considerar identificadores persistentes a los enlaces permanentes, pero esto conduce al error, pues los enlaces permanentes son siempre URLs completos que contienen identificadores internos del sistema generados por el mismo. Un identificador interno del sistema solo es válido y único dentro de una instalación de sistema específica y, por lo tanto, si se produce una migración a un sistema diferente, el antiguo enlace permanente ya no funcionará a menos que sea posible la redirección a las URL en el nuevo sistema.

Ya en lo referente a los diferentes tipos de sistemas PID, destacan los siguientes:

  • Sistema de manija. Las manijas son identificadores únicos a nivel internacional que pueden asignarse y administrarse de forma descentralizada mediante autoridades de nombres en sus propios servidores de identificadores locales para prefijos específicos. En este caso Global Handle Registry sirve como conducto intermedio para estos servidores locales. Dichos tiradores se pueden asignar a cualquier tipo de objeto.
  • Sistema DOI.