Automating Authority Control Processes

De TallerDocumental on Wiki
Saltar a: navegación, buscar

Referencia del artículo

Wolf, S. (2020). Automating Authority Control Processes. Code(4)Lib Journal, (47). https://journal.code4lib.org/articles/15014

Resumen original

Authority control is an important part of cataloging since it helps provide consistent access to names, titles, subjects, and genre/forms. There are a variety of methods for providing authority control, ranging from manual, time-consuming processes to automated processes. However, the automated processes often seem out of reach for small libraries when it comes to using a pricey vendor or expert cataloger. This paper introduces ideas on how to handle authority control using a variety of tools, both paid and free. The author describes how their library handles authority control; compares vendors and programs that can be used to provide varying levels of authority control; and demonstrates authority control using MarcEdit.

Resumen original traducido

El control de autoridades es una parte importante de la catalogación, ya que ayuda a proporcionar un acceso coherente a los nombres, títulos, temas y géneros/formas. Hay una variedad de métodos para proporcionar el control de autoridades, que van desde los procesos manuales, que requieren mucho tiempo, hasta los procesos automatizados. Sin embargo, los procesos automatizados a menudo parecen estar fuera del alcance de las pequeñas bibliotecas cuando se trata de utilizar un vendedor caro o un experto en catalogación. En este documento se presentan ideas sobre cómo manejar el control de autoridades utilizando una variedad de herramientas, tanto de pago como gratuitas. El autor describe cómo su biblioteca maneja el control de autoridades; compara los proveedores y programas que pueden utilizarse para proporcionar diversos niveles de control de autoridades; y demuestra el control de autoridades utilizando MarcEdit.

Resumen detallado

¿Qué es el control de autoridades? ¿Por qué quiero hacerlo, y mucho menos automatizarlo?

El control de autoridades (o control de puntos de acceso) es definido por la IFLA como “la normalización de puntos de acceso (encabezamientos) controlados y la creación de puntos de acceso alternativos y relacionados” (Zumer, 2009, p. 50). Un registro de autoridad establece como principal una forma del nombre concreta y enumera formas alternativas del mismo y puntos de acceso relacionados. El fin de utilizar una forma concreta de un punto de acceso (autor, tema o título) es el control de la autoridad y la ayuda que esto proporciona a los usuarios a la hora de buscar información sobre un determinado autor o tema. Ayudando a desambiguar nombres de personas, entidades corporativas, títulos, etc. A su vez, el control de autoridades puede ayudar al usuario a identificar términos de la materia que va a utilizar.

En los sitios web de las bibliotecas, el fichero de autoridades se presenta a veces como una opción de consulta independiente del catálogo y limitándose, en el ámbito de la recuperación, a la búsqueda mediante índices de materias y no a partir del formulario principal de consulta (Rodríguez-Yunta, 2012).

Cómo se maneja el control de autoridades en la UNT

El catálogo de la biblioteca de la Universidad del Norte de Texas (UNT) funciona con el programa Sierra y son miembros de la OCLC, una “cooperativa mundial de bibliotecas que proporciona servicios tecnológicos compartidos, investigación original y programas comunitarios para sus miembros y la comunidad bibliotecaria en general” (OCLC, 2020).

El autor indica que cuando realizaron todo el control de autoridades de la biblioteca, empezaron primero por hacer los informes de encabezamientos con el programa Sierra, el cual les proporcionaba una lista de nombres, temas y títulos utilizados por primera vez, así como otros posibles temas relacionados. Más adelante, buscaron en OCLC cada nuevo nombre y tema de los informes y descargaron los registros de autoridad en su catálogo, pero solo aquellos que establecían referencias cruzadas. Finalmente, revisaron que el formulario fuera correcto tanto en el registro catalogado como en los existentes en Sierra.

A pesar del trabajo realizado, este fue difícil de mantener debido a la adopción de la RDA. Puesto que llevó a que una gran cantidad de registros de autoridad se actualizaran con nuevas normas. Visto el problema, la biblioteca planteó el uso de un proveedor para ejercer el control de autoridades. Por lo que ya no se molestan en actualizar sus registros, sino que el proveedor les proporciona eventualmente registros de materias y otros registros actualizados.

¡Automático!

La manera más efectiva para manejar el trabajo que conlleva los registros de autoridad es mediante la automatización. Se pueden encontrar una gran variedad de formas de automatizar las autoridades. Algunas de las herramientas existentes son OCLC Connexion, MarcEdit, Sierra, Notepad++, Excel y proveedores.

Sierra

Con el programa Sierra se pueden ejecutar los informes de encabezamiento para poder identificar nuevos nombres y sujetos, usos no válidos y registros duplicados. Sierra es un sistema integrado de gestión bibliotecaria de código abierto de la empresa Innovatives Interfaces y, como índica Macías (2013), “está especialmente diseñado para soportar colecciones digitales y permite la adaptación y creación de nuevos módulos y servicios de información bibliotecaria gracias a los elementos de código libre que los componen”.

Cuenta además con una función de mantenimiento bibliográfico que actualiza automáticamente los registros bibliográficos para que coincidan con nuevos encabezamientos, siempre y cuando el encabezamiento del registro bibliográfico coincida con una referencia cruzada en el registro de autoridad.

MarcEdit

El programa MarcEdit es una herramienta de software libre que autoriza y valida los nombres y temas de forma automática para poder después cargar los registros. Proporciona un informe final para que la persona pueda arreglar las variantes o se puede configurar para que la herramienta lo haga de forma automática. Además, agrega la URI automáticamente en el campo $0 para poder vincular datos en el catálogo, siendo útil en la búsqueda por lotes en OCLC y, concretamente, para los registros de autoridad que se agreguen al catálogo. Cabe indicar que las URI son cadenas de caracteres que identifican recursos de una variada naturaleza en un formato estructurado común, y la tipología de URI más conocida son las URL, que se usan para localizar recursos de la Web (Buedo y Marín, 2013).

MarcEdit es una herramienta de gran ayuda a la hora de editar rápidamente lotes de registros antes de cargarlos en el Sistema Integrado de Bibliotecas (ILS), donde hacer cambios masivos implica mucho más trabajo.

Proveedores

Proveedores como Backstage y MARCIVE permiten a las bibliotecas enviar un archivo con todos los registros para actualizarlos y validarlos. Cada proveedor tiene su programación propia para poder arreglar las etiquetas de los campos, los errores de indicadores y la codificación incorrecta de subcampos. La biblioteca puede decidir la personalización que desea hacer a su perfil de procesamiento y una vez que los registros están “limpios”, estos se ejecutan a través de tantos archivos de autoridad como se desee, con el fin de validar los encabezamientos. Finalmente, la biblioteca recupera los registros bibliográficos actualizados, así como los archivos de registros de autoridad.

Ambos proveedores ofrecen un servicio de catalogación actualizado a medida que se actualizan los archivos de autoridad nacionales. Aunque esta opción supone un gran gasto económico anual. Por lo que la alternativa es hacer proyectos de limpieza enviando una única vez los registros.

Cargando por lotes nuevos registros de autoridad

Mediante el uso de MarcEdit y de OCLC se cargan los lotes de registros de autoridad, tras ello se ejecutan los informes de encabezamientos y se copian los nombres resultantes en Excel. Con MarcEdit se validan los nombres en el archivo de proveedores y se incrusta la URI en el campo $0 cuando sea posible. Proporcionando un enlace al registro de autoridad para esa entrada específica, que contendrá el Número de Control de la Biblioteca del Congreso (LCCN). Se copian los campos con $0 en Excel para poder comparar las dos listas de nombres y se aísla en dichos campos el número de control de la Biblioteca del Congreso en el informe de encabezamiento. Seguido se ejecuta una búsqueda por lotes en OCLC utilizando el LCCN y se exportan los registros.

Mantenimiento en curso

El archivo de autoridad de nombres y el archivo de autoridad de sujetos están en un cambio constante y algunos de estos se modifican para ajustarse a la norma actual.

Para mantener actualizados los registros de autoridad, OCLC proporciona semanalmente una lista con las fechas de cierre de los nombres y la Biblioteca del Congreso proporciona una lista de registros de materias actualizados mensualmente. Pero surge un problema, y es que no se sabe si estas herramientas cuentan en su catálogo con los encabezamientos que se requieren a no ser que se busque manualmente. Tampoco es buena idea cargar simplemente todos los registros actualizados, a menos que se disponga de una tabla de carga. Se necesita que el sistema cambie los encabezamientos de registros bibliográficos para que puedan coincidir con la nueva versión autorizada y eliminar así las referencias ciegas de los registros que no tienen un registro bibliográfico correspondiente.

Cabe señalar que la función “crear lista” de Sierra permite consultas en JSON como una opción de entrada, en lugar de tener que introducir a mano cada comando de búsqueda. Lo que hace que sea más fácil buscar muchos nombres a la vez. Así que la solución para actualizar los registros es la de convertir las listas de la Biblioteca del Congreso y de OCLC en una consulta JSON en Sierra para así encontrar cualquier registro que utilice el encabezamiento actualizado. Al coger dichos encabezamientos, se usa OCLC para buscar por lotes los nuevos registros de autoridad a cargar y se actualizan los encabezamientos en los registros y se agregan al nuevo formulario.

Encabezamientos de materia

La Biblioteca del Congreso de los EEUU publica listas actualizadas de los nuevos encabezamientos de materia en su web. Dichas listas muestran el encabezamiento del tema, el número de control y el por qué ese encabezamiento se encuentra en la lista. Además de lo mencionado, ofrecen información acerca de título cambiado, nuevo título, título cancelado y del campo “añadido” o “eliminado”.

Fechas de cierre

Las fechas de cierre se pueden dar en tres lugares, por lo que se deberá buscar cada nombre tres veces:

  1. En una entrada principal 1XX
  2. En los sujetos 6XX
  3. Como entrada añadida 7XX

Hay dos niveles con los que se puede trabajar este tema, el primero de ellos es buscar las fechas de cierre en los registros de autoridad y el segundo es buscar en los registros bibliográficos los encabezamientos que coinciden con el nombre antiguo. En el primer caso puede que no tengamos el registro de autoridad porque no cargamos en el catálogo los registros de autoridad de cada nombre, pero esto no lo sabríamos usando únicamente este método. En el segundo caso, hay que clasificar muchas coincidencias falsas y hay mucho trabajo manual para aislar los números de control necesarios.

Consejos

Las recomendaciones finales que aporta Wolf son:

  • Utilización del buscador genérico Google en caso de dudas en cuanto al uso de Excel y de las Expresiones Regulares.
  • En la opción “crear lista” de Sierra, es mejor construir una búsqueda en la vista clásica y luego cambiar a vista JSON para encontrar cómo escribir el código.
  • Esperar a tener varias listas para combinar y más tarde configurar una búsqueda una sola vez.
  • Evitar copiar las expresiones regulares de Word, ya que el formato puede causar problemas.
  • Cuando se descubra cómo configurar una consulta JSON se deberá reutilizar cuando sea necesario.
  • Cuando no funcione el código, en el caso de Sierra, no dejará continuar la búsqueda y dará a conocer el problema, pero será difícil trabajar con él en Sierra. Por ello la mejor opción será usar Notepad++ para encontrar el problema y solucionarlo.

Comentario crítico

El control y la normalización de autoridades es una tarea esencial para poder controlar de una forma normalizada la construcción de puntos de acceso y la normalización de encabezamientos. Esta tarea aumenta si tenemos en cuenta el peso de internet como una fuente de información electrónica y la consecuencia que supone en cuanto a la búsqueda de nuevos métodos de descripción, organización y acceso remoto. Esto conlleva a controlar una gran cantidad de metadatos, y el uso correcto de dichos esquemas de metadatos en el entorno bibliotecario dependerá del correcto control de las autoridades (Vellucci, 2000).

Son muchas las herramientas que se nos presentan a la hora de trabajar con autoridades de forma automatizada. La herramienta OCLC, aunque está diseñada para todo tipo de bibliotecas, es más adoptada por bibliotecas académicas medianas, pero es poco seleccionada por grandes bibliotecas o consorcios (Breeding, 2017). Por otra parte, la herramienta Sierra mejora la organización de la biblioteca y permite reducir gastos de recursos, como se ha comentado anteriormente, aunque se recuerda que es una herramienta de pago y que no dispone de prueba ni de ninguna versión gratuita. En cuanto a MarcEdit, esta es una herramienta gratuita para registros MARC que permite modificar registros importados y ajustarlos. Convirtiéndose en una herramienta de gran utilidad a la hora de revisar registros. En el caso de los proveedores, estos se encuentran en una actualización constante y esto lleva a que las bibliotecas deben tener en cuenta que “los resultados concuerden con sus intereses estratégicos. Las bibliotecas deben procurar que sus proveedores de tecnología atiendan sus necesidades” (Breeding, 2017, p. 557).

Para finalizar, cabe remarcar la importancia del control de autoridades automatizado y la necesidad de que este sea más explotado en beneficio de las bibliotecas y de sus usuarios. Sigue habiendo varios factores que dificultan lo mencionado (Rodríguez-Yunta, 2012), en primer lugar, que las bibliotecas son consumidores de software y llegan a generar presentaciones similares con las mismas limitaciones y, en segundo lugar, hay una confusión con el modelo que debe usarse para los sistemas de recuperación de catálogos y bases de datos documentales. Además, es importante indicar que no se debe suponer que en el futuro la uniformidad actual con MARC se vaya a mantener en un entorno de datos vinculados (Osuna, 2020). Por lo que se debería preparar para trabajar en un entorno en el que los metadatos se crean y gestionan en múltiples modelos de datos vinculados, bajo un entorno híbrido en conjunto con las nuevas y antiguas normas (Ibídem).

Referencias

Breeding, M. (2017). Informe de sistemas de bibliotecas 2017. Visiones competitivas de tecnología, software abierto y flujo de trabajo. El profesional de la información, 26(3), 543-557. http://profesionaldelainformacion.com/contenidos/2017/may/21.pdf

Buedo Hidalgo, D., & Marín Díaz, A. (2013). Servicio de convergencia basado en identificadores. Revista Telem@tica, 12(1), 44-54. https://www.revistatelematica.cujae.edu.cu/index.php/tele/article/view/91/90

Macías, A. (2013, diciembre 26). Sierra, un gestor de bibliotecas open source de última generación. Grup de Treball de Programari Lliure per als Professionals de la Informació. http://www.cobdc.net/programarilliure/sierra-un-sistema-de-gestion-para-los-retos-actuales-de-las-bibliotecas/

OCLC. (2020). Acerca de OCLC. https://www.oclc.org/es/about.html?cmpid=md_ab

Osuna González, M. (2020, febrero 24). El futuro del control de autoridades: cuestiones y tendencias en el entorno de datos vinculados [Entrada blog]. Biblioteconomía. http://blog.bne.es/biblioteconomia/2020/02/24/el-futuro-del-control-de-autoridades-cuestiones-y-tendencias-en-el-entorno-de-datos-vinculados/

Rodríguez-Yunta, L. (2012). Control de autoridades, una herramienta desaprovechada en los sistemas de recuperación. Anuario ThinkEPI, 6, 240-243. https://recyt.fecyt.es/index.php/ThinkEPI/article/view/30426/16004

Vellucci, S. L. (2000). Metadata and authority control. Library Resources and Technical Services, 44(1), 33-43. https://doi.org/10.5860/lrts.44n1.33

Zumer, M. (2009). Bibliografías nacionales en la era digital: Guía y nuevas orientaciones (F. Movilla López (trad.); Vol. 39). K.G. Saur. https://www.ifla.org/files/assets/hq/publications/series/39-es.pdf



Categorías: Control de autoridades | Registro de autoridad | Catalogación | Sistema Integrado de Bibliotecas | ILS | MarcEdit | OCLC | Sierra | JSON