Leveraging Python to improve ebook metadata selection, ingest, and management

De TallerDocumental on Wiki
Saltar a: navegación, buscar

Referencia

THOMPSON, Kelly. & TRAILL, Stacie. (2017). Leveraging Python to improve ebook metadata selection, ingest, and management. Code4Lib Journal [en línea], n. 38. [Consultado en: 28/11/17]. ISSN 1940-5758. Disponible en: http://journal.code4lib.org/articles/12828

Resumen original

Libraries face many challenges in managing descriptive metadata for ebooks, including quality control, completeness of coverage, and ongoing management. The recent emergence of library management systems that automatically provide descriptive metadata for e-resources activated in system knowledge bases means that ebook management models are moving toward both greater efficiency and more complex implementation and maintenance choices. Automated and data-driven processes for ebook management have always been desirable, but in the current environment, they become necessary. In addition to initial selection of a record source, automation can be applied to quality control processes and ongoing maintenance in order to keep manual, eyes-on work to a minimum while providing the best possible discovery and access. In this article, we describe how we are using Python scripts to address these challenges.

Resumen

"Los libros electrónicos que alguna vez fueron un pequeño componente de la mayoría de las colecciones académicas de bibliotecas, se han convertido en recursos básicos. Esta transformación ha supuesto importantes desafíos para las bibliotecas en la gestión eficaz de los metadatos MARC descriptivos para los libros electrónicos. Los desafíos identificados en la literatura incluyen control de calidad, integridad de cobertura, escalabilidad de flujos de trabajo y administración continua." (Mugridge y Edmunds, 2012), (Traill, 2013).

La reciente aparición de sistemas de administración de bibliotecas (LMS) que proporcionan acceso a metadatos descriptivos para recursos electrónicos activados en las bases de conocimiento del sistema, significa que los modelos de administración de libros electrónicos se están moviendo hacia una mayor eficiencia y opciones de implementación y mantenimiento más complejas. Después de muchos años, tras depender de los registros MARC suministrados por el proveedor como la única fuente de metadatos descriptivos para muchas colecciones de libros electrónicos, la disponibilidad de otros flujos de suministro de metadatos es bien recibida.

El desarrollo de plataformas de servicios bibliotecarios, como Alma (Ex Libris) y WorldShare (OCLC), que integra funciones de gestión de recursos electrónicos con funciones ILS tradicionales, significa que múltiples fuentes de metadatos de recursos electrónicos están ahora disponibles para muchas bibliotecas. Estas opciones tienen serias implicaciones para los flujos de trabajo de gestión de libros electrónicos: tanto la selección inicial de una fuente de registro MARC, como la gestión continua de flujos de metadatos de ebooks presentan nuevos desafíos para muchas bibliotecas.

La integración de bases de conocimiento con registros MARC vinculados en LMS tiene como objetivo aumentar la eficiencia, al eliminar la necesidad de cargar (y actualizar o eliminar periódicamente) lotes de registros MARC para recursos electrónicos. Sin embargo, en la práctica, esta integración significa que las bibliotecas a menudo tienen múltiples opciones para obtener metadatos descriptivos para libros electrónicos donde anteriormente solo había una opción. Las fuentes evaluadas incluyen WorldShare Collection Manager (WCM), Alma Community Zone (ACZ) y proveedores de contenido que suministran directamente los registros MARC para sus colecciones.

Evaluación de la integridad de registro para la selección de fuente de metadatos

La integridad se determina evaluando los archivos de los registros MARC de las fuentes disponibles (ACZ, WCM, proveedor) con un script de Python que verifica la presencia o ausencia de varios elementos y asigna valores numéricos ponderados a cada elemento. El script está destinado a ejecutarse según sea necesario desde la línea de comandos. Evalúa cada archivo binario MARC en el directorio de trabajo actual, o un único archivo binario MARC, basado en la entrada de la consola.

Otras oportunidades de automatización

Los scripts y procesos descritos anteriormente han mejorado la gestión de metadatos de ebook en UMN haciéndolo más consistente, basado en datos y haciéndolo más eficiente, mientras que también mejora la calidad de los metadatos para el descubrimiento. Sin embargo, ahora que han perfeccionado este proceso, están trabajando con sus administradores de sistemas para que estos scripts se ejecuten directamente en un servidor SFTP, para una mayor continuidad y seguridad. El procesamiento del lado del servidor también posibilitará colocar automáticamente los archivos de actualización procesados en un servidor SFTP donde los perfiles de importación programados de Alma pueden recogerlos.

Comentario personal

Las bibliotecas y los proveedores de libros electrónicos están trabajando conjuntamente en la actualización y definición de nuevos modelos de negocio más eficientes y efectivos para la adquisición de libros electrónicos. En un mercado global cada vez más competitivo, las nuevas tecnologías y las realidades económicas están obligando a los editores de libros y mayoristas a hacer cambios significativos en sus modelos de negocio.

Este despegue obedece a varios factores: la definitiva implantación de la edición electrónica como parte consustancial de la producción de contenidos (fundamentalmente en el ámbito científico y en el de las obras de referencia), las mejoras tecnológicas y de prestaciones en los dispositivos de lectura, así como la variedad de estos, la oferta cada vez más amplia y diversificada de catálogos de obras desarrollados por editoriales de todo tipo, y la receptividad hacia los nuevos medios manifestada por el público lector.

Bibliografía

Cordón, J. A. (2010). Libros electrónicos: una realidad emergente. Anuario Thinkepi [en línea], vol. 4, pp. 130–138. [Consultado en: 30/11/2017]. Disponible en: https://dialnet.unirioja.es/servlet/articulo?codigo=3263886

Alonso Arévalo, J. (2013). Plataformas de préstamos de libros digitales en las bibliotecas públicas. Lectyo [en línea], pp. 20. [Consultado en: 30/11/2017]. Disponible en: https://gredos.usal.es/jspui/bitstream/10366/122174/1/eb6-Plataformas%20de%20prestamos%20de%20libros%20digitales.pdf

De Vicente García, R. (1998). Los libros electrónicos en las colecciones de las bibliotecas públicas. BiD. Textos Universitaris de Biblioteconomia I Documentació [en línea], pp. 21. [Consultado en: 30/11/2017]. Disponible en: http://bid.ub.edu/pdf/30/es/devicente.pdf


Oscar (Discusión) 13:21 h. 30 Noviembre 2017 (CET)