MatchMarc: A Google Sheets Add-on that uses the WorldCat Search API

De TallerDocumental on Wiki
Revisión del 21:59 15 ene 2020 de LaraS (discusión | contribuciones) (Comentario documentado)
(dif) ← Revisión anterior | Revisión actual (dif) | Revisión siguiente → (dif)
Saltar a: navegación, buscar


Referencia del artículo

Suranofsky, M. y McColl, L. (2019). MatchMarc: A Google Sheets Add-on that uses the WorldCat Search API. Code{4}lib Journal, (46). Recuperado de: https://journal.code4lib.org/articles/14813

Resumen en inglés original

Lehigh University Libraries has developed a new tool for querying WorldCat using the WorldCat Search API. The tool is a Google Sheet Add-on and is available now via the Google Sheets Add-ons menu under the name “MatchMarc.” The add-on is easily customizable, with no knowledge of coding needed. The tool will return a single “best” OCLC record number, and its bibliographic information for a given ISBN or LCCN, allowing the user to set up and define “best.” Because all of the information, the input, the criteria, and the results exist in the Google Sheets environment, efficient workflows can be developed from this flexible starting point. This article will discuss the development of the add-on, how it works, and future plans for development.

Resumen original traducido

Las bibliotecas de la Universidad de Lehigh han desarrollado una nueva herramienta para consultar WorldCat utilizando la API de búsqueda de WorldCat. La herramienta es un complemento de hoja de Google la cual está disponible a través del menú de complementos de hojas de cálculo de Google con el nombre "MatchMarc". El complemento es fácilmente personalizable, sin necesidad de tener conocimientos de codificación. La herramienta devolverá un solo "mejor" número de registro de OCLC, y su información bibliográfica para un ISBN o LCCN determinado, lo que permite al usuario configurar y definir "mejor". Debido a toda la información, la entrada, los criterios y el existen resultados en el entorno de Hojas de cálculo de Google, se pueden desarrollar flujos de trabajo eficientes desde este punto de partida flexible. Este artículo discutirá el desarrollo del complemento, cómo funciona y los planes futuros para el desarrollo.

Resumen detallado

Contexto

Las Bibliotecas de la Universidad de Lehigh y las Galerías de Arte de la Universidad de Lehigh (LUAG) colaboraron entre sí en marzo de 2019 para catalogar una colección de dos mil libros de LUAG, los cuales se usaban como material de referencia en la LUAG y se encontraban almacenados en una instalación del campus, los cuales querían trasladarlos a una sala de lectura de referencia de la galería de arte para que los pudieran consultar cualquier persona de la universidad, para ello, la colección tenia que estar visible en el catálogo de la biblioteca. El personal se encontró con el problema de que tendría una tarea más en su trabajo rutinario.Finalmente, la sala abrió en octubre de 2019 y querían tener clasificados y colocados los libros en las estanterías como así que estuviesen en el catálogo antes de la apertura.

Evaluando soluciones

El personal pensaba usar las búsquedas automatizadas de registros de OCLC y tuvieron en cuenta qué documentos tenían ISBN o LCCN, lo cual sería el punto de acceso. Para ello, se plantearon usar Connexion Client de OCLC, el cual tiene una herramienta de búsqueda por lotes, pero no cumplía con las necesidades que necesitaban. Buscaron otras herramientas que usasen la API de WorldCat de OCLC para la selección de registros, pero solo dos encajaban con lo que buscaban: LS Tools de la Universidad de Cornell y el proyecto Open Refine de Backlog lookup de la Universidad de Yale, la cual presenta una gran cantidad lógica y capacidad de configuración incorporada. Sin embargo, no es una herramienta sencilla de manejar en cuanto a las personalizaciones que necesitaban. Y surgió la idea de usar un complemento que se pudiese utilizar con la hoja de cálculo de Google y se basaron en los pasos de catalogar los flujos de trabajo que suelen ser hechos en hojas de cálculo y de los atributos de otros complementos de las hojas de cálculo de Google:

  • Tiene la capacidad de hacer llamadas a API
  • Puede analizar y construir XML, es decir, puede analizar sin problemas el XML MARC devuelto por las llamadas a la API, para inspeccionar valores y extraer valores para volver a escribirlos en la hoja de cálculo.
  • El código está Javascript simple y es intuitivo para trabajar con él.
  • Google proporciona documentación exhaustiva y ejemplos de codificación para esta plataforma.
  • El código se puede escribir directamente en un navegador con el editor de secuencias de comandos.
  • Facilita el compartir los proyectos. El código puede escribirse, compartirse y probarse fácilmente, proporcionando un ciclo de retroalimentación eficiente.

Interacciones

Teniendo en cuenta las ventajas, crearon una prueba de concepto de complemento de hoja de cálculo de Google. A lo primero, el criterio de registros en cuanto a la coincidencia estaba codificado. Usaron los siguientes criterios de selección respecto al ISBN o LCCN:

  • Regrese primero los registros en poder de la Universidad de Lehigh (LYU)
  • Si LYU no tiene registros, devuelva si 040 contiene DLC
  • Si no hay registros son DLC, devuelva si 042 contiene pcc
  • Si no hay registros de PCC, devuelva el registro que tenga la mayor cantidad de existencias adjuntas.

El complemento interactuó con la API de OCLC WorldCat usando ISBN y LCCN de la hoja de Google y luego se insertaron los valores de los registros MARC almacenados en la API como respuesta a la hoja. También agregaron criterios de coincidencia que permitirían al usuario recuperar registros en un formato específico. A lo primero se pensó exclusivamente en la recuperación de registros de monografías impresas, pero también tenían que incorporar los futuros usos de la herramienta como que permitiese usar diferentes formatos y fuese más extensible. Pensaron crear un formulario en la barra lateral del complemento para los criterios de coincidencia, pero tuvieron problemas con los criterios adicionales lo cual les llevó a colocarlo en una pestaña de la hoja de cálculo. De esta manera, la herramienta permitía usar reglas de coincidencia más complejas sin tener conocimientos de codificación. Además, la pestaña sirve para que el usuario especifique los datos bibliográficos que quiera recuperar en los resultados de la búsqueda.

Probando

La primera prueba de la herramienta la realizaron con 83 libros de matemáticas. Realizaron una búsqueda con cada libro en las dos herramientas candidatas (Cliente Connexion de OCLC y con el complemento de la hoja de cálculo de Google, llamado MatchMarc). Establecieron una comparación con los números seleccionados manualmente de OCLC con los números seleccionados por la máquina. Se vieron dos diferencias las cuales eran de origen de un error humano. El complemento si seleccionó el mejor registro e inmediatamente empezaron a usar MatchMarc con la colección. El proceso fue rápido gracias al nuevo procedimiento de búsqueda y a la hoja de cálculo original con la cual se desarrolló un flujo de trabajo tras los resultados de MatchMarc en la hoja de cálculo:

  • La columna de números de devueltos se utilizó para crear etiquetas de columna. Guardaron la Hoja de Google como Excel y usaron la función Combinar correspondencia de MS Word para completar esta tarea.
  • El documento Excel usado previo se utilizó para crear breves registros MARC utilizando el traductor de texto de MarcEdit. La información local colocada en la hoja de cálculo, como notas locales, códigos de barras y números de llamada se convirtieron en parte de este breve registro MARC.
  • El registro MARC se fusionó con el archivo MARC de OCLC, utilizando la función Combinar registros de MarcEdit. El número de OCLC se utilizó en este proceso como el identificador único en el que basar la fusión.
  • Antes de importar el MARC a nuestro ILS, una tarea MARCEdit eliminó los campos MARC innecesarios y se aplicó el Ayudante RDA de MARCEdit. Los registros fueron importados a nuestro ILS.
  • Excel fue usado como una lista de verificación para garantizar que los códigos de barras y las etiquetas del lomo se colocaron en los libros correctos.

Usando MatchMarc

MatchMarc es un complemento gratuito y disponible públicamente. Para agregarlo hay que acceder a la hoja de Google a Add-ons > Get add-ons y hacer una búsqueda por MARC. La barra del complemento da la opción de ingresar una clave API de OCLC y la barra lateral se usa para indicar qué pestaña contiene el ISBN y LCCN y los criterios coincidentes. En el botón "Haga clic para inicializar las pestañas de muestra” genera dos pestañas: una con búsquedas de prueba y otra con criterios de coincidencia de muestra. Otra característica es la capacidad de recibir por correo electrónico un archivo MARCXML. En "Crear archivo de registro MARC y enviar a" antes de hacer clic en el botón "Iniciar búsqueda" se puede incluir un email.

En la pestaña Sample Searches es donde hay que poner la información de los registros. En la primera columna irá el ISBN y en la segunda el LCCN. En la segunda pestaña (Sample Search Criteria) es para los criterios de coincidencia en la que pueda indicar si quiere realizar una búsqueda de existencias locales. Si se configura de esta manera, la API atenderá primero esta interacción. Cuando encuentra un registro, escribe un listado de resultados en la hoja de cálculo o interactúa por segunda vez con la API indicándole que devuelva los resultados ordenados por el número de existencias de la biblioteca. Después pasa a la pestaña de los criterios para detectar cuales con coinciden. Cuando el resultado coincide con los criterios, en la pestaña primera escribe los detalles del registro. Además, también se puede configurar los detalles de los registros MARC en la parte de debajo de la pestaña de coincidencias. Por último, el complemento compara los valores de cada fila hasta hallar una coincidencia.

Limitaciones

Hay dos limitaciones que se han encontrado. La primera es el límite de 10 minutos de tiempo en la búsqueda de un gran listado de registros y la segunda limitación es la dependencia del ISBN y LCCN para realizar las búsquedas.

Planes de desarrollo

Se plantean tres mejoras a realizar a la herramienta. Desarrollarán que la herramienta pueda tomar los campos y subcampos MARC con los valores, que el usuario agregue a los resultados de la hoja, y aplicarlos al registro adecuado. Otra mejora es que por correo electrónicos e enviarán todos los registros OCLC con todos los campos de cada registro MARC. Y por último planean desarrollar una aplicación para usar en la hoja de cálculo de Google para evitar el problema del tiempo límite, sin que sea esta un complemento de la hoja de cálculo de Google.

Comentario documentado

La aparición de las nuevas tecnologías hace que el desarrollo y el mantenimiento de una colección bibliotecaria sea más sencillo de realizar. Son muchas las bibliotecas que hacen uso de estas tecnologías. Destaca principalmente el uso de las búsquedas automáticas para mejorar el flujo de trabajo, los complementos para las hojas de cálculo de Google (Lehigh University, 2019) y las diferentes APIs de WorldCat que usan OCLC (Johnston, 2017). Han sido varias bibliotecas universitarias las que han creado herramientas para solucionar los problemas de tiempo y tareas realizadas por el personal como la Universidad de Yale, que desarrolló Open Refine, y la Universidad de Cornelle, que creó LS Tools.

MatchMarc, según la Universidad de Lehigh (2019), es un complemento para hojas de cálculo de Google el cual ha sido desarrollado usando la plataforma de Google Apps Script con el objetivo de mejorar el flujo de trabajo. Automatiza un paso muy importante del proceso de catalogación: la búsqueda, la comparación y la selección de los registros. Este proyecto ha sido tomado como referencia en otras herramientas, ya que el código se encuentra disponible para cualquiera que lo quiera usar y por ser un claro ejemplo de como usar la API de búsqueda de Worldcat en un complemento para la hoja de cálculo de Google.

Las APIs más utilizadas para el uso de herramientas bibliotecas son la API de metadatos y la API de búsqueda. Las APIs de WorldCat presentan unos requerimientos de uso y términos de uso. En el caso de la API de metadatos la puede usar cualquier institución que tenga una suscripción en cataloging and Firstsearch y se necesita obtener una WSkey y ser un usuario de worldshare (Johnston, 2017). Para la API de búsqueda también se requiere que la institución esté suscripta y es posible que sea necesario solicitar una clave. MatchMarc tiene un campo en la barra lateral llamado CLC API Key en el que se introduce la clave. La API de búsqueda también la utilizan las herramientas creadas por las universidades de Yale y Cornelle, las cuales fueron candidatas para usar.

Una de las características de la API de búsqueda es que devuelve 10.000 visitas en un incremento de 100 de registros en MARCXML o Dublin Core y permite usar como identificador el número OCLC para los registros (Johnston, 2017). El número OCLC de los registros permite realizar diferentes interacciones dependiendo de cómo la herramienta informática esté programada para interactuar con la API de WorldCat de búsqueda como hace MatchMarc cuando recupera los registros en MARCXML. Además, usa el número OCLC como identificador para establecer una comparación con los números seleccionados manualmente frente los seleccionados por la máquina y para establecer una fusión entre los registros MARC de OCLC con los registros previos que la biblioteca de la Universidad de Lehigh ya tenía.

Podemos deducir que la creación de este complemento permite que las bibliotecas puedan tener otra opción en automatizar los procesos de catalogación en el menor tiempo posible con la posibilidad de buscar con el ISBN y el LCCN como punto de acceso debido a que mejora el flujo de trabajo usando la hoja de cálculo. El desarrollo de esta herramienta y similares de mejora de flujo de trabajo se basa en el uso de las APIs de Worldcat que usan OCLC con el objetivo de incorporar elementos diferentes en la creación de complementos, ya que permiten adaptar las necesidades de cada institución en el desarrollo de una aplicación, no solo para las aplicaciones de Google sino también para otras aplicaciones utilizadas por las instituciones.Además, destaca la gran importancia del número OCLC para el desarrollo de diferentes aplicaciones para la catalogación en las bibliotecas.

Referencias bibliográficas

Johnston, S.(2017). Homegrown WorldCat Reclamation: Utilizing OCLC’s WorldCat Metadata API to Reconcile Your Library’s Holdings. Code{4}Lib Journal, (27). Recuperado de: https://journal.code4lib.org/articles/10328

Lehigh University. (2019). Lehigh Libraries develop open source cataloging add-on for Google Sheets. Library and Technology services. Recuperado de: https://ltsnews.lehigh.edu/lehigh-libraries-develop-open-source-cataloging-add-google-sheets