Leveraging Google Drive for Digital Library Object Storage

De TallerDocumental on Wiki
Saltar a: navegación, buscar

Referencia del artículo

Weig, E. C. (2020). Leveraging Google Drive for Digital Library Object Storage. Code{4}lib Journal, (48). Recuperado de https://journal.code4lib.org/articles/15073

Resumen original

This article will describe a process at the University of Kentucky Libraries for utilizing an unlimited Google Drive for Education account for digital library object storage. For a number of recent digital library projects, we have used Google Drive for both archival file storage and web derivative file storage. As a part of the process, a Google Drive API script is deployed in order to automate the gathering of of Google Drive object identifiers. Also, a custom Omeka plugin was developed to allow for referencing web deliverable files within a web publishing platform via object linking and embedding. For a number of new digital library projects, we have moved toward a small VM approach to digital library management where the VM serves as a web front end but not a storage node. This has necessitated alternative approaches to storing web addressable digital library objects. One option is the use of Google Drive for storing digital objects. An overview of our approach is included in this article as well as links to open source code we adopted and more open source code we produced.

Resumen original traducido

Este artículo describe el proceso seguido por las Bibliotecas de la Universidad de Kentucky en la utilización de la cuenta ilimitada de Google Drive for Education, para el almacenamiento de objetos de la biblioteca digital. Para varios proyectos recientes de bibliotecas digitales, se ha utilizado Google Drive, tanto para el almacenamiento de ficheros de archivo como para el almacenamiento de archivos derivados de la web. Como parte del proceso, se implementa un script de API de Google Drive para automatizar la recopilación de identificadores de objetos de Google Drive. Además, se desarrolló un complemento Omeka personalizado para permitir la referencia a archivos entregables web dentro de una plataforma de publicación web mediante la vinculación e incrustación de objetos. Para una serie de nuevos proyectos de bibliotecas digitales, nos hemos inclinado hacia un enfoque de máquina virtual pequeña para la gestión de bibliotecas digitales en el que la máquina virtual sirve como interfaz web pero no como nodo de almacenamiento. Esto ha requerido enfoques alternativos para almacenar objetos de bibliotecas digitales direccionables a través de la web. Una opción es el uso de Google Drive para almacenar objetos digitales. En este artículo se incluye una descripción general de este enfoque, así como enlaces al código fuente abierto que se adoptó y al código fuente abierto que se creó.

Resumen detallado

Pequeñas máquinas virtuales

En las Bibliotecas de la Universidad de Kentucky, cada vez se confía más en pequeñas máquinas virtuales (VM) de bajo costo para administrar bibliotecas digitales de tamaño pequeño a mediano. El enfoque es una solución viable para las pequeñas y medianas bibliotecas, pero no para las grandes ya que estas pequeñas VM tienen un espacio de almacenamiento limitado. Es por ello que se ha avanzado hacia el almacenamiento de objetos digitales y entregables web de gran tamaño en la cuenta ilimitada de Google Drive.

Beneficios identificados

Algunos de los beneficios de utilizar Google Drive son el espacio de almacenamiento ilimitado y sin coste adicional y su facilidad de uso.

Desafíos identificados

Un primer desafío con Google Drive fue adaptarse a un sistema de almacenamiento basado en objetos frente al de archivos. Dado que Google Drive es un sistema de almacenamiento basado en identificadores de objetos para acceder a los objetos digitales fue necesario producir un reporte que relacionase los nombres de los archivos y los identificadores de objetos de los archivos de Google Drive. La información de este reporte debía combinarse con los metadatos existentes y cargarse en Omeka. Otro desafío fue aprender a utilizar los objetos de Google Drive dentro de las páginas de visualización de Omeka. Para ello, hubo que producir código personalizado para la plataforma de publicación web que permitiera la vinculación fácil a elementos de Google Drive y / o incrustarlos en vistas de elementos con formato HTML.

Secuencias de comandos de la API de Google Drive

Buscando en GitHub y en el manual en línea de la API de Google se encontró un script simple para ejecutar en cualquier directorio de Google Drive y que generase un reporte que contenga los metadatos que describen los archivos del directorio. Configurar el script y ejecutarlo fue sencillo. La salida resultante del guión fue una hoja de Google que tenía dos columnas. Una columna enumera un nombre de archivo y una segunda columna enumera el identificador de Google Drive correspondiente para el archivo. El reporte junto con los metadatos adicionales que describen los archivos digitales, se utilizaron para construir un solo archivo CSV para cargar por lotes los metadatos en Omeka. Afortunadamente, existe un complemento Omeka para la carga por lotes de metadatos con formato CSV.

Un complemento simple para Omeka

Una mala noticia fue que no existía ningún complemento de Omeka para utilizar archivos de Google Drive. Es por ello, que se necesitaba crear un código de complemento que pudiera contener la URL de Google Drive. Al analizar la sintaxis de la URL, el código analiza el enlace y detecta si especifica o no una URL de hipervínculo simple de Google Drive o una URL de incrustación de Google Drive. Según los resultados de este análisis, el código luego formatea el enlace para la página HTML en consecuencia.

Uniendo las piezas

Una vez que se instaló y configuró el nuevo complemento y algunos de nuestros metadatos se indexaron, los objetos de Google Drive comenzaron a aparecer dentro de nuestras páginas de vista de elementos.

Resultados

Se han superado los desafíos identificados y se ha logrado el objetivo de los proyectos: utilizar Google Drive en el almacenamiento de objetos de bibliotecas digitales. Para ello se ha creado tanto el código API de Google Drive junto con las instrucciones de uso como el complemento Omeka de código abierto disponible en GitHub y en omeka.org.

Comentario personal documentado

Las funcionalidades de Google Apps for Education (GAFE), y en concreto la de Google Drive son cada vez más usadas en los entornos educativos por su uso colaborativo, versatilidad, fácil manejo, capacidad de almacenamiento ilimitado y coste cero. También cabe destacar la reducción de costes en infraestructuras y asistencia técnica puesto que ya no hay que mantener servidores propios si no que la información se aloja en los propios servidores de Google. El uso de Google Drive permite que los centros educativos desarrollen soluciones técnicas a sus problemas de forma creativa e innovadora. (Universidad de Colima, 2013)

Al igual que en las bibliotecas de Kentucky, han surgido proyectos en otros entornos educativos cuyo objetivo es potenciar las prestaciones propias del repositorio, fomentando su crecimiento y difusión, así como la reutilización de los objetos incluidos en él, a través de su integración con diversos servicios y herramientas existentes en Internet. La interacción con servicios de gestión de archivos en la nube como Google Drive y la reproducción dentro del mismo entorno de videos publicados en otros servidores, permitirán flexibilizar la manipulación y visualización del contenido favoreciendo la reutilización de los mismos. Además, la posibilidad de interactuar con otros formatos de metadatos usados en plataformas que utilizan distintas tecnologías y formas de organización de la información abre un camino muy provechoso en pos de la interoperabilidad entre los sistemas. (Díaz et al., 2014)

En la creación de código abierto es muy útil la aplicación GitHub. Esta herramienta colaborativa es de gran ayuda a los programadores, ya que en ella se pueden alojar los programas que se estén desarrollando y la comunidad puede verlos y editarlos. GitHub tiene un control de versiones y se utiliza muchísimo ya que abre un mundo de posibilidades a la programación en abierto. (Gustavo, 2019)

Otra cuestión a tener en cuenta en la utilización de Google Drive para alojar los archivos de un repositorio, es la seguridad. Aunque, en principio, los archivos que se suben a Google Drive se guardan en centros de datos seguros, Google no es infalible. El ejemplo lo tenemos recientemente con la caída a nivel mundial del servicio de Google, el pasado 14 de diciembre, por un problema de almacenamiento interno. Durante 45 minutos las bibliotecas de Kentucky no pudieron acceder a la información de su repositorio. (Agencia EFE, 2020)

Está claro que la solución aplicada por las bibliotecas de Kentucky, al utilizar Google Drive en el almacenamiento de objetos de bibliotecas digitales, es creativa e innovadora, pero también refleja la falta de recursos económicos destinados a los centros educativos. La ampliación del disco duro de la máquina virtual hubiese resuelto igualmente el problema de almacenamiento, de forma más sencilla, aunque menos factible por la falta de recursos.

Referencias

Agencia EFE. (2020). ¿Qué ocasionó la caída del servicio de Google de este 14 de diciembre? El Comercio. Recuperado de https://www.elcomercio.com/tendencias/causas-caida-servicio-google-gmail.html

Díaz, J., Schiavoni, A., Amadeo, P., Charnelli, E., Schulz, J., y Humar, A. (2014). Integración de un Repositorio Digital con servicios que extienden su funcionalidad. Recuperado de https://core.ac.uk/download/pdf/296377601.pdf

Gustavo, B. (2019). ¿Qué es GitHub y para que se utiliza? Hostinger. Recuperado de https://www.hostinger.es/tutoriales/que-es-github/

Universidad de Colima. (2013). Ventajas de Google Apps . Recuperado de https://sites.google.com/a/ucol.mx/bienvenida/home/moving-to-google-apps