Building a Scalable and Flexible Library Data Dashboard

De TallerDocumental on Wiki
Saltar a: navegación, buscar

Referencia

  • MEALEY, Nathan. Building a Scalable and Flexible Library Data Dashboard. En: Code4Lib Journal . [en línea] 01/2017, 35 [consultado: 25/10/2017] ISSN: 1940-5758. Disponible en: http://journal.code4lib.org/articles/12152

Resumen original

Data dashboards provide libraries with the means to demonstrate their ongoing activities and usage in an engaging and communicative fashion. Yet, due to the number of service platforms used by libraries, and the wide-ranging technical specifications they entail, bringing all of this content together in a sustainable way is a significant challenge. This article describes Portland State University’s project to design and build a data dashboard based on a scalable and flexible infrastructure that would enable them to present data in a visually compelling and dynamic interface.

Resumen del alumno

Los Tableros de Datos proporcionan datos que pueden identificarse fácilmente y que permiten informar de las actividades de evaluación y toma de decisiones de la biblioteca. Además, incluyen datos de varias bases de datos haciendo posible dos aspectos importantes para las bibliotecas: mostrar el alcance de las actividades y descubrir las relaciones existentes entre los datos. Las bibliotecas se enfrentan con 3 problemas derivados de la cantidad de datos que generan:

  • Bases de datos dispersas debido a los diferentes sistemas utilizados por las bibliotecas para dar sus servicios (software de préstamo interbibliotecario, registros del servidor web, etc.)
  • Heterogeneidad de los datos, ya que cada sistema tiene una estructura única. Para que fuera homogénea, habría que normalizar esos datos en todos los sistemas
  • Acceso a los datos debido a que cada sistema proporciona diferentes maneras para acceder a la información: unos proporcionan API para recuperar datos, otros nos permiten exportar informes, etc.

En 2016, la Biblioteca de la Universidad Estatal de Portland comenzó un proyecto para afrontar estos problemas y construir un tablero de datos orientado al público, así como la infraestructura técnica necesaria para darle un mantenimiento continuo.

Proyecto de tablero de la biblioteca de la Universidad Estatal de Portland El objetivo principal que planteó la biblioteca fue "Desarrollar la infraestructura técnica y los flujos de trabajo para recopilar e informar sobre las métricas de la Biblioteca en todos los sistemas y unidades". Dada la amplitud del objetivo y la cantidad de datos a los que se enfrentaba la biblioteca, el proyecto se enfocó en un objetivo específico, la creación de un tablero de datos para la página web de la misma, permitiendo dos resultados en un solo paso: reemplazar el contenido actual por un panel más atractivo e interesante, y desarrollar la infraestructura para administrar e informar los datos de la biblioteca con vistas al futuro. Una vez se tuvo el alcance definido, se dividió el proyecto general en 4 fases para una mejor estructuración del trabajo:

  1. Identificar las fuentes de datos de las que se obtendrá información, evaluar esos datos y seleccionar las fuentes de datos de destino , ajustadas a cada modelo de sistemas para trabajar con la mayoría de ellas. Los datos seleccionados son aquellos que pueden dar una idea general de las actividades en curso de la biblioteca: visitas al sitio web, personas que visitan la biblioteca y la sala de estudio, préstamos, préstamos interbibliotecarios, uso de los recursos electrónicos, etc.
  2. Seleccionar el lugar de almacenamiento de los datos, el esquema y los datos de recolección . El esquema tenía los siguientes datos: nombre, cuenta de recopilación, año de recogida de datos y etiquetas (términos descriptivos). Para realizar el almacenamiento de datos, utilizaron MongoDB, una base de datos “NoSQL” que permite agregar datos sin un esquema predefinido; e implementaron una biblioteca de Python llamada Eve que da coherencia a los datos que se fueran almacenando.
  3. Construir la interfaz de usuario . Para ello utilizaron la biblioteca de gráficos JavaScript de C3 y se empezó a integrar el panel en el sitio web, desarrollando, para cada gráfico, códigos cortos que incluían las variables necesarias para construir y visualizar el gráfico.
  4. Extraer y almacenar en caché los datos para el uso repetido en producción . Para ello, crearon un proceso automatizado para extraer y programar los datos necesarios y almacenarlos en un servidor web local

El resultado es un tablero de datos dinámico y atractivo para los usuarios que requiere un mantenimiento sostenible y que puede incorporar fuentes de datos y puntos de datos adicionales. A pesar de tener el proyecto completado/terminado, se está trabajando en unos puntos importantes para mejorar el tablero de datos como los tableros dinámicos, incluir datos anuales, añadir fuentes de datos adicionales y compartir versiones de código abierto de los componentes del sistema para que otras bibliotecas puedan aprovecharlos. El proyecto de la Biblioteca de la Universidad Estatal de Portland ha proporcionado la primera idea para solucionar el problema de la variedad de los sistemas de bibliotecas así como el desarrollo de una capacidad mayor para aprovechar los datos que éstas proporcionan. Además, este proyecto también ha dejado la base para que otras bibliotecas puedan aprovechar mucho mejor los datos que los sistemas para bibliotecas les proporcionan.

Comentario

Los datos estructurados son cada vez más frecuentes y más importantes dentro del ecosistema web y, donde mejor podemos verlos, es en Google ya que hace uso de datos estructurados. Una manera de utilizarlos es incluyendo fragmentos enriquecidos en los sitios web para destacar contenido específico en los resultados que se obtienen tras la búsqueda. Su aplicación en las bibliotecas es a través de paneles o tableros de datos. Los paneles de datos estructurados son tablas de contenido con información de las actividades, servicios, préstamos, etc. que se realizan en una biblioteca, algunos ejemplos de Bibliotecas que se dedican a ello son el Laboratorio de la Biblioteca de Harvard está trabajando en una herramienta para ver el tamaño de la colección y la circulación por temas y las Bibliotecas de la Universidad de Brown, que están trabajando en un tablero web que presenta los datos a tiempo real como registros.

Referencias

  • BÉRARD, R., (2011). Free Library Data? (en línea) En LIBER Quarterly 20 (3-4), pp.321–331. [Fecha de consulta: 20/11/2017] Disponible en: http://doi.org/10.18352/lq.7997

Anabel (discusión)