Improving the discoverability and web impact of open repositories: techniques and evaluation

De TallerDocumental on Wiki
Saltar a: navegación, buscar

Referencia del artículo

Macgregor, G. (2019). Improving the discoverability and web impact of open repositories: techniques and evaluation. Code{4}lib Journal, (43). Retrieved from https://journal.code4lib.org/articles/14180

Resumen original

In this contribution we experiment with a suite of repository adjustments and improvements performed on Strathprints, the University of Strathclyde, Glasgow, institutional repository powered by EPrints 3.3.13. These adjustments were designed to support improved repository web visibility and user engagement, thereby improving usage. Although the experiments were performed on EPrints it is thought that most of the adopted improvements are equally applicable to any other repository platform. Following preliminary results reported elsewhere, and using Strathprints as a case study, this paper outlines the approaches implemented, reports on comparative search traffic data and usage metrics, and delivers conclusions on the efficacy of the techniques implemented. The evaluation provides persuasive evidence that specific enhancements to technical aspects of a repository can result in significant improvements to repository visibility, resulting in a greater web impact and consequent increases in content usage. COUNTER usage grew by 33% and traffic to Strathprints from Google and Google Scholar was found to increase by 63% and 99% respectively. Other insights from the evaluation are also explored. The results are likely to positively inform the work of repository practitioners and open scientists.

Resumen original traducido

En esta contribución, experimentamos con un conjunto de ajustes y mejoras de repositorio realizados en Strathprints, la Universidad de Strathclyde, Glasgow, repositorio institucional desarrollado por EPrints 3.3.13. Estos ajustes fueron diseñados para admitir una mejor visibilidad de la web del repositorio y la participación del usuario, mejorando así el uso. Aunque los experimentos se realizaron en EPrints, se cree que la mayoría de las mejoras adoptadas son igualmente aplicables a cualquier otra plataforma de repositorio. Después de los resultados preliminares informados en otra parte, y utilizando Strathprints como un estudio de caso, este documento describe los enfoques implementados, informa sobre datos comparativos de tráfico de búsqueda y métricas de uso, y ofrece conclusiones sobre la eficacia de las técnicas implementadas. La evaluación proporciona evidencia persuasiva de que las mejoras específicas en los aspectos técnicos de un repositorio pueden resultar en mejoras significativas en la visibilidad del repositorio, resultando en un mayor impacto web y los consecuentes aumentos en el uso del contenido. El uso de COUNTER creció un 33% y el tráfico a Strathprints de Google y Google Scholar aumentó en un 63% y 99% respectivamente. También se exploran otras ideas de la evaluación. Es probable que los resultados informen positivamente el trabajo de los profesionales del repositorio y los científicos abiertos.

Resumen detallado

Introducción

En los últimos diez años años se han invertido importantes recursos en hacer visibles importantes colecciones digitales a través de los repositorios, produciendo un gran incremento de los repositorios institucionales. Uno de los países que más esfuerzos ha dedicado ha sido Reino Unido a través de IRUS-UK, por el contrario, también hay numerosos ejemplos de organismos que todavía se muestran reticentes a llevar a cabo este tipo de iniciativas haciendo que sus repositorios no hayan experimentado un gran desarrollo. Los repositorios de acceso abierto se enfrentan a plataformas académicas que están incrementando su notoriedad pero apenas han asimilado los protocolos y estándares de la ciencia abierta. Para que los repositorios académicos de ciencia abierta sean competitivos en el futuro necesitan mejorar sus índices de relevancia y del contenido que tienen. En esta publicación se comparten una serie de mejoras en el repositorio de Strathprints, repositorio de la Universidad de Strathclyde a través de la tecnología EPrints para mejorar la visibilidad del repositorio e incrementar así su uso. Se describen los enfoques utilizados, los datos comparativos y las conclusiones alcanzadas tras la implementación de estas técnicas.

Fondo

A pesar de la gran importancia que los repositorios institucionales presentan para la comunicación científica en versión abierta es significativo la escasa información que se encuentran relativa a su evaluación y sobre su descubrimiento, especialmente sobre los factores de impacto de los repositorios. La Revista Code4Lib publicó un trabajo sobre el uso de microdatos en repositorios institucionales para mejorar la exposición de sus contenidos. Kelly y Nixon realizaron un trabajo sobre el uso de técnicas de SEO en tres repositorios separados de Reino Unido. Tonkin se centró en el estudio de la cubierta de los repositorios. Otros autores han puesto el acento en mejorar la indexación de Google Académico.

Promoción del descubrimiento de repositorios

Una de las mayores preocupaciones de la Universidad de Strathclyde ha sido la mejora de la capacidad de detección de su repositorio para asegurar que su investigación tenga una repercusión relevante llevado a cabo a través de Strathprints. A través de EPrints se llevaron a cabo una serie de mejoras y ajustes. Las primeras ligadas a la funcionalidad del repositorio mientras que las segundas estuvieron vinculadas a refinar aspectos existentes del repositorio.

Cambios técnicos

Las principales mejoras que se llevaron a cabo fueron las siguientes:

  • Puesta en funcionamiento de un interfaz de usuario con el objetivo de mejorar su maneja y usabilidad para hacerlo atractivo a los usuarios.
  • Implementación de una reingeniería receptiva "móvil primero" de Strathprints.
  • Mejoras de enlaces internos (navegación, etiquetas de hipervínculos, etc), mejoras de contenidos con el objetivo de incrementar la interacción con el usuarios.
  • La inclusión con herramientas sociales
  • Creación de una configuración "conector-life" para conformar Strathprints como un destino de texto completo para usuarios y máquinas, permitiendo un mayor control sobre lo que está escrito en Strathprints por el CRIS institucional.

Ajustes

Además de las mejoras anteriormente citadas también se llevó a cabo una serie de ajustes para facilitar el uso de los motores de búsqueda de Strathprints y la experiencia de los usuarios. Mejoras en la velocidad de la página, ajustes de nomenclatura de archivos para que sea más sencillo de encontrar y recuperar resultados, limpieza de enlaces que ya no funcionaban, "minificación" de todos los archivos de repositorios relevantes para reducir el tiempo de espera de las páginas, la racionalización de todos los archivos CSS y Javascript para acabar con reglas y variables que no se empleaban, carga asíncronica de recursos JS, la optimización de imágenes, la implementación de Google Data o la compresión de GZIP son las más relevantes.

Datos y resultados

La repercusión de estas mejoras se midieron a través de varias métricas, además de datos de tráfico en Google Seach Console, en COUNTER de IRUS-UK, Google Analytics y datos de Strathprints. Se tomaron datos antes de la mejora de julio de 2016 hasta finales de julio de 2017 y después de la mejora desde julio de 2017 hasta julio de 2018.

Tráfico

El tráfico web, medido por Google Analytics, experimentó un crecimiento de 150,408 a 428,407 una vez habían sido puestas en marcha las mejoras. También se descubrió que Google era la fuente principal de referencia más grande, representando un 55% de todo el tráfico, una vez se habían desarrollado las mejoras. Los datos arrojaron que el 80% de todo el tráfico del repositorio provenía de Google o Google Scholar. En la tabla 1 se observan las diez principales fuentes de referencia y se puede observar una disminución en las referencias de Bing y Yahoo. Otro dato llamativo fue el aumento de las referencias de fuentes sociales como Twitter o Facebook, que aunque es pequeño respecto al tráfico total, su incremento porcentual es reseñable.

Descubrimiento

El aumento en impresiones y clics durante todo el período del informe fue del 146% y 53% respectivamente. Durante el período analizado Strathprints experimentó un crecimiento del 33% en el uso conjunto con COUNTER. Para determinar si existía correlación entre los clics y el uso de COUNTER se empleó el coeficiente de Pearson para cada año del informe. Se obtuvo una correlación que va desde débil (r=0,26) para el primer periodo, a una positiva moderada para el segundo periodo (r=0,65). Se empleó también el coeficiente de determinación para comprender la proporción de la varianza en la variable dependiente (el uso de COUNTER) a partir de la independiente (los clics de Google). Los resultados pueden observarse en las figuras 7,8 y 9 y se deduce que solo alrededor del 42% de la variación única en el uso de COUNTER podría atribuirse directamente a los clics de Google.

Conclusiones y trabajo futuro

En este trabajo se han plasmado una serie de mejoras del repositorio impulsado por EPrints para incrementar la visibilidad de la web e incrementar la participación de los usuarios en ella. Los resultados han dejado patente que las mejoras técnicas de un repositorio inciden de manera significativa en su visibilidad y mejorar su repercusión en la web. El tráfico web, la búsqueda y el uso de COUNTER se pueden mejorar en las herramientas de búsqueda y que existe una fuerte relación entre la visibilidad de búsqueda de Google y el uso de COUNTER. Además de estos aspectos también se incrementó el tiempo que los usuarios pasan en la página. El experimentó no buscaba abordar todas las variables posibles, se abordó desde un enfoque holístico, aunque si pretendía abordar el mayor número posible a través de la búsqueda de la acumulación de ganancias marginales. Como tarea pendiente cabe explorar otras fuentes de búsqueda más allá de Google, ya que este no será el motor de búsqueda web preferido siempre. Se piensa también que gran parte de las mejoras implementadas en EPrints se pueden extrapolar a la mayoría de plataformas de repositorio.

Comentario Personal Documentado

El estudio de George Macgregor es de gran utilidad y muy completo porque revela que a través de ajustes técnicos en los repositorios se puede alcanzar un incremento sustancial en la visibilidad de las web de los repositorios y de la difusión de su contenido generando así un incremento sustancial del interés de los usuarios por dicho recurso. Los datos del estudio son concluyentes y avalan esta técnica ya que arrojan, en este caso, un crecimiento del 33% en el uso de COUNTER y en el tráfico a Strathprints de Google y Google Scholar un 63% y un 99% respectivamente, cifras más que relevantes. El estudio es muy técnico y muy específico, dando por entendidos muchos conceptos, siglas y metodologías que se pueden escapar a un público no experto en la materia y que no posea un elevado nivel de estudios. Sería interesante que se incluyesen otras opciones de medición del impacto de un repositorio como la que apunta en su trabajo (Ariel, 2013) destacando el uso del Ranking Web de Repositorios Digitales del Mundo o el Laboratorio de Cibermetría del CSIC de España. En ese mismo trabajo, también se hace una mención especial a la importancia de registrar los diferentes repositorios que creemos en los directorios internacionales más relevantes para aumentar nuestra visibilidad, el impacto de nuestras investigaciones y el conocimiento de los investigadores que trabajan en la institución. Estos son los más relevantes: Registry of Open Access Repositories (ROAR), Directory of Open Access Repositories (OpenD OAR), Repository 66 y Open Access Map. Este información es importante para complementar el estudio de George Macgregor.

Siguiendo esa misma línea, y de cara a mejorar el trabajo analizado, sería necesario la inclusión de información relativa a "Buenas prácticas" ya que a menudo se obvia este punto y es de gran utilidad para conseguir una buena presencia en la Web y evitar el uso de técnicas poco éticas. Tal y como afirma en su estudio (Abadal, 2012) estos recursos no pueden comprenderse de forma aislada y resulta esencial para aprovechar todo su potencial y para cumplir con su misión principal, es decir, que sean capaces de interoperar con otros repositorios y otros recursos para intercambiar información o datos. En ese aspecto, el artículo de Macgregor se detiene de forma muy sucinta en esta cuestión que es uno de los puntos clave para que tenga éxito la mejora del impacto en este tipo de herramientas. También se echa en falta en el trabajo una radiografía internacional de la situación de este tipo de herramienta para ver en que lugares y contextos se lleva a cabo su implementación y desarrollo. cómo se está realizando y los fondos necesarios para llevarlo a cabo. No podemos olvidar la importancia de los costes, tanto los visibles como los invisibles, a la hora de llevar a cabo cualquier mejora en una herramienta, y este aspecto, no se trata en el estudio del autor. Un buen punto este para la mejora de las razones que justifican la implementación de estas técnicas, junto a las ya existentes en el estudio de Macgregor, aplicadas en el repositorio institucional de la Universidad de Strathclyde en Glasgow y que ayudaría a comprender y concienciar de la importancia de llevar a cabo estas políticas tanto a los organismos de los que dependen estos repositorios como a un público interesado en la materia que no fuese tan experto o especializado en este área.

Para este punto, el trabajo de (Abadal, 2012) puede ser de gran utilidad para complementar dicha lectura, ya que ofrece de forma breve y didáctica una explicación de la situación internacional de este tipo de herramienta. Por otro lado, el propio George Macgregor reconoce que no es un estudio cerrado y que se va a seguir recogiendo datos para ver el impacto de estas mejoras durante un tiempo más extenso para ofrecer una base más solida de resultados a su estudio, y además afirma, que existe la posibilidad de que dichas técnicas puedan ser aplicadas a otras plataformas de repositorios mejorado las cifras arrojadas en su estudio a la vez que ofrece una serie de consejos, como por ejemplo, la mejora que implica la supresión de las cubiertas de los documentos digitales para que puedan ser halladas más fácilmente por los sistemas de rastreo de los bots.

Para terminar, el apartado dedicado a la evaluación debería ser más extenso, detallado y que no se amparase únicamente en las cifras y los resultados, que son vitales para cualquier investigación, no hay duda sobre ello pero tendría que haber propuesto un modelo de evaluación. Para este punto, el estudio de los autores (Serrano, Melero y Abadal, 2014) aportando modelos de evaluación que se desarollan a nivel nacional y los proyectos supranacionales más relevantes supone una importante referencia para completar este punto junto a las cifras numéricas arrojadas por el estudio de George Macgregor.


Bibliografía


  • López, F.-A. (2013). Visibilidad e impacto de los repositorios digitales en acceso abierto. De Bibliotecas y bibliotecarios...Boletín Electrónico ABGRA, (5). Recuperado a partir de http://eprints.rclis.org/18940/



  • Serrano, Vicente, R., Melero, R., & Abadal, E. (2014). Indicadores para la evaluación de repositorios institucionales en repositorios institucionales de acceso abierto. Anales de Documentación, 17(2). https://doi.org/10.6018/analesdoc.17.2.190821