SCOPE: A digital archives access interface

De TallerDocumental on Wiki
Revisión del 19:12 6 ene 2020 de MateoA (discusión | contribuciones) (Comentario Personal Documentado)
(dif) ← Revisión anterior | Revisión actual (dif) | Revisión siguiente → (dif)
Saltar a: navegación, buscar

Referencia del artículo

Stewart, K., y Breitwieser, S. (2019). SCOPE: A digital archives access interface. Code{4}lib Journal, (43). Recuperado a partir de https://journal.code4lib.org/articles/14283

Resumen original

The Canadian Centre for Architecture (CCA) identified certain technological issues, namely extensive reference workflows and under-utilizing existing metadata, as significant barriers to access for its born-digital archives. In collaboration with Artefactual Systems, the CCA built SCOPE, a digital archives access interface. SCOPE allows for granular file- and item-level searching within and across digital archives, and lets users download access copies of the collection material directly to a local machine. SCOPE is a free, open-source tool. The beta version is available to the public, and a second phase is under-development as of Spring 2019.

Resumen original traducido

El centro canadiense de arquitectura (CCA) identificó determinados problemas tecnológicos, a nivel de flujos de trabajo extensivos de referencia y bajo el uso de metadatos existentes, como barreras significativas para el acceso para sus archivos digitales. En colaboración con sistemas artefactuales, el CCA ha construido SCOPE, un interfaz de acceso a archivos digitales. SCOPE permite realizar búsquedas granuladas a nivel de documentos o ítem dentro y a través de archivos digitales, y permite a otros usuarios descargar copias del material de la colección directamente a una maquina local. SCOPE es una herramienta gratuita y de código libre. La versión beta está disponible al público y una segunda fase se desarrollará durante la primavera de 2019.

Resumen detallado

Introducción

Los métodos tradicionales de acceso a las colecciones de los archivos deben expandirse para albergar al formato digital. Los desafíos técnicos pueden obstaculizar el aprovechamiento de los metadatos a la hora de buscar y proveer los documentos a los investigadores. Así nace SCOPE, un buscador basado en la interfaz de acceso para material digital. SCOPE ha tenido como principal colaborador a Artefactual Systems. Esta herramienta escrita en código abierto pretende ser una solución para el acceso a colecciones digitales y un estudio de caso para soluciones técnicas colaborativas.

¿Por qué SCOPE? Parámetros para el acceso digital

CCA es una institución y museo internacional de búsqueda basada en el estudio y práctica de la arquitectura. Cuando adquirió 25 archivos con un alto componente digital, se planteó una nueva cuestión: “¿cómo se procesa, preserva y se hace accesible más de 5TB de material de archivo digitalmente nato?”

El personal de cinco archivos comenzó a trabajar en esos archivos y la meta era lograr hacer ese material accesible, además de diseñar el modelo para ver cómo luciría un sistema de preservación compatible entre el Sistema de Información de Archivo Abierto (Open Archival Information System (OAIS)) y la CCA. El OAIS es el estándar ISO para la preservación digital, y define los diferentes paquetes de información que se pueden mantener a lo largo del tiempo: SIP, DIP, AIP…

Al finalizar el procesamiento de los 25 archivos digitales, se realizaron tareas usuales de archivos digitales. El almacenamiento digital original se representó utilizando BitCurator y luego se organizó y describió. Tim Walsh desarrolló un paquete de herramientas de código abierto para el procesamiento de archivos digitales. Los archiveros llevaron a cabo posteriormente una descripción automatizada siguiendo ISAD-G y se incluyeron los metadatos en la base de datos del CCA.

Posteriormente el material fue incluido en Archivematica, el sistema de preservación construido por Artefactual Systems. Archivematica promulga una serie de microservicios de preservación, los escribe como un evento de PREMIS, y empaqueta la información en un archivo METS almacenado con AIP. Verifica que están debidamente fijados los AIP para que puedan mantenerse a lo largo del tiempo y generará el DIP para el acceso de los usuarios. Sin embargo, el acceso a los archivos por parte de los investigadores fue laborioso y generó dos problemas:

  • Las consultas terminaban siendo una consulta para aprender a usar el archivo por parte de los servicios de referencia
  • Los métodos tradicionales de investigación de archivos parecen aplicarse menos a los materiales digitales

Se tenía que optimizar el flujo de trabajo y aprovechar la descripción granular de nivel de archivo creada por Archivematica. Tras evaluar las soluciones se concluyó que crear una aplicación personalizada era el único camino para seguir.

En el año 2017 Tim Walsh diseño y construyó un prototipo de SCOPE que actualmente se ha convertido en un buscador plenamente funcional basado en la interfaz por DIPSs (se descargan completos y no por archivos separados de forma que se mantiene el contexto del archivo) desarrollado por Artefactual Systems. Los investigadores inician sesión y pueden buscar los metadatos para encontrar documentos individuales o DIPs completos, descárgalos directamente a las estaciones de trabajo del CCA mediante un link de la interfaz. El acceso de los investigadores solo se realiza a través de estaciones de trabajo, donde el acceso a Internet y el uso de UBSs está bloqueado. El material alojado no puede moverse ni es accesible desde otra localización.

La solicitud de documentos y la búsqueda se han mejorado. El nivel de documento de metadatos en el archivo de METs es reconocible y las búsquedas pueden ser conducidas a través de todas las colecciones a la vez. Los investigadores tienen acceso directo a ese nivel, incluyendo el nombre del archivo, formato, fecha de modificación… también permite la visualización de eventos PREMIS, haciendo el procesamiento de archivos más transparente a los investigadores.

Esfuerzo en equipo

Hubo varias razones por las cual la colaboración con Artefactual fue una decisión necesaria. La primera fue que se necesitaban desarrolladores de aplicaciones profesionales. En segundo lugar, la integración de SCOPE con el almacenamiento Archivematica, y Artefactual cuenta con una larga experiencia y conocimiento sobre la práctica en archivos. El CCA patrocino 700 horas de trabajo de Artefactual desde el verano de 2018 hasta la primavera de 2019.

Generalmente trabajan tres individuos fundamentales: un bibliotecario o archivero (analista), un desarrollador de software y un jefe de proyecto. Archiveros y otros profesionales de la CCA trasladaron sus necesidades y con la ayuda de Artefactual Systems, volcaron esas características particulares en la aplicación.

En la primera fase se realizaron dos pruebas de usuario que permitieron averiguar que el producto debía ser funcional, intuitivo y sencillo de utilizar, así como permitieron conceptualizar algunas funciones.

La colaboración entre las organizaciones propició una versión beta y una vez los usuarios la probaron, se pusieron en común los comentarios de estos para encontrar errores y resolverlos, y se emprendió la segunda ronda de desarrollo. El código de SCOPE está alojado en GitHub en la organización CCA y el personal de Artefactual tuvo acceso a GitHub. El proyecto se administra con Waffle, como hace Artefactual con Archivematica.

Trabajo Futuro

Actualmente están trabajando en una segunda ronda para conducir a SCOPE a una versión post-beta, introduciendo nuevas características y revisar las existentes. La actualización más importante será la integración de SCOPE con el almacenamiento DIP de Archivematica. Puede ser que se sigan usando las herramientas de automatización (AT) para generar DIP de la CCA o que se integre la funcionalidad de carga de IP de Archivematica a SCOPE. Otra medida importante es la mejora de la búsqueda que incluirá facetado y filtrado. También se pretende lograr incluir informes de estadísticas.

Conclusión

Como cualquier otro producto, una aplicación necesita un mantenimiento para seguir siendo relevante. Al ser software en código abierto, es la propia comunidad la que colabora a su mantenimiento. Los interesados pueden descargar la aplicación y probarla junto con Archivematica. Pueden contribuir así al proyecto en diferentes vías como: solución de problemas en un foro de usuarios, revisión de código, escritura de código e identificación o comentarios sobre problemas.

Comentario Personal Documentado

Las nuevas tecnologías están permitiendo la digitalización de los documentos impresos, garantizando la conservación de estos. A su vez, cada vez crece más y más el número de documentos que nacen en formato digital. Si unimos toda esta documentación en formato digital, nos encontramos con lo que se denomina como “patrimonio digital”. La UNESCO define como patrimonio digital “los recursos que son fruto del conocimiento o la expresión de los seres humanos, ya sean de carácter cultural, educativo, científico o administrativo, o comprendan información técnica, jurídica, médica o de otro tipo, y que se generan cada vez más a menudo directamente en formato digital, o se convierten a él a partir de material ya existente” (Pulgar y Marcos, 2008).

Mientras que actualmente las grandes bibliotecas están comenzado a digitalizar sus colecciones y hacerlas accesibles, los archivos van muy por detrás de ellas y los pocos que han conseguido digitalizar material y hacerlo accesible, poseen interfaces muy simples, con buscadores poco intuitivos. Una de las problemáticas a la que se enfrentar los archiveros en cuanto a la digitalización para la preservación y el acceso a los documentos va ligada a incorporación de metadatos a los documentos. Los metadatos de los documentos de archivo son característicos porque deben definir el contenido, el contexto y la estructura del documento a lo largo del tiempo (Raventós, 2012).

La herramienta SCOPE es un ejemplo de preservación digital. Está escrita en código abierto por lo que, si consigue convertirse en una herramienta buena de trabajo, las instituciones podrán copiar su modelo adaptándolo a sus necesidades particulares. Además, al estar basada en el modelo OAIS, convertido en norma ISO, también garantiza cierta homogenización en cuanto a las funciones, las responsabilidades y la organización que debe cumplir un sistema dedicado a la preservación y acceso a documentos. El modelo OAIS ha servido de base para repositorios de archivo en la conservación de sus documentos, dado que al contrario que otros modelos anteriores que solo aseguraban la lectura e inteligibilidad, OAIS garantiza que el documento es veraz, puede usarse a lo largo del tiempo y además está completo (Raventós, 2012).

Las funciones de preservación quedan aseguradas gracias al uso de PREMIS, dado que quedan definidos los metadatos que requiere SCOPE para la preservación de sus materiales digitales. Los datos escritos en PREMIS se encapsulan en un archivo METS que usando XML codifica el documento electrónico (Caplan, 2009).

El acceso también queda asegurado porque al seguir las “directrices” del OAIS, tomando el objeto original del productor (SIP) se crean AIPS (con la información descrita en PREMIS+METS) y cuando el usuario haga una búsqueda y solicite una respuesta, se le devolverá la información en DIP, un paquete de información del objeto recogido y descrito (De Giusti, Lira, Oviedo, Villarreal y Texier, 2012). En España, una iniciativa similar dedicada a la preservación digital es Ondarenet. Se trata de una herramienta que pretende constituirse como el archivo electrónico del País vasco, donde la captura, la conservación y la difusión de los objetos digitales quede asegurada de forma que quede garantizada la recuperación, preservación y difusión del patrimonio digital vasco. (Pulgar y Marcos, 2008).

Otro proyecto relacionado con Ondarenet y que también se ubica en España es Padicat. De nuevo, Padicat es una herramienta que se dedica al archivado de la web catalana. Como se ha mencionado anteriormente, las bibliotecas son precursoras en este ámbito, por delante de los archivos, y Padicat es fruto de la acción de la Biblioteca de Cataluña Como la Biblioteca de Cataluña tiene como misión recopilar, conservar y difundir la producción bibliográfica catalana, por ende, tiene la misma misión para su patrimonio digital. Así, Padicat, en colaboración CESCA y de la Secretaria de Telecomunicaciones y Sociedad de la Información la Generalitat de Catalunya, es un depósito digital encargado de compilar, procesar y dar acceso permanente a la producción digital catalana (Circo, 2006). Tanto Ondarenet como Padicat para garantizar la preservación de sus objetos digitales definen los metadatos que incorporaran los documentos digitales, tal y como hace la herramienta SCOPE.

Con toda esta información, se puede deducir que cada vez se desarrollan más herramientas enfocadas no sólo al acceso, sino también a la recuperación y preservación de documentos en formatos digital, hayan nacido ya en ese formato o hayan sufrido un proceso de digitalización. Los estándares y modelos internacionales están ayudando a crear el marco teórico que precisan dichas herramientas y ello unido a el uso del código abierto, facilita las tareas de creación e implementación de este tipo de iniciativas.

Referencias bibliográficas

Caplan, P. (2009). Entender PREMIS. Recuperado a partir de https://www.loc.gov/standards/premis/UnderstandingPREMIS_espanol.pdf

De Giusti, M. R., Lira, A. J., Oviedo, N., Villarreal, G. L., y Texier, J. (2012). Las Actividades y el Planeamiento de la Preservación en un Repositorio Institucional. En: BIREDIAL - Conferencia Internacional Acceso Abierto, Comunicación Científica y Preservación Digital, Baranquilla, 13-16 de noviembre. Recuperado a partir de https://www.aacademica.org/marisa.de.giusti/84.pdf

Llueca, C. (2006). Archivando la Web, el proyecto Padicat (Patrimonio Digital de Cataluña). El profesional de la Información, 15(6), 473-478. Recuperado a partir de http://eprints.rclis.org/8399/

Metadata Encoding and Transmission Standard. (18 de julio de 2019). En Wikipedia, la enciclopedia libre. Recuperado el 15 de noviembre de 2019 de https://es.wikipedia.org/wiki/Metadata_Encoding_and_Transmission_Standard

Open Archival Information System. (17 de julio de 2019). En Wikipedia, la enciclopedia libre. Recuperado el 15 de noviembre de 2019 de https://es.wikipedia.org/wiki/Open_Archival_Information_System

Pulgar Vernalte, F., y Marcos Maciá, S. (2008). Ondarenet: el archivo del patrimonio digital vasco. En XI Jornadas de Gestión de la Información, Madrid, 20-21 de noviembre. Recuperado a partir de http://eprints.rclis.org/12553/

Raventós P. (2012) Repositorios digitales: aplicación del modelo OAIS y los esquemas de metadatos a la conservación del patrimonio documental archivístico. En XVIII Jornadas de Archivos Universitarios, Cádiz, 23-25 de mayo. Recuperado a partir de: http://cau.crue.org/wp-content/uploads/pepitaraventosrepositoriosdigitales.pdf