Centralized Accessioning Support for Born Digital Archives

De TallerDocumental on Wiki
Saltar a: navegación, buscar

Referencia bibliográfica

Prael, A.S. 2018. Central Accesioning Support for Born Digital Archives. Code4Lib Journal, 41. Recuperado de: https://journal.code4lib.org/articles/13494

Resumen original

Archives often receive obsolete digital storage media alongside paper acquisitions: CDs and DVDs mixed in with folders of correspondence, Zip disks, and floppy disks set aside by the donor with the intention to review the content later. Archives must not only have the expertise to work with digital media,but also the hardware and software to capture the content without the risk of altering the files merely by viewing them. This article will describe how Yale University Libraries and Museumms addressed accesioning of born digital archival content on physical media through a centralized digital accesioning support service.

Centralizing the hardware and expertise required for working with physical media made it possible to accession media more quickly and return the files to the originating archives for arrangement and description.


Resumen propio

En 2014, la Biblioteca de la Universidad de Yale implantó el software ArchivesSpace para la gestión de los archivos digitales de sus distintos centros y un año después integró en ese software el sistema Preservica Digital Preservation para garantizar la disponibilidad de la información a largo plazo, con el propósito de conseguir el mismo desarrollo que para sus colecciones físicas. En 2016 se observó un retraso significativo en la captura e incorporación de los registros al sistema y para solucionarlo, se decidió contratar a un especialista para que pusiera en marcha un servicio centralizado dedicado exclusivamente a ello. De esta forma, el registro es más rápido, puesto que el especialista conoce cómo extraer la información de los distintos dispositivos de almacenamiento, algunos de ellos ya obsoletos. Una vez efectuada la incorporación, el centro de procedencia se encarga de la descripción y gestión. En el trabajo se describe la puesta en marcha de una prueba piloto de ese servicio central y los resultados obtenidos hasta la fecha de publicación del artículo. En esa prueba, participaron ocho centros: la Irving S. Gilmore Music Libary, la Robert B. Haas Family Arts Library, las Divinity Special Collections, la Beinecke Rare Book and Manuscript Unit, el Yale Center for British Art Institutional Archives, el Manuscripts and Archives Department, la Medical Historical Library y los Peabody Museum Archives.

En primer lugar se celebraron reuniones con los distintos grupos de interés, que manifestaron las siguientes necesidades: capturar contenido de medios físicos, escanear el contenido buscando información personal, crear archivos de manifiesto para todos los ficheros capturados, crear o actualizar descripciones a nivel de elemento, preparar contenido para la preservación a largo plazo, abordar los problemas sobre privacidad durante el proceso y reformatear los materiales audiovisuales no nacidos digitales. Este último aspecto quedó fuera del alcance del proyecto.

En esas reuniones, también se identificaron los dispositivos que se aceptarían: 3.5 floppy disks, 5.25 floppy disks, JAZ disks, ZIP disks, discos ópticos, discos duros, memorias USB y ordenadores portátiles.

Una vez establecido el alcance del proyecto, el siguiente paso fue definir los flujos de trabajo e investigar y desarrollar herramientas adecuadas para llevarlos a cabo.

El flujo de trabajo consta de los siguientes procesos:

1. El profesional encargado del servicio debe conseguir acceso a las unidades de las colecciones especiales en el repositorio para poder crear y actualizar las descripciones de los elementos.

2. En cada centro: se cumplimenta online un formulario de metadatos que describe cada uno de los discos que envía al servicio y a cada documento se le asigna un identificador en ArchivesSpace llamado Component Unique Identifier, que también debe aparecen en el medio físico. El servicio ofrece ayuda para realizar esta última tarea.

3. En el servicio: se revisa el envío y se manda a la unidad de procedencia confirmación de la recepción. Se fotografía cada disco. Se accede a los discos conectándolos a través de un bloqueador de escritura (write blocker) que asegura que no se va a alterar ni el contenido ni los metadatos del disco. El hardware utilizado fue UltraKit from Digital Intelligence. Se escanean buscando virus y malware. El software utilizado para ello es Avast Antivirus. Si se descubren virus, el servicio contacta con la unidad de procedencia, para determinar el camino apropiado a seguir. Una vez el disco es seguro, se hace una copia exacta del contenido utilizando KryoFlux y se escanea con el software Forensic Toolkit en busca de información personal protegida. Una vez se han completado estas tareas, el medio físico se devuelve a la unidad de procedencia y en el servicio se importan a ArchivesSpace los metadatos, se enlaza el contenido capturado con los metadatos correspondientes y se guarda en una carpeta para introducirlo en el Digital Preservation System.

La prueba piloto acabó en junio de 2018 y en ese momento se habían capturado 5910 documentos y se habían creado o actualizado 2695 descripciones a nivel de elemento. Aunque disminuyó el trabajo pendiente, todavía no ha sido suficiente y se ha decidido que el servicio sea permanente, concentrándose sobre todo en el Beinecke Rare Book and Manuscript Library, que es el centro con mayores necesidades.

Comentario personal

Resulta un artículo muy interesante, en el que se plantea el problema que da origen a la creación del servicio centralizado para la captura y registro de documentos y se detallan minuciosamente todos los aspectos relativos a su implementación, al ser la autora la profesional encargada de su puesta en marcha. Describe el número de estudiantes en prácticas, el equipamiento del laboratorio, el hardware y software utilizado, incluso las opciones que proporciona el antivirus. Plantea también los problemas que se tuvieron que resolver como el del traslado de los medios físicos frágiles al laboratorio.

El flujo de trabajo que se presenta es muy claro, con una descripción concisa de las tareas, indicando si se llevan a cabo en los centros o en el laboratorio.

La estructura en secciones (identificación del problema, construcción del servicio, creación de flujos de trabajo, conclusiones…) facilita la lectura del artículo y su comprensión.

Para concluir, me gustaría resaltar que la decisión de centralizar la adquisición de los documentos ha tenido éxito, que, tras el proyecto piloto, el servicio va a continuar su labor. Es lo que cabía esperar, ya que al realizar esta tarea una especialista, el tiempo que se precisa es menor, puesto que conoce perfectamente el software que tiene que utilizar y cómo hacerlo.

Bibliografía

ArchivesSpace (2018). https://archivesspace.org/

Casanovas, I. (2007). Gestión de documentos electrónicos. Buenos Aires: Alfagrama.

Moreiro, J.A.; Sánchez-Cuadrado, S.; Palacios, V.; Barra, E. (2011). Evaluación de software libre para la gestión de archivos administrativos. El profesional de la información, 20, (2), 206-213. Recuperado de: https://recyt.fecyt.es/index.php/EPI/article/viewFile/epi.2011.mar.12/21224

Sánchez Quero M; Bia Platas, A. (2002). Desarrollo de una política de preservación digital: tecnología, planificación y perseverancia. III Jornadas de Bibliotecas Digitales: El Escorial (Madrid) 18-19 de Noviembre de 2002. Recuperado de: https://media.cervantesvirtual.com/research/articles/JBIDI02a.pdf