domingo, diciembre 03, 2006

Proyecto de digitalización Biblioteca Complutense-Google. 1ª Parte


INTRODUCCIÓN: NOCIONES SOBRE LA PRESERVACIÓN DIGITAL

Para Terry Kuny, especialista en bibliotecas digitales y ciencias de la información, actualmente vivimos en la Edad Media digital. Según él, mucho de lo que está escrito y codificado electrónicamente se va a perder para siempre. A nosotros nos toca emular el papel de los monjes del pasado, y asumir la tarea de conservar la historia y el patrimonio documental de nuestros tiempos.

DESAFIOS DE LA PRESERVACIÓN DIGITAL

¿Pero porqué esta en riego nuestro patrimonio digital?

El desembarco de las nuevas tecnologías en el mundo de la información ha traído consigo la aparición del documento digital o electrónico. Éste ha tenido una gran acogida gracias a las enormes posibilidades que nos ofrece frente al documento tradicional impreso (acceso, recuperación, reducción de espacio,…). Pero no todo son ventajas. Nos tenemos que plantear el gran reto de cómo proteger los recursos digitales.

Los métodos de preservación tradicionales no pueden aplicarse tal cual al material digital por distintos motivos: por una parte las publicaciones digitales aprovechan a menudo información almacenada en distintos servidores, además hablamos de un volumen de datos enorme y con una gran volatilidad. La UNESCO estima que en Internet existen mil millones de páginas cuya duración de vida media es muy corta, entre 44 días y dos años.

Para las instituciones culturales que tienen a su cargo el acopio y la preservación del patrimonio cultural, definir que elementos deben conservarse para las generaciones futuras y cómo proceder en su selección y conservación, se está volviendo un problema apremiante. A la hora de seleccionar lo que merece ser preservado nos enfrentamos a un volumen de datos pasmoso. Así, la School of Information Management and Systems de la Universidad de Berkeley (California), afirma en un estudio que “el almacenamiento de la producción total anual de contenidos impresos, filmados, ópticos o magnéticos requeriría unos 1500 millones de gigabytes de memoria, lo que equivale a 250 megabytes por cada hombre, mujer o niño del planeta”

La preocupación de la UNESCO ante la amenaza de pérdida del patrimonio digital le ha llevado a preparar una estrategia para promover la preservación digital, que se ha articulado en torno a:

  • Amplio proceso de consultas con los gobiernos, responsables de la formulación de políticas, productores de información, instituciones y expertos encargados del patrimonio, fabricantes de programas informáticos y organismos de normalización
  • Difusión de directrices técnicas
  • Ejecución de proyectos piloto (Pandora- archivo de publicaciones australianas seleccionadas online
  • Preparación de un proyecto de carta para la preservación del patrimonio digital

En su Carta para la preservación del patrimonio digital reconoce la importancia de la conservación de los documentos electrónicos, y nos pone en alerta del peligro que corremos de perder el patrimonio digital del mundo.
Se enfatiza en la preservación en todos los ciclos de vida de los documentos: Creación, catalogación, almacenamiento, acceso y recuperación, preservación. El proceso de preservación y archivo se hace de forma más eficiente cuando se pone atención a las cuestiones de consistencia, formatos, normalización y descripción bibliográfica en los primeros pasos del ciclo de vida de la información. Por esto es importante que los creadores de objetos digitales participen de las estrategias de preservación digital.

Mientras que la información en soportes tradicionales como el papel, microfilms,… puede durar cientos (e incluso miles) años, la información digital es raro que supere las dos décadas. Esto se debe a problemas de carácter técnico y de carácter organizativo. Los primeros son más inmediatos y visibles, entre ellos tendríamos:

  1. La esperanza de vida de los soportes de almacenamiento digital que es mucho menor que la de los impresos.
  2. Velocidad de cambios del entorno: formatos, software y hardware
  3. Falta de compatibilidad hacia atrás de nuevos sistemas. El avance apresurado de las nuevas tecnologías trae aparejada la aparición de nuevas generaciones más potentes de equipos y programas informáticos. Esta renovación constante de hardware y software da lugar a problemas de compatibilidad con sistemas antiguos, lo que a la larga significa que parte del material digital que existe en Internet se volverá inaccesible.
  4. Facilidad de modificar datos, lo que dificulta garantizar la autenticidad y la integridad de los documentos

Además de los problemas que afectan a aspectos tecnológicos tenemos otros de dimensiones sociales y de organización. Son:

  • Problemas legales sobre los derechos de autor. ¿Cómo preservar un recurso reproduciéndolo o reformateándolo si no tenemos el permiso del titular?
  • Escasez de recursos humanos y financieros. ¿Cómo mantener y actualizar la infraestructura y los recursos necesarios para garantizar la perdurabilidad de los documentos a lo largo de los años?;
  • Falta de un compromiso institucional permanente. ¿Cómo asegurar el compromiso institucional permanente? ¿cómo convencer a todos los implicados de la necesidad de colaborar? ¿cómo verificar si se cumple todo lo que se promete?

ESTRATEGIAS PARA LA PRESERVACIÓN DIGITAL

Las principales estrategias aplicadas actualmente para frenar la pérdida de información digital son, de forma resumida:

  • Preservación de la tecnología
    Preservación del entorno técnico que hace funcionar al sistema. Básicamente conservar el software y hardware con que se origino ese documento. Es muy costoso y a la larga imposible de sostener.
  • Migración de los datos
    “Es la transferencia periódica del material digital desde una configuración de hardware o software a otra; o bien desde una generación de tecnología informática a la siguiente”
    Se utiliza para copiar o convertir datos desde una tecnología a otra, tanto si se trata de hardware como de software, conservando las características esenciales de los datos.
    Conversión de datos de una tecnología a otra sin cambiar las características esenciales de los datos.
  • Emulación de las aplicaciones informáticas originales
    Proceso mediante el cual se diseña y se instala un nuevo sistema informático capaz de simular las funciones que realizaba otro sistema ya obsoleto y generalmente de características diferentes, con el fin de poder ejecutar los viejos programas del segundo.
  • Copias de Seguridad
    Proceso de hacer duplicados exactos del objeto digital. Componente esencial de todas las estrategias de preservación, las copias de seguridad en sí mismas no son una técnica de mantenimiento a largo plazo.
  • Actualización
    Copia de información digital de un soporte de almacenamiento a largo plazo a otro del mismo tipo.
  • Metadatos
    Dirigidos a describir el objeto digital y permitir así su recuperación. Es una buena práctica crear unos metadatos (aunque sean básicos) en el momento mismo de la producción de los documentos.
  • Almacenamiento
    Migración a nuevos sistemas de almacenamiento
    Estas estrategias se consideran como soluciones a corto plazo a un problema a largo plazo.

DEFINICIÓN DE PRESERVACIÓN DIGITAL

De todo lo anterior podemos extraer la definición y los objetivos de la preservación digital. Así, Oya Rieger ve la preservación digital como un problema organizativo y la define como “actividades de gerencia que aseguran el acceso continuo a los materiales digitales frente a los elementos tecnológicos y empresariales rápidamente cambiantes

Podemos decir que la preservación digital consiste en “mantener la capacidad de visualizar, recuperar y utilizar colecciones digitales frente a las infraestructuras y elementos tecnológicos y de organización que cambian con mucha rapidez”

En la preservación digital encontramos una dicotomía muy interesante. ¿En qué consiste realmente, en la digitalización de los originales, en la conservación de los propios documentos digitales o en ambas cosas? Se puede entender por preservación digital la preservación de los artefactos físicos mediante su digitalización, pero también la preservación de los propios recursos digitales. Una vez tenido en cuenta esto podemos pensar en los objetivos que tiene esa preservación a través de la digitalización.


OBJETIVOS DE LA PRESERVACIÓN DIGITAL

1- Incrementar el acceso a la colección
2- Mejorar los servicios para un grupo de usuarios en expansión aumentando el acceso a las fuentes documentales de la institución.
3- Reducir la manipulación de los materiales frágiles y hacer una “copia de seguridad” de los mismos mediante su digitalización.
4- Brindar a la institución la oportunidad de desarrollar su infraestructura técnica y la destreza de su plantilla
5- Desarrollar fuentes de información en colaboración con otras instituciones accesibles a través de Internet.
6- Rentabilizar los avances tecnológicos de otras instituciones compartiéndolos
Plan de preservación

PLAN DE PRESERVACIÓN DIGITAL

La definición de un plan de preservación pasa por dar respuesta a las siguientes preguntas:
1. ¿Qué es lo que hay que guardar y porque?
Colecciones digitales con un valor duradero y de interés intelectual.
La demanda de los documentos también es un factor a tener en cuenta ya que si los fondos están digitalizados serán de más fácil acceso.
La condición física en que se encuentren los documentos también se ha de tener en cuenta ya que será más urgente la preservación de un documento que corre un gran riesgo físico por deterioro, por ejemplo que otro en mejores condiciones.

Esta selección debe estar avalada por una política de preservación bien definida y apoyada económicamente. Esta política debe ser revisada periódicamente junto con la selección de documentos a preservar. A estos documentos se les debe dar un valor límite de vida ya que algunos serán más perecederos que otros

2. ¿Dónde se debe guardar?
Los soportes digitales son frágiles y efímeros además adolecen de ciertas características como posibles fallos técnicos y mecánicos, errores del operador, virus, cambios no autorizados y no documentados, obsolescencia o incompatibilidad del software, pérdida de programas, metadatos incompletos, envejecimiento de la información, entre otros. La

La selección de formatos donde guardar la información debe ser parte del plan global de preservación del proyecto, que debe abarcar también otros aspectos tales como los procedimientos de preservación a seguir. Por otro lado, ninguno de los medios digitales de hoy en día garantiza la longevidad de la información. Los medios magnéticos tienen una vida sorprendentemente corta, los discos compactos son más duraderos pero nadie puede predecir su durabilidad que depende en gran medida de la calidad de los mismos.

3. ¿Hasta cuándo guardarlo?
A los objetos preservados se les debe asignar un valor límite de vida y llegado esa fecha, la institución, mediante su política de preservación digital deberá decidir qué hacer con eso objeto digital.

4. ¿Cómo recuperarlo después?
5. ¿Cómo mantenerlo inalterado?
6. ¿Cómo evitar que se vuelva obsoleto?

Estas tres últimas preguntas guardan una estrecha relación entre si, ya que la correcta recuperación depende de cómo se mantengan los recursos digitales y su mantenimiento depende en gran medida de evitar su obsolescencia.

Para evitar la obsolescencia de los recursos digitales podemos renovar periódicamente los archivos evitando la pérdida de datos debida al envejecimiento del soporte, o bien, convertir viejos formatos a otros más nuevos. También habrá que tener en cuenta los criterios de redundancia, y la elección adecuada de medios y lugares de almacenamiento.

Un factor que favorece la longevidad de nuestra información digital es el uso de los formatos más usados para su almacenamiento. Esto aumenta la probabilidad de que cuando un formato se vuelva obsoleto aún existan programas para su conversión. XML, HTML y PDF son ejemplos de estos. También se puede crear un archivo que contenga las definiciones de los formatos, estándares de metadatos, protocolos y otros elementos constructivos fundamentales de las bibliotecas digitales. Esto nos permitiría descifrar la información en el futuro, siempre que conservemos los formatos y esquemas de codificación.

No hay comentarios: