5 SIGLOS CONSERVANDO Y DIFUNDIENDO LIBROS, Y AHORA¿QUÉ HACEMOS CON INTERNET?
El archivo web de la BNE
MAR PÉREZ MORILLOJefe de Servicio Web de la BNE
BIBLIOTECA NACIONAL DE ESPAÑA
LIBER 2012, Barcelona
BIBLIOTECA NACIONAL DE ESPAÑA2
Índice
Panorama internacional del archivado web– Antecedentes– Principales proyectos– Edad oscura digital– Proyectos colaborativos
El archivo web de la Biblioteca Nacional de España– Comienzos– Estado de la colección– Planes a corto plazo– Retos de futuro
• El Depósito Legal de lo electrónico
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA3
Panorama internacional del archivado web. Antecedentes
• Directrices UNESCO para la Preservación del Patrimonio Digital (2003)• Internet Archive (1996)• Biblioteca Nacional de Australia: Pandora (1996)• Biblioteca Nacional de Suecia (1997)• Biblioteca Nacional de Nueva Zelanda (1999)• Library of Congress: Minerva (2000)
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA4
Panorama internacional del archivado web. Otros proyectos
El archivo web de la Biblioteca Nacional de España
• Iniciativas internacionales muy numerosas ya
• La Biblioteca Nacional de Portugal creó una Wiki en la que se recogen datos de todos los proyectos:
Año de creaciónOrganismo responsableTecnología utilizadaRecursos humanosMás información
BIBLIOTECA NACIONAL DE ESPAÑA5
Panorama internacional del archivado web. Otros proyectos
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA6
Riesgo de una Edad Oscura Digital
• “Digital Dark Age”: 150 millones de resultados en Google
• Preocupación general
El archivo web de la Biblioteca Nacional de España
• Copistas medievales vs. archiveros web
Carrera contrareloj
Problemas con los soportes
Afán de transmisión del conocimiento
Pérdidas de información
BIBLIOTECA NACIONAL DE ESPAÑA7
Riesgo de una Edad Oscura Digital
Obsolescenciade formatos y soportes
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA8El archivo web de la Biblioteca Nacional de España
Y, ante este riesgo,
¿qué hacemos?
BIBLIOTECA NACIONAL DE ESPAÑA9
Panorama internacional: el IIPC
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA10
Panorama internacional: el IIPC
El archivo web de la Biblioteca Nacional de España
• Numerosas iniciativas de colaboración.
• La más importante es el Consorcio Internacional para la Preservación de Internet:
principales instituciones patrimoniales en el campo de la información y la documentación
• Fundado en 2003 por 11 bibliotecas nacionales y el Internet Archive.
• Hoy sus miembros somos ya 42.
• La BNE se integró en el Consorcio a principios de 2010.
BIBLIOTECA NACIONAL DE ESPAÑA11
Panorama internacional: Proyectos colaborativos
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA12
Panorama internacional: Proyectos colaborativos
El archivo web de la Biblioteca Nacional de España
• La “Revolución del Jazmín” (Túnez, 2011): recolección web colaborativa entre Internet Archive, la Library of Congress y la Biblioteca Nacional de Francia.
• Blogs y sitios web de estudiantes y opositores al régimen de Ben Alidesaparecieron cada día durante las últimas semanas de 2010 y enero de 2011.
• Cuando Ben Ali fue depuesto del poder, los documentos oficiales comenzaron a desaparecer también.
BIBLIOTECA NACIONAL DE ESPAÑA13
Panorama internacional: Proyectos colaborativos
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA14
Panorama internacional: Proyectos colaborativos
El archivo web de la Biblioteca Nacional de España
• Otro proyecto colaborativo (aún en marcha): Olimpiadas 2012.
• La Universidad de North Texas creó una herramienta para proponer sitios web que recolectar y archivar.
• El archivado lo ha realizado Internet Archive.
• Proyectos como este sirven para favorecer la colaboración entre instituciones patrimonialespara coordinarse en la selección de estos materialescompartir prácticas en este campoexperimentar en accesos web comunes a colecciones de distinta procedencia
• 2705 URL recolectadas.
• Han participado 31 instituciones de todo el mundo
BIBLIOTECA NACIONAL DE ESPAÑA15
Panorama internacional: Proyectos colaborativos
El archivo web de la Biblioteca Nacional de España
La BNE ha participado en este proyecto colaborativo, proponiendo webs
BIBLIOTECA NACIONAL DE ESPAÑA16
Panorama internacional: ISO TC 46/SC 8/WG 9Estadísticas y aspectos de calidad en los archivos web
• La BNE trabaja en este grupo desde que se constituyó (finales de 2009)• Comité técnico 46: Información y documentación• Subcomité 8: Calidad, estadísticas y evaluación• Objetivo: elaborar un informe técnico que
refleje el estado actual de la cuestión,defina los términos y elementos relativos a estos proyectos,establezca aspectos cuantificables para medir la calidad y sirva de pauta a las organizaciones que desarrollan estos trabajos
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA17
El archivo web de la BNE. Comienzos
• La BNE inició su proyecto de archivado de la web a finales de 2009
• Contrato con Internet Archive para recolectar el dominio .es:
1 recolección masiva
(+ 317 millones de URL)
3 recolecciones trimestrales complementarias
• En total: + 875 millones de URL = 30TB
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA18
El archivo web de la BNE. 2ª fase del proyecto
• Periodo 2011-2012:
1 recolección masiva (sept-oct 2011)
1 recolección selectiva elecciones 20-N
1 recolección selectiva Humanidades
1 recolección masiva (mayo-junio 2012)
• Total: 55TB de datos comprimidos
El archivo web de la Biblioteca Nacional de España
•Recolecciones 2009-2010 + 2011-2012= 85TB
BIBLIOTECA NACIONAL DE ESPAÑA19
El archivo web de la BNE. Estado del proyecto
El archivo web de la Biblioteca Nacional de España
• En nuestra colección se guardan distintas capturas de un mismo sitio web.
• En la Wayback Machine, si tomamos como ejemplo la web de RTVE, se ve que hay capturas desde diciembre de 2009 hasta la última, que es de julio de 2012.
BIBLIOTECA NACIONAL DE ESPAÑA20
El archivo web de la BNE. Estado del proyecto
El archivo web de la Biblioteca Nacional de España
www.rtve.es
BIBLIOTECA NACIONAL DE ESPAÑA21
El archivo web de la BNE. Estado del proyecto
El archivo web de la Biblioteca Nacional de España
• Entre lo archivado en nuestra colección, muchas webs ya están desaparecidas.
• Ejemplo: una captura de la web del MCU de diciembre de 2011, poco después de las Elecciones Generales. Hoy no existe ya esta web. El MCU se fundió con el Ministerio de Educación.
BIBLIOTECA NACIONAL DE ESPAÑA22
El archivo web de la BNE. Estado del proyecto
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA23
El archivo web de la BNE. Planes a corto plazo
• Traslado de la colección desde Internet Archive• Habilitar acceso público• Toma de medidas ante la entrada en vigor del RD del DL electrónico• Colaboración con las CC.AA.• Rastreos y recolecciones propios
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA24
El Depósito Legal de lo electrónico
• Es el gran reto• Necesita de la colaboración de
• Organismos públicos,• Administraciones,• Agencias,• empresas privadas,• productores
• Necesita:• recursos,• financiación…
• Conversaciones con Red.es para colaboración
El archivo web de la Biblioteca Nacional de España
BIBLIOTECA NACIONAL DE ESPAÑA25
Retos de futuro
• Límites de las recolecciones (geográficos, lingüísticos…)• Almacenamiento• Preservación
El archivo web de la Biblioteca Nacional de España
• Derecho al acceso universal a lo público• Salvaguarda de los derechos de propiedad intelectual• Usos• ¿Derecho al olvido?
BIBLIOTECA NACIONAL DE ESPAÑA26
Fuentes de informaciónDirectrices de la UNESCO para la preservación del patrimonio digital (2003): http://unesdoc.unesco.org/images/0013/001300/130071s.pdfProyecto de archivado web en la BNE: http://www.bne.es/es/LaBNE/ArchivoWeb/index.htmlInternet Archive: http://archive.org/index.phpConsorcio Internacional para la Preservación de Internet (IIPC): http://www.netpreserve.org/Wiki con todos los proyectos web: http://en.wikipedia.org/wiki/List_of_Web_Archiving_InitiativesLa Revolución del Jazmín (Túnez, 2011): http://www.archive-it.org/collections/2323Recolección colaborativa de las Olimpiadas 2012: http://digital2.library.unt.edu/nomination/olympics2012/Grupo de trabajo ISO sobre aspectos de calidad de los archivos web: http://www.iso.org/iso/home/standards_development/list_of_iso_technical_committees/iso_technical_committee.htm?commid=48826Terry Kuny: “A Digital Dark Ages? Challenges in the Preservation of Electronic Information”, 63RD IFLA Council and General Conference, 1997. http://archive.ifla.org/IV/ifla63/63kuny1.pdf
El archivo web de la Biblioteca Nacional de España
Mar Pérez MorilloJefe del Servicio Web
BIBLIOTECA NACIONAL DE ESPAÑ[email protected]
Pº de Recoletos 20-22 28071 Madrid
EspañaT +34 915 807 800
www.bne.es