Preservación digital: retos y propuestas actuales
La captura de la web vasca: Un caso práctico de preservación digital
Francisca Pulgar Vernalte / Modesto Marin Tamayo Jaca, 22-24, julio, 2013
23-jul-13 2
Preservar
Preservación El diccionario de la Real Academia Española de la Lengua define
el verbo preservar:
En euskera preservar significa: babestu (proteger), zaindu (cuidar), y gorde (guardar), acepciones que nos indican acciones para cuidar algo para el futuro.
23-jul-13 3
Unesco
La Unesco en octubre de 2003 elabora el documento Carta para la Preservación del Patrimonio Digital en el que marca las directrices para salvaguardar el patrimonio digital:
Preámbulo.
El patrimonio cultural como herencia común.
Artículo 1 – Alcance.
Artículo 2 - Acceso al patrimonio digital.
Artículo 3 - El peligro de pérdida.
Artículo 4 - Necesidad de pasar a la acción.
Artículo 5 - Continuidad del patrimonio digital.
Artículo 6 - Elaborar estrategias y políticas.
Artículo 7 - Seleccionar los elementos que deben conservarse.
Artículo 8 - Proteger el patrimonio digital.
Artículo 9 - Preservar el patrimonio cultural.
Atribuciones
Artículo 10 - Funciones y atribuciones.
Artículo 11 - Alianzas y cooperación.
Artículo 12 - La función de la UNESCO.
23-jul-13 4
Ondarenet
Objetivos:
Objetivo principal:
Selección, recogida, preservación y difusión del Patrimonio Digital del Pueblo Vasco, paras las generaciones actuales y futuras.
Objetivos adicionales:
Como receptora del Depósito Legal y Propiedad Intelectual recoger, conservar y difundir lo producido en Euskadi.
Recoger, conservar y difundir todas las obras creadas en Euskera y las relacionadas con el ámbito lingüístico del euskera.
23-jul-13 5
Ondarenet
Proceso de gestión o el ciclo de vida del Patrimonio Digital, tiene unas fases diferenciadas:
Selección.
Captura y almacenamiento.
Preservación.
Difusión.
23-jul-13 6
Ondarenet
Selección: Tipos: Integral: procedimiento de captura masivo de un dominio de un país o tema:
Suecia: Kulturarw3 – The Swedish Web Archive
Internet Archive: Waybackmachine
Selectivo: seleccionar series de interés especial y que sean representativos de los principales aspectos de un país: Australia: Pandora
Euskadi: Ondarenet
Híbrido: una combinación de los 2 anteriores:
Dinamarca: Netarkivet
Cataluña: Padicat
23-jul-13 7
Ondarenet
Selección: En la actualidad se hace un captura selectiva de los recursos de la Web vasca:
Productores públicos y/o privados: instituciones públicas, editoriales,
empresas, individuos,…
Categoría de la información: promoción del euskera,
Idioma: euskera y castellano.
Ámbito geográfico: CAPV, Navarra, País vasco Francés, Diáspora
Vasca,…
Dominios: .biz, .com, .eu, .coop,…
Puntos de interés: elecciones, txakoli, bersolarismo,…
23-jul-13 8
Dominio .eus para 2014
El ICANN, organismo internacional que se encarga de asignar los dominios, ha confirmado para abril de 2014 el dominio .eus, y unirá bajo este dominio toda la producción relacionada con el euskera y la cultura vasca.
23-jul-13 9
Ondarenet
Captura y almacenamiento: tiene como objetivo recoger y almacenar los recursos digitales. Los datos capturados son comprimidos y almacenados en un repositorio digital. Para estas labores se utiliza el software recomendado por el International Internet Preservation Consortium (IIPC):
Heritrix: robot de captura de sitios y elementos web. Realización de capturas/parámetros. Recogida de datos estadísticos. Almacena las capturas en ficheros ARC.
Web Curator: es el interface del gestor de la colección:
Gestión de los usuarios. Define, configura y planifica las listas de capturas. Define los metadatos. Control de la calidad de las descargas.
Administrador de descargas: para gestionar las indexaciones y publicaciones se ha creado un pequeño portal para que el documentalista haga un seguimiento del estado de las descargas y de las publicaciones .
23-jul-13 10
Ondarenet
Captura y almacenamiento: los recursos digitales que se capturan son:
Páginas web: instituciones, empresas, personales,…
Recursos de comunicación: blogs,…
Ficheros digitales asociados en diferentes formatos:
.HTML
.JPG
.DOC
23-jul-13 11
Ondarenet
Preservación : permitirá garantizar la conservación y la visualización futura de las capturas realizadas. En este sentido engloba el conjunto de acciones encaminadas a:
Mantener la fiabilidad y perdurabilidad física de archivos digitales y de los metadatos complementarios.
Sistema de copia: backup mensual.
Asegurar la perdurabilidad de los soportes magnéticos.
Mantener la infraestructura de hardware y software necesaria para almacenar y garantizar el acceso a la colección.
23-jul-13 12
Ondarenet
Difusión: es uno de los objetivos fundamentales de la preservación: poder utilizar el objeto digital para proteger el documento original.
La difusión se realiza a través del portal de Ondarenet que nos permite:
Explicar el porqué de la iniciativa.
Las características del proyecto.
Acceso al repositorio digital.
Proponer una web.
Proyectos relacionados.
Permite realizar procesos de:
Búsquedas: por url o por grupos.
Presentación de relación de elementos y recursos.
23-jul-13 13
Ondarenet
Difusión: se utilizan el siguiente software :
NutchWax: indexación y búsqueda:
Indexa elementos: textos y documentos.
Permite indexar ficheros ARC (Wax).
Permite búsquedas no elimina duplicados.
Wayback: interface de consulta del ciudadano:
Búsqueda de elementos.
Visualización de la historia-versiones.
Visualización de versiones.
23-jul-13 14
Ondarenet
Trabajo diario:
Selección de la seed o url:
Propuestas: a través de la web [email protected]
Instituciones y organismos: Parlamento Vasco, ayuntamientos, asociaciones, clubes,…
Indices, listados,…
Agregadores de noticias: Google Reader , feedly
23-jul-13 15
Ondarenet
Trabajo diario:
Web Curator Tool (WCT): targets y target instances.
23-jul-13 16
Ondarenet
Trabajo diario:
WCT:
Comprobar la seed http://www.eresbil.com/
Realizar el target u objeto de descarga.
23-jul-13 17
Ondarenet
Trabajo diario
WCT: Target : General o información sobre el target.
23-jul-13 18
Ondarenet
Trabajo diario
WCT: Target : Seed o Url.
23-jul-13 19
Ondarenet
Trabajo diario
WCT: Target : Profile o Perfil de descarga.
23-jul-13 20
Ondarenet
Trabajo diario
WCT: Target : Description o metadatos.
23-jul-13 21
Ondarenet
Trabajo diario
WCT: Target : Groups o grupos.
23-jul-13 22
Ondarenet
Trabajo diario
WCT: Target : Groups o grupos: Subgrupos
• Arte (11 subgrupos) • Ciencia (12 subgrupos) • Cultura (6 subgrupos) • Economía (11 subgrupos) • Educación (9 subgrupos) • Empresa (15 subgrupos) • Euskera (4 subgrupos) • Ocio (11 subgrupos) • Política (8 subgrupos) • Puntos de interés (7 subgrupos) • Salud (9 subgrupos) • Sociedad (11 subgrupos) • Sociedad de la Información (8 subgrupos)
23-jul-13 23
Ondarenet
Trabajo diario
WCT: Target : Schedule o programación.
23-jul-13 24
Ondarenet
Trabajo diario
WCT: Target : Programación personalizada
23-jul-13 25
Ondarenet
Trabajo diario
WCT: Target : Aprobación o cambiar estado.
23-jul-13 26
Ondarenet
Trabajo diario
WCT: Target instance o Instancia de objeto de descarga.
23-jul-13 27
Ondarenet
Trabajo diario
WCT: Harvest results.
23-jul-13 28
Ondarenet
Modelo ejecución: consulta ciudadano y gestión captura/indización de la colección
23-jul-13 29
Ondarenet
Trabajo diario
Portal de indexación y publicación.
23-jul-13 30
Ondarenet
Difusión
Portal web: Búsqueda por url o por grupos.
23-jul-13 31
Ondarenet
Difusión
Portal web: Capturas realizadas.
23-jul-13 32
Ondarenet
Difusión
Portal web: Capturas realizadas.
23-jul-13 33
Ondarenet
Difusión
Portal web: Capturas realizadas : Ejemplos
Asociación Gerediaga (http://www.gerediaga.com/)
http://www.ondarenet.kultura.ejgv.euskadi.net:8085/wayback/es/*/http://www.gerediaga.com/
23-jul-13 34
Ondarenet
Difusión
Portal web: Capturas realizadas : Ejemplos
Ikuska : Muestra de Cortometraje de Pasaia (http://www.ikuska.net/)
http://www.ondarenet.kultura.ejgv.euskadi.net:8085/wayback/es/*/http://www.ikuska.net/
23-jul-13 35
Ondarenet
Difusión
Portal web: Capturas realizadas : Ejemplos
Festival Mendebala (http://www.mendebalasopuerta.net/)
http://www.ondarenet.kultura.ejgv.euskadi.net:8085/wayback/es/*/http://www.mendebalasopuerta.net/
23-jul-13 36
Ondarenet
Difusión
Portal web: Capturas realizadas : Ejemplos
Gesto por la Paz (http://www.gesto.org/)
http://www.ondarenet.kultura.ejgv.euskadi.net:8085/wayback/es/*/http://www.gesto.org/
23-jul-13 37
Ondarenet
Difusión
Portal web: Capturas realizadas : Ejemplos
Alhóndiga Bilbao (http://www.alhondigabilbao.com/)
http://www.ondarenet.kultura.ejgv.euskadi.net:8085/wayback/es/*/http://www.alhondigabilbao.com/
23-jul-13 38
Ondarenet
Difusión
Portal web: Capturas realizadas : Ejemplos
Centro Social Ignacio Ellacuria (http://www.centroellacuria.org/)
http://www.ondarenet.kultura.ejgv.euskadi.net:8085/wayback/es/*/http://www.centroellacuria.org/
23-jul-13 39
Ondarenet
Difusión
Portal web: Capturas realizadas : Ejemplos
Bagera : Asociación de Euskaltzales de San Sebastián (http://www.bagera.net/)
http://www.ondarenet.kultura.ejgv.euskadi.net:8085/wayback/es/*/http://www.bagera.net/
23-jul-13 40
Ondarenet
Colecciones especiales:
Elecciones al Parlamento Vasco (2009).
Elecciones Municipales y Forales (2011).
Elecciones al Parlamento Vasco (2012).
23-jul-13 41
Ondarenet
Colecciones especiales:
Montañismo vasco (2010).
Chacolí (2011).
Diáspora vasca (2012).
Bersolarismo (2013).
23-jul-13 42
Ondarenet
Colecciones especiales: Montañismo (2010)
23-jul-13 43
Ondarenet
Colecciones especiales: Elecciones Municipales y Forales (2011)
23-jul-13 44
Ondarenet
Colecciones especiales: Bertsolarismo (2013)
23-jul-13 45
Depósito Legal Electrónico
Difusión (Jornada Internacional de Archivos Web, Madrid 9 de julio de 2013)). Sesiones (de mañana y tarde):
http://www.youtube.com/watch?v=t33d4CA_ZS0 http://www.youtube.com/watch?v=K5lZTtfX1cs
23-jul-13 46
Liburuklik: biblioteca digital vasca
Difusión y acceso a los documentos.
23-jul-13 47
Liburuklik : biblioteca digital vasca
Eresbil: comunidad, colección e item.
23-jul-13 48
Liburuklik : biblioteca digital vasca
Eresbil : comunidad.
23-jul-13 49
Liburuklik : biblioteca digital vasca
Eresbil : colección partituras.
23-jul-13 50
Liburuklik : biblioteca digital vasca
Eresbil : Ficha “A Guetaria” [Música impresa]
23-jul-13 51
Liburuklik : biblioteca digital vasca
Eresbil : Metadatos “A Guetaria” [Música impresa]
23-jul-13 52
Liburuklik : biblioteca digital vasca
Eresbil : recurso digital : .jpg o .pdf
23-jul-13 53
Liburuklik : biblioteca digital vasca
Eresbil : Item.
23-jul-13 54
Liburuklik : biblioteca digital vasca
Difusión : redes sociales.
23-jul-13 55
Bibliografía
Ondarenet: el archivo web del País Vasco
Ondarenet: “El archivo de Internet: bibliotecas que piensan en el
futuro”
Liburuklik: patrimonio digital vasco en acceso abierto
Preservación digital (Ciro Llueca)
Preservación digital (wikipedia)
Preservación del patrimonio documental (UNESCO)
Directrices para proyectos de digitalización de colecciones y fondos de
dominio publico, en particular para aquellos custodiados en bibliotecas
y archivos
Directrices para la creación de un programa de preservación digital
La importancia de la utilizar metadatos PREMIS: primer paso para la
preservación de objetos digitales
Archivematica y el reto de la preservación digital
23-jul-13 56
Enlaces
Ondarenet: http://www.ondarenet.kultura.ejgv.euskadi.net
Ondarenet (Blog): http://liburutegiak.blog.euskadi.net/ondarenet/
23-jul-13 57
Enlaces
Liburuklik: http://www.liburuklik.euskadi.net/
Facebook: https://www.facebook.com/Liburuklik
23-jul-13 58
Enlaces
Twitter: @liburutegiak
Facebook: https://www.facebook.com/liburutegiak
Plataforma blogs: http://liburutegiak.blog.euskadi.net/
Wikipedia: Liburuklik : Biblioteca Digital Vasca
Pinterest: http://pinterest.com/liburutegiak/
23-jul-13 59
Preservación: garantizar el conocimiento del pasado
23-jul-13 60
¡MUCHAS GRACIAS! – ESKERRIK ASKO!
Francisca Pulgar Vernalte Modesto Marin Tamayo [email protected] [email protected]
Recommended