><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
TECNOLOGÍAS DE APOYO PARA LA PRESERVACIÓN DIGITAL EN REVISTAS
JOEL TORRES
1
><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
Introducción
Breve introducción que nos
permitirá conocer acerca de
este interesante tema.
Convert2XML
Preparación, descarga,
instalación, configuración y
uso del sistema.
Marcalyc
Preparación, descarga,
instalación, configuración y
uso del sistema.
Más opciones
Visores, otros convertidores,
otras herramientas, etc.
01 02 03 04
Temas a conversarLista de temas a conversar durante la sesión de hoy
2
><
01Reflexión inicial
Breve introducción que nos permitirá conocer acerca de este interesante tema.
Introducción
3
Fuente de las imágenes: Revista InfoWorld (19-Feb-1990) pp. 82-83 / Revista PC Magazine (May 30,1989) pp.12 / PC Magazine (13-Dec-1988) pp.21
a)CÓMO FUNCIONA EL INTERNET Y LA WEB
><
Es una red de computadoras
Consecuencia de la Guerra Fría
Creada en 1969 en Estados Unidos: se llamó Arpanet
Cooperación de las universidades y el Departamento de Defensa
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
¿Qué es el Internet?
5
><
Correo electrónico. 1971, Ray Tomlinson
Chat (o IRC).1988, en Finlandia
Transferencia de archivos
Foros de discusión
World Wide Web, 1989, Tim Berners Lee
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
Incluye muchos servicios
6
><
En 1980, cubría casi todo EEUU y llegaba a Londres. Eran 200 computadoras conectadas.
Fines de 1985, eran 2.000 computadoras.
1983, se crea Milnet para uso militar y Arpanet queda para uso científico
Primeras redes comerciales: Compuserve (1979), America Online (1985) y Prodigy (1986).
A partir de 1991, se integran todas en Internet.
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
Evolución de Internet
7
><
“La cara gráfica de Internet” (Piscitelli).
La parte multimedia de Internet.
Es un espacio de almacenamiento y un sistema de publicación mundial al que se accede en cualquier momento y desde cualquier lugar.
Compuesta por millones de sitios web, cada uno de los cuales puede tener varias páginas.
Web: Hipertexto + Internet.
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
¿Qué es la Web?
8
><
Se inventó en 1989, en el CERN (Suiza)
Tres inventos: - el HTTP: lenguaje para comunicarse entre las computadoras - UN TUBO
- PUERTOS = Varios CANALES (tubos pequeños) / estaciones de radio / Whats
- la URL : localizador de la información - UNA SALIDA
-el HTML: el lenguaje hipertextual - EL CONTENIDO DEL TUBO
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
¿Qué es la Web?
9
Tim Berners-Lee (1955)
><
1993: navegador Mosaic (Marc Andreessen)
1994: navegador Netscape
1995: salto espectacular
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
Varios años hasta que se popularizó
10
a)¿QUÉ ES UN SERVIDOR WEB?
><
Una computadora que tiene un sistema que puede almacenar las páginas.
Esa computadora está siempre conectada a la red y encendida = Escuchando
Cuando alguien escribe una URL, SIEMPRE llega a un servidor.
El servidor usa HTTP para enviar las páginas (la información) que contiene a la computadora de un usuario.
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
¿Qué es un servidor web?
12
><
Linux = Apache
Microsoft = Internet Information Server (IIS)
ANTES = Línea de comandos
AHORA = Interfase gráfica
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
¿Qué es un servidor web?
13
a)¿WEBSERVICE? ¿PLUG-IN?
><
Webservice = Un sistema alojado en un servidor web, que está “escuchando” a que otros sistemas de Internet le pidan cosas. Es un sistema que atiende a muchos sistemas. Ej. DOI / HANDLE
Plug In = Un módulo que se instala dentro de un sistema, que extiende sus capacidades o sus funciones. Ej. Mendeley dentro de Word.
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL 15
a)SOFTWARE LIBRE
a)¿QUÉ ES GITHUB?
><
UN REPOSITORIO DE SOFTWARE
Documentación
Colaboradores
Control de versiones
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL 18
a)LA PUBLICACIÓN CIENTÍFICA EN LÍNEA
><
Web - 1990 - Solo se publicaba texto
Web 2.0 - Promueve interacción social
Web semántica - Metadatos y significado a la información publicada
Web ubicua - Portabilidad de los contenidos en cualquier dispositivo y lugar donde el usuario se encuentre
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL 20
a)
HTML / XML FORMATOS ABIERTOS
><
Acuerdos
Interoperabilidad
Evita apropiaciones por parte de la industria privada
Acceso abierto - no cajas negras
Obligado - Gobiernos, iniciativas públicas, etc.
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
Por qué son importantes los estándares abiertos
22
><
Comúnmente se requiere combinar datos en Internet
Los humanos entendemos cómo combinar información
Las máquinas no son lo suficientemente inteligentes
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
Semántica en la información
23
><
Analogía de lo que le decimos a un perro:
Lo que el humano dice: "No te acerques a la basura Lucky, ni se te ocurra sacarla del cesto"
Lo que el perro escucha "Bla Bla Bla Bla Bla Lucky, Bla Bla Bla Bla"
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
¿Por qué las máquinas no entienden?
24
a)VENTAJAS DEL XML
><
Lenguaje de meta-marcado
Método uniforme para describir e intercambiar datos estructurados
Describe la estructura y semántica (contenido)
NO DESCRIBE EL FORMATO
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
¿Qué es el XML?
26
><
El contenido es separado de cualquier noción de presentación
Estándar internacional independiente de las plataformas
XML formato abierto que puede ser interpretado por cualquier aplicación
XML es comunicación en un mismo lenguaje
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
Importancia
27
><
El XML se prevé más duradero que los formatos de programas de propiedad por lo tanto es útil para la preservación digital
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
XML en la preservación digital
28
><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
XML en la recuperación de información
29
><
Estándar técnico que define formato XML para describir una estructura, semántica y metadatos para contenido digital científico
Provee conjunto de elementos y atributos XML para describir contenido gráfico y de texto de artículos de revista.
Es usado por; Publicaciones académicas Bibliotecas y archivos Sistemas de indización Comunidades de preservación Proveedores de servicio de publicación Editores académicos
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
XML - JATS : Revistas científicas
30
><
02Convert2XML
Convert2XML
• Funcionalidad y características31
><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
010203
2011
Iniciamos trabajo con las revistas mexicanas y con su transición hacia OJS
2014
A c e r c a m i e n t o c o n S c i E L O M é x i c o y nacimiento de la idea
2015
Se inician trabajos de desarrollo para liberar una primera versión
040506
2015
Primera versión, que convierte por completo y hace un marcado básico
2016
Problema de diseño, era necesario modificar una liga
2017
Se libera versión 1.6, que opera transparente y más ágil
Convert2XML
32
https://github.com/escire/Convert2XML
><
f in t @ f in t @ f in t @
Libertad
Es un plugin desarrollado por eScire bajo licencia GNU GPL que funciona desde OJS versión 2.8.X
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
Simplicidad
Parte de un archivo en Word formateado en el esquema del Scielo Publishing Schema (SPS)
Interoperabilidad
Resultado: XML-JATS que puede integrarse a OJS y que es interoperable con PubMed y Redalyc, así como cualquier otra plataforma que acepte este formato
Principales características
33
01 02 03
><
1. Webservice instalado y configurado en un servidor en línea.
2. Plugin Convert2XML instalado y configurado en el OJS de la revista.
3. Plugin
Requerimientos
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
><
Instalación del Webservice
01Instalación de
PlugIns
02Preparación de archivos
03
Servidor Windows Open Journal Systems MS Word
IIS Express (Freeware) GitHub / PKP Scielo Publishing Schema
Personal de informática Editor de la revista Equipo editorial
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
><
Instalación del Webservice
011. Descarga de Convert2XML
1.1. Descargar desde Github 1.2. Se acomoda en Raíz
2. Descarga de IIS Express 2.1. Instalación 2.2. Edición de archivo de configuración
2.2.1. Sección <Sites> 2.2.2.Sección <bindings)
3. Configuración de Conver2XML 3.1. Edición del archivo Webconfig.
3.1.1. Creación de carpetas de datos. 3.1.2. Configuración de URL pública. 3.1.3. Ajustes a la sección de sinónimos. 3.1.4. Ajustes a la sección de formatos de archivo. 3.1.5. Ajustes a la sección de personalización de errores. 3.1.6. Creación de archivo .bat
3.2. Alta de la aplicación en IIS Express 4. Confirmación del servicio en línea
><
1. Descarga el archivo convert2xml.tar.gz 2. En OJS - Liga para administrar como gestor 3. Seleccionar - Módulos del sistema / Instalar un nuevo módulo 4. Subir e instalar el archivo convert2xml.tar.gz 5. Regresar a la gestión de módulos y elegir módulos genéricos 6. Ubicar el modulo de Convert2XML, dar clic en Habilitar 7. Configuración del módulo Convert2XML 8. Cambiar la URL del servicio (webservice) 9. Comprobar que los requisitos se cumplan 10.Regresar a la gestión de módulos y elegir módulos genéricos. 11.Ubicar el módulo de galerada XML y dar clic en Habilitar. 12.Al recargarse la página dar clic en Configuración del módulo de galerada XML 13.Hoja de estilo XSL, seleccionar Hoja de estilos XSL personalizada 14.Página del proyecto Convert2XML en Github, descargar el archivo jats-html.xsl 15.Volver a OJS y en la opción para subir la hoja personalizada, seleccionar la
descargada de Github y cargarla
Instalación de PlugIns
02
><
1. En OJS / Área personal / Gestor de la revista 2. Opción Importar/Exportar datos y elegir la opción Módulo QuickSubmit 3. Cargar un archivo Word de prueba, para metadatos, el archivo se borrará 4. Ir al Área personal y seleccionar el enlace de Editor/a 5. Elegir el enlace de Números anteriores 6. Ubicar el número y articulo que se cargo, dar clic en el titulo del articulo 7. En la página que se carga, dar clic en Edición 8. Ubicar el plugin Convert2XML y dar clic en su enlace Convertir articulo 9. Se descarga un comprimido en formato zip - descomprimirlo 10.En la sección Maquetación hay que ubicar el archivo que se subió
previamente y eliminarlo 11.En la sección Maquetación cargar archivo elegir Galerada, seleccionar y cargar
el archivo XML que se descargo en el paquete generado por el convertidor 12.En la siguiente página modificar los datos del articulo de acuerdo a sus
necesidades, e ir a la sección imágenes para cargar desde ahí todas las imágenes que se descargaron en el mismo paquete generado por el convertidor.
13.Ir a la sección Archivos, ubicar el número y articulo que se subió 14.Dar clic en la visualización XML del articulo que se subió 15.Comprobar la estructura del articulo que haya sido detectada correctamente
Preparación de archivos
03
><
1.Instalación del Plug-In 2.Preparado de archivos 3.Conversión
Ejercicio
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL 40
Marcalyc
AccesibleDesarrollada por Redalyc para revistas de esta colección
En líneaFunciona desde el sitio de Redalyc con una cuenta por cada revista
EstandarizadaConversión a XML JATS a partir de HTML que puede ser construido desde Word o InDesign
PortableA partir del archivo final en
XML JATS es factible recuperar: PDF, ePub, HTML
InteroperableLos productos que se recuperan a partir del
XML JATS e incluso el mismo XML puede llevarse hacia OJS
NavegableRedalyc ofrece un visor
inteligente para las revistas que ya
entreguen sus artículos en XML JATS
http://marcalyc.redalyc.org/
><
04Conclusiones
Otras opciones que es necesario mencionar
Más opciones
41
><
Convertidor de PKP.
Visores de XML.
Formatos de salida.
III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
Más opciones
42
><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL
OBRIGADOJOEL TORRES
43