Flujos de trabajo en la gestión de un repositorio institucional Antonio Juan Prieto Jiménez Jordi...

Preview:

Citation preview

Flujos de trabajo en la gestión de un repositorio institucional

Antonio Juan Prieto JiménezJordi Serrano-Muñoz

Universitat Politècnica de Catalunya

¿Quiénes somos?

Sumario• Razón de ser• ¿Biblioteca?• Agentes• ¿Empezamos?• Check-list• Como organizarlo• Interoperabilidad e integración• Sostenibilidad• Soporte• Infraestructura TIC• Mas tareas

• La UPC en cifras• Repositorios en la UPC

Repositorios: Razón de ser (I)

• Ofrecer a nuestra comunidad una herramienta o aplicación para publicar sus trabajos académicos, en acceso abierto y en texto completo en Internet

• Garantizar el acceso perpetuo a los trabajos archivados mediante su almacenamiento en servidores seguros mantenidos y gestionados por la ¿Biblioteca?

• Mejorar la visibilidad de la organización y sus autores en la red.

Repositorios: Razón de ser (II)• ¿De verdad necesitamos crear, gestionar y

mantener un repositorio?• Analicemos las implicaciones:

• ¿Está la organización madura?• Dimensiones• Capacidades• Recursos: personas, infraestructura,

económicos, ….

Repositorios: Razón de ser (y III)• No lo necesitamos:

• Esperamos la oportunidad• Creamos las condiciones• Preparamos el terreno• No hacemos nada

• Si lo necesitamos• ¿Podemos hacerlo?• Lo tenemos claro• Alianzas / Colaboraciones

Repositorios: ¿Biblioteca? (I)

• La implementación, gestión, organización no es solo una responsabilidad de la biblioteca

• Es de toda la institución• Requiere un compromiso institucional• Si no hay compromiso…. ¿Para que

queremos un repositorio?

Repositorios: ¿Biblioteca? (y II)

La institución debe comprometerse con el control y la protección de su producción intelectual en soporte digital

Alicia López Medina (UNED)

Repositorios: Agentes (I)

• Implicación a diferentes niveles:• Órganos de gobierno• Gestores / administradores• Docentes / investigadores, …• Oficina de apoyo a la investigación y

transferencia de tecnología• Sistemas de información• …..

Y también biblioteca

Repositorios: Agentes (y II)

• Necesitamos la complicidad y el compromiso de nuestro entorno

• No debemos “lanzarnos a la piscina” solos, en ese caso lo mas probable es que fracasemos

• Cada uno de los agentes tiene su responsabilidad, su tarea y evidentemente diferentes niveles de implicación

Repositorios: ¿Empezamos?

• Habrá que hacer pasillos y “cafés”• Crear complicidades• Explicar cuales son los beneficios para el

investigador / docente y para la organización también para la sociedad

• Implicará un cambio cultural• Pensemos en la lista de tareas e implicaciones• Y naturalmente en asignarle un presupuesto

Atención: ¡esto no es un proyecto!

Repositorios: Check-list (I) /

• Visión, misión, objetivo del repositorio• ¿Qué representa el repositorio para la

organización?• ¿Qué contenidos?• ¿Hemos identificado a los agentes? • ¿La organización tiene una política sobre la

propiedad intelectual?• ¿Se han analizado los riesgos?

Repositorios: Check-list (II)

• ¿No habrá ya por ahí algún repositorio?• ¿Tenemos el soporte institucional? ¿Está la

institución “madura”?• La organización y los agentes, ¿Están

preparados? ¿Están capacitados?• ¿Tenemos algún “champion” como cómplice?• ¿Hemos definido roles, responsabilidades,

etc.. para el desarrollo del repositorio?

Repositorios: Check-list (y III)

• ¿Hay financiación?• ¿Qué estadísticas, datos e informes

facilitaremos del repositorio?• ¿Y el ROI?

Fuente: JISC: Planning Checklist - Before You Start Repositories Support Project

Repositorios: Como organizarlo (I)• Identificar comunidades, usuarios,

contenidos,…• Quien deposita o almacena• Procedimientos:

• Flujos y roles: aceptación, moderador/validador, revisor

• Mandato• Licencias

Repositorios: Como organizarlo (II)• Metadatos, normalización, …• Políticas de preservación

migración de formatos• Dominio, hosting, backup/copias de

seguridad, actualizaciones, migraciones …

No estamos solos en esto

Repositorios: Como organizarlo (III)• Diferentes implicaciones = diferentes

niveles:• “Políticos”• Tecnológicos• Gestión

• Se trata de una carrera de fondo: ¿Empezamos por un “piloto”? …. pero ….

• ….. ¿De verdad que necesitamos el repositorio?

Repositorios: Como organizarlo (IV)

• Modelo centralizado único repositorio para todos los contenidos

• Modelo diversificado:• Ajustar los modelos de metadatos.• Adaptarse a la naturaleza de los contenidos.• Trabajar las particularidades de los documentos.• Facilitar su integración con otros sistemas de

información.• Adaptarlos a la organización de la biblioteca• Desarrollo tecnológico mas flexible

Repositorios: Como organizarlo (y V)• Modelo centralizado:

• Fácil de gestionar• Incidencias con las "excepciones"

• Modelo diversificado:• Incremento en los costes de mantenimiento.• Dispersión de contenidos y posible confusión

en la comunidad de usuarios

Conocer la organización la decisión es de todas las partes

Interoperabilidad e integración (I)• Con otros sistemas de información:

• De la organización• Externos

• Podemos compartir / reusar información• Se pueden generar nuevas aplicaciones / utilidades• Mejoramos tareas / flujos de trabajo• Todos ponen / Todos ganan• Disponemos de estándares

No inventemos la rueda

Interoperabilidad e integración (y II)• OAI-PMH• Dublin Core• SWORD• SOA• IMS• SCORM• ….incluso el MARC

Sostenibilidad• Estamos preparados respecto a:

• Crecimiento de repositorio• Infraestructura TIC• Presupuesto asignado• Personal y su gestión• Updates / Migraciones• Preservación

Calculemos a medio / largo plazo

Soporte• Legal, TIC, Gestión …..• Modelo(s) de metadatos• Plataforma(s)• Políticas de colecciones y de acceso• Gestión usuarios → roles, flujos … • Interacción con los agentes• Capacidad de respuesta (compromiso)

Infraestructura TIC• In house / externalizado• Cloud• Compartido• Atención a los SLA (la letra pequeña)• Backup

Evaluar costes…….

Más tareas• Mandato ¿Work in progress?• Autores ¿Están dispuestos a colaborar?• Algún tipo de incentivo• Difusión interna / externa• Alta directorios / Google Scholar• ......

¿de verdad que necesitamos un repositorio?

La UPC en cifras 2010-2011 (I)

Titulaciones• 69 titulaciones de grado• 19 dobles titulaciones• 85 convenios

internacionales de doble titulación

• 61 programas de máster• 46 programas de

doctorado• 363 programas de

formación continua (másteres UPC y cursos de posgrado)

Comunidad• 44.221 estudiantes• 2.780 personal docente e

investigador• 1.694 personal de

administración y servicios

Distribuida en• 11 campus y centros

territoriales• 23 escuelas y facultades

13 bibliotecas+/-100 personas

La UPC en cifras 2010-2011 (II) Investigación• 64.164.414 € Ingresos por

proyectos I+D+i y transferencia tecnológica

• 101 Distinciones científico-técnicas recibidas

• 843 nuevos convenios y proyectos de investigación

• 2.070 artículos publicados en revistas científicas

• 78 patentes

Departamentos, institutos y centros de investigación• 42 departamentos• 6 institutos de investigación• 183 grupos de investigación• 17 centros específicos de

investigación• 19 Centros de investigación

en la red TECNIO• 19 Centros de investigación

vinculados

Universidad y Empresa• 2.680 empresas y entidades con convenio de colaboración• 14 empresas creadas y participadas (Programa Innova y Innova 31)• 21 cátedras y aulas de empresa

La UPC en cifras 2010-2011 (y III)

• 13 bibliotecas• +/-120 personas• Modelo diversificado• 2 TB. Contenidos• +/-64.000 documentos• Desde CRIS 9.700 documentos revisados / año • 47% personal implicado en estas tareas• En algunos casos representa el 25% de su

tarea

Repositorios en la UPC• Modelo diversificado:

• 2001: TDX • 2002: Archivo Gráfico de la ETSAB • 2003: Videoteca Digital de la UPC • 2004: Trabajos académicos • 2005: Revistas y congresos • 2006: E-prints • 2007: OCW Materiales docentes• 2010: Fondo histórico bibliotecas UPC

• 2011: Nuevo OCW• 2012: Depósito de exámenes

Integración

• Recuperar la información donde se genera o introduce por primera vez

• Evitar duplicar tareas• Actualizaciones => Estándares (SWORD, OAI,

RSS, etc.)• Importancia en el crecimiento repositorio

Estándares: extraer información

• OAI-PMH– Nuevos formatos de metadatos añadidos– Módulo OAIExtended: sets específicos (driver,

OpenAIRE, etc.)

• RSS– Ampliado para casos específicos (ItunesU,

Universia, etc.)

Estándares: Carga de datos

Simple Web-services Offering Repository Deposit

Un protocolo para depositar en repositorios entre aplicaciones Proyecto financiado por JISC iniciado en 2007 Implementado para diversas plataformas (DSpace, Eprints, Fedora, IntraLibrary) Creado por encima del protocolo Atom Publishing Protocol (APP o ATOMPUB) Dos operaciones básicas

Servicedocument Deposit

SWORD: formato METS (I)

• Llamada HTTP en la que se envía un archivo ZIP comprimido en formato estándar METS que contiene:- Archivo xml con las datos del recurso (archivo mets.xml) - Documentos propios del recurso

Memoria.pdfAnnex.pdf…

…Mets.xml(datos del recurso:-Autor-Tutor-Titulo-Fechas-Palabras clave… )

SWORD: formato METS (II)

Cabecera

Metadatos descriptivos en formato MODS/SWAP/etc.

Licencia Creative Commons

Lista archivos

Mapa estructural

--

--

SWORD – Llamada deposit

RESP HTTP 201 CREATED

HTTP POST

ClienteServidor SWORD

UPCommons

POST /deposit/123456789/18 HTTP/1.1Host:eprints.upc.es/pfc-swordContent-Type: application/zipAuthorization: Basic ZGFmZnk6c2VjZJldA==Content-length: nnnContent-MD5: md5-digestContent-Disposition: filename=mydeposit.zipX-Format-Namespace: METS

<?xmlversion="1.0" encoding="UTF-8"?><atom:entryxmlns:atom="http://www.w3.org/2005/Atom"xmlns:sword="http://purl.org/net/sword/"><atom:id>info:something:1</atom:id>…</atom:entry>

Puesta en marcha

• Pasos iníciales– Ver las necesidades de datos a enviar – Explicación del protocolo y formato

• Preparar un entorno de desarrollo • Creación de un wiki con información

sobre: – Datos necesarios para el envío del recurso– Como se mapean estas datos dentro del

formato METS– Como se envían (SWORD)– Enlaces a librerías en diferentes formatos de

programación

Otras

• No siempre existen los estándares adecuados• Debemos hacer cambios específicos para

casos concretos (solo “si no hay más remedio”)

• Exportación de bases de datos, cargas manuales, etc.

• Cambios bien documentados

Trabajos académicos UPC

E-prints UPC

Videoteca UPC Fondo Antiguo UPC

OCW UPC

Revis

tas y

co

ngre

sos U

PC

TDX

UPC

Exámenes UPC

PRISMA

DRAC

GD EscuelasGD Escuelas

OJS

MediaTIC

Catálogo

ITunesU

Doctorat

MDC

Portal producción científica

AteneaOAI-PMH

SWORD

SWORD

SWO

RD

OAI

-PM

H

RSS

BD EXPORT

BD EXPORT Visión General

GD Escuelas

SWORD

E-prints UPC

• Integración con DRAC (CRIS de la UPC)• Portal producción científica UPC• Driver / OpenAIRE

Integración DRAC

DRAC, el Descriptor de la Recerca i l’Activitat Acadèmica de la UPC: http://drac.upc.edu/info

Sistema que registra la actividad académica de la UPC Generación CVN Intervención del SBD en la definición del proyecto y

posterior participación en los workflows de revisión de datos Integrado con UPCommons “Política institucional de acceso abierto: acceso, visibilidad,

impacto y preservación de la producción académica de la UPC en Internet”

Modelo de integración Integración en dos fases:

1. Envío:• Introducción metadatos básicos en DRAC• Obligatoriedad de introducir enlace o archivo• Si se introduce archivo, se conecta a UPCommons

2. Revisión:• Revisión de metadatos básicos en DRAC• Revisión de metadatos propios de UPCommons, validación de

las condiciones de acceso y publicación final

Autenticación simultánea en ambas aplicaciones mediante CAS

Integración DRAC: Pasos

Integración DRAC: Pasos

PASO 1: Carga archivo PASO 2: Aceptación licencia

Integración DRAC: Pasos

Integración DRAC: Pasos

Integración DRAC: Pasos

Portal Producción científica

Portal de la Producción científica de la UPChttp://bibliotecnica.upc.edu/producciocientifica

Portal Producción científica

Evolución E-prints UPC20

05-1

1

2006

-04

2006

-09

2007

-01

2007

-05

2007

-09

2008

-01

2008

-05

2008

-09

2009

-01

2009

-05

2009

-09

2010

-01

2010

-05

2010

-09

2011

-01

2011

-05

2011

-09

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

Drac restringidoDrac abiertoEnvío directo

Antes de DRAC

2262 reg. (4 años)

Con DRAC

4214 reg. en abierto (2 años)

2804 reg. acceso restringido (2 años)

Trabajos académicos UPC

• Envío de los PFC/TFC desde las aplicaciones de gestión de las escuelas

• Proceso de carga de registros al catálogo

Envío de PFC/TFC

• Diferentes escuelas disponen de aplicaciones para la gestión de las lectura de PFC/TFC

• Recogen los archivos del proyecto y metadatos necesarios

• Nos envían a través de SWORD• De momento 4 escuelas => en proyecto

hacerlo con todas a través de la E-administración

Envío de registro al catálogo

• Evitar catalogar los trabajos dos veces• Carga semanal de registros del repositorio al

catálogo• Exportación de registro MARCXML mediante

OAI• ¡Más en el Pecha Kucha de mañana!

Revistas y Congresos UPC

• Envío de números de revistas desde OJS• Exportación/importación con RACO (Revistes

Catalanes amb Acces Obert)

OJS (I)

• Proyecto de IDP: Servició de publicaciones de la UPC

• Soporte al sistema de revisión de revistas editadas en la UPC

• Gestión y asignación de DOI

OJS (II)

DOI

UPCommonsRevistas y Congresos

SWORDSWAP

PAM MESSAGEREGISTRO

Resolución DOI

OJS

OAI-PMH

Videoteca UPC

• Mediatic• ItunesU

Mediatic

• Proyecto de colaboración entre Servicio informáticos del Campus de Terrassa y la Biblioteca del Campus de Terrassa

• Envío a través de SWORD

ItunesU UPC

• Videoteca UPC posible fuente de contenido

• Adaptación del RSS para hacerlo compatible con ItunesU (soportado en las últimas versiones de DSpace)

OCW y Exámenes UPC

• Desarrollados con Drupal• IDP: Servicio de publicaciones de la UPC• Integraciones

– Integración con Sistema de Gestión Académica (PRISMA): extracciones de tablas de la base de datos

– RSS Universia, MDX y OCW Consortium– Campus Virtual

PRISMA

• Información sobre asignaturas, plan docente …. mediante importación de base de datos

• Vía SOA, PRISMA captura datos bibliográficos del catálogo de documentos recomendados en la guía docente

• Re-uso de esos datos bibliográficos en el OCW

Futuro

• Trabajar en el envío de Tesis• Exportación de registros de fondo Antiguo a

Memoria Digital de Catalunya• Aplicar el modelo de carga de PFC SWORD a

más escuelas (proyecto de e-administración) • Exportación al catálogo con otros repositorios• …¿Datos?

¡Muchas gracias por la atención!

Seguimos en el Pecha Kucha ;-)

Recommended