32
VI Encuentros de centros de documentación de Arte contemporáneo Posicionamiento y nuevos retos en las bibliotecas especializadas Vitoria, 7 y 8 de noviembre de 2012 Sistemas y tecnologías para la publicación de datos abiertos enlazados en el ámbito de Archivos, Bibliotecas y Museos Juan Antonio Pastor Sánchez ([email protected]) Universidad de Murcia

VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

Embed Size (px)

DESCRIPTION

Ponencia de Juan Antonio Pastor Sánchez, doctor en Documentación y profesor de la Facultad de Comunicación y Documentación de la Universidad de Murcia, en los VI Encuentros de Centros de Documentación en ARTIUM celebrados en noviembre del 2012.

Citation preview

Page 1: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de centros de documentación de Arte contemporáneoPosicionamiento y nuevos retos en las bibliotecas especializadas

Vitoria, 7 y 8 de noviembre de 2012

Sistemas y tecnologías para la publicación dedatos abiertos enlazados en el ámbito de Archivos,Bibliotecas y Museos

Juan Antonio Pastor Sánchez ([email protected])Universidad de Murcia

Page 2: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Linked Open Data (LOD): desafío y oportunidades

“Porque está ahí”Es un reto para compartir e integrar conocimiento abierto mediante

procesos de colaboración en un entorno en constante evolución y con requisitos

muy altos de adaptabilidad

Page 3: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Web semánticaUna idea... un camino...

“Para un ordenador, la Web es un mundo, plano, aburrido y carentede significado. Es una lástima, ya que de hecho, en la Web sedescriben objetos reales y conceptos imaginarios y ofrece relacionesparticulares entre ellos. Añadir Semántica a la Web implica doscosas: que los documentos contengan información de forma que sea legible por lasmáquinas, y que los vínculos tengan el valor de relaciones. Solo cuando tenemos estenivel adicional de semántica podremos usar la potencia de procesamiento informáticoque nos permita explotar la información en mayor medida que la que proporcionanuestra propia lectura.”

Tim Berners-Lee (1ª Conferencia Internacional sobre la Word Wide Web, Ginebra, 1994)

Personas Documentos Objetos Datos Máquinas Agentes

Page 4: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

[1]Publicación

de datos para suacceso, consulta y

descarga libres,de forma total y/o selectiva a través

de la web

[3]Han de utilizarse

estándares abiertospara el formatode publicación

[2]Asociados a

una licencia quepermita su libre

reutilización

Optimización de recursos de información: reutilización, evitar duplicidades, disminución de costes...

Preservación del patrimonio informativo, documental y cultural mediante datos digitales.

Reutilización de datos a partir de enfoques basados en la interoperabilidad.

La definición de conexiones entre los conjuntos de datos abre nuevas posibilidades basadas en la interrelación y el descubrimiento de información.

[4]Su estructura debepermitir la definiciónde conexiones entrediferentes conjuntos

de datos

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Linked Open Data: ¿qué es y para qué sirve?

Es un enfoque distinto (y al mismo tiempo complementario) de los procesos de agregación basados en OAI

Page 5: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

¿De qué volumen de datos estamos hablando?

En total existen más de 4.600 conjuntos de datos registrados en thedatahub.org

Alrededor de 560 relacionados directamente con el ámbito GLAM (*)

El volumen real de datos individuales (triplets) es difícil de estimar

(*) GLAM: Galleries, Libraries, Archives, Museums

Page 6: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Una realidad en crecimiento

Page 7: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Linked Open Data en Bibliotecas, Archivos y Museos

Ventajas

Para los investigadores, estudiantes y usuarios: LOD es transparente para el usuario y contribuye a mejorar el funcionamiento de servicios tradicionales de búsqueda, a partir de procesos en los que se comparte, extiende y reutiliza el conocimiento.

Para las organizaciones es un primer paso hacia la gestión de información cultural “en la nube”, integrando descripciones de recursos, con un enfoque de mayor interconexión, visibildad y eficiencia. Supone mejorar los procesos de descripción, publicación y gestión de vocabularios controlados.

Los profesionales dispondrán de fuentes de datos que simplificarán su trabajo y evitarán redundancias. Todo ello separando el significado de los datos (semántica) de la sintaxis utilizada para su representación (formatos) obteniendo propuestas más duraderas y robustas.

Para los desarrolladores y firmas comerciales supone trabajar con formatos que no son específicos del ámbito de las bibliotecas y archivos, permitiendo la creación de herramientas de aplicación más general y la integración con otros sistemas.

Library Linked Data Incubator Group Final Report. 25 de octubre de 2011. http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/

Page 8: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Linked Open Data en Bibliotecas, Archivos y Museos

Situación actual

Los sistemas tradicionales bibliotecarios tienen grandes limitaciones: no se integrados con otras fuentes de datos (biográficas, geográficas, temporales), usan normas y formatos muy especializados, no se aplican identificadores normalizados, disparidad terminológica con la comunidad de la web semántica, los cambios tecnológicos están ligados a software comercial...

Library Linked Data Incubator Group Final Report. 25 de octubre de 2011. http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/

Actualmente existen muchos más conjuntos de datos con vocabularios controlados y modelos de descripción que con datos bibliográficos, cuya calidad y proceso de publicación varía enormemente, siendo necesario un esfuerzo de gestión interna y coordinación entre los editores de dichos datos.

Deben delimitarse aspectos sobre los derechos intelectuales y de explotación de los datos publicados como LOD. Cabe preguntarse sobre la autoría de aquellos datos mejorados por editores distintos a quienes los publicaron inicialmente. También es posible que los editores consideren los datos como activos de negocio y los publiquen parcialmente, limitando su utilidad semántica.

Page 9: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Linked Open Data en Bibliotecas, Archivos y Museos

Recomendaciones

Los cargos directivos de las bibliotecas deben identificar aquellos conjuntos de datos que deberían exponerse como datos vinculados al tiempo que fomentan el debate sobre los derechos de propiedad intelectual y de explotación de los datos abiertos.

Los ingenieros de datos y de sistemas deben desarrollar servicios que exploten las capacidades de LOD, con una política adecuada de gestión y preservación de conjuntos de datos y URIs, utilizando modelos de descripción existentes en vez de desarrollar otros nuevos.

Library Linked Data Incubator Group Final Report. 25 de octubre de 2011. http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/

Ha de incrementarse la participación del mundo GLAM en la elaboración de especificaciones de la Web Semántica, ayudando en el desarrollo de normas específicas en el ámbito genérico de LOD y fomentando el uso de prácticas adecuadas para la publicación de estos datos.

Los profesionales deben trabajar para gestionar y preservar adecuadamente los esquemas de elementos de los modelos de descripción y los vocabularios controlados utilizados en los conjuntos de datos.

Page 10: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Aplicación de tecnologías de la Web Semántica

La aplicación directa de SGBDs relacionales es poco operativo (complejidad, seguridad, conectividad) para la publicación de datos LOD. Por otro lado, el propio modelo relacional es

poco adecuado para la descripción con diferentes niveles de detalle (granularidad) de recursos de información en red muy heterogéneos.

RDF ofrece un modelo sencillo, para almacenar los datos y para definir losvocabularios de los esquemas de metadatos utilizados en la descripción de recursos. Los

datos se almacenan como grafos dirigidos codificables en diferentes sintaxis (formatos)

RDF Schema y OWL permiten definir clases de recursos y jerarquías de propiedades. Deeste modo es posible describir las relaciones entre dichos recursos para desarrollar

ontologías sencillas (mediante RDF Schema) o más complejas (con OWL).

SPARQL ofrece un lenguaje de consulta para la recuperación de datos RDF individuales,así como un formato XML para expresar los resultados obtenidos.

RDFa permite incluir declaraciones RDF dentro de las etiquetas de marcado delcódigo de documentos (X)HTML (XHTML y HTML5).

Page 11: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

RDF es para las máquinas lo que HTML es para las personas.

HTML permite crear contenido comprensible para las personas, publicado y enlazado en la Web.

RDF permite crear contenido “entendible” para las máquinas

Prefijo Espacio de nombresrdf http://www.w3.org/1999/02/22-rdf-syntax-ns#rdfs http://www.w3.org/2000/01/rdf-schema#dc http://purl.org/dc/terms/owl http://www.w3.org/2002/07/owl#ex http://www.ejemplo.org/exterms http://www.ejemplo.org/terms/exautores http://www.ejemplo.org/bd/autores/exobras http://www.ejemplo.org/bd/obras/xsd http://www.w3.org/2001/XMLSchema#foaf http://xmlns.com/foaf/0.1/

<sujeto> es un recurso identificado mediante URI

<predicado> es una propiedad de un vocabulario de descripción. Las propiedades

se encuentran definidas en URIs

<objeto> puede ser un literal o un recurso también identificado mediante URI

RDF se basa en tripletas de tipo<sujeto>-<objeto>-<predicado>

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Resource Description Framework: RDF

Page 12: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Serialización (codificación) RDF

Serialización RDF/XML

<?xml version="1.0"?><!DOCTYPE rdf:RDF> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:dc="http://purl.org/dc/elements/1.1/"xmlns:exterms="http://www.ejemplo.org/terms/" xml:base="http://www.ejemplo.org/"> <rdf:Description rdf:about="autores/Shakespeare”> <exterms:fullname>William Shakespeare</exterms:fullname> </rdf:Description> <rdf:Description rdf:about="obras/Romeo_y_Julieta"> <dc:creator rdf:resource="autores/Shakespeare"> <dc:title> Romeo y Julieta</dc:title> </rdf:Description> </rdf:RDF>

La serialización permite representar de un grafo con una sintaxis para almacenarlo en un

fichero de texto plano

RDF puede serializarse utilizando diferentes formatos: RDF / XML,

N3, Turtle, JSON...

RFD / XML tiene la ventaja de poder ser transformado mediante

XSLT

Serialización N3

@Prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> @Prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> @Prefix dc: <http://purl.org/dc/elements/1.1/> @Prefix exterms: <http://www.ejemplo.org/terms/> @Prefix obras: <http://www.ejemplo.org/bd/obras/> @Prefix autores: <http://www.ejemplo.org/bd/autores/> autores:Shakespeare exterms:fullname "William Shakespeare"obras:Romeo_y_Julieta c:title "Romeo y Julieta"@es dc:creator autores:Shakespeare

Page 13: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Ontologías: RDF Schema (RDFS) y OWL

A veces es necesario estructurar las descripciones de recursos definiendo jerarquías de clases y propiedades.

exterms:Escritor rdfs:subClassOf exterms:Artistaexterms:Artista a rdfs:Classexterms:ObraLiteraria a rdfs:Classexterms:nombre a rdfs:Property rdfs:domain exterms:Artista rdfs:range rdfs:Literalexterms:autorLiterario rdfs:subProperty dc:creator rdfs:domain exterms:ObraLiteraria fs:range exterms:Escritorexterms:nacimiento a rdfs:Property rdfs:domain exterms:Artista rdfs:range xsd:dateexterms:fallecimiento a rdfs:Property rdfs:domain exterms:Artista rdfs:range xsd:date

RDFS permite crear ontologías “ligeras” de un modo más sencillo

que con OWL

OWL está diseñado para esta función, pero el desarrollo de

ontologías es un proceso complejo

Page 14: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

A partir de este código XHTML...

<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:exterms="http://www.ejemplo.org/terms/" version="XHTML+RDFa 1.0" xml:lang="es"> <head><title>Catálogo</title> <base href="http://www.ejemplo.org/" /> </head> <body> <h1>Catálogo</h1> <ul><li about="bd/obras/Romeo_y_Julieta"> <strong property="dc:title"> Romeo y Julieta</strong>: <em rel="dc:creator" resource="bd/autores/Shakespeare"> <span about="bd/autores/Shakespeare" property="exterms:nombre"/> William Shakespeare</span> </em> </li></ul> </body> </html>

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

… se obtienen las siguientes declaraciones RDF

@prefix dc: <http://purl.org/dc/elements/1.1/> . @prefix exterms: <http://www.ejemplo.org/terms/> . @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix xhv: <http://www.w3.org/1999/xhtml/vocab#> . @prefix xml: <http://www.w3.org/XML/1998/namespace> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . <http://www.ejemplo.org/bd/obras/Romeo_y_Julieta> dc:creator <http://www.ejemplo.org/bd/autores/Shakespeare> dc:title "Romeo y Julieta"@en . <http://www.ejemplo.org/bd/autores/Shakespeare> exterms:nombre "William Shakespeare"@en .

RDF -in- attributes: RDFa

RDFa permite añadir declaraciones RDF a documentos web en forma de propiedades de etiquetas de marcado (X)HTML. De este modo pueden extraerse datos RDF de dichos documentos. Una misma página puede ser leída por personas y procesada por máquina.

Page 15: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

“Recuperar los títulos de las novelas dePaul Auster”

SELECT ?title WHERE {?person foaf:name “Paul Auster”?person dc:creator ?book .?book dc:title ?title .ORDER BY ASC(?title)}

XML con los resultados de las consultas

?xml version="1.0"?><sparql xmlns="http://www.w3.org/2005/sparql-results#"> <head><variable name="title"/></head> <results> <result> <binding name="title"> <literal xml:lang="es">Invisible</literal> </binding> </result> <result> <binding name="title"> <literal xml:lang="es">Travels in the Scriptorium</literal> </binding> </result> </results></sparql>

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

SPARQL

Protocolo para consultar grafos RDF y recuperar datos. La última revisión de SPARQL propone

operadores para crear y borrar declaraciones RDF

SPARQL se basa en la recuperaciónde tripletas a partir de un patrón

dbpediarec:Travels_in_the_Scriptorium

dbpediarec:Invisible

Travels in the Scriptorium

Invisible

dc:title

dc:title

dc:creator

dc:creator

Paul Auster

foaf:name

Además del lenguaje de consulta, SPARQL ofrece una sintaxis XML para el formato de los resultados

dbpediarec:Paul_Auster

Page 16: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Visión global de la Arquitectura de la Web Semántica

Page 17: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Aplicación técnica de Linked Open Data

Publicaciónde conjuntos

de datoscompletos

Negociaciónde contenidode recursosespecíficos

SPARQLEndpoint para

el accesoselectivo

Usar RDFapara el marcado

semántico dedocumentos

(X)HTML

Reutilizaciónde conjuntos dedatos externos

Ofrecer elconjunto de datos

RDF en un formatoabierto y dotarlode una licencia

adecuada

Mediante unaconsulta un usuario o

una aplicación informáticapueden recuperar datosespecíficos en diversos

formatos

Publicación dedatos de recursosindividuales en un

formato adaptado alcliente que los

solicita

Uso deURIs

derrefe-renciables

Además deidentificar un recurso sese debe proporcionar un

mecanismo deacceso

Inclusión dedeclaraciones RDF enforma de propiedadesde etiquetas (X)HTMLpara incluir infomación

semántica

Enriquecerun contenido o serviciode un sitio recuperando

datos con SPARQLEndpoint o negociación

de contenido

Page 18: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

EuropeanaEjemplo de aplicación de los principios Linked Open Data

ClienteRDF (LOD)

http://www.europeana.eu

HTML RDF

Almacen RDF(Tripletstore)

Creación de volcados

Generaciónde enlaces

ConversiónESE a EDM

ApacheSolr

Enriquecimientosemántico

MetadatosESE

NavegadorWeb

Perspectiva del usuario Web

Perspectiva Linked Open Data

Los usuarios utilizan un navegador web para acceder a los datos a través del portal de Europeana mediante un sistema de búsqueda basado en Apache Solr.

Las aplicaciones LOD acceden a conjuntos de datos RDF para su consulta o descarga donde se almacenan los metadatos EDM.

DescargaLinked Open Data

Europeanahttp://data.

europeana.euSPARQLEndpoint

Page 19: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Linked Open Data: ¿qué hacer?

¿Qué datos de mi organización quiero publicar? ¿Bajo qué licencia se publicarán?

¿Qué esquemas de metadatos y vocabularios RDF se usarán?

¿Será necesario desarrollar alguna ontología o derivar elementos de un vocabulario RDF?

¿Cómo se mapearán los datos con los elementos del esquema de metadatos?

¿Como se accederá a los datos? ¿Mediante descarga de ficheros? ¿A través de un SPARQL Endpoint?

¿Será crearán enlaces con conjuntos de datos externos? ¿Se generarán de forma manual o automática?

¿Se incorporarán conjuntos de datos externos para generar contenidos?

¿Como se mapearán los datos externos con los componentes de dichos contenidos?

¿Se incorporará información semántica en las páginas (X)HTML con RDFa o microdatos?

¿...?

Page 20: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

¿Software libre o software propietario?

[...]Con los datos proporcionados por el propio Senado, aproximadamente la mitad del total gastado "corresponde a las licencias de uso del gestor de contenidos (Oracle UCM), a los elementos de infraestructura relacionados con la tramitación electrónica (Kinamik), a las licencias del buscador (Oracle SES) y a la compra de un nuevo servidor de aplicaciones (Oracle Weblogic)".[...]

http://www.elmundo.es/elmundo/2012/11/06/navegante/1352201162.html

Page 21: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

WordPress

LH RDF: Permite la publicación de contenidos en RDF/XML previo mapeado de los campos de una entrada o página a los elementos de SIOC, Dublin Core, SKOS, FOAF y OAI-ORE.http://wordpress.org/extend/plugins/lh-rdf/

Enhanced Publication: Describe un sitio web como una publicación compuesta utilizando OAI-ORE, permitiendo relacionar recursos y generar una salida RDF utilizando OAI-ORE, Dublin Core, FOAF, FRBR, etc.http://wordpress.org/extend/plugins/enhanced-publication/

LH Tools: Implementa un SPARQL Endpoint para consultar los diferentes elementos del sitio web.http://wordpress.org/extend/plugins/lh-tools/

LH Relationships: Permite definir relaciones entre contenidos RDF: Permite la publicación de contenidos en RDF/XML previo mapeado de los campos de una entrada o página a los elementos de SIOC, Dublin Core, SKOS, FOAF y OAI-ORE.http://wordpress.org/extend/plugins/lh-relationships/

RDFaCE-Lite: Extiende el editor visual de Wordpress mediante funciones para el marcado semántico con RDFa o microdatos.http://wordpress.org/extend/plugins/rdface/

Page 22: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Omeka

OMEKA es un software de código abierto, escrito en PHP para la publicación en la web de colecciones de bibliotecas, archivos y museos.

Se basa en el uso de los elementos básicos de Dublin Core y constituye una alternativa mucho más sencilla y ágil a otros repositorios más potentes, como Dspace.

Está enfocado a la creación y visualización de exposiciones virtuales y es utilizado por más de 100 entidades en todo el mundo, y es utilizado por Europeana para el desarrollo de este tipo de eventos.

Carece de soporte RDF nativo pero incorpora dos extensiones que amplian la funcionalidad para la publicación LOD:Dublin Core Extended e Items relations.

Page 23: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

OmekaPublicación LOD y pseudo-negociación de contenido con Dublin Core Extended

A su vez, cada elemento dispone de una URL (distinta de la anterior) que ofrece la misma descripción en formato RDF/XML legible por máquina con un cliente RDF.http://mysois.uwm.edu/omeka/data/humanreadable/items/show/2272

Cada elemento descrito en Omeka tiene una URL a la que es posible conectarse con un navegador web convencional.http://mysois.uwm.edu/omeka/resource/items/show/2272

Page 24: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

OmekaPublicación LOD y negociación de contenido parcial con Dublin Core Extended

En caso de que un usuario se conecte con un navegador convencional a una URL legible por máquina, Omeka lo redirige a una URL con una versión legible por personas. http://mysois.uwm.edu/omeka/data/humanreadable/items/show/2272

Page 25: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Drupal 7

Drupal 7 ofrece en su núcleo soporte RDF y marcado RDFa, pudiendo ampliar sus funcionalidades a través de la librería ARC2 (escrita en PHP) y determinados plugins.

RDFx: ofrece soporte RDF y una API para que otros módulos utilicen esta funcionalidad.

RDF UI: permite definir el mapeado entre los campos de un tipo de contenido y un elemento de un vocabularios RDF.

Evoc: facilita la importación de vocabularios RDF para que puedan ser utilizados por RDF UI en el mapeado de campos.

SPARQL: permite definir SPARQL Endpoints propios (a partir del contenido del sitio web gestionado por Drupal) o externos.

SPARQL Views: permite definir vistas mediante consultas predefinidas a SPARQL Endpoints.

VARQL: similar a SPARQL Views pero ofrece un asistente para diseñar las consultas sin SPARQL.

Page 26: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

DrupalDefinición de objetos RDF a partir de tipos de contenidos en Drupal

Es posible crear nuevos tipos de contenido, sobre los que se pueden definir el tipo de recurso RDF del que se trata, así como definir propiedades sobre el tipo de contenido.

Page 27: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

DrupalMapeado entre campos CCK y elementos de vocabularios RDF

Para cada campo puede seleccionarse uno o varios elementos de mapeado

El valor del predicado con el que se define el mapeado puede ser un literal (property) o referencias URI/Nodos (rel o rev)

También es posible especificar un tipo de dato XML en el caso de seleccionar un como valor del predicado un literal

Con CCK pueden definirse los campos que conforman los tipos de contenido de Drupal

Page 28: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

DrupalInserción de RDFa en el código XHTML

<div class="field-item" property="dc:creator">Juan Antonio Pastor Sánchez</div><div class="field-item" property="dc:creator">Francisco Javier Martínez Méndez</div><div class="field-item" property="dc:creator">José Vicente Rodríguez Muñoz</div>

Drupal renderiza el código XHTML del documento insertando atributos RDFa a partir del mapeado definido

<dc:creator xml:lang="es">Juan Antonio Pastor Sánchez</dc:creator><dc:creator xml:lang="es">José Vicente Rodríguez Muñoz</dc:creator><dc:creator xml:lang="es">Francisco Javier Martínez Méndez</dc:creator>

Mediante técnicas de parseado o servicios de extracción RDFa como <http://www.w3.org/2007/09/pyRDFA>es posible extraer sentencias RDF del código XHTML del documento

Page 29: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

DrupalEl Ecosistema SPARQL en Drupal

VARQLSPARQL

Views

SPARQLEndpointRegistry

Vistas apartir de datos suministrados

por un SPARQLEndpoint

SPARQLProject

(Incluye API)

Contenidos“Nativos” de

Drupal

El Universo de los Datasets(Conjuntos de datos RDF)

El Universo de los Usuarios(Lectores, Gestores, Aplicaciones, Agentes)

SPARQLEndpoint

El Universo de Drupal(Nodos, Vistas, Taxonomías, Tipos de Contenido)

Drupal permite reutilizar Datasets RDF, registrando

SPARQL Endpoints externos para construir vistas.

También es posible crear SPARQL Endpoints en nuestro sitio web, para ofrecer nuestros

datos (de forma selectiva) a través de este servicio.

Page 30: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Semantic Mediawiki

Se trata de una extensión que permite incorporar información semántica en los propios contenidos gestionados con Mediawiki (la plataforma utilizada en Wikipedia).

Semantic Mediawiki amplia el conjunto de etiquetas de marcado del lenguaje utilizado para crear los documentos para insertar declaraciones similares a RDF.

Es posible definir el tipo de relación existente entre dos contenidos (artículos en la terminología Mediawiki) anotando semánticamente los enlaces entre ellos.

SMW permite definir un SPARQL Endpoint utilizando un servidor tripletstore en el que se han volcado las declaraciones RDF de los artículos.

Se trata de una extesión pensada fundamentalmente para la reutilización de datos contenidos en los artículos dentro de otros artículos.

El mundo de SMW es infinito y sobre esta extensión se han definido otras que ofrecen un ámbito abanico de soluciones.

Más información en: http://semantic-mediawiki.orghttp://www.mediawiki.org/wiki/Category:Semantic_MediaWiki_extensions

Page 31: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

VI Encuentros de Centros de Documentación de Arte contemporáneo. Vitoria, 7 y 8 de noviembre de 2012

Alcanzando el mañana...

La interconexión de datos semánticos es el primer paso para crear una nueva generación de contenidos y procesos “inteligentes” independientes de las plataformas utilizadas para su desarrollo y consulta, mediante la aplicación de estándares y tecnologías abiertas.

Actualmente los diferentes estándares y “piezas” de software utilizados para la

publicación y reutilización de LOD se combinan para dar forma a aplicaciones mashup que interactúan entre sí.

La oferta de sistemas y tecnologías para la publicación LOD debe complementarse

con plataformas SaaS que faciliten la publicación, reutilización y explotación de conjuntos de datos a pequeña o mediana escala.

Las entidades públicas son esenciales en el universo LOD, aportando datos, recursos y

normativa que ayuden a desarrollar un nuevo sector económico basado en un mercado de datos con modelos de negocio adecuados en el que participe el sector privado.

Los datos enlazados del ámbito GLAM han de ser más activos en el ecosistema LOD, cohesionando datos, conocimiento y participación ciudadana a través de la interconexión con recursos de otros ámbitos: DBpedia, SIOC (redes sociales), Geodata, etc

Page 32: VI Encuentros de Centros de Documentación de Arte Contemporáneo - Juan Antonio Pastor Sánchez

2ª Conferencia sobre calidad de revistas de ciencias sociales y humanidades (CRECS 2012) Valencia, 10 de mayo de 2012

¡¡¡ Muchas gracias por su atención !!!

... no hay soluciones únicas o que se puedan aplicar para siempre, solo hay elecciones inteligentes para una situación concreta que puedan adaptarse con el paso del tiempo...