Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Preview:

Citation preview

Daniel Vila Suero Ontology Engineering Group

Pensando en los datos

Cita en la BNE: RDA y Linked Data15 Abril 2016

Grupo de investigación dirigido por Asunción Gómez Pérez

Linked Data-based Data Integration

Semantic e-Science

(Social) Semantic

Web

NLP and Multilingualism

Ontological Engineering

1995

1997 2000

2004 2008

Ontology Engineering Group 9

JSON-LD

SPARQLMotor de búsqueda NoSQL DB

Aplicación + API (Javascript)

Cliente HTTP API

Indexación y ranking

SPARQL endpoint

Ontología BNE

Acceso

Aplicación

JSON-LD

Datos

• La Web: Javascript + CSS3 + HTML5 + LD

• Crecer: Escalabilidad con el número de usuarios

• Los usuarios: Apps and us

• ”Pensar en los datos”: Datos primero, aplicación después

Arquitectura pensada para..

¿Pensar en los datos?

JSON-LD

SPARQLMotor de búsqueda NoSQL DB

Aplicación + API (Javascript)

Indexación y ranking

Ontología BNE

Aplicación

JSON-LD

Datos

Problema a resolver

Solución

Solución

“Pensar en los datos”: Abordar las soluciones desde el modelo de datos

(aplicación)

(datos)

“Pensar en los datos” con un ejemplo

¿De dónde vienen estas sugerencias? (2015)

Objetivo inicial (2014): Mostrar obras de un mismo tema

¿Cómo hacer esto?

Objetivo inicial (2014): Mostrar obras de un mismo tema

Situación inicial (60’s): Los temas están en los bibliográficos

Registros bibliográficos (Ediciones)

Registros autoridad (Obras)

Tema

Tema

Aplicación

Datos

Aplicación

?

Soluciones (2014): “Clásica” vs. “Pensar en los datos”

?Ediciones

Obras

Aplicación

Temas

Quiero mostrar obras sobre un mismo tema

“Clásica” (1)Pregunto por ediciones sobre el mismo tema

Ediciones

Obras

Aplicación

Temas

Tema = Novelas picarescas

Ediciones (muchas)

Problemas: No es lo que queríamos. ¿cómo presentamos los resultados? (relevancia)

Soluciones (2014): “Clásica” vs. “Pensar en los datos”

?Ediciones

Obras

Aplicación

Temas

Quiero mostrar obras sobre un mismo tema

“Clásica” (2)Pregunto por ediciones sobre el mismo tema

y por cada edición pregunto por su obra

Ediciones

Obras

Aplicación

Temas

Tema = Novelas picarescas

Enlaces a obras

Problemas: Dos consultas, + costoso, +complejo NO facilmente reutilizable

1

Recuperar obras

2 Obras

1

2

Pensar en los datos (2014)

?Ediciones

Obras

Aplicación

Temas

Quiero mostrar obras sobre un mismo tema

Pensemos en los datos Obra

Edición Temas

Nueva relación (FRBR, RDA)

Ediciones

Obras

Temas

Nuevos enlaces

Pensar en los datos (2014)Pregunto por obras sobre el mismo tema

Ediciones

Obras

Aplicación

Temas

Tema = Novelas picarescas

Obras

Ventajas: Aplicación + rápida, menos compleja Beneficia a todo el servicio REUTILIZABLE Mejor presentación de resultados

(relevancia, agregación,

presentación)

Pensar en los datos (2015): Sugerencias

Misma funcionalidad (usando el buscador) Obras que compartan temas

Obras

Temas

Pensar en los datos (2016?): Valor añadido

Explotar la misma idea en distintos contextos:

> Obras con temas similares > Autores que hablan de los mismos temas > Temas que coinciden en diferentes obras

Obras

Temas

• Mayor impacto en todo el servicio: APIs, Motor de búsqueda, algoritmos de relevancia.

• Reutilización de funcionalidades

• El poder de los enlaces (the network effect):

“Cada nuevo enlace representa nuevas posibilidades”

Beneficios de pensar en los datos