20
La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México 2010

La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Embed Size (px)

Citation preview

Page 1: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

La web semántica y su impacto en la recuperación

de información

Rosenda Ruiz Figueroa3er Seminario Internacional

De la transparencia a los archivosMéxico 2010

Page 2: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

El proceso de recuperación de información en la Web

Reporta

El usuario transforma en

El usuario transforma en

Page 3: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

¿Qué es la web semántica?

Semántica

Relativa al significado de las palabras o vocablos en función de una lengua y un contexto. Es decir, las palabras tienen un significado particular para una

comunidad establecida

Por tanto, la web semántica es, por definición, aquélla donde los contenidos tienen un significado preciso para

una comunidad determinada

Page 4: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

¿Qué es la web semántica?• Una ampliación de la web actual• Un espacio donde los datos tienen un significado bien definido en función

de su contexto• Los datos se convierten, mediante un proceso de organización, en

información llena de significado• La organización puede ser realizada por humanos o por procesos

computarizados• La información puede ser usada por diferentes softwares (uso de una

infraestructura común), permitiendo la búsqueda, recuperación e integración de manera más eficiente durante los procesos de búsqueda y recuperación (interoperabilidad)

• El usuario puede encontrar respuesta a sus cuestionamientos de manera más rápida y sencilla (eficiencia) porque la información puede ser interpretada tanto por personas como por procesos computacionales (agentes)

Page 5: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Condiciones para que funcione la Web Semántica

Significado

Page 6: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

El proceso de recuperación de información en la Web semántica

Organización

Conversión a

Reporta

El usuario transforma en

Page 7: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Organización

Descriptiva

• Forma• Soporte• Creación• Obra• Ubicación• Propiedad• Representación

Contenido

• Contenido intelectual del documento

• Clasificación• Indización• Puntos de acceso• Representación

Metadatos

Page 8: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Dado lo anterior, la web semántica no puede funcionar sin una herramienta que de significado al contenido a través de un vocabulario específico y las relaciones de

los términos en función de un contexto

Los lenguajes documentales

Page 9: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Los lenguajes documentales

Libres (naturales)

• Descriptores libres• Palabras clave• Folksonomías

Controlados• Vocabularios• Encabezamientos de

materia• Sistemas de clasificación• Taxonomías• Tesauros• Ontologías

• Mapas conceptuales• Mapas de tópicos o

mapas temáticos

Page 10: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Los lenguajes documentales

Libres (naturales)

Características:•Exhaustivos•Imprecisos•Polisemia•Sinonimia•Sin contexto•No relacionales

Controlados

Características:• Preciso• Menor polisemia• Menor sinonimia• Contextuales• Representan un área (o

varias) del conocimiento• Relacionales• Facetados

Page 11: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Lenguajes controlados

• Herramientas para la representación y organización del conocimiento

• Enfatizan los aspectos fundamentales del contenido del objeto de información

• Facilitan la búsqueda precisa pero también la búsqueda de contexto

Page 12: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

• Permite al usuario buscar sin tener que conocer la estructura del propio lenguaje

• Usa términos que son adecuados al contexto y conocidos en el ambiente del usuario (uso)

• Permite conocer las relaciones preestablecidas en el propio lenguaje de manera que obtenga un panorama más amplio (precoordinación)

• Permite al usuario establecer relaciones durante el proceso de búsqueda (postcoordinación)

Un buen lenguaje controlado es aquel que:

Page 13: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Los lenguajes controlados• Vocabularios – Listado de términos. Finalidad: agrupar y

controlar

• Encabezamientos de materia – Lenguaje precoordinado con sintaxis no natural. Representación de una colección a partir de conceptos, formas, etc., y sus relaciones jerárquicas. Finalidad: localizar

• Sistemas de clasificación – Organización del conocimiento mediante la categorización y la jerarquización, uso de nomenclatura natural o artificial. Relaciones al mismo nivel: difusas, a menos que sean facetados. Finalidad: clasificar y localizar

Page 14: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Los lenguajes controlados

• Taxonomías – Organización del conocimiento mediante la categorización y la jerarquización en estructura plana. Normalmente basadas en conceptos. Finalidad: clasificar

• Tesauros – Sintaxis natural. Organización del conocimiento en base a conceptos y sus relaciones jerárquicas, equivalencias y asociaciones. Términos preferentes. Multijerárquicos. Finalidad: localizar

Page 15: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Los lenguajes controlados• Ontologías –

– Diversos tipos: Terminológicas y de Información– Tesauros más avanzados. – Incluyen taxonomías. – Representación del conocimiento a partir de los

conceptos y sus relaciones– Delimita propiedades, características: rasgos y atributos– Facetas– Mayor variedad de relaciones– Modelos conceptuales– Finalidad: Almacenamiento de conocimiento (vertido en

términos que representan conceptos) para ser usado por varios sistemas automáticos (reusabilidad)

Page 16: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Los lenguajes controlados

• Ontologías – – “En teoría, son una de las piezas clave para la

comunicación entre organizaciones, personas y aplicaciones y así facilitar la interoperabilidad entre sistemas. Gracias al conocimiento almacenado en las ontologías, los agentes inteligentes podrían extraer directamente datos de las páginas web, procesarlos y hacer inferencias. Sin embargo, esta funcionalidad actualmente aún no está disponible fuera de dominios reducidos.” (Vallez, Mari, 2010)

Page 17: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Parámetros de la indización de los documentos

• Pertinencia – Utilidad real de los resultados de búsqueda• Exhaustividad – Representación suficiente de los

contenidos• Especificidad – Eliminación de ambigüedades,

asociación de términos correcta y jerarquización adecuada

• Uniformidad – Coincidencia de los términos de búsqueda con los términos usados para la descripción

Page 18: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Entonces…Bien desarrollados, los lenguajes controlados optimizan la recuperación de la información porque:

1.Evitan la dispersión de la información debido a la estructuración del conocimiento

2.Evitan la polisemia y la sinonimia porque establecen relaciones entre los términos con significados diferentes y significados iguales

3.Dan significado a los términos con los que se describe el contenido de un recurso porque son sistemas semánticos

4.Establecen las relaciones entre los términos de búsqueda, no la tiene que hacer el usuario

Page 19: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

En conclusión

• Una búsqueda en la web utilizando un buscador normal, tipo Google, reporta un número infinito de resultados; la gran mayoría de ellos no tienen ni relevancia ni pertinencia

• El uso de un lenguaje controlado en la web semántica, que permite la búsqueda contextual, equivale, según los estudios realizados, a la reducción de más del 70% del número de resultados

• Así, el acceso a la información se hace más eficiente y expedito, proporcionando resultados a través de búsquedas más sencillas usando términos que corresponden al contexto del interesado

Page 20: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México

Si y solo sí

Derecho de acceso a la información

Transparencia

• Disponibilidad• Suficiencia• Claridad• Oportunidad• Facilidad de

acceso

Organización

Representación

Requiere