Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Los lenguajes controlados en la organización y
recuperación de contenidos en la Web
Wilmer Arturo Moyano GrimaldoCatedra para el curso:
Organización y acceso a la informaciónInstituto Tecnológico de Monterrey
Febrero 21 de 2012
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Agenda a tratar:
1. Organización de la información– Lenguaje y conocimiento– Lenguajes naturales vs. Lenguajes controlados
2. Lenguajes controlados y organización web– Knowledge organization systems y System
Knowledge Organization systems– Folcsonomías y etiquetado
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Lenguaje y conocimiento
Lenguaje
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Tendencias en la organización
Control Bibliográfico
Estructuralista
• Catalogación tradicional• Estándares bibliográficos• Esquemas de clasificación
• XML• RDF• Ontologías
Organización en la Web Metadatos Web
Semántica
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Organización de Información
• Fundamentos– Filosofía de los sistemas
• El todo, las partes y sus relaciones
– Filosofía de la ciencia• Positivismo y dialéctica
– Filosofía del lenguaje• Uso de las palabras
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
• Obstáculos – Variedad del universo de información– Cambios políticos
• Estandarización internacional
– Cambios tecnológicos• Componentes
– Humano– Tecnológico
Organización de Información
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Lenguajes naturales Vs. Lenguajes artificiales
VIZCAYA, D. A. (2000). Lenguajes documentales. p. 92
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Ventajas de los lenguajes controlados
• El apoyo en la coherencia de la indización• El aumento de la probabilidad de adecuación entre los términos
escogidos por los indizadores y aquellos escogidos por el investigador• El proveer una estructura sindética que ayuda a la navegación y al
refinamiento de conceptos• El control de la sinonimia y de la polisemia• La discriminación de las palabras homógrafas• El proveer unas notas de aplicación• El permitir una recuperación más global dentro de un ambiente
multilingüe• El permitir la reagrupación de los elementos dispersos por sus
características comunes (Arsenaut, 2006)
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Desventajas de los lenguajes controlados
• La ausencia de expresividad• La limitación de la cantidad de puntos de acceso• La ausencia de exhaustividad• La dificultad de representar nuevos conceptos• La dificultad de representar conceptos complejos• Las limitaciones del aprendizaje de las reglas sintéticas• La representación artificial de la realidad• La incompatibilidad entre los diferentes vocabularios
controlados• El costo de su desarrollo y utilización (Arsenaut, 2006).
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Lenguajes naturales y Lenguajes documentales en la organización de información
Fuente: VIZCAYA, D. A. (2000)
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Lenguajes documentales de acuerdo a su rol en los catálogos
Universo bibliográfico
Lenguajes de obras Lenguajes de Documentos
De autor
De título
De edición
De materias
De clasificación
De indización
De producción
De soporte
De ubicación
Svenonius, E. (2000). Intellectual foundation of information organization. p. 54
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
KOS: Knowledge Organization Systems
• Término propuesto en 1998 por el Networked Knowledge Organization Systems Working Group como remplazo a los Lenguajes documentales.
• Para todo tipo de esquemas de organización de información: Ej. Metadatos, ontologías.
• Características:– Imponen una visión
particular del mundo en una colección y sus elementos.
– Permiten caracterizar las entidades de diferentes formas dependiendo el KOS.
– Facilitan para que una persona pueda asociar el término del KOS con el objeto del mundo real al que representan
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Tipos de KOS
1. Listas de términosa. Archivos de autoridadesb. Glosariosc. Diccionariosd. Diccionarios geográficos (Gazeteers)
2. Clasificaciones y categoríasa. Listas de encabezamientosb. Esquemas de clasificación, de categorización y taxonomías
3. Listas de relacionesa. Tesaurosb. Redes semánticasc. Ontologías
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
SKOS: Simple Knowledge Organization System
• Recomendación de la W3C• Para la representación de KOS en la Web,
potenciando los lenguajes documentales tradicionales a un ambiente de Web Semántica.– Estructura basada en RDF para representación de
conceptos, sus relaciones y sus definiciones.
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
LÉNART, M. SKOS, un langage de représentation de schémas de concepts
SKOS: Simple Knowledge Organization System
AGROVOC
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Metadatos
• “Datos sobre datos”• Para la organización, gestión, descripción y
recuperación de información en formato digital. Ej. Fotografía
• No son específicos del ambiente bibliotecario• Para diferentes campos:
– Bibliotecas digitales: Dublin core– Archivos: Encoded Archival Description– Museos: VRA core
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Metadatos en la vida diaria
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Metadatos en la vida diaria
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Ontologías
• Vocabulario común a máquinas y personas– Mejoran la especificidad
en las búsquedas Web– Recuperación de
información automatizada por fuera de los motores de búsqueda.
– Representan la estructura de un documentos a través de la abstracción y relación de conceptos.
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
OWL: Web Ontology Language
• OWL= 2004; OWL2 = 2009 (basado en XML)• Para permitir la descripción de clases y las
relaciones entre estas que son inherentes a aplicaciones y documentos en la Web.– OWL2: especialmente para esquemas de clasificación
• Permite describir las clases• Mejora las relaciones entre las clases• Construcción de varias clases de reglas para nuevos números
de clasificación.
• Ejemplo: http://www.regesta.com/xdams/ontologie/owl/Biblioteca.owl
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Biblioteca.owl
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Folcsonomías
• Por Thomas Vander Wal en 2004– “Taxonomías creadas por la gente”
• Indización social a base de etiquetas– Lenguaje natural– No existen relaciones entre términos– Las etiquetas permiten la organización y
recuperación• Ejemplos de uso: www.delicious.com
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Aplicación del etiquetado
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Aplicación del etiquetado
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
En resumen…
• El lenguaje es el estándar que usa la comunicación para transmitir un mensaje y crear conocimiento.
• La recuperación más efectiva de información depende del uso de los lenguajes naturales y los lenguajes controlados.
• La nueva forma de definir los lenguajes documentales es como Sistemas de Organización de conocimientos (KOS)
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
En resumen…
• SKOS es el lenguaje que permite representar los lenguajes documentales en un ambiente Web mejorando la representación del conocimiento como apoyo a la Web Semántica
• Los metadatos y las ontologías son sistemas de organización del conocimiento en un ambiente digital y Web
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
En resumen…
• Las folcsonomías son estructuras temáticas basadas en lenguaje natural y creadas por los usuarios finales para la organización, descripción y recuperación de información por medio de etiquetas.
• El etiquetado ha permitido la creación de sistemas y servicios que facilitan la interacción entre el usuario y el sistema.
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Wilmer Arturo Moyano
Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Bibliografía recomendada…
• SVENONIUS, E. (2000). The intellectual foundation of information organization. Cambridge: The MIT press, 2000. 255 p. Serie Digital libraries and electronic publishing.
• ARSENAULT, C. (2006). “L’utilisation des langages documentaires pour la recherche d’information” En: Documentation et bibliothèques, avril-juin, 2006, pp. 139-149
• HODGE, G. (2000). Systems of Knowledge Organization for Digital Libraries: Beyond Traditional Authority Files. http://www.clir.org/pubs/reports/pub91
• PETERS, I. (2009). Folksonomies: indexing and retrieval in Web 2.0 (Disponible parcialmente a través de Google Books)