Se calcula que los mayores motores de búsqueda muestran sólo entre un tercio y la mitad de los...

Preview:

Citation preview

ESTRATEGIAS Y MECANISMOS DE

BUSQUEDA EN LA WEB INVISIBLE

¿Qué es la Web Invisible?

Este termino se utiliza para referirse a la información que los motores de búsqueda tradicionales no pueden encontrar.

Otra forma de denominar a esta información es Internet profunda, ya que en realidad no es invisible, sólo hay que saber llegar a ella a través de navegadores convencionales.Por ello, el término más correcto para denominar a la web invisible sería "no indizable".

Se calcula que los mayores motores de búsqueda muestran sólo entre un tercio y la mitad de los

documentos disponibles al público en la Red. Se ha estimado que la información contenida en la web

invisible es aproximadamente 550 veces mayor que la de la web superficial y crece a mayor velocidad

El tipo de información que encontramos en la Internet

Invisible puede ser:

Bases de datos: los buscadores sólo proporcionan acceso a la página de inicio porque las restantes son dinámicas. Documentos en formato pdf, word...: los motores de búsquedas fueron creados sólo para localizar e indizar páginas html, aunque actualmente Google indiza documentos en formato pdf, doc, xml... Páginas web que no son indizadas por los motores de búsqueda: porque se excluyen ellas mismas a través de un protocolo de exclusión. Sitios web que necesitan contraseña: los motores de búsqueda no pueden acceder al contenido de estas páginas

La Web invisible

Web opaca• Extensión de la indización• Frecuencia de la indización• Número máximo de resultados visibles• URL desconectados

Web privada• Páginas protegidas con contraseña• Robots.txt

Web propietaria• Páginas que requieren una cuenta de usuario• Páginas con formatos PDF, Flash, entre otros

Verdadera Web invisible• Formatos que no son indexados por los motores de

búsqueda.• Páginas generadas dinámicamente

Herramientas de búsqueda en la webBuscadores: Permiten la búsqueda directa de artículos y documentos en texto completo y recuperar archivos PDF o PostScript.Metabuscadores:presentan limitaciones respecto a las posibilidades de búsqueda de cada buscador por separado.Directorios: Mecanismos que se usan para localizar recursos en la web profunda principalmente bases de datos.

Herramientas de búsqueda en la web

Guías: Son las elaboradas por las bibliotecas.Tutoriales.Motores avanzados: Realizan búsquedas simultáneas en varias bases de datos en la web.

EJEMPLOS

¿CÓMO ACCEDER A LA

INTERNET INVISIBLE?

BASE DE DATOS

METABUSCABUSCADOR BUSCADOR WEB PROFUNDA

DIRECTORIO

METABUSCADOR

MOTOR AVANZADO

GUIA

BUSCADOR

ELABORADO POR:

SINDY YULIETH GARCIA RESTREPO

YENNY OSORIO VALENCIA

2009