22
4º Periodism ación de la red al periodismo David Rodríguez Mateos - 2 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo Licenciatura en Periodismo Universidad Carlos III de Madrid Curso 2004/2005

4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

Embed Size (px)

Citation preview

Page 1: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

BÚSQUEDAS DE INFORMACIÓN EN INTERNET

Aplicación de la red al periodismoLicenciatura en Periodismo

Universidad Carlos III de Madrid

Curso 2004/2005

Page 2: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

Índice1. Herramientas de búsqueda de información en Internet2. Directorios3. Portales4. Buscadores5. Algunos buscadores6. Metabuscadores7. Web profunda8. Tipos de Web profunda9. Web desaparecida10. Algunas estrategias para recuperar un contenido desaparecido11. Bases de datos12. Búsquedas de imágenes13. Estrategias para buscar cuando no sabes qué, cómo, dónde,

cuándo o cuánto buscar

Page 3: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

1. Herramientas de búsqueda de información en la web

• Directorios

• Portales

• Buscadores, motores de búsqueda

• Metabuscadores, no multibuscadores

• Referencias a “Web profunda”– Bases de datos– Otro tipo de información oculta

Page 4: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

2. Directorios• Recopilaciones manuales de enlaces web

– Una persona o institución envía la dirección de un sitio o página al directorio

– Otra persona del directorio comprueba la dirección

• Direcciones organizadas en categorías• Pueden ser

– Genéricos• Ej: Guía de enlaces de El País

– http://www.elpais.es/guiaderecursos/index.html

– Especializados• Ej: Buscopio, http://www.buscopio.net

• Si incluyen muchos contenidos, pueden incorporar un motor de búsqueda

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 5: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

3. Portales

• Sitios web que ofrecen contenidos informativos, comerciales, de ocio, de comunicación directa, etc.– Pretenden “dirigir” la navegación de los usuarios– Muchos de ellos incluyen directorios– Pueden ser:

• Horizontales: poco especializados– Ej: Yahoo, http://www.yahoo.es

• Verticales: muy especializados– Ej: Administracion.es, http://www.administracion.es

– Si incluyen muchos contenidos, pueden incorporar un motor de búsqueda

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 6: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

4. Buscadores

• Programas informáticos que – Recopilan automáticamente direcciones y

contenidos de documentos presentes en la web

– Las almacenan en una base de datos– Indexan los contenidos según un algoritmo– Permiten buscar en sus contenidos

mediante un motor de búsqueda• El usuario puede usar el motor mediante un

interfaz de búsqueda

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 7: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

5. Algunos buscadores

• Google– http://www.google.es, etc.– Permite búsqueda sencilla, por

expresiones, uso de operadores, búsqueda acotada por dominios, fechas, lenguajes, formatos de ficheros (HTML, Word, Powerpoint, Excel, Flash...)

• Solo en Estados Unidos, permite búsquedas en otras fuentes (páginas amarillas, BD de envío de paquetes...)

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 8: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

5. Algunos buscadores

• Alltheweb– http://www.alltheweb.com– Permite restringir las búsquedas

manualmente mediante posibilidades adicionales (operadores lógicos)

– Permite buscar sonidos

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 9: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

5. Algunos buscadores

• MSN Search– http://beta.search.msn.com/– Versión beta de buscador, patrocinado por

Microsoft– Ofrece algunas posibilidades de

refinamiento de búsqueda (país, idioma, grado de popularidad, grado de correspondencia entre término y resultados, etc.)

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 10: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

5. Algunos buscadores

• Teoma– http://www.teoma.com– Contiene menos documentos en su BD

que los otros buscadores citados– Ofrece sitios web web relacionados con

aquellos que son resultados de la búsqueda

• Especialmente, cuando la búsqueda es en inglés

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 11: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

6. Metabuscadores

• Herramientas que permiten buscar simultáneamente en varios buscadores– Ej.: Metacrawler

• http://www.metacrawler.com

• Ventaja: realiza simultáneamente varias búsquedas

• Desventaja: no todos los buscadores utilizan la misma sintaxis de búsqueda– El mismo texto usado en un buscador puede

producir muy distintos resultados en otro buscador

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 12: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

7. Web profunda

• También conocida como “Web invisible”, “Internet invisible” o “Internet oculta”

• Formada por el conjunto de aquellos recursos que no son localizables mediante los buscadores.– Internet superficial (máximo número de

documentos accesibles por los buscadores) = unos 200 Terabytes

– Internet profunda = unos 100.000 Terabytes (500 veces más)

– 1 Terabyte ~ 1.100.000.000.000 de caracteres

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 13: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

8. Tipos de Web profunda1. Web casi invisible

• Documentos que no han sido indexados por los buscadores

Están a demasiada profundidad No hay ningún enlace que apunte a la página principal Están en un formato que no recogen los buscadores

2. Web temporal• Documentos que solo existen durante el tiempo de su

consulta

3. Web tras la pasarela• Documentos a las que solo se puede acceder mediante

registro

4. Web de pago• Documentos que requieren un pago económico

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 14: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

9. Web desaparecida

• Aquellos documentos que no son accesibles– Porque el ordenador en el que se alojan no está

conectado temporalmente a Internet• Está apagado• Tiene un fallo en la conexión a la red

– Porque la dirección de partida es errónea– Porque han sido cambiados de sitio dentro del

ordenador en el que están– Porque han sido cambiados a otro ordenador– Porque han sido físicamente borrados del

ordenador

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 15: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

10. Algunas estrategias para recuperar un contenido desaparecido

• Partiendo de la dirección original– Ir recortando la dirección para ver si se mantienen las

carpetas, el servidor...• Ej: desde http://www.prueba.es/directo1/subdirecto2/

pagina.html– Probar con

» http://www.prueba.es/directo1/subdirecto2/» http://www.prueba.es/directo1/» http://www.prueba.es/

• Navegar o utilizar un buscador desde la primera dirección correcta

– Buscar y revisar el mapa del sitio

– Emplear un buscador para buscar partes del sitio web– Emplear un buscador para buscar el título del sitio web

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 16: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

11. Bases de datos (BD)

• Desde el punto de vista de la web, forman parte de la Web profunda– Como web temporal, tras la pasarela o de pago– Los buscadores solo pueden acceder, como mucho,

a la página principal– Cada BD tiene su propio lenguaje de consulta

• Ciertos sitios web son, en realidad, bases de datos– Ej: Earth Calendar

• http://www.earthcalendar.net/index.php

– Ej: Internet Archive• http://www.archive.org/

6.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18

Page 17: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

12. Búsquedas de imágenes

• Bases de datos de pago– Corbis

• http://www.corbis.com

– Getty Images• http://www.gettyimages.com

• Bases de datos gratuitas– Colecciones de la UNESCO

• http://www.unesco.org/webworld/digicol

– Google• http://www.google.es Imágenes• http://www.alltheweb Video

Page 18: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

13. Fuentes de información personal• Listas de distribución

– Envío masivo de mensajes• 1 mensaje se envía a todo un grupo• Todos reciben el mensaje• Ejemplo: Lista de distribución periodismo

– http://www.rediris.es/list/info/periodismo.html

– Listas de distribución en http://www.rediris.es/list/ y http://tile.net/lists

• Grupos de news / foros de discusión– Tablones de mensajes electrónicos– Un usuario coloca un mensaje– Los demás usuarios pueden acceder al tablón para leer uno o varios

mensajes.• Ejemplo: alt.periodismo

– Grupos de News en http://tile.net/news o en http://groups.google.es

Page 19: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

13. Estrategias para buscar cuando no sabes qué, cómo, dónde, cuándo

o cuánto buscar1. ¿Qué quiero saber o averiguar?

– Intenta formular con palabras tu búsqueda. Eso te ayudará a acotarla. Piensa en términos alternativos

2. ¿Conozco el tema?• Si se conoce el tema, se pueden

encontrar las fuentes en las que consultar, es decir, aquellos lugares donde se encuentra información válida y fiable sobre ese tema

Page 20: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

13. Estrategias para buscar cuando no sabes qué, cómo, dónde, cuándo

o cuánto buscar3. Si no conozco el tema, he de buscar primero

una buena fuente de referencia sobre ese tema– ¿Quién puede ofrecer la información que estoy buscando?

• Si estuviera buscando la pregunta en otro ámbito similar, ¿quién podría tenerla?

– ¿Cómo podría conseguirla?

4. Habla con otros / mira lo que otros están buscando

• ¿Quién más podría estar interesado en estas preguntas?

• ¿Cómo acceder a sus respuestas sobre ellas?

Page 21: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

13. Estrategias para buscar cuando no sabes qué, cómo, dónde, cuándo

o cuánto buscar5. Busca información por ti mismo

• Plantea tu pregunta tan concreta como puedas

• Si no funciona la búsqueda, utiliza un método indirecto o “método del embudo”• Empieza por una pregunta genérica• Según los resultados encontrados, puedes ir

acotando la búsqueda añadiendo nuevos términos

Page 22: 4º Periodismo Aplicación de la red al periodismo David Rodríguez Mateos - 2004 BÚSQUEDAS DE INFORMACIÓN EN INTERNET Aplicación de la red al periodismo

4º Periodismo

Aplicación de la red al periodismo David Rodríguez Mateos - 2004

Bibliografía

• BERGMAN, Michael K. Deep web. http://www.brightplanet.com/technology/deepweb.asp (Acceso: 15/11/2004)

• FROIDEVAUX MÜLLER, Jeanne: A Librarian's Guide to the Internet : Searching and evaluating information. Oxford: Chandos, 2003

• GIMÉNEZ TOLEDO, Elea. Manual de Documentación para comunicadores. Pamplona: Eunsa, 2004.

• VALLE GASTAMINZA, Félix del: Búsqueda y recuperación de información. http://www.ucm.es/info/multidoc/prof/fvalle/3dperiod.htm (Acceso: 15/11/2004)