130
UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO Taller de Buscadores 29 de Julio de 2008 Prof. Luis Joyanes Aguilar Catedrático de Informática

UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

Embed Size (px)

Citation preview

Page 1: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRIDFacultad de Informática

1

UNIVERSIDAD DE VERANO DE LA GOMERA - 2008

BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

Taller de Buscadores29 de Julio de 2008

Prof. Luis Joyanes Aguilar Catedrático de Informática

Page 2: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Buscadores vs Buscadores El Caso Google La Revolución de GMAIL ¿Cómo nos ven los

buscadores? Etiquetas de

Posicionamiento

ÍNDICE

Page 3: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICE

Búsqueda de Información. Clasificación de Herramientas. Directorios vs. Motores de Búsqueda. Estudio Práctico de Directorios. Elección del Motor de Búsqueda. Motores de Búsqueda Especializados. Funcionamiento de los motores de búsqueda. El directorio Público DMOZ. Otros Motores de Búsqueda Destacados.

BUSCADORES

Page 4: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Dispositivos móvilesTecnologías RFID...

Web SuperficialWeb InvisibleConocimiento Humano

UBICUIDAD DE LAS BÚSQUEDAS

Page 5: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

•Buscadores Contextuales

•Buscadores Sociales

•Buscadores que aprenden

....

“Poner al usuario al volante”

(Ramesh Jain)

PERSONALIZACIÓN

Page 6: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

•Acceso a través de •“Etiquetas semánticas”•Etiquetaje por parte de:

•Diseñadores (Web Semántica)•Editores (Blogs)•Usuarios (Folksonomies)

ETIQUETAJE SEMÁNTICO

Page 7: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICE

Índices o Directorios. Motores de Búsqueda.

Buscadores por categorías Buscadores por contenido Buscadores temáticos

Meta - Buscadores. Multibuscadores. Buscadores de Portal. FFA – Enlaces Gratuitos para todos. P2P

CLASIFICACIÓN DE HERRAMIENTAS

Page 8: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECLASIFICACIÓN DE HERRAMIENTAS (2)Buscadores por categorías Buscadores por contenido Buscadores temáticos

Definición Bases de datos de páginas Webestructuradas por categorías

BBDD que mantienen índices a páginas web

Guía jerárquica que va de los temas mas generales a los mas particulares

Funcionamiento Emplea un árbol jerárquico organizado por categorías en el que buscará la información

Un “programa” busca en la red todas aquellas referencias a la información solicitada

Iremos seleccionando por la estructura de temas y subtemas hasta llegar al que nos proporcione la información

Cuando son útiles Cuando tenemos clara la categoría de la informaciónCuando queremos encontrar poca información pero precisa

Cuando no se tiene clara la categoría de la informaciónCuando se quieren obtener un gran número de resultados

Cuando tenemos totalmente claro sobre que tema queremos obtener información

Ejemplos YahooLookSmart

AltavistaGoogle

OpositorCapitanesAnimeassault

Page 9: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECLASIFICACIÓN DE HERRAMIENTAS (3)

META-BUSCADORES Debe soportar, de acuerdo con los requerimientos de los

motores de búsqueda, diferentes formatos de consultas y de salidas. MetaCrawler como un claro ejemplo.

Con el objetivo de filtrar la información de salida, los meta-buscadores deben eliminar los resultados duplicados suministrados por los diferentes buscadores y de alguna forma también conseguir eliminar páginas “outdated” o desfasadas.

Basándose en los resultados obtenidos un meta-buscador debería ser capaz de post-procesar la información y realizar un nuevo ranking de los resultados de acuerdo con la búsqueda inicial que propuso el usuario.

Por último el meta-buscador debería, según estos autores, presentar una interfaz de usuario unificada que muestre los resultados de una forma clara y sencilla.

Page 10: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECLASIFICACIÓN DE HERRAMIENTAS (4) META-BUSCADORES II - Ejemplos

Metacrawler - www.metacrawler.com DogPile - Metabuscador de 13 motores de búsqueda, 6 Use2net y

2 buscadores FTP - www.dogpile.com SurfWax – Busca en los más importantes motores de búsqueda,

incluidos directorios públicos. www.surfwax.com All4one - Busca en 4 motores de búsqueda simultáneamente

www.all4one.com Ixquick - Busca en 14 motores de búsqueda simultáneamente

http://ixquick.com Mamma- Busca en más de 12 motores de búsqueda

simultáneamente www.mamma.com MetaBusca – Busca en 21 motores de búsqueda

www.metabusca.com Vivisimo – Busca en 5 buscadores ofreciendo un clúster de

resultados. http://vivisimo.com Grokker – Busca en 3 buscadores ofreciendo un clúster de

resultados. www.grokker.com

Page 11: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECLASIFICACIÓN DE HERRAMIENTAS (5)

MULTIBUSCADOR vs META-BUSCADOR Ejemplos Search – www.search.com 8C – www.8c.com

Page 12: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEDIRECTORIOS VS. MOTORES DE BÚSQUEDA Estudio Práctico de Directorios.

Métodos de Búsqueda de Información en Directorios. Cuadros de Diálogo donde introducir el texto.

Prueba 1: Obtener información acerca de coaching e inteligencia emocional a través de Yahoo.

Page 13: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEDIRECTORIOS VS. MOTORES DE BÚSQUEDA (2)

Prueba 2: Obtener información acerca de coaching e inteligencia emocional a través de Lycos

Page 14: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEDIRECTORIOS VS. MOTORES DE BÚSQUEDA (3)

Recorrer las Categorías que nos ofrece el Directorio. Prueba 3: Obtener información acerca de casas rurales en la

provincia de Cantabria a través de Yahoo mediante sus categorías

• Seleccionamos Deportes y Ocio.• Seleccionamos Turismo.• Seleccionamos Turismo Rural.• Seleccionamos Casas Rurales.• Seleccionamos Cantabria.

Page 15: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEDIRECTORIOS VS. MOTORES DE BÚSQUEDA (4) Estudio Práctico de Motores de Búsqueda.

Los motores de búsqueda están compuestos por tres pilares importantes:

El mecanismo que identifica las páginas web que serán introducidas en la base de datos del buscador.

Un mecanismo que indexe los sitios. Un mecanismo de búsqueda dotado de una interfaz lo

más sencilla posible. Prueba 4: Obtener información acerca de casas rurales en la

provincia de Cantabria a través de Altavista.

2190 Resultados – Altavista.

23 Resultados – Directorio Yahoo

Page 16: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEDIRECTORIOS VS. MOTORES DE BÚSQUEDA (5)

Directorios

Ventajas Inconvenientes

Cuando conocemos muy bien aquellos que queremos buscar, presentan una gran precisión

Si no tenemos muy claro aquello que queremos obtener nos podemos perder en la estructura jerárquica

Los comentarios que el índice añade junto con los enlaces nos proporcionan una información muy valiosa

No se puede acceder mediante ellos a páginas personales o que tengan muy poca relevancia

No incluyen en sus resultados información “basura”

Como el proceso de indexación de páginas es manual corren el riesgo de no estar muy actualizados

Si la información buscada no se encuentra en el directorio utilizará el motor que se encuentra por debajo para ofrecer siempre resultados

En muchas ocasiones el método de búsqueda por navegación se puede hacer lento y pesado

Page 17: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEDIRECTORIOS VS. MOTORES DE BÚSQUEDA (6)

Motores de búsqueda

Ventajas Inconvenientes

Manejan grandes bases de datos que nos permiten obtener una gran cantidad de información

Dependen de la forma de operación de su componente automática software para encontrar información

El método de obtención de información es extremadamente sencillo

La información es presentada sin tratamiento y muchas veces incluye muchos enlaces “basura”

Si queremos dar de alta una página simplemente daremos la dirección web de la misma, el software inteligente se encargara de visitarla e indexarla

El gran número de resultados que proporciona puede ser un problema y deberemos conocer como realizar de forma adecuada la consulta

Page 18: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECRITERIOS PARA SELECCIONAR EL MOTOR DE BÚSQUEDA

Calidad de Interfaz La interfaz es lo primero con lo que topamos al acceder a

un motor de búsqueda y para muchas personas es factor determinante a la hora de decantarse por un buscador o por otro. En la siguiente tabla podemos observar diferentes interfaces de buscadores. La calidad del interfaz no puede en ningún caso considerarse determinante para evaluar a un motor de búsqueda frente a otro

Page 19: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECRITERIOS PARA SELECCIONAR EL MOTOR DE BÚSQUEDA (2)

Número de resultados

En las pruebas realizadas nos hemos dado cuenta de que no por ofrecer un número inmenso de resultados estos serán mejores o más acertados. Por lo tanto a la hora de decantarnos por un buscador u otro evaluando el número de resultados, recomendamos elegir aquel que proporcione unos resultados que no sean tan numerosos como para no identificar cual de ellos es verdaderamente relevante ni tan escasos para no hallar la información buscada. Siempre intentaremos por lo tanto elegir aquel buscador que proporcione un número medio de resultados.

Page 20: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECRITERIOS PARA SELECCIONAR EL MOTOR DE BÚSQUEDA (3)

Exhaustividad

Un motor de búsqueda será mas exhaustivo que otro si referencia en su base de datos el mayor número de referencias a páginas web de Internet. Este criterio es de difícil apreciación por parte de un usuario medio y por lo tanto muy pocos de estos usuarios se decantaran por un buscador determinado teniendo este dato en cuenta.

Page 21: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECRITERIOS PARA SELECCIONAR EL MOTOR DE BÚSQUEDA (4)

Calidad del lenguaje de consulta

Este criterio indica lo flexible que puede llegar a ser el lenguaje mediante el cual el buscador consulta su base de datos. Cuanto más flexible sea el lenguaje más se podrá mejorar los resultados de nuestra búsqueda conociendo los operadores de los que dispone el motor. Para los usuarios avanzados este criterio si que puede ser importante a la hora de decantarse por un buscador u otro ya que si se conoce la forma de operar del mismo se pueden obtener resultados mucho más precisos, con la misma cadena de búsqueda, en un buscador que en otro.

Page 22: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECRITERIOS PARA SELECCIONAR EL MOTOR DE BÚSQUEDA (5)

Servicios adicionales ofrecidos Hoy en día muchas son las personas que buscan, con el

acceso a una sola url de Internet, obtener todos los servicios que necesitan. Con esta idea surgieron los portales y la mayoría de ellos ofrecían un buscador que junto con servicios de correo, disco virtual, noticias… querían cubrir todo el espacio de necesidades de un usuario. Es importante indicar que la mayoría de portales al incluir un servicio de búsqueda de información se fundamentan en el motor proporcionado por algunos de los buscadores más importantes de la red. Por lo tanto si lo que queremos es buscar información eficiente y de una forma rápida, en nuestra opinión, no debemos acudir a portales, más indicados para ofrecer a alguien que no dispone de mucho tiempo, una gran cantidad de servicios que en la mayoría de los casos no son de mucha calidad.

Page 23: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICECRITERIOS PARA SELECCIONAR EL MOTOR DE BÚSQUEDA (7)

Velocidad Para muchos usuarios sobre todo para los menos avezados

en la materia es el criterio que seleccionan a la hora de decantarse por un buscador. Nos referimos con velocidad al tiempo que un buscador tarda en ofrecernos el conjunto de resultados para una consulta determinada. Si bien este criterio depende en gran medida de la conexión de la que disponga el usuario, es cierto que algunos buscadores ofrecen sus resultados extremadamente deprisa. En nuestra opinión este hecho se debe precisamente a que estos buscadores indexan en sus bases de datos una información más bien escasa y nos ofrecerán pocos resultados en un tiempo muy reducido, si eso es lo que se busca serán una buena opción pero si pretendemos obtener un número elevado de resultados no nos debemos decantar por ellos.

Page 24: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

MOTORES DE BÚSQUEDA ESPECIALIZADOS

Buscador de Buscadores Especializados

Page 25: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEMOTORES DE BÚSQUEDA ESPECIALIZADOS (2)

Prueba 6: Búsqueda de imágenes en el buscador temático Ditto

Prueba 7: Búsqueda de información personal en el buscador temático SwitchBoard

Page 26: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEFUNCIONAMIENTO DE LOS MOTORES DE BÚSQUEDA

Page 27: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEEL DIRECTORIO PÚBLICO DMOZ

OPEN DIRECTORY PROJECT La meta de este proyecto es conseguir el directorio más

completo de la red gracias a la colaboración de lo que Dmoz denomina editores y puede organizar una pequeña parte de la web, filtrando los resultados incorrectos y obsoletos y ofreciendo de este modo una información actualizada..

Este proyecto surgió por la necesidad de aumentar el número de personas encargadas de “vigilar” la web y de tener actualizada la información de sus directorios y que mejor forma que proponer una comunidad en la que cualquier persona del mundo realice por muy pequeña que sea su aportación en esta causa.

Netscape Communication Corporation, administra y aloja la gran cantidad de información necesaria para llevar a cabo un proyecto de estas características.

Page 28: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEEL DIRECTORIO PÚBLICO DMOZ (1)

Datos Dmoz a fecha de 08/12/2007

Nº editores Categorías Paginas web

75.151 590,000 4.830.584

http://dmoz.org

Page 29: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (1)

Live - Microsoft www.live.com

Page 30: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (2)

Live Microsoft www.live.com

Page 31: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (3)

ASK www.ask.com

Page 32: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (4)

ASK – DICTIONARY SEARCH

Page 33: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (5)

CLUSTY – clusty.com

Buscador basado en Cluster Propiedad de Vivísimo

Page 34: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (6)

CLUSTY – clusty.com

Page 35: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (7)

A9 - AMAZON www.a9.com

Page 36: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (8)

A9 – AMAZON www.a9.com

Page 37: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (9)

Noxtrum www.noxtrum.com

Page 38: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (10)

Noxtrum www.noxtrum.com

Page 39: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (11)

MSDEWEY www.msdewey.com

Page 40: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (12)

MSDEWEY www.msdewey.com

Page 41: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (13)

TAFITI www.tafiti.com

Page 42: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (14)

TAFITI www.tafiti.com

Page 43: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (15)

SEARCH MASH http://seachcmash.com

Page 44: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (14)

SEARCH MASH http://searchmash.com

Page 45: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (17)

UNIVERSIA http://www.universia.net

Page 46: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

INDICEOTROS MOTORES DE BÚSQUEDA DESTACASDOS (18)

YubNub www.yubnub.org Ujiko www.ujiko.com Retrevo www.retrevo.com Talk Digger www.talkdigger.com Snap www.snap.com Inquisitor www.inquisitorx.com Alexa www.alexa.com PodZinger, Pluggd Powerset (Apuesta por el Lenguaje Natural)

Page 47: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Whathis //whathis.techtarget.com Wikipedia //www.wikipedia.com Webopedia //www.pcWebopedia.com Netlingo //netlingo.com/

framexindex.html Tech Enciclopedia

//www.techWeb.com/encyclopedia Glosario Internet

//www.ati.es/novatica/glointv2.html Vocabulario

//jamillan.com/v_index.htm

Contenedores de Información (1)

Page 48: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Encontrar comentarios en weblogs Essential Blogging

//www.oreilly.com/catalog/essblogging

Encontrar weblogs Movible Type //www.movabletype.org Radio Userland //radiouserland.com Blogger //www.blogger.com Radio Userland //radio.Weblogs.com

Contenedores de Información (2)

Page 49: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Blogger “powered by blogger” o bien site:blogspot.com

Blosxom “powered ny nlosxom”

Geeklog “powered by geeklog”

Technorati Site:technorati.com

MiWeblog Site:miweblog.net

Contenedores de Información (3)

Page 50: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

CASO

Page 51: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Por qué no se puede competir con Google (1) Una enorme infraestructura. La ventaja evidente de Google es su

gigantesca infraestructura, distribuida en más de 450.000 servidores de todo el mundo. Eso reduce los retrasos y permite un servicio más rápido (y mejor).

Productos con los que Google aprende. Conocer a los usuarios se traduce en una publicidad mejor dirigida. Los servicios avanzados de Google (como Google Reader, por ejemplo), proporcionan información sobre los usuarios de la que Google aprende.

Fibra óptica y estrategia móvil. Por un lado, Google está comprando fibra óptica para crear su propia red. Por otro, va poniendo los principios en la navegación por Internet desde teléfonos móviles.

Contactos. Google está conectado con los grandes del sector de las tecnologías y los grandes medios de comunicación. Por ejemplo, con Apple, CBS o Viacom.

Una marca omnipresente. Google es una de las marcas más famosas del mundo, e incluso ha sido reconocida en el Diccionario de Inglés de Oxford como verbo.

Page 52: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Por qué no se puede competir con Google (2) Acuerdos con distribuidores. Google tiene acuerdos con

los principales distribuidores para su software, como Dell, Mozilla, Adobe o DivX.

Una enorme cola de clientes base. Google le facilita la vida a mucha gente normal.

Alcance global. Además de tener casi 8.000 empleados repartidos por todo el mundo, Google trata de ajustarse a diferentes idiomas y culturas.

Empresas. Además del buscador que todos conocemos, Google también ofrece servicios de búsqueda para empresas.

El avión de Sergey y Larry, los fundadores de Google. Que es alucinante.

Page 53: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE: EL COMIENZO 1995 Primavera 1995: Sergey Brin (23 años entonces) y Larry Page

(24), confundadores de Google y actualmente presidente y CEO, se conocen en un acto que la Universidad de Stanford organiza para los candidatos de su Doctorado en Informática.

Otoño 1995: Larry y Sergey comienzan a trabajar en el 'Digital Library Project' de la Universidad de Stanford. Larry Page, con experiencia en diseño web y el título de Ingeniero Eléctrico, y Sergey Brin, un experto en tratamiento de datos y Licenciado en Informática y Ciencias Matemáticas, comienzan a crear un algoritmo para la búsqueda de datos. Esta tecnología se convertirá mas tarde en el corazón que hará funcionar a Google.

El nombre que Larry Page da a esta tecnologia fue 'PageRank'. En su pagina web personal de la Universidad de Stanford, colgará en 1997 una presentacion que lo explica: 'PageRank: Bringing Order to the Web'.

Page 54: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

1996

Enero 1996: Comienzan a desarrollar un buscador llamado 'BackRub'. Este nombre se lo dan debido a que la mayor habilidad de este motor de búsqueda es analizar los 'back links' (enlaces que apuntan a una determinada página).

Tal y como indican en su descripción, Backrub está escrito en Java y Python (incluso Larry Page postea alguna duda en los 'newsgroups'), y corre sobre varias máquinas Sun Ultra y Intel Pentium con Linux. La Base de Datos está alojada en un ordenador Sun Ultra II con 28GB de disco duro.

Si tienes cualquier duda sobre el funcionamiento de este buscador, y no está contestada en sus FAQ, puedes llamar al (415) 723-3154, y preguntar por Larry. Los primeros usuarios son los alumnos y profesores de Stanford, que disfrutan de la precisión con la que el buscador encuentra datos en la web.

Page 55: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

1997 1997: 'Backrub' se transforma en 'Google'. Le otorgan este

peculiar nombre por su parecido a la palabra 'googol', que en inglés es el nombre que que se da a la cifra '10 elevado a 100' (un uno seguido de 100 ceros). Ya tienen indexadas 24 millones de páginas. Mucho antes, ya han tenido problemas de capacidad en sus discos duros, y han tenido que idear ingenios basados en Lego.

En los comienzos de Google (en el dominio google.stanford.edu), su diseño es aún más austero de lo que será posteriormente. En esta antigua versión se incluyen fotografías de los equipos que utilizan.

1997: Larry y Sergey han registrado el dominio 'google.com'. Además, han dado a conocer su tecnología a la 'Office of Technology Licensing' (OTL) de la Universidad de Stanford, que será la encargada de contactar con diferentes compañías de Internet que puedan estar interesadas en Google.

Page 56: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

•1998: Google es un proyecto universitario

•Se ofrece por 1,6M$, Excite ofrece 0,75M$

2004: Google sale a Bolsa

Google vale unos 130.000M$ casi del doble que Telefónica

(24-04-2006)

•Anuncios textuales (Enero 2000)•AdWords (Octubre 2000)

•Subasta palabras clave y pago por click (2002)•Servicios especializados (a partir de 2003)

Evolución en el tiempo

Page 57: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE

Para buscar y encontrar en Internet normalmente sólo se necesita el buscador Google. Ventajas: Dispone de un sistema sencillo de búsqueda pero muy potente. Busca no sólo las páginas principales sino dentro de todas las

páginas de millones de webs.

“Si no está en Google no está en Internet” Ordena los resultados por importancia. Basándose en el principio

de que las páginas más referenciadas son las mejores Presenta en primer lugar las páginas que mejor pueden

responder a la búsqueda del usuario.

Page 58: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORIMO DE BÚSQUEDA (0) PageRank: Algoritmo de búsqueda utilizado por

Google hasta ahora. Su finalidad es asignar un valor numérico a las

páginas web según el número de veces que otras las recomiendan y según el PageRank que estas tienen a su vez.

Lógica: si una página web enlaza con otra página, es que la está recomendando, y si la recomienda, es que debe ser importante en el ámbito del tema que trata la primera página web. Una recomendación que proviene de una página que a su vez está muy recomendada vale más que una recomendación que provenga de una página que casi nadie recomienda.

Page 59: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Complejidad

Ecuación de 500 millones de

variables y más de 3.000

millones de términos

ValoraciónLas páginas importantes reciben

una valoración superior con

PageRank y aparecen en una

posición más alta dentro de los

resultados

Inteligencia colectiva

Utiliza la amplia estructura de vínculos

de la Web como herramienta

organizativa

Red social

No utiliza editores, ni a sus

empleados, para juzgar la

importancia de una página.

Todo es obra de los usuarios

de Internet

PageRankUn vínculo de A a B es un "voto" de A a B. La importancia de una página depende de los "votos" que recibidos, pero Google también analiza las

páginas que emiten los votos. Los votos emitidos por páginas que son en sí mismas "importantes" tienen más peso y ayudan a su vez a hacer que

otras páginas sean importantes

GOOGLE – ALGORITMO DE BÚSQUEDA (1)

Page 60: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (2) Transmisión del Pagerank

El valor del PageRank que observamos si tenemos instalada la barra de Google es un valor comprendido entre 0 y 10. Pero en realidad, el PageRank es un valor numérico mucho más alto, calculado en función de los enlaces que reciben nuestras páginas.

El valor real suele ser del orden de miles de unidades. Sin embargo, Google coge su valor logarítmico para hacerlo visible a los usuarios. La base de este logaritmo es desconocida.

Por ejemplo, para una base 7, tendríamos los siguientes valores:

Page 61: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (3)

Si una página tiene un PageRank real -por ejemplo- de 500000, ¿qué valor le trasmitiría a otra a la cual enlaza?.

PR Barra PR Real0 0 - 31 O3-192 19 - 1303 130 - 9074 907 - 63515 6351 - 444586 44458 - 3112097 311209 - 21784668 2178466 - 152492629 15249262 - 106765607

10 > 106765607

Page 62: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (4) La respuesta a esta pregunta se contesta en el ya famoso texto de

Sergey Brin y Larry Page (fundadores de Google), llamado 'The Anatomy of a Large-Scale Hypertextual Web Search Engine'.

En él, planteaban la siguiente fórmula para calcular el PageRank de una página web llamada 'A':

PR(A) = (1-d) + d * [ PR(T1)/C(T1) + ... + PR(Tn)/C(Tn) ]

Donde: 'd' es el factor de atenuación. Un valor podría ser 0,85 'Ti' es cada página que enlaza a 'A'. 'i' toma los valores 1, 2, ... hasta

'N' 'N' es el número de páginas que enlazan a 'A'. 'PR(Ti)' es el PageRank de cada una de las páginas que enlazan a 'A'. 'C(Ti)' es el número de enlaces que salen desde cada página 'Ti'.

Page 63: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (5) Por lo tanto, nuestra página de 500000 de PageRank

transmitirá a otra en caso de tener un único enlace, un valor de 0,85*500000 = 425000. Generalmente las páginas poseen más de un enlace dentro de ellas, así que este valor habría que dividirlo entre el número de enlaces.

Como se puede comprobar, el valor del PageRank de cada página no es constante en el tiempo, ya que depende de los enlaces que vayamos recibiendo y, a su vez, del PR de las páginas que nos enlazan.

Por ello, una vez al mes aproximadamente, Google recalcula el valor de este PageRank en lo que viene a llamar la 'Google Dance'.

Page 64: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (6)

Page 65: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (7) Google desea que en las primeras posiciones de los

resultados de búsqueda encontremos páginas de cierta relevancia y que estén siendo recomendadas por otras páginas que a su vez también tengan relevancia.

Para determinar el PageRank, Google analiza el número de enlaces que provienen de otras páginas web y su PageRank.

Problemas: SPAM a Buscadores. Los Webmasters crean miles de páginas con el único propósito de enlazar con sus páginas principales y con esto hacer subir su PageRank en el caso de Google.

Page 66: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (8) ETIQUETA <NOSCRIPT>, ayuda a este objetivo. Permite incluir texto dentro del código fuente de

nuestra web que no será publicado por el navegador. Su uso es penalizado por el buscador Google, ya que

permite incluir referencias ocultas a otras webs dentro de nuestra página, aumentando así la probabilidad de mejorar su posicionamiento.

Ejemplo a estudiar: http://www.webpositer.com/ Ver su código fuente y observar el contenido de la etiqueta

<noscript>. Esto facilita la creación de granjas de enlaces

Page 67: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (9) Solución proporcionada por Google, nuevo algoritmo

de búsqueda Trust Rank. El algoritmo Trust Rank, parte de la misma base, que

el anterior, pero en lugar de valorar la importancia de una recomendación en función del PageRank de la página que recomienda, lo hace a partir de una serie de páginas web que han sido consideradas importantes por humanos en lugar de por algoritmos.

A las páginas web que los humanos han determinado como importantes se las considera "web semilla" y a sus enlaces se les asigna un valor. Y será ese valor el que se irá transmitiendo por toda la red.

Page 68: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (10) Ejemplo: Supongamos que disponemos de una web

semilla A. A trasmitirá un valor de 100 Trust Rank a todas las webs a las que enlace. Estas páginas, a su vez, transmitirán un Trust Rank de 99 a todas las webs a las que enlacen. Y éstas últimas, transmitirán un Trust Rank de 98 a las que ellas enlacen.

Para mitigar la degradación del Trust Rank a medida que se distancia de las webs semilla, en el algoritmo se ha incluido un corrector que tiene en cuenta el número de grados que hay entre la web semilla y la web que recibe el Trust Rank, sin anular completamente la distancia que las separa de la semilla.

Page 69: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (11) De la misma manera que las webs semilla van a

transmitir Trust Rank, las webs consideradas spam por los humanos que evalúan las webs, van a transmitir Trust Rank negativo. Según este documento ciertas webs van a restar Trust Rank y cuando una página web sitúe su nivel de Trust Rank por debajo de una determinada cifra, va a convertirse automáticamente en una web que transmite Trust Rank negativo en lugar de positivo.

La idea del Trust Rank parece buena, pero hay ciertas cuestiones que deben tenerse en cuenta.

Page 70: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLE – ALGORITMO DE BÚSQUEDA (12) ¿Quiénes van a ser las Web Semilla?

A este respecto hay discrepancias El documento de Stanford habla de un algoritmo que determinará las webs que pueden ser semilla. En ciertos foros especializados en posicionamiento en buscadores se afirma que serán las webs gubernamentales y de universidades las que empezarán a transmitir el Trust Rank semilla, y en otros foros se afirma que Google hace meses que está contratando gente de todos los países para que evalúen de forma manual las webs más representativas de su país. Esta última posibilidad parece la más plausible, ya que hay indicios de que efectivamente, Google ha contratado evaluadores de webs.

¿Se realizará Spam a la inversa? Manipulación de páginas web positivas enlazadas con

aquellas que transfieren Trust Rank negativo.

Page 71: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLEBOT (0)

Googlebot es el robot que utiliza Google para 'rastrear' los sitios de Internet. No solamente indexa páginas web (HTML), sino que también extrae información de ficheros PDF, PS, XLS, DOC y algunos otros más.

La frecuencia con la que Googlebot accede a un sitio web depende de PageRank de éste. Cuanto mayor sea este valor, el robot accederá más asiduamente a sus páginas.

Por ejemplo, podemos comprobar que los sitios con PR10 (el valor más alto) como yahoo.com o usatoday.com, han sido 'rastreados' por Googlebot ayer o incluso hoy mismo, mientras que otros han sido accedidos hace varias semanas. Esto se puede comprobar accediendo a la 'cache' de esta página.

Page 72: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLEBOT (1)

Para comprobar si Googlebot ha accedido a nuestro sitio web, deberemos echar un vistazo a los logs de nuestro servidor. En ellos, deberemos observar si hay registros de accesos en los que aparezca 'googlebot‘ Generalmente aparecerá el nombre del servidor, el cual podrá ser alguno de estos:

SERVIDOR DI RECCION I Pcrawl1.googlebot.com 216.239.46.20crawl2.googlebot.com 216.239.46.39crawl3.googlebot.com 216.239.46.61crawl4.googlebot.com 216.239.46.82

… …crawl9.googlebot.com 216.239.46.234

crawler1.googlebot.com 64.68.86.9crawler2.googlebot.com 64.68.86.55

… …crawler14.googlebot.com 64.68.82.138

Page 73: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GOOGLEBOT (2) Googlebot intentará acceder, como hacen la mayoría de los

robots de los motores de búsqueda, al fichero 'robots.txt'. En este archivo se deberán indicar las zonas de nuestro sitio web donde no queremos que entre ni Googlebot ni el resto de los buscadores. Para conocer más sobre 'robots.txt‘ existe un magnífico recurso: www.robotstxt.org.

Una vez que Googlebot haya 'rastreado' nuestra página, seguirá los enlaces que en ella encuentre (los HREF y los SRC).

Por lo tanto, si quieres que Googlebot indexe tu página web, solamente es necesario que algún otro sitio tenga un hiperenlace al tuyo. Si no es así siempre puedes añadir directamente tu URL.

Además de este robot GoogleBot, existe otro, llamado FreshBot que 'rastrea' con mayor frecuencia los sitios webs con las noticias 'más frescas'.

Page 74: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Mil y un Googles en un mismo Google

Google esconde un sinfín de aplicaciones, herramientas y servicios. Y un día sí y otro también compra una empresa para meter el pie el algún pingüe negocio.

Buscador de Imágenes. Buscador de Vídeos. Directorio. News de 4500 fuentes con 700 en español. Compras Traductor. Escolar, para búsquedas académicas. Búsqueda dentro de los libros de universidades académicas. Mapas, Planos, Carreteras, etc. Respuestas a Preguntas desde SMS Respuestas a Preguntas por Académicos. Hasta tienda de artículos de propaganda

Page 75: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Otros Servicios de Google I Compras – froogle.google.com Traductor – translate.google.com Académico – scholar.google.com Librería – print.google.com Mapas – maps.google.com Videos – video.google.com SMS – sms.google.com Expertos – answer.google.com Laboratorios – labs.google.com Store – www.googlestore.com Noticias Email – Google Alerts Servicio de Mensajería – www.google.com/talk Google Notebook Google Accesible - http://labs.google.com/accessible/ Google Transit - http://www.google.com/transit Google Reader – http://www.google.com/reader Google CodeSearch - http://www.google.com/codesearch Google Finance – http://finance.google.com Google Base – http://base.google.com/base

Page 76: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Otros Servicios de Google II Grupos - groups.google.com Directorio – directory.google.com Catálogos catalogs.google.com Histórico de Búsquedas – www.google.com/searchhistory API de Google: code.google.com Home Personal de Google – www.google.com/ig Google Web Accelerator - webaccelerator.google.com Google Ride Finder - labs.google.com/ridefinder Google Suggest - http://www.google.com/webhp?complete=1&hl=en Google Compute - http://toolbar.google.com/dc/offerdc.html Google Sets - http://labs.google.com/sets Calculadora y Definiciones de Google Google y Mozilla Firefox (Prefecht) Google Earth – http://earth.google.com Documentos con Google http://docs.google.com Google Mars. http://www.google.com/mars/ Google Related Links. http://www.google.com/relatedlinks/ Google Trends. http://www.google.com/trends Google Analitycs. http://www.google.com/analytics Google Sitemaps – http://www.google.com/webmasters/sitemaps

Page 77: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Otros Servicios de Google III Búsqueda Vocal. http://labs.google.com/goog411/ Búsqueda Experimental. http://www.google.com/experimental/

Page 78: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Búsqueda de Información (1)

Para ingresar una consulta en Google, simplemente tipee algunas palabras descriptivas y presione la tecla "Intro" (o haga clic en el botón de búsqueda en Google) para ver la lista de resultados relevantes.

Google usa sofisticadas técnicas de búsqueda de texto que encuentran páginas que son importantes y relevantes para su búsqueda. Por ejemplo, cuando Google analiza una página, comprueba el contenido de las páginas vinculadas con esa página. Google también prefiere las páginas en las que los términos buscados están cerca unos de otros.

Page 79: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Página PrincipalBúsqueda AvanzadaPreferenciasHerramientas del idiomaImágenesGruposDirectoriosNews…

Búsqueda de Información (2)

Page 80: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Búsqueda avanzada Palabras de la consulta Idioma Formato de archivo Fecha Presencia Dominios Búsqueda segura Propiedades adicionales de Google

Búsqueda de Información (3)

Page 81: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Revisión Ortográfica: Céser, Tombona Las Palmas de Gran Canaria filetype:ppt Búsqueda en sitios: site: msn.com Búsquedas relativas: related:google.es Búsqueda de frases :Ser o no ser, “Ser o no ser” Booleanos básicos:

Predeterminado “Y” OR: Agaete OR Galdas OR El Dedo de Dios, Agaete (Telde OR

Maspalomas)

Negación Inclusión explícita Comodines

Búsqueda de Información (4)

Page 82: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Sintaxis especial Allintitle: Muestra las páginas que tienen todas las palabras especificadas

en su título. allintitle: palabra1 palabra2 Devuelve las páginas que tienen palabra1 y palabra2 en su título

Allintext: Páginas que tengan todas las claves especificadas dentro de su body

Allinanchor: Páginas que tengan en el texto que las apuntan, las palabras especificadas.

Allinurl: Muestra todas las páginas indexadas de un dominio indicado, o bien, las páginas que tienen todas las palabras especificadas en su url. Su sintaxis es: allinurl:www.dominio.com

Site: site:loc.gov site:edu site:ya.com Inurl: Busca la palabra que le especifiquemos en la url. Intitle: Busca la palabra que le especifiquemos en el título, pero no es

necesario que todas estén en el título. Por ejemplo intile:clave1 clave2 Busca clave1 en la url.

Link: Lista todos los enlaces, que teniendo page rank 4 o más, apuntan a nuestra página. Su uso es sencillo: link:www.direccion.com

Info:Nos muestra información sobre la página principal de un dominio especificado. info:www.dominio.com

Daterange: Fechas Julianas http://www.24hourtranslations.co.uk/dates.htm

Búsqueda de Información (5)

Page 83: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Filetype: Busca un tipo de documento especificado, por ejemplo: filetype:doc clave Busca ficheros '.doc' relacionados con 'clave'.

Related:Según google nos muestra sitios relacionados con la dirección que le especifiquemos, los resultados más que malos, son nulos. No merece la pena usarlo.

Stocks:Nos lleva a Yahoo Finance y nos muestra información de tipo financiero relacionada con la marca que le indiquemos.

Define: Este es el comando más reciente; busca la definición de una palabra indicada. Uso: define:mouth.

Calculadora: Calculadora Científica y de números romanos. Combinar la sintaxis

Como no se debe mezclar la sintaxis Como combinar la sintaxis Los elementos de sintaxis antisociales Todas las posibilidades

Búsqueda de Información (6)

Page 84: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

El directorio Google proporciona un método extremadamente útil que permite acotar la búsqueda basándose en un tema determinado. Por ejemplo, si busca "saturno" en la categoría Ciencia > Astronomía del directorio Google, encontrará páginas solamente acerca del planeta Saturno. No muestra páginas del auto Saturno, del sistema de juegos Saturno ni de cualquier otro significado del término.

Buscar dentro de una categoría de interés permite rápidamente acotar la búsqueda a las páginas que son relevantes para el usuario.

Búsqueda de Información (7)

Page 85: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Búsqueda de Información (8)

Consultas automáticas que incluyen "and" Google sólo le muestra aquellas páginas que

incluyen todos los términos de la búsqueda. No es necesario incluir "and" entre sus términos. Para acotar la búsqueda un poco más, agregue más términos.

Buscar: PERROS AND GATOS Buscar: PERROS GATOS

Page 86: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Búsqueda de Información (9)

Google ignora las palabras y caracteres comunes, conocidos como términos superfluos. Google automáticamente descarta términos como "http" y ".com,", así como ciertos dígitos o letras, porque raramente estos términos ayudan a acotar la búsqueda y pueden demorarla en forma significativa.

Use el signo "+" para incluir términos superfluos en su búsqueda. Asegúrese de incluir un espacio antes del signo "+".

Buscar: googlemania +comBuscar: googlemania com

Page 87: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Cada resultado de búsqueda Google contiene uno o más fragmentos de la página web que le muestra como sus términos se usan en el contexto de esa página.

Si buscamos "coches", parecerían resultados como: Volver al Inicio de Coches. Coches Nuevos. ...

Búsqueda de Información (10)

Page 88: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Para proporcionarle los resultados más exactos, Google no usa "búsquedas parciales" ni realiza búsquedas con "comodines". En otras palabras, Google busca exactamente los términos que ingresa en la casilla de búsqueda. Buscar "sal" o "sal*" no devolverá búsquedas que contengan "salero" o "salamandra". Si tiene dudas, pruebe varias formas distintas: "calle" y "calles", por ejemplo.

Buscar: calleBuscar: calle*

Búsqueda de Información (11)

Page 89: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Búsqueda de Información (12) Las búsquedas Google no distinguen entre mayúsculas

y minúsculas. Todas las letras, independientemente de como estén escritas, se consideran minúsculas.

Buscar: google, GoOgLe, GOOGLE. Las búsquedas Google en español en forma

predeterminada no distinguen los acentos diacríticos, diéresis ni la letra eñe.

Buscar: MartínBuscar: Martin

Si desea distinguir estas dos palabras, use el signo +. Buscar: caña Buscar: +caña

Page 90: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Puede excluir una palabra de la búsqueda colocando un signo menos ("-") inmediatamente antes del término que quiere excluir. (Asegúrese de dejar un espacio antes del signo menos.)

Buscar: radio onlineBuscar: radio -online

Búsqueda de Información (13)

Page 91: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Búsqueda de Información (14)

Google permite buscar frases agregando comillas. Las palabras entre comillas dobles ("como esto") aparecerán juntas en todos los documentos encontrados (a menos que sean palabras superfluas, palabras especiales que requieren un signo "+"). La búsqueda de frases mediante comillas es útil para buscar dichos populares o nombres específicos.

Ciertos caracteres sirven como conectores de frases. Google reconoce guiones, barras oblicuas, puntos, signos igual y apóstrofes como conectores de frases.

Buscar: Puerta de AlcaláBuscar: "Puerta de Alcalá"

Page 92: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Búsqueda de Información (15)

Algunas palabras, cuando se anexan con dos puntos, tienen un significado especial para Google. Una de esas palabras es el operador "site:". Para buscar en un sitio o dominio específico, use la sintaxis "site:ejemplodedominio.com" en la casilla de búsqueda Google.

Por ejemplo, para encontrar información de artículos en el sitio Google, ingrese:

Buscar: artículos site:www.google.com

Page 93: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Google permite realizar búsquedas, en las que podemos encontrar una determinada palabra u otra. Para ello usaremos "OR" ó "|".

Por ejemplo, para buscar páginas en los que aparezca 'tienda' y 'bolígrafos', o bien 'tienda' y 'lápices'.

Buscar: tienda (bolígrafos OR lápices)Buscar: tienda (bolígrafos | lápices)

Búsqueda de Información (16)

Page 94: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Búsqueda de Información (17)

Si buscamos una Frase Exacta, pero, queremos incluir palabras entre nuestra búsqueda, Google permite el uso de unos comodines.

Por ejemplo, si buscamos frases tipo "los tres días", "los tristes días", "los tristes oscuros días"...

Buscar: "los * días“ Buscar: "los * * días"

Page 95: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Búsqueda de Información (18)

Puesto que Google sólo encuentra las páginas web que contienen todas las palabras de la consulta, para acotar la búsqueda basta con agregar más palabras a los términos de búsqueda que ya ha ingresado. Al agregar más palabras, los resultados contendrán un subconjunto específico de las páginas devueltas por la consulta inicial que era "demasiado amplia".

Page 96: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Voy a Tener Suerte™...

Aquí te presentamos una lista (con la web original "por si acaso") de las búsquedas en las que Voy a Tener Suerte™...

I'm Feeling Lucky™: worst president I'm Feeling Lucky™: bastards I'm Feeling Lucky™: exit I'm Feeling Lucky™: under 18 I'm Feeling Lucky™: leave now Voy a Tener Suerte™: ladrones I'm Feeling Lucky™: failure I'm Feeling Lucky™: great president I'm Feeling Lucky™: out of touch executives I'm Feeling Lucky™: miserable failure

Page 97: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

HERRAMIENTAS GOOGLE

Google ToolBar – El cajetín de búsqueda se integra en el Navegador.

Google Talk – Servicio de mensajería instantánea. Google DeskBar – El cajetín de búsqueda se

integra en el escritorio. Google Desktop Search – El motor de Búsqueda

Aplicado a tu PC. Mini Base de Datos de tu PC. Búsquedas Instantáneas del Contenido que tienes y has

tenido. Resultados con Formato Google. Múltiples tipos de archivos clasificados por formatos:

Outlook, Excel, PowerPoint, Internet Explorer, Pdf, Música, Imágenes, Vídeo, Netscape, Firefox, Mozilla, etc.

Page 98: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

PUBLICIDAD CON GOOGLE (1)

ADWORDS: Con AdWords de Google podrá llegar a los usuarios en el preciso momento en que estos busquen ciertos productos o servicios. De esta manera, obtendrá visitantes y clientes segmentados. El sistema de precios de coste por clic implica que sólo se pagará cuando los usuarios hagan clic en su anuncio. De esta manera, se podrán controlar los costes con facilidad.

Page 99: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

PUBLICIDAD CON GOOGLE (2)

ADSENSE: AdSense™ de Google publica automáticamente anuncios de texto y anuncios gráficos orientados de forma precisa en función de su sitio y el contenido de éste. La incorporación de AdSense para búsqueda a su sitio, también publicará anuncios orientados en las páginas de resultados de la búsqueda.

Page 100: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

En Resumen… BUSCADORES: Buscador web - Buscador de imágenes - Buscador de

blogs - Google News - Google Video - Buscador de libros - Google Local - Google Groups - Google Scholar - Google Answers - Buscador de catálogos - Google Maps - Froogle - Google Base - Directorio Google - Google Finance - Google para móviles, Google Voice Local Search…

APLICACIONES: Picasa - Google Toolbar - Google Desktop - Google Earth - Google Deskbar - Google Talk.

PUBLICIDAD: AdWords – AdSense. UTILIDADES: Gmail - Google Calendar - Traductor - Google Reader -

Google Alerts - Orkut - Dodgeball - Web Accelerator - Página de inicio personalizada - Búsquedas personalizadas – Documentos Google – SketchUp

SISTEMAS OPERATIVOS: Google Phone - Android SERVICIOS PARA WEBMASTERS: Analytics – SiteMaps. MÁS: Google Search Appliance - Tienda Google - Google Code -

Laboratorio de Google.

Page 101: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Curiosidades Google

PigeonRank ™: http://www.google.com/technology/pigeonrank.html

Huevos de Pascua: http://www.google.com/Easter/feature_easter.html

Archivo Histórico de Búsqueda: http://www.google.com/press/zeitgeist/archive.html

Tienes registrados dominios como: 466453.com, gogle.com, googel.com, ggoogle.com o gogole.com.

Tiene un curioso mirror: elgooG http://www.alltooflat.com/geeky/elgoog/

Google Fight: http://www.googlefight.com/

Page 102: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Buscadores y motores de búsqueda

La Revolución de GMAIL

Page 103: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

LA REVOLUCION DE GMAIL

Primera Visita a GMail ¿Qué nos encontramos la primera vez que

entramos en GMail? Si todavía no tienes tu cuenta, o acabas de conseguir una, aquí te explicaremos que es lo que te vas a encontrar y cómo conseguir el máximo partido de tu nueva cuenta de GMail.

Lo primero que nos encontramos al llegar es un correo del GMail Team. Aunque hay varias zonas de la pantalla que has de tener en cuenta, porque te serán básicas para sacarle todo el partido a tu cuenta.

Arriba del todo tienes una lista de opciones juntamente a tu cuenta de correo:

Page 104: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

¿Qué significa cada una de las opciones? [email protected]: Es tu cuenta de correo... aunque no la

única... más adelante sabrás porqué :) Report bug: GMail está en fase Beta y por tanto, si encuentras un

error en el sistema, has de enviárselo a Google para que lo revise y lo solucione.

Contacts: es la Libreta de Direcciones de GMail. Cada vez que contestes un correo, se añadirá la cuenta a la lista.

Settings: Te permiten configurar tu cuenta de GMail. Más adelante explicaremos cómo configurar correctamente y que es cada opción.

Help: La ayuda de GMail Sign Out: Antes de cerrar el navegador, si ya has acabado,

desconecta de GMail (por seguridad). Lo siguiente que encuentras, es el buscador de GMail. Aquí, a parte

de buscar entre tus correos, puedes buscar por Internet como si de una búsqueda de Google se tratara

LA REVOLUCION DE GMAIL (2)

Page 105: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GMAIL: CORREO INTELIGENTE

A parte de las búsquedas tradicionales que se pueden realizar para buscar algún texto en los mensajes, GMail nos ofrece unas búsquedas específicas para el correo.

Mensajes DE - from: Nos permitirá buscar por quién nos ha enviado el mensaje.

Por ejemplo: from:Juan nos mostraría todos los mensajes de Juan.

También podemos ampliar la búsqueda por correo. Por ejemplo: from:[email protected] donde nos mostraría los mensajes recibidos desde esa cuenta.

Podemos hacer búsquedas también del tipo: from:*@gmail.com, from:juan@* o from:*.*.com.

Page 106: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Mensajes PARA - to: Funciona exactamente igual que el from: pero esta vez

nos permitirá buscar en las direcciones de llegada.

Copia ó Copia Oculta - cc: ó bcc: Funciona exactamente igual que el from: pero esta vez

nos permitirá buscar en las direcciones de copia y copia oculta.

Asunto del Mensaje - subject: Si queremos buscar algún mensaje o algun texto en el

asunto de un mensaje... Por ejemplo: subject:cena, por ejemplo, para buscar mensajes que lleven la cena en el asunto.

GMAIL: CORREO INTELIGENTE (2)

Page 107: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas de Clasificación - label: Si queremos buscar únicamente entre alguna de las

etiquetas que hemos creado, labels, podremos hacerlo por ejemplo: label:trabajo, nos buscaría todos los mensajes que tengamos con la etiqueta trabajo.

Con adjuntos - has:attachment Para encontrar mensajes con adjuntos, simplemente

haremos búsquedas e indicaremos has:attachment

Fichero adjunto - filename: Si buscamos algú fichero adjunto en concreto entre todos

nuestros mensajes, lo podremos hacer indicándolo así: filename:factura.xls si buscásemos el fichero factura.xls.

GMAIL: CORREO INTELIGENTE (3)

Page 108: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

En una carpeta - in:anywhere ó in:inbox ó in:trash ó in:spam GMail agrupa por defecto los mensajes en unas carpetas... si

queremos buscar algún mensaje en una carpeta podremos hacerlo mediante estos comandos.

Tenemos mensajes en cualquier carpeta (anywhere), en la bandeja de entrada (inbox), en la papelera (trash) o en la carpeta de correo no deseado (spam).

Estado del mensaje - is:starred ó is:unread ó is:read También podemos buscar entre mensajes que estén marcados para

seguimiento (starred), no leidos (unread) o leidos (read). Antes o Después de una fecha - before: ó after: Podemos indicar en la búsqueda los rangos de fechas entre los que

buscar. Si queremos buscar mensajes entre dos fechas, lo haremos indicando: after:2003/12/15 before:2004/1/15 y nos mostraría los mensajes entre el 15 de diciembre de 2003 y el 15 de enero de 2004.

GMAIL: CORREO INTELIGENTE (4)

Page 109: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GMAIL: ALMACENAMIENTO Con todo el lio que se armo con GMail y su giga de espacio gratuito, era de

esperar q al poco tiempo sucedieran estas cosas.. un tipo se creo un driver para montar tu cuenta de GMail, como si fuera una unidad virtual de tu PC, por lo tanto podes usar el espacio de esa cuenta, como si fuera otro disco rigido.

Si, como leyeron, primero, apareció una versión para Linux y poco después, apareció la versión para Windows.

Instalando este driver, nuestra cuenta de GMail para a ser una especie de disco rígido remoto, en el cual podemos almacenar todo tipo de archivos, hasta llenar el Giga de espacio que GMail nos da. Esto quiere decir que si vamos a 'Mi PC', nos vamos a encontrar con una nueva unidad, en la cual vamos a poder copiar, pegar, crear y eliminar tanto carpetas como archivos, usar drag'n'drop para todas esas operaciones, ver propiedades de los archivos, etc, como hacemos normalmente con cualquier disco.Cuando copiamos un archivo a este disco, lo que en verdad hace es enviar un mail a nuestra cuenta, con el archivo que subimos como adjunto a un mail. Por lo tanto si entras a tu cuenta de Gmail, como haces normalmente, vas a ver todos los archivos que copiaste en tu disco virtual, como mails con archivos adjuntos. Por otro lado, periódicamente el GmailFS chequea la cuenta para ver si se agrego algo nuevo, y automáticamente actualiza toda la estructura de archivos y carpetas.Bueno, para el que quiera probarlo:GmailFS for Linux

Gmail Drive for Windows

Page 110: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

GMail Drive shell extension GMail Drive is a Shell Namespace

Extension that creates a virtual filesystem around your Google GMail account, allowing you to use GMail as a storage medium.

GMail Drive creates a virtual filesystem on top of your Google GMail account and enables you to save and retrieve files stored on your GMail account directly from inside Windows Explorer. GMail Drive literally adds a new drive to your computer under the My Computer folder, where you can create new folders, copy and drag'n'drop files to.

GMAIL: ALMACENAMIENTO (2)

Page 111: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas META

Buscadores y Motores de Búsqueda

Page 112: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas META - Definición

Informan a los Motores de Búsqueda cómo deben tratar la página web para la indexación en sus bases de datos, que contenido tiene y de que tipo.

Envían una serie de cabeceras HTTP al navegador del usuario con el fin de mejorar el rendimiento de la página.

Son el medio de que disponemos para dar a conocer nuestra página y nuestro sitio web al mundo exterior

Estas etiquetas se deben situar dentro de la cabecera de nuestras páginas, normalmente entre la etiqueta </TITLE> y la etiqueta </HEAD>

Page 113: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas META – Tipos

Existen dos tipos de etiquetas META:

HTTP-EQUIV: Enviadas por como cabeceras HTTP independientes cuando la página es enviada por un servidor.

NAME: Suministran información adicional de nuestra página web, bien para aquella que vea el código fuente o para que los motores de búsqueda indexen nuestra página.

Page 114: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas META – HTTP-EQUIV <META HTTP-EQUIV="expires" CONTENT="fecha de caducidad de la página"> <META HTTP-EQUIV="pragma" CONTENT="no-cache"> <META HTTP-EQUIV="Refresh" CONTENT="URL=dirección_web"> <META HTTP-EQUIV="Set-Cookie" CONTENT="cookievalue=val; expires=fecha; path=ruta"> <META HTTP-EQUIV="Content-Type" CONTENT="tipo; charset=juego de carcateres"> <META HTTP-EQUIV="Content-Script-Type" CONTENT="text/javascript"> <META HTTP-EQUIV="Content-Style_Type" CONTENT="text/css"> <META HTTP-EQUIV="Content-Language" CONTENT="idioma-variante"> <META HTTP-EQUIV="Window-target" CONTENT="target"> <META HTTP-EQUIV="Ext-cache“ CONTENT="name=/ruta_carp/fich.ext; instruction=""> <META HTTP-EQUIV="Cache-Control" CONTENT="Public,Private,…"> <META HTTP-EQUIV="Vary" CONTENT="Content-language"> <META HTTP-EQUIV="Page-Enter" CONTENT="RevealTrans (Duration=4, Transition=15"> <META HTTP-EQUIV="Page-Exit" CONTENT= "RevealTrans(Duration=4,Transition=15"> <META HTTP-EQUIV="Site-Enter" CONTENT= "RevealTrans(Duration=4,Transition=15">  <META HTTP-EQUIV="Site-Exit" CONTENT="RevealTrans (Duration=4, Transition=15"> <META HTTP-EQUIV=“Pics" CONTENT='(PICS-1.1 "http://www.p.org/ratingsv1.1"(SS 000 1)'>

Page 115: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas META – NAME (i) Etiqueta "description“: Indica una breve descripción de la página.

<META NAME="description" CONTENT="HTMLWeb, diseño web, manuales de HTML, DHTML, JavasCript y articulos sobre diseño grafico y programacion web en general">

Etiqueta “keywords“: Indica frases o palabras clave de nuestra página.

<META NAME="keywords" CONTENT="HTMLWeb, HTML, DHTML, JavaScript, diseño web, programacion">

Etiqueta “abstract“: Define una segunda descripción para el sitio.<META NAME="Abstract" CONTENT="El diseño web proyecta

arte y tecnología a un espacio universal"> Etiqueta “revisit-after“: Indican a los motores de búsqueda cada

cuanto tiempo deben volver a visitar nuestra página web para volver a indexarla en sus bases de datos.

<META NAME="revisit-after" CONTENT="10 Days">

Page 116: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas META – NAME (ii)

Etiqueta “Robots“: Se usa para indicar a los motores de búsqueda de qué forma deben indexar las páginas que componen nuestro sitio web.

<META NAME="ROBOTS" CONTENT="parametros">ALL: indica a los robots que indexen todas las páginas de

nuestro sitio web.NONE: indica a los robots que no indexen ninguna de las

páginas de nuestro sitio web. INDEX: indica a los robots que indexen la página en sus

bases de datos.NOINDEX: indica a los robots que no indexen la página en

sus bases de datos.FOLLOW: indica a los robots que indexen en sus bases de

datos la página actual y todas las que se encuentran enlazadas con ella.

Page 117: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas META – NAME (iii)NOFOLOW: indica a los robots que indexe en sus

bases de datos la página actual pero no las que se encuentran enlazadas con ella.

IMAGEINDEX: indica a los motores que indexen las imágenes de la página en sus bases de datos.

NOIMAGEINDEX: indica a los motores que no indexen las imágenes de la página en sus bases de datos, pero que sí pueden indexar el texto de la misma.

IMAGECLICK: indica a los robots que indexen los enlaces que tengan las imágenes de la página.

NOIMAGECLICK: indica a los robots que no indexen los enlaces que tengan las imágenes de la página.

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">

Page 118: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas META – NAME (iv) Etiqueta “author“: Especifica el autor de la página Etiqueta “Generator“: Indica con que programa se generó la página web Etiqueta “copyright“: Establece información de copyright Etiqueta “clasification“: Usada por muchos motores de búsqueda para

categorizar nuestra web. Etiqueta “owner“: Indica quien es el propietario de la web. Etiqueta “reply-to“: Especifica la dirección de contacto del responsable de

la página. Se recomienda indicar el nombre de la persona.<META NAME="Reply-to" CONTENT="[email protected] (Luciano Moreno)">

Etiqueta “distribution“: Indica quien tiene derecho a ver la página:• GLOBAL: disponible para todo Internet.• LOCAL: indica que se trata de una página de uso local, por lo que el servidor

puede que no sirva la página a peticiones fuera de la máquina local.• IU: (Internal Use), disponible sólo para una Intranet, por lo que el servidor no

atenderán peticiones de máquinas fuera de la red local (no disponibles para Internet).

Page 119: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Etiquetas META – NAME (v) Etiqueta “rating“: Especifica la clasificación del contenido de la

página:

<META NAME="Rating" CONTENT="clasificación"> 14 Years: apta para mayores de 14 años. Equivale al valor PG-13 de la

etiqueta PICS. General: apta para todos los públicos. Equivale aproximadamente al

valor PG de la etiqueta PICS. Mature: apta sólo para adultos. Equivale aproximadamente al valor R de

la etiqueta PICS. Restricted: con contenido que puede resultar inmoral o dañino. Equivale

al valor X de la etiqueta PICS. Safe For Kids: no apta bajo ningún concepto para niños. Equivale al

valor G de la etiqueta PICS.

Page 120: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Buscadores y motores de búsqueda

¿Cómo nos ven los buscadores?

Page 121: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Buscadores y motores de búsqueda

Para saber como nos ven los buscadores existen diferentes páginas web que emulan a los spiders o arañas tipo Google.

Poodle Emulator nos permite ver que es lo que ve Google a la hora de indexar nuestra página

Page 122: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

elgooG: ¿Google al revés? (http://www.alltooflat.com/geeky/elgoog/) Archivo Google (I): Google antes de sus inicios... ¿Qué es BackRub?

(http://web.archive.org/web/*/http://backrub.stanford.edu/) Archivo Google (II): Google desde sus inicios... ¿Google en la Universidad de

Standford? (http://web.archive.org/web/*/http://google.stanford.edu/) Archivo Google (III): Google desde sus inicios... ¿Cómo evoluciona Google?

(http://web.archive.org/web/*/http://www.google.com) Así era Google: Estas son las fotos que muestran el primer ordeanador donde

Google estuvo metido. (http://www-db.stanford.edu/pub/voy/museum/pictures/display/0-4-Google.htm)

Larry Page: Uno de los creadores de Google. Antes (http://web.archive.org/web/19981202114029/http://www-pcd.stanford.edu/~page/) y Ahora (http://www-pcd.stanford.edu/~page/)

Sergey Brin: El otro de los creadores de Google. Antes (http://web.archive.org/web/19980418143602/http://www-db.stanford.edu/~sergey/) y Ahora (http://www-db.stanford.edu/~sergey/)

The Best Search Engines on the Web http://websearch.about.com/od/enginesanddirectories/p/websearch101.htm

Referencias Bibliográficas (i)

Page 123: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

7 de Enero de 1996: ¿Qué hacia Larry Page preguntando sobre "robots"? (http://groups.google.com/groups?selm=page-0701962007020001%40qwerty.stanford.edu&output=gplain)

Search-This: ¿Qué recibe y a quién ofrece resultados Google? (http://www.search-this.com/search_engine_decoder.asp)

Fotos de Google: GooglePlex, así es. (http://www.aaronsw.com/photos/google/)

Google Set-Vista (http://www.langreiter.com/space/google-set-vista)

TouchGraph GoogleBrowser (http://www.touchgraph.com/TGGoogleBrowser.html)

RooDolf (http://nutria.cs.tu-berlin.de/roodolf/index.html) Random WebSearch (http://www.randomwebsearch.com/) Googlism (http://www.googlism.com/) Poodle (http://www.google.es/search?

hl=es&q=poodle&spell=1)

Referencias Bibliográficas (ii)

Page 124: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Referencias Bibliográficas (iii)

TIWANA, Amrit. The Knowledge Management Toolkit. Upper Saddle River: Prentice Hall, 2000

SCHREIBER, Guus et al. Knowledge Engineering and Management. The CommonKADS Methodology. Cambridge, Massachusetts: The MIT Press, 2000.

Joyanes Aguilar, Luis. Las redes sociales: de la mensajería instantánea a los Weblogs. Sociedad y Utopía, Núm 24, 2004

Page 125: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Referencias Bibliográficas (iv)

HERREROS DE LAS CUEVAS, Carlos. La sucesión del lider. Granica: Barcelona, 2003

JOYANES AGUILAR, Luis. Cibersociedad 2.0: Hacia un mundo inalámbrico y a la sociedad del conocimiento. 2ª edición (1ª ed, 1997) . En preparación (McGraw-Hill: Madrid, 2003)

DRUCKER, Peter. La empresa en la sociedad que viene. Urano: Barcelona, 2003.

Google. Acerca de Google. http://www.google.com/about.html

Page 126: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Referencias Bibliográficas (v) WALLACE, Patricia . The Internet in the Workplace.

Cambridge University Press, 2004 CARR, Nicholas G. Does IT Matter? Harvard Business

Schools, 2004 ALONSO, Andoni y ARZOZ, Iñaki. Carta al Homo

Ciberneticus. Madrid: EDAF Ensayo, 2003 JOYANES, Luis. Innovaciones Tecnológicas. Retos y

Oportunidades en Sociedad y Utopía, UPSA Madrid, Octubre 2004.

JOYANES, Luis. Cibersociedad 2010. McGraw-Hill, Madrid 2005

CALISHAIN, Tara y DORNFEST, Rael. Google. Los mejores trucos. Anaya/O. Reilly. Madrid, 2004

Page 127: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Referencias Bibliográficas (vi)

Joyanes. Cibersociedad (McGraw-Hill, 1997) Marina, Joyanes y otros. Educación e Internet

(Santillana, 1999) Joyanes , El futuro del conocimiento (en preparación) Joyanes . Cibersociedad , 2ª edición (prevista 1T 2005) Joyanes . Comercio electrónico: fundamentos y modelos

(en preparación) Joyanes. “Historia de la Sociedad de la Información.

Hacia la sociedad del Conocimiento” en R-evolución tecnológica. U. de Alicante: Alicante, 2003

Joyanes. “Biotecnología e Informática” en Estudios, nº 1, Fundación Pablo VI: Madrid, 2003.

Page 128: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Cinco Días ….. Viernes Expansión ….. Viernes Gaceta de los Negocios ….. Viernes Financial Times (www.ft.com ...

www.ft.com/ftit..../fttelecoms ) Wall Street Journal (www.wsj.com) Les Echos (www.lesechos.com) BusinessWeek (www.businessweek.com) Business 2.0 (www.business2.com) Suplementos de Economía y de Tecnología semanales de: El

País, El Mundo, ABC y La Vanguardia…jueves, domingo, miercoles,

Prensa

Page 129: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Intelligent Enterprise (www.intelligententerprise.com) www.newsweek.com Red Herring (www.redherring.com) Upside (www.upside.com) The Standard Industrie (www.thestandard.com) Advisor (www.advisor.com) SIGS (www.sigs.com) ACM (www.acm.org) The Economist (www.economist.com)

Prensa

Page 130: UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID Facultad de Informática 1 UNIVERSIDAD DE VERANO DE LA GOMERA - 2008 BUSQUEDA DE INFORMACIÓN Y CONOCIMIENTO

© Luis Joyanes Aguilar, Rubén González Crespo Facultad de Informática Universidad Pontificia de Salamanca, campus de Madrid

Vocabulario especializado: argot y terminología

Jergas //probertencyclopedia.com/slang.htm //www.prevish.co.uk/slang //www.spraalservce.net/slangportal

Vocabulario especializado. Argot profesional //glosarist.com The OnlineMedical

Dictionary//cancerweb.ncl.ac.ul/omd MedTerms.com Diccionario legal //dictionary.law.com/lookup2.asp

Vocabularios online