Según estimaciones de organismos que estudian la evolución de
la Web, actualmente, hay más de quince mil millones de
páginas Web con información, las cuales crecen a un ritmo de
mas de siete millones de páginas al día.
Cuanto más grande es Internet, cuanto más inmanejable es
el volumen de información que nos rodea, más importante es
la tarea de encontrar lo que buscamos. Quien controla el
mapa, controlará Internet.
Del total de sitios web, el 85 % pertenece a Estados unidos.
Existen aproximadamente, 10 millones de paginas web en español.
Con el objeto de ordenar, clasificar y así localizar los temas que interesan a los usuarios, dentro de esa
gigantesca maraña de información, se han desarrollado ciertos mecanismos automatizados de búsqueda (o
"buscadores de información") que en cuestión de segundos encuentran y presentan al usuario la
información solicitada por el mismo.
Para realizar tan compleja tarea, imposible para cualquier ser humano, los buscadores utilizan un tipo de
software denominado "spiders" ("arañas"). Éstas se deslizan a través de toda la Web visitando millones de
páginas y registrando sus direcciones en grandes bases de datos. A partir de allí, algunos buscadores
envían "robots" a cada una de estas direcciones, los cuales se encargan de almacenar el texto de dichas
páginas.
TELARAÑAS Y ARAÑAS
En la actualidad existen mas de 5000 buscadores de información, de los cuales el 10% pertenecen al
ámbito de Latinoamérica.
Obviamente, no todos los buscadores de información son iguales, ni tienen las mismas potencialidades
Diferencias:
1. El tamaño de la base de datos que contiene los índices de búsqueda.
2. La frecuencia de actualización de dichos datos.
3. La lógica de búsqueda, mediante la cual se va acotando la localización del tema solicitado.
4. La rapidez con la cual encuentra la información pedida.
5. La relevancia, con la cual se presenta la información, en orden de importancia.
DIFERENCIAS ENTRE BUSCADORES
RENOVARSE O DESAPARECER
Con más de quine mil millones de páginas Web para revisar y clasificar, además de todos los sitios
nuevos que nacen cada día al ciberespacio, los buscadores no dan abasto en la gestión de
información y se ven obligados a actualizarse permanentemente, refinando sus sistemas de
búsqueda y categorización.
LA LEY DE INTERNET
Hay dos tipos:
Los directorios, que organizan y clasifican la información en forma
jerárquica y estructurada en temas y subtemas. El usuario ingresa desde
un tema general hasta llegar al que le interesa y desde allí acceder a
las paginas que contienen información relativa al tema que busca.
Las búsquedas por palabras clave, que se encargan de rastrear toda la
información disponible sobre el tema solicitado en la base de datos
disponible.
MECANISMOS DE BUSQUEDA
Los buscadores no funcionan en tiempo real. Es decir, cuando ingresamos una palabra, una frase
y apretamos Enter , estos sitios no salen a buscar por la Web a ver si encuentran lo que pedimos.
Lo que hacen es revisar una base de datos razonablemente actualizada de los sitios conocidos. Si
buscaran el dato por la Web real, pasaríamos mucho tiempo esperando los resultados.
NO FUNCIONAN EN TIEMPO REAL
El éxito en la búsqueda depende no solo de la amplitud de la base de
datos del mecanismo de búsqueda, sino del “oficio” del usuario para
hacer su solicitud.
Recuerde:
A BUENAS PREGUNTAS, BUENOS RESULTADOS.
SE NECESITA OFICIO
Parece un error obvio, pero todos empezamos buscando con palabras sueltas, como si las
máquinas o Internet poseyeran la capacidad de leernos la mente y averiguar que cuando
ponemos sociales lo que estamos tratando de decir es que nos gustaría visitar la pagina de la
FACISO; o que cuando ponemos ingeniería lo que deseamos en realidad es ver el programa de
esa carrera en la Universidad… de vaya usted a saber de donde.
PALABRAS SUELTAS ES UN ERROR
La clave para encontrar algo en un índice Web de 2500 millones de páginas, es no usar palabras
sueltas. Esto es así porque una búsqueda fallida no es sólo aquella que produce cero resultados,
sino también la que enumera decenas de miles. Si pone arte o ingeniería en Google le está
pidiendo que liste todos los sitios que en su base de datos contienen la palabra arte o ingeniería .
Es cierto que lo que usted está buscando ( Museo de Arte de Mazatlán o Programa de la carrera
de ingeniería de la Universidad Autónoma de Sinaloa ) se encontrará entre los centenares de
miles de resultados listados. Pero no habrá avanzado ni un paso en su investigación, porque es
tan inútil una lista de 2500 millones de sitios que una de 700.000.
CERO Y DECENAS DE MILES
Lo mejor es ser lo más específico posible. Si busca museos en línea, opte por poner museos en
Internet y se acercará bastante al dato correcto, aunque la lista de resultados todavía será muy
grande (más de 95.000). ¿Por qué no colocar directamente "guía de museos en Internet" ? Al fin
de cuentas, es un titular muy verosímil para un sitio. Pruébelo y obtendrá un éxito raro de
conseguir en el espacio virtual: un solo resultado y, además, perfecto.
Pero en la búsqueda de arriba hay un truco: las comillas. Cuando usted pone un criterio
entrecomillado en un motor de búsqueda (por ejemplo, " pintores impresionistas" ) le está
diciendo que encuentre exactamente esa frase. De otro modo, el buscador listará todas las
páginas que contengan las palabras pintores e impresionistas.
SEA LO MAS ESPECIFICO POSIBLE
1. Google 56.9%
2. Yahoo 21.2%
3. MSN Search 8.9%
4. AOL Search 3.2%
EL BUSCADOR MAS POPULAR DEL MUNDO
Unos hippies contra Bill Gates
Los fundadores de Google, Larry Page y Sergey Brin
GOOGLE VS MICROSOFT
El nombre proviene de un juego de palabras con el término "googol", acuñado por Milton Sirotta, sobrino del matemático norteamericano Edward Kasner, para referirse al número representado por un 1 seguido de 100 ceros. El uso del término refleja la misión de la compañía de organizar la inmensa cantidad de información disponible en la web y en el mundo.
Antes, una pequeña curiosidad:
QUE SIGNIFICA GOOGLE?
GOOGLE SE COMENZO A GESTAR EN 1996 EN LA UNIVERSIDAD DE
STANFORD (ESTADOS UNIDOS), POR LOS ENTONCES ESTUDIANTES
SERGEY BRIN Y LARRY PAGE. EN 1998, SE CREO LA EMPRESA GOOGLE INC.
¿COMO COMENZO GOOGLE?
PRINCIPALMENTE, A SU TECNOLOGIA.
BRIN Y PAGE DISEÑARON UN ALGORITMO (PAGE RANK) PARA
PUNTUAR LAS PAGINAS WEB DE INTERNET, QUE ES REALMENTE
EFECTIVO.
TEMBIEN DISPONEN DE UNA DE LAS MAYORES REDES DE
SERVIDORES DE INTERNET.
ADEMAS, HAY TENER EN CUENTA SU DISEÑO MINIMALISTA Y MUY
EFICIENTE.
¿A QUE SE DEBE EL EXITO DE GOOGLE?
1. LA COMPUTADORA MAS CERCANA AL POLO NORTE
2. LA COMPUTADORA MAS ALEJADA DE LA TIERRA
3. GOOGLE: EL CENTRO DE DATOS MAS INTRIGANTE
4. EL PROYECTO CIENTIFICO MAS GRANDE DEL MUNDO: EGEE-
II
5. LA SUPER COMPUTADORA MAS GRANDE DEL MUNDO
6. LA COMPUTADORA MAS PEQUEÑA
7. EL NUCLEO DE LINUX
LAS 7 MARAVILLAS TECNOLOGICAS DEL MUNDO
PAGERANK ES UNA MARCA REGISTRADA Y PATENTADA POR GOOGLE
EL 9 DE ENERO DE 1999 QUE AMPARA UNA FAMILIA DE ALGORITMOS
UTILIZADOS PARA ASIGNAR DE FORMA NUMERICA LA RELEVANCIA DE
LOS DOCUMENTOS (O PAGINAS WEB) INDEXADOS POR UN MOTOR DE
BUSQUEDA.
PAGERANK
PageRank confía en la naturaleza democrática de la web utilizando su vasta
estructura de enlaces como un indicador del valor de una página en concreto.
Google interpreta un enlace de una página A a una página B como un voto,
de la página A, para la página B. Pero Google mira más allá del volumen de
votos, o enlaces que una página recibe; también analiza la página que emite
el voto. Los votos emitidos por las páginas consideradas "importantes", es
decir con un PageRank elevado, valen más, y ayudan a hacer a otras
páginas "importantes". Por lo tanto, el PageRank de una página refleja la
importancia de la misma en Internet.
PAGERANK
Recommended