5
1 ESCUELA DOCTORAL / NIVEL PREPARATORIO EL ABC DE LAS BÚSQUEDAS EN EL WEB ¿Cuáles son las herramientas para buscar en INTERNET? Introducción No se puede dejar de dar importancia a la calidad de los resultados de las búsquedas de información en Internet. Este planteamiento es válido tanto para los usuarios de la información como para quienes posibilitan las búsquedas, los motores de búsqueda. Se ha demostrado que cada motor de búsqueda, tiene su propia arquitectura. Los motores de búsquedas temáticos son más apropiados para encontrar todo lo relacionado con un tema, mientras que los motores de búsqueda que utilizan robots presentan resultados más actualizados. El conocimiento por parte de los usuarios (que generalmente no leen las ayudas propias de cada buscador) y la aplicación de las capacidades de búsqueda y personalización posibilitarían que los resultados sean lo más acordes posibles a sus propios intereses. Principalmente para representación e indexación de la información se usan los métodos de indexación por palabra clave o concepto. La indexación por palabra clave es la forma más común en la web. Dado el creciente volumen de información en Internet, a pesar de la utilización de robots, la información encontrada no estará siempre actualizada. El ABC de los motores de búsqueda en INTERNET. Un motor de búsqueda, también conocido como buscador, es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider» (o Web crawler). Un ejemplo son los buscadores de Internet (algunos buscan únicamente en la web, pero otros lo hacen además en noticias, servicios como Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas. Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas. Hoy en día Internet se ha convertido en una herramienta, para la búsqueda de información, rápida, para ello han surgido los buscadores que son un motor de búsqueda que nos facilita encontrar información rápida de cualquier tema de interés, en cualquier área de las ciencias, y de cualquier parte del mundo. Clasificación

Herramienta 1 ABC de Las Búsquedas Web

Embed Size (px)

DESCRIPTION

ABC

Citation preview

  • 1

    ESCUELA DOCTORAL / NIVEL PREPARATORIO

    EL ABC DE LAS BSQUEDAS EN EL WEB

    Cules son las herramientas para buscar en INTERNET?

    Introduccin No se puede dejar de dar importancia a la calidad de los resultados de las bsquedas de informacin en Internet. Este planteamiento es vlido tanto para los usuarios de la informacin como para quienes posibilitan las bsquedas, los motores de bsqueda. Se ha demostrado que cada motor de bsqueda, tiene su propia arquitectura. Los motores de bsquedas temticos son ms apropiados para encontrar todo lo relacionado con un tema, mientras que los motores de bsqueda que utilizan robots presentan resultados ms actualizados. El conocimiento por parte de los usuarios (que generalmente no leen las ayudas propias de cada buscador) y la aplicacin de las capacidades de bsqueda y personalizacin posibilitaran que los resultados sean lo ms acordes posibles a sus propios intereses. Principalmente para representacin e indexacin de la informacin se usan los mtodos de indexacin por palabra clave o concepto. La indexacin por palabra clave es la forma ms comn en la web. Dado el creciente volumen de informacin en Internet, a pesar de la utilizacin de robots, la informacin encontrada no estar siempre actualizada.

    El ABC de los motores de bsqueda en INTERNET.

    Un motor de bsqueda, tambin conocido como buscador, es un sistema informtico que busca archivos almacenados en servidores web gracias a su spider (o Web crawler). Un ejemplo son los buscadores de Internet (algunos buscan nicamente en la web, pero otros lo hacen adems en noticias, servicios como Gopher, FTP, etc.) cuando se pide informacin sobre algn tema. Las bsquedas se hacen con palabras clave o con rboles jerrquicos por temas; el resultado de la bsqueda es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas.

    Como operan en forma automtica, los motores de bsqueda contienen generalmente ms informacin que los directorios. Sin embargo, estos ltimos tambin han de construirse a partir de bsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de pginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas. Hoy en da Internet se ha convertido en una herramienta, para la bsqueda de informacin, rpida, para ello han surgido los buscadores que son un motor de bsqueda que nos facilita encontrar informacin rpida de cualquier tema de inters, en cualquier rea de las ciencias, y de cualquier parte del mundo.

    Clasificacin

  • 2

    Se pueden clasificar en dos tipos:

    ndices temticos: Son sistemas de bsqueda por temas o categoras jerarquizados (aunque tambin suelen incluir sistemas de bsqueda por palabras clave). Se trata de bases de datos de direcciones Web elaboradas "manualmente", es decir, hay personas que se encargan de asignar cada pgina web a una categora o tema determinado.

    Motores de bsqueda: Son sistemas de bsqueda por palabras clave. Son bases de datos que incorporan automticamente pginas web mediante "robots" de bsqueda en la red.

    Clases de buscadores

    Buscadores jerrquicos (Araas o Spiders)

    Recorren las pginas recopilando informacin sobre los contenidos de las pginas. Cuando se busca una informacin en los motores, ellos consultan su base de datos y presentan resultados clasificados por su relevancia. De las webs, los buscadores pueden almacenar desde la pgina de entrada, a todas las pginas que residan en el servidor.

    Si se busca una palabra, por ejemplo, ordenadores. En los resultados que ofrecer el motor de bsqueda, aparecern pginas que contengan esta palabra en alguna parte de su texto.

    Si consideran que un sitio web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, slo almacenan una o ms pginas.

    Cada cierto tiempo, los motores revisan los sitios, para actualizar los contenidos de su base de datos, por tanto puede que los resultados de la bsqueda estn desactualizados.

    Los buscadores jerrquicos tienen una coleccin de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes. Los programas que exploran la red -araas (spiders)-, los que construyen la base de datos y los que utiliza el usuario, el programa que explota la base de datos.

    Si se paga, se puede aparecer en las primeras pginas de resultados, aunque los principales buscadores delimitan estos resultados e indican al usuario que se trata de resultados esponsorizados o patrocinados. Hasta el momento, aparentemente, esta forma de publicidad es indicada explcitamente. Los buscadores jerrquicos se han visto obligados a comercializar este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita.

    Ejemplos de araas: Google, Bing, Hotbot.

    Directorios

    Una tecnologa barata, ampliamente utilizada por gran cantidad de scripts en el mercado. No se requieren muchos recursos de informtica. En cambio, se requiere ms soporte humano y mantenimiento.

    Los algoritmos son mucho ms sencillos, presentando la informacin sobre los sitios registrados como una coleccin de directorios. No recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra pgina, como el ttulo y la descripcin que se introduzcan al momento de registrar el sitio en el directorio.

  • 3

    Los resultados de la bsqueda, estarn determinados por la informacin que se haya suministrado al directorio cuando se registra el sitio. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas segn categoras, de forma que es ms fcil encontrar pginas del tema de nuestro inters.

    Ms que buscar informacin sobre contenidos de la pgina, los resultados sern presentados haciendo referencia a los contenidos y temtica del sitio.

    Su tecnologa es muy barata y sencilla.

    Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo!, Terra (antiguo Ol). Ahora, ambos utilizan tecnologa de bsqueda jerrquica, y Yahoo! conserva su directorio. Buscar Portal, es un directorio, y la mayora de motores hispanos son directorios.

    Metabuscador

    Permite lanzar varias bsquedas en motores seleccionados respetando el formato original de los buscadores. Lo que hacen, es realizar bsquedas en autnticos buscadores, analizan los resultados de la pgina, y presentan sus propios resultados, segn un orden definido por el sistema estructural del metabuscador. Metacrawler, Aleyares son ejemplos de este tipo de buscador.

    FFA - Enlaces gratuitos para todos

    FFA (acrnimo del ingls "Free For All"), Cualquiera puede inscribir su pgina durante un tiempo limitado en estos pequeos directorios. Los enlaces no son permanentes.

    Buscadores verticales

    Los buscadores verticales o motores de bsqueda temticos, son buscadores especializados en un sector concreto, lo que les permite analizar la informacin con mayor profundidad, disponer de resultados ms actualizados y ofrecer al usuario herramientas de bsqueda avanzadas. Es importante resaltar que utilizan ndices especializados, para, de esta manera acceder a la informacin de una manera ms especfica y fcil. Algunos ejemplos de estos buscadores son: Nestoria, Wolfram Alpha.

    Existen distintos tipos de estos buscadores, algunos son especializados en una rama de una ciencia, y algunos abarcan todo tipo de materias. Tambin existen motores de bsqueda que solo entregan resultados sobre msica, ropa o distintos temas.

    Cmo funciona un motor de bsqueda?

    El motor de bsqueda ms popular, Google, contiene ms de 3.000.000.000 sitios web. Cuando introduces una frase o palabra, el motor buscar en su base de datos y devolver resultados en un orden que estar determinado por su propio algoritmo.

    As pues, cmo consiguen al principio toda esa informacin?

  • 4

    Araas (spiders)

    Los motores de bsqueda emplean el uso de araas para recopilar la informacin de los sitios web. Las araas rastrean los sitios web recopilando datos y siguen los enlaces que hay en las pginas. Las araas rastrean Internet casi continuamente, recolectando las pginas nuevas y actualizadas de la Web para mantener sus resultados al da.

    Tratamiento de Datos

    Los datos que las araas extraen son tratados de forma diferente por los diversos motores de bsqueda. Los motores de bsqueda ponen el 'peso' en diferentes componentes de un sitio web y en cmo se integra en la Web. De esta manera determinan el orden en el que los sitios web deben aparecer en los resultados de una bsqueda (las pginas que contienen los resultados de la bsqueda son llamadas comnmente SERPS- search engine result pages).

    Entrando

    La mayora de los motores de bsqueda ponen al da sus bases de datos al menos una vez al mes con la informacin recopilada por sus araas. Esto es importante saberlo cuando se tiene un sitio web relativamente nuevo - si pones tu sitio web por primera vez en la red al final de un 'rastreo' y las araas no lo encuentran, tendrs que esperar hasta la actualizacin siguiente para entrar a formar parte de la base de datos. Una vez el sitio web entra la base de datos todava llevar una o dos actualizaciones ms antes de que el nuevo sitio web se estabilice en los resultados de las bsquedas.

    Listado de buscadores

    Hoy por hoy es difcil realizar una bsqueda y no acudir al todopoderoso Google para realizarla. Sin embargo, se puede contar con los dedos de una mano el nmero de buscadores que cada uno de nosotros conoce.

    El siguiente listado muestra los principales motores de bsqueda y su lista ampliada. Cada uno de ellos muestra el hipervnculo de acceso.

    Principales motores de bsqueda:

    Google Yahoo! Ask Altavista MSN AOL AlltheWeb Go Netscape Search Live Lycos Snap webcrawler

    Listado ampliado de motores de bsqueda:

    A9 AOL AURA! blinkx boing bookmach.com BOXXET ChaCha ClipBlast! Clusty

    collarity CometQ CONGOO Cuil d e c i p h o del.icio.us digg digg labs swarm Ditto Dmoz dumbfind exalead factbites

  • 5

    fazzle FEEDS|2.0 Feedster FindSounds GIGABLAST girafa gnn o d GoDefy goshme GoYams grokker ICEROCKET ixquick KartOO last.fm Lexxealpha like LiveDeal liveplasma Local.com lurpo MetaGlossary mnemomap Mojeek Mooter MrSAPO MS. DEWEY

    nayio Octora OiHoi Search Ozu Pagebull PlanetSearch pluggd PODZINGER Previewseek pronto.com QTsearch Quintura Releton retrevo gamma riya ROLLYO O SearchTheWeb2 SEEQPOD sidekiq Simply Google Singing FISH Slideshow Slifter soople Speegle Sphider SPURL.net

    S R C H R SurfWax Swoogle TagJag! Terra thefind.com Trexy turboscout UJIKO url.com VMGO.com Web 2.0 Webaroo WEBBRAIN What to RENT? whonu? WIKIO WiseNut Yahoo! MINDSET yoono yoople yubnub YuFind ZABASEARCH zapmeta Zippy ZUULA

    Fuente: readwriteweb

    VRIP / 7 de febrero de 2013

    AR Socorro