24
“Administrr la organización del cambio” Programa de formación ALCUE FOOD Sexto programa – Prioridad 5 Calidad y seguridad de los alimentos De la De la información información a la a la decisión decisión módulo módulo 6 6 Búsqueda Búsqueda avanzada avanzada de de información información en el Net en el Net Una Una formación formación por por Jean Jean - - Pierre Bernat Pierre Bernat Cirad Cirad Armelle Thomas Armelle Thomas - - Inforizon Inforizon Noviembre Noviembre - - 2005 2005

Búsqueda Avanzada de Información en Internet

Embed Size (px)

DESCRIPTION

Jean-Pierre Bernat – CiradArmelle Thomas - InforizonNoviembre - 2005http://www.alcuefood.org/online/files/contenidos/link_14082006034832.pdf

Citation preview

“Administrr la organización delcambio”Programa de formación ALCUE FOODSexto programa – Prioridad 5Calidad y seguridad de los alimentos

De la De la informacióninformación a la a la decisióndecisiónmódulomódulo 66

BúsquedaBúsqueda avanzada avanzada de de informacióninformación en el Neten el Net

UnaUna formaciónformación porporJeanJean--Pierre Bernat Pierre Bernat –– CiradCiradArmelle Thomas Armelle Thomas -- InforizonInforizon

NoviembreNoviembre -- 2005 2005

Sumario

• Estrategias de búsqueda en el Web

• Evaluación de la información

• El Web invisible

• Cómo localizar las fuentes significativas ?

DispersiónDispersión y y heterogeneidadheterogeneidad

•• TantoTanto en el en el contenidocontenido comocomo en en loslos mediosmedios de de difusióndifusión

•• ContenidoContenido actualizadoactualizado en el en el cursocurso deldel tiempotiempo ((peropero algunosalgunoscontenidoscontenidos archivadosarchivados en el web en el web www.archivo.orgwww.archivo.org) y URL que a ) y URL que a vecesvecescambiancambian

•• ““GranularidadGranularidad de de loslos contenidoscontenidos” : la ” : la páginapágina, el , el artículoartículo en la en la páginapágina, , la base de la base de datosdatos accesibleaccesible via la via la páginapágina, etc., etc.

•• MultilingüismoMultilingüismo e e informacióninformación mundialmundial

•• InformaciónInformación gratuitagratuita o “o “pagapaga con el clic”con el clic”

•• El El conceptoconcepto de de exhaustividadexhaustividad no no puedepuede existirexistir en el Neten el Net

•• CredibilidadCredibilidad : EL : EL problemaproblema

UnaUna grangran masamasa de de informacióninformación

•• VeinteVeinte mil mil millonesmillones de de páginaspáginas o o másmás (320 (320 millonesmillones en 1997) : en 1997) : loslosexpertosexpertos han han dejadodejado de de contarcontar….….

•• Sin Sin tomartomar en en cuentacuenta la la masamasa de las de las páginaspáginas deldel Web invisible (Web invisible (cfcfdiapo diapo específicaespecífica sobre la sobre la preguntapregunta))

•• MásMás de 70 de 70 millonesmillones de de sitiossitios ((wwwwww..netcraftnetcraft..comcom) : ) : peropero quéqué se se puedepuederealmenterealmente llamarllamar un un sitiositio Web ?? Y un Web ?? Y un grangran desarrollodesarrollo de de loslos blogsblogs

•• Miles de Miles de millonesmillones de de mensajesmensajes archivadosarchivados en en loslos forosforos usenetusenet, las , las listas, ….listas, ….

Los Los métodosmétodos universalesuniversales de de búsquedabúsqueda en el en el Web Web deberíandeberían siempresiempre refererirserefererirse aa

VayaVaya a a loslos «« buenosbuenos sitiossitios » » comocomo puntopunto de de partidapartidade su de su navegaciónnavegación : y si : y si ustedusted no no loslos conoceconoce, busque (, busque (piensepiensefuentesfuentes antes de antes de pensarpensar herramientasherramientas))

YYUtiliceUtilice motoresmotores de de búsquedabúsqueda ((GoogleGoogle y y otrosotros) ) con con diferentesdiferentes estrategiasestrategias de de búsquedabúsqueda

• Defina con precisión sus necesidades y el tipo de informaciónbuscada (información científica, económica, estadística, reglamentaria, …),

• Controle el « espacio-tiempo » de su búsqueda

• Utilice buenas palabras-claves, y sus favoritos

• Tenga siempre presente sus medios, y la elección de criterios

• Sea « ágil »

RepasoRepaso de las de las herramientasherramientasde de búsquedabúsqueda

CatálogosCatálogosgenerales MotoresMotores de de búsquedabúsqueda

generalesgenerales generalesCatálogosCatálogosespecializadosespecializados

MotoresMotores de de búsquedabúsquedaespecialesespeciales

Portales verticalesPortales verticales

EnciclopediasEnciclopedias, , diccionariosAgregadoresAgregadores de de

news diccionariosnews

Meta Meta motoresmotores de de búsqueda

Bases de Bases de datosdatosespecializadosespecializados y y catálogos

búsquedacatálogos

ForosForos, listas, FAQ, listas, FAQ

NuevasNuevas tendenciastendencias para la para la búsquedabúsqueda de de informacióninformación en el neten el net

•• ReagrupamientoReagrupamiento de de loslos actoresactores en el Web, en el Web, simplificaciónsimplificación de la de la sintaxissintaxis

•• Google “El Google “El reyrey” … y ” … y abandonoabandono deldel usouso de de loslos repertoriosrepertorios

•• CartografíaCartografía de de loslos resultadosresultados ( ( KartooKartoo, , MapstanMapstan,…),…)

•• CreaciónCreación de «de « tesorostesoros dinámicosdinámicos » y de » y de gruposgrupos ( ( ExaleadExalead, , TeomaTeoma, , VivisimoVivisimo,…),…)

•• DesarrolloDesarrollo portales verticales (portales verticales (accesoacceso al web al web profundoprofundo) y ) y agregadoresagregadores de de prensaprensa

•• DesarrolloDesarrollo de de herramientasherramientas especializadasespecializadas ((ScirusScirus, Google , Google ScholarScholar, , HealthHealth on on thethe net net MedhuntMedhunt, …) de , …) de herramientasherramientas de de personalizaciónpersonalización

••DesarrolloDesarrollo de de herramientasherramientas de de reparticiónrepartición (“social (“social navegaciónnavegación”, p2p, ”, p2p, sindicaciónsindicación ),…)

ReagrupamientoReagrupamiento y y clasificaciónclasificaciónautomáticaautomática

ObjetivoObjetivo : : EstructurarEstructurar automáticamenteautomáticamente loslos contenidoscontenidos de de acuerdoacuerdo a a temáticastemáticas

•• SuministroSuministro de de objetosobjetos en en gruposgruposClasificaciónClasificación automáticaautomática de de documentosdocumentos en clases en clases prepreformateadasformateadas (a priori)(a priori)ReagrupamientoReagrupamiento dinámicodinámico de de documentosdocumentos (a posteriori)(a posteriori)

•• Varias Varias estrategiasestrategias ((estadísticaestadística o o lingüísticalingüística) y/o ) y/o cartografíacartografía de la de la informacióninformación

ClasificaciónClasificación a priori sobre a priori sobre ExaleadExalead

Enlaces en las categorías de un catálogo utilizado por un motor.

Usted puede reformular su demanda via estas categorías

ClasificaciónClasificación a posteriori sobre a posteriori sobre ExaleadExalead

CálculoCálculo estadísticoestadístico efectuadoefectuado para para encontrarencontrar unauna lista de palabras lista de palabras claves en claves en relaciónrelación con la con la búsquedabúsqueda

Clusters con Clusters con TeomaTeoma

Este Este motormotor clasificaclasifica las las páginaspáginas en en gruposgrupos porpor análisisanálisis de de loslos enlaces. enlaces. Los Los títulostítulos de de estosestos gruposgrupos son son loslos términostérminos másmás frecuentesfrecuentes en las en las páginaspáginas retenidasretenidas..

EvaluaciónEvaluación de la de la informacióninformación en Interneten Internet

PrecisiónPrecisión ((hechoshechos, , estadístsestadísts., ., fechasfechas… Las infos … Las infos estánestán bien bien referenciadasreferenciadas, la , la informacióninformaciónpuedepuede serser verificadaverificada?) ?)

PopularidadPopularidad ((importanciaimportancia de la de la fuentefuente en el campo de en el campo de búsquedabúsqueda))

InformacionesInformaciones fechadasfechadas, , recientesrecientes

ActualizaciónActualización

AutoresAutores usualesusuales ((quiénesquiénesson?, son?, calificacionescalificaciones))

IndependenciaIndependencia//Objetividad Objetividad ((QuéQué mediosmedios ?)?)

CoberturaCobertura ((pertinenciapertinencia para el para el tematema ; en ; en profundidadprofundidad ?)?)

AutoridadAutoridad / / ConfiabilidadConfiabilidad(y (y selecciónselección deldel sitiositio))

CONTENIDOCONTENIDOFUENTESFUENTES

TrucosTrucos para para evaluarevaluar unaunainformacióninformación en el weben el web

•• IrIr a la a la referenciareferencia de las de las páginaspáginas ((quitandoquitando el “/”)el “/”)

•• ObtenerObtener informacionesinformaciones en el en el productorproductor deldel sitiositio ((porpor ejemploejemplocopyright copyright –– encabezadoencabezado y pie de y pie de páginaspáginas para las para las indicacionesindicaciones))

•• UtilizarUtilizar el ‘enlace:’ el ‘enlace:’ caracterizarcaracterizar (Google, Yahoo, etc.)(Google, Yahoo, etc.)

•• UtilizarUtilizar un un servicioservicio de de informacióninformación para para determinardeterminar el el propietariopropietario de la de la páginapágina ((wwwwww..betterwhoisbetterwhois..comcom ; ; wwwwww..allwhoisallwhois..comcom para para loslos dominiosdominiosgenéricosgenéricos) () (wwwwww..genericgeneric--nicnic.net/.net/dyndyn//whoiswhois para para loslos dominiosdominios porpor paíspaís))

La web invisible , La web invisible , eseese desconocidodesconocido ::--))

Invisible ?Invisible ?

Para Para buscarbuscar herramientasherramientas comocomo Google o Google o Yahoo…Yahoo…

UnaUna definicióndefinición completacompleta deldel Web invisibleWeb invisible

TodasTodas las las páginaspáginas que que loslos motoresmotores de de búsquedabúsqueda rechazanrechazan o no o no puedenpueden indexarindexar

•• A causa de barreras A causa de barreras técnicastécnicas que que impidenimpiden la la indexaciónindexación : : framesframes, , javascripjavascrip que que modificanmodifican el el contenidocontenido, , tecnologíastecnologías propietariaspropietarias, , páginaspáginasformateadasformateadas en flash, en flash, shockwaveshockwave o o muymuy pequeñospequeños scripts en htmlscripts en html

•• PáginasPáginas basadasbasadas en scriptsen scripts : : cadacada vezvez másmás páginaspáginas basadasbasadas en scripts en scripts son son correctamentecorrectamente analizadasanalizadas, , peropero muchas muchas contienencontienen formas que formas que excluyenexcluyen loslos motoresmotores de de búsquedabúsqueda..

•• SitioSitio Web o Web o páginaspáginas que que necesitannecesitan unauna palabra de palabra de páginapágina de de conexiónconexiónpara para tenertener accesoacceso : : quéqué tipotipo de de contraseñacontraseña es es estaesta??

•• ContenidosContenidos accesiblesaccesibles de bases de de bases de datosdatos especializadosespecializados : La : La mayoríamayoríade de loslos contenidoscontenidos deldel web invisible web invisible estáestá hechohecho de bases de de bases de datosdatos que que puedenpueden serser alcanzadosalcanzados via el web. via el web. LosLos resultadosresultados seránserán suministradossuministrados en en forma de forma de páginaspáginas web web generadasgeneradas dinámicamentedinámicamente..

El web invisible : El web invisible : unauna mina de mina de orooro para para loslos profesionalesprofesionales

Una masa increíble de informaciones ampliamente inexploradas

Nadie conoce el tamaño exacto del web invisible : algunasestimaciones estiman que es 500 veces más grande que el web visible (550 mil millones de páginas, puede ser más ??)

El web invisible crece más rápidamente que el web visible

Pasar un poco de tiempo explorando las bases de datoscorrespondientes a su campo de búsqueda o a su tema de estudioes hoy en día una necesidad.

VisitarVisitar las Bases de las Bases de datosdatos : : unauna necesidadnecesidad

Testear las herramientas de búsqueda para penetrar

realmente en el web invisible

Mal Mal indexadoindexado porporlas las herramientasherramientasde de búsquedabúsqueda

Un Un contenidocontenidoprofesionalprofesional y y creíble

CadaCada vezvez másmás bases bases de de datosdatos disponibles creíbledisponibles

RápidoRápido repasorepaso de las bases de de las bases de datosdatos

Bases de Bases de datosdatos = = recolecciónrecolección organizadaorganizada de de informacióninformación : : Bases Bases hechashechas de de registrosregistros, , registrosregistroscompuestoscompuestos de campos (de campos (porpor ejemploejemplo autorautor, , tematema…) …) utilizandoutilizando puntospuntos de de accesoacceso para la para la búsquedabúsqueda

•• bases bases bibliográficasbibliográficas : : registrosregistros que que describendescriben obrasobras, , artículosartículos, etc., etc.•• Bases Full text : Bases Full text : contienencontienen el texto el texto integralintegral•• NuméricosNuméricos, audio, , audio, imágenesimágenes, “, “mixtosmixtos””

EstrategiaEstrategia de de búsquedabúsqueda en en unauna base de base de datosdatos : : métodosmétodos para para localizarlocalizar las las páginaspáginas

deldel web invisibleweb invisible

•• CatálogoCatálogo de bases de de bases de datosdatos accesiblesaccesibles : : wwwwww.invisible.invisible--webweb.net.net, en , en francésfrancés ((peropero para la para la internacionalinternacional) ) http://http://dadidadi..enssibenssib..frfr

•• Portales para Portales para loslos sitiossitios deldel web invisible (web invisible (principalmenteprincipalmente de de bibliotecasbibliotecas)): no : no hayhay catálogocatálogo específicoespecífico deldel web invisible web invisible peropero útilútil para para localizarlocalizar bases de bases de datosdatos comocomo las de las de loslos recursosrecursos académicosacadémicos : : http://http://infomineinfomine..ucrucr..eduedu ; ; wwwwww..vlibvlib..orgorg ; ; wwwwww..rdnrdn..acac..ukuk ; ; wwwwww..liilii..orgorg

•• Meta Meta motormotor de de búsquedasbúsquedas especializadasespecializadas : : wwwwww..completeplanetcompleteplanet..comcom ; ; wwwwww.profusion..profusion.comcom//navnav ; ; wwwwww..searchsearch..comcom ((búsquedasbúsquedas especializadasespecializadas) ; ) ; wwwwww..scirusscirus..comcom or or http://http://scholarscholar..googlegoogle..comcom ((informacióninformación científicacientífica), ), etcetc……

•• MotorMotor de de búsquedabúsqueda comocomo GoogleGoogle : : TipoTipo de de preguntapregunta con con unauna palabra clave palabra clave que que describedescribe el campo de el campo de búsquedabúsqueda y y unauna palabra clave palabra clave comocomo “base de “base de datosdatos”.”.

De la De la búsquedabúsqueda de de informacióninformación al al “sourcing”“sourcing”

• Identificación, evaluación y gestión de las fuentes Internet delmétodo y de los conocimientos específicos

• La búsqueda de información “se resume” en la búsqueda de fuentes

• PERO el sourcing es una necesidad para la vigilancia estratégica(y la gestión de favoritos, como lo veremos en la parte “Vigilanciaestratégica en el Net”)

TresTres etapasetapas para para tenertener unauna estrategiaestrategiaganadoraganadora

1. Definición de los campos y áreas de búsqueda (o interés) : frases que definen las necesidades (temas), tipo de contenidosbuscados (Información científica, económica, estadística, reglamentaria, … dominios lingüístico geográfico, categorías de actores, medios

2. Definición de un enfoque semántico : palabras claves y conceptos

3. Definición de las fuentes útiles : sitios académicos, asociaciones, agencias gubernamentales, blogs, bases de datos, foros, newsletters……..

Fuentes de Fuentes de informacióninformación en el Net : en el Net : es es unauna cartografíacartografía complejacompleja !!

MétodoMétodo de “sourcing” de “sourcing” útilesútiles en el Neten el NetEncontrarEncontrar listas de enlaces (listas de enlaces (directamentedirectamente))

UtilizarrUtilizarr páginaspáginasvinculadasvinculadas para para encontrarencontrar fuentesfuentes((utilizandoutilizando el el índiceíndicede de popularidadpopularidad)

Encontrar Encontrar portalesportales

EncontrarEncontrar fuentesfuentes «« similaressimilares aa » » fuentesfuentes conocidasconocidas

)

MENU