86
Tipos de bases de datos científicas 4

Tipos de bases de datos científicasec3/publicaciones/curso_Chile_2.pdf · • Mala cobertura de las revistas de Humanidades y Ciencias Sociales presentes en otras bases de datos

  • Upload
    others

  • View
    27

  • Download
    0

Embed Size (px)

Citation preview

Tipos de bases de datos científicas

4

Elección de la fuente de información

• Encontrar una BBDD que responda a nuestras necesidades en función de lo que queremos evaluar

• BBDD Nacional o Internacional• BBDD Temática o multidisciplinar• BBDD de producción, actividad científica o

para el análisis

• Producción– WoS– SCOPUS– G Scholar

• BD Bibg. Especializadas:– Psycinfo,

Econlit..• Regionales y

nacionales– CINDOC– Dialnet

• Impacto (revistas)– JCR– SJR

– R&NIn-Recs/jScielo

Fuentes de información científica

• Impacto(autores)– WoS– SCOPUS– Google

Scholar

– R&NIn-Recs/j

• Impacto(Países)- ESI

• ColaboraciónCualquier

BD

Control bibliográfico:

Ulrich´s, Latindex, DICE…• Actividad• Esp@cenet• WIPO• NTIS• UMI

• Teseo

Bases de datos de entorno

INE: Indicadores de I+D, Eurostat

• No son estadísticamente representativas en el sentido tradicional

• Muestran distribuciones sumamente sesgadas• El acceso a los datos es barato, los datos están

muy desglosados y son muy fiables• La obtención de los mismos es casi instantánea• Podemos crear muchos indicadores y hacer

“experimentos”

Algunas consideraciones sobre las fuentes

Web of Knowledge (WOS, JCR, ESI)

• http://www.accesowok.fecyt.es/wos/• BBDD de referencia en la ciencia mundial para

estudios bibliométricos• Cubre las mejores revistas en todas las áreas

temáticas• Indiza más de 10.000 revistas y 100.000 actas

de congresos (40 millones de registros)• Consta de varios índices (SCI, SSCI, AHCI y

CPCI)• Orientación anglosajona y a ciencias básicas• 149 revistas españolas a fecha abril 2009

(Rodríguez-Yunta, L. Revistas españolas en WoS, 2009)

Web of Science (WOS)

Búsqueda básica (13 campos de consulta)

• Year published: año de publicación del artículo

• Timespan: años en que la referencia ha sido procesada por WoS

Cuidado con la búsqueda por fechas

1

2

Búsqueda de autores (authorfinder)

Ejemplo: Emilio Delgado López-Cózar

• Selecciona la forma adecuada

• Añade otra posible firma del autor

3

4

5

Resultados

6 7

8

Refina por áreas o instituciones

• Cuidado con la sintaxis de WoS• Cuidado con los autores con dos apellidos• Cuidado con los homónimos• Cuidado con nombre regionales,

abreviaturas o “nombres artísticos”• Cuidado con los errores de indización• Extremo cuidado al limitar por los campos

afiliación o categoría JCR

O usa directamente la búsqueda básica, pero…

• No admite tildes ni eñes• Sólo la(s) inicial(es) del nombre de pila• Admite operadores booleanos en el

mismo cuadro de búsqueda• Truncamiento con * para ampliar las

búsquedas

Cuidado con la sintaxis de WoS

• El porcentaje de investigadores españoles que aparecen bajo dos o más nombres diferentes oscila entre un 20% y un 40% según los estudios (Costas et al. 2006; Ruiz-Pérez et al. 2002).

• Los propios investigadores son responsables de esta variabilidad en su forma de firma, ya que utilizan distintas formas a lo largo de su producción

• Además, las bases de datos bibliográficas cometen con errores al transcribir la información a su registro electrónico, sobre todo derivadas de sus prácticas de indización adaptadas a las estructuras de nombres ingleses

Cuidado con los autores con dos apellidos

• Es complejo diferenciar entre autores homónimos, apellidos comunes, etc (López E, Rodriguez JM, Garcia A)

• En este caso hay que usar las opciones de WoS para refinar los resultados, a sabiendas de que podemos perder un pequeño porcentaje de la producción del autor

• La mejor forma de evitar este fenómeno es asesorar a los investigadores para que usen firmas lo más distintivas posibles.

Cuidado con los homónimos

• Ramón Moncho• José Luis Koldo• Javier Xavier• Rosario Charo• Cuando hagamos búsquedas de autores es

conveniente visitar antes su web personal, nos puede dar pistas sobre cómo firma, en qué revistas publica, sus colaboradores, …

Cuidado con nombres regionales, abreviaturas o nombres

“artísticos”

Autores

Instituciones

Cuidado con los errores de indización de WoS

AFILIACIÓN• Autores en estancias fuera de la institución a

veces no firman con su institución de origen• Autores con doble filiación a veces no usan ambas• La tipología Proceedings paper incluye sólo la

institución del primer firmanteCATEGORÍA JCR• Las revistas pueden estar asignadas hasta a 5

categorías ISI• Autores con investigación multidisciplinar

Extremo cuidado al limitar por afiliación o categoría

jcr

Para el caso de las instituciones

• Piensa todas las posibles variantes de una institución

• WoS usa abreviaturas estándar y elimina las preposiciones

• universidad = univ; hospital = hosp

• Universidad de Murcia = UnivMurcia

• Universidad Politécnica de Valencia = ?

Para las instituciones

• Opciones de filtrado de los resultados por áreas, tipos de documentos, años, instituciones, países, fuentes, autores, idiomas

• Opciones de análisis de resultados e informes de citación

• Opciones de ordenación• Historial de

búsquedas

• Opciones de exportación, impresión y guardar en listas

• Encuentra las citas a un artículo, libro, … (incluso si no está recogido en WoS) pero ha sido citado desde las revistas indizadas en WoS

• Ejemplo: citas recibidas por los artículos publicados en 2007 en la revista NO ISI Anales de Documentación

Cited Reference Search

• Thomson cuenta con un listado maestro (master list) donde aparecen las revistas recogidas en sus índices de citas http://science.thomsonreuters.com/mjl/

¡Ojo! No confundir con JCR: No todas las revistas incluidas en WoS tienen factor de impacto JCR

Cómo localizar las revistas indexadas en la WoS

• ¿Qué producción tiene la Universidad de Vigo en 2008?– ¿Cuál es su promedio de citas?– ¿Qué país es su principal colaborador?

• ¿Cuántas citas ha recibido Pedro Cavadas en sus trabajos publicados en la revista J PLAST RECONSTR AES ?

• ¿Qué revista tiene como ISSN 1532-2882?– ¿En qué productos de Thomson está

recogida?

Práctica

• http://www.accesowok.fecyt.es/jcr/• Base de datos que recoge los factores de impacto

de las revistas científicas seleccionadas por Thomson Reuters

• Podemos delimitar la búsqueda por año, categoría temática y países

• Recoge otros indicadores como posición de la revista en su categoría, índice de inmediatez, porcentaje de autocitas,

Journal Citation Reports(JCR)

Factor de impacto de la revista

Categorías JCR a las que se adscribe

Posición de la revista en dichas categorías

Información básica de una revista

• Si queremos recopilar sistemáticamente todos los indicadores JCR; FECYT ofrece los listados de impactos en formato exceldesde 2002 http://www.accesowok.fecyt.es/news/2007/20070709.html

Descarga de JCR

• http://www.accesowok.fecyt.es/esi/• Indicadores a nivel macro de producción y citación• Nos proporciona un marco comparativo; podemos

confrontar los registros de un investigador o institución con áreas / países, etc

Essential Science Indicators(ESI)

Papers más citados

Evolución anual Ránking de paises para la categoría

• http://www.scopus.com/• Base de datos multidisciplinar de Elsevier• Competencia directa de WoS• Casi 18.000 titulos diferentes• 38 millones de registros• 16500 revistas revisadas

• Fuente: Scopus in detail

Sin embargo,…

• No es tan selectiva como WoS• Prima la cantidad de fuentes sobre la “calidad” de las mismas

Scopus

Búsqueda básica (18 campos)

Basic Search

Affiliation Search

Búsqueda por institución

Ejemplo 1: Universidad de Murcia

Basic Search

Affiliation Search

Ejemplo 2: AIDICO

Búsqueda por institución

Affiliation Search

Ejemplo: Emilio Delgado López-Cózar

Cuidado en las búsquedas por autor

• Problemas de normalización de autores e instituciones solventadas en gran parte con “authorsearch” y “affiliation search”

• Guiones y tildes en la búsqueda afecta a los resultados

• Autores pueden estar indizados por el segundo apellido

• Errores ortográficos, fallos OCR,…Administradores y gestores documentales deberían ocuparse de la correcta indización de sus autores en las bases de datos internacionales

Cuidado en las búsquedas por autor

• Refinar búsquedas (limitar /excluir)• Añadir categorías de filtrado• Ordenar resultados según criterios ascendente /

descendente• Análisis de citas• Exportar resultados

Resultados

• http://help.scopus.com/flare/Content/tutorials/sc_menu.html

• Master List en http://info.scopus.com/detail/what/documents/title_list.xls

Tutoriales interactivos

• Subproducto de Google especializado en buscar e identificar material bibliográfico publicado de carácter científico-académico

• ¿Qué encuentra?– Referencias bibliográficas con resúmenes– Textos completos– Citas

http://scholar.google.es/

Google Scholar

Diapositiva 39

em1 emilio delgado; 22/08/2008

Simple

Avanzada muy pocas opciones de búsqueda por campos

Búsquedas simple y avanzada

3. Resultado que nos dirige a una fuente secundaria donde se recoge el documento

2. Resultado que nos devuelve una cita

1. Resultado que nos dirige al documento original a texto completo

Tipos de resultados

• Breve descripción bibliográfica del documento (título, autores, revista/fuente, año).

• (1) Tipo de documento, formato (pdf, html) o el tipo documental (libro, cita)

• (2) Flecha verde indica que GS da acceso al texto completo • (3) Web fuente de la información (servidor, repositorio, etc.) • (4) “citado por”, muestra el listado de documentos recopilados por GS

que citan el trabajo• (5) Versiones que ha localizado de un mismo trabajo (preprints, etc).

La versión del editor, si se indexa, es la versión principal. • Otras opciones: exportar el registro a un software de gestión

bibliográfica (6) localizar el documento en una biblioteca (7)

Estructura de un registro en GS

• Identifica y muestra todas las posibles versiones de un documento que figuren en sus índices

• El rastreador de GS identifica todas las localizaciones en distintas URLsa las que puede acceder

Versiones del mismo documento

Diapositiva 43

em2 emilio delgado; 22/08/2008

Versiones del mismo documento

Una comparativa

Lokman I Meho and Kiduk YangImpact of Data Sources on Citation Counts and Rankings of LIS Faculty: Web ofScience vs. Scopus and Google Scholar. JASIST 2004

• Esfuerzo en tratamiento (en horas)– WoS 100 – SCOPUS 200– GS 3000

• Recuperación/cobertura n=5285– (WoS+SCOPUS) 2733

• 2023 WoS, • 2301 SCOPUS • 2552 GS

• Errores– 0,5% WoS, – 4,4% SCOPUS– 12% GS

• Otros datos (Jacsò P, 2008)– 42 mill WoS– 38 mill SCOPUS

– Libros– Artículos de revistas científicas– Comunicaciones y ponencias a congresos– Informes científico-técnicos– Tesis, tesinas o memorias de grado– Trabajos científicos depositados en repositorios, archivos

de preprints– Páginas web personales o institucionales etc…– Cualquier publicación con resumen

• No cubre– Reseñas de libros y editoriales– Libros de texto y monografías– Periódicos y revistas comerciales

Cobertura de Google Scholar

Diapositiva 46

em3 emilio delgado; 22/08/2008

• Tradicional mala cobertura de revistas de Humanidades y Ciencias Sociales. Política de expansión en la actualidad en estos ámbitos del conocimiento.

• Mala cobertura de las revistas de Humanidades y Ciencias Sociales presentes en otras bases de datos (MLA Bibliography, Philosopher’sIndex, PsycInfo, SociologicalAbstracts, …)

• Rigurosos proceso de selección de las revistas científicas, especialmente en la Web of Science

• No existe ningún tipo de control en los procesos de selección de las revistas que indiza por la que todo tipo de revistas tienen cabida

COBERTURA DE REVISTAS CIENTÍFICAS

Comparativa GS vs WoS/ScopusÍndices de citas multidisciplinares

(Web of Science; Scopus)Google Scholar

• Solo localiza citas de revistas y congresos▼

• Localiza citas emitidas por los documentos no cubiertos por otras bases de datos, especialmente desde preprints, congresos o tesis doctorales. Esta característica lo hace especialmente útil para las siguientes disciplinas: Humanidades, Ciencias Sociales e Ingenierías

• Acceso directo al documento si la biblioteca lo tiene contratado

▲• Acceso directo al documento si la biblioteca lo tiene contratado

• Acceso solo a la referencia de los artículos▼• Acceso directo a publicaciones científicas a texto completo y gratuitas

• Dominio de la literatura de carácter anglosajón. Especialmente en WoS

▼• Mayor cobertura de literatura en lenguas nacionales ▲

• Contenidos exclusivamente científicos y mayoritariamente sometidos a revisión

▲• Cobertura de documentos que podrían no ser de carácter académico: programas de asignaturas, guías de biblioteca, temarios, etc...

• Solo cubren los contenidos de revistas científicas y recientemente libros de actas de congresos (WoS: Conference Proceedings Citation Index)

▼• Posibilidad de encontrar documentos muy diversos: pre-prints, artículos revistas, libros, tesis, informes, comunicaciones a congresos…

• Cobertura de una amplia tipología de fuentes de información: repositorios, bases de datos, catálogos on-line de bibliotecas, web personales e institucionales (universidades, institutos de investigación, sociedades científicas, empresas…), productos de Google (Google Patents y Google Books)

• Transparencia absoluta en las fuentes que componen las bases de datos. Disponibilidad de Master List actualizados

▲• Falta de trasparencia en la cobertura. No se declaran acuerdos con editoriales ni de las fuentes que se indizan

COBERTURA GENERAL

• Pago de licencias▼• Libre Acceso▲

PRECIO

Índices de citas multidisciplinares(Web of Science; Scopus)

Google Scholar

• Incluyen diversas opciones de filtrado (disciplina, año, tipo documental) que nos permiten refinar las búsquedas

▲• Solo incluye el filtrado por 7 disciplinas▼

• Cada registro está clasificado en una tipología documental (artículo, revisión, carta, nota, recensión, etc….)

▲• No identifica ante que tipología documental nos encontramos. Tan solo los libros

• Localiza las diferentes versiones de un documento y las agrupa bajo un mismo encabezamiento de título

• Se puede consultar todos los resultados que una consulta genera

▲• Solo se muestran los 1000 documentos en cada consulta

• Posibilidad de exportar los resultados a software de análisis de datos: Histcite, Refviz, NWB, BibExcel

▲• Posibilidad de exportar los resultados a software de análisis de datos: Publish or Perish

• Presenta gran variedad de resultados duplicados

• Costes de procesamiento de la información con menores costes en horas.

▲• Gran coste en el procesamiento de los datos lo que hace difícil su uso en estudios de gran escala.

• Exportación de los resultados en diferentes formatos (RIS, txt, tabulados, etc…)

▲• Solo permite exportar los resultados, uno a uno, a un software bibliográfico.

• Permiten ordenar los resultados según diferentes opciones (Título, Nº de citas, fecha de publicación, primer autor,…)

▲• Los resultados se presentan directamente ordenados por número de citas y no existen otras opciones

• Herramientas de análisis bibliométricos on-linecomo Citation Report en WoS

▲• No tiene ninguna herramienta para analizar resultados

• Posibilidad de buscar en 12 campos diferentes en WoS y 17 en Scopus

▲• Solo ofrece tres campos de búsqueda (Autor, Revista y Año de Publicación)

INTERFAZ, BÚSQUEDAS y RESULTADOS

• Control absoluto de las revistas científicas

• Ausencia de cualquier tipo vocabulario controlado. No existe control de las revistas científicas, éstas pueden aparecer indizadas de diferente forma

• No existe normalización pero tienen herramientas para identificación de autores (WoS=Author Finder)

▲• No existe normalización de los autores▼

CONTROL DE LA INFORMACIÓN

• el texto completo de un trabajo en acceso abierto

• las citas recibidas por un trabajo• los trabajos producidos por un autor• trabajos sobre un tema

Podemos encontrar

•Es adecuado para localizar información concreta (análisis a nivel micro)…

En conclusión

Diapositiva 51

em6 emilio delgado; 22/08/2008

• Los datos de GS no tienen ninguna normalización, consecuencia de la amplia cobertura, la variedad de fuentes de información y el procesamiento automático de la información

• Para la elaboración de un mismo ranking bibliométrico el procesamiento de los datos con WoS lleva 10 horas, con Scopus 20 y con GS 300

• El programa Publish or Perishhttp://www.harzing.com/pop.htm facilita el análisis bibliométrico de resultados de GS, pero es costoso en cuanto al tratamiento de los datos

Pero no es adecuado para realizar análisis

bibliométricos

• Indicadores alternativos al FI• Productos gratuitos y de libre acceso• Usan algoritmos que valoran la importancia

de la revista citante (al modo del PageRankde Google)

• http://www.eigenfactor.org/• http://www.scimagojr.com/• Diferentes fuentes para su cálculo:

Eigenfactor usa WoS; Scimago usa Scopus

Eigenfactor y SJR

http://ec3.ugr.es/in-recs/

http://ec3.ugr.es/in-recj/

IN-RECS e IN-RECJ

• Índice Bibliométrico de Revistas Científicas Españolas de Ciencias Sociales (IN-RECS) y de Ciencias Jurídicas (IN-RECJ)

• Propósito: medir impacto y proporcionar perfiles bibliométricos de Revistas, Artículos, Autores e Instituciones

• Instrumento útil para medir impacto de la ciencia producida y publicada en España

• Paliar lagunas de la WOS (sólo 33 revistas españolas en CCSS y 2 en CCJJ)

• Valorar los hábitos de publicación y citación de los científicos españoles de CCSS y CCJJ

• Proporcionar una herramienta útil a las Agencias Evaluadoras: CNEAI, ANECA, Autonómicas

• Reconocer la idiosincrasia y el carácter regional, nacional o local de la investigación en CCSS y CCJJ

¿Qué es y por qué es necesario?

• Pretende obtener el respaldo de la comunidad científica española

• Alcanzar la máxima representatividad de las distintas especialidades en las que se vertebran las disciplinas científicas de las Ciencias Sociales

• Exigencia de que las revistas fuente posean una acreditada calidad editorial

• Apliquen un sistema riguroso de selección de originales• Cuenten con reputados comités editoriales• Primar la selección sobre la exhaustividad• La ciencia es selectiva por naturaleza (Ley Bradford)• Razones económicas

Algunas consideraciones

Algunas cifras

Detalle Categoría y Autores más citados

Visibilidad de la Ciencia de America Latina

• En los años recientes, la multiplicación de revistas científicas editadas en Iberoamérica podría llevar a afirmar que la región destaca por su fortalecimiento en la comunicación entre académicos. Y si bien ello es cierto, también es preciso reconocer que salvo algunas excepciones, su impacto en la producción global del conocimiento continúa siendo limitado al ámbito local .

• Crece la producción pero disminuye el impacto.

Sistema Regional de Información en Línea para Revistas Científicas de América Latina, el Caribe España y Portugal

OJO tiene dos productos

- DIRECTORIO: 16,963 revistas. Información básica normalizada

- CATÁLOGO: 3,381 revistas. Selección de revistas clasificadas según el cumplimiento de unos criterios de calidad

!

!

El catálogo LATINDEX

● CARACTERÍSTICAS BÁSICAS: mención de cuerpo editorial, antigüedad, mención del director, lugar de edición, entidad editora, etc..

● PRESENTACIÓN: páginas de presentación, tablade contenidos, miembros del consejo editorial, afiliación de los autores, etc..

● GESTIÓN Y POLÍTICA EDITORIAL: sistema de arbitraje, evaluadores externos, autores externos, apertura editorial, cumple la periodicidad, etc..

● CARACTERÍSTICAS DE LOS CONTENIDOS:contenido original, resumen, palabras clave, intrucciones autores, etc…

Metodología de Latindex basada en el cumplimiento de 33 criterios repartidos en 4 bloques

Metodología de evaluación

Dar visibilidad a la producciDar visibilidad a la produccióón cientn cientíífica de calidadfica de calidadMostrar que la ciencia perifMostrar que la ciencia periféérica existe y es de calidadrica existe y es de calidadPosicionar la producciPosicionar la produccióón cientn cientíífica iberoamericanafica iberoamericanaFortalecer los procesos editorialesFortalecer los procesos editorialesInvestigar las caracterInvestigar las caracteríísticassticas, , tendencias, tendencias, etc.etc.Fortalecer el espaFortalecer el españñol y portuguol y portuguéés como vs como víía de a de

comunicacicomunicacióónnConstruirConstruir indicadoresindicadores biliombilioméétricostricos regionalesregionales

www.www.redalycredalyc.org.org

Redalyc características generales

• La Red de Revistas Científicas de América Latina y el Caribe, España y Portugal Redalyc es un proyecto impulsado por la Universidad Autónoma de Estado de México (UAEM), con el objetivo de contribuir a la difusión de la actividad científica editorial que se produce en y sobre Iberoamérica.

• Fue abierto formalmente al público en el mes de octubre del año 2002

• La visibilidad se alcanza al poner a disposición, desde Internet y de libre acceso, los textos completos de los artículos y materiales publicados en las revistas

• Emplea la metodología LATINDEX para la valoración y posterior integración de las publicaciones

• Redalyc implementa el protocolo OAI-PMH, Open Archives Initiative– Protocol for Metadata Harvesting

Evolución REDALYC

REDALYC: PARTICIPACIÓN POR PAÍSES

Búsqueda temáticas

VISIBILIDAD junio 09

Páginas vistas11.5 millones

Usuarios únicos1.8 millonesArtículos

descargados3.9 millones

Redes de colaboración entre países

Redes institucionales

Redes institucionales

Redes de colaboración entre autores