1
RESULTADOS Las gráficas siguientes muestran la representación HJ-Biplot en los planos factoriales 1-2 (izq) y 2-3 (dcha), los cuales capturan el 67,84% de la información. Propuesta de aplicabilidad del método multivariante gráfico Biplot a los estudios bibliométricos en biomedicina Arias Díaz-Faes A 1 , Benito-García N 1 , Martín-Rodero H 2 , Vicente-Villardón JL 1 1 Departamento de Estadística. Universidad de Salamanca 2 Biblioteca de la Facultad de Medicina. Universidad de Salamanca RESUMEN El uso de indicadores bibliométricos se ha asumido como una metodología imprescindible para evaluar la actividad científica en cualquier disciplina, sin embargo, la metodología de representación gráfica que debería llevar asociada, para facilitar su comprensión, no ha adquirido la misma relevancia. En estudios bibliométricos abundan representaciones descriptivas uni y bivariantes, quedando el uso de los Métodos Multivariantes Gráficos reducido a las técnicas de Análisis de Componentes Principales, Análisis Clúster y Análisis de Correspondencias. Se propone la utilización del método multivariante HJ-Biplot (Galindo, 1986) como técnica que va a permitir una representación e interpretación más rica de los resultados, gracias a la utilización de conceptos geométricos sencillos. Se aplica para la evaluar la actividad científica del área biosanitaria, en las universidades de Castilla y León. MATERIAL Y MÉTODOS Con objeto de demostrar la aplicabilidad del HJ-Biplot en los estudios bibliométricos, se ha realizado un análisis de datos reales tomados de la base Science Citation Index (ISI Web of Science). La búsqueda se ha limitado a los centros universitarios de CyL, quedando la misma definida en los siguientes términos: CI=(Salamanca OR Valladolid OR Leon OR Burgos) AND CU=Spain. Las áreas temáticas seleccionadas han sido: Parasitology’ , ‘Microbiology’, ‘Public, Environmental & Occupational Health’ y ‘Biotechnology & Applied Microbiology’. El marco cronológico se delimitó al período 2004-2009. Se ha utilizado el programa estadístico MultBiplot desarrollado por Vicente-Villardón (2010) SOFTWARE MultBiplot (Vicente- Villardón JL, 2010) CONCLUSIONES Se demuestra la idoneidad del HJ-Biplot como herramienta de inspección de grandes matrices de datos bibliométricos. Se han encontrado patrones de publicación comunes entre la Universidad de Salamanca y el CSIC, fundamentalmente, en el ámbito de la Microbiología, siendo la revista que recibe más contribuciones: Int J Syst Evol Microbiol. Las publicaciones de la Universidad de León se concentran principalmente en el área Biotecnológica, mientras que la Universidad de Valladolid presenta mayor dispersión en sus pautas de publicación. OBJETIVOS Poner de manifiesto que el método estadístico HJ-Biplot puede ser utilizado como herramienta de inspección de grandes matrices de datos bibliométricos. Caracterizar la producción científica de los centros universitarios de CyL. * Los Centros vienen identificados con vectores y las Revistas con puntos. Ángulos agudos entre dos vectores, que representan a dos Centros, indican que ambos Centros tienen un perfil de publicación similar. Así, podemos afirmar que la USAL y el CSIC de Salamanca publican en las mismas revistas. La ULE y la UVA presentan también patrones similares entre ellas y con el grupo Otras. Por otro lado, los perfiles de publicación de la USAL y la ULE no son similares (ángulo recto entre los vectores que las representan indican independencia) -ver plano 1-2-. Las calidades de representación de la UBU y los Hospitales de CyL en el plano 1-2 no son óptimas, por ello, se interpretarán en el plano 2-3. Las proyecciones de los puntos, que representan a las Revistas, sobre el vector nos permiten estimar el número de publicaciones de cada centro en una revista concreta. Por tanto, las revistas en las que más publican el CSIC y la USAL son IJSEM, seguida de NM, EC, VPE e IM . Este grupo de revistas, pertenecientes en su mayoría al ámbito de la Microbiología, forman un Cluster (Cluster 1) bien diferenciado del resto . Interpretando las proyecciones sobre el vector que representa a la Universidad de León podemos afirmar que la mayor parte de su producción se agrupa, principalmente, en BT y AMB; revistas en la que los investigadores de la Universidad de Salamanca apenas publican. En las revistas AEM, FML y PR publican investigadores de Salamanca, León y Valladolid, aunque el número de artículos es claramente menor. Éstas, junto con las citadas anteriormente (BT y AMB) forman otro Cluster (Cluster 3) bien diferenciado. El resto de las revistas conforman el Cluster 2 que se caracteriza por la nula representatividad de las Universidades de León y Valladolid (proyectan en la parte negativa de los vectores que las representan) y la baja producción de los investigadores salmantinos (proyectan cerca del origen pero en la parte positiva). El plano 2-3 muestra como la Universidad de León y, en menor medida, la Universidad de Burgos concentran su producción científica en revistas de Biotecnología e Ingeniería Medioambiental que se corresponden con el Cluster 3 sobre ese plano. Al proyectar sobre el vector que representa a los Hospitales Universitarios de CyL en el plano 2-3, se observa que la revista Enfermedades Infecciosas y Microbiología Clínica es la que recibe mayores aportaciones. MATRIZ DE DATOS Consta de 130 filas que se corresponden con las frecuencias de publicación en cada Revista durante el período señalado y, 7 columnas que contienen los Centros objeto de análisis: Universidad de Salamanca, Universidad de León, Universidad de Valladolid, Universidad de Burgos, CSIC, Hospitales de CyL y Otras (centros mixtos). REFERENCIAS - Gabriel KR. The biplot-graphic display of matrices with application to principal component analysis. Biometrika. 1971; 58: 452- 467 - Galindo MP. Una alternativa de representación simultánea: HJ-Biplot. Qüestiió. 1986; 10 (1): 13-23 - Galindo MP, Cuadras CM. Una extensión del método biplot a su relación con otras técnicas. Publicación de Bioestadística y INTRODUCCIÓN Un Biplot, para una matriz de datos X nxp , es una representación gráfica mediante marcadores g 1 , g 2 , ….,g n para las filas de X y h 1 , h 2 , ….,h p para las columnas de X, de forma que el producto escalar g i T h j aproxime el elemento x ij de la matriz de partida, tan bien como sea posible (Gabriel, 1971). Los Biplot, propuestos por Gabriel, fueron dos: JK-Biplot, en el cual las filas son representadas con la máxima calidad de representación, pero las columnas vienen mal representadas, y el GH-Biplot en el cual las columnas son representadas con la máxima calidad, pero no las filas. Galindo, en 1986, propone el HJ-Biplot, una representación gráfica multivariante de los datos de una matriz X nxp , mediante marcadores j 1 .,…,j p para las filas y h 1 ,..., h p para las columnas, elegidos de forma que ambos marcadores puedan ser superpuestos en un mismo sistema de referencia, con máxima calidad de representación. El HJ Biplot no reproduce los datos, pero proporciona las mejores representaciones Beta-Baricéntricas. 1. HJ Biplot ejes 1-2 2. HJ Biplot ejes 2-3

RESULTADOS

  • Upload
    qabil

  • View
    25

  • Download
    0

Embed Size (px)

DESCRIPTION

Propuesta de aplicabilidad del método multivariante gráfico Biplot a los estudios bibliométricos en biomedicina Arias Díaz-Faes A 1 , Benito-García N 1 , Martín-Rodero H 2 , Vicente-Villardón JL 1 1 Departamento de Estadística. Universidad de Salamanca - PowerPoint PPT Presentation

Citation preview

Page 1: RESULTADOS

RESULTADOS

Las gráficas siguientes muestran la representación HJ-Biplot en los planos factoriales 1-2 (izq) y 2-3 (dcha), los cuales capturan el 67,84% de la información.

Propuesta de aplicabilidad del método multivariante gráfico Biplot a los estudios bibliométricos en biomedicina

Arias Díaz-Faes A1, Benito-García N1, Martín-Rodero H2, Vicente-Villardón JL1

1 Departamento de Estadística. Universidad de Salamanca

2 Biblioteca de la Facultad de Medicina. Universidad de Salamanca

RESUMEN

El uso de indicadores bibliométricos se ha asumido como una metodología imprescindible para evaluar la actividad científica en cualquier disciplina, sin embargo, la metodología de

representación gráfica que debería llevar asociada, para facilitar su comprensión, no ha adquirido la misma relevancia. En estudios bibliométricos abundan representaciones descriptivas uni y

bivariantes, quedando el uso de los Métodos Multivariantes Gráficos reducido a las técnicas de Análisis de Componentes Principales, Análisis Clúster y Análisis de Correspondencias. Se

propone la utilización del método multivariante HJ-Biplot (Galindo, 1986) como técnica que va a permitir una representación e interpretación más rica de los resultados, gracias a la utilización

de conceptos geométricos sencillos. Se aplica para la evaluar la actividad científica del área biosanitaria, en las universidades de Castilla y León.

MATERIAL Y MÉTODOS

Con objeto de demostrar la aplicabilidad del HJ-Biplot en los estudios bibliométricos, se ha realizado un

análisis de datos reales tomados de la base Science Citation Index (ISI Web of Science).

La búsqueda se ha limitado a los centros universitarios de CyL, quedando la misma definida en los

siguientes términos: CI=(Salamanca OR Valladolid OR Leon OR Burgos) AND CU=Spain. Las áreas

temáticas seleccionadas han sido: ‘Parasitology’, ‘Microbiology’, ‘Public, Environmental & Occupational

Health’ y ‘Biotechnology & Applied Microbiology’. El marco cronológico se delimitó al período 2004-2009. Se

ha utilizado el programa estadístico MultBiplot desarrollado por Vicente-Villardón (2010)

SOFTWARE

MultBiplot (Vicente-Villardón JL, 2010)

CONCLUSIONES Se demuestra la idoneidad del HJ-Biplot como herramienta de inspección de grandes matrices de datos bibliométricos.

Se han encontrado patrones de publicación comunes entre la Universidad de Salamanca y el CSIC, fundamentalmente, en el ámbito de la Microbiología, siendo la revista que recibe más contribuciones: Int J Syst Evol Microbiol.

Las publicaciones de la Universidad de León se concentran principalmente en el área Biotecnológica, mientras que la Universidad de Valladolid presenta mayor dispersión en sus pautas de publicación.

OBJETIVOS

Poner de manifiesto que el método estadístico HJ-Biplot puede ser utilizado como herramienta de

inspección de grandes matrices de datos bibliométricos.

Caracterizar la producción científica de los centros universitarios de CyL.

* Los Centros vienen identificados con vectores y las Revistas con puntos.

Ángulos agudos entre dos vectores, que representan a dos Centros, indican que ambos Centros tienen un perfil de publicación similar . Así, podemos afirmar que la USAL y el CSIC de Salamanca publican en

las mismas revistas. La ULE y la UVA presentan también patrones similares entre ellas y con el grupo Otras. Por otro lado, los perfiles de publicación de la USAL y la ULE no son similares (ángulo recto entre los

vectores que las representan indican independencia) -ver plano 1-2-. Las calidades de representación de la UBU y los Hospitales de CyL en el plano 1-2 no son óptimas, por ello, se interpretarán en el plano 2-3.

Las proyecciones de los puntos, que representan a las Revistas, sobre el vector nos permiten estimar el número de publicaciones de cada centro en una revista concreta. Por tanto, las revistas en las que más

publican el CSIC y la USAL son IJSEM, seguida de NM, EC, VPE e IM . Este grupo de revistas, pertenecientes en su mayoría al ámbito de la Microbiología, forman un Cluster (Cluster 1) bien diferenciado del resto .

Interpretando las proyecciones sobre el vector que representa a la Universidad de León podemos afirmar que la mayor parte de su producción se agrupa, principalmente, en BT y AMB; revistas en la que los

investigadores de la Universidad de Salamanca apenas publican. En las revistas AEM, FML y PR publican investigadores de Salamanca, León y Valladolid, aunque el número de artículos es claramente menor. Éstas,

junto con las citadas anteriormente (BT y AMB) forman otro Cluster (Cluster 3) bien diferenciado.

El resto de las revistas conforman el Cluster 2 que se caracteriza por la nula representatividad de las Universidades de León y Valladolid (proyectan en la parte negativa de los vectores que las representan) y la baja

producción de los investigadores salmantinos (proyectan cerca del origen pero en la parte positiva).

El plano 2-3 muestra como la Universidad de León y, en menor medida, la Universidad de Burgos concentran su producción científica en revistas de Biotecnología e Ingeniería Medioambiental que se corresponden

con el Cluster 3 sobre ese plano.

Al proyectar sobre el vector que representa a los Hospitales Universitarios de CyL en el plano 2-3, se observa que la revista Enfermedades Infecciosas y Microbiología Clínica es la que recibe mayores aportaciones.

MATRIZ DE DATOSConsta de 130 filas que se corresponden con las frecuencias de publicación en cada Revista durante el período señalado y, 7 columnas que contienen los Centros objeto de análisis:

Universidad de Salamanca, Universidad de León, Universidad de Valladolid, Universidad de Burgos, CSIC, Hospitales de CyL y Otras (centros mixtos).

REFERENCIAS

- Gabriel KR. The biplot-graphic display of matrices with

application to principal component analysis. Biometrika. 1971;

58: 452-467

- Galindo MP. Una alternativa de representación simultánea:

HJ-Biplot. Qüestiió. 1986; 10 (1): 13-23

- Galindo MP, Cuadras CM. Una extensión del método biplot

a su relación con otras técnicas. Publicación de

Bioestadística y Biomatemática. Universidad de Barcelona.

1986; 17

INTRODUCCIÓNUn Biplot, para una matriz de datos Xnxp, es una representación gráfica

mediante marcadores g1, g2, ….,gn para las filas de X y h1, h2, ….,hp para las

columnas de X, de forma que el producto escalar g iT hj aproxime el elemento

xij de la matriz de partida, tan bien como sea posible (Gabriel, 1971).

Los Biplot, propuestos por Gabriel, fueron dos: JK-Biplot, en el cual las filas

son representadas con la máxima calidad de representación, pero las

columnas vienen mal representadas, y el GH-Biplot en el cual las columnas

son representadas con la máxima calidad, pero no las filas.

Galindo, en 1986, propone el HJ-Biplot, una representación gráfica

multivariante de los datos de una matriz Xnxp , mediante marcadores j1.,…,jp

para las filas y h1,..., hp para las columnas, elegidos de forma que ambos

marcadores puedan ser superpuestos en un mismo sistema de referencia,

con máxima calidad de representación. El HJ Biplot no reproduce los datos,

pero proporciona las mejores representaciones Beta-Baricéntricas.

1. HJ Biplot ejes 1-2 2. HJ Biplot ejes 2-3