11

Click here to load reader

Factorizacion Con Spss

Embed Size (px)

Citation preview

Page 1: Factorizacion Con Spss

Capıtulo 2

ANALISIS FACTORIAL

El analisis factorial intenta identificar variables subyacentes o factores que expliquenla configuracion de las correlaciones dentro de un conjunto de variables observadas. Elanalisis factorial se suele utilizar en la reduccion de los datos para identificar un pe-queno numero de factores que expliquen la mayor parte de la varianza observada de unnumero mayor de variables manifiestas. Tambien puede utilizarse para generar hipote-sis relacionadas con los mecanismos causales o para inspeccionar las variables paraanalisis subsiguientes (por ejemplo, para identificar la colinealidad antes de realizar unanalisis de regresion lineal).

El procedimiento de analisis factorial ofrece un alto grado de flexibilidad:

1. Existen siete metodos de extraccion factorial disponibles.

2. Existen cinco metodos de rotacion disponibles, entre ellos el oblimin directo y elpromax para rotaciones no ortogonales.

3. Existen tres metodos disponibles para calcular las puntuaciones factoriales; y laspuntuaciones pueden guardarse como variables para analisis adicionales.

Por ejemplo. ¿Que actitudes subyacentes hacen que las personas respondan a las pre-guntas de una encuesta polıtica de la manera en que lo hacen? Examinando las corre-laciones entre los elementos de la encuesta se deduce que hay una superposicion signi-ficativa entre los diversos subgrupos de elementos (las preguntas sobre los impuestostienden a estar correlacionadas entre sı, las preguntas sobre temas militares tambienestan correlacionadas entre sı, y ası sucesivamente). Con el analisis factorial, podemosinvestigar el numero de factores subyacentes y, en muchos casos, podremos identificarlo que los factores representan conceptualmente. Adicionalmente, se pueden calcularlas puntuaciones factoriales para cada encuestado, que pueden utilizarse en analisissubsiguientes. Por ejemplo, es posible construir un modelo de regresion logıstica parapredecir el comportamiento de voto basandose en las puntuaciones factoriales.

19

Page 2: Factorizacion Con Spss

20 Analisis Factorial

Entre las salidas que proporciona destaca; para cada variable el numero de casosvalidos, la media y la desviacion tıpica. Para cada analisis factorial obtendremos lamatriz de correlaciones (incluidos niveles de significacion), el determinante, la inversade las variables y la matriz de correlaciones reproducida, que incluye anti-imagen. Pro-porciona ademas la solucion inicial y dentro de esta las comunalidades, los autovaloresy el porcentaje de varianza explicada; la prueba KMO (medida de la adecuacion mues-tral de Kaiser-Meyer-Olkin) y prueba de esfericidad de Bartlett. La Solucion sin rotarcon las saturaciones factoriales, las comunalidades y los autovalores. Si elegimos unarotacion, devuelve la solucion rotada, que incluye la matriz de configuracion rotada yla matriz de transformacion. Para las rotaciones oblicuas las matrices de estructuray de configuracion rotadas; la matriz de coeficientes para el calculo de las puntuacio-nes factoriales y la matriz de covarianza entre los factores. Por ultimo proporciona losgraficos de sedimentacion y el grafico de las saturaciones de los dos o tres primerosfactores.

2.1. Para obtener en analisis factorial

- Elegir en los menus:

AnalizarReduccion de datosAnalisis factorial.

- Seleccionar las variables para el analisis factorial.

Figura 2.1: menu factorial

- Las opciones que proporciona son:

a) Descriptivos.

1) Descriptivos univariados. Incluyen la media, la desviacion tıpica y elnumero de casos validos para cada variable.

2) Solucion inicial. Muestra las comunalidades iniciales, los autovalores yel porcentaje de varianza explicada.

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.

Page 3: Factorizacion Con Spss

Practicas de Analisis Multivariante con SPSS 21

3) Matriz de correlaciones. Las opciones disponibles son los coeficientes, losniveles de significacion, el determinante, la matriz inversa, reproducida,la matriz anti-imagen y la prueba KMO y de esfericidad de Bartlett.

Figura 2.2: descriptivos factorial

b) Extraccion.

1) Metodo. Nos permite especificar el metodo de extraccion factorial. Losmetodos disponibles son: Componentes principales, Mınimos cuadradosno ponderados, Mınimos cuadrados generalizados, Maxima verosimili-tud, factorizacion de Ejes principales, factorizacion Alfa y factorizacionImagen.

2) Analizar. Para especificar o una matriz de correlaciones o una matrizde covarianza.

Figura 2.3: extraer factorial

3) Extraer. Utilizado para retener todos los factores cuyos autovalores ex-cedan un valor especificado o retener un numero especıfico de factores.

4) Mostrar. Permite solicitar la solucion factorial sin rotar y el grafico desedimentacion de los autovalores.

5) Numero maximo de iteraciones para convergencia. Permite especificarel numero maximo de pasos que el algoritmo puede seguir para estimarla solucion.

c) Rotacion.

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.

Page 4: Factorizacion Con Spss

22 Analisis Factorial

1) Metodo. Permite seleccionar el metodo de rotacion factorial. Los meto-dos disponibles son: varimax, equamax, quartimax, oblimin directo ypromax.

2) Mostrar. Para incluir los resultados de la solucion rotada, ası como losgraficos de las saturaciones para los dos o tres primeros factores.

3) Numero maximo de iteraciones para convergencia. Especifica el numeromaximo de pasos que el algoritmo puede seguir para llevar a cabo larotacion.

Figura 2.4: rotacion factorial

d) Puntuaciones factoriales.

1) Guardar como variables. Crea una nueva variable para cada factor en lasolucion final. Los metodos alternativos para calcular las puntuacionesfactoriales son regresion, Bartlett o Anderson-Rubin.

2) Mostrar matriz de coeficientes de las puntuaciones factoriales. Muestralos coeficientes por los cuales se multiplican las variables para obtenerpuntuaciones factoriales. Tambien muestra las correlaciones entre laspuntuaciones factoriales.

Figura 2.5: puntuaciones factoriales

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.

Page 5: Factorizacion Con Spss

Practicas de Analisis Multivariante con SPSS 23

e) Opciones.

1) Valores perdidos. Permite especificar el tratamiento que reciben los valo-res perdidos. Las alternativas disponibles son: Excluir casos segun lista,Excluir casos segun pareja y Reemplazar por la media.

Figura 2.6: opciones factorial

2) Formato de visualizacion de los coeficientes. Permite controlar aspectosde las matrices de resultados. Los coeficientes se ordenan por tamano yse suprimen aquellos cuyos valores absolutos sean menores que el valorespecificado

2.2. Consideraciones sobre los datos.

Las variables deberıan ser cuantitativas a nivel de intervalo o de razon. Los datoscategoricos (como la religion o el paıs de origen) no son adecuados para el analisisfactorial. Los datos para los cuales razonablemente se pueden calcular los coeficientesde correlacion de Pearson, deberıan ser adecuados para el analisis factorial.

Los datos han de tener una distribucion normal bivariante para cada pareja devariables, y las observaciones deben ser independientes. El modelo de analisis factorialespecifica que las variables vienen determinadas por los factores comunes (los factoresestimados por el modelo) y por factores unicos (los cuales no se superponen entre lasdistintas variables observadas); las estimaciones calculadas se basan en el supuesto deque ningun factor unico esta correlacionado con los demas, ni con los factores comunes.

2.3. Ejemplo

Los siguientes datos corresponden a la medicion que sobre 17 humedales se ha reali-zado en una determinada epoca del ano. Las variables medidas han sido las siguientes:

1. X1: Conductividad electrica.

2. X2: Contenido en bicarbonatos.

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.

Page 6: Factorizacion Con Spss

24 Analisis Factorial

3. X3: Contenido en cloruros.

4. X4: Contenido en sulfatos.

5. X5: Contenido en calcio.

6. X6: Contenido en magnesio.

7. X7: Contenido en sodio.

8. X8: Contenido en potasio.

9. X9: Contenido en fosfatos.

Obteniendose los siguientes valores:

Humedal X1 X2 X3 X4 X5 X6 X7 X8 X9Caja 0,315 1,6694 5 86 55 4 4 2 1,8082

Camunas 8 3,7282 2388 7638 2123 972 1757 5 0,3228Capacete 3,41 4,0642 732 881 218 122 379 41 74,588Cerero 3,94 1,4585 1359 772 251 96 710 14 0,0968Chica 2,8 4,4862 220 2510 572 20 458 7 0,0968Dulce 1,56 2,4745 269 495 157 38 162 9 0,3228

FP Salinas 11 1,2206 3038 923 233 226 1488 11 0,0645FP Vicaria 8,75 2,6384 4325 456 234 229 2371 11 1,1947

Grande 2,6 3,3251 840 2270 609 86 284 7 0,5166Gualdal. May 6,37 2,5483 2320 1040 1294 192 485 23 0,4843

Hoyos1 1,18 5,1966 13 499 202 20 5 18 6,7807Lobon 0,57 1,7494 110 42 21 12 60 6 0,5812

Marcela 3,4 2,1189 1121 866 157 115 643 4 0,7426Ratosa 3,48 1,7207 1484 554 151 151 708 7 0,1291

Redonda 4,62 1,0357 472 2964 752 160 652 34 0,1291Salada 3,8 0,8685 1023 2274 1946 360 430 23 0,5489Viso 0,3 1,8567 7 15 39 3 4 2 4,4882

Hay que tener en cuenta que las variables estan medidas en unidades distintas, porlo que en su momento sera necesario tipificar.

Vamos a realizar el analisis factorial por el metodo de componentes principales.Para ello seleccionaremos los menus:

AnalizarReduccion de DatosAnalisis Factorial

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.

Page 7: Factorizacion Con Spss

Practicas de Analisis Multivariante con SPSS 25

E introduciremos todas las variables a analizar. El metodo de componentes prin-cipales es el que realiza SPSS por defecto, para cambiarlo, hemos de pulsar el botonde extraccion y cambiar en la opcion de metodo el de componentes principales por eldeseado.

Figura 2.7: analisis factorial

Lo primero sera determinar cual sera la estructura factorial necesaria, para lo cualusaremos el metodo de Kaiser que determina tantos factores como autovalores mayoresque 1. Este es el metodo que por defecto realiza el programa (se puede cambiar en elboton de Extraccion).

Si aplicamos la regla de Kaiser nos proporcionarıa una estructura factorial con tresfactores que explican el 81.94 % de la varianza total. Sin embargo observamos que elcuarto autovalor, que esta muy cercano a uno, proporciona un factor que determinael 10.693 % de la varianza, por lo tanto decidimos incluirlo tambien en la estructurafactorial. Es decir, finalmente, nos quedarıamos con una estructura factorial de cuatrofactores que explicarıan el 92.010% de la varianza.

Esta decision la observamos tambien en el grafico de sedimentacion:Otras cuestiones adicionales a la hora de tomar decisiones son estadısticos descrip-

tivos, las matriz de correlaciones y su inversa y la prueba de Barlett. Pero nosotros nosvamos a centrar en las comunalidades (que muestran que porcentaje de cada variable

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.

Page 8: Factorizacion Con Spss

26 Analisis Factorial

Figura 2.8: grafico de sedimentacion

es explicado por la nueva estructura factorial) y en la matriz de componentes de lanueva estructura del problema (eliminando los valores menores de 0.3)

Las comunalidades son muy altas, lo cual implica que todas las variables estan muybien representadas en el espacio de los factores (la comunalidad representa el coeficientede correlacion lineal multiple de cada variable con los factores). La estructura factorialno esta muy clara en principio, ya que diversos factores comparten variables, ya que, porejemplo, la variable potasio esta relacionada con los factores segundo, tercero y cuarto,la variable fosfatos aparece tanto en el segundo factor como en el tercero. Lo mismoocurre para las variables sulfatos y calcio respecto a los ejes primero y tercero. Paraobservar esto vemos las representaciones de las variables en el plano de los factoresprimero y tercero, en donde vemos que las dos ultimas variables citadas forman unangulo proximo a 45o con cada eje, lo cual no permite asociarlas a ninguno de ellos(las saturaciones representan en este caso las correlaciones de las variables con cadaeje y por lo tanto el coseno del angulo que forman con ellos). Al mismo tiempo vemoscomo la variable bicarbonato esta cerca del eje del coordenadas, lo cual indica que noesta relacionada con ninguno de los dos ejes.

Todos estos resultados conducen a algunas complicaciones a la hora de interpretarlos factores, por lo que realizamos una rotacion de los ejes con la idea de clarificar laestructura factorial sin perder poder explicativo. Para rotar los ejes solo hemos de elegir

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.

Page 9: Factorizacion Con Spss

Practicas de Analisis Multivariante con SPSS 27

Figura 2.9: grafico

el boton ROTACION y elegir alguno de los metodos que nos aparecen. En nuestro casooptaremos por una rotacion varimax, que produce la siguiente matriz de componentes(las comunalidades no varıan):

Figura 2.10: rotacion varimax

La estructura factorial se ha simplificado y queda:

1. Factor 1 : asociado a las variables conductividad electrica, cloruros, sodio y enmenor proporcion a magnesio. Su poder explicativo es del 44.29 % de la varianzatotal (este porcentaje de inercia se refiere a los ejes que se han obtenido en primerlugar y no tiene por que coincidir con los porcentajes de inercia una vez rotados,aunque si coincide el total explicado, SPSS muestra este porcentaje que en larotacion varimax son de 32.47 %, 29.3 %, 18.14 %, 12.71 %). Teniendo que:

a) La variable conductividad electrica, queda explicada, por el total de losfactores en un 93.6 %, mientras que el primer factor lo es solo en un 84.08 %(89.83% del total del espacio de los factores)

b) La estructura factorial completa determina a la variable cloruros en un95.5 %, siendo atribuible a este factor el 94.28 % (98.31 % del total del es-pacio de los factores)

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.

Page 10: Factorizacion Con Spss

28 Analisis Factorial

c) Respecto de la variable Sodio su comunalidad es del 0.951, 95.1 % de lavarianza explicada (89.11 % por este factor y 93.7% en el espacio de losfactores).

d) La variable magnesio esta explicada por la estructura factorial en el 92 %,tiene menor carga que las anteriores, puesto que vale 0.447, lo que repre-senta casi el 20 % de su varianza (21.71 % de lo que, de ella, representa laestructura factorial)

2. Factor 2 : Asociado a las variables sulfatos, calcio y magnesio y con un poderexplicativo del 20.44 % de la inercia.

a) La variable magnesio esta mas representada por este factor, su saturaciones de 0.845, lo que representa el 71.40 % de su varianza total y el 77.61 %de la explicada por todos los factores.

b) La variable sulfatos, que tiene una comunalidad de 0.93, es explicada poreste eje en un 85.93 % (saturacion 0.927), lo que es un 92.4 % en el espaciode los factores.

c) La variable calcio, que es representada en un 91.5 %, tiene una carga factorialde 0.939 por lo que el 88.17 % de su varianza total viene representada poreste eje (96.36 % de lo explicado por la estructura factorial total)

3. Factor 3 : asociado a potasio y fosfatos y con un porcentaje de inercia explicadadel 17.2 %

a) La variable potasio tiene una comunalidad del 0.922, y este factor aporta el89.68 %, o sea, un 97.26 % de lo explicado por la estructura factorial

b) En cuanto a la variable fosfatos, esta representada en el espacio de los fac-tores por una comunalidad de 0.864, que atribuible al tercer factor es el69.55 %, con una saturacion de 0.834, es decir, el 80.5 % del espacio de losfactores.

4. Factor 4 : este factor esta representado principalmente por la variable bicarbona-tos, la cual esta representada por la estructura factorial en un 94.2 %, La partede la varianza explicada por el factor es 91.39 %, lo que equivale al 97.02 % de lodeterminado por los cuatro factores.

La estructura factorial ha quedado bastante clara y solamente la variable mag-nesio parece que comparte parte de su varianza con dos factores. El siguiente pasoserıa interpretar en terminos geologicos el significado de los factores, o sea, intentarresumir el porque se unen esas variables e incluso intentar dar un nombre a cada factor.

Las graficas bidimensionales y tridimensionales de las variables en el espacio delos factores permiten visualizar la estructura factorial comentada (solo mostramos unabidimensional y una tridimensional).

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.

Page 11: Factorizacion Con Spss

Practicas de Analisis Multivariante con SPSS 29

Figura 2.11: componentes 1 y 3

Figura 2.12: componentes 1, 2 y 3

Estos resultados han sido obtenidos mediante el metodo de componentes principalesy la rotacion varimax, siendo interesante abordar otros metodos de extraccion y otrasrotaciones.

ANALISIS ESTADISTICO MULTIVARIANTE CON SPSS. Curso Basico.