Upload
moises-betancort
View
5.166
Download
4
Embed Size (px)
DESCRIPTION
Citation preview
TIPOS DE APLICACIONES DEL
A. MULTIVARIADO1. Reducir la dimensionalidad de un problema (análisis de
componentes principales, análisis factorial, escalamiento
multidimensional
2. Estudio de la dependencia múltiple de un conjunto de
variables (correlación canónica)
3. Clasificar sujetos o grupos preestablecidos (análisis
discriminante, regresión logística)
4. Comparar grupos en múltiples variables dependientes
(análisis multivariado de la varianza: MANOVA)
Cuando queremos estudiar la influencia de una o más variables independientes
sobre dos o más variables dependientes utilizamos el MANOVA.
El MANOVA detecta si hay diferencias entre grupos a través de una combinación
lineal de las variables dependientes.
El MANOVA estudia si existen diferencias significativas entre las medias de las
variables dependientes en los niveles de las variables independientes (Camacho)
Al igual que en el ANOVA, el MANOVA ejecuta primero un test omnibus (global)
de significación y luego anovas univariados en cada una de las variables
dependientes.
Existe cierta controversia sobre si los análisis sobre las variables dependientes
deben hacerse siguiendo un modelo anova o un análisis discriminante.
Uno de las ventajas del MANOVA es que tiene en cuenta la correlación entre las
variables dependientes.
t-test vs. ANOVA vs. MANOVA
En la siguiente tabla podemos ver las diferencias en cuanto a las variables
independientes y dependientes que hay entre las tres técnicas más utilizadas
en Ciencias Sociales
Test Variables Independientes Variables Dependientes
t-test Una Una
ANOVA Múltiples Una
MANOVA Múltiples Múltiples
1. El MANOVA permite el uso de múltiples medidas
2. Puede que no encontremos diferencias entre dos variables dependientes
correlacionadas si las evaluamos separadamente
3. Llevar a cabo múltiples ANOVAS nos lleva a aumentar la tasa de error tipo I
Teoría detrás del MANOVA..
En el ANOVA la ratio F recoge la variación sistemática dividida por la
variación aleatoria…
2 2 2
intergrupo intragrupo =
ij j j ij j
j i j
Y Y n Y Y Y Y
SCT SC SC
Inter IntraInter Intra
Inter Intra
SC SCMC MC
gl gl
1
Inter Intra
Inter
Intra
E MC E MC
MCF E F
MC
ANOVA
accion conductas compuls ivas
10.467 2 5.233 2.771 .080
51.000 27 1.889
61.467 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrát ica F Sig.
ANOVA
pensamiento conductas obsesivas
19.467 2 9.733 2.154 .136
122.000 27 4.519
141.467 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrát ica F Sig.
Observa el siguiente ejemplo… un ANOVA para cada variable
dependiente….
ANOVA
accion conductas compuls ivas
10.467 2 5.233 2.771 .080
51.000 27 1.889
61.467 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrát ica F Sig.
2 2 2
ij j j ij j
j i j
Y Y n Y Y Y Y
intergrupo intragrupo =
61.467 = 10.467 51.000
SCT SC SC
Inter Inter Inter Intra Intra IntraMC SC gl MC SC gl
5.233= 2.771 0.05
1.889
Inter
Intra
MCF F p
MC
En el MANOVA dado que tenemos más de una variable dependiente hay que
recoger la relación entre las mismas y por tanto ya no hacemos una ratio de
sumas de cuadrados (como en el ANOVA) sino una ratio de matrices de
varianzas-covarianzas. Estas matrices se denominan Sumas Cuadradas de
Productos Cruzados (SCPC).
Un producto cruzado no es más que el sumatorio de la diferencia entre las
puntuaciones en una variable X y su media, multiplicado por las puntuaciones en
otra variable Y menos su media.
Teoría detrás del MANOVA..
( ) ( )i iX X Y Y
MANOVA tiene en cuenta la correlación entre las variables dependientes a
través de estos productos cruzados
Dos variables Dependientes. El concepto de productos cruzados
.
.
.
i i
j j
i j i j
PC Total A A P P
PC Expl n A A P P
PC Err A A P P
Como en el ANOVA tenemos tres tipos de fuentes de variación o tres tipos de
matrices de productos cruzados. La total (T), la debida a la variación
sistemática (H) o del modelo, y la debida al error, o no sistemática (E).
Vamos a crear tres matrices que combinen los productos cruzados
y las sumas cuadráticas univariadas
( )
.
.
61.47 5.47
5.47 141.47
Accion
Pensamiento
SCPC Total
SCT PC Total
PC Total SCT
T
ANOVA
accion conductas compuls ivas
10.467 2 5.233 2.771 .080
51.000 27 1.889
61.467 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrát ica F Sig.
ANOVA
pensamiento conductas obsesivas
19.467 2 9.733 2.154 .136
122.000 27 4.519
141.467 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrát ica F Sig.
( )
.
.
51 13
13 122
Accion
Pensamiento
SCPC Error
SCE PC Error
PC Error SCE
E
ANOVA
accion conductas compuls ivas
10.467 2 5.233 2.771 .080
51.000 27 1.889
61.467 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrát ica F Sig.
ANOVA
pensamiento conductas obsesivas
19.467 2 9.733 2.154 .136
122.000 27 4.519
141.467 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrát ica F Sig.
( )
.
.
10.47 7.53
7.53 19.47
Accion
Pensamiento
SCPC Modelo
SCExp PC Expl
PC Expl SCExp
H
ANOVA
accion conductas compuls ivas
10.467 2 5.233 2.771 .080
51.000 27 1.889
61.467 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrát ica F Sig.
ANOVA
pensamiento conductas obsesivas
19.467 2 9.733 2.154 .136
122.000 27 4.519
141.467 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrát ica F Sig.
61.47 5.47 51 13 10.47 7.53
5.47 141.47 13 122 7.53 19.47T E H
1
1
1
10.47 7.53 0.0202 0.0021
7.53 19.47 0.0021 0.0084
0.2273 0.0852
0.1930 0.1794
Inter
Intra
MCF E F
MC
Mult HE
HE
Sumas de Cuadrados y productos cruzados para el ejemplo anterior
Para dividir matrices lo que
hacemos es multiplicar una
por la inversa de la otra…..
Hay distintas manera de resolver esta matriz para
alcanzar un valor de estadístico multivariado que
permita aproximar a F y evaluar la H0 del efecto
multivariado...
Una vez calculadas las SCPC para el Error y la Hipótesis podemos aplicar dos
métodos.
1. Calcular el determinante de las SCPC anteriores hallando en este caso el valor
del estadístico multivariado lambda de Wilks...
2. Calcular los autovectores (eigenvector) y autovalores (eigenvalues) de la matriz
HE-1. Estos autovalores nos muestran la ratio entre la varianza sistemática
debida al efecto y la varianza error. El concepto de autovalor es básico en el
análisis multivariado. Conceptualmente se puede interpretar como la cantidad
de variabilidad que tenemos en nuestros datos. Veamos gráficamente que es
un autovector y un autovalor…
SCPCerror
SCPC SCPCerrorefecto
La Fig. 1 muestra un patrón de ausencia de correlación entre dos variables. Por el
contrario la Fig. 2 muestra un patrón de correlación positiva entre dos variables. La
longitud y la altura de esta elipse se corresponden con los autovectores de la matriz de
correlaciones de estas dos variables. Cada autovector tiene un autovalor (eigenvalue)
que nos da la distancia entre los dos puntos de dichos vectores. De tal manera que
estos dos valores nos muestran cómo se distribuye la variabilidad en nuestra matriz de
correlaciones
Figura 1 Figura 2
10.2273 0.0852
0.1930 0.1794
0.603 0.425.
0.335 0.339
0.335 0.
0 0.073
HE
Vector propio
Valor propio
El cálculo de los autovalores o valores propios de la matriz HE-1 nos permite pasar
obtener la ratio de una variabilidad con respecto a la otra obteniendo dos valores que
recogen cúanto explica nuestro modelo del total de la variabilidad de los datos…
hemos reducido cuatro valores a
dos valores para el cálculo de la
razón de variabilidad explicada
frente a no explicada..
Finalmente el cálculo del estadístico se puede hacer por distintas fórmulas..
Todas ellas tienes aproximaciones a la distribución F para hacerla más
manejable…
1 1
si
i i
V
1
s
i
i
T
1
1
1
s
i i
Traza de Pillai-Bartlett. Siendo s el
número de funciones y lambda los
eigenvalue
Traza de Hotelling. Siendo s el
número de funciones y lambda los
eigenvalue
Lambda de Wilks. Siendo s el número
de funciones y lambda los eigenvalue.
Compara esta fórmula con la anterior
que vimos..
La buena noticia es que todo esto lo hace el SPSS… ¿cómo? El siguiente
ejemplo nos servirá
Factores inter-sujetos
TCC 10
TC 10
Control 10
1.00
2.00
3.00
grupo
group
Etiqueta
del valor N
Estadísticos descriptivos
4.90 1.197 10
3.70 1.767 10
5.00 1.054 10
4.53 1.456 30
13.40 1.897 10
15.20 2.098 10
15.00 2.357 10
14.53 2.209 30
grupo group
TCC
TC
Control
Total
TCC
TC
Control
Total
acc ion conductas
compuls iv as
pensamiento
conductas obses ivas
Media Desv. típ. N
Prueba de Box sobre la igualdad
de las matrices de covarianzasa
9.959
1.482
6
18168.923
.180
M de Box
F
gl1
gl2
Signif icación
Contras ta la hipótesis nula de que las matrices
de cov arianza observ adas de las v ariables
dependientes son iguales en todos los grupos.
Diseño: Intercept+grupoa.
Igual que en el ANOVA necesitamos
comprobar la igual de varianzas. En este
caso covarianzas
Contrastes multivariadosd
.983 745.230b 2.000 26.000 .000 .983 1490.459 1.000
.017 745.230b 2.000 26.000 .000 .983 1490.459 1.000
57.325 745.230b 2.000 26.000 .000 .983 1490.459 1.000
57.325 745.230b 2.000 26.000 .000 .983 1490.459 1.000
.318 2.557 4.000 54.000 .049 .159 10.227 .684
.699 2.555b 4.000 52.000 .050 .164 10.218 .682
.407 2.546 4.000 50.000 .051 .169 10.183 .678
.335 4.520c 2.000 27.000 .020 .251 9.040 .722
Traza de Pillai
Lambda de Wilks
Traza de Hotelling
Raíz mayor de Roy
Traza de Pillai
Lambda de Wilks
Traza de Hotelling
Raíz mayor de Roy
EfectoIntersección
grupo
Valor F
Gl de la
hipótesis Gl del error Signif icación
Eta al
cuadrado
parcial
Parámetro de
no centralidad
Potencia
observ adaa
Calculado con alfa = .05a.
Estadíst ico exactob.
El estadís tico es un límite superior para la F el cual of rece un límite inf erior para el nivel de signif icación.c.
Diseño: Intercept+grupod.
Los contrastes Multivariados nos dicen si las medias en las variables
dependientes son distintas en los grupos. Observa los valores de significación
¿Qué te sugieren?...
¡¡¡¡ recuerda !!!!
MANOVA ha generado una combinación lineal de las variables dependientes,
función, en la que lleva a cabo los contrastes de medias multivariados
Pruebas de los efectos inter-sujetos
10.467b
2 5.233 2.771 .080 .170 5.541 .500
19.467c
2 9.733 2.154 .136 .138 4.308 .402
616.533 1 616.533 326.400 .000 .924 326.400 1.000
6336.533 1 6336.533 1402.348 .000 .981 1402.348 1.000
10.467 2 5.233 2.771 .080 .170 5.541 .500
19.467 2 9.733 2.154 .136 .138 4.308 .402
51.000 27 1.889
122.000 27 4.519
678.000 30
6478.000 30
61.467 29
141.467 29
Variable dependienteacc ion conductas
compulsiv as
pensamiento
conductas obsesiv as
acc ion conductas
compulsiv as
pensamiento
conductas obsesiv as
acc ion conductas
compulsiv as
pensamiento
conductas obsesiv as
acc ion conductas
compulsiv as
pensamiento
conductas obsesiv as
acc ion conductas
compulsiv as
pensamiento
conductas obsesiv as
acc ion conductas
compulsiv as
pensamiento
conductas obsesiv as
FuenteModelo corregido
Intersección
grupo
Error
Total
Total corregida
Suma de
cuadrados
tipo II I gl
Media
cuadrát ica F Signif icación
Eta al
cuadrado
parcial
Parámetro de
no centralidad
Potencia
observ adaa
Calculado con alfa = .05a.
R cuadrado = .170 (R cuadrado corregida = .109)b.
R cuadrado = .138 (R cuadrado corregida = .074)c.
Anovas UNIVARIADOS sobre cada variable denpendiente con la
variable independiente grupo ¿Qué puedes concluir?
Matriz SCPC inter-sujetos
616.533 1976.533
1976.533 6336.533
10.467 -7.533
-7.533 19.467
51.000 13.000
13.000 122.000
acc ion conductas
compulsivas
pensamiento
conductas obsesivas
acc ion conductas
compulsivas
pensamiento
conductas obsesivas
acc ion conductas
compulsivas
pensamiento
conductas obsesivas
Intersección
grupo
Hipótesis
Error
acc ion
conductas
compulsivas
pensamiento
conductas
obsesivas
Basado en la suma de cuadrados tipo III
61.47 5.47 51 13 10.47 7.53 = +
5.47 141.47 13 122 7.53 19.47T E H
Le hemos pedido a SPSS que nos de las SCPC…. Recuerda que es sobre
estas matrices que hacemos los cálculos en MANOVA…
¿Hay diferencias
entre las medias de
los niveles de la
variable grupo para
las variables
dependientes?..
¿qué vemos…?
Comparaciones múltiples
1.20 .615 .061 -.06 2.46
-.10 .615 .872 -1.36 1.16
-1.20 .615 .061 -2.46 .06
-1.30* .615 .044 -2.56 -.04
.10 .615 .872 -1.16 1.36
1.30* .615 .044 .04 2.56
1.20 .615 .184 -.37 2.77
-.10 .615 1.000 -1.67 1.47
-1.20 .615 .184 -2.77 .37
-1.30 .615 .131 -2.87 .27
.10 .615 1.000 -1.47 1.67
1.30 .615 .131 -.27 2.87
1.20 .615 .173 -.36 2.76
-.10 .615 .998 -1.66 1.46
-1.20 .615 .173 -2.76 .36
-1.30 .615 .126 -2.86 .26
.10 .615 .998 -1.46 1.66
1.30 .615 .126 -.26 2.86
-1.80 .951 .069 -3.75 .15
-1.60 .951 .104 -3.55 .35
1.80 .951 .069 -.15 3.75
.20 .951 .835 -1.75 2.15
1.60 .951 .104 -.35 3.55
-.20 .951 .835 -2.15 1.75
-1.80 .951 .207 -4.23 .63
-1.60 .951 .312 -4.03 .83
1.80 .951 .207 -.63 4.23
.20 .951 1.000 -2.23 2.63
1.60 .951 .312 -.83 4.03
-.20 .951 1.000 -2.63 2.23
-1.80 .951 .193 -4.22 .62
-1.60 .951 .280 -4.02 .82
1.80 .951 .193 -.62 4.22
.20 .951 .996 -2.22 2.62
1.60 .951 .280 -.82 4.02
-.20 .951 .996 -2.62 2.22
(J) group
TC
Control
TCC
Control
TCC
TC
TC
Control
TCC
Control
TCC
TC
TC
Control
TCC
Control
TCC
TC
TC
Control
TCC
Control
TCC
TC
TC
Control
TCC
Control
TCC
TC
TC
Control
TCC
Control
TCC
TC
(I) group
TCC
TC
Control
TCC
TC
Control
TCC
TC
Control
TCC
TC
Control
TCC
TC
Control
TCC
TC
Control
DMS
Bonf erroni
Sidak
DMS
Bonf erroni
Sidak
Variable dependiente
acc ion conductas
compuls iv as
pensamiento
conductas obses iv as
Dif erencia
entre
medias (I-J) Error t íp. Signif icación Límite inf erior
Límite
superior
Interv alo de conf ianza al
95%.
Basado en las medias observ adas.
La dif erencia de medias es signif icativ a al niv el .05.*.
Aquí hemos llevado a cabo un contraste simple en el que comparamos los grupos de
tratamiento frente a control (3) en cada variable dependiente… este tipo de contraste se
pide en el SPSS en contrastes…
¿qué podemos concluir de esta tabla?..
Resultados del contras te (m atriz K)
-.100 -1.600
0 0
-.100 -1.600
.615 .951
.872 .104
-1.361 -3.551
1.161 .351
-1.300 .200
0 0
-1.300 .200
.615 .951
.044 .835
-2.561 -1.751
-.039 2.151
Estimación del contraste
Valor hipotetizado
Diferencia (Estimado - Hipotetizado)
Error típ.
Significac ión
Límite inferior
Límite superior
Intervalo de confianza al
95 % para la diferencia
Estimación del contraste
Valor hipotetizado
Diferencia (Estimado - Hipotetizado)
Error típ.
Significac ión
Límite inferior
Límite superior
Intervalo de confianza al
95 % para la diferencia
Contraste simple groupa
Nivel 1 - Nivel 3
Nivel 2 - Nivel 3
acc ion
conductas
compulsivas
pensamiento
conductas
obsesivas
Variable dependiente
Categoría de referencia = 3a.
A practicar…