06/02/2013
1
Introducción al uso de ANOVA, Kruskal-Wallis,
Friedman, Correlación(con STATA)
Juan Carlos Bazo Alvarez
UNIVERSIDAD PERUANA CAYETANO HEREDIAFACULTAD DE CIENCIAS Y FILOSOFÍA
DEPARTAMENTO DE ESTADÍSTICA, DEMOGRAFÍA, HUMANIDADES Y CIENCIAS SOCIALES.
Introducción
A pedido de los organizadores de este pequeño taller(ADIECS-UNMSM), hemos estructurado una introducciónrápida y práctica al uso de estas herramientas estadísticasbásicas.
Por ello, se asume una base teórica previa que no seráabordada aquí, pero que suele ser materia del pregrado regular.
Aún así, es recomendable que luego de esta sesión los alumnosrepasen/revisen los fundamentos teóricos detrás de estasherramientas.
Juan Carlos Bazo Alvarez
06/02/2013
2
ANOVA Herramienta de gran poder y versatilidad
Originalmente para estudios experimentales.
Aún preferida en áreas como la agronomía.
También usada en Ciencias de la Salud y del Comportamiento.
Paulatinamente remplazada en sus usos más comunes por nuevasherramientas, pero que usan enfoques distintos (ejemplo: GLM).
Juan Carlos Bazo Alvarez
Trabaja con la varianza: parte de un modelo quedetermina como se descompone la variabilidad total deloutcome.
El ANOVA tiene muchas variantes, aquí solo revosaremosdos: oneway y muestras relacionadas.
ANOVA Oneway Permite comparar dos o más grupos independientes
Juan Carlos Bazo Alvarez
Supuestos: independencia, homogeneidad de varianzas,normalidad.
Requiere de un post-hoc para el detalle dos a dos.
10
15
20
Nic
otin
a
A B C D
DentroEntreTotal SCSCSC
DCBAH :0
06/02/2013
3
ANOVA Muestras Relacionadas Permite comparar medidas repetidas de los mismos
sujetos o sujetos pareados.
Juan Carlos Bazo Alvarez
Aquí hablamos de variabilidad INTRASUJETO eINTERSUJETO.
24
68
10P
unta
je M
em
oria
1 1.5 2 2.5 3Condición
Kruskal-Wallis
Es la alternativa no paramétrica del ANOVA Onewaycuando no se cumplen los supuestos.
K-W es bastante flexible y sólo exige nivel ordinal demedida.
Juan Carlos Bazo Alvarez
Total 4 7 3 6 20 D 0 0 1 4 5 C 1 1 1 0 3 B 0 1 1 1 3 A 3 5 0 1 9 programa baja media alta muy_alta Total hab_lec
. tab programa hab_lec
06/02/2013
4
Friedman
Es la alternativa no paramétrica del ANOVA de muestrasrelacionadas.
Es altamente flexible (sin mayores supuestos).
Juan Carlos Bazo Alvarez
id A B C1 1 2 32 2 3 43 1 3 34 2 3 45 3 3 46 1 2 47 2 2 38 2 2 4
Indices de Correlación
Permiten determinar fuerza y sentido de la relación.
Se acompañan de una prueba de significancia.
Algunos tienen más supuestos que otros.
Existe uno para cada necesidad.
Hoy revisaremos sólo 4 de ellos.
Juan Carlos Bazo Alvarez
-40 -20 0 20 40
ptje de error total
-20
-10
0
10
20
30
40
ptj
e t
ota
l
Variable dependiente: ptje total
Gráfico de regresión parcial
06/02/2013
5
Veamos ahora un poco más de todo, con una práctica diferente:
ENDES
Juan Carlos Bazo Alvarez
Recommended