View
1.048
Download
1
Category
Preview:
Citation preview
MAESTRIA EN RADIOLOGIA BUCAL Y
MAXILOFACIAL
PRUEBA DE
KRUSKAL – WALLIS
Y
PRUEBA DE
FRIEDMAN
MAESTRANDO: YALIL RODRIGUEZ
Cuando la distribución de los datos no
presenta normalidad, y se requiere
comparar más de 3 grupos, se pueden
realizar varios tipos de pruebas:
- Si los grupos son independientes:
Prueba de Kruskal Wallis
Mediana
- Si los grupos están relacionados:
Prueba de Friedman
W de Kendall
Q de Cochran
Prueba de Kruskal Wallis
También es llamada prueba H
Es el equivalente a un ANOVA de una sola vía
Es la prueba más adecuada para comparar poblaciones cuyas distribuciones no son normales
Es una prueba no paramétrica, que utiliza rangos de datos muestrales de tres o más grupos independientes
Se utiliza para probar la hipótesis nula (Ho) de que las muestras independientes provienen de poblaciones con medianas iguales. La hipótesis alterna (H1) es la afirmación de que las poblaciones tienen medianas que no son iguales
Los valores de la muestra invariablemente difieren de
alguna manera, y la pregunta es si las diferencias entre
las muestras significan diferencias genuinas en la
población o si solo representan la clase de variaciones que
pueden esperarse en muestras que se obtienen al azar de la
misma población.
Requiere que las mediciones de las variable se encuentre al
menos en escala ordinal
Fue propuesta por William Henry Kruskal (1919- 2005) y W.
Allen Wallis (1912-1998), en el artículo ¨Use of ranks in one-
criterion varience analysis¨, publicado en en ¨Journal of
American Statistics Association¨, en 1952
Requisitos
Al menos 3 muestras independientes, las cuales se
seleccionan al azar
Cada muestra debe tener al menos 5 observaciones
La distribución de los datos no deber normal
Fórmula
N= número total de observaciones en todas las muestras
combinadas
K= número de muestras
R1= suma de los rangos de la muestra 1
N1= número de observaciones de la muestra 1
Gl (grados de libertad)= k-1
Pasos
1. Planteamiento de las hipótesis
2. Se ordenan las observaciones de menor a mayor, y se les
asignan rangos desde 1 hasta n
3. Se obtiene la suma de los rangos correspondientes a los
elementos de cada muestra, y se halla el rango promedio
4. Se calcula el estadístico de prueba
5. Se busca H en la Tabla de Chi cuadrado
6. Se extraen las conclusiones
Para aplicar la prueba, se calcula el estadístico de prueba H,
el cual tiene una distribución que puede aproximarse por
medio de la distribución Chi ², siempre y cuando cada
muestra tenga al menos 5 observaciones.
Cuando se utiliza Chi ² en este contexto, el número de
grados de libertad es k-1
Si las muestras tiene menos de 5 observaciones, hay que
remitirse a tablas de valores críticos
Se trabaja generalmente con un nivel de significancia de 0.05
Si el resultado que arroja H es mayor que 0.05, se acepta Ho.
Al aplicarse la prueba de Kruskal Wallis, existe un factor de
corrección que debe aplicarse siempre que existan muchos
empates:
T= L³- L. Donde L es el número de observaciones que está
empatada. Se calcula T para cada grupo, y luego se realiza la
sumatoria
N= Número de todas las observaciones
Ejemplo
Utilizaremos algunos datos de mi artículo titulado:
“ ANALISIS DE BJÖRK Y JARABAK
EN SUJETOS CON DIFERENTE RELACIÓN
ESQUELÉTICA, SOBRE CEFALOGRAMAS DERIVADOS
DE TOMOGRAFÍA COMPUTARIZADA CONE BEAM”.
El tamaño de la muestra fué de 15 sujetos para Clase I, 15
sujetos para Clase II, y 16 sujetos para Clase III.
A los 46 sujetos se les realizaron los trazos correspondientes al
análisis de Björk y Jarabak, más el ANB y el FMA (ángulo
mandibular)
Primero, aplico la prueba de normalidad de los datos. En este
caso, con SPSS. Los datos no tienen distribución normal o
paramétrica, si son < 0.05
En este caso, según la prueba de S-W, los ángulos NSAr, o ángulo de la silla, para Clase II,
el MeGoN, o ángulo goniaco inferior para Clase II, y laAltura Facial Anterior,
o NMe, para Clase III, fueron menores a 0.05, es decir, no tienen normalidad en
su distribución . Para estas medidas, usaremos la prueba de Kruskal Wallis.
Para la explicación del uso de la prueba de Kruskal Wallis,
usaremos los valores del ángulo NSAr, para los 3 grupos
Angulo SNAr
Clase I Clase II Clase III
121 124 133
128 122 114
130 125 119
115 124 113
127 123 114
128 121 128
134 116 127
121 124 123
114 135 119
117 126 122
125 118 114
116 133 123
117 102 127
116 126 119
125 122 123
128
En este caso, compararemos el comportamiento del ángulo SNAr en las 3 clases esqueléticas. Es decir, haremos la
comparación en 3 grupos.
Para el caso, plantearemos las siguientes hipótesis:
- Hipótesis nula (Ho): el comportamiento del ángulo SNAr en
las 3 clases esqueléticas, no difiere significativamente entre si.
- Hipótesis alterna(H1): el comportamiento del ángulo SNAr
en las 3 clases esqueléticas, difiere significativamente entre sí.
Se inicia con el ordenamiento de todas
las observaciones de los 3 grupos,
uniéndolas en uno solo, a partir del
valor más pequeño hasta el mayor, y la
detección de las ligas o empates.
Si se producen empates en los valores,
se aplica un factor de corrección, el
cual se observa en la columna “Cálculo
de rango en caso de empate””.
Orden
Valor de Ang.
SNAr en
descendente Rango
Calculo de rango en caso
de empate # de ligas
1 102 1
2 113 2
3 114 4,5 3+4+5+6/4=4,5 4
4 114 4,5
5 114 4,5
6 114 4,5
7 115 7
8 116 9 8+9+10/3=9 3
9 116 9
10 116 9
11 117 11,5 11+12/2=11,5 2
12 117 11,5
13 118 13
14 119 15 14+15+16/3=15 3
15 119 15
16 119 15
17 121 18 17+18+19/3=18 3
18 121 18
19 121 18
20 122 21 20+21+22/3=21 3
21 122 21
22 122 21
23 123 24,5 23+24+25+26/4=24,5 4
24 123 24,5
25 123 24,5
26 123 24,5
27 124 28 27+28+29/3=28 3
28 124 28
29 124 28
30 125 31 30+31+32/3=31 3
31 125 31
32 125 31
33 126 33,5 33+34/2=33,5 2
34 126 33,5
35 127 36 35+36+37/3=36 3
36 127 36
37 127 36
38 128 39,5 38+39+40+41/4=39,5 4
39 128 39,5
40 128 39,5
41 128 39,5
42 130 42
43 133 43,5 43+44/2=43,5 2
44 133 43,5
45 134 45
46 135 46
Explicación en la diapositiva siguiente
Para el valor del ángulo 114, hay 4 empates: el 3, 4, 5, y 6.
Para obtener el valor corregido, se suman y se dividen entre el
# de valores.
3+4+5+6=18. Dividido entre 4= 4.5. Este valor se usa para
los 4 empates
Así sucesivamente en todos los casos de empate
Se presentan 13 empates en valores
El número de ligas es el número de valores empatados para
cada rango. En este caso, es de 4, pues hay 4 valores
empatados en 114.
Orden
Valor de Ang.
SNAr en
descendente Rango
Calculo de rango en caso
de empate # de ligas
1 102 1
2 113 2
3 114 4,5 3+4+5+6/4=4,5 4
4 114 4,5
5 114 4,5
6 114 4,5
7 115 7
Una vez efectuado el ordenamiento en rangos,
volvemos a la primera tabla para organizar cada
observación con su correspondiente rango, y realizar
la sumatoria de rangos.
Cada sumatoria, la elevamos al cuadrado
Clase I Rangos Clase II Rangos Clase III Rangos
121 18 124 28 133 43,5
128 39,5 122 21 114 4,5
130 42 125 31 119 15
115 7 124 28 113 2
127 36 123 24,5 114 4,5
128 39,5 121 18 128 39,5
134 45 116 9 127 36
121 18 124 28 123 24,5
114 4,5 135 46 119 15
117 11,5 126 33,5 122 21
125 31 118 13 114 4,5
116 9 133 43,5 123 24,5
117 11,5 102 1 127 36
116 9 126 33,5 119 15
125 31 122 21 123 24,5
128 39,5
∑ R 352,5 379 349,5
R² 124256,25 143641 122150,25
Ahora se calcula el valor de ajuste de ligas con la
siguiente fórmula:
L= 1- ∑(Li³-Li)
N³-N
= ∑ (3³-3) + (4³-4)………
46³ - 46
=1- 306/97290
= 0.99
Donde Li corresponde al valor de cada liga, y N corresponde al número total de observaciones entre los 3 grupos.
Con el ajuste L, procedemos a calcular el valor
estadístico de prueba de Kruskal Wallis
12 124256,25 143641 122150,25
H = X + + - 3 (46 + 1)
46(46+1) 15 15 16
= 0,00555042 X (8283,75+9576,06667+7634,39063) - 141
= 0,00555042 X (25494,2073) – 141
= 141,503463 – 141
= 0,503. Al dividirlo con el ajuste L, que corresponde a 0,99 nos da
= 0,50. Este valor se compara con los valores de chi ², pues cada muestra tuvo al menos 5 observaciones, en este caso, 15 o 16. Teniendo en cuenta que los grados de libertad son k – 1, quiere decir que k=2 (fueron 3 grupos)
Tabla de Chi 2
La prueba H nos arroja un resultado de 0.50, el cual es menor a
5.99 de la tabla de Chi ², con 2 grados de libertad , con un nivel
de significancia de 0.05.
0.50 se encuentra entre el 0.8 y el 0.7 de probabilidad, lo cual no
es significativo
Este resultado de H es mayor de 0.05, lo cual quiere decir que
no hay diferencias significativas en las medianas de las 3 clases
esqueléticas para el ángulo SNAr.
Se acepta la hipótesis nula (Ho).
En SPSS
Nos arroja el mismo
resultado
Este valor es mayor a 0.05, lo
cual significa que no hay
diferencias significativas entre
las 3 clases esqueléticas para
el ángulo NSAr. Se acepta la
hipótesis nula (Ho).
Prueba de Friedman
Esta prueba puede considerarse como una extensión de la prueba de Wilcoxon para el caso de más de 2 muestras relacionadas. Es la prueba no paramétrica paralela al ANOVA de medidas repetidas, y al igual que éste, contrasta la hipótesis nula de igualdad de tres o más muestras relacionadas
Existen 2 situaciones en las que se aplica esta prueba:
- Para una misma muestra medida más de 2 veces. En este caso, k es el número de tratamientos, o las diferentes situaciones o tiempos en los que se mide al sujeto
- En una sola medición de más de 2 muestras relacionadas. En este caso, k es el número de muestras o grupos relacionados
En estadística la prueba de Friedman es una prueba no
paramétrica desarrollado por el economista Milton
Friedman. Esta prueba puede utilizarse en aquellas
situaciones en las que se seleccionan n grupos de k
elementos de forma que los elementos de cada grupo
sean lo más parecidos posible entre sí, el método
consiste en ordenar los datos por filas o bloques,
reemplazándolos por su respectivo orden.
Hipótesis
H0: No existen diferencias entre los grupos.
Ha: Existen diferencias entre los grupos.
Para resolver este contraste de hipótesis, Friedman propuso un
estadístico que se distribuye como una Chi-cuadrado con K - 1
grados de libertad, siendo K el número de variables
relacionadas; se calcula mediante la siguiente expresión.
Estadístico de Prueba
En la expresión anterior:
• X2r = estadístico calculado del análisis de
varianza por rangos de Friedman.
• H = representa el número de elementos o de bloques
(numero de hileras)
• K = el número de variables relacionadas
• ∑ Rc2 = es la suma de rangos por columnas al
cuadrado.
1. Hacer una tabla en la que las K variables, es decir, las K medidas estén en las columnas y los n elementos en las filas, de esta manera la tabla tendrá K columnas y n filas.
2. A los valores de cada fila se les asigna un número del 1 a K, según el orden de magnitud de menor a mayor; a este número se le denomina rango.
3. Se suman los respectivos rangos en función de las columnas.
4. Aplicar la fórmula de análisis de varianza de doble entrada por rangos de Friedman.
5. Comparar el valor de X2r de Friedman con tablas
de valores críticos de Chi-cuadrada.
Pasos
Ejemplo
Se escogen al azar 8 Maestrandos de la Maestría de Radiología Bucal y Maxilofacial de la UPC, para evaluar su criterio con respecto al grado de incomodidad que podria presentar un paciente con respecto a la toma de 3 tipos de radiografías intraorales: Periapical de zona molar posterior inferior, Oclusal inferior, y Bite wing de zona molar posterior. Este criterio se evalúa de acuerdo a una escala de 1 a 10, donde 1 es MUY INCÓMODO, y 10 corresponde a una MUY BUENA RESPUESTA DEL PACIENTE.
Ho, o Hipótesis nula: No hay diferencia entre las 3 técnicas.
H1, o Hipótesis alterna: Existe diferencia entre las 3 técnicas con respecto al grado de incomodidad en el paciente.
Primer paso: Hacer una tabla en la que las K variables
estén en las columnas y los n elementos en las filas, de
esta manera la tabla tendrá K (3) columnas y n (8) filas.
Maestrandos Periapical Oclusal BW
A 6 5 3
B 9 9 4
C 6 9 3
D 5 8 6
E 7 8 8
F 5 7 5
G 6 7 5
H 6 7 7
Segundo paso: A los valores de cada fila se les asigna un
número del 1 a K (3), según el orden de magnitud de
menor a mayor; a este número se le denomina rango.
Maestrandos Periapical Oclusal BW
A 6(3) 5(2) 3(1)
B 9(2.5) 9(2.5) 4(1)
C 6(2) 9(3) 3(1)
D 5(1) 8(3) 6(2)
E 7(1) 8(2.5) 8(2.5)
F 5(1.5) 7(3) 5(1.5)
G 6(2) 7(3) 5(1)
H 6(1) 7(2.5) 7(2.5)
Tercer paso: Se suman los respectivos rangos en función
de las columnas.
Las sumas de rangos correspondientes a cada aparato,
variable o columna son:
R1 = 14 R2 =21.5 R3 =12.5
A cada valor se le saca el cuadrado.
R1 = 196 R2 = 462.25 R3 = 156.25
Cuarto paso: Aplicar la fórmula de análisis de varianza
de doble entrada por rangos de Friedman.
= 12/ 96 196 + 462.25 + 156.25 - 96
= 0.125 (814.15) - 96
= 101.76 - 96
= 12/ 8x3 (4) (14)² + (21.5)² + (12.5)² - 3 (8) (3+1)
= 5.81
Debido a que se presentaron varios empates, hay
que dividir este valor por un factor de
corrección. Su fórmula es la siguiente:
Donde:
T ih = número de observaciones empatadas para un rango dado en una fila,
o bloque
h = numero de empates en cada bloque. Por ejemplo, en el bloque 2 hay un
solo empate (h=1), y hay 2 datos empatados (t 2h=2).
Entonces T 2= 2³-2=6. Igual para los bloques o filas 5, 6, y 8.
Entonces, ∑ T I = 24
k = número de variables, es decir, 3.
b=H = Número de filas o bloques, es decir , 8.
C = 1 – 24/24 X 8 = 0.875
Con la corrección, quedaría:
5.81 x 0.875 = 6.64
Este valor se compara con la tabla de Chi ².
Los grados de libertad corresponden a k -1, osea
3-1= 2
Para este caso, el valor de Chi ² es de 5.99.
Nuestro resultado es mayor a este valor, lo que
significa que si hay diferencias significativas en
el grado de incomodidad para el paciente, entre
las 3 técnicas. Se rechaza la hipótesis nula
En SPSS
El mísmo valor
Este valor es menor a 0.05,
lo cual nos confirma las
diferencias significativas
encontradas.
Se rechaza la Hipótesis nula
GRACIAZZZZZZZZZZ
ZZZZZZZZZZZZZZZZ
ZZZZZZZZZ……
Recommended