23
Guía de Bioestadística Dr. Julio Idrovo 3. INFERENCIA ESTADÍSTICA 3.1 Introducción La inferencia estadística es la parte de la estadística que permite tomar decisiones sobre una determinada cuestión con un grado de confianza establecido a priori. Por ejemplo, se puede averiguar si dos muestras están o no correlacionadas linealmente, si sus medias son iguales, si su variabilidad es diferente, cuáles son sus distribuciones, etc. 3.2 Teoría de los tests estadísticos La formulación de la teoría de los tests estadísticos comprende los siguientes pasos: 3.2.1 Planteamiento de la hipótesis nula La hipótesis nula (H 0 ) generalmente es formulada con la intención de rechazarla. Postula la carencia de diferencia entre los parámetros motivo del problema. Simultáneamente se plantea la hipótesis alternativa (H A ) o hipótesis de trabajo, la misma que es complementaria a la hipótesis nula. El rechazo de H 0 conduce a la aceptación de H A y viceversa. Se puede saber si un test se realizará a "una cola" o a "dos colas" mirando a cuantos lados va la hipótesis alternativa. H 0 : s 2 = 3.25 H A : s 2 3.25 dos colas H 0 : s 2 3.25 H A : s 2 > 3.25 cola derecha H 0 : s 2 3.25 H A : s 2 < 3.25 cola izquierda 3.2.2 Nivel de significancia (a) El nivel de significancia se considera como la probabilidad de rechazar la hipótesis nula cuando es verdadera; es por lo tanto un error denominado de tipo I. Su valor se da a priori, en porcentaje, generalmente 5%. También es probable que se tenga que aceptar la hipótesis nula cuando es falsa; este es un error de tipo II y se lo simboliza ß. El complemento de a es el nivel de confianza, o sea la probabilidad de aceptar H 0 cuando es verdadera; esta es una decisión correcta de tipo A. La potencia de un test se entiende como la probabilidad de rechazar H 0 cuando es falsa; esta es una decisión correcta de tipo B. Decisión Verdadera Falsa Aceptar A Rechazar a B

Inferencia estadística

  • Upload
    julio

  • View
    549

  • Download
    2

Embed Size (px)

DESCRIPTION

Guía de aplicación de algunos tests estadísticos

Citation preview

Page 1: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

3. INFERENCIA ESTADÍSTICA

3.1 Introducción La inferencia estadística es la parte de la estadística que permite tomar decisiones sobre una determinada cuestión con un grado de confianza establecido a priori. Por ejemplo, se puede averiguar si dos muestras están o no correlacionadas linealmente, si sus medias son iguales, si su variabilidad es diferente, cuáles son sus distribuciones, etc.

3.2 Teoría de los tests estadísticos La formulación de la teoría de los tests estadísticos comprende los siguientes pasos:

3.2.1 Planteamiento de la hipótesis nulaLa hipótesis nula (H0) generalmente es formulada con la intención de rechazarla. Postula la carencia de diferencia entre los parámetros motivo del problema. Simultáneamente se plantea la hipótesis alternativa (HA) o hipótesis de trabajo, la misma que es complementaria a la hipótesis nula. El rechazo de H0

conduce a la aceptación de HA y viceversa.

Se puede saber si un test se realizará a "una cola" o a "dos colas" mirando a cuantos lados va la hipótesis alternativa.

H0: s2 = 3.25 HA : s2 3.25 dos colas

H0: s2 3.25 HA : s2 > 3.25 cola derecha

H0: s2 3.25 HA : s2 < 3.25 cola izquierda

3.2.2 Nivel de significancia (a)El nivel de significancia se considera como la probabilidad de rechazar la hipótesis nula cuando es verdadera; es por lo tanto un error denominado de tipo I. Su valor se da a priori, en porcentaje, generalmente 5%. También es probable que se tenga que aceptar la hipótesis nula cuando es falsa; este es un error de tipo II y se lo simboliza ß. El complemento de a es el nivel de confianza, o sea la probabilidad de aceptar H0 cuando es verdadera; esta es una decisión correcta de tipo A. La potencia de un test se entiende como la probabilidad de rechazar H0 cuando es falsa; esta es una decisión correcta de tipo B.

Decisión Verdadera Falsa

Aceptar A

Rechazar a B

3.2.3 Elección del test estadísticoEl test estadístico se seleccionará de acuerdo con la hipótesis planteada. Cuando para un mismo problema existen dos o más tests disponibles, se elegirá aquel más potente. Generalmente los tests paramétricos son los más potentes. Se denominan tests paramétricos a aquellos que necesitan del cálculo de parámetros propios de la distribución, como la media, varianza, etc. Los tests no paramétricos son aquellos que consideran únicamente el tamaño de la muestra.

3.2.4 Cálculo del valor del testCon el test seleccionado se procederá a calcular el valor del estadístico, utilizando la fórmula propia de cada test.

3.2.5 Determinación de los puntos críticosConociendo el tamaño de la muestra (o los grados de libertad) y el nivel de significancia, se procederá a buscar los valores críticos del test, los mismos que se encuentran tabulados. Cuando el test se realiza a dos colas, los puntos críticos se encuentran utilizando a/2 en lugar de a. El valor crítico izquierdo representa la probabilidad de que 1-a/2 de los datos sean mayores que él. El valor crítico derecho

Page 2: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

representa la probabilidad de que a/2 de los datos sean mayores que él. Estos determinan las zonas de rechazo y aceptación de H0. La zona o zonas de rechazo comprenderán un área total igual a a, mientras

que la zona de aceptación corresponderá a 1-a.

3.2.6 DecisiónSi el valor del test cae dentro de la zona de rechazo de H0 se procederá a rechazar la hipótesis nula,

aceptando la hipótesis alternativa.

3.3 Normalidad de los datosLa mayoría de las pruebas estadísticas parten del hecho de que los datos analizados están aproximadamente normalmente distribuidos. En algunos casos puede ser necesario verificar si esto es cierto, para lo cual nos sirven los tests a continuación detallados.

3.3.1 Test de Kolmogorov – SmirnovEste test es de gran utilidad cuando se trata de analizar la distribución de la variable en estudio. La distribución de la variable puede escribirse como una distribución acumulativa de frecuencias relativas. Se procede de la siguiente manera: se compara el valor observado en la distribución acumulativa de

frecuencias con el valor de de la distribución teórica: D ( x )=|F0 ( x )−F (x )|, donde F0(x) es el valor de

la distribución teórica, F(x) es el valor observado y D(x) es el valor absoluto de la diferencia. La máxima diferencia se denota como D = max D(x)

La hipótesis nula H0 asume que no hay diferencia entre la distribución acumulativa de frecuencias y la distribución teórica. Los valores críticos D* se localizan conociendo el tamaño de la muestra y a. Si la distribución acumulativa de frecuencias hipotética es correcta, es razonable que el valor D sea pequeño. La hipótesis H0 se acepta si el valor D observado es menor que el valor critico D* del test: D < D*

El test de Kolmogorov - Smirnov se puede aplicar para establecer comparaciones entre dos muestras. Se procede haciendo las distribuciones acumulativas de frecuencias para cada muestra y se encuentra la diferencia entre las frecuencias de las dos muestras para un mismo intervalo. La máxima diferencia es probada en el test estadístico para verificar o no la carencia de diferencia entre las dos medidas. Los valores críticos se localizan conociendo el tamaño de las dos muestras y a, en la tabla del test de Kolmogorov - Smirnov para dos muestras. La hipótesis H0 se verifica si D < D*.

La prueba de Kolmogorov - Smirnov puede aplicarse para tamaños de muestra pequeños, lo que no sucede con la chi cuadrado. Además, es más poderosa que la χ2, es decir, cuando se rechaza la hipótesis nula, se tiene una mayor confiabilidad en dicho resultado. El test de Kolmogorov - Smirnov debe usarse cuando la variable de análisis es continua. Sin embargo, si la prueba se usa cuando la distribución de la población no es continua, el error que ocurre en la probabilidad resultante está en la dirección segura. Es decir, cuando se rechaza la hipótesis nula, tenemos verdadera confianza en la decisión.

Ejemplo 1:

Se realizaron ocho titulaciones, con los resultados 25.13, 25.02, 25.11, 25.07, 25.03, 24.97, 25.14 y 25.09 mL. ¿Dichos resultados podrían proceder (a) de una población normal con media 25.00 mL y desviación estándar 0.05 mL, y (b) de cualquier otra población normal?

(a) En este caso transformamos los valores x en valores z utilizando la relación z i=xi−25.00

0.05

Page 3: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

Los valores obtenidos son:

xi 25.13 25.02 25.11 25.07 25.03 24.97 25.14 25.09zi 2.6 0.4 2.2 1.4 0.6 -0.6 2.8 1.8

xi zi fra P(z) D(x)

24.97 -0.6 0.125 0.2743 0.1493

25.02 0.4 0.250 0.6554 0.4054

25.03 0.6 0.375 0.7257 0.3507

25.07 1.4 0.500 0.9192 0.4192

25.09 1.8 0.625 0.9641 0.3391

25.11 2.2 0.750 0.9861 0.2361

25.13 2.6 0.875 0.9953 0.1203

25.14 2.8 1.000 0.9974 0.0026

El valor crítico es D(8,0.05)¿ =0.288, y puesto que D=0.4192 la hipótesis de normalidad se rechaza.

(b) En este caso estimamos la media y la desviación estándar de los datos antes de transformarlos en valores z.

La media es 25.07 y la desviación estándar es 0.0593. Con estas estimaciones se obtienen los siguientes valores:

xi 25.13 25.02 25.11 25.07 25.03 24.97 25.14 25.09

zi 1.01 -0.84 0.67 0.00 -0.67 -1.69 1.18 0.34

xi zi fra P(z) D(x)

24.97 -1.69 0.1250 0.0458 0.0792

25.02 -0.84 0.2500 0.1995 0.0505

25.03 -0.67 0.3750 0.2499 0.1251

25.07 0.00 0.5000 0.5000 0.0000

25.09 0.34 0.6250 0.6321 0.0071

25.11 0.67 0.7500 0.7501 0.0001

25.13 1.01 0.8750 0.8443 0.0307

25.14 1.18 1.0000 0.8812 0.1188

El valor crítico es D(8,0.05)¿ =0.288, y puesto que D=0.1251 la hipótesis de normalidad se acepta.

3.3.2 Test Chi cuadradoEste test se puede interpretar como el test de la “bondad del ajuste”, el cual establece si existe una diferencia significativa entre un número de objetos o respuestas y un número teórico.

El valor del test estadístico se calcula con la expresión

χ2=∑ (O−E )2

Edonde O es el valor observado y E es el valor esperado o teórico. Es de esperarse que un valor pequeño de

χ2 indique concordancia entre las dos series de frecuencias.

La hipótesis H0 asume que no existe diferencia entre las dos distribuciones y se acepta cuando es menor que el valor critico localizado en las tablas por conocimiento de los grados de libertad (n—1) y a

χ2< χ2∗¿¿

Page 4: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

3.4 Valores anómalosDada una muestra aleatoria simple de tamaño n procedente de una población univariante, (x1, x2, ..., xn), podemos sospechar que una de sus observaciones, que forzosamente será la menor o la mayor de la muestra, es un dato atípico, es decir, el valor registrado para ese individuo es anormalmente pequeño o grande.

Ante esta situación, el analista debe investigar la procedencia de ese dato, y como consecuencia de ello, eliminarlo de la muestra si se confirma que ha sido un error (quizás de medida o de transcripción manual del dato) o modificar sus hipótesis sobre la población en caso de verificarse su exactitud (¿quién nos asegura que un dato anómalo no es señal de la presencia de una veta de mineral en un análisis geológico de cierto terreno?).

En todo caso, no se eliminará un dato sospechosamente atípico hasta no tener la certeza absoluta de que su origen se debe a un error humano o de instrumentación.

La presencia de un valor anómalo puede alterar sensiblemente las conclusiones de un análisis estadístico. Aquellos métodos poco sensibles a estos datos extraños se denominan robustos, y la estadística robusta es un área de intensa investigación.

3.4.1 Test Q de DixonEsta prueba supone que la población está normalmente distribuida. Una forma de estudiar una medida sospechosa es comparar la diferencia entre ella y la medida más próxima, con la diferencia entre las medidas más grande y más pequeña (rango). El cociente de estas diferencias (sin signo) se denomina Q de Dixon.

Q=|val∨sospechoso−valor más cercano|valor más grande−valor más pequeño

Si el valor de Q calculado supera el valor crítico Q*, se rechaza el valor sospechoso.

Ejemplo 2:

Se obtuvieron los siguientes valores para la concentración de nitrito (mg/L) en una muestra de agua de río.

0.403 0.410 0.401 0.380 0.400 0.413 0.411

La medida 0.380 mg/L es sospechosa. ¿Debería rechazarse al nivel de significancia del 5%?

Datos:

Valor sospechoso = 0.380

Valor más cercano = 0.400

Valor más grande = 0.413

Valor más pequeño = 0.380

Q=|0.380−0.400|0.413−0.380

=0.606

El valor crítico al 5% es Q(7,0.05 )¿ =0.570

Puesto que Q>Q*, se rechaza el valor sospechoso al nivel de significancia del 5%, es decir, el dato es anómalo.

3.4.2 Test de GrubbsComo ayuda a la decisión sobre si un dato es o no atípico, se dispone de la prueba de Grubbs, la cual exige que la muestra proceda de una población normal. Debería probarse, primeramente, que los datos puedan ser razonablemente aproximados por una distribución normal antes de aplicar el test de Grubbs.

El contraste se plantea en los siguientes términos:

H0: "no hay datos atípicos en la muestra"

frente a la alternativa:

HA: "hay al menos un dato atípico".

Cuando se trata de una prueba a dos colas, se hará uso del estadístico:

Page 5: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

G=max|x i−X|

s=max|zi|

siendo X la media y s la desviación típica muestrales.

El test de Grubbs puede también ser definido como una de las siguientes pruebas a una cola.

1. Probar que el mínimo valor es un anómalo.

G=X−Xmin

s2. Probar que el máximo valor es un anómalo.

G=X max−X

sLa región crítica de este contraste se puede obtener aproximadamente tomando como referencia la distribución tn-2 de Student con (n - 2) grados de libertad y nivel de significancia a*=a/(2n) si es a dos colas, o a*=a/n si la prueba se realiza a una cola.

Se aceptará la hipótesis alternativa HA de existencia de dato atípico si G excede de cierto valor crítico G*:

G¿=n−1√n √ t (α ¿ ,n−2)

2

n−2+t ( α¿ ,n−2 )2

Ejemplo 3:

En un estudio sobre la posible influencia del tamaño del cerebro humano en la inteligencia, se ha estimado la dimensión del órgano como el número de píxeles que ocupa en sendas imágenes obtenidas por Resonancia Magnética. Los sujetos bajo estudio han sido 20 estudiantes masculinos de psicología de cierta Universidad norteamericana. Al representar los datos en un histograma, se ha observado que el primero aparece algo apartado de los demás, por lo que se sospecha que pueda ser atípico. Se supone que la población tiene distribución normal.

1201121 1038437 965353 904858 955466

1079549 924059 945088 889083 892420

905940 955003 935494 1062462 949589

997925 879987 949395 930016 935863

Se aplica el test de Grubbs para contrastar la hipótesis nula de que no hay un registro anómalo.

La media de los datos es 964855.40 y la desviación estándar es 78103.09, y con estos valores se obtienen los siguientes valores absolutos de zi.

3.03 0.94 0.01 0.77 0.12

G=max|zi|=3.031.47 0.52 0.25 0.97 0.93

0.75 0.13 0.38 1.25 0.20

0.42 1.09 0.20 0.45 0.37

G¿=20−1

√20 √ t( 0.025

20,20−2)

2

20−2+t(0.025

20,20−2)

2 =19

√20 √ 12.320818+12.3208

=2.71

Dado que 3.03>2.7, se rechaza la hipótesis nula. Según la prueba de Grubbs, todo parece indicar que el dato 1201121 es atípico. Un fallo en la transcripción de la información muestral provocó la aparición de esta cantidad en lugar de la correcta, que era 1001121. Corríjase este primer valor de la muestra y ejecútese nuevamente el programa; el problema queda ahora resuelto.

3.5 Análisis de la precisiónLa precisión depende de la variabilidad de los datos, la cual determinaremos utilizando la varianza. Analizaremos dos casos:

Page 6: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

Comparar la varianza de una población con un valor preestablecido.

Comparar las varianzas de dos poblaciones.

3.5.1 Test Chi-cuadradoChi-cuadrado es una distribución asimétrica y no negativa. Este test permite verificar si la varianza de una población es estadísticamente igual a un valor preestablecido. Utiliza la varianza de la muestra considerada, por lo tanto es paramétrico.

La hipótesis nula postula que no hay diferencia entre la varianza poblacional s2 y el valor v.

H 0 :σ2=v H A : σ2≠v

El nivel de significancia a se fija a priori. El valor del test estadístico se calcula mediante la fórmula que se presenta a continuación. Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad (n-1) y el nivel de significancia a. Se toma la decisión de aceptar H0

cuando se cumple la doble condición indicada (en un test a dos colas).

χ2= (n−1 ) s2

σ2

χ ( gl ,1−α /2 )2∗¿< χ2< χ ( gl ,α /2)

2∗¿¿ ¿

Ejemplo 4:

Un proceso se encuentra fuera de control cuando su varianza excede el valor 5.6 . Se toma una muestra de tamaño 25 con una varianza igual a 5.78 . Hay evidencia suficiente para decir que el proceso está fuera de control al nivel de significancia del 5% ?.

1) H0: s2 5.6 HA: s2 > 5.6 (1 cola)

2) a = 0.05

3) Test paramétrico chi-cuadrado.

4) Se calcula el valor del test:

5) El valor crítico tabulado es:

La zona de rechazo está a la derecha del valor crítico.

6) Puesto que el valor del test cae en la zona de aceptación, se procede a aceptar la hipótesis nula. Por tanto, se concluye que la evidencia presentada no es suficiente para manifestar que el proceso está fuera de control.

3.5.2 Test F

La distribución F es asimétrica y no negativa. Se utiliza para comparar las varianzas de dos poblaciones, bajo el conocimiento de las varianzas de dos muestras; entonces es paramétrico.

La hipótesis plantea la igualdad entre las varianzas.

H 0 :σ12=σ2

2 H A : σ12≠σ 2

2

El nivel de significancia a se fija a priori. El valor del test estadístico se calcula mediante la fórmula que se presenta a continuación. Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad tanto del numerador como del denominador (n1-1 y n2-1) y el nivel de significancia (a). Se toma la decisión de aceptar H0 cuando se cumple la doble condición indicada (en un test a dos colas).

Page 7: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

F=s1

2

s22

F ( gl1 , gl2 ,1−α /2)¿ <F<F( gl1 , gl2 ,α /2)

¿

Debido a la asimetría de la distribución F, el valor crítico de la izquierda F ( gl1 , gl2 ,1−α /2)¿ = 1

F ( gl1 , gl2 ,α /2 )¿

Ejemplo 5:

Dos muestras aleatorias de los resultados de una prueba dan las siguientes estadísticas:

Clase A: n = 16 s2 = 92.3

Clase B: n = 25 s2 = 34.7

Estos datos proveen suficiente evidencia para rechazar la hipótesis de que las dos clases tienen varianzas iguales para los resultados de la prueba involucrados?. Usar a = 0.05 .

1) H0: s2A = s2

B HA: s2A s2

B (dos colas)

2) a = 0.05

3) Test paramétrico F.

4) Se calcula el valor del test: F = s2A / s2

B = 92.3 / 34.7 = 2.66

5) Los valores críticos son:

F*(15,24,0.025) = 2.44 1/ F*

(15,24,0.025) = 1/2.44 = 0.41

6) Las zonas de rechazo están a la izquierda de 0.41 y a la derecha de 2.44 El valor del test (2.66) cae en la zona de rechazo derecha por lo tanto se rechaza la hipótesis nula y se concluye que los resultados de la prueba, para las dos clases, tienen varianzas diferentes.

3.6 Análisis de las mediasDentro del análisis de medias se pueden tener los siguientes casos:

Comparar la media de una población con un valor preestablecido.

Comparar las medias de dos poblaciones independientes.

Comparar las medias de dos poblaciones dependientes.

3.6.1 Test t para una poblaciónLa distribución t (conocida también como t de Student) es simétrica alrededor de la media. Tiene algunas variantes, pero ahora nos ocuparemos de aquella que permite comparar la media de una población con un valor dado. Requiere el conocimiento de la media y desviación estándar muestrales, por tanto es paramétrica.

H 0 : μ=v H A : μ≠v

El nivel de significancia a se fija a priori. El valor del test estadístico se calcula mediante la fórmula que se presenta a continuación. Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad (n-1) y el nivel de significancia a. Se toma la decisión de aceptar H0 cuando se cumple la doble condición indicada (en un test a dos colas).

t= X−μs

√n

t (gl , 1−α /2)¿ < t<t ( gl ,α /2 )

¿

Por la simetría de la distribución t, se tiene que t (gl , 1−α /2)¿ =−t ( gl, α /2)

¿

Ejemplo 6:

La muestra utilizada anteriormente arrojó una media igual a 8.75 . Hay evidencia suficiente para aceptar el postulado de que la media es igual a 8.32 al nivel del 5% ?.

1) H0: m = 8.32 HA: m 8.32 (dos colas)

Page 8: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

2) a = 0.05

3) Test paramétrico t para una población.

4) El valor del test se calcula:

t= X−μs

√n=8.75−8.32

√ 5.78100

=1.789

5) Los valores críticos tabulados son: ± t*(24,0.025) = ± 2.064

Las zonas de rechazo están a la derecha de t* y a la izquierda de -t*.

6) Puesto que el valor del test está en la zona de aceptación, se acepta H 0. Esto significa que no hay evidencia suficiente para decir que la media no es igual a 8.32

3.6.2 Test t para dos poblaciones (muestras independientes)Dos muestras son independientes cuando la fuente de la cual provienen es diferente. Se necesita conocer las medias y las varianzas de las dos muestras. La hipótesis nula postula que las medias de las dos poblaciones son iguales.

H 0 : μ1=μ2 H A: μ1≠μ2

Para el análisis de las medias se debe considerar previamente si las varianzas son o no iguales (realizar un test F) puesto que el test t es diferente.

VARIANZAS IGUALES

Cuando las varianzas son iguales es necesario calcular la desviación estándar pesada SP.

sp=√ gl1 s12+gl2 s2

2

gl

t=( X1−μ1 )−( X2−μ2 )

sp √ 1n1

+ 1n2

El número de grados de libertad es la suma de los grados de libertad de las dos muestras:

gl=gl1+gl2=( n1−1 )+( n2−1 )El nivel de significancia a se fija a priori. El valor del test estadístico se calcula mediante la fórmula que se presenta a continuación. Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad (n1 + n2 - 2) y el nivel de significancia (a). Se toma la decisión de aceptar H0 cuando se satisface la misma condición que en el caso anterior.

Ejemplo 7:

Dos poblaciones normalmente distribuidas se muestrean para comparar sus medias. ¿Los datos siguientes, soportan la hipótesis de que las dos medias poblacionales son significativamente diferentes?. Usar a=0.05

1) H0: m1 = m2 HA: m1 m2 (dos colas)

2) a = 0.05

3) Test paramétrico t para dos poblaciones con varianzas iguales (se puede probar con un test F). Muestras independientes.

4) Calculamos el valor del test. Es necesario que se encuentre el valor de la desviación estándar ponderada sp.

sp=√ (12−1 )∗7.2+ (15−1 )∗8.112+15−2

=2.78

Page 9: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

t= 75.6−78.7

2.78∗√ 112

+ 115

=−2.884

5) Los valores críticos del test son ± t*(25,0.025) = ± 2.060

6) Las zonas de rechazo se encuentran a la izquierda de -2.060 y a la derecha de 2.060 El valor del test (-2.884) cae en la zona de rechazo izquierda por tanto se rechaza la hipótesis nula aceptándose, por consiguiente, la hipótesis alternativa. Se concluye que las medias son significativamente diferentes.

Cuando no se sabe nada respecto a las varianzas poblacionales, se debe realizar previamente un test F para determinar si éstas son iguales o no, y de esta manera escoger el test t apropiado.

VARIANZAS DESIGUALES

Cuando las varianzas son diferentes, el número de grados de libertad considerado será calculado utilizando la expresión:

ν=( s1

2

n1

+s2

2

n2)

2

( s12

n1)

2

n1−1+

( s22

n2)

2

n2−1

El nivel de significancia a se fija a priori. El valor del test estadístico se calcula mediante la fórmula que se presenta a continuación.

t=( X1−μ1 )−( X2−μ2 )

√ s12

n1

+s2

2

n2

Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad y el nivel de significancia (a). Se toma la decisión de aceptar H0 cuando se satisface la misma condición

que en el caso anterior.

Ejemplo 8:

Dos máquinas dispensadoras de bebidas se muestrean para probar si las dos dispensan la misma cantidad de bebida. Usar a=0.05.

Máq. Cantidad dispensada

C 6.5 6.8 3.0 6.0 5.8 6.1 3.3 3.4 5.9 6.2

P 7.6 6.0 6.1 6.0 7.4 7.3 6.0 6.2 6.3 6.1

1) H0: m1 = m2 HA: m1 = m2 (dos colas)

2) a = 0.05

3) Puesto que las varianzas son 2.13 y 0.43 respectivamente, se puede probar con un test F que son significativamente diferentes. Se usa por tanto el test paramétrico t para dos poblaciones con varianzas no iguales.

4) Calculamos el valor del test.

t=(5.3−6.5 )

√ 2.1310

+ 0.4310

=−2.372

5) Los valores críticos tabulados son ± t*(9,0.025) = ± 2.262

La zona de aceptación está comprendida entre -2.262 y 2.262

6) El valor del test cae fuera de la zona de aceptación, por tanto se concluye que las dos máquinas dispensan diferentes cantidades de bebida.

Page 10: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

3.6.3 Test t para dos poblaciones (muestras dependientes)

Dos muestras son dependientes cuando provienen de la misma fuente. En este caso es indispensable que las muestras tengan el mismo tamaño (datos apareados). La hipótesis nula postula que la media de las diferencias es igual a cero.

H 0 : μd=0 H A: μd≠0

Es necesario determinar la media y la desviación estándar de las diferencias d i=x1i−x2i

. El número de

grados de libertad es n-1, donde n es el tamaño de cualquiera de las dos muestras.

El nivel de significancia a se fija a priori. El valor del test estadístico se calcula mediante la fórmula que se presenta a continuación.

t=d−μd

sd√n

Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad (n-1) y el nivel de significancia a. Se toma la decisión de aceptar H0 cuando se satisface la misma condición que en el caso anterior.

Ejemplo 9:

Un sociólogo está estudiando los efectos de cierta película sobre las actitudes de los hombres negros con respecto a los hombres blancos. Al azar se seleccionaron doce hombres negros y se les pidió que llenen un cuestionario antes y después de ver la película. Los resultados se muestran a continuación.(3)

Antes 10 13 18 12 9 8 14 12 17 20 7 11

Después 5 9 13 17 4 5 11 14 13 18 7 12

1) H0: md = 0 HA: md 0 (dos colas)

2) a = 0.05

3) Test paramétrico t para dos poblaciones. Muestras dependientes.

4) Para calcular el test es necesario conocer la media y la desviación estándar de las diferencias.

Antes 10 13 18 12 9 8 14 12 17 20 7 11

Después 5 9 13 17 4 5 11 14 13 18 7 12

di 5 4 5 -5 5 3 3 -2 4 2 0 -1

d=1.92 sd=3.23

t=1.923.23

√12=2.054

5) Los valores críticos del test son ± t*(11,0.025) = ± 2.201

6) La zona de aceptación va desde -2.201 hasta 2.201; el valor del test cae en la zona de aceptación de la hipótesis. La película realmente no tiene efecto sobre las actitudes de los hombres negros.

3.7 Análisis de varianzaEn el trabajo analítico se presentan a menudo comparaciones en las que intervienen más de dos medias. Entonces, existen dos posibles fuentes de variación: la primera, que siempre está presente, debida al error aleatorio en la medida; y la segunda, debida al factor controlado.

El análisis de varianza es una técnica estadística muy poderosa que se utiliza para separar y estimar las diferentes causas de variación.

Generalmente se tienen los datos en forma tabulada y se procede a calcular las medias y varianzas para cada muestra:

repeticionescuenta media varianza

1 2 ………

Page 11: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

mu

estr

a

1 x11 x12 r1 x1 s12

2 x21 x22 r2 x2 s22

k xk1 xk2 rk xk sk2

El número de ensayos (repeticiones) para cada muestra no tiene porque ser el mismo, de modo que ri

representará el número de repeticiones realizadas con la i-ésima muestra. Entonces, el número total de

ensayos n estará dado por la suma de las repeticiones de cada muestra n=∑ ri y la media global

X=∑ x i , j

nLa hipótesis nula adoptada es que todas las k muestras se extraen de una población con media m y varianza s2. Con base en esta hipótesis se puede estimar la varianza (cuadrado medio) de dos formas: una estudia la variación dentro de cada muestra, y la otra la variación entre las distintas muestras.

Variación dentro de la muestra: La estimación de la varianza dentro de la muestra se realiza a través de su cuadrado medio (CM) definido como el cociente entre la suma de cuadrados (SC) y los grados de libertad (gl). Los grados de libertad para cada muestra están dados por el número de repeticiones realizadas en la muestra menos uno: gli=ri−1

CM (dentro )= SC(dentro)gl(dentro )

SC (dentro )¿∑i=1

k

gli∗si

2

gl ( dentro )=∑i=1

k

gli=n−k

Variación entre muestras: La estimación de la varianza entre las muestras se realiza a través de su cuadrado medio.

CM (entre )=SC(entre)gl(entre)

SC (entre )=∑i=1

k

ri∗( x i−X )2

gl ( entre )=k−1Se procede a elaborar la tabla ANOVA de la siguiente manera:

Fuente de variación SC gl CM

Entre muestrasSC (entre )=∑

i=1

k

ri∗( x i−X )2k−1 SC (entre )

gl(entre)

Dentro de la muestra SC (dentro )¿∑

i=1

k

gli∗si

2 n−k SC (dentro)gl(dentro)

Total SC ( total ) gl(total)

Para la variación total se acumulan los parciales tanto para la suma de cuadrados como para los grados de libertad.

SC ( total )=SC (entre )+SC (dentro )gl (total )=gl (entre )+gl ( dentro )= (k−1 )+(n−k )=n−1

Page 12: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

El valor del test está dado por F=CM (entremuestras)

CM (dentrode la muestra) , el cual se compara con el valor

crítico a una cola F ( gl1 , gl2 ,α )¿

.

Si, por ejemplo, se desea estudiar el efecto de tres diferentes catalizadores sobre el rendimiento de un producto industrial, ó examinar cinco diferentes técnicas analíticas para la determinación de la concentración de una especie, es indispensable aplicar el análisis de varianza.

Ejemplo 10:

Considere que 3 diferentes catalizadores han sido utilizados en un estudio respecto al rendimiento de un producto industrial. La tabla presenta los datos de este experimento y los resultados de algunos cálculos.

repeticiones ri x i si2 gli∗si

2 ( x i−X )2 ri∗( x i−X )2

A 85 86 83 82 87 90 80 81 8 84.25 11.36 79.50 5.06 40.50

B 87 86 85 93 89 88 86 89 8 87.88 6.41 44.88 1.89 15.13

C 89 85 90 86 83 88 87 91 8 87.38 7.13 49.88 0.77 6.13

= 24 259.50 174.25 61.75

X=¿ 86.50

Se asume que las observaciones son independientes y que cada serie proviene de una población normalmente distribuida con varianza s2. Sin embargo, cada serie tiene media diferente. Entonces, en este caso se utilizará ANOVA para establecer si la diferencia observada entre las medias surge debido a la casualidad exclusivamente, o existe evidencia de que existe diferencia significativa entre las medias.

Se definen las siguientes cantidades:

n = número de datos = 24

k = número total de tipos de factor (catalizadores) bajo análisis = 3

SC(dentro) = 174.25

SC(entre) = 61.75

gl(dentro) = n-k = 24-3 = 21

gl(entre) = k-1 = 3-1 = 2

CM(dentro) = 174.25/21 = 8.30

CM(entre) = 61.75/2 = 30.88

Un valor significativo para F indica una variación significativa debida a los distintos tipos de factor, esto es, las medias de los tres catalizadores no son las mismas.

Los resultados del ANOVA a un factor para los datos se resumen:

Fuente de Variación SC gl CM

Entre series

(debido al catalizador)61.75 2 30.88

Residual

(errores casuales)174.25 21 8.30

Total 236.00 23

El test F da el siguiente resultado: F. = 30.88 / 8.30 = 3.72 > F*(2, 21, 0.05) = 3.47

Como se deduce de la observación de la tabla, la variación entre series es claramente mayor que la variación casual. Por consiguiente el valor de F es significativo. Esto indica que los rendimientos promedio con los catalizadores A, B, y C son diferentes. Esto significa que uno ó dos de los catalizadores considerados dan resultados significativamente mejores que el ó los otros.

3.8 Análisis del coeficiente de correlaciónPara determinar si existe o no correlación lineal entre dos variables, se procede a realizar la inferencia estadística sobre el coeficiente de correlación lineal.

Page 13: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

A continuación se analizarán dos métodos: uno paramétrico y otro no paramétrico. La hipótesis nula postula que el coeficiente de correlación lineal es igual a cero, lo cual equivale a decir que no existe correlación lineal entre las variables.

H 0 : ρ=0 H A : ρ≠0

3.8.1 Test de Pearson

Compara directamente el valor del coeficiente de correlación muestral (r) con el valor crítico que se localiza conociendo el número de grados de libertad (n-2) y el nivel de significancia (a). La hipótesis se

acepta si se cumple la condición |r|<r(n−2 , α )¿

3.8.2 Test de Spearman (Rank Correlation)

Se realiza un ranking para cada una de las variables. Como los datos son apareados, se calculan las diferencias de los ranks correspondientes (di). El valor del test se calcula con la fórmula indicada a continuación y se compara con el valor crítico que se localiza conociendo el tamaño de la muestra ( n) y el nivel de significancia (a).

r s=1−6∗∑ d i

2

n(n2−1)

La hipótesis se acepta si se cumple la condición |r s|<r s( n,α )

¿

Ejemplo 11:

Las distancias recorridas y los tiempos empleados por 15 trabajadores para llega a sus trabajos se indican a continuación. Hay evidencia suficiente para decir que estos datos bivariados están linealmente correlacionados?. Usar a=0.05.

X(mil) 3 5 7 8 10 11 12 12 13 15 15 16 18 19 20

Y(min) 7 20 20 15 25 17 20 35 26 25 35 32 44 37 45

Método paramétrico :

1) H0: = 0 HA: 0 (dos colas)

2) a = 0.05

3) Inferencia paramétrica sobre el coeficiente de correlación lineal.

4) El test es el valor del coeficiente de correlación lineal calculado r=0.879.

5) Los valores críticos tabulados son ± r*(13,0.025) = ± 0.514

La zona de aceptación se encuentra entre -0.514 y 0.514 .

6) El test cae en la zona de rechazo derecha, por lo tanto la evidencia presentada es suficiente para rechazar la hipótesis nula. Esto significa que los datos si están linealmente correlacionados.

Método no paramétrico :

1) H0: = 0 HA: 0 (dos colas)

2) a = 0.05

3) Test de correlación de rango de Spearman.

4) Para calcular el valor del test es necesario elaborar los rankings de cada una de las variables. Esto se muestra en la siguiente tabla.

i X Y Rx Ry di di2

1 3 7 1.0 1.0 0.0 0.002 5 20 2.0 5.0 -3.0 9.003 7 20 3.0 5.0 -2.0 4.004 8 15 4.0 2.0 2.0 4.005 10 25 5.0 7.5 -2.5 6.256 11 17 6.0 3.0 3.0 9.00

Page 14: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

7 12 20 7.5 5.0 2.5 6.258 12 35 7.5 11.5 -4.0 16.009 13 26 9.0 9.0 0.0 0.0010 15 25 10.5 7.5 3.0 9.0011 15 35 10.5 11.5 -1.0 1.0012 16 32 12.0 10.0 2.0 4.0013 18 44 13.0 14.0 -1.0 1.0014 19 37 14.0 13.0 1.0 1.0015 20 45 15.0 15.0 0.0 0.00

= 70.50

rs = 1 - 6*70.5/[15 (225-1)] = 0.874

5) Los valores críticos tabulados son ± rs*

(15,0.025) = ± 0.521

La zona de aceptación va desde -0.521 hasta 0.521

6) El valor del test cae fuera de la zona de aceptación, por tanto se rechaza la hipótesis nula. Se concluye que las variables están linealmente correlacionadas.

3.9 Actividades

3.9.1 En clasea) Cuál es la diferencia sustancial entre los tests paramétricos y los no paramétricos?

b) Cuáles son las diferentes aplicaciones del test t?.

c) Dé ejemplos de muestras independientes y dependientes.

d) De los tests estudiados, cuáles son paramétricos y cuáles son no-paramétricos?

e) Las galletas se empaquetan en cajas que se afirma tienen un promedio de 7.25 onzas y 32 galletas. Se contó el número de galletas en cada una de 18 cajas aleatoriamente seleccionadas. Los resultados se totalizaron mediante x = 535 y x2 = 16010. Al 0.02 de nivel de significancia, concuerda con que el número de galletas por paquete podría ser 32 ?.(3)

f) Muestras aleatorias de los resultados de una prueba en dos clases dieron las siguientes estadísticas:

Clase A : n = 16 s2 = 92.3

Clase B : n = 25 s2 = 34.7

Proveen estos datos suficiente razón para rechazar la hipótesis de que las dos clases tienen varianzas iguales ?. Use a = 0.05 (3)

g) Los siguientes datos fueron obtenidos en un experimento conducido por un jardinero, cuyo objeto era descubrir cuando un cambio aplicado en la mezcla de fertilizante para sus plantas de tomate resultaría en mejores frutos. Tenía 11 plantas en una fila; a 5 se les dio la mezcla estándar de fertilizante A, y las 6 restantes fueron alimentadas con una mezcla supuestamente mejorada de fertilizante B. Las mezclas A y B fueron aplicadas al azar sobre la fila de plantas.

# 1 2 3 4 5 6 7 8 9 10 11

Mezcla A A B B A B B B A A B

Lbs tomate

29.9 11.4 26.6 23.7 25.3 28.5 14.2 17.9 16.5 21.1 24.3

Al nivel de significancia del 5%, hay suficiente evidencia para sostener que la nueva mezcla de fertilizante mejora la producción?.

3.9.2 En casaa) En un gran huerto de cerezas el promedio producido ha sido 4.35 toneladas por acre en los últimos

años. Se probó un nuevo fertilizante sobre 15 lotes de un acre, seleccionados al azar. La producción de estos lotes fue la siguiente:

3.56 4.93 5.12 4.45 3.48

5.00 3.92 5.13 5.35 4.45

Page 15: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

4.88 4.25 4.79 4.81 4.72

Al nivel de significancia del 0.05, se tiene suficiente evidencia para afirmar que hubo un incremento significativo en la producción ?. (3)

b) Anteriormente la desviación estándar de los pesos de ciertos paquetes de 32.0 onzas llenados por una máquina fue 0.25 onzas. Una muestra aleatoria de 20 paquetes mostró una desviación estándar de 0.35 onzas. Es el aparente incremento en variabilidad, significativo al nivel de significancia de 0.10 ?. (3)

c) La desviación estándar de las temperaturas anuales de una ciudad en un período de 100 años es 15 F. Usando la temperatura media en el 15 día de cada mes durante los últimos 12 meses, una desviación estándar de temperaturas anuales se calculó como 10.5 F. Es la temperatura en la ciudad significativamente menos variable que en el pasado a un nivel de significancia de 0.10 ?.(3)

d) La contaminación del aire se determina midiendo varios elementos diferentes que pueden detectarse en el aire. Uno de ellos es el monóxido de carbono (CO). La muestra de lecturas diarias en la tabla siguiente se obtuvo del diario local.

3.5 3.9 2.8 3.1 3.1 3.4

4.8 3.2 2.5 3.5 4.4 3.1

1. Calcule la media y la desviación estándar para esta muestra.

El monóxido de carbono es medido e interpretado de acuerdo con la escala :

bajo : de 0 a 4.9; medio : de 4.9 a 14.9; alto : de 14.9 en adelante

2. Presenta la muestra suficiente evidencia para permitir concluir que el nivel de monóxido de carbono es bajo al nivel de significancia del 5% ?.

3. Presenta la muestra suficiente evidencia para permitir rechazar la afirmación de que la varianza de las lecturas de CO no es mayor que 0.25 a a=0.05 ? (3)

f) Dos muestras independientes se tomaron de poblaciones normales, con los resultados mostrados en la tabla adjunta. Esta información provee suficiente razón para rechazar la hipótesis nula en favor de la afirmación de que la media de la población R es significativamente mayor que la media de la población S ?. Use a = 0.05 (3)

Muestra n x (x - )2

R 10 295 75

S 8 195 90

g) Los efectos corrosivos de varios suelos sobre los filtros de acero con revestimiento y sin revestimiento fueron probados usando un plan de muestreo dependiente. Los datos recogidos son resumidos en

n = 40 d = 220 d2 = 62220

donde d es la cantidad de corrosión de la porción revestida substraída de la cantidad de corrosión de la porción no revestida. Provee esta muestra suficiente razón para concluir que el revestimiento es beneficioso ?. Use a = 0.01. (3)

h) Las dos muestras independientes de la tabla adjunta se obtuvieron esperando demostrar que la media de la población A es mayor que la media de la población B. Las muestras proveen evidencia significativa para justificar tal esperanza  (utilice el test no paramétrico)?. Use a = 0.05 (3)

Muestra A 6 7 7 6 6 5 6 8 5 4

Muestra B 7 2 4 3 3 5 4 6 4 2

i) Se ha efectuado un estudio respecto al tiempo de coagulación de la sangre de 24 animales los cuales han sido distribuidos de manera casual en 4 grupos y se les ha suministrado 4 diferentes dietas alimenticias (A, B, C, y D). Los resultados se resumen en la siguiente tabla:

A B C D

62 63 68 56

60 67 66 62

63 71 71 60

59 64 67 61

Page 16: Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

  66 68 63

    68 64

      63

      59

Media=

61,0 66,2 68,0 61,0

Aplique el análisis de varianza a un factor para establecer si existe o no diferencia significativa entre las medias de los tiempos de coagulación de sangre obtenidos para las cuatro dietas y de acuerdo a esto determine si es posible establecer cual es la mejor dieta a usar para el propósito de reducir el tiempo de coagulación de la sangre de estos animales.

j) En un estudio del corazón se midió la presión sistolítica de la sangre a 24 hombres de 25 años de edad y a 30 hombres de 40 años de edad. Muestran los datos siguientes suficiente evidencia para concluir que los hombres de mayor edad tienen presión sistolítica de la sangre más alta, al nivel de significancia del 0.02 ?. (3)

25 años :

95 100 100 105 106 108 110 110 115 118 120 122

124 125 130 130 130 132 136 138 140 148 150 156

40 años :

108 110 110 114 114 116 118 120 122 124

126 126 128 130 130 132 136 136 136 140

142 142 146 148 150 152 154 160 164 176