Upload
usmp-fn-archivos
View
436
Download
11
Embed Size (px)
Citation preview
Eduardo Vergara Wekselman Eduardo Vergara Wekselman Médico Epidemiólogo RNE # 20215Médico Epidemiólogo RNE # 20215
INFERENCIA ESTADISTICAINFERENCIA ESTADISTICA
INFERENCIA ESTADISTICAINFERENCIA ESTADISTICA
Muestra
• Población Objetivo
Inferencia estadística Muestreo
Investigador
La inferencia estadística se refiere a los métodos y/o procesos para obtener
conclusiones acerca de poblaciones, basados en la información muestral.
POBLACIONPOBLACION
MUESTRAMUESTRA
XX11,...........,X,...........,XNN XX11....,X....,Xnn
Antes de realizar cualquier inferencia estadística es necesario identificar la
distribución de probabilidad de la variable aleatoria que se pretende analizar.
Algunos instrumentos para ello son:
•Histograma, rango de la variable.
•Gráficos de caja
•Pruebas de ajuste a una distribución (Test de Kolmogorov-Smirnoff).
Para llevar a cabo estos contrates en SPSS seguiremos:
Analizar la opción Pruebas no parametricas K-S de una muestra donde se
debe seleccionar como distribución de prueba: Normal
INTRODUCCIÓN INTRODUCCIÓN
La media muestral (X) y la desviación estándar (S) son buenos estimadores
puntuales de la media (µ) y la desviación estándar de la población (σ) .
Dado que los datos son las observaciones de una variable aleatoria, estos
estimadores son a la vez variables aleatorias.
Por lo tanto tienen una determinada distribución, que en el caso de la media es
Normal.
Así pues podemos calcular un intervalo de valores [a,b] tales que
)( bXaP = C
Gráficamente: para una normal tipificada, un intervalo de confianza del 95% se
puede representar como:
95%
2.5%2.5%
La probabilidad de que una
variable normal tipificada
tome valores en el
intervalo
[-1.96,1.96] es del 95%.
GRÁFICA DE UN INTERVALO DE CONFIANZA GRÁFICA DE UN INTERVALO DE CONFIANZA
INTERVALO DE CONFIANZA:INTERVALO DE CONFIANZA:
• Intervalo construido bajo condiciones tales que con una cierta probabilidad (usualmente 95%) contenga al parámetro deseado
• Intervalo calculado de acuerdo a principios tales que 95 de cada 100 intervalos similarmente construidos contendrán el valor del parámetro
• Uno puede tener 95% de confianza en afirmar que ese intervalo contiene el valor real del parámetro
IINFERENCIA ESTADISTICANFERENCIA ESTADISTICA
Definición de Inferencia de Estadística:Definición de Inferencia de Estadística:
Es un proceso por medio del cuál se elaboran conclusiones probabilísticas
en relación a una población, valiéndose de la información proporcionada
por una muestra de esa población.
PROBLEMAS A RESOLVER MEDIANTE LA INFERENCIA PROBLEMAS A RESOLVER MEDIANTE LA INFERENCIA ESTADÍSTICAESTADÍSTICA
1. Conocer la proporción de estudiantes que fuman cigarrillos de la Facultad de Medicina de la
USMP
2. Un investigador esta interesado en comparar la efectividad de dos medicamentos en el
tratamiento de la Malaria
AREAS DE LA INFERENCIA ESTADISTICAAREAS DE LA INFERENCIA ESTADISTICA
1. Estimación de parámetros (Resuelve Problema 1)
2. Prueba de Hipótesis (Resuelve problema 2)
TIPOS DE ESTIMACIÓN POR PARAMETROSTIPOS DE ESTIMACIÓN POR PARAMETROS
La estimación por parámetros es de dos tiposLa estimación por parámetros es de dos tipos
1. Estimación por punto
2. Estimación por intervalo
ESTIMACIÓN POR PUNTO DE PARÁMETROSESTIMACIÓN POR PUNTO DE PARÁMETROSLo proporcionan sus respectivos estadísticos que se calculan en base a la Muestra, es decir:Parámetros Estadísticos _ n x = xi
i=1 n
n _ 2 s2 = (xi - x)2
i=1 n - 1 _ _1 - 2 x1 - x2
P p = a/n, donde a es el número de unidades que poseen el atributo de interés en la muestra
P1 - P2 p1 - p2 .
ESTIMACIÓN:ESTIMACIÓN:
PuntualPuntual: : Determina que posible valor del parámetro de la población es más
consistente con los datos observados en la muestra.
Ejemplo: el cálculo de una tasa de incidencia, un RR o un promedio
Por intervaloPor intervalo: : Cuantifica la incertidumbre o variabilidad que tiene una
estimación.
Ejemplo: el cálculo de un intervalo de confianza
Ejemplo 1 Estimación de una media aritmética
• Se tiene interés en estimar la estatura media de los alumnos de la Facultad de
Medicina de la USMP. Para tal efecto se recurre a una muestra aleatoria de 36
alumnos y se obtienen los siguientes resultados: _• x = 170 cm y s = 20cm.
• La estatura media de los alumnos está representado por (que es el parámetro
de la población) y la estimación por punto de este parámetro está dado por : _• x = 170 cm.
• En relación al ejemplo 1, construiremos un intervalo de confianza del 95% para la
estatura promedio () de los estudiantes de medicina.
• Grado de confianza del 95% le corresponde un Z=1.96
_ __• Error estándar ES (x) = 20/36 = 3.33
• Por consiguiente:
• L1= 170 – 1.96 *3.33 = 163.5 (6.52)
• L2= 170 + 1.96 *3.33 = 176.5
[163.5 , 176.5]
La estatura promedio de los estudiantes de la Facultad de Medicina de la USMP
está oscilando entre 163.5 y 176.5 cm con grado de confianza 95%
Ejemplo 2 Estimación de una proporción P
• Interés: Estimar la proporción de niños desnutridos menores de 5 años de una determinada
comunidad.
• Seleccionamos una muestra de 100 niños menores de 5 años y se determina que 45 están
desnutridos.
• Se quiere estimar una proporción de población P P = A/N, donde, A: nº de niños menores de 5 años
desnutridos en la población y N: nº de niños menores de 5 años en la población.
• El estimador es: p p = a/n donde a es el número de niños desnutridos en la muestra y n es el
tamaño de muestra. Por consiguiente, p = 45/100 = 0.45. proporción estimada de niños
desnutridos menores de 5 años en la comunidad es de 0.45
ESTIMACIÓN POR INTERVALOESTIMACIÓN POR INTERVALO
• Consiste en determinar dos valores numéricos L1 y L2 y que con un cierto
grado de confianza se espera que el valor del parámetro esté
comprendida entre dichos valores.
• Intervalo de confianza para la media
• En este caso los valores L1 y L2 serían: _ _• L1 = x - Z ES (x) _ _• L2 = x + Z ES (x)
• Donde:
Donde t n-1 es el coeficiente de confiabilidad, cuyo valor se obtiene de la tabla
de distribución “t” de Student con n-1 grados de libertad para el nivel de
confianza deseado.
Algunas características de la distribución “t” de Student son:
La distribución tiene forma acampanada.
Es simétrica respecto al punto t=0
Forma cola rápidamente a la derecha e izquierda; por lo tanto “t” es más variable que Z
La “forma” de la distribución cambia conforme el valor de n. Es decir, para cada grado de
libertad (n-1) existe una curva simétrica.
A medida que n aumenta, “t” se aproxima a la normal Z.
Ejemplo 2
Se desea estimar el tiempo promedio de estancia hospitalaria para cierto tipo de
pacientes. Se toma una muestra de 25 historias clínicas y se calcula x =5,7 y s =
4,5 días.
Estimar con 95% de confianza.
Solución: En este caso no se conoce σ luego el modelo de estimación, será:• L.S
= x ± t n-1 s
n L.I.
• Z : Es un coeficiente de confianza y cuyo valor depende del grado de
confianza (G.C.) que se establece, es decir:
G.C. : 90% 95% 99%
Z : 1.64 1.96 2.57 _ _• ES(x) : es el error estándar de x y se define como: _ _ • ES(x) = s/n , donde s es la desviación estándar de la muestra
• Nota El coeficiente Z se utiliza cuando tamaño de muestra n > 30.
Luego de la tabla “t” se obtiene para un nivel de significación de 0,05
bilateral: t24 = 2,064
= 5,7 2,064 4,5 25
Interpretación:
La probabilidad de que el tiempo promedio de estancia hospitalaria, en la
población de pacientes, se encuentre entre 3.84 y 7.56, es de 0,95.
7,56 días
3,84 días
INTERVALO DE CONFIANZA PARA LA PROPORCIÓN PINTERVALO DE CONFIANZA PARA LA PROPORCIÓN P
• L1 = p - z pq/n
• L2 = p + zpq/n
• donde q = 1 - p.
• pq/n = ES(p), nos indica el estimador del error estándar de la proporción
de la muestra p
• Según la información que se dispone, se construye un intervalo del 95% para P:
• Para una confianza del 95%, Z = 1.96
• Reemplazando valores se tiene: ____________• L1 = 0.45 - 1.96 * 0.45(0.55)/100 = 0.352 ____________• L2 = 0.45 + 1.96 * 0.45(0.55)/100 = 0.548.
• La proporción de niños menores de 5 años desnutridos en dicha comunidad
está entre 0.352 y 0.548 con una confianza del 95%.
• Nota Se utiliza el coeficiente de confianza Z/2 si np y n(1-p) >5.
PRUEBA DE HIPÓTESISPRUEBA DE HIPÓTESIS
• Es una técnica estadística que se sigue para decidir si rechazamos o no una hipótesis
estadística en base a la información de una muestra.
Hipótesis estadística:
• Es una afirmación de lo que creemos sobre una población. Por lo general, está
hipótesis se refiere a los parámetros de la población acerca de los cuales se quiere
hacer la afirmación. (En la practica, se tiene idea de la distribución de la variable que
se está estudiando)
• Ejemplo 1: Un investigador pretende estudiar en forma comparativa la eficacia de
dos tratamientos (o procedimientos experimentales) para determinar cuál es el mejor
CARACTERÍSTICA DE LA HIPÓTESISCARACTERÍSTICA DE LA HIPÓTESIS
Plantearse conceptual y operativamente.
Ser claras y precisas.
Ser específicas
Referirse a situaciones empíricas y objetivas (no juicios de valor)
HIPÓTESIS DE INVESTIGACIÓNHIPÓTESIS DE INVESTIGACIÓN
Es una respuesta tentativa al problema planteado. Ella está basado
en la Observación o en algún sistema teórico.
TIPOS DE HIPÓTESIS ESTADÍSTICATIPOS DE HIPÓTESIS ESTADÍSTICA
• Hipótesis nula (HHipótesis nula (Hoo)) también se le denomina hipótesis de la no diferencia y se establece para ser
rechazada o desacreditada.
• Considerando el ejemplo establecido en la hipótesis estadística , las hipótesis nula que les corresponde
es:
• Ho: A - B = 0 (Tratamiento A no difiere de B)
• Hipótesis alterna (HHipótesis alterna (H11)) son todas las demás suposiciones o alternativas al problema para contrastar Ho.
• La hipótesis alterna H1 puede ser uni o bilateral.
• Con respecto al ejemplo, se tiene:
• H1: A - B > 0, (indica que tratamiento A es mejor que el tratamiento B. Ha unilateral a la derecha)
Ho verdadero Ho Falso
Rechazar Ho Error tipo I () Decisión correcta
(1-ß) Decisión estadística
No rechazar Ho Decisión correcta
(1-) Error tipo II (ß)
Nivel de significancia: En realidad
• Cuando se toma una decisión estadística, podemos cometer el error tipo I o tipo II.
= P(error tipo I) = P( Rechazar Ho / Ho es verdadero) puede ser manejada por el investigador, por consiguiente puede establecer su
valor, es decir, =0.001, 0.01 , 0.05 nos indica el nivel de significación de la prueba, porque permite diferenciar la
región de rechazo y no rechazo de la prueba.1- 1- indica el grado de confianza de la prueba. indica el grado de confianza de la prueba.ß= P(error tipo II) = P(No rechazar Ho / Ho falso)ß no se maneja directamente por el investigador. y ß y ß están relacionados y ambos disminuyen su valor si incrementamos el
tamaño de muestra o si mejoremos el diseño del estudio.1-ß= P(rechazar Ho/Ho es falso), también se denomina potencia de prueba. Valor
mínimo que puede tomar es del 80%.
• Mostraremos estas cuatro probabilidades utilizando la distribución de medias y una prueba unilateral.
(1- (1-
H0H1
_xc
0
_ xi
Zona de no rechazo de H0 Zona de rechazo de H0
IDENTIFICACIÓN DE HIPÓTESIS ESTADÍSTICASIDENTIFICACIÓN DE HIPÓTESIS ESTADÍSTICAS
• Hipótesis nula Ho
– Hipótesis de Igual
– La que contrastamos
• Hipótesis Alternativa H1
– Hipótesis de Diferencia
– Niega a H0 (y creemos que es ‘mejor’).
:H
:H
1
0%50p
%50p
BilateralBilateral UnilateralUnilateral
CONTRASTES: UNILATERAL Y BILATERALCONTRASTES: UNILATERAL Y BILATERAL
Unilateral Unilateral
Bilateral
H1: <70 H1: >70
H1: 70
REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓNREGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN
Región críticaRegión crítica• Valores menos probables’
Nivel de significación: aNivel de significación: a• Número pequeño: 1% , 5%• Fijado de antemano por el investigador• Es la probabilidad de rechazar H0 cuando es cierta
No rechazo No rechazo H0H0
Reg. Crit.Reg. Crit.Reg. Crit.
=5%=5%
=70=70
SIGNIFICACIÓN : PSIGNIFICACIÓN : P
P
P
85X
Se rechaza H0: =40
Se acepta H1: >40
El contraste es El contraste es estadísticamente significativoestadísticamente significativo cuando cuando p<p<
DecisiónHipótesis Nula
H0 cierta H0 falsa
No Rechazar H0(1-α)
Nivel de confianza
βError Tipo II
Rechazar H0 αError Tipo I
(1- β)Potencia
ERROR TIPO I y ERROR TIPO IIERROR TIPO I y ERROR TIPO II
Fuente.- Schefler. Bioestadística.
Decisión
Realidad
Ninguna Ninguna DiferenciaDiferencia DiferenciaDiferencia
Ninguna Ninguna DiferenciaDiferencia (1-α) β
DiferenciaDiferencia α (1- β)
Fuente.- Norman y Streiner. Bioestadística.
DecisiónRealidad
HH00 cierta cierta HH00 Falsa Falsa
No Rechazo HNo Rechazo H00
CorrectoCorrectoEl tratamiento no tiene efecto y así se decide.
Error de tipo IIError de tipo IIEl tratamiento si tiene efecto pero
no lo percibimos. Probabilidad β
Rechazo HRechazo H00
(Acepto H(Acepto H11))
Error de tipo IError de tipo IEl tratamiento no tiene efecto pero se decide
que sí. Probabilidad α
CorrectoCorrectoEl tratamiento tiene efecto y el
experimento lo confirma.
Fuente.- F. J. Barón López. Universidad de Málaga.
PASOSPASOS DE UNA PRUEBA DE HIPÓTESISDE UNA PRUEBA DE HIPÓTESIS
a. Planteamiento de Hipótesis: H0 y H1
b. Nivel de Significación (α = 0.05 ó α = 0.01)
c. Contraste estadístico (según escalas de medición y diseño)
d. Significación (resultado de p)
e. Decisión (Rechazar H0 ó No Rechazar H0)
f. Conclusión (conduce a la decisión clínica – teórica)
RESUMEN: RESUMEN: αα, , p p Y CRITERIO DE RECHAZOY CRITERIO DE RECHAZO
Sobre el criterio de rechazo Contraste significativo = p menor que a
Estadísticos de contrastea
259753,500
462319,500
-2,317
,021
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintót. (bilateral)
Edad delencuestado
Variable de agrupación: Sexo del encuestadoa.
a. Estudio sobre nivel de hemoglobina en sangre y exposición a la baja presión de oxigeno en la altura.
b. Se tiene que en la población general la media es 15.80 g /100 ml y con una desviación de 5 g/100 ml. En los hallazgos muestrales se hallo una media de 15.96 g/100 ml.
c. Planteando una hipótesis Bilateral: H0 = μm = μp
d. Nivel de Significancia al 5%
e. Estadísticos: EE = 0.05; Z = x – μ / EE = 3.20
f. P es altamente significativo
g. Rechazar la H0
h. Conclusión (conduce a la decisión clínica – teórica)
NIVEL CRITICO DE UNA PRUEBA ESTADISTICANIVEL CRITICO DE UNA PRUEBA ESTADISTICA NIVEL CRITICO INTERPRETACION CONCLUSION
p > 0.05p > 0.05 Indica que la diferencia encontrada Indica que la diferencia encontrada es NO SIGNIFICATIVA y puede es NO SIGNIFICATIVA y puede
deberse al azar del muestreodeberse al azar del muestreo
No rechazar HoNo rechazar Ho
No hay evidencia suficiente para No hay evidencia suficiente para rechazarrechazar
0.01 < p 0.01 < p ≤ 0.05≤ 0.05 Indica que la diferencia encontrada Indica que la diferencia encontrada ES SIGNIFICATIVA y que ES SIGNIFICATIVA y que
probablemente no se deba al azarprobablemente no se deba al azar
Rechazar Ho a favor de HaRechazar Ho a favor de Ha
hay evidencia suficiente para hay evidencia suficiente para rechazarrechazar
0.001 < p 0.001 < p ≤ 0.01≤ 0.01 Indica que la diferencia encontrada Indica que la diferencia encontrada es MUY SIGNIFICATIVA y es MUY SIGNIFICATIVA y
probablemente se deba a que hay probablemente se deba a que hay diferencias en la población diferencias en la población
Rechazar Ho a favor de HaRechazar Ho a favor de Ha
hay evidencia suficiente para hay evidencia suficiente para rechazarrechazar
p p ≤ 0.001≤ 0.001 Indica que la diferencia encontrada Indica que la diferencia encontrada es ALTAMENTE SIGNIFICATIVA y es ALTAMENTE SIGNIFICATIVA y probablemente se deba a que hay probablemente se deba a que hay
diferencias en la poblacióndiferencias en la población
Rechazar Ho a favor de HaRechazar Ho a favor de Ha
hay evidencia suficiente para hay evidencia suficiente para rechazarrechazar
Sí p > α, entonces No se puede rechazar la Hipótesis al nivel α establecido
Sí p ≤ ≤ α entonces se rechaza la Hipótesis al nivel α establecido
ESQUEMA DE SELECCIÓN DE PRUEBAS ESTADÍSTICASESQUEMA DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS
Número de grupos
1 grupo1 grupo
2 grupos2 grupos
3 grupos3 grupos
n > = 30n > = 30
SiSiPrueba Z para la mediaPrueba Z para la media
NoNo
Distribución Distribución normalnormal
Prueba T para la mediaPrueba T para la media
Prueba del signo Prueba del signo para la medianapara la mediana
SiSi
NoNo
IndependientesIndependientes
IndependientesIndependientes
SiSin > = 30n > = 30
Prueba Z para la Prueba Z para la ≠ ≠ mediamediaSiSi
NoNo Distribución Distribución normalnormal
Distribución Distribución Normal c/varianzasNormal c/varianzas
semejantessemejantes NoNo
SiSi
ANVA Comparación de Ttos0ANVA Comparación de Ttos0
Prueba de krustal-Wallis-Comp TtosPrueba de krustal-Wallis-Comp Ttos
SiSi
NoNoDistribución Distribución
Normal c/varianzasNormal c/varianzassemejantessemejantes NoNo
SiSiANVA en bloque Comparación de TtosANVA en bloque Comparación de Ttos
Prueba de Friedman -Comp TtosPrueba de Friedman -Comp Ttos
SiSi
NoNo
Varianzas Varianzas igualesiguales
Prueba TPrueba Tpara para ≠ de≠ de medias medias
Prueba TPrueba TCon ajustes de Con ajustes de
g de libertadg de libertad
SiSi
NoNo
Prueba de Mann Whitney Prueba de Mann Whitney para comparación de poblacpara comparación de poblac
NoNo n > = 30n > = 30
SiSi
NoNo
Prueba Z para la mediaPrueba Z para la mediade la de la ≠ en datos apareados≠ en datos apareados
Distribución Distribución normalnormal
SiSi
NoNo
Prueba T para la media de Prueba T para la media de La La ≠ en datos apareados≠ en datos apareados
Prueba del signo ó dePrueba del signo ó deWilcoxon para datos apareadosWilcoxon para datos apareados
ESQUEMA DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS CUANDO LA VARIABLE ESQUEMA DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS CUANDO LA VARIABLE DEPENDIENTE ES NOMINALDEPENDIENTE ES NOMINAL
Número de grupos
1 grupo1 grupo
2 grupos2 grupos
3 grupos3 grupos
Muestra grandeMuestra grandenP y n (1-P) > 5nP y n (1-P) > 5
SiSi
NoNo
IndependientesIndependientes
IndependientesIndependientes
SiSi Frecuencias Frecuencias EsperadasEsperadas pequeñaspequeñas
SiSi
NoNo
Frecuencias Frecuencias EsperadasEsperadaspequeñaspequeñas
SiSi
NoNo
NoNo
Prueba Z para la proporción poblacionalPrueba Z para la proporción poblacional
Prueba binomial p/ proporción poblacionalPrueba binomial p/ proporción poblacional
Prueba exacta de Fisher Prueba exacta de Fisher Comparación de proporcionesComparación de proporciones
Prueba Z o Prueba JI Cuadrado para Prueba Z o Prueba JI Cuadrado para Comparación de proporcionesComparación de proporciones
SiSi
NoNo
Prueba de McNemarPrueba de McNemarComparación de proporcionesComparación de proporciones
Prueba JI Cuadrado (reunir categorías)Prueba JI Cuadrado (reunir categorías)para comparación de proporcionespara comparación de proporciones
Prueba JI Cuadrado para Prueba JI Cuadrado para Comparación de proporcionesComparación de proporciones
Prueba Q de Cochran Prueba Q de Cochran comparación de tratamientoscomparación de tratamientos
ESQUEMAS DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS PARA ESQUEMAS DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS PARA MEDIR RELACIÓN ENTRE VARIABLES MEDIR RELACIÓN ENTRE VARIABLES
Escala de Escala de Medición Medición
paraparaambasambas
variables variables
ContinuaContinua
Ordinal y/ó númericaOrdinal y/ó númerica
NominalNominal
Coeficiente de correlación lineal de Pearson Coeficiente de correlación lineal de Pearson
Cada variable Cada variable Tiene dos Tiene dos CategoríasCategorías
(tabla de 2x2)(tabla de 2x2)
Coeficiente de correlación por rangos de Spearman Coeficiente de correlación por rangos de Spearman
Prueba JI Cuadrado (Coeficiente Prueba JI Cuadrado (Coeficiente ǿ)ǿ)Riesgo relativo (Estudios de cohorte)Riesgo relativo (Estudios de cohorte)Odds ratio (Estudios de casos-control)Odds ratio (Estudios de casos-control)Coeficiente de concordancia Kappa Coeficiente de concordancia Kappa (Comparación de métodos)(Comparación de métodos)
Prueba de JI Cuadrado para independencia Prueba de JI Cuadrado para independencia de variables (Coeficiente de contingencia) de variables (Coeficiente de contingencia)
CHI CUADRADOCHI CUADRADO
• Variables cualitativas
• Dos o más categorías excluyentes
• Tablas de contingencia
Peso del niño al nacer. Estudio de seguimiento de 2000 Peso del niño al nacer. Estudio de seguimiento de 2000 gestantes.gestantes.
Recién nacido de bajo pesoRecién nacido de bajo peso
GestanteGestante SíSí NoNo TotalTotal
FumadoraFumadora 43 43 (a)(a) 207 207 (b)(b) 250 250 (a+b)(a+b)
No fumadoraNo fumadora 105 105 (c)(c) 1645 1645 (d)(d) 1750 1750 (c+d)(c+d)
TotalTotal 148 148 (a+c)(a+c) 1852 1852 (b+d)(b+d) 20002000
• Para hallar los valores esperadosPara hallar los valores esperados
• E = E = (a+b) x (a+c)(a+b) x (a+c) = = 250 x 148250 x 148 = 18.5 = 18.5 (a)(a)
n 2000n 2000
CHI CUADRADOCHI CUADRADO
Peso del niño al nacer. Estudio de seguimiento de 2000 gestantes. (valores esperados)
Recién nacido de bajo pesoRecién nacido de bajo peso
GestanteGestante SíSí NoNo TotalTotal
FumadoraFumadora 18.5 (a)(a) 231.5 (b)(b) 250250
No fumadoraNo fumadora 129.5 (c)(c) 1620.5 (d)(d) 17501750
TotalTotal 148148 18521852 20002000
• E = E = (a+b) x (b+d)(a+b) x (b+d) = = 250 x 1852250 x 1852 = 231.5 = 231.5 (b)(b)
n 2000n 2000• E = E = (c+d) x (a+c)(c+d) x (a+c) = = 1750 x 148 1750 x 148 = 129.5 = 129.5 (c)(c) n 2000n 2000• E = E = (c+d) x (b+d(c+d) x (b+d) =) = 1750 x 1852 1750 x 1852 = 1620.5 = 1620.5 (d)(d) n 2000n 2000
• X2 = (43 - 18.5)2 + (207 - 231.5)2 + (105 - 129.5)2 + (1645 - 1620.5)2
18.5 231.5 129.5 1620.5
• X2 = (24.5)2 + (-24.5)2 + (-24.5)2 + (24.5)2
18.5 231.5 129.5 1620.5
• X2 = 600.25 + 600.25 + 600.25 + 600.25 = 32.44 + 2.59 + 4.6 + 0.37
18.5 231.5 129.5 1620.5
• X2 = 40.04
• Para una seguridad del 95% (α =0.05) el valor teórico de una distribución ji-cuadrado con un grado de libertad es 3,84.
• Para α =0.01 es de 6,63 y para α =0.005 es de 7,88. Como quiera que en el cálculo del χ 2 en el ejemplo obtuvimos un valor de 40,04, que supera al valor para α =0.005.
• Concluimos que las dos variables no son independientes, sino que están asociadas (p<0.005).
• Por lo tanto, a la vista de los resultados, rechazamos la hipótesis nula (H0) y
aceptamos la hipótesis alternativa (Ha) como probablemente cierta.