Inferencia Estadística.ppt

Eduardo Vergara Wekselman Eduardo Vergara Wekselman Médico Epidemiólogo RNE # 20215Médico Epidemiólogo RNE # 20215

INFERENCIA ESTADISTICAINFERENCIA ESTADISTICA

INFERENCIA ESTADISTICAINFERENCIA ESTADISTICA

Muestra

• Población Objetivo

Inferencia estadística Muestreo

Investigador

La inferencia estadística se refiere a los métodos y/o procesos para obtener

conclusiones acerca de poblaciones, basados en la información muestral.

POBLACIONPOBLACION

MUESTRAMUESTRA

XX11,...........,X,...........,XNN XX11....,X....,Xnn

Antes de realizar cualquier inferencia estadística es necesario identificar la

distribución de probabilidad de la variable aleatoria que se pretende analizar.

Algunos instrumentos para ello son:

•Histograma, rango de la variable.

•Gráficos de caja

•Pruebas de ajuste a una distribución (Test de Kolmogorov-Smirnoff).

Para llevar a cabo estos contrates en SPSS seguiremos:

Analizar la opción Pruebas no parametricas K-S de una muestra donde se

debe seleccionar como distribución de prueba: Normal

INTRODUCCIÓN INTRODUCCIÓN

La media muestral (X) y la desviación estándar (S) son buenos estimadores

puntuales de la media (µ) y la desviación estándar de la población (σ) .

Dado que los datos son las observaciones de una variable aleatoria, estos

estimadores son a la vez variables aleatorias.

Por lo tanto tienen una determinada distribución, que en el caso de la media es

Normal.

Así pues podemos calcular un intervalo de valores [a,b] tales que

)( bXaP = C

Gráficamente: para una normal tipificada, un intervalo de confianza del 95% se

puede representar como:

95%

2.5%2.5%

La probabilidad de que una

variable normal tipificada

tome valores en el

intervalo

[-1.96,1.96] es del 95%.

GRÁFICA DE UN INTERVALO DE CONFIANZA GRÁFICA DE UN INTERVALO DE CONFIANZA

INTERVALO DE CONFIANZA:INTERVALO DE CONFIANZA:

• Intervalo construido bajo condiciones tales que con una cierta probabilidad (usualmente 95%) contenga al parámetro deseado

• Intervalo calculado de acuerdo a principios tales que 95 de cada 100 intervalos similarmente construidos contendrán el valor del parámetro

• Uno puede tener 95% de confianza en afirmar que ese intervalo contiene el valor real del parámetro

IINFERENCIA ESTADISTICANFERENCIA ESTADISTICA

Definición de Inferencia de Estadística:Definición de Inferencia de Estadística:

Es un proceso por medio del cuál se elaboran conclusiones probabilísticas

en relación a una población, valiéndose de la información proporcionada

por una muestra de esa población.

PROBLEMAS A RESOLVER MEDIANTE LA INFERENCIA PROBLEMAS A RESOLVER MEDIANTE LA INFERENCIA ESTADÍSTICAESTADÍSTICA

1. Conocer la proporción de estudiantes que fuman cigarrillos de la Facultad de Medicina de la

USMP

2. Un investigador esta interesado en comparar la efectividad de dos medicamentos en el

tratamiento de la Malaria

AREAS DE LA INFERENCIA ESTADISTICAAREAS DE LA INFERENCIA ESTADISTICA

1. Estimación de parámetros (Resuelve Problema 1)

2. Prueba de Hipótesis (Resuelve problema 2)

TIPOS DE ESTIMACIÓN POR PARAMETROSTIPOS DE ESTIMACIÓN POR PARAMETROS

La estimación por parámetros es de dos tiposLa estimación por parámetros es de dos tipos

1. Estimación por punto

2. Estimación por intervalo

ESTIMACIÓN POR PUNTO DE PARÁMETROSESTIMACIÓN POR PUNTO DE PARÁMETROSLo proporcionan sus respectivos estadísticos que se calculan en base a la Muestra, es decir:Parámetros Estadísticos _ n x = xi

i=1 n

n _ 2 s2 = (xi - x)2

i=1 n - 1 _ _1 - 2 x1 - x2

P p = a/n, donde a es el número de unidades que poseen el atributo de interés en la muestra

P1 - P2 p1 - p2 .

ESTIMACIÓN:ESTIMACIÓN:

PuntualPuntual: : Determina que posible valor del parámetro de la población es más

consistente con los datos observados en la muestra.

Ejemplo: el cálculo de una tasa de incidencia, un RR o un promedio

Por intervaloPor intervalo: : Cuantifica la incertidumbre o variabilidad que tiene una

estimación.

Ejemplo: el cálculo de un intervalo de confianza

Ejemplo 1 Estimación de una media aritmética

• Se tiene interés en estimar la estatura media de los alumnos de la Facultad de

Medicina de la USMP. Para tal efecto se recurre a una muestra aleatoria de 36

alumnos y se obtienen los siguientes resultados: _• x = 170 cm y s = 20cm.

• La estatura media de los alumnos está representado por (que es el parámetro

de la población) y la estimación por punto de este parámetro está dado por : _• x = 170 cm.

• En relación al ejemplo 1, construiremos un intervalo de confianza del 95% para la

estatura promedio () de los estudiantes de medicina.

• Grado de confianza del 95% le corresponde un Z=1.96

_ __• Error estándar ES (x) = 20/36 = 3.33

• Por consiguiente:

• L1= 170 – 1.96 *3.33 = 163.5 (6.52)

• L2= 170 + 1.96 *3.33 = 176.5

[163.5 , 176.5]

La estatura promedio de los estudiantes de la Facultad de Medicina de la USMP

está oscilando entre 163.5 y 176.5 cm con grado de confianza 95%

Ejemplo 2 Estimación de una proporción P

• Interés: Estimar la proporción de niños desnutridos menores de 5 años de una determinada

comunidad.

• Seleccionamos una muestra de 100 niños menores de 5 años y se determina que 45 están

desnutridos.

• Se quiere estimar una proporción de población P P = A/N, donde, A: nº de niños menores de 5 años

desnutridos en la población y N: nº de niños menores de 5 años en la población.

• El estimador es: p p = a/n donde a es el número de niños desnutridos en la muestra y n es el

tamaño de muestra. Por consiguiente, p = 45/100 = 0.45. proporción estimada de niños

desnutridos menores de 5 años en la comunidad es de 0.45

ESTIMACIÓN POR INTERVALOESTIMACIÓN POR INTERVALO

• Consiste en determinar dos valores numéricos L1 y L2 y que con un cierto

grado de confianza se espera que el valor del parámetro esté

comprendida entre dichos valores.

• Intervalo de confianza para la media

• En este caso los valores L1 y L2 serían: _ _• L1 = x - Z ES (x) _ _• L2 = x + Z ES (x)

• Donde:

Donde t n-1 es el coeficiente de confiabilidad, cuyo valor se obtiene de la tabla

de distribución “t” de Student con n-1 grados de libertad para el nivel de

confianza deseado.

Algunas características de la distribución “t” de Student son:

La distribución tiene forma acampanada.

Es simétrica respecto al punto t=0

Forma cola rápidamente a la derecha e izquierda; por lo tanto “t” es más variable que Z

La “forma” de la distribución cambia conforme el valor de n. Es decir, para cada grado de

libertad (n-1) existe una curva simétrica.

A medida que n aumenta, “t” se aproxima a la normal Z.

Ejemplo 2

Se desea estimar el tiempo promedio de estancia hospitalaria para cierto tipo de

pacientes. Se toma una muestra de 25 historias clínicas y se calcula x =5,7 y s =

4,5 días.

Estimar con 95% de confianza.

Solución: En este caso no se conoce σ luego el modelo de estimación, será:• L.S

= x ± t n-1 s

n L.I.

• Z : Es un coeficiente de confianza y cuyo valor depende del grado de

confianza (G.C.) que se establece, es decir:

G.C. : 90% 95% 99%

Z : 1.64 1.96 2.57 _ _• ES(x) : es el error estándar de x y se define como: _ _ • ES(x) = s/n , donde s es la desviación estándar de la muestra

• Nota El coeficiente Z se utiliza cuando tamaño de muestra n > 30.

Luego de la tabla “t” se obtiene para un nivel de significación de 0,05

bilateral: t24 = 2,064

= 5,7 2,064 4,5 25

Interpretación:

La probabilidad de que el tiempo promedio de estancia hospitalaria, en la

población de pacientes, se encuentre entre 3.84 y 7.56, es de 0,95.

7,56 días

3,84 días

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN PINTERVALO DE CONFIANZA PARA LA PROPORCIÓN P

• L1 = p - z pq/n

• L2 = p + zpq/n

• donde q = 1 - p.

• pq/n = ES(p), nos indica el estimador del error estándar de la proporción

de la muestra p

• Según la información que se dispone, se construye un intervalo del 95% para P:

• Para una confianza del 95%, Z = 1.96

• Reemplazando valores se tiene: ____________• L1 = 0.45 - 1.96 * 0.45(0.55)/100 = 0.352 ____________• L2 = 0.45 + 1.96 * 0.45(0.55)/100 = 0.548.

• La proporción de niños menores de 5 años desnutridos en dicha comunidad

está entre 0.352 y 0.548 con una confianza del 95%.

• Nota Se utiliza el coeficiente de confianza Z/2 si np y n(1-p) >5.

PRUEBA DE HIPÓTESISPRUEBA DE HIPÓTESIS

• Es una técnica estadística que se sigue para decidir si rechazamos o no una hipótesis

estadística en base a la información de una muestra.

Hipótesis estadística:

• Es una afirmación de lo que creemos sobre una población. Por lo general, está

hipótesis se refiere a los parámetros de la población acerca de los cuales se quiere

hacer la afirmación. (En la practica, se tiene idea de la distribución de la variable que

se está estudiando)

• Ejemplo 1: Un investigador pretende estudiar en forma comparativa la eficacia de

dos tratamientos (o procedimientos experimentales) para determinar cuál es el mejor

CARACTERÍSTICA DE LA HIPÓTESISCARACTERÍSTICA DE LA HIPÓTESIS

Plantearse conceptual y operativamente.

Ser claras y precisas.

Ser específicas

Referirse a situaciones empíricas y objetivas (no juicios de valor)

HIPÓTESIS DE INVESTIGACIÓNHIPÓTESIS DE INVESTIGACIÓN

Es una respuesta tentativa al problema planteado. Ella está basado

en la Observación o en algún sistema teórico.

TIPOS DE HIPÓTESIS ESTADÍSTICATIPOS DE HIPÓTESIS ESTADÍSTICA

• Hipótesis nula (HHipótesis nula (Hoo)) también se le denomina hipótesis de la no diferencia y se establece para ser

rechazada o desacreditada.

• Considerando el ejemplo establecido en la hipótesis estadística , las hipótesis nula que les corresponde

es:

• Ho: A - B = 0 (Tratamiento A no difiere de B)

• Hipótesis alterna (HHipótesis alterna (H11)) son todas las demás suposiciones o alternativas al problema para contrastar Ho.

• La hipótesis alterna H1 puede ser uni o bilateral.

• Con respecto al ejemplo, se tiene:

• H1: A - B > 0, (indica que tratamiento A es mejor que el tratamiento B. Ha unilateral a la derecha)

Ho verdadero Ho Falso

Rechazar Ho Error tipo I () Decisión correcta

(1-ß) Decisión estadística

No rechazar Ho Decisión correcta

(1-) Error tipo II (ß)

Nivel de significancia: En realidad

• Cuando se toma una decisión estadística, podemos cometer el error tipo I o tipo II.

= P(error tipo I) = P( Rechazar Ho / Ho es verdadero) puede ser manejada por el investigador, por consiguiente puede establecer su

valor, es decir, =0.001, 0.01 , 0.05 nos indica el nivel de significación de la prueba, porque permite diferenciar la

región de rechazo y no rechazo de la prueba.1- 1- indica el grado de confianza de la prueba. indica el grado de confianza de la prueba.ß= P(error tipo II) = P(No rechazar Ho / Ho falso)ß no se maneja directamente por el investigador. y ß y ß están relacionados y ambos disminuyen su valor si incrementamos el

tamaño de muestra o si mejoremos el diseño del estudio.1-ß= P(rechazar Ho/Ho es falso), también se denomina potencia de prueba. Valor

mínimo que puede tomar es del 80%.

• Mostraremos estas cuatro probabilidades utilizando la distribución de medias y una prueba unilateral.

(1- (1-

H0H1

_xc

0

_ xi

Zona de no rechazo de H0 Zona de rechazo de H0

IDENTIFICACIÓN DE HIPÓTESIS ESTADÍSTICASIDENTIFICACIÓN DE HIPÓTESIS ESTADÍSTICAS

• Hipótesis nula Ho

– Hipótesis de Igual

– La que contrastamos

• Hipótesis Alternativa H1

– Hipótesis de Diferencia

– Niega a H0 (y creemos que es ‘mejor’).

:H

:H

1

0%50p

%50p

BilateralBilateral UnilateralUnilateral

CONTRASTES: UNILATERAL Y BILATERALCONTRASTES: UNILATERAL Y BILATERAL

Unilateral Unilateral

Bilateral

H1: <70 H1: >70

H1: 70

REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓNREGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN

Región críticaRegión crítica• Valores menos probables’

Nivel de significación: aNivel de significación: a• Número pequeño: 1% , 5%• Fijado de antemano por el investigador• Es la probabilidad de rechazar H0 cuando es cierta

No rechazo No rechazo H0H0

Reg. Crit.Reg. Crit.Reg. Crit.

=5%=5%

=70=70

SIGNIFICACIÓN : PSIGNIFICACIÓN : P

P

P

85X

Se rechaza H0: =40

Se acepta H1: >40

El contraste es El contraste es estadísticamente significativoestadísticamente significativo cuando cuando p<p<

DecisiónHipótesis Nula

H0 cierta H0 falsa

No Rechazar H0(1-α)

Nivel de confianza

βError Tipo II

Rechazar H0 αError Tipo I

(1- β)Potencia

ERROR TIPO I y ERROR TIPO IIERROR TIPO I y ERROR TIPO II

Fuente.- Schefler. Bioestadística.

Decisión

Realidad

Ninguna Ninguna DiferenciaDiferencia DiferenciaDiferencia

Ninguna Ninguna DiferenciaDiferencia (1-α) β

DiferenciaDiferencia α (1- β)

Fuente.- Norman y Streiner. Bioestadística.

DecisiónRealidad

HH00 cierta cierta HH00 Falsa Falsa

No Rechazo HNo Rechazo H00

CorrectoCorrectoEl tratamiento no tiene efecto y así se decide.

Error de tipo IIError de tipo IIEl tratamiento si tiene efecto pero

no lo percibimos. Probabilidad β

Rechazo HRechazo H00

(Acepto H(Acepto H11))

Error de tipo IError de tipo IEl tratamiento no tiene efecto pero se decide

que sí. Probabilidad α

CorrectoCorrectoEl tratamiento tiene efecto y el

experimento lo confirma.

Fuente.- F. J. Barón López. Universidad de Málaga.

PASOSPASOS DE UNA PRUEBA DE HIPÓTESISDE UNA PRUEBA DE HIPÓTESIS

a. Planteamiento de Hipótesis: H0 y H1

b. Nivel de Significación (α = 0.05 ó α = 0.01)

c. Contraste estadístico (según escalas de medición y diseño)

d. Significación (resultado de p)

e. Decisión (Rechazar H0 ó No Rechazar H0)

f. Conclusión (conduce a la decisión clínica – teórica)

RESUMEN: RESUMEN: αα, , p p Y CRITERIO DE RECHAZOY CRITERIO DE RECHAZO

Sobre el criterio de rechazo Contraste significativo = p menor que a

Estadísticos de contrastea

259753,500

462319,500

-2,317

,021

U de Mann-Whitney

W de Wilcoxon

Z

Sig. asintót. (bilateral)

Edad delencuestado

Variable de agrupación: Sexo del encuestadoa.

a. Estudio sobre nivel de hemoglobina en sangre y exposición a la baja presión de oxigeno en la altura.

b. Se tiene que en la población general la media es 15.80 g /100 ml y con una desviación de 5 g/100 ml. En los hallazgos muestrales se hallo una media de 15.96 g/100 ml.

c. Planteando una hipótesis Bilateral: H0 = μm = μp

d. Nivel de Significancia al 5%

e. Estadísticos: EE = 0.05; Z = x – μ / EE = 3.20

f. P es altamente significativo

g. Rechazar la H0

h. Conclusión (conduce a la decisión clínica – teórica)

NIVEL CRITICO DE UNA PRUEBA ESTADISTICANIVEL CRITICO DE UNA PRUEBA ESTADISTICA NIVEL CRITICO INTERPRETACION CONCLUSION

p > 0.05p > 0.05 Indica que la diferencia encontrada Indica que la diferencia encontrada es NO SIGNIFICATIVA y puede es NO SIGNIFICATIVA y puede

deberse al azar del muestreodeberse al azar del muestreo

No rechazar HoNo rechazar Ho

No hay evidencia suficiente para No hay evidencia suficiente para rechazarrechazar

0.01 < p 0.01 < p ≤ 0.05≤ 0.05 Indica que la diferencia encontrada Indica que la diferencia encontrada ES SIGNIFICATIVA y que ES SIGNIFICATIVA y que

probablemente no se deba al azarprobablemente no se deba al azar

Rechazar Ho a favor de HaRechazar Ho a favor de Ha

hay evidencia suficiente para hay evidencia suficiente para rechazarrechazar

0.001 < p 0.001 < p ≤ 0.01≤ 0.01 Indica que la diferencia encontrada Indica que la diferencia encontrada es MUY SIGNIFICATIVA y es MUY SIGNIFICATIVA y

probablemente se deba a que hay probablemente se deba a que hay diferencias en la población diferencias en la población



p p ≤ 0.001≤ 0.001 Indica que la diferencia encontrada Indica que la diferencia encontrada es ALTAMENTE SIGNIFICATIVA y es ALTAMENTE SIGNIFICATIVA y probablemente se deba a que hay probablemente se deba a que hay

diferencias en la poblacióndiferencias en la población



Sí p > α, entonces No se puede rechazar la Hipótesis al nivel α establecido

Sí p ≤ ≤ α entonces se rechaza la Hipótesis al nivel α establecido

ESQUEMA DE SELECCIÓN DE PRUEBAS ESTADÍSTICASESQUEMA DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS

Número de grupos

1 grupo1 grupo

2 grupos2 grupos

3 grupos3 grupos

n > = 30n > = 30

SiSiPrueba Z para la mediaPrueba Z para la media

NoNo

Distribución Distribución normalnormal

Prueba T para la mediaPrueba T para la media

Prueba del signo Prueba del signo para la medianapara la mediana

SiSi

NoNo

IndependientesIndependientes


SiSin > = 30n > = 30

Prueba Z para la Prueba Z para la ≠ ≠ mediamediaSiSi

NoNo Distribución Distribución normalnormal

Distribución Distribución Normal c/varianzasNormal c/varianzas

semejantessemejantes NoNo

SiSi

ANVA Comparación de Ttos0ANVA Comparación de Ttos0

Prueba de krustal-Wallis-Comp TtosPrueba de krustal-Wallis-Comp Ttos

SiSi

NoNoDistribución Distribución

Normal c/varianzasNormal c/varianzassemejantessemejantes NoNo

SiSiANVA en bloque Comparación de TtosANVA en bloque Comparación de Ttos

Prueba de Friedman -Comp TtosPrueba de Friedman -Comp Ttos

SiSi

NoNo

Varianzas Varianzas igualesiguales

Prueba TPrueba Tpara para ≠ de≠ de medias medias

Prueba TPrueba TCon ajustes de Con ajustes de

g de libertadg de libertad

SiSi

NoNo

Prueba de Mann Whitney Prueba de Mann Whitney para comparación de poblacpara comparación de poblac

NoNo n > = 30n > = 30

SiSi

NoNo

Prueba Z para la mediaPrueba Z para la mediade la de la ≠ en datos apareados≠ en datos apareados

Distribución Distribución normalnormal

SiSi

NoNo

Prueba T para la media de Prueba T para la media de La La ≠ en datos apareados≠ en datos apareados

Prueba del signo ó dePrueba del signo ó deWilcoxon para datos apareadosWilcoxon para datos apareados

ESQUEMA DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS CUANDO LA VARIABLE ESQUEMA DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS CUANDO LA VARIABLE DEPENDIENTE ES NOMINALDEPENDIENTE ES NOMINAL

Número de grupos

1 grupo1 grupo

2 grupos2 grupos

3 grupos3 grupos

Muestra grandeMuestra grandenP y n (1-P) > 5nP y n (1-P) > 5

SiSi

NoNo



SiSi Frecuencias Frecuencias EsperadasEsperadas pequeñaspequeñas

SiSi

NoNo

Frecuencias Frecuencias EsperadasEsperadaspequeñaspequeñas

SiSi

NoNo

NoNo

Prueba Z para la proporción poblacionalPrueba Z para la proporción poblacional

Prueba binomial p/ proporción poblacionalPrueba binomial p/ proporción poblacional

Prueba exacta de Fisher Prueba exacta de Fisher Comparación de proporcionesComparación de proporciones

Prueba Z o Prueba JI Cuadrado para Prueba Z o Prueba JI Cuadrado para Comparación de proporcionesComparación de proporciones

SiSi

NoNo

Prueba de McNemarPrueba de McNemarComparación de proporcionesComparación de proporciones

Prueba JI Cuadrado (reunir categorías)Prueba JI Cuadrado (reunir categorías)para comparación de proporcionespara comparación de proporciones

Prueba JI Cuadrado para Prueba JI Cuadrado para Comparación de proporcionesComparación de proporciones

Prueba Q de Cochran Prueba Q de Cochran comparación de tratamientoscomparación de tratamientos

ESQUEMAS DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS PARA ESQUEMAS DE SELECCIÓN DE PRUEBAS ESTADÍSTICAS PARA MEDIR RELACIÓN ENTRE VARIABLES MEDIR RELACIÓN ENTRE VARIABLES

Escala de Escala de Medición Medición

paraparaambasambas

variables variables

ContinuaContinua

Ordinal y/ó númericaOrdinal y/ó númerica

NominalNominal

Coeficiente de correlación lineal de Pearson Coeficiente de correlación lineal de Pearson

Cada variable Cada variable Tiene dos Tiene dos CategoríasCategorías

(tabla de 2x2)(tabla de 2x2)

Coeficiente de correlación por rangos de Spearman Coeficiente de correlación por rangos de Spearman

Prueba JI Cuadrado (Coeficiente Prueba JI Cuadrado (Coeficiente ǿ)ǿ)Riesgo relativo (Estudios de cohorte)Riesgo relativo (Estudios de cohorte)Odds ratio (Estudios de casos-control)Odds ratio (Estudios de casos-control)Coeficiente de concordancia Kappa Coeficiente de concordancia Kappa (Comparación de métodos)(Comparación de métodos)

Prueba de JI Cuadrado para independencia Prueba de JI Cuadrado para independencia de variables (Coeficiente de contingencia) de variables (Coeficiente de contingencia)

CHI CUADRADOCHI CUADRADO

• Variables cualitativas

• Dos o más categorías excluyentes

• Tablas de contingencia

Peso del niño al nacer. Estudio de seguimiento de 2000 Peso del niño al nacer. Estudio de seguimiento de 2000 gestantes.gestantes.

Recién nacido de bajo pesoRecién nacido de bajo peso

GestanteGestante SíSí NoNo TotalTotal

FumadoraFumadora 43 43 (a)(a) 207 207 (b)(b) 250 250 (a+b)(a+b)

No fumadoraNo fumadora 105 105 (c)(c) 1645 1645 (d)(d) 1750 1750 (c+d)(c+d)

TotalTotal 148 148 (a+c)(a+c) 1852 1852 (b+d)(b+d) 20002000

• Para hallar los valores esperadosPara hallar los valores esperados

• E = E = (a+b) x (a+c)(a+b) x (a+c) = = 250 x 148250 x 148 = 18.5 = 18.5 (a)(a)

n 2000n 2000

CHI CUADRADOCHI CUADRADO

Peso del niño al nacer. Estudio de seguimiento de 2000 gestantes. (valores esperados)

Recién nacido de bajo pesoRecién nacido de bajo peso

GestanteGestante SíSí NoNo TotalTotal

FumadoraFumadora 18.5 (a)(a) 231.5 (b)(b) 250250

No fumadoraNo fumadora 129.5 (c)(c) 1620.5 (d)(d) 17501750

TotalTotal 148148 18521852 20002000

• E = E = (a+b) x (b+d)(a+b) x (b+d) = = 250 x 1852250 x 1852 = 231.5 = 231.5 (b)(b)

n 2000n 2000• E = E = (c+d) x (a+c)(c+d) x (a+c) = = 1750 x 148 1750 x 148 = 129.5 = 129.5 (c)(c) n 2000n 2000• E = E = (c+d) x (b+d(c+d) x (b+d) =) = 1750 x 1852 1750 x 1852 = 1620.5 = 1620.5 (d)(d) n 2000n 2000

• X2 = (43 - 18.5)2 + (207 - 231.5)2 + (105 - 129.5)2 + (1645 - 1620.5)2

18.5 231.5 129.5 1620.5

• X2 = (24.5)2 + (-24.5)2 + (-24.5)2 + (24.5)2

18.5 231.5 129.5 1620.5

• X2 = 600.25 + 600.25 + 600.25 + 600.25 = 32.44 + 2.59 + 4.6 + 0.37

18.5 231.5 129.5 1620.5

• X2 = 40.04

• Para una seguridad del 95% (α =0.05) el valor teórico de una distribución ji-cuadrado con un grado de libertad es 3,84.

• Para α =0.01 es de 6,63 y para α =0.005 es de 7,88. Como quiera que en el cálculo del χ 2 en el ejemplo obtuvimos un valor de 40,04, que supera al valor para α =0.005.

• Concluimos que las dos variables no son independientes, sino que están asociadas (p<0.005).

• Por lo tanto, a la vista de los resultados, rechazamos la hipótesis nula (H0) y

aceptamos la hipótesis alternativa (Ha) como probablemente cierta.

Documents

Inferencia Estadística.ppt