Tema: Intervalos de confianza y contraste de hipótesis
Docente: A. Javier Pruñonosa Santana
Datos de contacto: E-mail: [email protected]
Estadística inferencial
PoblaciónParámetros (μ, σ, etc)
MuestraEstimadores
(χ, s, etc)
Muestreo aleatorioInferencia
Conduce a 2 tipos de resultados:
-Valores “Valores “pp””
-Intervalos de confianzaIntervalos de confianza
Inferencia estadísticaRecordemos que un estimador es una función de los valores de la muestra que se elabora para indagar el valor de un parámetro de la población de la cual procede la muestra.
Los estimadores de la muestra permiten obtener un valor aproximado de alguna característica de la población (parámetro)
2 tipos de estimación:
Estimación puntual
Estimación por intervalo
Proporciona un valor único aproximado del parámetro desconocido, quedando sin especificar que de buena es esta aproximación. Ej: A partir de la muestra se estima que la prevalencia de fumadores en la población es del 20%.
Proporciona un rango de posibles valores, algunos de los cuales “confiamos” que sea el verdadero valor del parámetro desconocido, con una determinada seguridad de que la afirmación sea cierta. Ej: La prevalencia de fumadores en la población general se estima entre un 18% y un 22%, con un una nivel de confianza al 95%.
1.- Intervalos de confianza
Concepto de intervalo de confianza (IC)
“Es un rango de valores – calculado en nuestros estimadores de la muestra - en el que nosotros confiamos que se contenga el parámetro poblacional”
“Nos permiten presentar un resultado acompañándolo de un margen de error, con un límite superior y otro inferior”
Para calcularlo necesitamos utilizar el concepto de “Error estándar” del estimador calculado de la muestra: media, proporción, varianza, curtosis, etc.
Representación de 100 intervalos de confianza al 95%, calculados en 100 muestras distintas obtenidas de una misma población
Ejemplo: Interesa estimar la media de edad de la población a partir de una muestra aleatoria, y con distribución normal, n= 100. La media muestral obtenida fue de 39 años y se sabe que el error estándar de la media poblacional es de 2.n = 100 x = 39 EE μ = 2 EE μ = s / √ n
Cálculo del intervalo de confianza usando la normal
Paso 1.- Calcular el parámetro x = 39
Paso 2.- Comprobar las condiciones de aplicación n>60, ¿simetría? ¿Curtosis?
Paso 3.- Calcular el error estándar del parámetro EE μ = 2
Paso 4.- Asignar a “z” un valor adecuado al error alfa del intervalo de confianza que deseemos calcular. Si el intervalo es al 95%, alfa valdrá 0,025 en cada cola, es decir 0,05 a dos colas y z2 = 1,96
(ver tabla de distribución normal)
IC para el cálculo de medias
Tener en cuenta que:
-El error alfa en cada cola es (1 – el nivel de confianza del intervalo en tanto por uno) / 2
-El error alfa en ambas colas es (1 – el nivel de confianza del intervalo en tanto por uno).
Paso 5.- Sumar y restar al parámetro z veces el EE del parámetro
μ Е χ ± zα/2 EEμ
IC 95%: x ± zα/2 EEμ = 39 ± (1,96) (2) = (35,08 a 42,92)
Paso 6.- Conclusiones: Se puede afirmar con una confianza del 95% que la media de edad en la población estará situada entre 35 y los 42 años de edad.
Confiamos en que éste sea uno de los 95 intervalos de cada 100 que incluyen a la media poblacional y no sea uno de los 5 intervalos de cada 100 que no incluyen a la media poblacional.
OJO
Identifiquemos que en este ejemplo conocíamos un parámetro poblacional = error estándar de la media.
Si solo conocemos los estimadores muestrales, podemos hacer todo el procedimiento, pero le asignaremos un valor a “z” utilizando la tabla de distribución para la “t de student”.
Ejercicio 2: En una muestra aleatoria de la población menor de 18 años del Estado de Morelos (n = 1000), se encuentra a un total de 200 fumadores. Calcular la proporción de fumadores en la población general.
IC para el cálculo de proporciones
Cálculo del intervalo de confianza usando la normal
Paso 1.- Calcular el parámetro p = 200 / 1000 = 0,2 1-p = 0,8
Paso 2.- Comprobar las condiciones de aplicación
p>5/n 0,2 > 5/100 (Se cumple)
1- p > 5/n 0,8 > 5/100 (Se cumple)
Paso 3.- Calcular el error estándar del parámetro EEP = √ p(1-p) / n
EPP = √ (0,2 x 0,8) / 1000 = 0,01265
Si no cumpliera estos criterios, es mejor resolverlo a través de la binomial.
Paso 4.- Asignar a “z” un valor adecuado al error alfa del intervalo de confianza que deseemos calcular. Si el intervalo es al 95%, alfa valdrá 0,025 en cada cola, es decir 0,05 a dos colas y zα = 1,96
(ver tabla de distribución normal)
Paso 5.- Sumar y restar al parámetro z veces el EE del parámetro
IC 95%: π ± zα/2 EEP = 0,2 ± 1,96 x 0,01265 = (0,1752 a 0,2247)
Paso 6.- Conclusiones: Se puede afirmar con una confianza del 95% que la prevalencia de fumadores en menores de 18 años de edad, en el Estado de Morelos, se encuentra en el rango de valores entre el 17,5% y el 22,5%.Confiamos en que éste sea uno de los 95 intervalos de cada 100 que incluyen a la prevalencia poblacional y no sea uno de los 5 intervalos de cada 100 que no incluyen este parámetro poblacional.
2.- Estimación puntual
Test de chi cuadrado
Formulación de las hipótesis
Hipótesis nula (H0)
Es una afirmación acerca del valor de un parámetro en una población, o sobre la comparación de un parámetro en dos poblaciones.
Siempre incluye una igualdad (>= ; = ; <=)
Hipótesis alternativa (H1)
Es la negación de la hipótesis nula; Es en general la hipótesis de investigación
Ho
Región de
aceptación
1 - α
α = 0,05
Región de rechazo
0 3,84 167
Errores en el contraste de hipótesis
Distribución binomial y estimación del error alfa
Test de Chi cuadrado
Esperado
ObservadoEsperadoChi
2)(2
Planteamiento implícito en la fórmula: Los datos que encontré en mi estudio, qué tan diferentes son a los valores que esperaría en una población “teórica” que cumpla con el planteamiento de mi hipótesis nula
Veamos un ejemplo
EJERICICIO SOBRE MEDIDAS DE ASOCIACIÓNEJERICICIO SOBRE MEDIDAS DE ASOCIACIÓN
EjemploEn un estudio de una muestra de 450 personas se desea estudiar si existe asociación entre la obesidad y la Diabetes mellitus; se encontró que 250 personas eran obesas. Mediante pruebas de laboratorio se detectó que del total de la muestra 150 eran diabéticos. De los 200 no obesos 50 eran diabéticos y 150 ni eran obesos ni diabéticos
CASOS NO CASOSCASOS NO CASOS
ENFERMEDADENFERMEDAD
A B
C D
Mi Mo
Ni
No
TABLA CUADRICELULAR O DE 2 x2
Fx de
Riesgo
Fx de
Riesgo
N
EXPEXP
NO EXPNO EXP
CASOS NO CASOS CASOS NO CASOS DIABETES MELLITUSDIABETES MELLITUS
100 150
50 150
150 300
250
200
450
Obesidad
MEDIDAS DE ASOCIACIÓNMEDIDAS DE ASOCIACIÓN
EXPEXP
NO EXPNO EXP
Razón de Momios = Razón de Momios = R MR M
A X DRM = B X C
Este tipo de medida de asociación es usada para estudios de tipo trasversal, casos y controles
RM =Odss en expuestos (A / B)
Odds en No expuestos (C / D)
A X D 100 x 150
RM = = B X C 50 x 150
RM = 2.0
Las personas obesas tienen 2 veces más la posibilidad de presentar diabetes mellitus que las personas no obesas de este estudio.
¿Esta ventaja / posibilidad es estadísticamente significativa?
Test de Test de Chi 2 Chi 2
Paso 2: Calcular la distribución de casos esperados en una tabla 2 x 2
Paso 3.- Calcular el valor del estadístico
Esperado
EsperadoObservadoChi
2)(2
Paso 1: Construyamos la hipótesis de investigación (Ho y Hi)
Ho: La posibilidad (ventaja) de DM es igual en personas obesas y no obesasH1: La posibilidad (ventaja) de DM es diferente en personas obesas y no obesas
Paso 4.- Rechazamos o aceptamos la Ho
Ejercicio de Medidas de impactoEjercicio de Medidas de impactoMuertes de causas Cardiovasculares (CVC) en una cohorte seguida durante 5 años, según exposición o no a HTA grave.
Exposición a HTA grave
Muerte CVC Total
Si No
Si 588 4000 4588
No 235 4370 4605
IA Exp = 588 / 4588 = 0,128
IA NoExp = 235 / 4605 = 0,051
IA Total = 823 / 9193 = 0,0895
RR = 0,128 / 0,051 = 2,51
Estos resultados (diferencias entre IA exp e IA No exp)… ¿Son estadísticamente significativos? ¿Son realmente representativos de lo que pasa en la población? ¿Con qué probabilidad espero encontrarlos en la población de donde extraje la muestra? Resolverlo a través de la Chi cuadrada
Test de Test de Chi 2 Chi 2
Paso 2: Calcular la distribución de casos esperados en una tabla 2 x 2
Paso 3.- Calcular el valor del estadístico
Esperado
ObservadoEsperadoChi
2)(2
Paso 1: Construyamos la hipótesis de investigación (Ho y Hi)
Ho: La IA de MCV es igual en personas con i sin HTA graveH1: La IA de MCV en personas con HT grave es diferente que en personas sin HTA
Paso 4.- Rechazamos o aceptamos la Ho
Recordemos que…Recordemos que…
Desarrollar estudios con diseños de tipo prospectivo (ensayos clínicos, estudios cuasi experimentales, cohortes), nos permite realizar cálculos de incidencias acumuladas (o densidad de incidencias, según el diseño), situación que nos permite calcular una rica cantidad de estimadores de medidas de asociación e impacto.
Siguiendo con el ejemplo anterior, podríamos calcular las siguientes mediadas de asociación e impacto potencial:
Muertes de causa CVC en una cohorte, según exposición o no a HTA grave.
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
HTA Si NoIA Expuestos IA No expuestos
Riesgo atribuible en expuestos (RAE)
-Cantidad de DAÑO atribuible al FACTOR DE RIESGO en los Expuestos;-Porcentaje de muertes que se hubieran evitado si se hubiese evitado la exposición.
RAE = IA Exp – IA NoExp
RAE
RAE = IA Exp – IA NoExp
RAE = 0,128 – 0,051 = 0,077 = 7,7 %
Riesgo atribuible en expuestos (RAE)
De cada 100 personas expuestos a HTA, se habría evitado 7,7 muertes CVC evitando la exposición.
NNT: Número necesario a tratar
Si trato a 100 personas con HTA grave, podría evitar 7,7 muertes CVC: ¿Cuántas personas necesito tratar para evitar una muerte CVC?
NNT = (1 / RAE ) = 1 / 0,077
NNT = 13
Proporción Atribuible en Expuestos (PAE) o Fracción Etiológica en Expuestos (FEE)
Porcentaje del daño (mortalidad CVC) que es prevenible en los expuestos si se evitara / tratara la exposición (HTA grave)
FEE = ( IA Exp – IA NoExp) / IA Exp.
FEE = (1,128 – 0,051) / 0,128 = 0,60 = 60 %
El 60% de las muertes CVC que ocurren en pacientes con HTA grave se evitarían eliminando la exposición.
MEDIDAS DE IMPACTO POTENCIAL
FEE =FEE =
FEE =FEE =
Fracción Etiológica en Expuestos (FEE) en Fracción Etiológica en Expuestos (FEE) en estudios de cohorteestudios de cohorte
RR - 1RR - 1
R RR R
MEDIDAS DE IMPACTO POTENCIAL
FEE =FEE =
FEE =FEE =
Fracción Etiológica en Expuestos (FEE)Fracción Etiológica en Expuestos (FEE) en en estudios de cohorteestudios de cohorte
RM - 1RM - 1
R MR M
Riesgo Atribuible en la Población (RAP)
Cantidad de DAÑO atribuible al FR en toda la población
RAP = IA en la Población Total - IA en no expuestos
IA Expuestos IA NO Expuestos IA Población Total
RAP
RAP = IA en la Población Total - IA en no expuestos
Riesgo Atribuible en la Población (RAP)
RAP = 0,0895 – 0,051 = 0,0385 = 3,85%
Eliminando la HTA grave, en cada 100 personas de la población se habrían evitado 3,85 muertes CVC
Proporción Atribuible Poblacional (PAP) o Fracción Etiológica en la Población (FEP)
-Porcentaje de la cantidad de DAÑO atribuible al FR en toda la población;
- Porcentaje del daño que ocurre en la población que se evitaría eliminando / controlando el factor de riesgo
FEP = RAP / IT
FEP = 0,0385 / 0,0895 = 0,43 = 43 %
El 43% de las muertes CVC que ocurren en la población se evitarían eliminando la HTA grave
Fin de la presentación