Upload
claudia-chavez
View
27
Download
1
Embed Size (px)
DESCRIPTION
prueba de hipotesis
Citation preview
Prueba de Hiptesis
Tipos de inferencias (2)PRUEBA DE HIPOTESIS: busca responder a una pregunta sobre el valor de un parmetro en la poblacin (siempre utilizando los resultados de la muestra)
Esta pregunta sobre el valor del parmetro en la poblacin se plantea utilizando hiptesis
El procedimiento cuantifica en que medida los datos de la muestra apoyan la hiptesis planteada
En el ejemplo anterior, la pregunta es si hay menos resistencia con el nuevo antimalrico
En EstadsticaLos mtodos estadsticos son herramientas de la ciencia para el contraste formal de hiptesis.
Las hiptesis para ser contrastadas con mtodos estadsticos deben ser formuladas de modo particular
Elementos necesariosLas hiptesis
Un procedimiento para responder a la pregunta o hiptesis utilizando los datos de la muestra
Criterios para interpretar los resultados
Hiptesis
Son enunciados formulados como respuestas tentativas a preguntas de investigacin.
Pregunta de investigacin Hiptesis
Mtodo CientficoCmo funciona la Ciencia:
Se formula una hiptesis.Se obtienen datos (muestra)La hiptesis es contrastada con la evidencia de la muestra.Conclusin
La evidencia proviene de la informacin de las observaciones del fenmeno que se estudia.
Las observaciones se obtienen de unidades de estudio (individuos), usualmente de una muestra.
Porqu hiptesis?La pregunta de investigacin debe tratar de expresarse en forma de hiptesis
El mtodo cientfico no permite determinar que una hiptesis es verdadera, solamente puede determinar si es falsa
Por lo tanto debe plantearse una hiptesis que al ser rechazada d respuesta a la pregunta de investigacin
Las dos hiptesisHiptesis nula, H0Hiptesis de no diferencia o no asociacin, es planteada en forma opuesta a la pregunta de investigacin de inters, definida para ser rechazada: la tasa de resistencia a ambos antimalricos es similar
Hiptesis alternativa o alterna, HaEs la pregunta cientfica de inters. Aceptaremos que Ha es verdadera si los datos sugieren que H0 es falsa: la tasa de resistencia difiere entre ambos antimalricos
Ejemplos
HoHaRiesgo relativo = 1Riesgo relativo 1Resistencia 50%Resistencia < 50%XCD4-intervencin = XCD4-estndarXCD4-intervencin XCD4-estndarSensibtest1 Sensibtest2Sensibtest1 > Sensibtest2Xint1 = Xint2 = Xint3 = Xint4Algn Xi es diferenteEn una regresin, 1 = 01 0Curaanalgsico1 < Curaanalgsico2Curaanalgsico1 Curaanalgsico2
Las hiptesis se plantean como:De existencia del EFECTO (de un tratamiento).De una DIFERENCIA (de las medias del peso al nacer las proporciones del bajo peso al nacer entre dos poblaciones).De la ASOCIACIN (entre el tipo de construccin de las casas y la distribucin del Dengue).
Ejemplos adicionales:
La Altura produce incremento en la frecuencia de nacimientos prematuros: Existe DIFERENCIA entre las Edades gestacionales de neonatos en la Altura vs. a Nivel del Mar.La sustancia X incrementa la posibilidad de malformaciones congnitas: Existe DIFERENCIA en la prevalencia de malformaciones congnitas entre gestantes expuestas a X vs. No expuestas.
Que los alumnos formulen sus preguntas de investigacin y las conviertan en hiptesis
Formulacin de Hiptesis (continuacin)Hiptesis Nula (Ho) : Enunciado formal para el contraste de hiptesis con mtodos estadsticos: No hay asociacin, No hay diferencia, No hay efecto.
Hiptesis alternativa (H1): Hiptesis complementaria a Ho: Si hay asociacin, Si hay diferencia, Si hay efecto.
La Hiptesis nula y la Hiptesis alternativa habitualmente (p. ej. en Epidemiologa) se plantean en funcin de una Medida del Efecto.Medidas del efecto son:Diferencias de medias, Diferencias de prevalenciasRazones de riesgo (Riesgos relativos)Razones de chances (Odds ratios)
Hiptesis de dos colasUn clnico trata de demostrar que la reaccin al tratamiento es diferente entre el frmaco A y el frmaco B
Hiptesis: Ho: A = B (Nula) Ha: A B (Alterna)
Hiptesis de una colaInters especfico en una sola direccin
No existe inters/relevancia cientfica si el efecto se presenta en la otra direccin
Ejemplo: se quiere demostrar que el frmaco A tiene mayor efecto que el frmaco B
Hiptesis: Ho: A B (Nula) Ha: A > B (Alterna)
Cul hiptesis es verdadera (o falsa)?Con los datos de la muestra se calcula un valor (llamado estadstico de prueba) que sirve para decidir si Ho es falsa y debe ser rechazada (nica y exclusivamente para eso)
Si los resultados sugieren que se debe rechazar Ho, entonces automticamente se acepta que Ha es verdadera
Si los resultados no indican que se rechaze Ho tampoco se puede concluir nada sobre Ha
Usando el estadstico de pruebaCon el estadstico de prueba y una frmula matemtica (distribucin de probabilidades, que vara segn el tipo de hiptesis evaluada), se calcula una probabilidad, el famoso valor p
El valor p, p, o p-value puede interpretarse como la probabilidad de que Ho sea verdadera
Por convencin se acepta que si p < 0.05 (5%), entonces es muy probable que Ho sea falsa y por lo tanto debe ser rechazada
EjemploQueremos determinar si el promedio de peso en varones es bajo ( 70
En 30 personas, promedio 50kg y D.E. 10 kg
El Valor P y la evidenciaEl Valor P Significancia estadstica es una medida (cuantitativa) de la fuerza de la evidencia en contra de la Hiptesis nula.
Escala de grises
Mientras ms pequeo sea el valor P, ms fuerte es la evidencia en contra de la hiptesis nula.
El Valor P como una probabilidad
Utilizando el valor crticoRegin de rechazo:2.5% bajola curva Tcrtico = -1. 70Zobservado = -10.96
Chart1
0.0001338302
0.0001986555
0.0002919469
0.0004247803
0.0006119019
0.0008726827
0.0012322192
0.0017225689
0.0023840882
0.0032668191
0.0044318484
0.0059525324
0.0079154516
0.0104209348
0.0135829692
0.0175283005
0.0223945303
0.0283270377
0.0354745928
0.043983596
0.0539909665
0.0656158148
0.0789501583
0.0940490774
0.1109208347
0.1295175957
0.1497274656
0.171368592
0.194186055
0.217852177
0.2419707245
0.2660852499
0.2896915528
0.3122539334
0.3332246029
0.3520653268
0.3682701403
0.3813878155
0.391042694
0.3969525475
0.3989422804
0.3969525475
0.391042694
0.3813878155
0.3682701403
0.3520653268
0.3332246029
0.3122539334
0.2896915528
0.2660852499
0.2419707245
0.217852177
0.194186055
0.171368592
0.1497274656
0.1295175957
0.1109208347
0.0940490774
0.0789501583
0.0656158148
0.0539909665
0.043983596
0.0354745928
0.0283270377
0.0223945303
0.0175283005
0.0135829692
0.0104209348
0.0079154516
0.0059525324
0.0044318484
0.0032668191
0.0023840882
0.0017225689
0.0012322192
0.0008726827
0.0006119019
0.0004247803
0.0002919469
0.0001986555
0.0001338302
0.3969525475
0.391042694
0.3813878155
0.3682701403
0.3520653268
0.3332246029
0.3122539334
0.2896915528
0.2660852499
0.2419707245
0.217852177
0.194186055
0.171368592
0.1497274656
0.1295175957
0.1109208347
0.0940490774
0.0789501583
0.0656158148
0.0539909665
0.043983596
0.0354745928
0.0283270377
0.0223945303
0.0175283005
0.0135829692
0.0104209348
0.0079154516
0.0059525324
0.0044318484
0.0032668191
0.0023840882
0.0017225689
0.0012322192
0.0008726827
0.0006119019
0.0004247803
0.0002919469
0.0001986555
0.0001338302
Sheet1
0.1
-40.0001338302
-3.90.0001986555
-3.80.0002919469
-3.70.0004247803
-3.60.0006119019
-3.50.0008726827
-3.40.0012322192
-3.30.0017225689
-3.20.0023840882
-3.10.0032668191
-30.0044318484
-2.90.0059525324
-2.80.0079154516
-2.70.0104209348
-2.60.0135829692
-2.50.0175283005
-2.40.0223945303
-2.30.0283270377
-2.20.0354745928
-2.10.043983596
-20.0539909665
-1.90.0656158148
-1.80.0789501583
-1.70.0940490774
-1.60.1109208347
-1.50.1295175957
-1.40.1497274656
-1.30.171368592
-1.20.194186055
-1.10.217852177
-10.2419707245
-0.90.2660852499
-0.80.2896915528
-0.70.3122539334
-0.60.3332246029
-0.50.3520653268
-0.40.3682701403
-0.30.3813878155
-0.20.391042694
-0.10.3969525475
00.3989422804
0.10.3969525475
0.20.391042694
0.30.3813878155
0.40.3682701403
0.50.3520653268
0.60.3332246029
0.70.3122539334
0.80.2896915528
0.90.2660852499
10.2419707245
1.10.217852177
1.20.194186055
1.30.171368592
1.40.1497274656
1.50.1295175957
1.60.1109208347
1.70.0940490774
1.80.0789501583
1.90.0656158148
20.0539909665
2.10.043983596
2.20.0354745928
2.30.0283270377
2.40.0223945303
2.50.0175283005
2.60.0135829692
2.70.0104209348
2.80.0079154516
2.90.0059525324
30.0044318484
3.10.0032668191
3.20.0023840882
3.30.0017225689
3.40.0012322192
3.50.0008726827
3.60.0006119019
3.70.0004247803
3.80.0002919469
3.90.0001986555
40.0001338302
0.10.3969525475
0.20.391042694
0.30.3813878155
0.40.3682701403
0.50.3520653268
0.60.3332246029
0.70.3122539334
0.80.2896915528
0.90.2660852499
10.2419707245
1.10.217852177
1.20.194186055
1.30.171368592
1.40.1497274656
1.50.1295175957
1.60.1109208347
1.70.0940490774
1.80.0789501583
1.90.0656158148
20.0539909665
2.10.043983596
2.20.0354745928
2.30.0283270377
2.40.0223945303
2.50.0175283005
2.60.0135829692
2.70.0104209348
2.80.0079154516
2.90.0059525324
30.0044318484
3.10.0032668191
3.20.0023840882
3.30.0017225689
3.40.0012322192
3.50.0008726827
3.60.0006119019
3.70.0004247803
3.80.0002919469
3.90.0001986555
40.0001338302
4.10.0000892617
4.20.0000589431
4.30.0000385352
4.40.0000249425
4.50.0000159837
4.60.0000101409
4.70.0000063698
4.80.0000039613
4.90.000002439
50.0000014867
5.10.0000008972
5.20.0000005361
5.30.0000003171
5.40.0000001857
5.50.0000001077
5.60.0000000618
5.70.0000000351
5.80.0000000198
5.90.000000011
60.0000000061
6.10.0000000033
6.20.0000000018
6.30.000000001
6.40.0000000005
6.50.0000000003
6.60.0000000001
6.70.0000000001
6.80
6.90
70
7.10
7.20
7.30
7.40
7.50
7.60
7.70
7.80
7.90
80
8.10
8.20
8.30
8.40
Sheet2
Sheet3
Clculo de probabilidad exactap exacto = rea bajo la curvaZobservado = -10.96
Chart1
0.0001338302
0.0001986555
0.0002919469
0.0004247803
0.0006119019
0.0008726827
0.0012322192
0.0017225689
0.0023840882
0.0032668191
0.0044318484
0.0059525324
0.0079154516
0.0104209348
0.0135829692
0.0175283005
0.0223945303
0.0283270377
0.0354745928
0.043983596
0.0539909665
0.0656158148
0.0789501583
0.0940490774
0.1109208347
0.1295175957
0.1497274656
0.171368592
0.194186055
0.217852177
0.2419707245
0.2660852499
0.2896915528
0.3122539334
0.3332246029
0.3520653268
0.3682701403
0.3813878155
0.391042694
0.3969525475
0.3989422804
0.3969525475
0.391042694
0.3813878155
0.3682701403
0.3520653268
0.3332246029
0.3122539334
0.2896915528
0.2660852499
0.2419707245
0.217852177
0.194186055
0.171368592
0.1497274656
0.1295175957
0.1109208347
0.0940490774
0.0789501583
0.0656158148
0.0539909665
0.043983596
0.0354745928
0.0283270377
0.0223945303
0.0175283005
0.0135829692
0.0104209348
0.0079154516
0.0059525324
0.0044318484
0.0032668191
0.0023840882
0.0017225689
0.0012322192
0.0008726827
0.0006119019
0.0004247803
0.0002919469
0.0001986555
0.0001338302
0.3969525475
0.391042694
0.3813878155
0.3682701403
0.3520653268
0.3332246029
0.3122539334
0.2896915528
0.2660852499
0.2419707245
0.217852177
0.194186055
0.171368592
0.1497274656
0.1295175957
0.1109208347
0.0940490774
0.0789501583
0.0656158148
0.0539909665
0.043983596
0.0354745928
0.0283270377
0.0223945303
0.0175283005
0.0135829692
0.0104209348
0.0079154516
0.0059525324
0.0044318484
0.0032668191
0.0023840882
0.0017225689
0.0012322192
0.0008726827
0.0006119019
0.0004247803
0.0002919469
0.0001986555
0.0001338302
Sheet1
0.1
-40.0001338302
-3.90.0001986555
-3.80.0002919469
-3.70.0004247803
-3.60.0006119019
-3.50.0008726827
-3.40.0012322192
-3.30.0017225689
-3.20.0023840882
-3.10.0032668191
-30.0044318484
-2.90.0059525324
-2.80.0079154516
-2.70.0104209348
-2.60.0135829692
-2.50.0175283005
-2.40.0223945303
-2.30.0283270377
-2.20.0354745928
-2.10.043983596
-20.0539909665
-1.90.0656158148
-1.80.0789501583
-1.70.0940490774
-1.60.1109208347
-1.50.1295175957
-1.40.1497274656
-1.30.171368592
-1.20.194186055
-1.10.217852177
-10.2419707245
-0.90.2660852499
-0.80.2896915528
-0.70.3122539334
-0.60.3332246029
-0.50.3520653268
-0.40.3682701403
-0.30.3813878155
-0.20.391042694
-0.10.3969525475
00.3989422804
0.10.3969525475
0.20.391042694
0.30.3813878155
0.40.3682701403
0.50.3520653268
0.60.3332246029
0.70.3122539334
0.80.2896915528
0.90.2660852499
10.2419707245
1.10.217852177
1.20.194186055
1.30.171368592
1.40.1497274656
1.50.1295175957
1.60.1109208347
1.70.0940490774
1.80.0789501583
1.90.0656158148
20.0539909665
2.10.043983596
2.20.0354745928
2.30.0283270377
2.40.0223945303
2.50.0175283005
2.60.0135829692
2.70.0104209348
2.80.0079154516
2.90.0059525324
30.0044318484
3.10.0032668191
3.20.0023840882
3.30.0017225689
3.40.0012322192
3.50.0008726827
3.60.0006119019
3.70.0004247803
3.80.0002919469
3.90.0001986555
40.0001338302
0.10.3969525475
0.20.391042694
0.30.3813878155
0.40.3682701403
0.50.3520653268
0.60.3332246029
0.70.3122539334
0.80.2896915528
0.90.2660852499
10.2419707245
1.10.217852177
1.20.194186055
1.30.171368592
1.40.1497274656
1.50.1295175957
1.60.1109208347
1.70.0940490774
1.80.0789501583
1.90.0656158148
20.0539909665
2.10.043983596
2.20.0354745928
2.30.0283270377
2.40.0223945303
2.50.0175283005
2.60.0135829692
2.70.0104209348
2.80.0079154516
2.90.0059525324
30.0044318484
3.10.0032668191
3.20.0023840882
3.30.0017225689
3.40.0012322192
3.50.0008726827
3.60.0006119019
3.70.0004247803
3.80.0002919469
3.90.0001986555
40.0001338302
4.10.0000892617
4.20.0000589431
4.30.0000385352
4.40.0000249425
4.50.0000159837
4.60.0000101409
4.70.0000063698
4.80.0000039613
4.90.000002439
50.0000014867
5.10.0000008972
5.20.0000005361
5.30.0000003171
5.40.0000001857
5.50.0000001077
5.60.0000000618
5.70.0000000351
5.80.0000000198
5.90.000000011
60.0000000061
6.10.0000000033
6.20.0000000018
6.30.000000001
6.40.0000000005
6.50.0000000003
6.60.0000000001
6.70.0000000001
6.80
6.90
70
7.10
7.20
7.30
7.40
7.50
7.60
7.70
7.80
7.90
80
8.10
8.20
8.30
8.40
Sheet2
Sheet3
Una interpretacin prctica (aunque no exacta) del valor P es:
P es la probabilidad de que la Hiptesis nula sea cierta
Valor P (continuacin)
Si las observaciones en la muestra soportan la Hiptesis nula. Entonces es ms probable que esta Hiptesis sea cierta.
Reglas de DecisinPara tomar una decisin sobre rechazar o no rechazar la hiptesis nula hay que especificar una Regla de decisin.Hay que especificar un punto de corte punto crtico:Si P es menor que Alfa (), se rechaza Ho Si P es mayor que Alfa (), se rechaza Ho
Para cada prueba, el clculo de p puede diferirLa frmula del estadstico de prueba tambin cambia!
Prueba sobreDistribucinUna proporcinBinomial o normal (Z)Razn de momiosChi cuadradoDiferencia de 2 proporcionesZ o chi cuadradoDiferencia de 2 mediasZ o TRegresin linealF
Normal/Large Sample Data?Inference on means?Independent?Inference on variance?Variance known?Paired tZ testVariances equal?T test w/ pooled varianceT test w/ unequal varianceF test for variancesYesYesYesYesYesYesNoNoNoNo132
Normal/Large Sample Data?Binomial?Independent?Nonparametric testExpected 52 sample Z test for proportions or contingency tableMcNemars testFishers Exact testNoNoNoNoYesYesYes4
Ahora, recordemos que estamos usando una muestra para concluir sobre la poblacinEs posible (poco probable, ojal) que la decisin tomada de rechazar o no Ho sea errneaQu error podramos cometer?
Escenarios posiblesESTADO REAL (LA VERDAD)H0 es verdadera,No hay diferenciaEVIDENCIA/DATOS DE LA MUESTRANo diferencia (No rechaza H0))Error Tipo I ()Error Tipo II ()Hay diferencia (Rechazar H0 y aceptar Ha)NO HAY ERRORNO HAY ERRORH0 es falsa yHa es verdaderaHay diferencia
Posibles escenariosESTADO REAL (VERDAD)desconocidoHay DiferenciaEVIDENCIA( DATOS)observadosNo diferencia (No rechazar H0)No hay diferenciaError Tipo II ()Error Tipo I ()Diferencia (Rechazar H0)NO HAY ERRORNO HAY ERROR
Errores en la toma de decisionesAl tomar una decisin basados en un punto de corte se pueden cometer uno de dos errores:
Rechazar Ho siendo esta cierta(Error tipo I).
No rechazar Ho siendo esta falsa(Error tipo II)
Error Tipo I ()PUEDE ocurrir cuando la evidencia (datos de la muestra) sugiere NO RECHAZAR Ho
El error consiste en reportar una diferencia o asociacin que realmente no existe
Puede deberse a un tamao de muestra muy grande que detecta diferencias no biolgicas
Tambin puede darse por azar, estimndose que puede ocurrir con una probabilidad p
Error Tipo II ()PUEDE ocurrir cuando la evidencia sugiere RECHAZAR Ho
El error consiste en reportar que no hay una diferencia o asociacin cuando si la hay
Puede deberse a tener una muestra pequea que no permite detectar diferencias reales
Tambin puede darse por azar, aunque el clculo de la probabilidad () es muy complejo
Habitualmente (Tradicionalmente) se especifica a priori un punto de corte () de 0.05. Esto trasladado a nuestra regla de decisin, significa que el Error tipo I de la prueba estadstica ser del 5%.Una vez especificado el valor de , tenemos controlada la magnitud del Error tipo I. El Error tipo II () se controla modificando el tamao de la muestra. En general y se minimizan con tamaos de muestra grandes.
Cmo determinar el tamao de los errores y ? :Debiera depender de las consecuencias de cometer uno u otro error ? EJEMPLOS:Al investigar una nueva Droga en un estudio in vitro: Si el resultado es significativo se continua investigando; caso contrario se abandona el estudio. En este caso tiene ms sentido minimizar (abandonar para siempre el estudio de una droga efectiva).
En un ensayo clnico de una Droga para tratar una enfermedad (que tiene varios otros tratamientos efectivos). Si el resultado es significativo, la droga entra al mercado; caso contrario el trabajo en esta droga cesar. El error (abandonar el estudio de una droga efectiva para la que existen varias opciones) no es tan importante como cometer un error que implicara sacar al mercado una droga intil. En este caso tendra prioridad en ser minimizada
Errores conceptuales comunesLas inferencias son vlidas slo para las muestras donde se tomaron los datos
Si no rechazamos H0 eso significa que H0 es verdadera
Una diferencia estadsticamente significativa tiene relevancia biolgica
El valor p mide que tan diferentes son los promedios/proporciones
Supuestos ms comunesTodas las observaciones son independientes entre s
Tamao de muestra grande para que se cumpla el teorema del lmite central
En variables numricas, no deben haber valores extremos o sesgos que limiten la representatividad del promedio como medida de tendencia central
Ejemplo: Prueba de HiptesisUn Clnico compara la proporcin de pacientes con Hepatitis crnica que responde favorablemente a dos tratamientos: A y B.
Hiptesis: Ho: A B =0 (Nula) H1: A B 0 (Alterna)
Se llev a cabo un Ensayo clnico asignando de manera aleatoria (y ciega) la droga A y la droga B a 300 pacientes con Hepatitis crnica. Se observ que en el grupo que recibi la droga A, 30% tuvieron respuesta favorable. En contraste con el grupo que recibi la droga B (17% respondieron favorablemente).
Especificando un punto de corte para significancia: Alfa () = 0.05
Prueba estadstica para comparar proporciones (30% versus 17%): P=0.015
Conclusin: La diferencia en las respuestas al tratamiento entre los grupos (droga A vs. droga B) es significativa.
Dependiendo de la Medida del efecto empleada (diferencias, odds ratios [OR], riesgos relativos [RR]) y del tipo de variables a analizar (promedios, proporciones, tiempo hasta un evento, etc...) las hiptesis varian, as como los mtodos estadsticos que se deben usar.
Significancia estadstica vs. Significancia biolgica.La significancia estadstica no dice nada acerca de la verdadera magnitud o la importancia de un efecto.En muestras grandes, las diferencias muy pequeas que tienen poca o ninguna importancia biolgica pueden resultar significativas.Las Implicancias de un resultado significativo deben ser juzgados en otro terreno [el Biolgico], adems del estadstico.
Ejemplos con Stata (1)Pregunta de investigacin: El sexo influye en la edad de inicio del consumo de cigarrillos?
Ho: Edadinicio consumo(varones-mujeres)=0H1: Edadinicio consumo(varones-mujeres)0
Datos: Encuesta de drogas
Variables: p59 (Edad de inicio del consumo de cigarrillos) e inf_sexo (Sexo)Prueba estadstica: Prueba t para dos medias independientes
Ejemplos con Stata (2)Pregunta de investigacin: Existen diferencias entre sexos en la prevalencia de consumo de cigarrillos?
Ho: P(varones) P(mujeres)=0H1: P(varones) P(mujeres)0
Datos: Encuesta de drogas
Variables: fuma (generada de p58) e inf_sexo (Sexo)Prueba estadstica: Prueba Z para dos proporciones