28
C ONTRASTE DE H IPÓTESIS

CONTRASTE DE HIPÓTESIS - Universitat de València 3/Tema 3... · Intervalos de confianza para pruebas de hipótesis 82 ... Podemos rechazar la hipotesis nula Estadísticos para una

Embed Size (px)

Citation preview

CONTRASTE DE HIPÓTESIS

Contraste de Hipótesis

Contenidos

El pan y la salud (def y conc. básicos) 75Contrastes de Hipótesis 77

Media 78Intervalos de confianza para pruebas de hipótesis 82Prueba de significación 86

El proceso de la prueba de hipótesis 88Proporción 91

El Rechazo de la Hipótesis Nula 96Significación Estadística y Relevancia Práctica 97Errores Asociados al Contraste de Hipótesis 99

Pedro Valero [email protected] 74

Contraste de Hipótesis El pan y la salud (def y conc. básicos)

EL PAN Y LA SALUD (DEF Y CONC. BÁSICOS)

• Quizás no hay un alimento más inocente que el pan- ¿O quizás no?

• Como se puede veren esta noticia,reducir el contenidode sal del pan puedetener un granimpacto en la saludpública de losespañoles- La hipertensión es

una enfermedadcara, muyextendida y difícil de combatir

- Los fabricantes puede abusar de la sal como estrategia comercial

Pedro Valero [email protected] 75

Contraste de Hipótesis El pan y la salud (def y conc. básicos)

• Puesto que aumentar la sal es una tentación continua para los fabricantes, podemosimaginar que es necesario controlar ese compromiso para asegurarse que todos lorespetan- ¿Cómo evaluamos si se está respetando correctamente?

Habría que recoger muestras de panes por fabricanteAnalizar la cantidad de sal en las diferentes barrasSacar la mediaComparar la media de sal con el objetivo (18 gs por kilo)

- Vamos a ver cómo se haría este análisis

Pedro Valero [email protected] 76

Contraste de Hipótesis Contrastes de Hipótesis

CONTRASTES DE HIPÓTESIS

• En primer lugar veremos cómo hacer el contraste de hipótesis para la media usando elejemplo del pan

• Luego veremos cómo hacer el contraste de hipótesis para la proporción, para el queusaremos un ejemplo diferente

Pedro Valero [email protected] 77

Contraste de Hipótesis Contrastes de Hipótesis/Media

Media

• Supongamos que queremos evaluar el pan de un determinado fabricante y recogemos 21barras de un cuarto de kilo de pan. - Los datos están a la derecha y también tenéis el archivo de SPSS en la página

web (recordar que el objetivo es de 18 gs. por kilo, puesto que la barra pesa uncuarto, cada una debería tener aproximadamente 4.5 gs por kilo)¿Este fabricante está cumpliendo con el acuerdo?

4 3,8 2,5

8 6 5

3 6 3,5

4,2 5 6

8 3 2

7 2 8

3 4,5 9

Pedro Valero [email protected] 78

Contraste de Hipótesis Contrastes de Hipótesis/Media

• La forma de ver si en general está cumpliendo el acuerdo es calcular la media de gramosde sal y ver si la media supera ese valor

- En la tabla vemos el resultado de calcular la media y otros valores para nuestro conjunto de datosVemos que efectivamente, el valor supera la media de sal aceptable pero no obstante, ladiferencia no es muchaSupongamos que tenemos que poner una multa a ese fabricante si pasara de los límites, ¿loharíamos?Supongamos que el fabricante alega diciendo que el valor medio que ha salido es sólo productode un poco de mala suerte en las barras escogidas porque en sus controles internos ese resultadoes muy raro que se produzca¿Podemos usar los descubrimientos de Gosset para aclarar este tema?

Estadísticos descriptivos

N Mínimo Máximo Media Desv. típ.Sal 21 2,00 9,00 4,9286 2,14153N válido (según lista) 21

Pedro Valero [email protected] 79

Contenidos 80

El proceso de prueba de hipótesis

• Una hipótesis es una especulación acerca de algo. En Estadística, una prueba de hipótesisconsiste en elegir entres dos hipótesis más o menos plausibles

Hipótesis nula: La hipótesis nula es la posición de partida de una comprobación de hipótesis

Se expresa como una negación del tipo “no hay diferencia” o “no hay relación”

En nuestro ejemplo, la hipótesis nula sería: “No hay diferencia entre el contenido medio de sal en la muestra debarras de pan utilizadas y el contenido que marca la ley (4,5 gs de sal por cuarto de kilo)

Hipótesis alternativa: Esta es la posición contraria a la hipótesis nula

Se expresa como lo contrario de la hipótesis nula y significa “sí hay diferencia” o “sí hay relación”

En nuestro ejemplo, la hipótesis alternativa sería: “El contenido medio de sal en las muestra de barras de pan esincompatible con el contenido que marca la ley (4.5 gs de sal por cuarto de kilo)”

• El resultado del proceso de prueba de hipótesis consiste en rechazar o no rechazar lahipótesis nula por lo que la frase que se utiliza es:- No se rechaza la hipótesis nula (con el significado en nuestro caso que el pan del fabricante está

bien)- Se rechaza la hipótesis nula (el pan del fabricante no se ajusta a lo marcado por la ley)

Contraste de Hipótesis Contrastes de Hipótesis/Media/El proceso de prueba de hipótesis

Contenidos 81

Inocente si no se demuestra lo contrario

• El resultado de una prueba de hipótesis es Rechazar o No rechazar- La hipótesis nula no se acepta- La hipótesis alternativa no se acepta

La explicación de esta terminología nos llevaría un poco más lejos de lo que queremos pero hayuna analogía que seguramente os resultará familiar y que viene del mundo legal“Inocente si no se demuestra lo contrario”

• Si todo el mundo es inocente, ¿por qué llevan al alguien a un juicio? Obviamente porquehay dudas sobre su inocencia- Un juicio es una prueba de hipótesis con las siguientes hipótesis:

Hipótesis nula: No hay pruebas para rechazar que alguien es inocente

Hipótesis alternativa: Hay pruebas para rechazar que alguien es inocente

- Observar queNo hay que probar que alguien es inocente, eso se da por supuestoNo se puede probar que alguien es culpable: siempre podría haber nuevas pruebas queinvalidaran esa conclusión

Contraste de Hipótesis Contrastes de Hipótesis/Media/Inocente si no se demuestra lo contrario

Contraste de Hipótesis Contrastes de Hipótesis/Intervalos de confianza para pruebas de hipótesis

Intervalos de confianza para pruebas de hipótesis

• Volviendo a nuestro ejemplo del pan:- Si usamos los resultados en la muestra de panes de ese fabricante para calcular un intervalo de

confianza dentro del cual estará el valor de la población de panes de ese fabricante haremos:

Los datos los he calculado con el SPSS utilizando el comando Comparar medias>Prueba t para una muestra

- El intervalo nos dice que con un 95% de confianza la media de la sal en las barras de pan denuestro fabricante estará entre 4 y 5,8 por lo que (responde la correcta):a) No podemos rechazar la hipótesis nula de que el pan de ese fabricante no difiere del valor 4,5deseadob) Podemos rechazar la hipotesis nula

Estadísticos para una muestra

N Media Desviación típ.

Error típ. de la

mediaSal 21 4,9286 2,14153 ,46732

4 9286 0 46 2 086 3 96 5 88; =

Pedro Valero [email protected] 82

Contraste de Hipótesis Contrastes de Hipótesis/Intervalos de confianza para pruebas de hipótesis

• ¿Porqué multiplicamos por 2.086?- En el tema anterior aprendimos que cuando la muestra es grande se multiplica por 1.96 para

calcular el intervalo de confianza pero que cuando la muestra es pequeña hay que usar losvalores de la distribución t

- Estos son los valores para unos tamaños de muestra específicos. Tenemos que mirar 20 porqueen este caso gl se calcula n-1 (21-1)

Hemos usado intervalos de confianza al 95%, hacerlo al 99% haría los intervalos más grandes y sería más difícilrechazar la hipótesis nula

En la práctica, se suele utilizar intervalos de confianza al 95%

gl 95% 99%2 4.303 9.9253 3.182 5.8414 2.776 4.6045 2.571 4.0328 2.306 3.35510 2.228 3.16920 2.086 2.84550 2.009 2.678100 1.984 2.626

Pedro Valero [email protected] 83

Contraste de Hipótesis Contrastes de Hipótesis/Intervalos de confianza para pruebas de hipótesis

• Utilizando el SPSS- El comando del SPSS para hacer el cálculo de la prueba de hipótesis está en Analizar>Comparar

medias>prueba t para una muestra. Al seleccionarlo produce el siguiente cuadro de diálogo

El 4,5 lo introducimos nosotros y corresponde con el valor de la hipótesis nula. Apretamosaceptar y en la ventana resultados aparece el output

Pedro Valero [email protected] 84

Contraste de Hipótesis Contrastes de Hipótesis/Intervalos de confianza para pruebas de hipótesis

- El SPSS muestra los resultados de una manera diferente a lo que he puesto antes. Como lousaremos para hacer nuestros análisis necesitáis saber como funciona.En la parte de arriba pone valor de prueba=4.5, este es el valor que queremos comparar con elresultado obtenido en nuestra muestra.

La diferencia de medias es la resta entre lo obtenido en nuestra muestra (4,9286) y el valor deprueba (4,5)=0,42857El intervalo al 95% de confianza es un intervalo de confianza para la diferenciaLa hipótesis nula es que la diferencia es cero, la alternativa que la diferencia no es ceroSi el intervalo de confianza para la diferencia incluye cero no rechazamos la hipótesis nula, si noincluye cero, sí rechazamos la hipótesis nula

Estadísticas de muestra única

N Media

Desviación

estándar

Media de error

estándarSal 21 4,9286 2,14153 ,46732

Prueba para una muestraValor de prueba = 4.5

t gl Sig. (bilateral)

Diferencia de

medias

95% Intervalo de confianza

para la diferenciaInferior Superior

Sal ,917 20 ,370 ,42857 -,5462 1,4034

Pedro Valero [email protected] 85

Contraste de Hipótesis Contrastes de Hipótesis/Prueba de significación

Prueba de significación

• Existe un segundo método para la prueba de hipótesis que será el que utilizaremos más amenudo y que es el que habitualmente aparece en todos lados- El primer paso consiste en calcular el estadístico t mediante la siguiente fórmula:

- En donde:Estadístico de contraste: es el resultado que en este caso se llama tEstimación puntual: El valor que nos ha salido en la muestra (en este caso 4,9286)Valor teórico: El valor de prueba (en este caso 4,5)El error típico: Este valor se puede calcular como sabemos (en este caso daba 0,46)Con esos tres valores hacemos: (4,9286-4,5)/0,46=0,917 (el valor que aparece en la tabla)Ese valor de t puede ser buscado en una tabla para evaluar su significación pero en la práctica lospaquetes estadísticos la imprimen directamente (es 0,370):

Prueba para una muestraValor de prueba = 4.5

t gl Sig. (bilateral)

Diferencia de

medias

95% Intervalo de confianza para

la diferenciaInferior Superior

Sal ,917 20 ,370 ,42857 -,5462 1,4034

EstimaciónPuntual ValorTeóricoEstadístico de Contraste

ErrorTípico

Pedro Valero [email protected] 86

Contenidos 87

¿Qué significa la significación estadística?

• La significación estadística nos indica si rechazamos la hipótesis nula o no y se lee comouna probabilidad- Un valor alto en la significación quiere decir que la hipótesis nula no se debe rechazar- Un valor bajo en la significación quiere decir que la hipótesis se debe rechazar

Como regla general, rechazamos la hipótesis nula cuando la significación (p) es menor que

0,05Repito...

Rechazamos cuando p<0, 5• En nuestro caso, puesto que p=0,370>0.05 no rechazamos la hipòtesis nula (es decir no

podemos decir que la cantidad media de sal en nuestra muestra es tan grande como pararechazar con un 95% de confianza que la cantidad de sal que pone ese fabricante essuperior a la que debe)

Contraste de Hipótesis Contrastes de Hipótesis/Prueba de significación/¿Qué significa la significación estadística?

Contraste de Hipótesis Contrastes de Hipótesis/El proceso de la prueba de hipótesis

El proceso de la prueba de hipótesis

• Vamos a examinar los pasos del proceso de comprobación de hipótesis de nuevo:

a) Plantear una hipótesis nula y una alternativa: La hipótesis nula es la que afirma que no haydiferencias o que no hay relación. La alternativa es la que afirma que hay diferencias o relación entre las cosas

- La mayoría de las veces, cuando uno está estudiando un tema, uno quiere encontrar diferencias orelaciones, así que empezar desde una hipótesis nula puede parecer un poco hipócrita en elfondoSin embargo, recordar que en un juicio se parte de una situación similar, “inocente hasta que nose demuestre lo contrario” pero si se decide juzgar a alguien será por algo ¿no?

b) Calcular un estadístico de contraste: El estadístico de contraste en los ejemplos que hemos vistotiene dos partes

- La diferencia entre el valor teórico y el valor que ha salido en la muestra. Si el valor teórico y elque sale en la muestra son muy parecidos entonces es que no hay diferencias y la hipótesis nulaes la más creíbleSi en cambio hay mucha diferencia, la hipótesis nula deja de ser creíble. Eso es lo que ocurría enel caso de la proporción de divorcios pero no en el caso de la sal en el pan

Pedro Valero [email protected] 88

Contraste de Hipótesis Contrastes de Hipótesis/El proceso de la prueba de hipótesis

- La división por el error típico. Aunque haya diferencias, siempre es necesario tener en cuenta queesas diferencias dependen del error. Si estuviéramos midiendo algo con precisión absoluta,cualquier diferencia sería significativa, si en cambio lo estuviéramos midiendo con muy pocaprecisión, es muy difícil demostrar que una diferencia es significativa

Recordar que el error típico depende de dos cosas, el tamaño de la muestra y la desviación típica.

Cuanto mayor es el tamaño de la muestra, más precisión en nuestras medidas y más fácil esconseguir que las diferencias sean significativas. Usar muestras grandes facilita rechazar lahipótesis nula.Cuanto menor es la desviación típica, más fácil es rechazar la hipótesis nula. Controlar ladesviación típica no es tan fácil como aumentar el tamaño de la muestra y en la práctica amenudo sólo se puede hacer en situaciones experimentales (Es un tema que veréis en laasignatura de diseño experimental)

c) Comprobar el nivel de significación: El estadístico de contraste tiene asociado una probabilidad. Esaprobabilidad nos indica si es probable conseguir ese valor del estadístico de contraste si no hubiera diferencias(es decir, si la hipótesis nula fuera verdadera)

- Valores bajos de probabilidad significa que la hipótesis nula no parece verdadera y larechazamos (normalmente es lo que queremos)

- Valores altos de probabilidad significa que la hipótesis nula no puede ser rechazada y nostenemos que quedar con ella

Pedro Valero [email protected] 89

Contraste de Hipótesis Contrastes de Hipótesis/Proporción

Proporción

• Sexo y Divorcio, ¿tienen algo que ver?Nadie que se casa piensa que acabará divorciándose. El fracaso de un matrimonio es una experiencia personalcon gran impacto psicológico y económico. Por lo tanto, entender los factores que hacen que un matrimoniotenga éxito o constituye un tema de investigación de gran relevancia tanto teórica como aplicada. Ayudar aparejas en dificultades es una actividad habitual para psicólogos profesionales y entender esta situación enprofundidad es un requisito para realizarla correctamente

En un estudio por Thornes y Collard (1979) se analizó la historia de un grupo de 1036 personas en los que sebuscó que la mitad estuviera casada y la otra mitad fueran divorciados. En ese estudio se les preguntó sobreuna serie de cuestiones relacionadas con relaciones sexuales

Una de las preguntas fue sobre si habían tenido relaciones pre-matrimoniales. El resultado fue que 66% (159de 241) de los que habían tenido relaciones prematrimoniales estaban divorciados, y un 34% (82 de 241) queno

Pedro Valero [email protected] 90

Contraste de Hipótesis Contrastes de Hipótesis/Proporción

• ¿Podemos decir que es mayoría los que se divorcian si tuvieron relacionesprematrimoniales? Analicemos esto- ¿Qué quiere decir mayoría? Normalmente significa más del 50%, como cuando se hace una

votación para aprobar algoEn realidad, en este estudio, aunque se buscó que el 50% estuviera casado y el 50% divorciado,los valores fueron algo diferentes y un 52,3% estaba casado y un 47,7% divorciadoEn este caso, diríamos que “mayoría” sería si hay más de 47,7% de divorciados entre los quetuvieron relaciones prematrimoniales

- Calcularemos el mismo estadístico de contraste salvo por algunos matices

Los “matices” son que, para calcular el error típico, utilizaremos unaformula un poco diferente a la que vimos en su momento:

es la proporción que planteamos para la hipótesis nula (en estecaso 0,477 después de pasar los porcentajes a proporciones)

es el complementario de , o sea =0,523Esta fórmula del error típico es diferente de la que vimos en el primer tema porque utiliza laproporción planteada en la hipótesis nula y no la que se recoge en la muestra

EstimaciónPuntual ValorTeóricoEstadístico de Contraste

ErrorTípico

ET p0 p0q0n

-----------=p0

q0 p0 1 p0–

Pedro Valero [email protected] 91

Contraste de Hipótesis Contrastes de Hipótesis/Proporción

- Poniéndolo todo junto queda:

¿Qué significa ese 5,68?

Es el estadístico de contraste, el cual nos indica si la diferencia entre los valores de arriba esgrande o no tal y como hacíamos con la diferencia de medias en el ejemplo del panPara decidir si ese valor es grande o es pequeño podemos utilizar los valores de la distribuciónnormal (1,96 para una confianza del 95%) o podemos utilizar la distribución binomial si usamosun ordenador (el SPSS permite hacer la prueba binomial pero normalmente con la aproximaciónnormal tenemos suficiente)

0 66 0 477–0 477 0 523

241------------------------------------

---------------------------------------- 5 68

Pedro Valero [email protected] 92

Contraste de Hipótesis Contrastes de Hipótesis/Proporción

• La prueba binomial en el SPSS- Esta prueba se encuentra en el menú Analizar>Pruebas no paramétricas>Cuadros de diálogo

antiguos>Binomial

- En este caso ponemos como valor de prueba 0,47 (el número de divorciados en general ennuestro grupo)

Pedro Valero [email protected] 93

Contraste de Hipótesis Contrastes de Hipótesis/Proporción

- El resultado es el siguiente

Podemos utilizar la significación para decidir si la proporción observada de divorciados (0,659) esmayor que la proporción de prueba o media para todos los individuos (0,47). El resultado esmenor de 0,05 por lo que rechazamos la hipótesis nula de que no hay diferencia entre esosvaloresConclusión: el grupo de sujetos que tuvieron relaciones prematrimoniales tuvieron unaproporción de divorcios mayor que los que no las tuvieron

Prueba binomial

Categoría N

Proporción

observada

Prop. de

prueba

Sig. exacta

(unilateral)Div Grupo 1 Divorced 159 ,659751 ,470000 ,000

Grupo 2 Married 82 ,340249

Total 241 1,000000

Pedro Valero [email protected] 94

Contraste de Hipótesis El Rechazo de la Hipótesis Nula/Proporción

EL RECHAZO DE LA HIPÓTESIS NULA

• El proceso de prueba de hipótesis puede resultar muy confuso al principio- Seguramente el problema se encuentra en que en la vida real nos proponemos encontrar lo

verdadero y no rechazar lo falso- El proceso de prueba de hipótesis se basa en rechazar cosas que hipotetizamos que son

verdaderas aunque en realidad queremos demostrar que no lo sonNO VOY A INTENTAR CONVENCEROS DE QUE NO ES CONFUSO PORQUE LO ES

• Rechazar la hipótesis nula o fallar en rechazar la hipótesis nulaA pesar de que parecerá muy retorcido, los resultados de una prueba de hipótesis se plantean desde el puntode vista de la hipótesis nula

La rechazamos (y aceptamos la alternativa) o no la rechazamos, eso es todo

Pedro Valero [email protected] 95

Contraste de Hipótesis Significación Estadística y Relevancia Práctica

SIGNIFICACIÓN ESTADÍSTICA Y RELEVANCIA PRÁCTICA

• A pesar de todas las precauciones que hemos tomado, las pruebas de hipótesis pueden darlugar a resultados que aunque son correctos técnicamente no lo son desde un punto devista lógico- Uno de estos casos es cuando una diferencia es significativa pero es tan pequeña que en la

práctica no importa, o que si tenemos en cuenta otros factores las conclusiones a las quellegamos no se siguen de nuestra prueba de hipótesis

• Ejemplo: El estudio del HalothanoF. Mosteller explica en su libro “los placeres de la Estadística” su implicación en el estudio sobre un anestésicoque se utilizaba en aquel momento

El estudio fue lanzado en parte porque una mujer murió de modo fulminante cuando se le puso el anestésico

No obstante, otros anestésicos también podrían causar problemas y hay que tener en cuenta que eseanestésico se había utilizado en unos 10 millones de operaciones

Un estudio detallado encontró que la tasa de muerte en operaciones que usaban Halotano era del 2,1%mientras que el Éter era del 2%

Aunque no puedo decirlo porque faltan datos es posible que esa diferencia fuera significativa, ¿se deberíautilizar Èter en lugar de Halotano?

Pedro Valero [email protected] 96

Contraste de Hipótesis Significación Estadística y Relevancia Práctica

Tal y como explica F. Mosteller, había bastante interés en dejar de usar Éter y pasarse al Halotano por una razónmuy sencilla: el Éter puede explotar y el Halotano no

- Moraleja: No basta con que haya diferencias, éstas tienen que ser lo suficientementeimportantes para tener relevancia en la práctica según el contexto y el resto de las condiciones atener en cuenta

• Intervalos de confianza: Una recomendación que se puede hacer es que se den losintervalos de confianza además de la significación ya que ayudan a entender si lasdiferencias son realmente importantes

Pedro Valero [email protected] 97

Contraste de Hipótesis Errores Asociados al Contraste de Hipótesis

ERRORES ASOCIADOS AL CONTRASTE DE HIPÓTESIS

• Los contrastes de hipótesis son un proceso bastante complejo y con muchos aspectosdifíciles de entender. Por ello, no es difícil cometer errores. Aunque una lista completasería inmanejable, aquí hay algunas pero la lista podría ser más larga:

Hipótesis nula demasiado fácil: Si la hipótesis nula es demasiado fácil, entonces el proceso de hacer uncontraste de hipótesis seguramente dará lugar a que la rechacemos, aunque en la práctica ese rechazo notiene ninguna consecuencia.

Este problema viene de plantear un “rival” que es demasiado fácil de derrotar.Afirmar que una terapia de adelgazamiento ha tenido éxito porque la reducción de peso ha sidomayor que cero en un mes es algo completamente vacío. Se necesitaría rechazar una hipótesisnula un poco más ambiciosa para poder decir que esa terapia tiene éxito.

No bases tu hipótesis nula en los resultados: La hipótesis nula se tiene que plantear por anticipado. Novale ver que el 35% de la muestra está a favor de una medida y plantear como hipótesis nula que un tercio de lapoblación está a favor de la medida a continuación.

Las hipótesis nulas se plantean a priori

La hipótesis nula no es lo que quieres que sea verdadero: Es al contrario, es lo que quieres rechazarasí que tienes que pensar en lo que quieres y negarlo para ponerlo como hipótesis nula

Pedro Valero [email protected] 98

Contraste de Hipótesis Errores Asociados al Contraste de Hipótesis

Pedro Valero [email protected] 99

Contraste de Hipótesis Errores Asociados al Contraste de Hipótesis

Pedro Valero [email protected] 100