11
Tema 6: (Segunda parte) Contrastes de hipótesis Objetivos: - Conocer el concepto de contraste de hipótesis y de nivel de significación de un contraste. - A la vista de una situación real de carácter económico o social, modelizada por medio de una distribución Normal (con varianza conocida) o Binomial, el alumno debe saber: - Determinar las regiones de aceptación y de rechazo de la hipótesis nula en un contraste de hipótesis, unilateral o bilateral, sobre la media de una distribución normal con varianza conocida, y decidir, a partir de una muestra aleatoria adecuada, si se rechaza o se acepta la hipótesis nula a un nivel de significación dado. - Determinar las regiones de aceptación y de rechazo de la hipótesis nula en un contraste de hipótesis, unilateral o bilateral, sobre el valor de una proporción y decidir, a partir de una muestra aleatoria adecuada, si se rechaza o se acepta la hipótesis nula a un nivel de significación dado. Para ello estudiaremos: - Elementos de un test de hipótesis. - Metodología general de un t est de hipótesis. - Contraste de hipótesis para la media de una población. - Contraste bilateral: 0      - Contraste unilateral: 0      o 0      - Contraste de hipótesis para la proporción. - Contraste bilateral: 0  p  p   - Contraste unilateral: 0  p  p   o 0  p  p   Planteamiento de un problema: Los fabricantes de una determinada marca de leche afirman que el contenido en materias gr asas, por término medio, es del 12% o menos. La desviación típica es 2’2%. Para estudiar si es cierta o no la afirmación de los fabricantes, una organización de consumidores toma una muestra de 50 envases y se mide el porcentaje de grasa que hay en cada uno de ellos obteniéndose un  promedio del 12’6%. ¿Crees que se debe rechazar la hipótesis hecha por la empresa distribuidora de que el contenido de grasas  por término medio no supera el 1 2%, o bien no hay m otivo suficiente para rechazarla? Dar solución a este tipo de problemas es lo que vamos a hacer en este apartado del tema. Introducción  En esta parte del tema abordaremos el importante aspecto de la toma de decisiones, es decir, plantearemos determinadas hipótesis sobre los parámetros de una población y a partir de l os datos de una muestra decidiremos si podemos o no aceptar la hipótesis inicial. Las hipótesis en estadística inferencial son afirmaciones que involucran al total de l a población. Su verdad o falsedad podría establecerse con exactitud si tuviésemos la oportunidad de e valuar a todos los individuos que la componen. Como esto no es posible o no se lleva a cabo, el criterio para aceptar o rechazar una hipótesis estadística se basa en un razonamiento de tipo probabilístico: a través del estudio de una o varias muestras se determina la probabilidad de que los resultados obtenidos sean compatibles con la hipótesis establecida. Si es altamente i mprobable que, de ser cierta la hipótesis, se hayan producido dichos resultados la rechazaremos. Si no es a sí, lo más que podemos decir es que no existen razones para pensar que tal hipótesis no sea cierta.

Contrastes de Hipótesis

Embed Size (px)

DESCRIPTION

Contrastes de Hipotesis

Citation preview

Page 1: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 1/11

Tema 6: (Segunda parte) Contrastes de hipótesis 

Objetivos:

- Conocer el concepto de contraste de hipótesis y de nivel de significación de un contraste.

- A la vista de una situación real de carácter económico o social, modelizada por medio de una

distribución Normal (con varianza conocida) o Binomial, el alumno debe saber:-  Determinar las regiones de aceptación y de rechazo de la hipótesis nula en un contraste de

hipótesis, unilateral o bilateral, sobre la media de una distribución normal con varianzaconocida, y decidir, a partir de una muestra aleatoria adecuada, si se rechaza o se acepta lahipótesis nula a un nivel de significación dado.

-  Determinar las regiones de aceptación y de rechazo de la hipótesis nula en un contraste dehipótesis, unilateral o bilateral, sobre el valor de una proporción y decidir, a partir de unamuestra aleatoria adecuada, si se rechaza o se acepta la hipótesis nula a un nivel designificación dado.

Para ello estudiaremos:- Elementos de un test de hipótesis.

- Metodología general de un test de hipótesis.

- Contraste de hipótesis para la media de una población.

- Contraste bilateral: 0     

- Contraste unilateral:0      o

0     

- Contraste de hipótesis para la proporción.

- Contraste bilateral: 0 p p   

- Contraste unilateral: 0 p p    o 0 p p   

Planteamiento de un problema: Los fabricantes de una determinada marca de leche afirman que elcontenido en materias gr asas, por término medio, es del 12% o menos. La desviación típica es 2’2%. Para

estudiar si es cierta o no la afirmación de los fabricantes, una organización de consumidores toma unamuestra de 50 envases y se mide el porcentaje de grasa que hay en cada uno de ellos obteniéndose un

 promedio del 12’6%. ¿Crees que se debe rechazar la hipótesis hecha por la empresa distribuidora de que el contenido de grasas por término medio no supera el 12%, o bien no hay motivo suficiente para rechazarla?Dar solución a este tipo de problemas es lo que vamos a hacer en este apartado del tema.

Introducción 

En esta parte del tema abordaremos el importante aspecto de la toma de decisiones, es decir, plantearemosdeterminadas hipótesis sobre los parámetros de una población y a partir de los datos de una muestradecidiremos si podemos o no aceptar la hipótesis inicial.

Las hipótesis en estadística inferencial son afirmaciones que involucran al total de la población. Su verdado falsedad podría establecerse con exactitud si tuviésemos la oportunidad de evaluar a todos los individuosque la componen. Como esto no es posible o no se lleva a cabo, el criterio para aceptar o rechazar unahipótesis estadística se basa en un razonamiento de tipo probabilístico: a través del estudio de una o variasmuestras se determina la probabilidad de que los resultados obtenidos sean compatibles con la hipótesisestablecida. Si es altamente improbable que, de ser cierta la hipótesis, se hayan producido dichos

resultados la rechazaremos. Si no es así, lo más que podemos decir es que no existen razones para pensarque tal hipótesis no sea cierta.

Page 2: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 2/11

1. Elementos de un test de hipótesis 

Hipótesis:

Trataremos de utilizar los datos obtenidos en una muestra para tomar  decisiones sobre la población. Paraello, debemos realizar ciertos supuestos o afirmaciones sobre una característica de una población. Estossupuestos, que pueden ser o no ciertos, se llaman hipótesis estadísticas  y pueden representarse medianteuna variable aleatoria. 

Podemos, entonces, definir el test de hipótesis o contraste de hipótesis como el procedimiento estadísticomediante el cual se investiga la verdad o falsedad de una hipótesis acerca de una población. Se realizacuando existen dos modelos teóricos sobre el comportamiento aleatorio de un carácter; generalmente unode ellos es un modelo establecido, al que se enfrenta un modelo alternativo.

Ejemplo 1 : Hace algunos años, la media de estatura de los españoles adultos varones era de 170 cm y su desviacióntípica 9 cm. Pasado el tiempo, un muestreo realizado a 36 adultos da una medida de 172 cm. ¿Puede afirmarse queesa diferencia de 2 cm es debida al azar o realmente la estatura media ha variado?

Ejemplo 2 : Supongamos que, respecto a una determinada ley, el 52 % de los ciudadanos está en contra. Pasado eltiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han descendido hasta el 49 %.¿Ha cambiado realmente la opinión pública o tal resultado es debido al azar?

En los ejemplos anteriores hay una hipótesis de partida y los resultados obtenidos a partir de una muestradifieren de la hipótesis. Y nos preguntamos si la diferencia es atribuible al azar.

Las hipótesis que formularemos en este tema serán sobre la media poblacional μ o la proporción poblacional p.

Hipótesis nula, H0: Es la hipótesis emitida o formulada, es decir, la que se desea contrastar. Inicialmentese considera que es verdadera y se mantiene o se rechaza como consecuencia del contraste. Lamantendremos salvo que los datos muestren de forma evidente su falsedad.

Hipótesis alternativa, H1: Es cualquier otra hipótesis que recoja una situación contraria a la dada en lahipótesis nula, de forma que la aceptación de la hipótesis nula H0 implica el rechazo de la alternativa H1  yviceversa, el rechazo de H0 implica la aceptación de H1. 

En la toma de decisiones estadísticas, toda hipótesis nula ha de ir acompañada de una hipótesis alternativaque es la que aspira a desplazar a la nula.

 En el ejemplo1 anterior la hipótesis nula es: la altura media de los españoles es de 170 cm (    170:0     H   ) y la

hipótesis alternativa: la estatura media de los españoles ya no es 170 cm (    170:1     H   ). 

Ejemplo ilustrativo 1 : Decidir la inocencia o culpabilidad de una persona en un país en el que se sigue el principiode presunción de inocencia:Como se quiere evitar condenar a una persona inocente, sólo se hará cuando haya una fuerte evidencia de suculpabilidad, cuando esté demostrada ésta. En caso de duda, se primará la inocencia frente a la culpabilidad. Portanto, en la terminología propuesta sería:

Culpable H 

 Inocente H 

:

:

1

0  

Ejemplo ilustrativo 2 : Decidir si un alumno sabe o no la asignatura de Economía, y por tanto aprueba o suspende laasignatura:

 Desde el punto de vista del profesorado, un estudiante no sabe la asignatura mientras no demuestre lo contrario; esdecir, el examen ha de presentar pruebas suficientes de que conoce la asignatura. En general, en caso de duda o de

 falta de datos, se primará el suspenso frente al aprobado. Por tanto, en la terminología propuesta sería:

)(:

)(:

1

0

aprobadoasignaturala sabeSI alumno El  H 

 suspensoasignaturala sabe NOalumno El  H   

Observaciones: Sobre la metodología de los test de hipótesis hay que tener en cuenta que: 

1. No sirve para demostrar H0. 2. Sirve para decidir que, a partir de los datos de la muestra, o no puede rechazarse H

0, o es aceptable

suponer que H0 es cierta.3. Sirve para demostrar H1 en el sentido de que, a partir de los datos de la muestra, hay una fuerteevidencia de que H1 es cierta en comparación con H0.

Page 3: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 3/11

Errores: Cuando trabajamos con el método del contraste de hipótesis podemos cometer dos tipos deerrores: 

En los ejemplos anteriores:1.- Decidir la inocencia o culpabilidad de una persona en un estado en el que se sigue el principio de presunción deinocencia:

2.- Decidir si un alumno sabe o no la asignatura de Economía, y por tanto aprueba o suspende la asignatura:

Nivel de Significación y Potencia

Llamaremos nivel de signi fi cación de un contraste  a un número,  , que se elige por el investigador paraconstruir el contraste, de tal modo que la probabilidad de cometer un error de tipo I no sea superior a   ,es decir,    es la probabilidad de rechazar la hipótesis nula siendo verdadera. Es un valor muy pequeño(0.1, 0.05, 0.01, 0.005, 0.001). El nivel de significación se relaciona con el nivel de confianza por:

1   sc   N  N  . 

Llamaremos potencia del contraste al valor de 1-    , siendo      la probabilidad de cometer un error de

tipo II, es decir,     es la probabilidad de no rechazar la hipótesis nula no siendo esta cierta.Lo ideal sería minimizar    y     , pero esto no puede hacerse simultáneamente pues si disminuye unoaumenta el otro y viceversa.

Así, si un examen es muy exigente se disminuye    , es decir, la probabilidad de aprobar a un estudianteque no sabe; sin embargo, se aumenta     , la probabilidad de suspender a un estudiante que si sabe. Pero

si el examen es poco exigente disminuye la probabilidad de suspender a un alumno que si sabe laasignatura (   ), pero aumenta la de aprobar a uno que no sabe lo suficiente (  ).

La única manera de disminuir los dos tipos de errores a la vez es aumentando el tamaño de la muestra(preguntar muchas cosas, para tener más datos sobre lo que sabe o no el estudiante).

En general, se fija de antemano un nivel de conf ianza (1-   

 ) , que asegure un error de tipo I admisible yde entre todos los contrastes con dicho nivel de confianza se elige el de mayor potencia. (El estudio de la potencia de un test se escapa al nivel de este curso, así que daremos por hecho que los contrastes de estetema cumplen esa condición).

Page 4: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 4/11

Estadístico de contraste o de prueba 

El estadístico de prueba de un contraste es una función aleatoria de la muestra cuya distribución,cuando H 0 es cierta, debe ser conocida. Este estadístico sirve para extraer de la muestra la informaciónmás adecuada para discernir cual de las dos hipótesis es más verosímil, a la vista de los datos observados.

Se llama valor observado o valor experimental del estadístico de prueba al valor de este estadísticoque resulta de los datos de la muestra que se ha elegido para realizar el contraste.

Región de Aceptación y Región Crítica o de Rechazo

Sabemos ya formular la hipótesis nula y la hipótesis alternativa. Lo que necesitamos ahora es un criterio para saber si debemos aceptar una u otra, es decir, ¿con cuál de las dos hipótesis nos quedamos?

Al tener ya formulada la hipótesis nula, es necesario que las evidencias sean muy fuertes para rechazarla;es decir, puede que haya cambios debidos al azar, en cuyo caso el cambio no es significativo, y nocambiamos, pero puede que los cambios sean debidos a otras causas. En este último caso es cuando elcambio es significativo y rechazaremos.

Por lo tanto, lo primero que debemos hacer es fijar un cierto intervalo dentro del cual es normal que hayacambios, es decir, una región tal que si el parámetro (en nuestro caso media o proporción) se mantiene endicho intervalo, nos seguimos quedando con H 0, pues esas pequeñas variaciones son debidas al azar. Eseintervalo o región se denomina región de aceptación , y será mayor o menor dependiendo del nivel designificación.

La región que quede fuera de la región de aceptación indica que en este caso los cambios no se puedenatribuir al azar, y por tanto hemos de rechazar H 0  y aceptar H 1. Tal región se llama región críti ca o de

rechazo .

Importante : La región crítica o de rechazo de un contraste, a un nivel de significación    , se elige de tal forma que, si H 0  es cierta, la probabilidad de que el valor experimental del estadístico de prueba esté enesta región es menor o igual que    , esta forma de elegir la región crítica implica:

a) Si el valor observado del estadístico de prueba ESTÁ en la región crítica correspondiente a un nivel de significación    , SE RECHAZA la hipótesis nula a este nivel de significación.

b) Si el valor observado del estadístico de prueba NO ESTÁ en la región crítica, NO SE RECHAZA lahipótesis nula.

 En este último caso, el valor observado estará en la región de aceptación, pero eso no implica que seacepte H 0 , sino que no se tiene suficiente evidencia muestral para rechazarla al nivel de    elegido.

Llegados a este punto, hemos de distinguir entre dos tipos de contraste o test, que determinan la región deaceptación y la región de rechazo.

a) Contraste Bilateral (o de dos colas):En este caso la región de rechazo o región crítica está formada por los dos extremos fuera del intervalo.Dicho caso se presenta cuando la hipótesis nula es del tipo H 0 : μ = k (para la media ) (o bien H 0 : p = k, sise trata de la proporción) y la hipótesis alternativa, por tanto, es del tipo H 1: μ  k (o bien H 1 : p k ).

En el caso de distribuciones normales (que son las que vemos en este tema), y para un contraste bilateral,la región de aceptación, de forma gráfica, será:

Donde2

  z   es el valor crítico cuyo cálculo ya se estudió en el tema anterior de intervalos de confianza, y

la región de aceptación no es más que dicho intervalo.b) Contraste Unilateral (o de una cola):En este caso la región de rechazo o región crítica está formada por sólo uno de los extremos fuera delintervalo. Dicho caso se presenta cuando la hipótesis nula es del tipo H 0 : μ k (o bien H 0 : p k ) y la

Page 5: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 5/11

hipótesis alternativa, por tanto, es del tipo H 1 : μ  k (o bien H 1 : p k ). (El sentido de las desigualdades puede cambiar).

En el caso unilateral, la región de aceptación de forma gráfica, es:

Unilateral por la derecha: (    1 H  ) 

Donde  z   es un valor que en una N(0, 1) deja a su izquierda una probabilidad de    1  

Unilateral por la izquierda: (    1 H  )

Donde  z   es un valor que en una N(0, 1) deja a su izquierda una probabilidad de    1  

2. Metodología general de un test de hipótesis.

Los procedimientos seguidos en las pruebas de hipótesis correspondientes a las situaciones de decisiónestadística se encuentran totalmente prefijados y se llevan a cabo en una serie de etapas que facilitan sucomprensión, y que son:

 Paso 1º : Se enuncian la hipótesis nula 0 H   y la alternativa 1 H  . Consiste en atribuirle un valor a un

 parámetro de cierta población (la hipótesis nula 0 H  ) y el valor contrario será la hipótesis alternativa 1 H  ,

es decir dichas hipótesis deben ser excluyentes.Una vez enunciadas, se analizará si el contraste es bilateral (la hipótesis alternativa es del tipo ) o si setrata de un contraste unilateral (la hipótesis alternativa es del tipo > o <).

 Paso 2º : Se elige un estadístico de contraste cuya distribución muestral es conocida. En nuestro caso serála media o la proporción muestral.

 Paso 3º : Se determina, a partir del nivel de confianza,  1 , o del de significación,   , el valor de2

  z   

 para contrastes bilaterales o el de   z  

 para contrastes unilaterales, y con dichos valores se construyen las

regiones de aceptación correspondientes (y por tanto también las regiones de rechazo):

 Paso 4º : Se calcula el valor concreto del estadístico de contraste a partir de la muestra.

 Paso 5º : Aplicar el test, es decir, dependiendo de si el estadístico de contraste cae en la región deaceptación o de rechazo, tomar la decisión de rechazar H 0 o de indicar que no existen evidenciasestadísticas significativas como para rechazarla.

Estudiaremos ahora dos de los tipos de test de hipótesis más habituales: test para la media de una población y test para la proporción de una población.

Page 6: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 6/11

3. Contraste de hipótesis para la media 

Vamos a sistematizar los pasos que se dan para realizar contrastes de hipótesis sobre la media de la población, distinguiendo los casos en los que la hipótesis nula es del tipo 0    de aquellos otros en los

que en la hipótesis nula se aceptan desigualdades 0      o bien 0    .

Si el Contraste es bilateral: 0     Paso 1º: Se formulan las hipótesis 0100   :;:            H  H  .

La hipótesis nula consiste en atribuirle un cierto valor a la media de la población.

Paso 2º: Se elige el estadístico de contraste.Bien cuando 30n  o bien para cualquier valor de n si la población de partida es normal, las

medias se distribuyen  

  

 

n N 

      ,0

.

Tipificando tenemos: 1,00  N 

n

 X  Z   

 

    , este es el estadístico de contraste.

Paso 3º: Se calcula, a partir del nivel de significación, la región de aceptación y la de rechazo. Como el

test es bilateral la región de aceptación para un nivel de significación  es   

  

22

,      z  z  .

Paso 4º: Se calcula el valor concreto del estadístico de contraste a partir de la muestra:

n

 x z 

 

 00

 

Paso 5º: Se comprueba si este valor concreto, z0, está dentro o fuera de la zona de aceptación.

- Si el valor observado del estadístico de prueba ESTÁ en la región crítica, SE RECHAZA la hipótesis

nula a este nivel de significación.- Si el valor observado del estadístico de prueba está en la zona de aceptación y, por tanto, NO ESTÁ en laregión crítica, NO SE RECHAZA la hipótesis nula., no se tiene suficiente evidencia muestral pararechazarla al nivel de    elegido.

 Ejemplo 1: Se cree que el tiempo medio de ocio que dedican al día los estudiantes de Bachillerato sigueuna distribución normal de media 350 minutos y desviación típica 60 minutos. Para contrastar estahipótesis, se toma una muestra aleatoria formada por 100 alumnos, y se observa que el tiempo medio deocio es de 320 minutos. Con un nivel de significación del 10%, ¿se contradice la afirmación inicial?

Si el Contraste es unilateral:0      o

0     

Paso 1º: Formular las hipótesis 0100   :;:            H  H  .O bien 0100   :;:            H  H   

Paso 2º: Se elige el estadístico de contraste.Bien cuando 30n  o bien para cualquier valor de n si la población de partida es normal, las

medias se distribuyen  

  

 

n N 

      ,0

.

Tipificando tenemos: 1,00  N 

n

 X  Z   

 

    , este es el estadístico de contraste.

Paso 3º: Se calcula, a partir del nivel de significación, la región de aceptación y la de rechazo. Como eltest es unilateral la región de aceptación para un nivel de significación  es:

Para el caso 0100   :;:            H  H   :   z ,  

Page 7: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 7/11

Para el caso 0100   :;:            H  H  :   ,  z   

En estos casos, toda la cola (intervalo de no aceptación o de rechazo) está en una de los extremos de ladistribución. Los valores críticos   z  se obtienen directamente de la tabla )1,0( N  .

Paso 4º: Se calcula el valor concreto del estadístico de contraste a partir de la muestra:

n

 x

 z   

 00

 

Paso 5º: Se comprueba si este valor concreto, z0, está dentro o fuera de la zona de aceptación.

- Si el valor observado del estadístico de prueba ESTÁ en la región crítica, SE RECHAZA la hipótesisnula a este nivel de significación.

- Si el valor observado del estadístico de prueba está en la zona de aceptación y, por tanto, NO ESTÁ en laregión crítica, NO SE RECHAZA la hipótesis nula., no se tiene suficiente evidencia muestral pararechazarla al nivel de    elegido.

 Ejemplo 2: Una encuesta, realizada a 64 empleados de una fábrica, concluyó que el tiempo medio deduración de un empleo en la misma era de 6’5 años con una desviación típica de 4. ¿Sirve esta afirmación

 para aceptar, con un nivel de significación del  1%, que el tiempo medio de empleo en esa fábrica esmenor o igual que 6? 

Consideraciones a tener en cuenta:

- En la práctica, la muestra se toma después de haber formulado las hipótesis, con el fin de que el resultadode la muestra no influya en el planteamiento de éstas.- Al disminuir el nivel de significación,   , aumenta la región de aceptación y por tanto es posible que unahipótesis que se rechace con un nivel de significación del 10% no se pueda rechazar a un nivel designificación del 5%.- Cuanto más “fuera” de la región de aceptación se encuentre nuestro estadístico de contraste, con mayorconfianza podremos rechazar la hipótesis nula y por tanto mayor seguridad tendremos en que nuestra

decisión es la correcta. De la misma manera, cuanto más “dentro” de la región de aceptación se encuentre,mayor seguridad tendremos a la hora de no rechazar la hipótesis nula.

4. Contraste de hipótesis para la proporción

En los contraste de hipótesis para la proporción o porcentajes también se parte de una suposición o porcentaje poblacional. Después se utiliza la proporción de la muestra, obtenida de forma aleatoria, paracomprobar si es cierta la suposición sobre la proporción poblacional. Si llamamos p a la proporción deindividuos de una población que tienen una determinada característica, el planteamiento para este tipo detest será del tipo:

Si el Contraste es bilateral: 0 p p   

La hipótesis nula consiste en atribuirle un valor a la proporción de individuos que tiene una ciertacaracterística.

Paso 1: Formulamos las hipótesis 0100   :;:   p p H  p p H    .

Paso 2: Se elige el estadístico de contraste.

Como vimos en la primera parte del tema, la distribución de las proporciones muestrales,  P ˆ , se

distribuye

 

 

 

   

n

q p p N    00

0 , .

Tipificando obtendremos el estadístico de contraste para este test:

Page 8: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 8/11

n

q p

 p P  Z 

00

 que sigue una N(0, 1)

Paso 3: Se calcula, a partir del nivel de significación, la región de aceptación y la de rechazo. Como el test

es bilateral la región de aceptación para un nivel de significación  es

 

 

 

 22

,      z  z  .

Paso 4: Calculamos el valor concreto del estadístico de contraste a partir de la muestra

n

q p

 p p z 

00

0

0

ˆ

 

Paso 5: Se comprueba si esa proporción está dentro o fuera de la zona de aceptación.

- Si el valor observado del estadístico de prueba ESTÁ en la región crítica, SE RECHAZA la hipótesisnula a este nivel de significación.

- Si el valor observado del estadístico de prueba está en la zona de aceptación y, por tanto, NO ESTÁ en la

región crítica, NO SE RECHAZA la hipótesis nula., no se tiene suficiente evidencia muestral pararechazarla al nivel de    elegido.

 Ejemplo 1: El ayuntamiento de una ciudad afirma que el 65 % de los accidentes juveniles de los fines de semana son debidos al alcohol. Un investigador decide contrastar dicha hipótesis, para lo cual toma unamuestra formada por 35 accidentes y observa que 24 de ellos han sido debidos al alcohol. Con un nivel de

 significación del 1%, ¿qué podemos decir sobre la afirmación del ayuntamiento?

Si el Contraste es unilateral: 0 p p    o 0 p p   

Paso 1º: Formular las hipótesis 0100   :;:   p p H  p p H    .

O bien 0100   :;:   p p H  p p H     

Paso 2º: Se elige el estadístico de contraste.

La distribución de las proporciones muestrales,  P ˆ , se distribuye

 

 

 

   

n

q p p N    00

0 , .

Tipificando obtendremos el estadístico de contraste para este test:

n

q p

 p P  Z 

00

  que sigue una N(0, 1)

Paso 3º: Obtención de la zona de aceptación.Se calcula, a partir del nivel de significación, la región de aceptación y la de rechazo. Como el test esunilateral la región de aceptación para un nivel de significación  es:

Para el caso 0100   :;:   p p H  p p H     :   z ,  

Para el caso 0100   :;:   p p H  p p H    :   ,  z   

En estos casos, toda la cola (intervalo de no aceptación o de rechazo) está en una de los extremos de ladistribución. Los valores críticos  

 z  se obtienen directamente de la tabla )1,0( N  .

Paso 4: Calculamos el valor concreto del estadístico de contraste a partir de la muestra

n

q p

 p p z 

00

00

ˆ

 

Paso 5: Se comprueba si esa proporción está dentro o fuera de la zona de aceptación.

Page 9: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 9/11

- Si el valor observado del estadístico de prueba ESTÁ en la región crítica, SE RECHAZA la hipótesisnula a este nivel de significación.

- Si el valor observado del estadístico de prueba está en la zona de aceptación y, por tanto, NO ESTÁ en laregión crítica, NO SE RECHAZA la hipótesis nula., no se tiene suficiente evidencia muestral pararechazarla al nivel de    elegido.

 Ejemplo 2: Un investigador, utilizando información de anteriores comicios, sostiene que, en una determinada zona,el nivel de abstención en las próximas elecciones es del 40% como mínimo. Se elige una muestra aleatoria de 200individuos para los que se concluye que 75 estarían dispuestos a votar. Determina, con un nivel de significación del1%, si se puede admitir como cierta la afirmación del investigador.

 Ejemplo 3: En el año 2000 el 25% de los partos fueron de madres de más de 35 años. Este año se ha tomado unamuestra de 120 partos de los cuales 33 fueron de madres de más de 35 años.Con una significación del 10%, ¿se puede aceptar que la proporción de madres de más de 35 años sigue siendocomo mucho del 25%, frente a que ha aumentado?

RESUMEN DE FÓRMULAS

Page 10: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 10/11

Relación de ejercicios propuestos

1) La altura en cm. de las cañas producidas por una variedad de carrizo en cada cosecha es una variable aleatoria quesigue una ley normal con desviación típica    = 16 cm. Para contrastar si la altura media de las cañas de la últimacosecha es de 170 cm, se ha tomado una muestra aleatoria de 64 de estas cañas y se han medido sus longitudes,resultando como media muestral  x  = 166 cm. ¿Son suficientes estos datos para rechazar que la altura media de lascañas de la última cosecha es de 170 cm, a un nivel de significación  = 0.05?

2) Un comerciante ha observado durante un largo periodo de tiempo que sus beneficios semanales se distribuyensegún una ley normal con una media de 5000 euros y una desviación típica de 520 euros. A finales del año pasado seabrió un supermercado frente a su comercio y él cree que su beneficio semanal medio ha disminuido desde entonces.Para contrastar esta suposición, ha tomado una muestra aleatoria de 16 semanas del año actual y ha encontrado que el

 beneficio semanal medio de esa muestra es de 4700 euros. ¿Puede afirmarse, a un nivel de significación  = 0.01,que estos datos avalan la creencia del comerciante?

3) Sólo el 75% de los alumnos de un centro de enseñanza realizan correctamente un test psicotécnico que llevautilizándose mucho tiempo. Para tratar de mejorar este resultado, se modificó la redacción del test, y se propuso a ungrupo de 120 alumnos de ese centro, elegidos al azar. De los 120 alumnos a los que se les pasó el nuevo test, lorealizaron correctamente 107. ¿Podemos afirmar que la nueva redacción del test ha aumentado la proporción derespuestas correctas, a un nivel de significación  = 0.025?

4) En una ciudad, donde la proporción de fumadores con edad comprendida entre 18 y 20 años es del 30 %, el

ayuntamiento ha realizado una campaña contra el consumo de tabaco. Dos meses después de terminar dichacampaña, se ha realizado una encuesta a 400 personas de estas edades, elegidas al azar, y se ha encontrado entre ellosa 92 fumadores. ¿Podemos afirmar, a un nivel de significación  = 0,05, que esta campaña ha modificado la

 proporción de fumadores entre 18 y 25 años?

5) Supongamos que 100 neumáticos de cierta marca duraron en promedio 21431 kilómetros. Si se supone que la población es normal con una desviación típica poblacional de 1295 km, utilizando  = 0.05, ¿podemos considerarque la duración media de los neumáticos es inferior a 22000 km?

6) Un constructor afirma que por lo menos el 75% de las casas que construye tienen calefacción. ¿Se estaría deacuerdo con tal afirmación si una inspección aleatoria muestra que 72 de 135 casas cuentan con calefacción? (Usar = 0,1)

7) La edad de la población que vive en residencias de mayores en Cádiz sigue una distribución normal de desviación

típica 7,3 años. Se toma una muestra aleatoria simple de tamaño 50, y se obtiene una media muestral de 69 años. ¿Se puede asegurar que la edad media de la población que vive en residencias de mayores en Cádiz es mayor de 70 añoscon un nivel de significación del 5%?

8) Para conocer la producción media de sus olivos, un olivarero escoge al azar 10 de ellos, pesa su producción deaceitunas, y obtiene los siguientes valores, expresados en kg: 175, 180, 210, 215, 186, 213, 190, 213, 184, 195.Sabemos que la producción sigue una distribución normal con desviación típica igual a 15.3 kg. Con la informaciónobtenida, ¿se puede asegurar que la producción media de un olivo de ese agricultor es menor de 200 kg? (Usar  =0,05)

9) El 40% de los escolares de cierto país suelen perder al menos un día de clase a causa de gripes y catarros. Sinembargo, un estudio sobre 1000 escolares revela que en el último curso hubo 450 en tales circunstancias. Lasautoridades defienden que el porcentaje del 40% para toda la población de escolares se ha mantenido. Contrastar conun nivel de significación del 5% la hipótesis defendida por las autoridades sanitarias, frente a que el porcentaje ha

aumentado, como parecen indicar los datos, explicando claramente a qué conclusión se llega.

10) El alcalde de una ciudad prometió, en su programa electoral, oponerse a la construcción de una central detratamiento de ciertos residuos, puesto que en aquel momento sólo un 10% de los ciudadanos estaban a favor de lacentral de tratamiento de residuos. En los últimos días se ha encuestado a 100 personas de las cuales 14 están a favorde la central. El alcalde afirma sin embargo que el porcentaje de ciudadanos a favor sigue siendo del 10% o inclusoha disminuido. ¿Tiene razón el alcalde con un nivel de significación del 2 %?

11) Las autoridades educativas publican en un estudio que el 25% de los estudiantes de Bachillerato de una ciertacomunidad autónoma tienen ordenador portátil. A partir de una muestra aleatoria de tamaño 300 se ha obtenido quesólo 70 de ellos tienen ordenador portátil. ¿Se podría asegurar que las autoridades dicen la verdad? (Usar  = 0,06)

12) Los estudiantes universitarios de cierto país dedican al estudio un número de horas semanales que sigue unadistribución normal de media desconocida y de desviación típica 7 horas. Si en una muestra de 200 estudiantes se

obtuvo una media muestral de 30 horas de estudio semanal.a) Halle un intervalo de confianza al 95% para el número de horas de estudio semanales de los estudiantesuniversitarios de dicho país.

 b) ¿Se podría afirmar que los estudiantes universitarios de ese país estudian menos de 35 horas semanales? (Usar = 0,01)

Page 11: Contrastes de Hipótesis

7/21/2019 Contrastes de Hipótesis

http://slidepdf.com/reader/full/contrastes-de-hipotesis-56d7ddf324870 11/11

1. Solución: Estos datos son suficientes para rechazar, a este nivel, que la altura media de las cañas deesta cosecha sea de 170 cm.2. Solución: No se puede afirmar, al nivel 0’01, que los datos de la muestra apoyan la creencia de que elnuevo supermercado ha disminuido el beneficio semanal medio del comerciante.3. Solución: Podemos afirmar que la nueva redacción del test ha aumentado la proporción de respuestascorrectas, a un nivel de significación  = 0.025.

4. Solución: Estos datos son suficientes para afirmar, al nivel 0.05, que se ha modificado la proporción de

fumadores entre los 18 y 25 años.5. Solución: Podemos afirmar que la duración media de los neumáticos de dicha marca es menor de

22000 km, con una probabilidad de error tipo I,   , del 5 %.

6. Solución: Los datos de la muestra son suficientes para rechazar, a este nivel  = 0’1, la afirmación del

constructor de que la proporción de casas con calefacción que éste construye no es inferior al 75%.7. Solución: Puede decirse que los datos de la muestra no permiten afirmar que la media de edad deesas personas sea mayor que 70 años, al nivel de significación  = 0’05. 

8. Solución: Puede decirse que los datos de la muestra confirman que la producción media de un olivo deese agricultor es menor de 200 kg, al nivel de significación  = 0’05. 

9. Solución: Estos datos son suficientes para afirmar, al nivel  = 0’05, que el porcentaje de escolares

que pierden al menos un día de clase por causa de gripes y catarros ha aumentado, por lo que eseporcentaje es mayor del 40 %. Entonces, la hipótesis mantenida por las autoridades no es correcta.10. Solución: No tenemos evidencias suficientes para afirmar que el porcentaje de ciudadanos que están

a favor de la construcción de la central de tratamiento de residuos es mayor del 10 %, al nivel designificación  = 0’02. Por tanto, los datos de la muestra avalan la opinión del alcalde de que el

porcentaje de ciudadanos a favor sigue siendo del 10% o incluso ha disminuido.11. Solución: No tenemos evidencias suficientes para afirmar que el porcentaje de estudiantes deBachillerato que tienen ordenador portátil es distinto del 25 %, al nivel de significación    = 0’06. En

consecuencia, a este nivel, los datos no permiten rechazar que el estudio se corresponda con la realidad.Por tanto, podemos afirmar que las autoridades educativas dicen la verdad.12. Solución: a) Un intervalo de confianza al 95% para la media de horas de estudio semanales de losuniversitarios es (29’03, 30’97). b) Podemos afirmar que la media del número de horas de estudio semanales de los universitarios esmenor de 35 horas, al nivel de significación = 0’01.