37
CONTROL ESTADÍSTICO DE PROCESOS “PRUEBA DE HIPÓTESIS” IV – “A”

control estadistico de procesos-prueba de hipotesis

Embed Size (px)

Citation preview

1

“PRUEBA DE HIPÓTESIS”

CONTROL ESTADÍSTICO DE

PROCESOS

“PRUEBA

DE

HIPÓTESIS”

IV – “A”

2

“PRUEBA DE HIPÓTESIS”

"AÑO DE LA PROMOCIÓN DE LA INDUSTRIA RESPONSABLE Y DEL

COMPROMISO CLIMÁTICO"

UNIVERSIDAD NACIONAL

“SAN LUIS GONZAGA” DE ICA

FACULTAD DE ADMINISTRACIÓN

“PRUEBA DE HIPÓTESIS”

Curso : CONTROL ESTADÍSTICO DE PROCESOS Doctor : Dr. ORLANDO GABRIEL HERNÁNDEZ

Año : IV - “A” Turno : MAÑANA Autores : CARRILLO MAMANI, GERALD

FLORES JAUJE, LUIS HUARIPAUCAR GAMBOA, SONIA

OCHOA SUAREZ, GIUSEPI

2014

3

“PRUEBA DE HIPÓTESIS”

INTRODUCCIÓN Es evidente que las distribuciones muestrales, vistas en el capítulo

anterior, basadas en la teoría de la distribución normal, desarrollan un

papel de gran importancia en la inferencia estadística.

La inferencia estadística comprende dos partes principales, a saber: la

estimación de parámetros y la prueba o docimasia de hipótesis. En este

capítulo estudiaremos la segunda de ellas, con el fin de desarrollar

métodos y observar su aplicación a problemas corrientes de la vida

diaria.

La inferencia estadística está basada en el supuesto de tomar muchas

muestras, todas con igual probabilidad de ser seleccionadas y a través

de una de ellas sabremos algo acerca de la población, mediante el cálculo

de estimadores, que nos permitan hacer aseveraciones, incorrectas

algunas veces, estableciéndose la probabilidad de error.

Este método se basa en la aplicación de técnicas de muestreo, para lo

cual se requiere de un buen diseño, además de la aplicación de métodos

aleatorios de selección, cuando las probabilidades son iguales para cada

elemento de una población. En algunos casos no requieren ser iguales,

siempre que se conozcan y sean diferentes a cero.

CONTENIDO

Conceptos generales, usos y procedimientos de aplicación.

Pruebas de hipótesis con aplicaciones en distribuciones de:

Medias, Proporciones.

Teoría de las muestras pequeñas. Distribución “t” de Student.

4

“PRUEBA DE HIPÓTESIS”

Definición: Es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el valor de un parámetro desconocido de una población. Denominada también prueba de significación, tiene como objeto principal evaluar suposiciones evaluar suposiciones o afirmaciones acerca de los valores estadísticos de la población denominados parámetros. Hipótesis estadística: es un supuesto acerca de un parámetro o acerca de algún valor estadístico de una Población. Con ello encontramos que no todas las hipótesis son hipótesis estadísticas. Se debe tomar con referencia a un parámetro, ya sea una media aritmética, una proporción o varianza para que sea hipótesis estadística. Ejercicios:

1. Supongamos que se efectúan 100 lanzamientos de un amoneda y que se obtienen 60 caras (40 sellos). Vamos a probar la “legitimidad de la moneda” (que no esté cargada) tomando en cuenta que al lanzar 100 monedas, lo lógico sería que cayeran 50 caras y 50 sellos. Sin embargo, al realizar el experimento, encontramos que envés de obtener las 50 caras, se presentan 60; esta pequeña diferencia puede llevarnos a pensar, que la probabilidad de presentación de cara es mayor que la de sello, dicho en otras palabras que la moneda está cargada. Determinaremos en primer lugar la probabilidad de que se obtengan 60 caras o más.

Una hipótesis estadística, también puede considerarse como la afirmación acerca de una característica ideal de una población sobre la cual hay inseguridad en el momento de formularla y que, a la vez es expresada de tal forma que puede ser rechazada

5

“PRUEBA DE HIPÓTESIS”

µ=np 𝜎 = √𝑛𝑝𝑞

µ = (1/2)100= 50 σ= √100 (1

2) (

1

2) = √25 = 5

Al determinar la probabilidad de que en el lanzamiento de 100 monedas obtengamos 60 caras o más, utilizamos la distribución normal, como aproximación a la binomial.

𝑧 = 𝑥−𝜇

𝜎=

59.5−50

5= 1.9

El área es igual a 0.4713 0.5000- 0.4713 = 0.0287 p (x≥60)= 2.87%

Se observa que la probabilidad de que se obtengan 60 caras o más, al lanzar 100 monedas, es de 2.87 % lo que se considera como una probabilidad muy pequeña. Se puede concluir:

a. Que la hipótesis es cierta (la moneda es legitima) pero ha sucedido algo raro.

b. La hipótesis no es correcta (luego la moneda no es legítima). La hipótesis puede ser formulada con el fin de rechazarla de acuerdo con el análisis estadístico. Esta clase de hipótesis se denomina hipótesis nula y se representa por 𝐻0. Se tiene también la hipótesis alternativa representada por 𝐻𝑎: 𝜇 ≠ 50 (que el número de caras sea

6

“PRUEBA DE HIPÓTESIS”

mayor o menor de 50), es decir la moneda no es legítima o está cargada.

Tipo de Error

En la decisión anterior de aceptar o rechazar una hipótesis pueden cometerse dos tipos de error.

a) Aceptar una moneda que es falsa (error tipo II). Aceptar las hipótesis cuando ha debido rechazarse.

b) Rechazar una moneda que es verdadera (error tipo I). rechazar la hipótesis cuando ha debido aceptarse. Existen por lo tanto dos posibles decisiones: aceptar o rechazar la hipótesis, la que a la vez, puede ser cierta o falsa.

7

“PRUEBA DE HIPÓTESIS”

Tipos de Error Si se acepta una hipótesis verdadera la decisión es correcta. Si se acepta una hipótesis falsa. Cometemos error de tipo II. Si rechazamos una hipótesis verdadera, cometemos error tipo I. Si rechazamos una hipótesis falsa, la decisión es correcta. EJEMPLO:

A. Supongamos que se detiene a una persona por robo y se le envía al juez quien podrá declararlo inocente o culpable. Al juez se les presenta los PRO Y los CONTRA y con base en toda la información, decide dejar libre o condenarlo. El juez no sabrá si hubo error en su decisión, solo lo podrá saber la persona que ha sido juzgada.

D E C I S I O N E S

Persona Juzgada Del Juez Inocente Error

LIBRE CONDENADO ERROR

CONDENADO ERROR DECISIÓN CORRECTA

HIPOTESIS NULA y ALTERNATIVA Se ha dicho que una hipótesis estadística es un supuesto concerniente a los parámetros de la forma o la forma de distribución de probabilidad correspondiente a una o más poblaciones dadas. En otras palabras, se resumen diciendo que corresponde a un enunciado acerca del valor estadístico (parámetro poblacional baja). La hipótesis se debe formular en forma correcta o lógica y debe ser enunciada antes de obtener los datos muéstrales. Son ejemplos de hipótesis estadística:

a) El promedio de calificación que tendrán los alumnos en mi curso de estadística será superior a 4.0.

b) El 90% de mis estudiantes aprobaran el curso c) El 5% de las unidades producidas por una maquina serán defectuosas.

8

“PRUEBA DE HIPÓTESIS”

Hay dos tipos de hipótesis que se debe formular: la hipótesis nula simbolizada por 𝐻0 y la hipótesis alternativa por 𝐻𝑎. La hipótesis nula es aquella por medio de la cual se hace una afirmación sobre un parámetro, que se va a constatar con el resultado muestrual. Cuando el fabricante dice que su producto tiene una duración de 5000 horas, se le considera como hipótesis nula, pues es lo que se quiere probar. La hipótesis alternativa, es toda aquella hipótesis que difiera de la hipótesis nula, es decir ofrece una alternativa afirmando que la hipótesis nula es falsa para ejemplo se podría decir que la hipótesis alternativa podría ser:

a) El fabricante ha exagerado la duración de su producto (prueba unilateral a la izquierda)

b) El producto tiene una duración superior al señalado por el fabricante (prueba unilateral la derecha)

c) La duración del producto no es la señalada por el fabricante (prueba bilateral)

Prueba unilateral y bilateral

La prueba de hipótesis unilateral es aquella en la cual la zona de rechazo o zona crítica está completamente comprendida en unos de los extremos de la distribución. La prueba es unilateral a la derecha (de la curva); cuando la hipótesis alternativa de la que se quiere probar hace mención por ejemplo a los salarios que paga una empresa son mayores; que la calidad de un producto es superior; que el rendimiento académico es mejor, etc. Si, por contrario, la hipótesis alternativa se refiere a los salarios son inferiores que el producto es de menor de calidad que el rendimiento académico es bajo o que el productor exagera la duración del producto, etc.; corresponderá a una prueba unilateral a la izquierda. En el caso de que la prueba comprenda áreas o zona de rechazo y no en los extremos de la distribución, se dice que la prueba es bilateral asea que la hipótesis alternativa es diferente; por lo tanto se omiten los términos: superior, mayor, inferior, bajo, menor, etc.

9

“PRUEBA DE HIPÓTESIS”

Nivel de significación y puntos críticos Se entiende por nivel de significación, la máxima probabilidad de que especifique, con el fin de ser mínimo el primer tipo de error. Generalmente, esta probabilidad se fija antes de escoger la muestra.

a) El nivel de significación de simboliza por alfa (α) siendo generalmente del 1%, 5% o 10%, pero se puede usar cualquier nivel dependiendo del tipo de investigación que se adelante. Existe la costumbre de trabajar con el nivel de 0.05 ósea del 5%, especialmente cuando el enunciado del problema no lo da. Cuando se trabaja con un nivel del 5% el resultado es significativo; si se emplea el 1%, el resultado.

El valor del nivel de significación corresponde a un área bajo la curva de probabilidad o normal, denominada región critica o zona de rechazo. Se tendrán casos en que la región critica este situado a la derecha de la curva y se dirá que se trata de una docima unilateral. Si se sitúa a la izquierda será una docima unilateral hacia la izquierda. En caso de tener de tener dos regiones críticas, se hablara de una docima bilateral. En las docimas unilaterales se tomara el valor total de alfa; para las docimas bilaterales alfa se dividirá por dos. La región no sombreada o no cubierta por el nivel de significación se determinara zona de aceptación o de no rechazo. Grafica de regiones criticas

a) Docima unilateral hacia la derecha con α = 0.05

b) Docima unilateral hacia la izquierda con α = 0.05

c) Docima bilateral con α = 0.05

Procedimiento a seguir en las pruebas hipótesis

1. Formular la hipótesis nula, y la alternativa

2. Seleccionar el nivel de significación

3. Conocer a estimar la varianza

4. Determinar la técnica y la prueba de estadística

5. Determinar los valores críticos y sus regiones de rechazo

6. Calcular los datos muestrales, utilizando las formulas

correspondientes.

7. Tomar la decisión estadística.

10

“PRUEBA DE HIPÓTESIS”

Ampliaremos el resumen anterior; para ello se recomienda tener presente, además de los siguientes pasos, las alternativas que se dan para cada situación especial. 1.- Establecer las hipótesis Ho: hipótesis nula Ha: hipótesis alternativa a) En el caos de la moneda se podrían presentar las hipótesis de la

siguientes formas:

Ho: µ=50 Ho: µ= 50 Ho: µ=50 Ha: µ≠50 Ha: µ< 50 Ha: µ >50

(Docima Bilateral) (Docima Unilateral a la izquierda) (Docima Unilateral a la derecha) b) En el caso de una distribución de diferencias entre dos medias

muestrales, puede plantearse, así:

Ho: µx= µy Ho: µx= µy Ho: µx= µy Ha: µx≠ µy Ha: µx >µy Ha: µx < µy

(Docima Bilateral) (Docima Unilateral a la izquierda) (Docima Unilateral a la derecha) c) En las proporciones se escribirá para cada caso, así:

Ho: µp= 0.50 Ho: µp= 0.50 Ho: µp= 0.50 Ha: µp≠ 0.50 Ha: µp >0.50 Ha: µp<0.50

(Docima Bilateral) (Docima Unilateral a la izquierda) (Docima Unilateral a la derecha) d) Diferencias entre dos proporciones:

Ho: µp1= µp1 Ho: µp1= µp1 Ho: µp1= µp1

11

“PRUEBA DE HIPÓTESIS”

Ha: µp2≠ µp2 Ha: µp2 >µp2 Ha: µp2< µp2

(Docima Bilateral) (Docima Unilateral a la izquierda) (Docima Unilateral a la derecha)

2.- Elegir riesgo α= %

Los niveles de significación más utilizados son:

a) α=0.05 ó 5%

b) α= 0.01 ó 1%

c) α= 0.10 ó 10%

3.- Se establecen riesgos supuestos

a) La muestra es aleatoria. b) La población es normal. c) La varianza poblacional es conocida (en la mayoría de casos como no se conoce es estimada). 4.- Se formula la respectiva variante estadística.

a) Distribución normal: 𝑍 =x−u

𝜎

b) Distribución de medias muestrales: 𝑧 =�̅�

𝜎/√𝑛 o 𝑧 =

�̅�−µ

𝑠/√𝑛 𝑐𝑢𝑎𝑛𝑑𝑜 𝑛 > 30

c) Distribución de proporciones muestrales: 𝑧 = 𝑝−𝑃

√𝑝𝑞

𝑛

siendo n>30

d) Distribución de diferencias entre dos medias muestrales:

𝑧 =(𝑥 ̅− �̅�)−(𝜇𝑥−𝜇𝑦)

√𝜎𝑥2

𝑛1+

𝜎𝑦2

𝑛2

O 𝑧 = (�̅�−�̅�)−(𝑢𝑥−𝑢𝑦)

√𝑠𝑥2

𝑛1+

𝑠𝑦2

𝑛2

(Siendo 𝑛1 y 𝑛2 mayores que 30)

e) Distribución de diferencias entre dos proporciones muestrales:

12

“PRUEBA DE HIPÓTESIS”

𝑧 = (𝑝1 − 𝑝2) − (𝜇𝑝1 − 𝜇𝑝2)

√𝑝1𝑞1

𝑛1+

𝑝2𝑞2

𝑛2

5.- Formular los puntos críticos Z1 y Z2 a) Al trabajar con un nivel de significación del 5% de docima bilateral, se obtendrá: 𝑧𝑠=1.96 y 𝑧𝑖 = −1.96

b) Con el mismo nivel de significación y una docima unilateral: 𝑧𝑠 = 1.64

si la prueba es hacia la derecha;

𝑧1 = −1.64, 𝑠𝑖 𝑙𝑎 𝑝𝑟𝑢𝑒𝑏𝑎 𝑠𝑒 ℎ𝑎𝑐𝑒 𝑎 𝑙𝑎 𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎.

6.- Descripción de la región critica: (Bilateral con un α= 0.05) 𝑧𝑠 ≥ 1.96 𝑧𝑖 ≤ 1.96

Docima unilateral a la izquierda 𝑧𝑖 < −1.64

13

“PRUEBA DE HIPÓTESIS”

Docima Unilateral a la derecha 𝑧𝑠 < 1.64

7.- Se le dan valores a la variante estadística, con el fin de obtener

el valor de Z.

En el ejemplo de la moneda, se tiene que: 𝑧 =59.5−50

5= 1.9

8.- Adoptar una decisión, se acepta o se rechaza la hipótesis nula,

al nivel de significación dado.

Siguiendo el ejemplo, donde Z=1.9 y trabajando con una docima

bilateral, además con un nivel de significación del 5% encontramos que

1. 9 se sitúa en la zona de aceptación, por lo tanto aceptamos la hipótesis

nula (𝐻0: 𝜇 = 50), es decir, es legitima o correcta (no está cargada). En

otras palabras la diferencia no es significativa.

Pruebas cuando se conoce σ o la muestra es grande

Recordemos que en los pasos que se han señalado para la realización de

una prueba, se decía (paso 3), que la varianza es conocida; esto hace

referencia a que se tiene información sobre la varianza poblacional (σ).

En el supuesto de que no se conozca deberá ser sustituida por la

varianza muestral, siempre y cuando el número de elementos que

constituyen la muestra sea mayor de 30, la cual se considera como

muestra grande. De todas formas el procedimiento y calculo será igual,

conociendo o no la varianza o la desviación típica poblacional.

14

“PRUEBA DE HIPÓTESIS”

Prueba de hipótesis cuando se conoce y no se

conoce el error estándar de la población σ, siendo

n > 30

Recordemos que en los pasos que se han señalado para la realización de

una prueba, se decía que la varianza es conocida, esto hace referencia a

que se tiene información sobre la varianza poblacional (σ). En el

supuesto de que no se conozca deberá ser sustituida por la varianza

muestral, siempre y cuando el número de elementos que constituyen la

muestra sea mayor a 30, la cual se considera como muestra grande. De

todas formas el procedimiento y calculo será igual, conociendo o no la

varianza o la desviación típica poblacional.

Distribución de medias muéstrales

Veamos algunos ejemplos, cuando se conoce la varianza poblacional y

cuando es desconocida. Como orientación en este último caso, por lo

general, después de señalar el tamaño de la muestra, y su media, vendrá

la identificación de la desviación típica, evitando que se confunda la

desviación o la varianza poblacional con la de la muestra.

Ejemplos:

1. un inspector de calidad investiga las acusaciones contra una

embotelladora por su deficiente llenado que debe ser, en

promedio, de 32.5 onzas. Para ello toma una muestra de 60

botellas, encontrando que el contenido medio es de 31.9 onzas de

líquido. Se sabe que la maquina embotelladora debe producir un

llenado con una desviación típica de 3.6 onzas. ¿Puede el inspector

llegar a la conclusión, a un nivel de significación del 5 %, que se

está llenando las botellas por debajo de su especificación de

contenido?

15

“PRUEBA DE HIPÓTESIS”

Datos Solución µ = 32.5 σ = 3.6 n = 60 �̅� = 31.9

a) 𝐻0 : µ = 32.5 𝐻𝑎 : µ < 32.5

b) α = 0.05

c) z = 31.9−32.5

3.6

√60

= -1.29

como -1.29 se sitúa en la zona de aceptación, es válida la hipótesis nula, lo cual significa que el inspector no debe llegar a la conclusión de que se esté llenando y vendiendo un producto por debajo de su especificación, al nivel del 5 %

2. un proceso está programado para empacar la cantidad, media, de

una libra (16 onzas) de café. Se toma una muestra aleatoria de 36

paquetes; resulta una media de 14.2 onzas y desviación típica de

5.3 onzas. Al nivel del 5%, ¿se podrá afirmar que no se está

cumpliendo con lo indicado en el empaque?

Datos Solución µ = 16 n = 36 �̅� = 14.2 S = 5.3

a) 𝐻0 : µ = 16

𝐻𝑎 : µ ≠ 16

b) α = 0.05

c) z = 14.2−165.3

√36⁄

z=- 2.03

Al nivel del 5% se podrá afirmar que no se está cumpliendo con lo indicado por la fábrica por lo tanto aceptamos la hipótesis alternativa y rechazamos la hipótesis nula.

16

“PRUEBA DE HIPÓTESIS”

3. Muchos años de experiencia en un examen de ingreso a la

universidad en ingles arroja una calificación promedio de 64, con

una desviación estándar de 8. Todos los estudiantes de cierta

ciudad, en la cual existen 64, han obtenido una calificación

promedio de 68. ¿Puede tener la certeza de que los estudiantes

de esta ciudad son superiores en inglés?

Datos Solución

µ = 64 σ = 8 n = 64 �̅� = 68

a) 𝐻0 : µ = 64

𝐻𝑎 : µ > 64 b) α = 0.05

c) z = 68−64

8

64

= 4

Z = 4 se ubica en la zona de rechazo por lo tanto puede tenerse la certeza, con un nivel de significación del 5 % que los estudiantes de esta ciudad son superiores en inglés.

17

“PRUEBA DE HIPÓTESIS”

4. Docimar la hipótesis de que la distancia media requerida para

poder detener un automóvil que va a 20 km/h. es de 25 metros.

Con base en una muestra de 100 conductores se obtiene que la

distancia media es de �̅� = 27.3 metros, con una desviación

estándar s = 2.1 metros. Utilizar un nivel de significación del 5 %.

Datos Solución

µ = 25 α = 0.05 n = 100 �̅� = 27.3 S = 2.1

a) 𝐻0 : µ = 25

𝐻𝑎 : µ ≠ 25

b) α = 0.05

c) 𝑧 = 27.3−25

2.1

√100

= 10.95

La distancia media requerida es diferente a 25 mts, al nivel del 5%

18

“PRUEBA DE HIPÓTESIS”

5. Cuatrocientos estudiantes, elegidos aleatoriamente se someten a

un “test” de rendimiento, obteniéndose los siguientes resultados:

�̅� = 76 y s = 16, con base en esta información docimar la hipótesis

µ = 74 frente a la alternativa µ ≠ 74, al nivel del 1 %.

Datos Solución

n = 400 �̅� = 76 S = 16

a) 𝐻0 : µ = 74

𝐻𝑎 : µ ≠ 74

b) α = 0.01

c) Z = 76−74

16

√400

= 2.5

Se ubica en la zona de aceptación; aceptamos que µ = 74, al nivel del 1 %

19

“PRUEBA DE HIPÓTESIS”

6. Una encuesta revela que los 100 autos particulares, que

constituyen una muestra aleatoria, se condujeron a un promedio

de 12,500 km. Durante un año, con una desviación estándar de

2400 km. Con base en esta información, docimar la hipótesis

donde, en promedio, los autos particulares se condujeron a

12,000 km durante un año, frente a la alternativa de que el

promedio sea superior. Utilizar el nivel de significación del 5%.

Datos Solución

n = 100 �̅� = 12,500 S = 2,400

a) 𝐻0 : µ = 12,000

𝐻𝑎 : µ > 12,000

b) α = 0.05

c) z = 12,500−12,000

2,400

√100

= 2.083

rechazamos la hipótesis de que µ = 12,000, luego aceptamos que los autos se condujeron durante un nivel superior en ese año, al nivel del 5%

20

“PRUEBA DE HIPÓTESIS”

7. Una fábrica de cuerdas ha establecido con base en una experiencia

de muchos años, que las cuerdas tienen una fuerza de ruptura de

15.9 libras, con una desviación estándar de 2.3 libras. Se efectúa

un cambio en el proceso de fabricación, y se obtiene una muestra

de 64 artículos cuya fuerza media de ruptura es de 15.0 libras.

¿Debe considerarse que el nuevo proceso tiene un efecto

significativo negativo a la resistencia de las cuerdas?

Datos Solución

µ = 15.9 σ = 2.3 n = 64 �̅� = 15

a) 𝐻0 : µ = 15.9

𝐻𝑎 : µ < 15.9

b) α = 0.05

c) Z =15−15.9

2.3

√64

= - 3.13

Se ubica en la región de rechazo, por lo tanto aceptamos que el nuevo proceso tiene un efecto significativo negativo, respecto a la resistencia de las cuerdas, al nivel del 5%

21

“PRUEBA DE HIPÓTESIS”

8. Los salarios diarios en una sector de la industria están

distribuidos normalmente con una media de $ 13,200 y una

desviación estándar de $ 2,500. Si una empresa del sector, que

cuenta con 40 obreros, paga, en promedio, $ 12,200, ¿puede

decirse que esta compañía paga salarios inferiores al nivel de

significación del 1%?

Datos Solución

µ = 13,200 σ = 2,500 n = 40 �̅� = 12,200

a) 𝐻0 : µ = 13,200

𝐻𝑎 : µ < 13,200

b) α = 0.01

c) z = 12,200 − 13,200

2,500

√40

= − 1,000

2,500

6.33

= -2.53

Se ubica en la región de rechazo, por lo tanto, se puede decir que la compañía paga salarios inferiores, al nivel del 1%

22

“PRUEBA DE HIPÓTESIS”

9. Un distribuidor de botas especiales de trabajo le garantiza al jefe

de una empresa que el promedio de duración de las botas es de 8

meses con una desviación típica de mes y medio. El cliente de la

empresa decide comprar 36 pares de botas, que en promedio

duran 8 meses 10 días. ¿Tiene razón el fabricante con un nivel

de significación del 5%?

Datos Solución

µ = 8 σ = 1.5 n = 36 �̅� = 8.33

a) 𝐻0 : µ = 8

𝐻𝑎 : µ ≠ 8

b) α =0.05

c) z = 8.33−8

1.5

√36

= 0.33 (6)

1.5= 1.32

Aceptamos que el fabricante tiene razón, al nivel del 5%

23

“PRUEBA DE HIPÓTESIS”

10.- un fabricante de aparatos de calefacción, tiene un proveedor que le

suministra ciertos componentes, que tienen como especificación una

resistencia de 400 °C al calor. El fabricante realiza una selección al azar

de 64 de dichos componentes y comprueba que si resistencia media al

calor es de 395 °C, con desviación estándar de 20 °C. ¿Puede llegar a la

conclusión de que su proveedor no sostiene las especificaciones

acordadas, a un nivel de significación del 5%?

Datos Solución

µ = 400

α = 0.05

n = 64

�̅� = 395

S = 20

a) 𝐻0 : µ = 400

𝐻𝑎 : µ ≠ 400

b) Z = 395−400

20

√64

= - 2

El proveedor no sostiene las especificaciones acordadas,

al nivel del 5%

24

“PRUEBA DE HIPÓTESIS”

𝑧 = 𝑝 − 𝑃

√𝑝𝑞𝑛

Distribución de proporciones

Los procedimientos de decisión de las proporciones son similares a los

ya indicados para las medias, salvo que por lo general la desviación

típica y por ende el error estándar de la proporción se calcula con datos

obtenidos en la muestra, la cual debe tener, en este, caso más de 30

elementos.

Su fórmula:

1.-Por estadística que se tienen, se ha podido establecer que por lo

menos el 40% de los jóvenes toman regularmente coca- cola, cuando

tiene sed. Una muestra aleatoria de 450 jóvenes revelo que 200 de ellos

solían tomar dicha bebida, cuando tenían sed. ¿Cuál podría ser su

conclusión al nivel del 1%, acerca de lo que muestran las estadísticas?

Datos Solución

p =200/450

= 44%

n = 450

q = 250/450

= 0.56

a) 𝐻0: 𝑃 = 0.40

𝐻1: 𝑃 ≠ 0.40

b) α = 0.01

𝑍 = 0.44 − 0.40

√0.44(0.56)450

= 1.71

25

“PRUEBA DE HIPÓTESIS”

z= 1.71 se ubica en la zona de aceptación,

luego al nivel del 5%, la conclusión a que se

llega, es la de aceptar el 40% que arrojan las

estadísticas; por lo tanto no hay razón para

rechazarlas.

2.-una empresa al seleccionar su personal lo somete a un curso de

entrenamiento. Por experiencia, el 76% de los aspirantes aprueban el

curso. Se efectúan en el programa para la cual se inscriben 40 y

aprueban 24. ¿Podría afirmarse que los cambios introducidos reducen

la selección? 1%

Datos Solución

n = 40

p = 24/40

= 0.60

q = 0.40

a) 𝐻0: 𝑃 = 0.76

𝐻1: 𝑃 < 0.76

b) α = 0.01

c) 𝑧 =0.60−0.76

√(0.6)(0.4)

40

= -2.07

Como -2.07 cae en la

región de aceptación, no

reducen la selección los

cambios introducidos, al

nivel del 1%

26

“PRUEBA DE HIPÓTESIS”

3.- el fabricante de cierto producto estima tener el 50% del mercado de

la categoría del producto. Al realizar un sondeo en una muestra

probabilística de 400 consumidores de la categoría del producto, 180 de

ellos indicaron ser consumidores. ¿Es correcta la estimación hacha

por el fabricante? (5 %)

Datos Solución

P = 0.50

n = 400

p = 0.45

α = 0.05

a) 𝐻0: 𝑃 = 0.50

𝐻1: 𝑃 ≠ 0.50

b) 𝑧 = 0.45− 0.50

√(0.45)(0.50)

400

= −2

No es correcta la estimación hecha por el

fabricante, al nivel del 5%

27

“PRUEBA DE HIPÓTESIS”

4.- por evidencia experimental se sabe que cierta droga pediátrica es

eficaz en un 80% de los casos, cuando está correctamente administrada.

Se aplica dicha droga a 400 niños y se obtienen únicamente 300

resultados positivos. ¿Puede considerarse este resultado como

evidencia de que la droga no estuvo bien administrada? (1%)

Datos Solución

P = 0.80

n = 400

p = 0.75

α = 0.01

a) 𝐻0: 𝑃 = 0.80

𝐻1: 𝑃 < 0.80

b) 𝑧 = 0.75−0.80

√(0.75)(0.25)

400

= −2.27

Este resultado si puede ser considerado como

evidencia de que la droga estuvo bien

administrada, al nivel del 1%

28

“PRUEBA DE HIPÓTESIS”

TABLA DE DISTRIBUCIÓN “t” DE STUDENT

Grados de

libertad

Nivel de significación para pruebas de una cola 0.25 0.10 0.05 0.025 0.01 0.005

Nivel de significación para pruebas de dos colas 0.50 0.20 0.10 0.05 0.02 0.01

1 2 3 4 5

1.0000 0.8165 0.7649 0.7407 0.7267

3.0777 1.8856 1.6377 1.5332 1.4759

6.3138 2.9200 2.3534 2.1318 2.0150

12.7062 4.3027 3.1824 2.7764 2.5706

31.8207 6.9646 4.5407 3.7469 3.3649

63.6574 9.9248 5.8409 4.6041 4.0322

6 7 8 9

10

0.7176 0.7111 0.7064 0.7027 0.6998

1.4398 1.4149 1.3968 1.3830 1.3722

1.9432 1.8946 1.8595 1.8331 1.8125

2.4469 2.3646 2.3060 2.2622 2.2281

3.1427 2.9980 2.8965 2.8214 2.7638

3.7074 3.4995 3.3554 3.2498 3.1693

11 12 13 14 15

0.6974 0.6955 0.6938 0.6924 0.6912

1.3634 1.3562 1.3502 1.3450 1.3406

1.7959 1.7823 1.7709 1.7613 1.7531

2.2010 2.1788 2.1604 2.1448 2.1315

2.7181 2.6810 2.6503 2.6245 2.6025

3.1058 3.0545 3.0123 2.9768 2.9467

16 17 18 19 20

0.6901 0.6892 0.6884 0.6876 0.6870

1.3368 1.3334 1.3304 1.3277 1.3253

1.7459 1.7396 1.7341 1.7291 1.7247

2.1199 2.1098 2.1009 2.0930 2.0860

2.5835 2.5669 2.5524 2.5395 2.5280

2.9208 2.8982 2.8784 2.8609 2.8453

21 22 23 24 25

0.6864 0.6858 0.6853 0.6848 0.6844

1.3232 1.3212 1.3195 1.3178 1.3163

1.7207 1.7171 1.7139 1.7109 1.7081

2.0796 2.0739 2.0687 2.0639 2.0595

2.5177 2.5083 2.4999 2.4922 2.4851

2.8314 2.8188 2.8073 2.7969 2.7874

26 27 28 29 30

0.6840 0.6837 0.6834 0.6830 0.6828

1.3150 1.3137 1.3125 1.3114 1.3104

1.7056 1.7033 1.7011 1.6991 1.6973

2.0555 2.0518 2.0484 2.0452 2.0423

2.4786 2.4727 2.4671 2.4620 2.4573

2.7787 2.7707 2.7633 2.7564 2.7500

40 0.6807 1.3031 1.6839 2.0211 2.4233 2.7045 60 0.6786 1.2958 1.6706 2.0003 2.3901 2.6603

120 0.6765 1.2886 1.6577 1.9799 2.3578 2.6174

0.6745 1.2816 1.6449 1.9600 2.3263 2.5758

29

“PRUEBA DE HIPÓTESIS”

Distribución de las medias muestrales

Cuando el problema de la desviación típica muestral y el tamaño de la

muestra es menor o igual a 30 (n ≤ 30), se considera que esta sin

corregir, procediendo a su corrección, para ser aplicada en la variante

estadística “t”. Simbolicemos a �̂� (desviación típica sin corregir) y S

(desviación típica corregida).

𝑠 = �̂�√𝑛

𝑛 − 1

𝑠 = √∑(𝑥1 − �̅�)2

𝑛 − 1= √

∑ 𝑥𝑖2 − 𝑛�̅�2

𝑛 − 1

También se le puede corregir directamente, al calcular la variante

estadística:

𝑡 =�̅� − 𝜇

�̂�

√𝑛 − 1

Ejemplo:

1. Una muestra de 25 observaciones tiene una media de 42.0 y una

desviación de 8. Trabajando con un nivel de significación del 1%.

¿existe razón para rechazar la hipótesis de que la media de la

población es 46.0?

Datos: Solución:

n =25

�̅�=42

𝜇=46

ŝ = 8

𝛼 = 0.01

𝐻0 : 𝜇𝑥 = 46

𝐻𝑎 : 𝜇𝑥 ≠ 46

𝑡 =�̅� − 𝜇

�̂�

√𝑛 − 1

30

“PRUEBA DE HIPÓTESIS”

𝑡 =42 − 46

8

√25 − 1

t = -48

√24

t = -2.45

gl= n-1=25-1=24

Tabla “t” => 2.7969

Respuesta: Se acepta la hipótesis de que 𝜇= 46,

es decir, no existe razón para rechazar, que la

media de la población es 46, al nivel de confianza

del 1%.

Es necesario observar que si el nivel de significación, como en este

ejemplo, es de 𝛼=0.01, se tomara el mismo nivel para cada una de

las zonas críticas (zona de rechazo) tal como aparece en la tabla

donde dice “nivel de significación para pruebas de dos colas”

En caso de que sea de una cola, suponiendo que 𝛼=0.05, debe

observarse, en la tabla, donde dice, “nivel de significación para

pruebas de una cola”, es decir, debe corresponder al doble para

pruebas de dos colas, así que a pesar de ser 𝛼=0.05, se está

trabajando con 𝛼=0.10.

31

“PRUEBA DE HIPÓTESIS”

2. Una inspectora de calidad, investiga las acusaciones contra una

fábrica de cerveza, porque no llena bien sus envases, afirmando

que contienen 35 onzas de líquido. Se muestrearon 28 latas de

cerveza, encontrando un contenido medio de 33.2 onzas, con una

desviación estándar de 2.2 onzas. ¿Debe la inspectora llegar a la

conclusión, al nivel del 5%, que se está exagerando su

contenido?

Datos: Solución:

n = 28

�̅� = 33.2

ŝ = 2.2

u = 35

𝛼 = 0.05

𝐻0 : 𝜇𝑥 = 35

𝐻𝑎 : 𝜇𝑥 < 35

𝑡 =�̅� − 𝜇

�̂�

√𝑛 − 1

𝑡 =32.2 − 35

2.2

√28 − 1

t = -2.82.2

√27

t = -4.25

gl= n-1=28-1=27

Tabla “t” => 1.703

Obsérvese como se

tiene el valor del

punto crítico,

siendo

𝛼 = 0.05 (nivel de

significación),

localizamos el 0.05 donde dice la prueba de una sola cola, y

encontramos que equivale al 10%, en las pruebas de dos colas, es

decir el doble, por lo tanto siendo el grado de libertad de 27 y el

punto crítico del 0.10 será de 1.703 y como se localiza a la

izquierda se le da signo negativo.

Respuesta: Al nivel del 5%, el inspector si puede llegar a la conclusio n de que se esta exagerando el llenado

32

“PRUEBA DE HIPÓTESIS”

3. Un fabricante desea hacer, a fin de aumentar sus ventas, que el

contenido de nicotina de sus cigarrillos tiene un promedio inferior

a los 22mg. Una oficina gubernamental de salud y del medio

ambiente, realiza un análisis de 10 cigarrillos y obtiene los

contenidos de nicotina para cada uno, siendo de: 21, 24, 18, 16, 22,

23, 20, 20, 24, 16.

a. ¿tiene justificación lo aseverado por el fabricante?

b. ¿Cuándo cometería un error de tipo 1?

Datos: Solución:

n=10

�̅� = ∑ 𝑥𝑖

𝑛

= 204

10= 20.4

𝜇 = 22

𝛼 = 0.05

𝐻0 : 𝜇 = 22

𝐻𝑎 : 𝜇 < 22

s = √𝜮 𝒙𝒊

𝟐 − 𝒏𝒙 𝟐

𝒏−𝟏

𝑠 = √4242 − 10 (20.4)²

10 − 1

𝑠 = √4242 − 10 (16.16)

9

S= 2.99

t = 𝑥 ̅–𝑢

𝑆

√𝑛

t = 20.4 − 22

2.99

√10

t=−1.6

0.9455210204

t=-1.69

gl= n-1=10-1=9 𝛼 = 0.10

Tabla “t” => 1.833

a) No hay justificacio n al nivel del 5%. b) Aceptar que u=22 mg, cuando el contenido de nicotina es en realidad diferente.

33

“PRUEBA DE HIPÓTESIS”

DISTRIBUCIÓN DE UNA PROPORCIÓN MUESTRAL

El proceso a seguir, en la correccio n de la desviacio n tí pica de una proporcio n, al realizar una prueba de hipo tesis, consiste en trabajar con n-1, es decir, se resta 1 al taman o de la muestra, lo dema s es igual a lo visto hasta el momento para distribuciones de medias proporcionales. La fo rmula a utilizar es:

t = 𝒑 − 𝑷

√𝒑.𝒒

𝒏 − 𝟏

34

“PRUEBA DE HIPÓTESIS”

EJEMPLOS:

1. Se dice con frecuencia que la proporción de funcionarios públicos

que tienen el hábito de fumar en horas de trabajo es del 42%. La

oficina gubernamental de salud desea realizar una campaña a fin

de disminuir este porcentaje, para ello debe comprobar ese

porcentaje, así que decide realizar una investigación por

muestreo a 25 funcionarios encontrando que 13 de ellos fuman.

¿Al nivel del 1% la oficina puede aceptar el porcentaje del 42%

como indicador?

DATOS: SOLUCIÓN:

𝝁𝒑 = 𝑷 = 𝟒𝟐%

p = 13

25= 0.52

n =25

𝛼 = 0.01

𝐻0: 𝜇𝑝=0.42

𝐻𝑎: 𝜇𝑝 ≠0.42

t = 𝒑 − 𝑷

√𝒑.𝒒

𝒏 − 𝟏

t = 0.52 − 0.42

√0.52 . (0.48)

25 − 1

t = 0.1

√0.2496

24

t = 0.1

0.1019803903

t= 0.98

gl= n-1=25-1=24 𝛼 = 0.01

Tabla “t” => 2.797

Respuesta: Si hay razo n para aceptar el % de 42, como indicador de fumadores en horas de trabajo, al nivel del 1%.

35

“PRUEBA DE HIPÓTESIS”

2. El distribuidor de una maquina afirma que el máximo de

elementos defectuosos por hora que presente su funcionamiento

es del 3%. En una determinada hora, se toman como muestra 20

artículos producidos, los que a su vez son sometidos a control,

encontrando un artículo defectuoso. ¿Al nivel del 5% se podrá

decir que el % de defectuosos es superior al señalado por el

distribuidor?

DATOS: SOLUCIÓN:

𝝁𝒑 = 𝑷 = 𝟑%

p = 1

20= 0.03

n =20

𝛼 = 0.05

𝐻0: 𝜇𝑝=0.03

𝐻𝑎: 𝜇𝑝>0.03

t = 𝒑 − 𝑷

√𝒑.𝒒

𝒏 − 𝟏

t = 0.05 − 0.03

√0.05 (0.95)

20 − 1

t = 0.02

√0.0475

19

t = 0.02

0.05

t= 0.4

gl= n-1=20-1=19 𝛼 = 0.1

Tabla “t” =>1.729

Respuesta: No se puede concluir que el

porcentaje de defectuosos sea superior al

señalado por el distribuidor, al nivel del 5%.

36

“PRUEBA DE HIPÓTESIS”

CONCLUSIÓN

Si se condensan los resultados hasta aquí obtenidos, a manera de conclusiones se puede abordar, que todo problema de prueba de hipótesis consiste en lo siguiente:

1. Identificar una variable aleatoria X que tiene una distribución conocida, es decir, que pertenece a una clase determinada, por ejemplo a las del tipo normal, y con relación a la cual se quiere tomar una decisión respecto al valor de un parámetro desconocido, pero asociado a ella.

2. Se plantea una hipótesis nula, donde se asume un valor para el parámetro; y una hipótesis alternativa donde se contradice lo expresado en la hipótesis nula.

3. Se escoge el nivel de significación a, que es la probabilidad de rechazar la hipótesis nula siendo esta cierta.

4. Se selecciona una muestra de tamaño n para estimar el parámetro desconocido y poder posteriormente decidir si se rechaza o no H0.

5. Se define la región crítica para la prueba de hipótesis de interés.

6. Se toma la decisión de rechazar H0, con un nivel de significación a si el valor estimado del parámetro está en la región crítica y de no rechazar Ho si este valor no está en la región crítica.

37

“PRUEBA DE HIPÓTESIS”

RECOMENDACIÓN

Se recomienda usar las tablas de distribución.

BIBLIOGRAFÍA

CIRO MARTÍNEZ BENCARDINO: ESTADÍSTICA Y MUESTREO

AÑO 2008. EDICIÓN 2/R ACT UALIZADA EDICIONES ECOE.