View
2
Download
0
Category
Preview:
Citation preview
Estadística Inferencial
ESTADÍSTICA INFERENCIAL
1
Sesión No. 8
Nombre: Pruebas de hipótesis referentes al valor de la media de la población. Parte II. Objetivo: Al finalizar la sesión, el estudiante conocerá cómo calcular el tamaño
de la muestra requerido para probar la media. Así mismo aplicará el método del
valor P para pruebas de hipótesis referentes a la media de la población.
Contextualización
Establecer el tamaño muestral apropiado para una investigación es fundamental
y depende del método de análisis a emplear. A partir de la prueba de hipótesis
que se utilizará es posible un acercamiento al tamaño de la muestra particular.
En la sesión anterior, se ha visto que la decisión de rechazar o aceptar 𝐻0 se
tomó al comparar el valor calculado del estadístico de prueba con un valor crítico
de 𝑧 basado en el nivel de significancia 𝛼 de la prueba. Aún así, diferentes
niveles de significancia pueden conducir a diversas conclusiones. Para evitar
confusiones en las conclusiones, algunos experimentadores prefieren usar un
nivel de significancia variable llamado valor P para la prueba.
ESTADÍSTICA INFERENCIAL
2
Introducción al Tema
¿Por qué es importante establecer el tamaño apropiado de una muestra para probar la media?
Imagen recuperada de: 4.bp.blogspot.com
En esta sesión, se expondrá en primer lugar cómo determinar el tamaño de la
muestra requerido para probar la media. Podrás ver que, para el caso de
pruebas de hipótesis para la media con varianza conocida, y tamaño de muestra
grande o población normal muestreada, se tiene una expresión sencilla para
calcular el tamaño de muestra.
También podrás revisar acerca de un procedimiento para las pruebas de
hipótesis conocido como método del valor P, que actualmente ha cobrado
popularidad por ser fácilmente aplicable al software de cómputo.
ESTADÍSTICA INFERENCIAL
3
Explicación
4.3 Determinación del tamaño de muestra requerido para probar la media
¿Cómo determinar el tamaño de la muestra en una prueba de hipótesis para la media poblacional?
Al realizar una prueba de hipótesis para el valor de la media poblacional, el nivel
de significancia elegido determina la probabilidad de cometer un error tipo I en
esta prueba. Al controlar el tamaño de la muestra, también se controla la
probabilidad de cometer un error tipo II.
La expresión matemática para determinar el tamaño de la muestra en la prueba
de hipótesis de cola inferior para la media poblacional se muestra a continuación:
𝒏 =(𝒛𝒂 + 𝒛𝜷)𝟐𝝈𝟐
(𝝁𝟎 − 𝝁𝒂)𝟐
Donde:
𝑧𝑎 = Valor de 𝑧 que proporciona un área de 𝑎 en la cola superior de la
distribución normal estándar.
𝑧𝛽= Valor de 𝑧 que proporciona un área de 𝛽 en la cola superior de la
distribución normal estándar.
𝜎 = Desviación estándar poblacional.
𝜇0= Valor de la media poblacional en la hipótesis nula.
𝜇𝑎= Valor de la media poblacional utilizada para el error tipo II.
Para una prueba de hipótesis de dos colas se emplea 𝑧𝑎 2⁄ en lugar de 𝑧𝑎 en la
misma expresión.
ESTADÍSTICA INFERENCIAL
4
Ejemplo:
Un contratista tiene que decidir si acepta un
pedido de vigas recibido de un proveedor o si
lo rechaza por no ser del tamaño solicitado.
Las especificaciones indican que la longitud
promedio de las vigas debe ser por lo menos
120 centímetros. Para evaluar si el pedido
recibido satisface lo anterior, se selecciona una muestra de 36 vigas y se miden.
De acuerdo con esta muestra se deberá tomar la decisión de aceptar el pedido
de vigas o devolverlo por no tener la longitud adecuada.
Sea 𝜇 el número medio de longitud que tienen las vigas del envío. La hipótesis
nula y alternativa para la media poblacional que se plantean son:
𝐻0: 𝜇 ≥ 120 𝐻1: 𝜇 < 120
Suponiendo que el contratista establece con base a su propio criterio lo siguiente
acerca de las probabilidades de cometer los errores tipo I y tipo II:
Para el error tipo I: Si la media de la longitud de las vigas del pedido es
𝜇 = 120, el estará dispuesto a asumir el riesgo de que la probabilidad de
rechazar el envío sea 0.05.
Para el error tipo II: Si la media de la longitud de las vigas del pedido es
5 centímetros menos de lo que indican las especificaciones (es decir,
𝜇 = 115), estoy dispuesto a asumir el riesgo de que la probabilidad de
aceptar el envío sea 𝛽 = 0.10.
Si 𝛼 = 0.05 y 𝛽 = 0.10. Mediante la distribución de probabilidad normal estándar
se tiene que:
𝑧𝑎 = 𝑧0.05 = 1.645
Fuente: construmatica.com
ESTADÍSTICA INFERENCIAL
5
𝑧𝛽 = 𝑧0.10 = 1.282
Como 𝜇0 = 120, 𝜇𝑎 = 115 y 𝜎 = 12 se tiene que:
𝑛 =(1.645 + 1.282)2(12)2
(120 − 115)2= 49.3478 ≅ 50
Como las probabilidades de los dos tipos de errores se han controlado utilizando
𝑛 = 50, queda justificado que, en esta prueba de hipótesis, el contratista diga se
acepta 𝐻0 o se rechaza 𝐻0. Las inferencias correspondientes se hacen teniendo
probabilidades admitidas de cometer un error tipo I o un error tipo II.
Acerca de la relación entre 𝛼 , 𝛽 y el tamaño 𝑛 de la muestra caben tres
observaciones (Anderson, Sweeney, & Williams, Estadística para administración
y economía, 2008).
1. Una vez que se tienen dos de estos tres valores, el tercero puede
calcularse.
2. Dado un nivel de significancia 𝛼, aumentando el tamaño de la muestra se
reduce 𝛽.
3. Dado un tamaño de muestra, al disminuir 𝛼 aumenta 𝛽 y al aumentar 𝛼,
disminuye 𝛽.
La tercera observación debe tenerse en cuenta cuando no se controla la
probabilidad de cometer un error tipo II. Dicha observación indica que no se
deben elegir niveles de significancia 𝛼 innecesariamente pequeños; para un
ESTADÍSTICA INFERENCIAL
6
tamaño de muestra dado, elegir un nivel de significancia pequeño implica más
riesgo de cometer un error tipo II. Valores pequeños de 𝛼 son mejores si sólo
preocupa cometer un error tipo I. Pero valores pequeños de 𝛼 tienen la
desventaja de incrementar la probabilidad de cometer un error tipo II.
4.4 Método del valor P para pruebas de hipótesis referentes a la media de la población
¿En qué consiste el método del valor P?
El procedimiento de prueba de hipótesis para la media poblacional por el método
del valor P es el siguiente (Anderson, Sweeney, & Williams, Estadística para
negocios y economía, 2012):
1. Establecer la hipótesis nula y la hipótesis alternativa.
2. Especificar el nivel de significancia.
3. Recabar los datos muestrales y calcular el valor del estadístico de prueba.
4. Emplear el valor del estadístico de prueba para calcular el valor P.
5. Rechazar 𝐻0 si el valor P≤ 𝛼
El valor P es el nivel más pequeño de significancia 𝛼 para el cual la información
observada indica que 𝐻0 debe ser rechazada cuando se utiliza un procedimiento
de prueba especificado con un conjunto de datos dado.
El valor P es un número comprendido entre 0 y 1, por ser una probabilidad, que
mide el grado en que los datos observados confirman 𝐻0. Es una probabilidad
asociada al valor que toma el estadístico de contraste para los datos de la
muestra. Cuanto menor sea el valor P es menos probable que los datos
observados se ajusten a la hipótesis nula formulada (González Manteiga &
Perez de Vargas, 2012).
Para calcular el valor P, se emplea el valor del estadístico de prueba. El método
a seguir depende de si se trata de una prueba de cola inferior, de cola superior o
de dos colas.
ESTADÍSTICA INFERENCIAL
7
En la prueba de cola inferior, el valor P es la probabilidad de conseguir un valor
del estadístico de prueba tan pequeño o menor que el obtenido con la muestra.
Por ende, para calcular el valor P, en el caso de 𝜎 conocida, se debe determinar
el área bajo la curva normal estándar para valores de 𝑧 ≤ que el valor del
estadístico de prueba. Una vez que se ha determinado el valor P, la conclusión a
un nivel particular 𝛼 resulta de comparar el valor P con 𝛼:
1. Valor P≤ 𝛼 ⇒ rechazar 𝐻0 al nivel 𝛼
2. Valor P> 𝛼 ⇒ no rechazar 𝐻0 al nivel 𝛼
Ejemplo:
El Instituto Nacional del Consumidor (INCO) realiza un estudio para verificar si
cierta marca de refresco embotellado cumple con el contenido neto de 3 litros
que se anuncia en su etiqueta. El INCO establece que mientras la media
poblacional del volumen de llenado sea por lo menos 3 litros por envase, los
derechos del consumidor estarán protegidos. Por lo tanto, el INCO selecciona
una muestra de 36 botellas de refresco de un contenedor grande, la media
muestral obtenida es �̅� = 2.92 litros. Los estudios realizados con anterioridad
indican que 𝜎 = 0.18 y que se puede sostener que la población de los volúmenes
de llenado tiene una distribución normal.
Solución
Si la media poblacional del volumen de llenado es por lo menos de 3 litros, lo
que afirma la embotelladora es correcto. Esto establece la hipótesis nula de la
prueba.
𝐻0: 𝜇 ≥ 3
Si la media poblacional del volumen de llenado es menor de 3 litros, lo que
afirma la embotelladora es incorrecto. Esto establece la hipótesis alternativa de
la prueba.
ESTADÍSTICA INFERENCIAL
8
𝐻1: 𝜇 < 3
El responsable de realizar la prueba en el INCO afirma que si la empresa
satisface sus especificaciones de volumen en 𝜇 = 3, no tomará ninguna medida
en su contra. Pero está dispuesto a asumir un riesgo de 1% de cometer tal error
(𝛼 = 0.01).
Con �̅� = 2.92, 𝜎 = 0.18 y 𝑛 = 36 se determina el valor del estadístico de prueba 𝑧.
𝑧 =�̅� − 𝜇0𝜎 √𝑛⁄
=2.92 − 3
0.18 √36⁄= −2.67
Como el valor P es la probabilidad de que el estadístico de prueba 𝑧 sea menor
o igual que −2.67 (el área bajo la curva normal estándar a la izquierda del
estadístico de prueba), en la siguiente tabla de probabilidad normal estándar
aparece que el área en la cola inferior para 𝑧 = −2.67 es 0.0038.
En la gráfica se puede ver que a �̅� = 2.92 le corresponde 𝑧 = −2.67 y el valor P
= 0.0038.
ESTADÍSTICA INFERENCIAL
9
Dado que el responsable de la prueba eligió como nivel de significancia un valor
𝛼 = 0.01, al comparar éste valor con el valor P (0.0038 ≤ 0.01), por lo tanto 𝐻0
es rechazada.
Algunos lineamientos que los expertos en estadística recomiendan para
interpretar valores P pequeños son (Anderson, Sweeney, & Williams, Estadística
para negocios y economía, 2012):
• Menor que 0.01: Evidencia terminante para concluir que 𝐻1 es verdadera.
• Entre 0.01 y 0.05: Fuerte evidencia para concluir que 𝐻1 es verdadera.
• Entre 0.05 y 0.10: Evidencia débil para concluir que 𝐻1 es verdadera.
• Mayor que 0.10: Evidencia insuficiente para concluir que 𝐻1 es verdadera.
ESTADÍSTICA INFERENCIAL
10
Conclusión
En esta sesión, pudiste ver cómo determinar el tamaño de la muestra requerido
en una prueba de hipótesis para la media poblacional, de manera que se
controlen tanto la probabilidad de cometer un error tipo I como un error tipo II.
También se presentaron los pasos básicos del método del valor P para pruebas
de hipótesis acerca de una media poblacional. El cual se basa en la
determinación de un valor P que es una medida de fortaleza de la evidencia de
los datos en contra de la hipótesis nula.
Si los intervalos de confianza están dedicados a determinar los valores creíbles
para una cantidad como una media poblacional 𝜇, ¿cuál será la relación entre
los intervalos de confianza y las pruebas de hipótesis?
ESTADÍSTICA INFERENCIAL
11
Para aprender más
¿Cuándo nace el concepto del p-valor y cómo ha evolucionado hasta el concepto tal y como es utilizado en nuestros días?
• Romero, S. N. (2012). La revolución en la toma de decisiones estadísticas:
el p-valor. Telos, 14(3), 439-446. Septiembre-Diciembre Documento
obtenido de:
http://www.redalyc.org/pdf/993/99324907004.pdf
ESTADÍSTICA INFERENCIAL
12
Actividad de Aprendizaje
Instrucciones:
Con la finalidad de profundizar en los conocimientos adquiridos a lo largo de esta
sesión, ahora tendrás que realizar la siguiente actividad:
Resuelva los siguientes problemas.
1. En un estudio sobre el rendimiento de la gasolina en los automóviles,
medido en kilómetros por litro, se probaron las siguientes hipótesis
Hipótesis Conclusión
𝐻0 : ≥ 20 𝑘𝑘𝑘í𝑚𝑚𝑚𝑚𝑚𝑚 𝑝𝑚𝑚 𝑐𝑎𝑐𝑎 𝑘𝑘𝑚𝑚𝑚 Confirma lo que sostiene el fabricante
𝐻1 < 20 𝑘𝑘𝑘ó𝑚𝑚𝑚𝑚𝑚𝑚 𝑝𝑚𝑚 𝑐𝑎𝑐𝑎 𝑘𝑘𝑚𝑚𝑚 Refuta lo que sostiene el fabricante; el rendimiento es menor de lo afirmado
Para 𝜎 = 3 y un nivel de significancia de 0.02, ¿qué tamaño de muestra
se recomienda si el investigador desea tener 80% de probabilidad de
detectar que 𝜇 es menor que 20 kilómetros por litro cuando en realidad es
de 19?
2. La longitud objetivo de cintas empleadas en moños para regalos es de
245 cm. De una muestra de 50 cintas, cada una con una longitud
determinada, se obtiene una media de longitud de 246.18 cm y una
desviación estándar de 3.6 cm. ¿Sugieren estos datos que la longitud
promedio verdadera es algún otro diferente del valor objetivo?
3. Un gerente de control de calidad para probar si en el proceso de
fabricación de LEDs se satisface el estándar de producir 120 piezas por
lote se usan las hipótesis 𝐻0: 𝜇 = 120 y 𝐻1: 𝜇 ≠ 120. Empleando un nivel
de significancia de 0.05 y una desviación estándar de 5. Si la media de
producción disminuye a 117 piezas por lote, el gerente de control de
ESTADÍSTICA INFERENCIAL
13
calidad desea tener 98% de oportunidad de concluir que no se está
satisfaciendo el estándar de producción. ¿De qué tamaño deberá tomarse
la muestra?
Puedes realizarlo en un procesador de textos, al final tendrás que guardarlo en
formato PDF, y entregarlo de acuerdo a las indicaciones de tu profesor.
Recuerda que esta actividad te ayudará a reforzar tus conocimientos en la
determinación del tamaño de la muestra y el método del valor P.
Esta actividad representa el 5% de tu calificación y se tomará en cuenta lo
siguiente:
• Tus datos generales.
• Título de la actividad.
• Procedimiento correcto y completo de los ejercicios.
• Ortografía y redacción.
ESTADÍSTICA INFERENCIAL
14
Bibliografía
• Alvarado, V. J. A., & Obagi, A. J. J. (2008). Fundamentos de inferencia
estadística. Colombia: Pontificia Universidad Javeriana.
• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística
para administración y economía (10 ed.). México: Cengage Learning.
• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2012). Estadística
para negocios y economía (11 ed.). México: Cengage Learning.
• Devore, J. L. (2008). Probabilidad y estadística para ingeniería y ciencias
(8 ed.). México: Cengage Learning.
• González, M. M. T., & Pérez de Vargas, A. (2012). Estadística aplicada.
Una visión instrumental. España: Díaz de Santos.
• Hines, W. W., & Montgomery, D. C. (1996). Probabilidad y estadística
para ingeniería y administración (2 ed.). México: Compañía Editorial
Continental.
• Lind, D. A., Marchal, W. G., & Wathen, S. A. (2012). Estadística aplicada a
los negocios y economía (15 ed.). México: McGraw-Hill.
• Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2015). Introducción a la
probabilidad y estadística (14 ed.). México: Cengage Learning.
• Navidi, W. (2006). Estadística para ingenieros. México: McGraw-Hill.
• Spiegel, M. R., & Stephens, L. J. (2008). Estadística. México: McGraw-Hill.
• Triola, M. F. (2004). Estadística (9 ed.). México: Pearson Educación.
• Triola, M. F., & Pineda Anaya, M. L. (2004). Probabilidad y Estadística.
México: Pearson Education.
ESTADÍSTICA INFERENCIAL
15
• Wackerly, D. D., Mendenhall III, W., & Scheaffer, R. L. (2010). Estadística
matemática con aplicaciones (7 ed.). México: Cengage Learning.
• Walpole, R. E., Myers, R. H., & Myers, S. L. (1999). Probabilidad y
estadística para ingenieros (6 ed.). México: Prentice-Hall.
Cibergrafía
• Romero, S. N. (2012). La revolución en la toma de decisiones estadísticas:
el p-valor. Telos, 14(3), 439-446. Septiembre-Diciembre Documento
obtenido de:
http://www.redalyc.org/pdf/993/99324907004.pdf
Te invito a que consultes la Biblioteca Digital UNID
Recommended