21
CAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra 8.1 INTRODUCCION La prueba de hipótesis comienza con: 1. una suposición (valor para una media de la población), llamada hipótesis, que hacemos con respecto a la población. 2. recolectamos datos de una muestra 3. producimos estadísticas de muestra (determinación de la diferencia entre el valor hipotético y el valor real de la media de la muestra). 4. uso de la información para tomar una decisión con respecto a nuestra hipótesis (juzgamos si la diferencia es significativa o no). ¿Cuándo aceptar o rechazar una hipótesis? Una hipótesis solo puede ser aceptada si los cálculos y resultados obtenidos se encuentran dentro de los parámetros establecidos en nuestra hipótesis, de lo contrario es rechazada. No obstante y a pesar de los resultados, en la toma de decisiones habrá que enfrentar la incertidumbre. 8.2 CONCEPTOS BASICOS media de la población (µ) media de la muestra (X) error estándar de la media de la desviación estándar de la población valores de Z Ej.: (pag. 422) µ = 04 X = 0.0408 n = 100 N = 10,000 El contrato para techar un nuevo complejo deportivo fue otorgado a grandes contratistas. Las especificaciones de construcción pedían un techo movible de aproximadamente 10,000 láminas de aluminio con un grosor de 0.04 pulgadas, éstas no pueden ser considerablemente mas gruesas porque la estructura no podrá soportar el peso adicional, tampoco pueden ser mas delgadas porque la fuerza estructural del techo sería inadecuado. El contratista no deseaba medir cada lámina así es que decide tomar una muestra aleatoria de 100 y encontró que su grosor medio era de 0.0408 pulgadas. Por experiencia con el proveedor de las láminas se cree que estas provienen de una población que tiene una desviación estándar de 0.004 pulgadas de grosor. Error estándar = 0.004/√100 = 0.0004 Z = (0.0408 – 0.04)/0.0004 = 2 Límites de confianza === µ±Z(error estándar) === 0.04±2(0.0004) === (0.0392, 0.0408). El resultado es = 4.5% la probabilidad total de que la media de la muestra difiera de la media de la población en 2 o mas errores estándar, es decir que la probabilidad de que la media de la muestra sea ≥ 0.0408 0 ≤ 0.0392 es solo de 4.5%. En este caso la diferencia entre la media de la muestra y la población hipotetizada es demasiado grande y la probabilidad de que la población produzca una muestra aleatoria semejante 1

CAPITULO 8 - Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

Embed Size (px)

Citation preview

Page 1: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

CAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra

8.1 INTRODUCCIONLa prueba de hipótesis comienza con:1. una suposición (valor para una media de la población), llamada hipótesis, que hacemos con

respecto a la población.2. recolectamos datos de una muestra3. producimos estadísticas de muestra (determinación de la diferencia entre el valor hipotético y

el valor real de la media de la muestra).4. uso de la información para tomar una decisión con respecto a nuestra hipótesis (juzgamos si

la diferencia es significativa o no).¿Cuándo aceptar o rechazar una hipótesis? Una hipótesis solo puede ser aceptada si los cálculos y resultados obtenidos se encuentran dentro de los parámetros establecidos en nuestra hipótesis, de lo contrario es rechazada. No obstante y a pesar de los resultados, en la toma de decisiones habrá que enfrentar la incertidumbre.

8.2 CONCEPTOS BASICOS media de la población (µ) media de la muestra (X) error estándar de la media de la desviación estándar de la población valores de Z

Ej.: (pag. 422) µ = 04 X = 0.0408 n = 100 N = 10,000El contrato para techar un nuevo complejo deportivo fue otorgado a grandes contratistas. Las especificaciones de construcción pedían un techo movible de aproximadamente 10,000 láminas de aluminio con un grosor de 0.04 pulgadas, éstas no pueden ser considerablemente mas gruesas porque la estructura no podrá soportar el peso adicional, tampoco pueden ser mas delgadas porque la fuerza estructural del techo sería inadecuado. El contratista no deseaba medir cada lámina así es que decide tomar una muestra aleatoria de 100 y encontró que su grosor medio era de 0.0408 pulgadas. Por experiencia con el proveedor de las láminas se cree que estas provienen de una población que tiene una desviación estándar de 0.004 pulgadas de grosor.

Error estándar = 0.004/√100 = 0.0004Z = (0.0408 – 0.04)/0.0004 = 2Límites de confianza === µ±Z(error estándar) === 0.04±2(0.0004) === (0.0392, 0.0408).El resultado es = 4.5% la probabilidad total de que la media de la muestra difiera de la media de la población en 2 o mas errores estándar, es decir que la probabilidad de que la media de la muestra sea ≥ 0.0408 0 ≤ 0.0392 es solo de 4.5%. En este caso la diferencia entre la media de la muestra y la población hipotetizada es demasiado grande y la probabilidad de que la población produzca una muestra aleatoria semejante es demasiado baja, por lo tanto se rechaza la hipótesis. Al momento de tomar una decisión se deben determinar los costos que implican una decisión incorrecta y el nivel preciso de riesgo que estemos dispuestos a asumir.

8.3 PRUEBA DE HIPOTESIS Para realizar pruebas de hipótesis se debe establecer el valor supuesto o hipotetizado del

parámetro de la población antes de tomar una muestra, conocido como “hipótesis nula ( Ho o H subcero)”. Por ej.:

H0 :µ = 500 === la hipótesis nula es que la media de la población es = 500µH0 = 500 ==== valor hipotetizado de la media de la población.

Si rechazamos la hipótesis, la conclusión que aceptamos se llama “hipótesis alternativa (H1 o H subuno)”. Por ej.:

H1: µ ≠ 500 H1: µ > 500 H1: µ < 500

Interpretación del nivel de significancia. El objetivo de la prueba de hipótesis es hacer un juicio con respecto a la diferencia entre esa estadística de muestra y un parámetro de población hipotetizado.

1

Page 2: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

decidir que criterio utilizar para aceptar o rechazar la hipótesis nula. En el ejemplo de la pag. 422 se obtuvo una probabilidad de 4.5% de ocurrencia de esta diferencia entre la media de la muestra y la de la población hipotetizada y por tanto se rechaza la hipótesis nula, este valor se le conoce como “nivel de significancia” (a).

Si suponemos que la hipótesis es correcta, entonces el nivel de significancia indicará el porcentaje de medias de muestra que está fuera de ciertos límites. Ver figuras 8-2 y 8-3 de páginas 426 y 427. Ahora bien, el hecho de aceptar una hipótesis no prueba que nuestra hipótesis nula (H0) sea cierta, simplemente no nos proporciona evidencia estadística o que los datos son insuficientes como para rechazarla.Selección de un nivel de significancia. No existe un nivel de significancia único estándar o universal para probar hipótesis, los investigadores pueden utilizar el que crean conveniente pero debemos recordar que entre más alto sea ese nivel, mayor será la probabilidad de rechazar una hipótesis nula cuando es cierta. Ver la figura 8-4 y tal como se ve la gráfica del inciso c) el nivel de significancia es tan alto que sería raro aceptar la hipótesis nula cuando no sea cierta, pero al mismo tiempo la rechazaríamos cuando es cierta.

Errores tipo I y tipo II. Error tipo I. Es el rechazo de una H0 cuando es cierta. Su probabilidad se simboliza como “a” (alfa).Error tipo II. Es aceptar una H0 cuando es falsa. Su probabilidad se simboliza como “ß” (beta).

AREA DE ACEPTACIÓN RECHAZO N.C.=0.99 0.025

0.025 RECHAZO

AREA DE ACEPTACIÓN RECHAZO N.C.=0.90 0.0250.025 RECHAZO

AREA DE ACEPTACIÓN AREA DE RECHAZO N.C.=0.50 0.025

0.025 AREA DE RECHAZO

2

Page 3: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

En algunos casos es preferible el error tipo I (si la H0 fuera agua contaminada y la rechazamos) y en otros el error tipo II (si se acepta la hipótesis anterior siendo falsa). La probabilidad de cometer un tipo de error puede reducirse incrementando la probabilidad de cometer el otro tipo de error.

Decisión sobre el tipo de distribución a utilizar en la prueba de hipótesisLa siguiente tarea es determinar la distribución de probabilidad adecuada (normal, t), también se puede usar el multiplicador de población finita (ver tabla 8-1).

Prueba de hipótesis de dos extremos o colas y de un extremoEn una prueba con dos extremos se rechazará la H0 si la media de muestra es significativamente > o < la µ hipotetizada, existen dos zonas de rechazo (figura 8-5). Es apropiado cuando la H 0 es µ = µH0 y H1 es µ≠ µH0 para ilustración veamos el ejemplo de la pag. 429 donde µ = µH0 = 1000 horas ( entonces H0: µ = 1000 y H1: µ ≠ 1000) Esta es una prueba de dos extremos o colas donde se rechaza H0 si la vida media de la muestra está por arriba o por debajo de 1000 horas (hacer figura 8-5).Prueba de un extremo. (ver el ej. de la pag. 430) H0: µ = 1000 H1: µ < 1000 donde considera que la vida media de los focos es de al menos 1000 horas y se rechazará la H 0 solo si la vida media está significativamente por debajo de las 1000 horas (ver figura 8-6). Esta prueba es de extremo izquierdo o inferior cuyo planeamiento es H0: µ = µH0 y H1: µ < µH0. Otro ejemplo lo encontramos en la pag. 431 H0: µ = 100 H1: µ > 100 donde considera que el promedio de gastos tiene un límite de L. 100.00 y se rechazará la H0 solo si la media de la muestra está significativamente por encima de L. 100.00 y se tomarían medidas correctivas (ver figura 8-7). Esta prueba es de extremo derecho o superior cuyo planeamiento es H0: µ = µH0 y H1: µ > µH0.Debemos recordar que aceptamos una hipótesis nula con base a la información de la muestra, en realidad estamos diciendo que no hay evidencia estadística para rechazarla. No estamos afirmando que la hipótesis nula sea cierta.

8.4 Prueba de hipótesis de medias cuando se conoce la desviación estándar de la población.

Ej.: (pag. 433) Un fabricante suministra ejes traseros para camiones que deben soportar 80,000 lb por pulg2 en pruebas de carga, pero un eje excesivamente fuerte eleva los costos de producción. La experiencia indica que la desviación estándar de la fuerza de los ejes es de 4,000 lb por pulg2. Se selecciona una muestra de 100 ejes, se prueban y se detecta que la capacidad de carga promedio es de 79,600 lb por pulg2. a un a = 0.05 en la prueba, ¿Satisfarán los ejes sus requerimientos de carga? Los datos se resumen de la siguiente manera:µH0 = 80.000 n = 100 δ = 4,000 X = 79,600 a = 0.05

1. Planteamiento de hipótesisH0: µ = 80,000 La media real es 80,000 lb por pulg2

H1: µ ≠ 80.000 La media real no es 80,000 lb por pulg2 a = 0.05 Nivel de significancia para probar esta hipótesis

2. Cálculo del error estándar. Se conoce la δ y n es grande por lo tanto se trata de una población infinita.

δx = (δ/√n) = 4,000/√100 = 400

3. Cuando a = 0.05 el N.C. = 0.95 (o sea 1 – 0.05), recuerde que esta prueba es de 2 extremos o colas que hace dividir 0.95/2 = 0.475; luego en la tabla de la distribución normal estándar se busca un valor igual o lo mas cercano posible a 0.475, dando un resultado de Z = 1.96.

4. Definir los límites de la región de aceptación: µH0 ± Zδx LIC = 80,000 – 1.96 (400) = 79,216 lb por pulg2

80,000 ± 1.96 (400) LSC = 80,000 + 1.96 (400) = 80,784 lb por pulg2

3

Page 4: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

5. Interpretación de los resultados. En la gráfica siguiente se puede observar que la media de la muestra X = 79,600 cae en el área de aceptación, por tanto se acepta la H 0, porque no hay diferencia significativa entre la µH0 = 80,000 y la media observada de los ejes de la muestra.

ESCALA ORIGINAL -1.96 +1.96

AREA DE ACEPTACIÓN AREA DE RECHAZO N.C.=0.95 0.025

0.025 AREA DE RECHAZO

79,216 U=80,000 80,784 X=79,600

PRUEBA DE HIPÓTESIS USANDO LA ESCALA ESTANDARIZADA.Mediante este método se ejecutan los tres primeros pasos anteriores y en lugar del paso 4 se ejecuta el paso siguiente, considerando como media Z = 0:

4. Escala estandarizada === Z = X - µ Z = 79,600 – 80,000 = -1 δx 400

RECHAZO ------ACEPTACION----------- RECHAZO

Valor crítico de Z-- -1.96 Z = 0 1.96 --- Valor crítico de ZX estandarizada Z --------- -1.00

5. Interpretación de los resultados. En la gráfica que antecede se puede observar que la estadística de la muestra estandarizada Z = -1 cae en el área de aceptación, por tanto se acepta la H0, porque no hay diferencia significativa entre la µH0 = 80,000 y la media observada de los ejes de la muestra, el fabricante debe aceptar que los ejes producidos reúnen los requisitos de carga.

PRUEBA DE UN EXTREMO DE MEDIASEjemplo. El Hospital Escuela usa grandes cantidades de dosis envasadas de un medicamento particular. Cada dosis de esta medicina es de 100 cc. que el cuerpo tolerará inocuamente dosis excesivas pero las dosis insuficientes no producen el efecto médico deseado e interfieren en el tratamiento del paciente. El Hospital durante varios años ha adquirido este producto del mismo fabricante y sabe que la desviación estándar de la población es 2 cc. se inspecciona aleatoriamente 50 dosis y encuentra que la media de estas dosis es de 99.75 cc. El Hospital establece un a = 0.10 y pregunta si las dosis de esta remesa son demasiado pequeñas. Los datos se resumen de la siguiente manera:

µH0 = 100 n = 50 δ = 2 X = 99.75 a = 0.10

1. Planteamiento de hipótesisH0: µ = 100 La media de las dosis de la remesa es 100 cc.H1: µ < 100 La media es menor que 100 cc. a = 0.10 Nivel de significancia para probar esta hipótesis

2. Cálculo del error estándar. Se conoce la δ y n es grande por lo tanto se trata de una población infinita.

δx = (δ/√n) = 2/√50 = 0.2829

4

Page 5: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

3. Cuando a = 0.10 el N.C. = 0.90 Esta prueba es de extremo inferior por lo que a una mitad del área bajo la curva (0.50) se le resta 0.10 = 0.40; luego en la tabla de la distribución normal estándar se busca un valor igual o lo mas cercano posible a 0.40, el resultado de Z = 1.28.

4. Definir el límite de la región de aceptación: µH0 - Zδx

LIC = 100 - 1.28 (0.2829) = 99.64

5. Interpretación de los resultados. En la gráfica siguiente se puede observar que la media de la muestra X = 99.75 cae en el área de aceptación, por tanto se acepta la H 0, porque la media observada de la muestra no significativamente menor que la µH0 = 100 cc. El Hospital deberá concluir que las dosis de la remesa son suficientes.

ESCALA ORIGINAL Z = -1.28

AREA DE ACEPTACIÓN AREA DE RECHAZO N.C.=0.90

0.10

99.64 U=100 X=99.75

RECHAZO ------ACEPTACION--------------------------------------

Valor crítico de Z-- -1.28 Z = 0 Z estandarizada --------- -0.88

8.6 PRUEBA DE HIPOTESIS DE PORCION. MUESTRAS GRANDES

Se debe recordar que la binomial es la distribución teóricamente correcta para usarse al trabajar con porciones, porque los datos son discretos no continuos. Al aumentar el tamaño de la muestra, la distribución binomial se aproxima a la normal en sus características y se puede usar la distribución normal para aproximar la distribución de muestreo, siempre y cuando np y nq ≥ 5.

Ejemplo. Corporación Cresida está evaluando la promoción de sus empleados, es decir, está determinando la porción de aquellos cuya capacidad, capacitación y experiencia de supervisión los califican para promocionarlos al siguiente nivel de administración. El gerente de Recursos Humanos dice que el 80% de los empleados son promocionables. El presidente de la empresa reúne un comité especial para evaluar la capacidad de los empleados y éste realiza entrevistas con 150 empleados y encuentra que solo el 70% califica para promoción. Se desea probar al a = 0.05 la hipótesis de que el 80% de los empleados son sujetos a promoción.

PHO = 0.80 QHO = 0.20 n = 150 p = 0.70 q = 0.30

1. Planteamiento de hipótesisH0: P = 0.80 80% de los empleados son promocionables.H1: P ≠ 0.80 La porción de empleados promocionables no es 80%. a = 0.05 Nivel de significancia para probar esta hipótesis

5

Page 6: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

2. Cálculo del error estándar de la porción. δP = √ (PHO * QHO/n) = √(0.80 * 0.20)/150 = 0.0327

3. Elegir la distribución apropiada y encontrar el valor crítico. np = 40 y nq = 10 se cumple la regla para aproximar a una distribución normal. El N.C. = 0.95 Esta prueba es de dos extremos y el valor crítico de Z = 1.96.

4. Estandarizar la porción de la muestra. === Z = p - PH0 = (0.7 – 0.8)/0.0327 = -3.06δP

AREA DE ACEPTACIÓN AREA DE RECHAZO N.C.=0.95 0.025

0.025 AREA DE RECHAZO

-1.96 Z = 0 1.96 Z=-3.06

5. Interpretación de los resultados. En la gráfica se observa que la porción de la muestra (-3.06)

cae en el área de rechazo, en cuyo caso el presidente de la empresa debe rechazar la H0, e inferir que la porción real de empleados promocionables no es de 80%.

PRUEBA DE UN EXTREMO DE PORCIONES. Es conceptualmente similar a una prueba de un extremo de una media. Se ilustra en el siguiente ejemplo:Un miembro de la sociedad civil, afirma que < 60% de las plantas industriales de Tegucigalpa, cumple con los estándares de contaminación ambiental. Un funcionario de la Secretaría de Agricultura cree que 60% de las plantas si cumple con los estándares y decide probar esta hipótesis a un n.c. = 98%, para lo cual extrae una muestra de 60 de una población de más de 10,000 plantas y encuentra que 33 cumplen con los estándares de contaminación.

PHO = 0.60 QHO = 0.40 n = 60 p = 33/60 = 0.55 q = 27/60 = 0.45

1. Planteamiento de hipótesisH0: P = 0.60 La porción de plantas que cumplen con los estándares de contaminación es 0.60.H1: P< 0.60 La porción que cumplen con los estándares de contaminación no es 0.60. n.c. = 0.98 Nivel de confianza para probar esta hipótesis

2. Cálculo del error estándar de la porción. δP = √ (PHO * QHO/n) = √(0.60 * 0.40)/60 = 0.0632

Elegir la distribución apropiada y encontrar el valor crítico. np = 36 y nq = 24 se cumple la regla para aproximar a una distribución normal. El n.c. = 0.98 Esta prueba es de extremo inferior por lo que a una mitad del área bajo la curva (0.50) se le resta 0.02 = 0.48; luego en la tabla de la distribución normal estándar se busca un valor igual o lo mas cercano posible a 0.48, dando un resultado de Z = 2-05

3. Estandarizar la porción de la muestra. === Z = p - PH0 = (0.55 – 0.6)/0.0632 = -0.79δP

6

Page 7: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

AREA DE ACEPTACIÓN AREA DE RECHAZO N.C.=0.98

0.02

-2.05 Z = 0 Z=-0.79

4. Interpretación de los resultados. En la gráfica se observa que la porción de la muestra (-0.79)

cae en el área de aceptación rechazo, en cuyo caso el funcionario de la SAG debe aceptar la H0, e inferir que la porción real de plantas que cumplen es de 0.60.

Ej.: Un fabricante de blusas para mujer, sabe que su marca se vende en 19% de las tiendas de ropa en Comayagüela. Se toma una muestra de 85 tiendas en Tegucigalpa y se detecta que solo el 14.12% de ellas vende su producto. A un a = 0.04 ¿existe evidencia que en Tegucigalpa hay una peor distribución? Es una prueba de extremo inferior.Z = -1.15 (calculado) Z = -1.75 (tabla) LIC = 0.1155 se acepta la hipótesis nula.

PRUEBA DE HIPÓTESIS DE MEDIAS CUANDO NO SE CONOCE LA δ (D. EST. DE LA POB.)Cuando no se conoce la desviación estándar de la población es necesario estimarla a partir de la desviación estándar de la muestra. Y si además el tamaño de la muestra (n) es ≤ 30 se debe utilizar la distribución “t” con n – 1 grados de libertad, en cuyo caso de usa la tabla 2.

Ej.: El Gerente de Recursos Humanos del Banco Central de Honduras, está reclutando personal para un puesto en el extranjero y cree que la puntuación promedio será de aproximadamente 90. Cuando la Administración revisa 20 de estos resultados encuentra que la puntuación promedio es 84 con una S = 11 y desea probar su hipótesis a un a = 0.10 ¿Cuál es el procedimiento a seguir?Es una prueba de 2 extremos, µH0 = 90 n = 20 S = 11 X = 84 a = 0.10

1. Planteamiento de hipótesisH0: µ = 90 La media real es 90 H1: µ ≠ 90 La media real no es 90 a = 0.10 Nivel de significancia para probar esta hipótesis

2. Cálculo del error estándar estimado. δx = (δ/√n) = 11/√20 = 2.46

3. Elegir la distribución adecuada “t” y encontrar el valor crítico. g.l. = n -1 = 20 – 1 = 19 a = 0.10 t = ± 1.729

4. Definir los límites de la región de aceptación: µH0 ± tδx LIC = 90 – 1.729 (2.46) = 85.747

90 ± 1.729(2.46) LSC = 90 + 1.729 (2.46) = 94.253

Interpretación de los resultados. En ambas gráficas siguientes se puede observar que la media de la muestra X = 84 y t = 2.44, caen en el área de rechazo, por tanto se rechaza la H 0, que es la afirmación del gerente de Recursos Humanos acerca de que la puntuación media real de los empleados examinados es 90.

ESCALA ORIGINAL

7

Page 8: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

-1.729 +1.729

AREA DE ACEPTACIÓN AREA DE RECHAZO N.C.=0.90 0.005

0.005 AREA DE RECHAZO

85.747 U=90 94.253 X = 84

ESCALA ESTANDARIZADA

RECHAZO ------ACEPTACION----------- RECHAZO

Valor crítico de t= -1.729 t = 0 1.729 --- Valor crítico de tX estandarizada t= -2.46

Ej.: Un documental de televisión afirmaba que los hondureños tienen un sobrepeso aproximado de 10 lb. en promedio. Se examinó a 18 personas y se encontró que su sobrepeso promedio es de 12.4 lb. con una S = 2.7 lb. A un a = 0.01 ¿hay razón para dudar de la validez del valor aproximado de 10 lb? t = ± 2.898 Límites = (8.16, 11.84) PRUEBAS DE UN EXTREMO DE MEDIAS MEDIANTE LA DISTRIBUCION TEl procedimiento es similar al de una prueba de un extremo que usa la distribución normal estándar y la tabla Z, excepto que para encontrar el valor apropiado de “t” es necesario duplicar el valor de “a” (área en ambos extremos combinados), por ej.: si a = 0.05 se tendrá que buscar los grados de libertad a un a = 0.10 porque la columna 0.10 representa 10% del área bajo la curva contenida en ambos extremos combinados, igualmente 0.05 del área bajo la curva contenida en cada uno de los extremos.Ej.: La corredora de bienes raíces VICASA tomó una muestra aleatoria de 12 viviendas de un prestigiado barrio de Tegucigalpa y encontró que el valor de mercado promedio estimado de una vivienda era L780,000, con una desviación estándar de L49,000. Pruebe la hipótesis de que para todas las casas del área, el valor estimado medio es L825,000, contra una hipótesis alternativa de que es menor que L825,000. Utilice un a = 0.05.

Preguntas para un quiz:

1. En la prueba de hipótesis, suponemos que algún parámetro de población toma un valor particular antes de muestrear. Esta suposición que se va a probar se denomina hipótesis alternativa.2. Suponiendo que una hipótesis dada acerca de la media de una población es correcta, el porcentaje de medias muestrales que pudieran caer fuera de ciertos límites de esta media hipotética se denomina nivel de significancia.3. En la prueba de hipótesis, la distribución de probabilidad apropiada es siempre la distribución normal.4. Si cometiéramos un error tipo I, rechazaríamos una hipótesis nula cuando realmente es verdadera.5. Una prueba en la escala sin procesar o en la escala estandarizada nos lleva a la misma conclusión.6. Sí 1.96 es el valor crítico de z, entonces el nivel de significancia de la prueba es 0.05.

8

Page 9: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

7. Si nuestras hipótesis nula y alternativa son H0: m 5 80 y H1: m < 80, es apropiado utilizar una prueba de cola izquierda.8. Si la media de muestra estandarizada está entre cero y el valor crítico, entonces no se rechaza H0.9. El valor 1 2b se conoce como la potencia de la prueba.10. Después de realizar una prueba de una cola y rechazar H0, se da cuenta de que debió haber hecho una prueba de dos colas, al mismo nivel de significancia. También rechazará H0 para esa prueba.11. A menudo, aunque no siempre, es posible establecer el valor de a de manera que obtengamosun trueque sin riesgos en la prueba de hipótesis.12. Imagine que efectúa una prueba de hipótesis de dos colas sobre una media de población y ha establecido a 5 0.05. Si el estadístico muestral cae dentro de 0.95 del área alrededor de mH0, usted ha probado que la hipótesis nula es cierta.13. Si las pruebas de hipótesis se hicieran a un nivel de significancia de 0.60, la hipótesis nula generalmente se aceptaría cuando no es cierta.14. Si mH0 5 50 y a 5 0.05, entonces 1 2b debe ser igual a 0.95 cuando m 5 50.15. Para un nivel de significancia dado, los valores críticos de t se acercan a cero cuando crece el tamaño de la muestra.16. Elegir el nivel de significancia apropiado es más fácil que elegir la prueba correcta que se debe utilizar.17. Existen métodos matemáticos que garantizan que el nivel de significancia seleccionado siempre será el adecuado.18. La prueba de hipótesis nos ayuda a sacar conclusiones sobre parámetros estimados.V F

9

Page 10: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

CAPITULO 9. PRUEBA DE HIPOTESIS CON DOS MUESTRAS

Prueba de hipótesis para diferencias entre medias. En muchas situaciones de toma de decisiones se necesita determinar si los parámetros de 2 poblaciones son parecidos o diferentes, por ejemplo: un médico receta una misma medicina a 2 personas que padecen la misma enfermedad, la reacción de la medicina en una de las personas es positiva, sin embargo en la otra persona no produce la misma reacción. Otro ejemplo se presenta en algunas empresas en puestos cubiertos por hombres y mujeres que desarrollan las mismas funciones pero el salario devengado por los hombres es mejor que el de las mujeres.Para el análisis de esta situación, estudiaremos la DISTRIBUCION DE MUESTREO PARA LA DIFERENCIA ENTRE 2 PARAMETROS DE POBLACION. Para una mejor comprensión, veamos las figuras siguientes:

Distribución de muestreo de µ1 y µ2

Distribución de todos los valoresposibles de Ⱦ1 y Ⱦ2

δȾ1 δȾ2

µȾ1= µ1 µȾ2 = µ2

Distribución de muestreo de la diferencia entre las medias de las muestras

Distribución de todos los valores posibles de Ⱦ1-Ⱦ2

δȾ1- Ⱦ2

µȾ1- Ⱦ2

El significado de la simbología utilizada, es el siguiente:µ1 y µ2 = La media de la población 1 y de la 2 respectivamente

δȾ1 y δȾ2 = Error estándar de la media de la muestra 1 y el de la 2 respectivamente

µȾ = Media de la distribución de muestreo de las mediasȾ1- Ⱦ2 = Diferencia entre las medias

δȾ1- Ⱦ2 = Error estándar de la diferencia entre 2 medias, o la desviación estándar de la diferencia entre medias.NOTA. Si la desviación estándar de la población (δ) es desconocida entonces hay que estimar el error estándar a partir de la S o S2.

10

Page 11: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

Ambas poblaciones (1 y 2) tienen su propia µ y δ y además su distribución de muestreo de la media (µȾ= µ) y su error estándar de la media (δȾ) construidos a partir de todas las muestras posibles de un tamaño dado que pueden tomar de la distribución de la población correspondiente.Si se toma una muestra de cada población y se calcula la diferencia entre medias (Ⱦ1 - Ⱦ2), se pueden presentar los resultados siguientes:

a) > 0 == Ⱦ1 > Ⱦ2

b) < 0 == Ⱦ1 < Ⱦ2

c) = 0 == Ⱦ1 = Ⱦ2

Todas las diferencias posibles de las medias nos conducen a una distribución de muestreo de la diferencia entre las medias de las muestras (µȾ1 - Ⱦ2 = µȾ1 - µȾ2). Si µ1= µ2 == µȾ1- µȾ2 = 0.La desviación estándar de la distribución de la diferencia entre las medias de muestras se conoce como ERROR ESTANDAR DE LA DIFERENCIA ENTRE DOS MEDIAS, su fórmula es:

δȾ1- Ⱦ2 = √ (δ21/n1 + δ2

2/n2) donde: δȾ1- Ⱦ2 = Error estándar de la diferencia entre dos medias

δ21 = Varianza de la población 1

δ22 = Varianza de la población 2

n1 = Tamaño de la muestra de la población 1

n2 = Tamaño de la muestra de la población 2

si no se conocen las dos desviaciones estándar de población se puede estimar el error estándar a partir de las desviaciones de las muestras.

Prueba de diferencia entre medias. Tamaños de muestra grandes. Dos extremos.A un estadístico en recursos humanos se le pide determinar si los salarios por hora de los trabajadores especializados son los mismos en 2 ciudades distintas. El resultado de la investigación es el siguiente:

MUESTRA NO. CIUDAD SALARIO POR HORA S N

1 San Pedro Sula L. 8.95 L. 0.40 200

2 Tegucigalpa 9.10 0.60 175

Se desea probar en el a = 0.05 que no hay diferencia significativa entre los salarios por hora. Puesto que la empresa está interesada en saber si hay diferencia o sea, si las medias son o no iguales; es una prueba de dos extremos.

1. Planteamiento de hipótesisH0: µ1 = µ2 No hay diferencia

H1: µ1 ≠ µ2 Existe diferencia a = 0.05 Nivel de significancia para probar esta hipótesis.

2. Cálculo del error estándar estimado. δȾ1- Ⱦ2 = √ ((0.40)2/200 + (0.60)2/175)) = 0.053

3. Elegir la distribución adecuada “Z” y encontrar los valores críticos. Z = 1.96

4. Definir los límites de la región de aceptación por el método de estandarización:

Z = ( Ⱦ 1 - Ⱦ 2) – (µ 1 - µ2)Ho Z = (8.95 – 9.10) - 0 = - 2.83δȾ1- Ⱦ2 0.053

5. Interpretación de los resultados y conclusión. Al graficar el valor de Z = -2.83 lo encontramos en el área de rechazo, así pues rechazamos H0 y se concluye que los salarios de los trabajadores semiespecializados de las dos ciudades, son diferentes.

11

Page 12: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

Ej. 9-2. Se recolectaron 2 muestras independientes de observaciones con los datos siguientes:

Muestra # Media S n1 86 6 602 82 9 75

Usando un a = 0.01 probar si las 2 muestras pueden de manera razonable, ser consideradas como provenientes de poblaciones con la misma media.

Muestras pequeñas:En el procedimiento para probar estas hipótesis, hay cambios en el cálculo del error estándar de la diferencia entre medias y también los grados de libertad al utilizar la tabla 2 de la distribución “t”. Si se supone que la δ2

1 = δ22 se debe estimar una δ2 común; para ello se utiliza un promedio

pesado se S21 y S2

2 que se llama “estimación conjunta de la δ2 en el cual los pesos son los grados de libertad de cada muestra, cuya fórmula es como sigue:

S2p = (n1 -1)S 2 1 +(n2 -1)S 2 2 Sp = √ Sp

2 δȾ1- Ⱦ2 = Sp [√((1/n1) + (1/n2))]n1 + n2-2

donde: S2p = Estimación conjunta de la δ2 n1 = Tamaño de la muestra 1

n2 = Tamaño de la muestra 2 S21 = Varianza de la muestra 1

S22 = Varianza de la muestra 2 Sp = Estimación conjunta de la δ

δȾ1- Ⱦ2 = Error estándar estimado

Ejemplo: (9-3 de pag. 477)HP fabricante de computadoras personales investiga dos programas educativos con el fin de aumentar la sensibilidad de sus directivos. El programa original consistía en sesiones informales de preguntas y respuestas; el nuevo programa implica clases formales con psicólogos y sociólogos, pero es considerado más caro. Se desea saber a un a = 0.05 si este gasto ha aumentado la sensibilidad de sus directivos. Los datos son:

Muestra Programa Sensibilidad media después S n1 Formal 92% 15% 122 Informal 84% 19% 15

1. Planteamiento de hipótesisH0: µ1 = µ2 No hay diferencia en los niveles de sensibilidad proporcionado por los

programas. H1: µ1 > µ2 Existe diferencia a = 0.05 Nivel de significancia para probar esta hipótesis.

2. Cálculo de la S2p = (12 - 1)(15) 2 + (15 - 1)(19) 2 = 301.16 Sp = √301.16 = 17.354

12 + 15 – 2

δȾ1- Ⱦ2 = 17.354[√((1/12) + (1/15))] = 6.721

3. Elegir la distribución “t” para muestras pequeñas encontrar el valor crítico de “t” con g.l. = n1 +n2-2 = 25, a = 0.10 (se duplica para pruebas de un extremo. t = 1.708

4. Definir los límites de la región de aceptación por el método de estandarización:

t = ( Ⱦ 1 - Ⱦ 2) – (µ1 - µ2)Ho t = (92 – 84) - 0 = 1.19δȾ1- Ⱦ2 6.721

Interpretación de los resultados y conclusión. Después de graficar el valor de t = 1.19 en el área de aceptación, se acepta la H0 y se concluye que no hay diferencia significativa entre los niveles de sensibilidad adquiridos por los 2 programas. Los gastos con respecto

12

Page 13: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

al programa formal no han producido un alza significativa en el nivel de sensibilidad de sus administradores.

Ej. 9-8 “EL GRUPO Q” cada año selecciona varios modelos de automóvil y evalúa su eficiencia con respecto al consumo de combustible. Este año presenta los datos de 2 modelos compactos, así:

Muestra

Modelo Consumo promedio (millas por galón)

S n

1 A 27.2 3.8 12

2 B 32.1 4.3 9

A un a = 0.01 ¿Se deberá concluir que los automóviles de la marca B tienen un número promedio de mpg mayor que los automóviles de la marca A?

Prueba de diferencias entre medias con muestras dependientesEl uso de muestras dependientes o apareadas permite llevar a cabo un análisis más preciso al tener un mayor control de factores externos. Este proceso requiere cambios en la fórmula para calcular el error estándar estimado y además el tamaño de las muestras debe ser el mismo.

Ej. Pag.482 “El Oasis Colonial” un balneario de aguas termales, tiene un programa de reducción de peso y afirma que el participante promedio pierde más de 17 lbs. Un ejecutivo de pesos pesados está interesado en el programa pero se muestra un poco escéptico en lo que se afirma y para convencerlo, el balneario le permite elegir aleatoriamente los registros de 10 participantes y anotar su peso antes y después de haber llevado el programa. El ejecutivo desea probar a un a = 5% que la pérdida promedio de peso en más de 17 lbs. A continuación los datos encontrados:

Antes 189 202 220 207 194 177 193 202 208 233

después 170 179 203 192 172 161 174 187 186 204

Pérdida individual promedio

19 23 17 15 22 16 19 15 22 29

Se tienen 2 muestras (una antes y una después) que son dependientes entre sí, pues la muestra de 10 personas ha sido observada 2 veces. El planteamiento inicial de la hipótesis es como sigue:

H0: µ1 - µ2 = 17 La pérdida promedio de peso = 17 lbs. H1: µ1 - µ2 > 17 La pérdida promedio de peso excede las 17 lbs. a = 0.05 Nivel de significancia para probar esta hipótesis

El interés que se tiene es la diferencia entre el peso antes y después y por tanto es una prueba de extremo derecho, en consecuencia lo que hay es una sola muestra de pérdida de peso, por lo que se replanteará la hipótesis así:

1. H0: µ1 = 17 La pérdida promedio de peso = 17 lbs. H1: µ1 > 17 La pérdida promedio de peso excede las 17 lbs. a = 0.05 Nivel de significancia para probar esta hipótesis.

2. Cálculo de las diferencias apareadas o dependientes: Comparar las pérdidas individuales

13

Page 14: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

Calcular la Ⱦ y S de las pérdidas individuales: Ⱦ = 19.7 S2 = 19.34 S = 4.4 Estimar la δ que no conocemos a partir de la S.

3. Calcular la estimación del δx = (δ/√n) = 4.4/√10 = 1.394. Estandarizar la pérdida media de peso: t = Ⱦ - U HO t = 19.7 – 17 = 1.94

δȾ 1.395. interpretar los resultados y concluir. Se observa que la media de muestra t = 1.94

se encuentra fuera de la región de aceptación, en consecuencia el ejecutivo rechaza la HO y concluye que la pérdida de peso es legítima.

Pruebas para diferencias entre porciones. Tamaños de muestra grandes.El procedimiento a seguir es muy parecido a lo que se hizo cuando comparamos las medias utilizando muestras independientes, se estandariza la diferencia entre las 2 porciones de muestra y se basa la prueba en la distribución normal; la única diferencia es la forma de calcular la estimación del error estándar de la diferencia entre las 2 porciones de muestra.

δp1- p2 = √ (p1q1/n1 * p2q2/n2) donde: δp1-q2 = Error estándar de la diferencia entre dos porciones.p1 = Porción de éxitos de la muestra 1q1 = Porción de fracasos de la muestra1p2 = Porción de éxitos de la muestra 2q2 = Porción de fracasos dela muestra 2n1 = Tamaño de la muestra de la población 1n2 = Tamaño de la muestra de la población 2

Si no se conocen los parámetros de la población se puede estimar el error estándar a partir de las estadísticas de muestra, agregando la raya superior.

Antes de calcular el error estándar, es necesario calcular una porción combinada de éxitos de ambas muestras y su fórmula es:

P = n1p1 + n2p2

n1 + n2

Ej. 9.5 pag.489. “INFARMA” fabrica productos medicinales y está probando 2 nuevos compuestos (droga 1 y droga 2) para reducir los niveles de presión sanguínea a 2 diferentes grupos de personas. En el grupo 1, 71 de 100 respondieron a la droga 1 con niveles menores de presión arterial; en el grupo 2, 58 de 90 respondieron a la droga 2 con niveles menores de presión sanguínea. A un a = 0.05 probar si existe una diferencia entre la eficiencia de las 2 medicinas. Es una prueba de 2 extremos porque solo se desea saber si existe diferencia entre los 2 compuestos.

n1 = 100 ṗ1 = 71/100 = 0.71 q1 = 29/100 = 0.29

n2 = 90 ṗ2 = 58/90 = 0.644 q2 = 32/90 = 0.356

1. Planteamiento de hipótesisH0: P1 = P2 No hay diferencia entre las 2 medicinas. H1: P1 # P2 Existe diferencia entre ellas a = 0.05 Nivel de significancia para probar esta hipótesis.

2. Cálculo de la p = (100)(0.71) + (90)(0.644) = 0.6789100 + 90

δp1- p2 = [√((0.6789 * 0.3211/100) + (0.6789 * 0.3211/90))] = 0.0678

14

Page 15: CAPITULO 8 -    Web viewCAPITULO 8. PRUEBA DE HIPOTESIS: Pruebas de una sola muestra. 8.1 INTRODUCCION. La prueba de hipótesis comienza con: una

3. Encontrar el valor crítico de “Z”, n.c.= 0.95 Z = 1.96

4. Definir los límites de la región de aceptación por el método de estandarización: Z = (p1 - p2) – (P1 - P2)Ho Z = (0.71 – 0.644) - 0 = 0.973

δp1- p2 0.0678

Interpretación de los resultados y conclusión. Después de graficar el valor de Z = 0.973 en el área de aceptación, se acepta la H0 y se concluye que no hay diferencia significativa entre los 2 nuevos medicamentos destinados a reducir la presión sanguínea.

Pruebas de un extremo para diferencias entre porciones.El Instituto de la Propiedad del gobierno de la unidad nacional, está utilizando 2 métodos para listar propiedades. El primero requiere la presencia del dueño de la propiedad ante el recabador de la información, el segundo le permite al dueño enviar la información por internet. El Director del Instituto piensa que el método 1° produce menos errores que el 2°. Se realiza una verificación de 50 listas del método 1° produciendo 10% de errores; y 75 del 2° que produjeron 13.3% de errores. A un a = 0.15 probar la hipótesis que sostiene el Director del Instituto de la Propiedad.

p1 = 0.10 Porción de éxitos muestra1 p2 = 0.133 Porción de éxitos muestra 2q1 = 0.90 Porción de fracasos muestra 1 q2 = 0.867 Porción de fracasos muestra 2n1 = 50 n2 = 75

1. Planteamiento de hipótesisH0: P1 = P2 No hay diferencia entre las 2 métodos. H1: P1 < P2 El método 1° produce menos errores que el método 2° a = 0.15 Nivel de significancia para probar esta hipótesis.

2. Cálculo de la p = (50)(0.10) + (75)(0.133) = 0.1250 + 75

δp1- p2 = [√((0.12 * 0.88/50) + (0.12 * 0.88/75))] = 0.0593

3. Encontrar el valor crítico de “Z”, n.c.= 0.35 Z = 1.04

4. Definir los límites de la región de aceptación por el método de estandarización:

Z = (p1 - p2) – (P1 - P2)Ho Z = (0.10 – 0.133) - 0 = - 0.556δp1- p2 0.0593

5. Interpretar y concluir. Al ubicar en la gráfica el valor de z = - 0.556, lo encontramos en el área de aceptación, por consiguiente se acepta H0 de que no existe diferencia entre los 2 métodos de recabar información.

15