57
6. Estimación , DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA La estadística está dividida en descriptiva e inferencial donde La estadística Descriptiva se relaciona principalmente con la recopilación, presentación y descripción de datos. Y la estadística Inferencial esta formada por un conjunto de métodos o técnicas utilizadas para la toma de decisiones o establecer conclusiones de una población. Para que la estadística inferencial sea efectiva sobre las conclusiones de una población, se requiere que las muestras seleccionadas de dicha población, sean muestras aleatorias. Los métodos estadísticos hacen uso de la información contenida en la muestra aleatoria y con base a esa información, se interpreta, se infiere y se toman las decisiones de la población. La inferencia estadística puede dividirse en dos grandes áreas: estimación de parámetros y prueba de hipótesis. 6.2 POBLACION, MUESTRA Y MUESTREO En este capítulo se hará un recordatorio de la definición de lo que es muestra, población y muestreo como se vio en el capítulo 2. Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico; es decir, está formada por la totalidad de las observaciones en las cuales se tiene cierto interés.

adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS.

6.1 INFERENCIA ESTADISTICALa estadística está dividida en descriptiva e inferencial donde La

estadística Descriptiva se relaciona principalmente con la recopilación, presentación y descripción de datos. Y la estadística Inferencial esta formada por un conjunto de métodos o técnicas utilizadas para la toma de decisiones o establecer conclusiones de una población. Para que la estadística inferencial sea efectiva sobre las conclusiones de una población, se requiere que las muestras seleccionadas de dicha población, sean muestras aleatorias. Los métodos estadísticos hacen uso de la información contenida en la muestra aleatoria y con base a esa información, se interpreta, se infiere y se toman las decisiones de la población.

La inferencia estadística puede dividirse en dos grandes áreas: estimación de parámetros y prueba de hipótesis.

6.2 POBLACION, MUESTRA Y MUESTREO

En este capítulo se hará un recordatorio de la definición de lo que es muestra, población y muestreo como se vio en el capítulo 2.

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico; es decir, está formada por la totalidad de las observaciones en las cuales se tiene cierto interés.

Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población. O también es un subconjunto, extraído de la población (mediante técnicas de muestreo), cuyo estudio sirve para inferir características de toda la población, (Ver fig. 6.1).

Page 2: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Figura. 6.1. Población y Espacio muestral

El muestreo es la técnica o método con que se extraen los elementos de la población a estudiar.

Existen dos tipos de muestreo Probabilístico y no probabilístico. En este último (no probabilístico) puede haber clara influencia de la persona o personas que seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad. Salvo en situaciones muy concretas, en la que los errores cometidos no son grandes, debido a la homogeneidad de la población, en general no es un tipo de muestreo riguroso y científico, dado que no todos los elementos de la población pueden formar parte de la muestra. Por ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que no tienen teléfono o que están trabajando, no podrán formar parte de la muestra.

Muestreo probabilístico: En este tipo de muestreo es en el que todos

los individuos de la población, tienen la misma probabilidad de ser parte de la

muestra.

6.3 ESTADISTICOS Y DISTRIBUCIONES DE MUESTREO

Page 3: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Las inferencias estadísticas se hacen mediante los estadísticos. Los estadísticos son funciones derivadas de las observaciones contenidas en una muestra aleatoria. Una distribución de muestreo es una distribución de probabilidad de un estadístico, por ejemplo la distribución de probabilidad de X, se le conoce como distribución de muestreo de la media. La distribución de muestreo de un estadístico depende de la distribución de la población, del tamaño de la muestra y del método de muestreo seleccionado.

6.4 DISTRIBUCION DE MUESTREO DE MEDIAS

Sea x1 , x2, x3 ,⋯ , xn un conjunto de observaciones de una muestra aleatoria de tamaño n tomada de una población (finita o infinita) normal con media μ y varianza σ 2. Cada observación en esta muestra es una variable aleatoria distribuida normal e independiente, con media μ y varianza σ 2.

Entonces x= x1+x2+x3+⋯+ xn

n, tiene una distribución normal con media μx=μ, y

varianza σ x2=σ2

n. Esta afirmación se puede verificar con el siguiente teorema.

Teorema del Límite Central: Si x1, x2 , x3 ,⋯ , xn es una muestra aleatoria de tamaño n tomada de una población (finita o infinita) con media μ y varianza σ 2, y si x es la media muestral, entonces la forma límite de la distribución de

Z= x−μσ√n

Cuando n→∞, es la distribución normal estándar.

Aun cuando la distribución de la población no es normal, el Teorema del Límite Central permite afirmar que “prácticamente” x es normal para muestras grandes tomadas de cualquier población.

Page 4: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

6.5 ESTIMADORES Y SU PROPIEDADES

Un estimador es una regla, a menudo expresada como una fórmula, que indica cómo calcular el valor de una estimación con base en las mediciones contenidas en una muestra. Existen dos tipos de estimaciones concernientes a una población: la estimación por intervalo y la estimación puntual.

Una estimación puntual, es un solo valor o número que se utiliza para estimar un parámetro de población desconocido. A menudo una estimación puntual es insuficiente debido a que ya en resultado, solo se tienen dos opciones: el valor de estimador es correcta o no. Por ejemplo, mediante una estimación puntual se afirmara que para el año 2030, la proporción de enfermos de sida a nivel mundial será 0.70, pudiera ser cierta o no.

Un estimador puntual es una variable aleatoria con una distribución de muestreo que depende de la población y de su parámetro. Un buen estimador debe de contener dos propiedades muy importantes, para evaluar la bondad del estimador, que son que el estimador sea insesgado respecto al parámetro a estimar y que tenga varianza mínima. Por ejemplo la media

muestral x=1n∑i=1

n

x i es un estimador puntual de la media de la población μ.

Los estimadores puntuales más usuales son los de la distribución binomial ( p), de la distribución de Poisson del parámetro λ y la distribución normal (μ ,σ ).

Antes de utilizar un estadístico muestral como estimador puntual, se verifica si el estimador puntual tiene ciertas propiedades que corresponden a un buen estimador puntual. Como hay distintos estadísticos muéstrales que se usan como estimadores puntual es de sus correspondientes parámetros poblacionales, se usará la notación general siguiente:

θ: es el parámetro poblacional de interés.θ̂: es el estadístico muestral o estimador puntual de θ.

En general θ representa cualquier parámetro poblacional como, por ejemplo, la media poblacional, la desviación estándar poblacional, etc.; y θ̂

Page 5: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

representa el correspondiente estadístico muestral, por ejemplo la media muestral, la desviación estándar muestral y la proporción muestral.

Las propiedades de un buen estimador son: Insesgadez: Si el valor del estadístico muestral es igual al parámetro

poblacional que se estudia, se dice que el estudio muestral es un estimador insesgado del parámetro poblacional.

El estadístico muestral θ̂ es un estimador insesgado del parámetro poblacional θ si E (θ̂ )=θ, donde E (θ̂ ) valor esperado del estadístico muestral.

Por lo tanto, el valor esperado, o media, de todos los posibles valores de un estadístico muestral insesgado es igual al parámetro poblacional de interés.

Eficiencia: Se dice que el estimador puntual con menor error estándar tiene mayor eficiencia relativa que los otros.

Cuando se muestrean poblaciones normales, el error estándar de la media muestral es menor que el error estándar de la mediana muestral. Por tanto, la media muestral es más eficiente que la mediana muestral.

Consistencia: Un estimador puntual es consistente si el valor del estimador puntual tiende a estar más cerca del parámetro poblacional a medida que el tamaño de la muestra aumenta. En otras palabras, una muestra grande tiende a proporcionar mejor estimación puntual que una pequeña.

Los estimadores x , s y p̂ son estimadores insesgado de μ , σ y p, respectivamente (Walpole, Ronald E., 2007).

6.6 ERROR ESTÁNDAR DE UN ESTADISTICO

Debido a que un estadístico es una variable aleatoria derivada de las observaciones de un muestreo aleatorio, el valor del estadístico puede variar de una muestra a otra muestra aleatoria, dependiendo de la variación de la población de interés. De esta forma El error estándar de un estadístico depende de la desviación estándar de su distribución de muestreo. Por

Page 6: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

ejemplo, si la media muestral X se utiliza como estimados puntual de la media poblacional μ, el error estándar de X mide que también X estima a μ.

Si x1 , x2 , x3 ,⋯ , xn es una muestra aleatoria de tamaño n tomada de una

población normal con media μ y varianza σ2

√n, de modo que el error estándar

de x es

σ x=σ√n

(6.1)

Si se desconoce el valor de σ , éste se puede sustituir por la deviación estándar muestral de x en la expresión 6.1, por consiguiente el error estándar estimado de x es

σ x=S√n

(6.2)

6.7 ESTIMACION POR INTERVALOS

Tomando en cuenta que la mayoría de las veces el parámetro poblacional es desconocido, conveniente obtener límites entre los cuales se encuentre el dicho parámetro con un cierto nivel de confianza estadística, en este caso se trata de la estimación por intervalos.

Es decir, la estimación por intervalos da por consecuencia un intervalo de confianza en el que se espera que se encuentre el parámetro poblacional con una alta probabilidad de certeza. Por ejemplo, el intervalo de confianza para la media poblacional es el intervalo de valores que tiene una alta probabilidad de contener a la media de la población como se ilustra en la figura 6.2. En la estimación por intervalos de un parámetro población, resulta adecuado hablar en términos de probabilidad de que el estimador cubra el verdadero valor del parámetro, como se muestra en la figura 6.2. Por lo tanto, si se seleccionan 100 muestras de una población y se calcula cada media de las muestras, de las cuales se les estima sus correspondiente intervalos de confianza del 95%, se tendría que aproximadamente 95 de los 100 intervalos de confianza contienen la media poblacional.

Page 7: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Figura 6.2 Distribución de muestreo para estimador por intervalos.

El nivel de confianza α (alfa) es el valor de la probabilidad de que el parámetro poblacional se encuentre dentro del intervalo; los niveles de confianza más ampliamente usados son: α=0.10 , α=0.05 y α=0.01 correspondientes al 90%, 95% y 99% de confianza estadística, respectivamente.

6.8 ESTIMACION POR INTERVALO DE UNA MEDIA CON n > 30

Sea x1 , x2 , x3 ,⋯ , xn es una muestra aleatoria de tamaño n>30 tomada de una población normal con media μ y varianza σ 2 conocida. Entonces un intervalo de confianza del 100%(1-α) para μ esta dada por

x−Z∝/2σ√n

≤μ≤ x+Z∝/2σ√n

(6.3)

Donde Z∝ /2 es el punto de la distribución normal estándar, que corresponde al nivel de confianza dado α . En la tabla 6.1, se pueden ver algunos valores de Zα /2 para diferentes valores de α .

α Zα /2

Page 8: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

0.10 Z0.05=1.645

0.05 Z0.025=1.96

0.01 y Z0.005=2.575

Tabla 6.1 Valores de Zα /2 para distintos valores α (alfa)

Ejemplo 6.1. Los datos de la tabla 6.2 se encuentran una muestra aleatoria de las estaturas en centímetros de 45 estudiantes de la licenciatura de ingeniería de alguna universidad. Se sabe que la muestra aleatoria de tamaño n=45 proviene de una población normal con la varianza poblacional σ 2=9 . Construya un intervalo de confianza del 95% para la estatura media poblacional μ.

164 162 165 163 165168 165 165 169 167163 164 160 167 160166 164 169 163 171160 163 160 168 167165 167 162 164162 166 165 166165 161 170 164158 165 160 167165 169 165 162

Tabla 6.2 Estaturas de 45 estudiantes

La media de la muestra de los 45 estudiantes es

x=164.578

De la tabla I del apéndice y para un α=0.05 se tiene que Z0,025=1.96. La obtención del intervalo de confianza al 95% de las estaturas de los estudiantes es la siguiente

164.578−1.96 3√45

≤μ≤164.578+1.96 3√45

Page 9: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

164.578−1.96 36.708

≤ μ≤164.578+1.96 36.708

164.578−1.96 (0.447)≤μ≤164.578+1.96(0.447)

164.578−0.876≤μ≤164.578+0.876

163.702≤ μ≤165.454

Por lo tanto la estatura media poblacional de los estudiantes esta entre 163.702 y 165.454.

Ahora consideremos lo siguiente, dado que se seleccionó una confianza estadística del 95%. ¿Qué hubiera pasado si se hubiera escogido una confianza estadística mayor, por ejemplo 99%? ¿Cómo será el intervalo de confianza para la estatura media poblacional de los estudiantes?

Para un α=0.01, y de la tabla I del apéndice se tiene que Zα /2=Z0.01 /2=Z0.005=2.58, entonces el intervalo de confianza al 99% es

164.578−2.58 3√45

≤μ≤164.578+2.58 3√45

164.578−2.58 36.708

≤ μ≤164.578+2.58 36.708

164.578−2.58(0.447)≤ μ≤164.578+2.58(0.447)

164.578−1.153≤ μ≤164.578+1.153

163.425≤μ≤165.731

Por lo tanto, para una confianza estadística del 99%, la estatura media poblacional de los estudiantes esta entre 163.425 y 165.731.

Nótese que la longitud el intervalo de confianza al 99% es mayor que la longitud del intervalo de confianza al 95%. En general, para un tamaño de

Page 10: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

muestra fijo y una desviación estándar σ , entre mas grande sea la confianza estadística, mas grande será el intervalo de confianza resultante.

6.9 ESTIMACION POR INTERVALO DE UNA PROPORCION

Si x es una variable aleatoria binomial con los parámetros n y p, y n es grande y

p̂= xn , entonces la expresión 6.4 es un intervalo de confianza aproximadamente

del (1−α )100% para p,

p̂−Zα /2 ∙√ p̂ (1− p̂ )n

< p< p̂+Zα /2 ∙√ p̂ (1− p̂)n

(6.4)

Ejemplo 6.2. En una muestra aleatoria, 145 personas de 450, a quienes se aplicó una vacuna contra la influenza, experimentaron cierto síntoma de incomodidad. Construir un intervalo de confianza del 95% para la proporción poblacional de personas que experimentaron algún síntoma de incomodidad por la vacuna.

Sustituyendo n=450 , p̂=145450

=0.32 y para α=0.05 y de la tabla I del

apéndice se tiene que Z0.025=1.96, en la expresión 6.4 del intervalo de confianza, se obtiene que

0.32−1.96 ∙√ 0.32 (1−0.32 )450

< p<0.32+1.96 ∙√ 0.32(1−0.32)450

0.32−(1.96)(0.02199)< p<0.32+(1.96)(0.02199)

0.2769< p<0.3631

Page 11: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Por lo tanto, la proporción poblacional de personas que experimentaron algún síntoma de incomodidad por la vacuna está entre 0.2769 y 0.3631.

6.10 DISTRIBUCION t (t- Student)

Sea Z una variable aleatoria con distribución normal con μ=0 y varianza σ 2=1 y sea V una variable aleatoria ji-cuadrada con k grados de libertad. Si Z y V son independientes, entonces la variable aleatoria

T= Z

√Vk

tiene una función de densidad de probabilidad

f ( x )=Γ [ (k+1 ) /2 ]

√ πk Γ ( k /2 ) [ (x2/k )+1 ](k +1) /2−∞<x<∞

y se dice que sigue una distribución t con k grados de libertad. Su media y varianza de la distribución t son μ=0 y σ=k /(k−2) para k>2, respectivamente. En la figura 6.3 se presenta la grafica de varias distribuciones t.

Page 12: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

G. L.2310

t de Student

-9 -6 -3 0 3 6 9x

0

0.1

0.2

0.3

0.4

dens

idad

Figura 6.3 Grafica de varias distribuciones t

6.11 DISTRIBUCION MUESTRAL t (t- Student)

Por lo general en muchas ocasiones no se conoce la desviación estándar de la población, sino que se cuenta con solo la estimación de la desviación estándar obtenida de una muestra aleatoria de dicha población, por consiguiente no es posible obtener el valor de Z de una distribución normal estándar. En este caso, se obtiene el estadístico t (t-Student), definido como la expresión 6.5.

t= x−μS

(6.5)

Donde t sigue una distribución t (t-Student) con n-1 grados de libertad y

S=√∑ (x−x i )2

n−1 es la desviación estándar muestral.

La distribución t tiene una curva más ancha que la distribución normal estandarizada cuando el número de grados de libertad es pequeño. Cuando los grados de libertad tienden a infinito, la distribución t tiende a una distribución normal estándar. Es significa que a medida que se incrementa el tamaño de la muestra, la desviación estándar muestral se aproxima a la

Page 13: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

desviación estándar poblacional y en consecuencia la distribución de t se a próxima a la distribución normal estándar (ver figura 6.4)

Figura 6.4 Distribución t de Student y normal.

6.12 ESTIMACION POR INTERVALO DE UNA MEDIA CON n≤30

Sea x y S la media y desviación estándar, respectivamente, de una muestra aleatoria tomada de una población normal con media μ y varianza σ 2 desconocida. Entonces un intervalo de confianza del 100%(1-α) para μ esta dos por

x−t∝/2, n−1s

√n≤μ≤ x+t∝ /2 ,n−1

s√n

(6.6)

Donde t∝/2 , n−1 es un punto critico superior de la t-Student con n-1 grados de libertad, correspondiente al nivel de confianza α .

Ejemplo 6.3. Los siguientes datos de la tabla 6.3 corresponden a la estatura en centímetros de una muestra aleatoria de 10 estudiantes del grupo A de la licenciatura de ingeniería. Encontrar un intervalo de confianza del 95% para la estatura media.

168 168 164 160 171165 157 165 164 165

Tabla 6.3 Estaturas en centímetros de 10 estudiantes

Supongas que la estatura de los estudiantes sigue una distribución normal. La media y desviación estándar de la muestra son

Page 14: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

x=164.7

S=4.00139 De la tabla II del apéndice y para un α=0.05 y para n-1=10-1=9 grados de libertad se tiene que t 0,025,9=2.262. El intervalo de confianza al 95% de las estaturas de los estudiantes es

164.7−2.262 4.00139√9

≤μ≤164.7+2.262 4.00139√9

164.7−2.262(1.333)≤μ≤164.7+2.262(1.333)

161.15≤μ≤167.71

Por lo tanto, se tiene una confianza estadística del 95% de que el promedio de estatura de los estudiantes se encuentra entre 161.15 y 167.71.

6.13 DISTRIBUCION JI-CUADRADA

Sean Z1 , Z2 , Z3 ,⋯ , Zv variables aleatorias con distribución normal e independiente, con media μ=0 y varianza σ 2=1, entonces, la variable aleatoria definida como

χ=Z12+Z2

2+…+Zv2 (6.7)

Tiene la función de densidad de probabilidad

f ( x )=x¿ ¿¿¿

y por consiguiente χ sigue una distribución ji-cuadrada con v grados de libertad, y se simboliza con χ v

2. La media y la varianza de la distribución χ v2 son

μ=v

Page 15: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

σ 2=2v

En la figura 6.5 se pueden ver la distribución χ v2 con v=1, v=5, v=10, grados de

libertad. La distribución de ji-cuadrada es una de las distribuciones de muestreo con mayor utilidad.

G. L.2510

Chi-Cuadrada

0 10 20 30 40x

0

0.1

0.2

0.3

0.4

0.5

0.6

dens

idad

Figura 6.5 Gráficas de la distribución χ2 con distintos grados de libertad

Supóngase que X1 , X2 , X3 ,⋯ , Xn es una muestra aleatoria de tamaño, tomada de una población normal, con media μ y σ 2, entonces el estadístico ji-cuadrada dado por

χ2=(n−1 ) S2

σ2(6.8)

Tiene una distribuida como χ2 con n-1 grados de libertad y se le conoce como la distribución de muestreo ji-cuadrada, donde n es el tamaño de la muestra aleatoria, s2 la varianza muestral. Con la distribución de muestreo ji-cuadrada se puede construir estimaciones de intervalo de confianza y hacer pruebas de hipótesis estadísticas sobre la varianza de una población normal. El estadístico ji-cuadrada también se puede dar con la siguiente expresión

χ2=∑i=1

n

( X i−X )2

σ2

(6.9)

v=2

v=5v=10

Page 16: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Propiedades de las distribuciones ji-cuadrada

1. Los valores de χ2 son mayores o iguales que 0. 2. La forma de una distribución χ2 depende de n−1grados de libertad. En

consecuencia, hay un número infinito de distribuciones χ2. 3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1. 4. Las distribuciones χ2 no son simétricas. Tienen colas estrechas que se

extienden a la derecha; esto es, están sesgadas a la derecha. 5. Cuando n>2, la media de una distribución χ2 es n−1 y la varianza es 2 (n−1 ).

6. El valor modal de una distribución χ2 se da en el valor (n−3 ).

6.14 INTERVALO DE CONFIANZA DE LA VARIANZA

Sea X1 , X2 , X3 ,⋯ , Xn una muestra aleatoria de tamaño n tomada de una población normal, sea S2 la varianza muestral y por consiguiente sea S2 el estimador puntual de σ 2. En la sección 6.13 se mostró que la expresión

χ2=(n−1 ) S2

σ2

es una ji- cuadrada con n-1 grados de libertad. Esta distribución se muestra en la figura 6.6. Para el desarrollo del intervalo de confianza de σ 2, de la figura 6.4 se tiene la siguiente expresión (6.10)

p( χ 1−( α / 2)2 ≤

(n−1 )S2

σ 2≤ χ (α /2 )

2 )=1−α(6.10)

y haciendo un reordenamiento la expresión 6.10 puede escribirse como

P( (n−1 )S2

χ (α /2 ,n−1 )2 ≤σ 2≤ (n−1 ) S2

χ (1−α /2, n−1)2 )=1−α

(6.11)

Page 17: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Figura 6.6 Derivación de un intervalo de confianza para σ 2en una distribución normal

y por lo tanto, de la expresión 6.11, concluimos que el intervalo de confianza del 100 (1−α )% para σ 2 esta dado por

( (n−1 ) S2

χ (α /2 ,n−1 )2 , (n−1 ) S2

χ (1−α /2 ,n−1 )2 ) (6.12)

Ejemplo 6.4. Considerando los datos del ejemplo 6.3, de las estaturas de los estudiantes, encontrar un intervalo de confianza bilateral al 95% para la varianza poblacional σ 2 de las estaturas de los estudiantes.

Supongas que la estatura de los estudiantes sigue una distribución normal. La desviación estándar y la varianza de la muestra son

S=4.00139S2=16.011

De la tabla III del apéndice y para un α=0.05 y para n-1=10-1=9 grados de libertad se tiene que χ ( α /2 ,n−1)

2 = χ (0.025 ,9 )2 =19.02 y χ (1−α /2 , n−1)

2 = χ (0.975 ,9 )2 =2.70,

Page 18: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

sustituyendo estos valores en la expresión 6.9, se tiene que el intervalo de confianza para σ 2 al 95% de las estaturas de los estudiantes es

((9)(16.011)19.02, (9)(16.011)

2.70 )

( 144.09919.02, 144.0992.70 )

(7.57 ,53.37 )

Por lo tanto, se estima que la varianza poblacional σ 2 de las estaturas de los estudiantes esta entre 7.57 y 53.37.

6.15 PRUEBA DE HIPOTESIS

En muchos problemas de la ciencia, de la ingeniería y de la administración, se requiere que se toma una decisión entre aceptar y rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. Y el procedimiento sobre la toma de decisión sobre la hipótesis, se le conoce como prueba de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones.

Ejemplo 6.5. Considerando los datos del ejemplo 6.1, de las estaturas en centímetros de los estudiantes de alguna universidad. El interés se centra sobre la estatura promedio de los estudiantes, de manera específica, el interés recae en decir si la estatura promedio es o no de 165 centímetros, esto lo podemos expresar simbólicamente comoH 0 : μ=165 centímetros(H ¿¿0 :Laestatura promedio de los estudiantes esde165 centimentros)¿

H a : μ≠165 centímetros(H ¿¿a :Laestatura promedio de los estudiantes esdiferente de165 centimentros)¿

Page 19: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

La proposiciónH 0 : μ=165 centímetros, se conoce como Hipótesis nula, mientras que la proposición H a : μ≠165 centímetros, recibe el nombre de Hipótesis alternativa. En la hipótesis alternativa se especifican los valores de μ que pueden ser mayores o menores que 165 centímetros, también se conoce como Hipótesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una Hipótesis alternativa unilateral, como pudieran ser,

H 0 : μ=165 centimetros ; Ha : μ<165centimetros.ó

H 0 : μ=165 centimetros ; Ha : μ>165 centimetros.

De este modo, en forma general podemos decir que la Hipótesis nula, representada por H0, es la afirmación sobre una o más características de poblaciones que al inicio se supone cierta (es decir, una "creencia a priori"). La Hipótesis alternativa, representada por H a, es la afirmación contradictoria a H 0, y ésta es la hipótesis del investigador.

Es importante señalar que las hipótesis siempre son proposiciones sobre la población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parámetro de la población especificado en la hipótesis nula se determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del parámetro.

2. Puede obtenerse a partir de alguna teoría, modelo o diseño experimental, que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo.

3. Cuando el valor del parámetro proviene de consideraciones externas, tales como las especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación, el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones.

Page 20: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Los procedimientos de prueba de hipótesis dependen del empleo de la información contenida en la muestra aleatoria de la población de interés. Si esta información es consistente con la hipótesis, se concluye que ésta es verdadera; sin embargo si esta información es inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la población. Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión equivocada.

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que H 0 es falsa. Si la muestra no contradice decididamente a H 0, se continúa creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar H 0 o no rechazar H 0.

6.16 ERRORES DEL TIPO I Y TIPO II.

El procedimiento de contrastar la hipótesis nula contra la hipótesis alternativa con base de la información obtenida en una muestra aleatoria, puede llevar a cometer dos posibles errores, debido a fluctuaciones o variaciones del azar en el muestreo. Si la hipótesis nula es en realidad verdadera, pero los datos de la muestra aleatoria la contradicen entonces la hipótesis nula es rechazada y entonces se estará cometiendo el Error Tipo I. Por otro lado, si la hipótesis nula es falsa y los datos de la muestra conllevan a no rechazarla, se estará cometiendo el Error Tipo II. En otras palabras, El Error tipo I se define como el rechazo de la hipótesis nula H0 cuando esta es verdadera y el Error tipo II se define como la aceptación de la hipótesis nula H0

cuando esta es falsa. Por lo tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que determinan si la decisión final es correcta o errónea. Estas situaciones aparecen en la tabla 6.4

Page 21: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

DecisiónEventos No se rechaza H 0 Rechazar H 0

H 0 es Verdadera No hay error con probabilidad 1−α

Error Tipo Icon probabilidad α

H 0 es Falsa Error Tipo II con probabilidad β

No hay error (potencia)

Con probabilidad 1−β

Tabla 6.4 Situaciones que determinan si la decisión final fue correcta o errónea.

Algunas veces, la probabilidad del error tipo I recibe el nombre de nivel de significancia de la prueba y se denota con α y La probabilidad de cometer un error Tipo II se denota por . La probabilidad de no rechazar una hipótesis nula verdadera es la confianza 1−α, con la cual se trabajó para hacer estimaciones por intervalo. Cuando se rechaza una hipótesis nula falsa se ha tomado una decisión correcta y la probabilidad de hacerlo se denomina potencia o poder de la prueba y es denotada por 1 . En símbolos esto se expresa de la siguiente manera:

P(Error tipo I) = P(Rechazar H0H0 es verdadera) =

P(No rechazar H0H0 es verdadera) = 1 P(Error Tipo II)=P(No rechazar H0H0 es falsa) =

P(Rechazar H0H0 es falsa) = Potencia = 1

El nivel de significancia lo fija el investigador, y en la práctica se suelen usar valores de 0.01, 0.05 o el 0.1

En la figura 6.7 se ilustra las reglas de decisión y los tipos de error:

Page 22: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Figura 6.7 Reglas de decisión.

6.17 PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESISUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis

alternativa, H a, se debe realizar un procedimiento de comparación‚ por medio del cual se toma una decisión basada en la muestra aleatoria seleccionada de la población en estudio. Para llevar a cabo este procedimiento es necesario seleccionar el estadístico de prueba adecuado, calcularlo con base en la muestra y luego tomar la decisión de rechazar o no H0 con respecto a un nivel de significancia α . Se recomienda utilizar los siguientes pasos al aplicar la metodología de prueba de hipótesisLos pasos a seguir en una prueba de hipótesis son:

1. Identificar el parámetro de interés, el cual se deriva del problema.2. Formular las hipótesis nula H0 y la hipótesis alternativa Ha.3. Escoger un nivel de significancia .4. Seleccionar el estadístico de prueba adecuado a la distribución

muestral.5. Determinar la región crítica o de rechazo para el estadístico de

prueba.6. Calcular el estadístico de prueba.7. Tomar una decisión de rechazar H0 o no rechazarla.8. Dar una conclusión al problema.

Page 23: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

6.18 PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL Y VARIANZA CONOCIDA

CASO ISupongas que se desea probar la hipótesis

H 0 : μ=μ0H a : μ≠ μ0

Donde μ0 es un valor especifico. Sea x1, x2, x3 ,⋯ , xn una muestra aleatoria de tamaño n, y sea X la media

muestral con distribución normal con media μ y varianza σ 2 entonces el estadístico de prueba para la media esta en la expresión 6.13,

Z0=x−μ0

σ√n

(6.13)

Donde μ0 es el valor que supuesto en la hipótesis nula (H0 ).

REGLA DE DECISION

Si se ha planteado la hipótesis alternativa como, H a : μ≠ μ0, donde μ0 es un valor especifico, se tiene una prueba de hipótesis bilateral, es decir a dos colas, por lo tanto, el nivel de significancia α se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 6.8. En consecuencia, si H 0 : μ=μ0 es cierta, la probabilidad de que el estadístico

de prueba Z0 este entre −Z α2 y Z α

2 es 1−α. Los valores de −Zα /2 y Zα /2

pertenecen a una distribución Normal estándar. Nótese en la figura 6.8 que la

probabilidad del estadístico de prueba este en la región Z0>Z α2 o Z0←Z α

2

cuando H0 : μ=μ0 es verdadera, es α . En consecuencia, la hipótesis H 0 debe rechazarse si se cumple que

Z0>Z α2 o Z0←Z α

2

Page 24: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

De otra forma si el valor del estadístico de prueba Z0 está entre −Zα /2 y Zα /2 no se rechaza la hipótesis H0.

Figura 6.8 Distribución de Z0 cuando H 0 : μ=μ0 es verdadera, con región critica para H a : μ≠ μ0.

Ejemplo 6.6. Se esta estudiando el rendimiento de un proceso químico. De la experiencia, se sabe que la desviación estándar del rendimiento es de 3.2. En la tabla 6.5 están los resultados del rendimiento obtenidas los últimos 40 días en la planta de operación ¿Existe evidencia de que el rendimiento no es del 90%? Utilizar α=0.05.

86.74 83.81 85.33 86.3381.58 88.30 89.65 86.0487.68 85.00 81.76 86.8684.84 80.67 90.84 83.2691.88 81.84 83.75 82.9787.38 92.51 87.04 86.7487.32 88.22 89.33 90.3981.72 76.78 82.97 92.3289.66 86.18 88.31 88.4582.66 79.35 85.22 88.11

Tabla 6.5 Rendimiento de un proceso químico

Siguiendo los pasos de la prueba de hipótesis tenemos

1. El parámetro de interés es μ, el promedio del rendimiento de un proceso.2. La hipótesis nula es H 0 : μ=90

La hipótesis alternativa es H a : μ≠90

Page 25: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

3. El nivel de significancia es α=0.05

4. El estadístico de prueba es Z0=x−μ0

σ√n

5. Rechazar H0 si se cumple que Z0>Z α2 o Z0←Z α

2 , de la tabla I del

apéndice se tiene que Z0.025=1.96 y −Z0.025=−1.96 .6. Considerando que el promedio muestral x=85.99, n=40, σ=3.2 y μ0=90

el valor del estadístico de prueba es

Z0=85.99−903.2√40

Z0=−7.99

7. Dado que Z0←Z0.025 , como se ilustra en la figura 6.9, se rechazar la hipótesis H0.

8. Por lo tanto se concluye, con una confianza estadística del 95%, de que el promedio del rendimiento de un proceso químico no es de 90%.

Figura 6.9 Regla de decisión para una prueba de hipótesis a dos colas

CASO II

Si se ha planteado la hipótesis alternativa como: H a : μ>μ0, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia α en la

Page 26: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

parte superior de la distribución, como se aprecia en la figura 6.10, donde Zα pertenece a una distribución Normal estándar

Figura 6.10 Regla de decisión para una prueba de hipótesis a una cola superior

Si el valor del estadístico de prueba Z0 es mayor que Zα se rechaza la hipótesis nula, en caso contrario no se rechaza H 0 .

Ejemplo 6.7. Un proceso manufacturero usado por una fábrica durante los últimos años da una producción media de 100 unidades por hora con una desviación estándar de 8 unidades. Se acaba de introducir en el mercado una nueva máquina para realizar ese tipo de producto. Aunque es muy cara comparada con la que está ahora en uso, si la media de producción de la nueva máquina es de más de 150 unidades por hora, su adopción daría bastantes beneficios.

Para decidir si se debiera comprar la nueva máquina, a la gerencia de la fábrica se le permite hacer un ensayo durante 35 horas, hallándose un promedio de 160 unidades por hora. Con ésta información qué decisión se debe tomar si se asume un nivel de confianza del α=0.01 .

Siguiendo los pasos de la prueba de hipótesis tenemos

1. El parámetro de interés es μ, el promedio de producción de unidades.2. La hipótesis nula es H 0 : μ=150

La hipótesis alternativa es H a : μ>150

Page 27: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

3. El nivel de significancia es α=0.01

4. El estadístico de prueba es Z0=x−μ0

σ√n

5. Rechazar H0 si se cumple que Z0>Zα de la tabla I del apéndice se tiene que Z0.01=2.33

6. Considerando que el promedio muestral x=160, n=35, σ=8 y μ0=150 el valor del estadístico de prueba es

Z0=160−150

8√35

Z0=7.395

7. Dado que Z0>Z0.01 se rechazar la hipótesis H0.8. En consecuencia, como puede observarse en la figura 6.11, el valor

del estadístico de prueba está en la zona de rechazo de la hipótesis nula, por lo tanto, se acepta que la producción promedio por hora es superior a las 150 unidades y asumiendo un riesgo del 1%, se puede comprar la nueva máquina.

Figura 6.11 Regla de decisión para una prueba de hipótesis a una cola inferior

CASO III

Si se ha planteado la hipótesis alternativa como, H a : μ<k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia α en la parte

Page 28: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

inferior de la distribución, como se aprecia en la figura 6.12, Z∝ pertenece a una distribución Normal estándar.

Figura 6.12 Regla de decisión para una prueba de hipótesis a una cola inferior

Si el valor del estadístico de prueba Z0 es menor que Zα se rechaza la hipótesis nula, en caso contrario no se rechaza H 0 .

Ejemplo 6.8. Considerando los datos del ejemplo 6.6 con respecto al rendimiento de un proceso químico, plantearemos la hipótesis alternativa de que el rendimiento del proceso químico es menor que el 90%, es decir H a : μ<90

, utilizar α=0.05.

Siguiendo los pasos de la prueba de hipótesis tenemos

1. El parámetro de interés es μ, el promedio del rendimiento de un proceso químico.

2. La hipótesis nula es H 0 : μ=90

La hipótesis alternativa es H a : μ<90

3. El nivel de significancia es α=0.05

4. El estadístico de prueba es Z0=x−μ0

σ√n

5. Rechazar H0 si se cumple que Z0<Zα , de la tabla I del apéndice se tiene que Z0.05=1.96.

Page 29: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

6. Considerando que el promedio muestral x=85.99, n=40, σ=3.2 y

μ0=90 el valor del estadístico de prueba es Z0=85.99−903.2√40

Z0=−7.99

7. Dado que Z0<Z0.05 se rechazar la hipótesis H0.8. Por lo tanto se concluye, con una confianza estadística del 95%, de

que el promedio del rendimiento de un proceso químico no es de 90%, dado el resultado de la prueba se puede afirmar que el promedio del rendimiento es menor a 90%.

6.19 PRUEBA DE HIPÓTESIS SOBRE IGUALDAD DE DOS MEDIAS, VARIANZAS CONOCIDAS

En algunos problemas de investigación, se tiene el interés en comparar las medias de dos poblaciones distintas con muestras aleatorias independientes de tamaños n1 y n2. Por ejemplo, comparar el rendimiento de dos maquinas de ensamble, comparar una encuesta de opinión sobre que opinan lo hombres con respecto a que opinan las mujeres, la calidad de un producto de un proveedor con respecto a otro proveedor, etc.

Supóngase que se tienen dos poblaciones de interés, donde la primera tiene una media poblacional desconocida μ1 y varianza conocida σ 12 y la segunda tiene una media poblacional desconocida μ2 y varianza conocida σ 22. Supóngase que las dos poblaciones son normales, y sino se aplican las condiciones del teorema del limite central. Un planteamiento de las hipótesis para la diferencia de medias en dos poblaciones se puede ver en la tabla 6.6.

- Prueba de hipótesis a dos colas

H 0 : μ1=μ2óH 0 : μ1−μ2=k

H a : μ1≠ μ2óH a : μ1−μ2≠k

- Prueba de hipótesis a una cola superior

H 0 : μ1=μ2ó H0 : μ1−μ2=k

H a : μ1>μ2ó Ha: μ1−μ2>k

- Prueba de hipótesis a una cola inferior

H 0 : μ1=μ2ó H0 : μ1−μ2=k

H a : μ1<μ2ó Ha : μ1−μ2<kTabla 6.6 Diversas formas de plantear las hipótesis, donde k es un valor específico.

Page 30: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

El procedimiento de prueba se basa en la distribución de la diferencia de las medias muestrales X1−X2. En general, si la hipótesis nula H 0 : μ1=μ2 es verdadera, la distribución de X1−X2 es una distribución normal con media μ1−μ2 y

varianza σ12

n1+σ 22

n2, por lo tanto el estadístico de prueba, se puede ver en la

expresión 6.14

Z0=( x1−x2 )−(μ1−μ2 )

√ σ12

n1+σ22

n2

(6.14)

El estadístico Z0 tiene una distribución normal estándar. Por consiguiente si la hipótesis alternativa es definida como Ha : μ1≠ μ2, entonces es una prueba de hipótesis es bilateral, por consiguiente la hipótesis nula H 0 se rechaza si

Z0>Z α2 o Z0←Z α

2

Si la hipótesis alternativa es definida como H a : μ1>μ2, corresponde a una prueba de hipótesis unilateral a una cola superior, en consecuencia la hipótesis nula H 0 se rechaza si

Z0>Zα

Si la hipótesis alternativa es definida como H a : μ1<μ2, corresponde a una prueba de hipótesis unilateral a una cola inferior, en consecuencia la hipótesis nula H 0 se rechaza si

Z0<Zα.

Ejemplo 6.9 Un constructor está considerando dos lugares alternativos para construir un centro comercial. Como los ingresos de los hogares de la comunidad son una consideración importante en ésta selección, desea probar

Page 31: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

que el ingreso promedio de la primera comunidad excede al promedio de la segunda comunidad en cuando menos $1,500 diarios. Con la información de un censo realizado el año anterior se sabe que la desviación estándar del ingreso diario de la primera comunidad es de $1,800 y la desviación estándar de la segunda es de $2,400. Se toma una muestra aleatoria de 30 hogares de la primera comunidad, encuentra que el ingreso promedio es de $35,500 y con una muestra de 40 hogares de la segunda comunidad el ingreso promedio es de $34,600. Pruebe la hipótesis con un nivel de significancia α=0.05.

Solución: Se desea probar si la diferencia entre los ingresos de la comunidad 1 y la 2 es de $1,500 o más, por lo tanto:

H 0 : μ1−μ2=1,500

H a : μ1−μ2>1,500

El tamaño de las muestras es grande y las varianzas poblacionales son conocidas, por consiguiente la estadística de trabajo a utilizar es la expresión 6.14

n1=30x1=35,500σ 1=1,800n2=40x2=34,600σ 2=2,400α=0.05

Z0=( x1−x2 )−(μ1−μ2 )

√ σ12

n1+σ22

n2

=(35,500−34,600 )−(1,500)

√ 1,800230+ 2,400

2

40

=−1.195

Para un nivel de significancia α=0.05, en la tabla I de la distribución normal del apéndice se tiene un valor de Z0.05 es 1.96. Por consiguiente Z0<Z0.05 , lo que significa que no es posible rechazar la hipótesis nula, con lo que podemos por lo tanto, con una confiabilidad del 95%, la diferencia entre el ingreso promedio por hogar en las dos comunidades no es mayor a $1,500.

6.20 PRUEBA DE HIPÓTESIS SOBRE IGUALDAD DE DOS MEDIAS,

Page 32: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

VARIANZAS DESCONOCIDAS CON (n¿¿1≥30 y n2≥30)¿

Para la diferencia de dos medias si las muestras se obtienen de poblaciones con distribuciones normales, pero n1≥30 y n2≥30 y varianzas poblacionales desconocidas, el estadístico de prueba de la expresión 6.14 es modificado al sustituir las varianzas muestrales s12 y s22 por sus respectivas varianzas poblacionales σ 12 y σ 22, como se ilustra en la expresión 6.15

Z0=( x1−x2 )−(μ1−μ2 )

√ S12

n1+S22

n2

(6.15)

Las reglas de rechazo para la hipótesis nula, son las mismas que se describen en la sección 6.19.

Ejemplo 6.10 Una muestra de 80 alambres de acero producidos por la fábrica A presenta una resistencia promedio a la ruptura de 1,230 lbs. Con una desviación estándar de 120 lbs. Una muestra de 100 alambres de acero producidos por la fábrica B presenta una resistencia promedio a la ruptura de 1,110 lbs. Con una desviación estándar de 90 lbs. Con base en ésta información pruebe si la resistencia promedio a la rotura de los alambres de acero de la marca A es significativamente mayor que la de los alambres de acero de la marca B. Utilizar un nivel de significancia de α=0.01.

Solución Las hipótesis a probar son

H 0 : μA=μB

H a : μA>μB

El tamaño de las muestras es grande, las varianzas poblacionales son desconocidas, y asumiendo que las medias poblacionales son iguales y sustituyendo x A=1,230,sA=120, xB=1,190, sB=90, nB=100 y nA=80 en el

Page 33: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

estadístico de prueba de la expresión 6.15, se tiene

Z0=( x1−x2 )−(μ1−μ2 )

√ s12

n1+

s22

n2

=(1,230−1,190 )−(0)

√ 120280+ 90

2

100

=2.476

Para un nivel de significancia α=0.01, en la tabla de la distribución normal el valor de Z0.05 es 2.33. Se tiene que Z0>Z0.05, como se aprecia en la figura 6.13, El estadístico de prueba Z0 está en la zona de rechazo de la hipótesis nula, por consiguiente, con una confiabilidad del 99% se acepta que la resistencia promedio de los alambres de la marca A es significativamente mayor que la resistencia promedio de los alambres de la marca B.

Figura 6.13 Regla de decisión para una prueba de hipótesis a una cola superior

6.21 PRUEBAS DE HIPÓTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA (n≤30).

Cuando se prueban hipótesis sobre la media μ de una población normal cuando σ 2 es desconocida, es posible aplicar los procedimientos de la sección 6.18, al sustituir la desviación estándar muestral S por la desviación estándar poblacional σ , siempre y cuando el tamaño de muestra sea grande, es decir n≥30. Sin embargo, cuando la muestra es pequeña, digamos n≤30, y σ 2 es desconocida se requiere de otra distribución de muestreo.

Page 34: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Sea x1 , x2 , x3 ,⋯ , xn una muestra aleatoria de tamaño n, y sea X y S la media y desviación estándar muestral, respectivamente, se desea probar la hipótesis alternativa bilateral

H 0 : μ=μ0H a : μ≠ μ0

Donde μ0 es un valor especifico.

El estadístico de prueba es

t 0=x−μ0

S√n

(6.16)

El estadístico t 0 tiene una distribución t con n-1 grados de libertad, si la hipótesis nula H 0 : μ=μ0, es verdadera, para una hipótesis alternativa bilateral H a : μ≠ μ0, la hipótesis nula H0 se rechaza si

t 0>t α2, n−1 o t 0← t α

2,n−1

donde t α2

,n−1 y −t α2

,n−1 son los puntos superior e inferior, respectivamente, de la

distribución t con n-1 grados de libertad.

Si la hipótesis alternativa unilateral superior H a : μ>μ0 , se calcula el estadístico de prueba t 0 de la expresión 6.16, la hipótesis nula H 0, se rechaza si

t 0>t α, n−1

y por lo contrario no se rechaza H 0.

Para una hipótesis alternativa unilateral inferior H a : μ<μ0, se calcula el estadístico de prueba t 0 de la expresión 6.16, la hipótesis nula H 0, se rechaza si

Page 35: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

t 0← tα , n−1

y por lo contrario no se rechaza H 0.

Ejemplo 6.11 En su calidad de comprador comercial para un supermercado, se toma una muestra aleatoria de 12 sobres de café de una empacadora. Se encuentra que el peso promedio muestral del contenido de café de cada sobre es 15.97 grs. con una desviación estándar de 0.15. La compañía empacadora afirma que el peso promedio mínimo del café es de 16 grs. por sobre. ¿Puede aceptarse ésta afirmación si se asume un nivel de confianza del 90%?

Solución. Se desea probar si el peso mínimo es de 16 grs., es decir mayor o igual a 16 grs., así que las hipótesis adecuadas son:

H 0 : μ=16

H a : μ>16

Teniendo en cuenta que el tamaño de la muestra es pequeño n=12, la media muestra es x=15.97 y su desviación estándar muestral es S=0.15, el calculo del estadístico de prueba

t 0=x−μ0

S√n

=15.97−160.15√12

=−0.697

Como lo indica la hipótesis alternativa, se trabaja a una cola superior y para α=0.10 en la tabla II, de la distribución t del apéndice, con 11 grados de libertad el valor de t 0.10,11 es 1.363. Por consiguiente t 0<t0.10,11, y en consecuencia no se puede rechazar la hipótesis nula y se puede concluir que la compañía de café tiene la razón de que el peso promedio mínimo de los sobres de café es de 16 grs.

6.22 PRUEBAS DE HIPÓTESIS SOBRE LAS MEDIAS DE DOS DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS

Page 36: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Supóngase que se tienen dos poblaciones de interés, donde la primera tiene una media poblacional desconocida μ1 y varianza desconocida σ 12 y la segunda tiene una media poblacional desconocida μ2 y varianza desconocida σ 22

. Supóngase que las dos poblaciones son normales. Un planteamiento de las hipótesis para la diferencia de medias en dos poblaciones se puede ver en la tabla 6.6. Para probar las hipótesis que se plantean en la tabla 6.6 se usara el estadístico de prueba t. Pero para esto, es necesario considerar dos situaciones diferentes. En el primer caso, se supondrá que las varianzas de las dos distribuciones normales son desconocidas pero iguales, esto es σ 12=σ2

2=σ2 y en un segundo caso, se supondrá que σ 12≠σ2

2 y desconocidas.

Caso I σ 12=σ22

Sea x11 , x12 , x13 ,⋯ , x1n1 una muestra aleatoria de n1 observaciones tomadas de la primera población y sea x21 , x22 , x23 ,⋯ , x2n2 una muestra aleatoria de n2 observaciones de la segunda población. Sean X1 , X2 , S1

2 , S22 las medias

muestrales y varianzas muestrales, respectivamente. Supongamos que S12 y S22

son estimaciones de la varianza común σ 2, en consecuencia ambas varianzas muestrales pueden combinarse para formar un solo estimador, como se ilustra en la expresión

Sp2=

(n1−1 )S12+ (n2−1 ) S22

n1+n2−2

(6.17)

Por lo tanto el estadístico de prueba para la comparación de dos medias es

t 0=x1−x2

S p√ 1n1+ 1n2(6.18)

Donde Sp es,

Sp=√ (n1−1 )S12+(n2−1 )S22

n1+n2−2

(6.19)

Page 37: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Si H 0 : μ1=μ2es verdadera t 0 tiene una distribución t n1+n2−2.

Si la hipótesis alternativa es bilateral H a : μ1≠ μ2, entonces si

t 0>t α2, n1+n2−2 o t 0← t α

2,n1+n2−2

se debe rechazar la hipótesis nula H 0 : μ1=μ2.

Si la hipótesis alternativa es unilateral superior H a : μ1>μ2, entonces si

t 0>t α2, n1+n2−2

se debe rechazar la hipótesis nula H 0 : μ1=μ2.

Si la hipótesis alternativa es unilateral inferior H a : μ1<μ2, entonces si

t 0← t α2,n1+n2−2

se debe rechazar la hipótesis nula H 0 : μ1=μ2.

Ejemplo 6.12

Caso II σ 12≠σ22

En algunos casos no es recomendable suponer que la varianzas desconocidas σ 12 y σ2

2 sean iguales. En tal situación, no existe un estadístico t exacto para probar la hipótesis nula H 0 : μ1=μ2. Pero el estadístico

Page 38: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

t 0¿=

x1−x2

√ S12

n1+

S22

n2

(6.20)

tiene una distribución que es aproximadamente una distribución t con v grados libertad, donde v esta dado por

v=( S1

2

n1+

S22

n2 )2

( S12

n1 )2

n1+1+( S2

2

n2 )2

n2+1

- 2

(6.21)

El procedimiento de prueba de hipótesis es el mismo, que en caso I, solo que ahora los grados de libertad están determinados por la expresión 6.21.

Ejemplo 6.13

6.23 PRUEBA DE HIPÓTESIS PARA PARA UNA PROPORCION

En muchos problemas que surgen en la práctica tienen una variable aleatoria que sigue una distribución binomial, por ejemplo, la proporción de productos defectuosos, la proporción de personas que están de acuerdo con una nueva política en la empresa, la proporción de personas que presentan cierto síntoma de enfermedad, etc. En este caso el parámetro de interés es p, por consiguiente las hipótesis para considerar en la prueba están en la tabla 6.7

- Prueba de hipótesis a dos colas

H 0 : p=p0

H a : p≠ p0

- Prueba de hipótesis a una cola superior

H 0 : p=p0

H a : p> p0

- Prueba de hipótesis a una cola inferior

H 0 : p=p0

H a : p< p0Tabla 6.7 Hipótesis a considera en la prueba, donde p0 es un valor especifico

Page 39: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Si la hipótesis nula H 0 : p=p0 es verdadera, el estadístico de prueba es

Z0=p−p0

√ p(1−p)n

(6.22)

Para una hipótesis alternativa bilateral H a : p≠ p0, la hipótesis nula H 0 : p=p0 se rechazará si

Z0>Z α2 o Z0←Z α

2

Para una hipótesis alternativa unilateral superior H a : p> p0 , la hipótesis nula H 0 : p=p0 se rechazará si

Z0>Zα

Para una hipótesis alternativa unilateral inferior H a : p< p0 , la hipótesis nula H 0 : p=p0 se rechazará si

Z0←Zα

Es importante señalar que el estadístico de prueba es valido siempre y cuando no sea muy próximo a 1 o a cero, y si el tamaño de muestra es relativamente grande, digamos n≥30.

Ejemplo 6.14 Un fabricante afirma que por lo menos el 90% de las piezas de una maquinaria que se fabrican en una empresa cumplen con las especificaciones del producto. Una inspección de 200 de esas piezas reveló que 160 de ellas cumplían con las especificaciones. Pruebe si lo que afirma el fabricante es cierto. Utilizar α=0.05.

Solución:

Page 40: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

H 0 : p=0.9

H a :P<0.9

Para realizar una prueba de hipótesis para la proporción se utiliza la expresión 6.22

n=200 p=160200

=0.81−p=0.2α=0.05

Z0=p−p0

√ p(1−p)n

= 0.8−0.9

√ (0.8 )(0.2)200

=−3.536

Para α=0.05 y de la tabla I de la distribución normal estándar del apéndice el valor de −Zα=−1.64, de este modo Z0<−Zα, por consecuencia El valor del estadístico de prueba se encuentra en la zona de rechazo, como se puede observar en la figura 6.14, por consiguiente, con una confiabilidad del 95% se concluye que la afirmación del fabricante no es cierta.

Figura 6.14 Regla de decisión para una prueba de hipótesis a una cola inferior

6.24 PRUEBA DE HIPÓTESIS PARA UNA VARIANZA

Page 41: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Supóngase que se quiere probar la hipótesis de que la varianza de una población normal σ 2 es igual un valor específico, digamos, σ 02. Para probar

H 0 :σ2=σ0

2

H a :σ2≠σ0

2

Se utiliza el estadístico de prueba

χ02=

(n−1 ) s2

σ02

(6.23)

donde s2 es la varianza muestral. Si la hipótesis nula H 0 :σ

2=σ02 es verdadera, entonces el estadístico χ02 se

distribuye ji-cuadrada con n-1 grados de libertad.Si se plantea como hipótesis alternativa H a :σ

2≠σ02, entonces se trata una

prueba de hipótesis bilateral. Por consiguiente, la hipótesis nula H 0 :σ2=σ0

2, será rechazada si se cumple que

χ02> χ α

2 , n−1

2 o χ0

2< χ1−α2 , n−1

2

donde χ α2 , n−1

2 y χ1−α

2 ,n−1

2 son los puntos que corresponden a los porcentajes

100α /2 inferior y superior, respectivamente, de la distribución ji-cuadrada con n-1 grados de libertad.

Si se plantea como hipótesis alternativa H a :σ2>σ 0

2, entonces se trata una prueba de hipótesis unilateral superior. Por consiguiente, la hipótesis nula H 0 :σ

2=σ02, será rechazada si se cumple que

Page 42: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

χ02> χ α, n−1

2

Si se plantea como hipótesis alternativa H a :σ2<σ 0

2, entonces se trata una prueba de hipótesis unilateral inferior. Por consiguiente, la hipótesis nula H 0 :σ

2=σ02, será rechazada si se cumple que

χ02< χ 1−α, n−1

2

Ejemplo 6.15 Se afirma que un pieza para un semiconductor es producido por una compañía, tiene una varianza del diámetro no mayor que 0.0002 pulgadas. Una muestra aleatoria de 10 piezas arrojó una varianza muestral de 0.0003, pruébese que la varianza del diámetro de la pieza es mayor que 0.0002, utilícese α=0.05. Solución. Las hipótesis a probar son

H 0 :σ2=0.0002

H a :σ2>0.0002

Es una prueba de hipótesis unilateral superior. Supongamos que las mediciones de los diámetros tienen una distribución normal, por consiguiente el valor del estadístico de prueba es

χ02=

(n−1 ) s2

σ02 =

(9 )(0.0003)0.0002

=13.5

Para un α=0.05 y de la tabla III de los valores de la distribución ji-cuadrada, se tiene que χ0.05 , 92 =16.919. Por consiguiente se tiene que χ02< χ α, n−1

2 , por lo tanto no es posible rechazar H 0 :σ

2=0.0002, lo que significa que no hay suficiente evidencia para afirmar que σ 2 sea mayor que 0.0002.

6.25 DISTRIBUCION MUESTRAL F DE SNEDECOR

Page 43: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Si S12 y S22 son las varianzas de muestras aleatorias independientes de

tamaño n1 y n2, respectivamente, tomadas de dos poblaciones normales que tienen la misma varianza, entonces

F0=S12

S22

(6.24)

Es un valor de una variable aleatoria que tiene distribución F con parámetros v1=n1−1 y v2=n2−1.

En la figura 6.15 se puede ver la grafica de esta distribución. La distribución F se usa en situaciones de dos muestras para realizar inferencias sobre la población. Sin embargo, la distribución F se aplica a muchos otros tipos de problemas en los cuales están relacionadas las varianzas muestrales. De hecho la distribución F se llama distribución de razón de varianzas.

Fig. 6.15. Distribución F .

6.26 COMPARACION DE DOS VARIANZAS POBLACIONALES

Las características son:

Page 44: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

Continua, es decir valores infinitos. Positivamente sesgada (derecha). Asintótica (aumenta x pero no toca el eje) Existe una familia de distribuciones F (grados de libertad)

Pasos para comparar dos varianzas poblacionales

1. Hipótesis nula vs hipótesis alternativa:

H 0 :σ12=σ2

2H a: σ12≠σ2

2

H 0 :σ12=σ2

2H a: σ12>σ2

2

H 0 :σ12=σ2

2H a: σ12<σ2

2

2. Nivel de confianza α :Probabilidad de rechazar la hipótesis nula.usualmente 0.05 y 0.01

3. Grados de Libertad y Valor Crítico (n−1 ).Según los grados de libertad se ubica el valor crítico en la tabla F.

4. Se extrae el valor de prueba: F=S12

S22 el valor resultante se compara con

el valor crítico (F ), si es mayor se rechaza la hipótesis nula.

Ejemplo 6.16 Una compañía produce piezas maquinadas para motor que se supone tienen una varianza en diámetro no mayor que 0.0002 pulgadas. Una muestra aleatoria de n=10 piezas dio s12=0.0003 pulgadas. Suponga que deseamos comparar la variación en los diámetros de las piezas producidas por la empresa, con la variación en los diámetros de las piezas producidas por un competidor donde para n=20 piezas la s22=0.0001 ¿los datos proporcionan suficiente información para indicar una variación mas pequeña en diámetros para el competidor? Prueba usando α=0.05.

Solución: Estamos probando

H 0 :σ12=σ2

2 vs Ha :σ 12>σ2

2

Page 45: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

El estadístico de prueba, F=S12

S22 esta basado en v1=9gl en el numerador

y v2=19gl en el denominador y F0.05=2.42 (véase la tabla IV del apéndice) como el valor observado del estadístico de prueba es

F=S12

S22=0.00030.0001

=3

Vemos que F>F0.05, por tanto, en el nivel α=0.05, rechazamos H0 :σ12=σ2

2 a favor de H a :σ1

2>σ 22 y concluimos que la compañía competidora produce piezas

con menor variación en sus diámetros.

Ejercicios unidad 6

1. Una muestra aleatoria de 100 muertos registrado en México el año pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor de 70 años? Use α=0.05

µ=71.8 S=8.9 n=100 x =70

2. Buscando conocer los efectos entre hombres y mujeres de una gran compañía publicitaria contra el uso del tabaco, se ha observado a 90 hombres y 90 mujeres fumadores elegidos al azar para ver si hay diferencia en la disminución de cigarros consumidos diariamente; los resultados son: los hombres x1=5 .6 cigarros menos y una desviación estándar S1=3 .5 , y las mujeres x2=7.2cigarros menos con S2=2 .9 ¿Qué nos permite inferir estos resultados? Use α=0.05

3. En el pasado, 15% de la propaganda por correo para donativos dio como resultado contribuciones. Se mando una nueva carta a una muestra de 200 personas y 45 enviaron un donativo. Para α=0.05 ¿Se puede concluir que la nueva carta fue más efectiva? p=0.45 n=200 H0 : p=0 . 45

Page 46: adidex.comadidex.com/files/inferencia-estadistica.docx · Web viewUna vez que se han formulado las hipótesis nula, H 0 y la hipótesis alternativa, H a , se debe realizar un procedimiento

4. Un periodista publicó una nota en la que sostiene que 35 de cada 100 taxistas en la ciudad son personas que por lo menos han empezado una carrera profesional ¿Se confirma este porcentaje si en una muestra aleatoria de 90 taxistas, 38 de ellos expresaron haber iniciado al menos una carrera profesional? Use α=0.05 p1=0 .35 n1=100 p2=0 .42 n2=90

5. El proceso de bruñido se usa para esmerilar ciertos discos de silicio al grueso apropiado es aceptable sólo si σ ≤ 0.5 mm. Emplear el nivel de significancia de α=0.05 para probar la H0 : σ=0 .5 Ha : σ > 0.5 si el grosor de 15 cubitos cortados de tales discos tienen una desviación estándar de 0.64 mm. S=0 .64 n=15

6. Al analizar el mercado de comportamiento interno de un país, los responsables de la economía nacional han formulado la siguiente hipótesis de trabajo: “El índice de variación de los precios de los alimentos básicos en las zonas de alto nivel de vida es el mismo que el de las zonas de bajo nivel de vida”. Para contrastarla, se hizo un estudio en un sector, muy representativo, del respectivo nivel de vida de cada zona; o sea que se extrajeron al azar dos muestras de tamaño n1=n2=60 . Con cada muestra se obtuvieron los precios de uno de los principales alimentos básicos; registrándose las desviaciones estándar muéstrales S1=1.75 S2=2 .07 . Pruebe la hipótesis con un 98% de confianza.