6

Click here to load reader

Semana 3 1_

Embed Size (px)

Citation preview

Page 1: Semana 3 1_

Enith Cecilia Niebles Lara Especialista educación Matemática Ingeniera Civil Curso para hacer clase Estadística Inferencial Basada en recopilación Bibliográfica indicada

1

SEMANA 3

3. Estimación por Intervalos de Confianza

3.1 Tamaño de la Muestra

Cuando se requiere saber el tamaño de la muestra para asegurar que el error al

estimar sea menor que una cantidad determinada e.

De acuerdo a lo trabajado en semana anterior debemos elegir n de modo que

z

√ = e, Al resolver esta ecuación se obtiene para n:

n= (z

σ/ e)2 Sólo si se conoce la σ de la que seleccionamos la muestra.

Nota:

Cuando se resuelve para el tamaño de la muestra n, todos los valores fraccionales

se redondean al siguiente número entero.

En caso de no conocer σ, se puede tomar una muestra preliminar de tamaño

n≥ 30 que proporcione una estimación de σ, luego con el uso de s se puede

determinar aproximadamente cuantas observaciones se necesitan para

proporcionar el grado de precisión que se desea.

Ejemplo:

¿Qué tan grande se requiere una muestra del ejemplo anterior, si queremos tener

un 95% de confianza de que nuestra estimación de µ difiera por menos de 0.05?

Solución:

La desviación estándar poblacional es σ = 0.3; aplicando la fórmula se tiene que

n= ( (1.96)(0.3)/0.05 )2 = 138.3. Concluimos que se puede tener una confianza

de 95% de que una muestra aleatoria de tamaño n = 139 proporcionará una

estimación que difiere de µ en una cantidad menor que 0.05

Page 2: Semana 3 1_

Enith Cecilia Niebles Lara Especialista educación Matemática Ingeniera Civil Curso para hacer clase Estadística Inferencial Basada en recopilación Bibliográfica indicada

2

3.2 Estimación de la Media Poblacional con una Muestra, con varianza

desconocida

Cuando se requiere estimar una población y no se conoce la varianza, si la

muestra aleatoria proviene de una distribución normal, entonces la variable

aleatoria tiene una distribución t de Student con n-1 grados de libertad.

T = ( - µ) ∕ (

√ ) Donde: s = es la desviación estándar de la muestra, en

esta situación en que se desconoce σ, se puede utilizar T para construir un

intervalo de confianza de µ.

El procedimiento es el mismo anterior, sólo que excepto que se reemplaza

σ por s y la distribución normal estándar se reemplaza por la distribución T de

Student.

Entonces

1-

- t

0 t

t

P ( - t

< T < t

) = 1-

Donde t

es el valor t con n-1 grados de libertad, vemos en la gráfica un área ambos

lados del eje

, debido a su simetría.

Page 3: Semana 3 1_

Enith Cecilia Niebles Lara Especialista educación Matemática Ingeniera Civil Curso para hacer clase Estadística Inferencial Basada en recopilación Bibliográfica indicada

3

Ahora, si y s son la media y la desviación estándar de una muestra aleatoria de una población normal con varianza σ2 desconocida, un

intervalo de confianza de (1- ) 100% para µ es1:

- t

√ < < + t

Donde t es el valor t con v = n-1 grados de libertad, que deja un área de

a la derecha.

Nota: El uso de la distribución t, se basa en la premisa de que el muestreo se realiza de una distribución normal. Con mucha frecuencia los estadísticos recomiendan que aunque la normalidad no se pueda suponer, con σ desconocida y n≥ 30, S, pueda remplazar a σ y se puede utilizar el intervalo de confianza:

- z

√ < < + z

“Por lo general este intervalo se le llama “intervalo de confianza de muestra grande”, se justifica porque n≥ 30, S estará muy cerca de σ real y de ésta forma el teorema del límite central sigue valiendo, se recuerda que esto es sólo una aproximación y que la calidad de este enfoque mejora a medida que el tamaño de la muestra crece. Ejemplo2: El contenido de 7 contenedores similares de ácido sulfúrico son 9.8, 10.2, 9.8, 10.4, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los contenedores, si se supone una distribución aproximadamente normal”.

1 Algunos apartes fueron tomados de http://tesisdeinvestig.blogspot.com/2011/05/teoria-de-pequenas-

muestras-o-teoria.html 2 Algunos apartes fueron tomados de

http://www.itch.edu.mx/academic/industrial/estadistica1/cap03.html#tres_intervalo_media_var_desconocida

Page 4: Semana 3 1_

Enith Cecilia Niebles Lara Especialista educación Matemática Ingeniera Civil Curso para hacer clase Estadística Inferencial Basada en recopilación Bibliográfica indicada

4

Solución: La media muestral y la desviación estándar para los datos son

= ∑ xi ∕n = 10.0 litros (Xi- )2 ∕ n-1 0.283 litros

Ahora, (1 – )= 95%; es decir, (1 – )= 0.95

De donde = 0.05 y

= 0.025 ahora buscamos en las tablas A4 1 y

A42, t 0.025, ver anexos.

Encontramos t 0.025 = 2.447, para v= 6 grados de libertad.

Por tanto el intervalo de confianza de 95% para µ es:

- t

√ < < + t

√ Reemplazando,

– t

√ < < + t

√ ,

Seguimos reemplazando,

– (2.447)

√ < < + (2.447)

De donde: 9.74 < < 10.26

Se puede afirmar con una confianza del 95% de que el contenido medio con ácido

sulfúrico en los contenedores esta entre 9.74 y 10.26 litros

(Solucionar Taller 3 estimación de la media).

Page 5: Semana 3 1_

Enith Cecilia Niebles Lara Especialista educación Matemática Ingeniera Civil Curso para hacer clase Estadística Inferencial Basada en recopilación Bibliográfica indicada

5

3.3 Estimación de la Diferencia entre dos Medias Poblacionales (Con dos

Muestras) y Varianzas conocidas

Si tenemos dos poblaciones con medias µ1 y µ2 y varianzas σ1 y σ2

respectivamente, un estimador puntual de la diferencia entre µ1 y µ2 está

dado por la estadística 1 - 2).

Para obtener una estimación de (µ1 - µ2), seleccionamos dos muestras

aleatorias independientes, una de cada población, de tamaño n1 y n2, y

calculamos la diferencia 1 - 2) de las medias muestrales y podemos esperar

que esté distribuida en forma aproximadamente normal.

Entonces un intervalo de confianza (1- ) 100% para (µ1 - µ2); con σ1 y σ2

conocida, esta dado por:

( - ) - Z

< ( µ1 - µ2 )< ( - ) + Z

Donde z

es el valor de Z que deja un área de

a la derecha.

El grado de confianza es exacto cuando las muestras se seleccionan de

poblaciones normales.

Ejemplo:

Se lleva a cabo un experimento en que se comparan dos tipos de motores A y B.

se miden el rendimiento en millas por galón de gasolina. Se realizan 50

experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se

utiliza y las demás condiciones se mantienen constantes.

Page 6: Semana 3 1_

Enith Cecilia Niebles Lara Especialista educación Matemática Ingeniera Civil Curso para hacer clase Estadística Inferencial Basada en recopilación Bibliográfica indicada

6

El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el

promedio para el motor B es 42 millas por galón, Encuentre un intervalo de

confianza de 96% sobre ( µB - µA ), donde µB y µA son el rendimiento de gasolina

medio poblacional para los motores A y B , respectivamente. Suponga que las

desviaciones estándar poblacionales son seis y ocho para los motores A y B,

respectivamente.

Solución:

La estimación puntual de µB - µA es - = 42 – 36 = 6

(1 – )= 96%; es decir, (1 – )= 0.96

De donde = 0.04 y

= 0.02 ahora buscamos en las tablas A3 1 y A32,

Z 0.02, ver anexos.

Encontramos que Z 0.02 = 2.05.

Reemplazamos en la fórmula para encontrar el intervalo de confianza del 96% y

obtenemos:

( - ) – Z √

< ( µB - µA ) < ( - ) + Z √

Es decir: 3.43 < ( µB - µA ) < 8.57

Si las varianzas no se conocen y las dos distribuciones relacionadas son

aproximadamente normales, aplicamos la distribución t. Ahora si no se está

dispuesto a suponer que son normales (usando muestras mayores que 30),

entonces se permite el uso de S1 y S2 en lugar de σ1 y S2 respectivamente, con

la explicación de que S1 σ1 y S2 S2… Por supuesto el intervalo en este caso es

aproximado.

(solucionar Taller 3 estimación de la diferencia de medias).