DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
CONTENIDO
1. Introducción
2. Teorema del límite central
3. Aplicación de las distribuciones muestrales
4. Distribuciones muestrales Chi 2, t y F
Página 2 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
DISTRIBUCIONES MUESTRALES
1. Introducción
A las distribuciones de los estadísticas muestrales se les llama
distribuciones muestrales.
ESTADÍSTICA INFERENCIAL: La estadística inferencial involucra el uso
de un estadístico para sacar una conclusión o inferencia sobre el
parámetro correspondiente de la población
Por ejemplo se usa:
media de muestra para estimar la media poblacional
desv. Est. De muestra para estimar la desv. Est. poblacional
p proporción en la muestra para estimar la proporción poblacional
ERROR DE MUESTREO: es la diferencia entre el parámetro poblacional
y el estadístico de la muestra utilizado para estimar el parámetro.
Por ejemplo la diferencia entre:
y y p y
Página 3 de 22
PoblaciónCon N elementos
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
DISTRIBUCIÓN MUESTRAL: es un conjunto de todos los valores posibles
para un estadístico y la probabilidad relacionada con cada valor.
150 1/6
200 1/6
250 2/6
300 1/6
350 1/6 Tomando K=6 muestras de
1.0 tamaño n cada una
MEDIA DE LAS MEDIAS MUESTRALES o GRAN MEDIA o MEDIA DE
MEDIAS:
VARIANZA DE LA DISTRIBUCIÓN MUÉSTRAL DE LAS MEDIAS
MUESTRALES
Del ejemplo anterior:
ERROR ESTÁNDAR DE LA DISTRIBUCIÓN MUESTRAL DE LAS MEDIAS
MUESTRALES
Página 4 de 22
Xmedia 1Desv.est.1
Xmedia KDesv.est.K
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
En el caso anterior vale 64.55
Si el muestreo se realiza sin reemplazo y si el tamaño de muestra es
más del 5% de la población (n > 0.05N) debe aplicarse el factor de
corrección para poblaciones finitas (FPC) al error estándar.
2. TEOREMA DEL LÍMITE CENTRAL
La distribución de las medias de las muestras tiende a la normalidad
independientemente de la forma de la distribución poblacional de la
que sean obtenidas. Es la base de las cartas de control X-R.
F(X)
Distribución de las medias
muestrales
Distribución de valores individuales
Distribución muestral de la media
Página 5 de 22
XXs n
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
A medida que n se vuelve más grande, la distribución de las medias
muestrales se aproximará a una distribución normal con una media
Si es una muestra aleatoria de una Poblacion (X) con
distribución normal .Entonces se
distribuye normalmente con media y varianza
Por ejemplo, para los siguientes datos de la población:
DATOS DE LA POBLACIÓN PARA MOSTRAR EL TEOREMA DEL
LÍMITE CENTRAL PROMEDIO
2 7 5 5 2 4.21 7 7 9 4 5.65 8 1 1 5 4.07 1 4 1 4 3.47 6 9 8 5 7.01 6 4 7 9 5.47 3 1 7 3 4.26 7 9 4 3 5.89 7 7 6 1 6.08 3 4 4 7 5.25 3 3 4 2 3.45 9 9 1 9 6.65 5 3 9 5 5.43 1 9 1 5 3.84 3 9 5 5 5.29 1 7 7 8 6.42 1 7 8 6 4.87 7 9 8 3 6.83 4 5 6 8 5.24 8 3 4 5 4.85 3 2 2 6 3.68 1 5 5 9 5.67 5 9 6 8 7.02 2 7 2 1 2.8
Página 6 de 22
nXXX ,...,, 21
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
3 1 4 1 7 3.29 3 2 3 8 5.06 2 7 4 4 4.65 2 6 8 6 5.49 6 2 9 4 6.02 6 3 5 5 4.29 2 2 3 6 4.42 6 6 8 3 5.05 4 2 1 9 4.24 2 9 4 2 4.28 1 2 1 4 3.23 2 8 5 4 4.45 8 9 6 2 6.07 9 3 8 5 6.45 6 8 7 5 6.29 6 4 8 7 6.87 9 9 8 3 7.25 5 1 4 6 4.28 4 7 8 7 6.88 7 7 1 8 6.25 5 1 7 5 4.67 7 2 9 8 6.69 5 2 5 9 6.02 5 3 5 8 4.64 5 8 4 2 4.69 2 6 6 1 4.81 7 7 3 4 4.47 7 2 8 7 6.28 1 1 7 6 4.62 2 1 4 9 3.69 4 3 7 3 5.27 8 4 3 2 4.81 2 9 3 8 4.62 4 6 2 8 4.42 9 3 3 1 3.62 6 7 8 7 6.0
Página 7 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
El histograma de los datos de la población, es el siguiente:
8642
40
30
20
10
0
Poblacion
Frequency
Histogram of Poblacion
Al hacer una prueba de normalidad de Anderson Darling en los datos
se tiene:
151050-5
99.9
99
95
90
80706050403020
10
5
1
0.1
Poblacion
Perc
ent
Mean 5.073StDev 2.584N 300AD 5.965P-Value <0.005
Probability Plot of PoblacionNormal
Como el P value es menor a 0.05 los datos no siguen una distribución
normal.
Página 8 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
El histograma de los promedios muestrales (subgrupos de 5 datos) se
muestra a continuación:
Al hacer una prueba de normalidad de Anderson Darling se tiene:
987654321
99.9
99
95
90
80706050403020
10
5
1
0.1
Muestra
Perc
ent
Mean 5.073StDev 1.118N 60AD 0.527P-Value 0.172
Probability Plot of MuestraNormal
Como el P value es mayor a 0.05 incluso mayor a 0.10, las medias
siguen una distribución normal.
La sigma de la población estimada con la media de la muestra es:
Página 9 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
S pob. 2.5840 Raiz(n) Spob est.Sn=5 1.1181 2.2361 2.5001243
Tomando un tamaño de subgrupo de n = 10 se tiene:
PROM. N=10
4.9 4.73.7 4.26.2 3.85.0 6.25.6 6.55.0 5.74.6 6.55.8 5.65.8 5.35.0 4.74.6 5.34.9 4.14.1 5.05.0 4.55.1 4.8
6.56.05.55.04.54.03.5
9
8
7
6
5
4
3
2
1
0
PROM. N=10
Frequency
Histogram of PROM. N=10
Por lo que con un tamaño de muestra de n = 5 es suficiente para
mostrar normalidad.
3. APLICACIÓN DE LAS DISTRIBUCIONES MUESTRALES
Página 10 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
Muchas decisiones en los negocios dependen de una muestra
completa no tanto de una observación, por tanto se trabaja con la
distribución muestral de las medias o de las proporciones, para el caso
de las medias se tiene:
Con este valor se determina P(Z <= z)
Donde n es el tamaño de la muestra y si no se conoce sigma, se
estima con el valor de S. Ejemplos páginas 153 – 156.
Ejemplo:
Una empresa de constestación de llamadas telefónicas, está
interesada en conocer la probabilidad de que la media de n llamadas
dure un cierto periodo de tiempo, no le interesa una llamada
individual, ya que no le permitiría determinar la cantidad de personas
que requiere:
Las llamadas durante un mes promediaron 150 seg. Con una
desviación estándar de 15 seg.
a. ¿Cuál es la probabilidad de que una llamada en particular dure entre
150 y 155 segundos?
;
En tablas P(Z <= 0.33) = 0.6293 ; P(Z<=0) = 0.500
Por tanto P( 0 <= Z <= 0.33) = 0.1293 o 12.93%
Página 11 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
Por tanto la probabilidad de que una llamada dure entre 150 y 155
segundos es del 12.93%.
b. ¿Cuál es la probabilidad de que la media de n=50 llamadas esté
entre 150 y 155 segundos?
Ahora se aplica la distribución muestral de las medias, con:
;
En tablas P(Z <= 2.36) = 0.9909 ; P(Z<=0) = 0.500
Por tanto P( 0 <= Z <= 2.36) = 0.4909 o 49.09%
P(150 <= X < = 155)
150 155
150 155
Para el caso de las medias el área es mayor debido a que las medias
muestrales están menos dispersas que los valores individuales de
llamadas
Página 12 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
c. ¿Cuál es la probabilidad de que la media de n=35 llamadas esté
entre 145 y 155 segundos?
Ahora se aplica la distribución muestral de las medias, con:
;
En tablas P(Z <= -1.97) = 0.0244 ; P(Z<=1.97) = 0.9756
Por tanto P( -1.97 <= Z <= 1.97) = 0.9512 o 95.12%
d. ¿Cuál es la probabilidad de que la media de n=35 llamadas sea
mayor a 155 segundos?
Ahora se aplica la distribución muestral de las medias, con:
En tablas P(Z <= -1.97) = 0.0244 o 1-P(Z<=1.97) = 1 - 0.9756 =
0.0244
Por tanto P(Z >= 1.97) = 0.0244 o 2.44%
Con la información anterior ahora la empresa ya puede tomar
decisiones.
Página 13 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
Ejercicios:
1. Los choferes de camniones de una empresa recorren en promedio
8,500 km. cada trimestre, con una desviación estándar de 1,950 Km. Si
se toma una muestra de n = 100 choferes, Cuál es la probabilidad de
que la media de la muestra sea o encuentre en:
a. ¿Mayor a 8,500 Km.?
b. ¿Menor a 8,000 Km.?
c. ¿Entre 8,200 y 8,700 Km?
d. ¿Entre 8,100 y 8,400 Km.?
2. Los refrescos de una embotelladora tienen una media de 16.1 oz.,
con una desviación estándar de 1.2 oz. Si se toma una muestra de n =
200 refrescos, cuál es la probabilidad de que la media sea:
a. ¿Menor que 16.27 oz.?
b. ¿A lo más 15.93 oz.?
c. ¿Entre 15.9 y 16.3 oz.?
d. ¿Más de 16.2 oz.?
Página 14 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
Para el caso de proporciones se tiene:
Si n>0.05N puede requerirse el
FCP
Una vez calculando lo anterior ahora se determina Z
Ejemplo:
Una empresa adquiere lotes de partes de tamaño n = 200, el lote tiene
una tasa de partes con falla del 10%, la política de la empresa ahora es
que:
a. Si hay más del 12% de defectos se buscará un nuevo proveedor.
b. Entre el 10 y 12% se considerará la búsqueda de un nuevo
proveedor
c. Entre el 5 y 10%, se seguirá con el mismo proveedor
d. Menos del 5%, se incrementarán los pedidos
Solución:
a. P(p > 0.12)
P(Z >= 0.95) = 0.1711 o sea el 17.11%
b. P(0.10 <= p <= 0.12) = 0.3289 o el 32.89%
c. P(0.05 <= p <= 0.10)
Página 15 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
P(-2.38 <= Z <= 0.1) = 0.4913 o el 49.13%
d. P(p <= 0.05) = 0.0087 o el 0.87%
Por tanto como la mayor probabilidad es la del inciso c, no se cambia
al proveedor actual.
Ejercicios:
1. La proporción de personas que comen en un restaurante es del 75%.
En una muestra de 100 clientes, ¿Cuál es la probabilidad de que
menos del 20% compren comida para llevar?
2. El 60% de los empleados en una empresa vive cerca. De 100
empleados al azar, ¿Cuál es la probabilidad de que por lo menos 30
vivan cerca?
Página 16 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
4. Distribuciones muestrales derivadas de la normal:
Chi 2, t y F
Distribución Chi Cuadrada
Esta distribución se forma al sumar los cuadrados de las variables
aleatorias normales estándar.
Si Z es una variable aleatoria normal, entonces el estadístico Y
siguiente es una variable aleatoria Chi cuadrada con n grados de
libertad.
Media y varianza de una ji-cuadrada.
E(X)=k
V(X)=2k
Página 17 de 22
Población
Muestra
Aparecen distribuciones muestrales:
Normal, Chi-cuadrada, t-student, F
223
22
21 .... nzzzzy
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
Calculo de puntos críticos usando las tablas de ji-cuadrada
K=1 K=5
K=25K=50
Gráficas de la distribución ji-cuadrada
Con k grande ji-cuadrada se hace normal
Ejemplo: Calcule el valor critico que satisface
De tablas de ji-cuadrada con alfa=.05 y k=20
Página 18 de 22
)( 2,kXP
05.)( 220,05.0 XP
41.31220,05.0
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
Si es una muestra aleatoria de una Poblacion (X) con
distribución normal .Entonces se distribuye ji-
cuadrada con k= n-1 grados de libertad.
Donde S cuadrada es la varianza muestral.
Distribución t-student
Si es una muestra aleatoria de una población (X) con
distribución normal . Entonces se distribuye
t-student con n-1 grados de libertad
),(
]12/][2/[
]2/)1[()(
2/)1(2
x
xkk
kxf
k
Función de Distribución t-student
K=1K=10
K=100
Página 19 de 22
21
22
)1(
nS
n
1)/()( ntnsX
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
La media y la varianza de la distribución t son:
De una muestra aleatoria de n artículos, la probabilidad de que
Caiga entre dos valores especificados es igual al área bajo la
distribución de probabilidad t de Student con los valores
correspondientes en el eje X, con n-1 grados de libertad
Ejemplo:
La resistencia de 15 sellos seleccionados aleatoriamente son: 480,
489, 491, 508, 501, 500, 486, 499, 479, 496, 499, 504, 501, 496, 498
¿Cuál es la probabilidad de que la resistencia promedio de los sellos
sea mayor a 500?. La media es 495.13 y la desviación estándar es de
8.467.
t = -2.227 y el área es 0.0214
Página 20 de 22
0 3;2
kk
k
ns
xt
/
227.215/467.8
50013.495
t
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
Distribución F
Surge de dividir dos ji-cuadradas independientes
F=(W/u)/(Y/v)
W se distribuye ji-cuadrada con u g.l.
Y se distribuye ji-cuadrada con v g.l.
El uso de esta distribución es para comparar varianzas (Recuerde el
análisis de varianza)
Distribución F.
),0(
]1][2/[)2/(
/]2/)[()(
2/)(
1)2/(2
x
xvu
vu
xvuvuxf
vk
uu
u=10
v=5
u=20
v=20
Página 21 de 22
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007
Para determinar la otra cola de la distribución F se determina con la expresión.
Falfa, k1, k2 = 1 / F(1-alfa), k2, k1
Dado K1 = 8 y K2 = 10, F0.05 = 3.07, encontrar el valor de F0.05 con K1 = 10 y K2 = 8
F0.05,10,8 = 1/ F0.95,8,10 = 1/ 3.07 = 0.326.
Página 22 de 22