View
154
Download
2
Category
Preview:
Citation preview
Distribuciones Muestrales
Ing. Raúl Alvarez Guale, MPC
Población
• Unidad: Una sola entidad, por lo general, un objeto o una persona, cuyas características son de interés.
• Población de Unidades: colección completa de unidades acerca de la cual se busca información
Población
• En estadística, el uso del término de población es una herencia de los días cuando la estadística se aplicaba principalmente a fenómenos sociológicos económicos.
• Definición: Una población estadística es el conjunto de todas las mediciones (o registro de algún rasgo de calidad) correspondientes a cada unidad de población de unidades, acerca de la cual se busca información.
PoblaciónPoblaciones, Unidades y variables
Población Unidad Variable/característica
Todos los alumnos actualmente inscritos en la universidad
alumno PromedioNúmero de créditosHoras de trabajo por semanaEspecialidadDiestro/zurdo
Todos los restaurantes de comida rápida en el campus
restaurante Número de empleadosNúmero de asientos
Todas la tarjetas de circuito impreso fabricadas durante un mes
tarjeta Tipo de defectosNúmero de defectosUbicación de defectos
Muestra
• Una muestra de una población estadística es el subconjunto de mediciones que realmente se recolectan en el curso de una investigación
Población
Muestra
Muestra aleatoria: Población Finita
• Un conjunto de Observaciones X1, X2, …, Xn, constituye constituye una muestra aleatoroa de tamaño n a partir de una población de tamaño N, si sus valores se eligen de modo que cada subconjunto de N elementos de la población tiene la misma probabilidad de salir
Muestra aleatoria: Población Infinita
• Un conjunto de Observaciones X1, X2, …, Xn, constituye una muestra aleatoria de tamaño n a partir de una población infinita f(x) si:
1. Cada Xi es una variable aleatoria cuya distribución está dada por f)x)2. Estas n variables aleatorias son
independientes.
• El ejecutivo de un restaurante recibe un reporte que indica que el monto promedio gastado por un adulto en un restaurante gourmet es de $302.45 por año. La cifra fue obtenida de una muestra de 540 adultos de Nuevo México. Preguntas:– ¿Qué se puede inferir de la media poblacional?– ¿Cuán cercana está la cifra de $302.45 de la media
poblacional?– ¿Basta la muestra de 540 individuos, de una población
de 2 millones, para obtener un “buen” estimado de la media poblacional?
• El gerente de control de calidad de una empresa productora de kits de reparación de plomería selecciona una muestra aleatoria de estos kits y los inspecciona para detectar fallas. De la muestra de 233 kits, se tienen 18 defectuosos, esto es, el 7.7%. Preguntas:– ¿Qué se puede inferir respecto del total de 13,300
kits producidos?– ¿El porcentaje de kits defectuosos del conjunto
total estará alrededor de 7.7%? ¿Cuán cercano?– ¿Debe inspeccionarse una muestra más amplia?
Las respuestas a las preguntas anteriores requieren el entendimiento de las distribuciones muestrales.
Cada vez que se toman muestras de una población, pueden ocurrir diferentes muestras y cada muestra tener diferentes items. Por lo tanto las medidas estimadas a partir de una muestra, estadísticos, constituyen variables aleatorias, las cuales deben de ser descritas por las denominadas distribuciones muestrales.
El entendimiento de las distribuciones muestrales es la base para el desarrollo de los temas de:
• Estimación estadística• Prueba de hipótesis
Objetivos
• Definir el concepto de error muestral.
• Determinar la media y desviación estándar para la distribución muestral de la media muestral, x.
• Determinar la media y desviación estándar para la distribución muestral de la proporción muestral, p.
• Describir el Teorema del Límite Central y su importancia
• Aplicar distribuciones muestrales para x y p.
_
Error Muestral• Estadísticos (muestra) son usados para estimarparámetros (población)
ej.: x es un estimador de la media poblacional, μ
Problemas:
– Diferentes muestras proporcionan diferentes estimados de los parámetros de la población.
– Los resultados muestrales presentan variabilidad, por lo tanto, existe error muestral.
Recordar: Con una muestra aleatoria se busca conseguir un grupo representativo de la población.
PoblaciónMedia μ
Muestra1 Muestra 2
Muestra n
�͞ x1
�͞ x2
�͞ xn
Valores que puede tomar la variable aleatoria �͞ x
Describir �xA través de una distribuciónmuestral
Cálculo del Error Muestral
• Error Muestral:Es la diferencia entre un valor (estadístico) calculado de la muestra y su correspondiente valor (parámetro) calculado de la población
Ejemplo: (Para la media)
Donde:
μ -x MuestralError
lpoblaciona Media μ
muestral Mediax
¡Siempre presente dado que se usa una muestra!
Recordatorio
Media Poblacional: Media Muestral:
N
xμ i
Donde:
μ = Media poblacional
x = Media muestral
xi = Valores en la población o muestra
N = Tamaño de la población
n = Tamaño de la muestra
n
xx i
La media poblacional NO varía
La media muestral puede VARIAR cuando diferentes muestras son tomadas de la población
Ver Tema 3
Ejemplo
Si la media poblacional es μ = 98.6 °C y una muestra de n = 5 temperaturas da una media muestral de = 99.2 °C, entonces el error muestral es:
C0.698.699.2μx
x
7-18
Errores Muestrales
• Diferentes muestras darán diferentes errores muestrales.
• El error muestral puede ser positivo o negativo (x puede ser mayor que o menor que μ).
• El tamaño del error depende de la muestra seleccionada.
• Es decir, un mayor tamaño de muestra no necesariamente produce un error pequeño si la muestra no es representativa.
Distribución Muestral
Una distribución muestral es una distribución de probabilidad de los posibles valores de un estadístico para muestras (del mismo tamaño) seleccionadas de una población.
PoblaciónMedia μ
Muestra1 Muestra 2
Muestra n
�͞ x1
�͞ x2
�͞ xn
Valores que puede tomar la variable aleatoria �͞ x
Describir �xA través de una distribuciónmuestral
Desarrollo de una Distribución Muestral
Supongamos una población…
Tamaño de población N=4
Variable aleatoria, x, es laedad de los individuos
Valores de x: 18, 20,22, 24 (años)
A B C D
7-22
0.3
0.2
0.1
0 18 20 22 24
A B C D
Distribución Uniforme
P(x)
x
(continuación)
Medidas de resumen para la distribución de la población:
214
24222018
N
xμ i
2.236N
μ)(xσ
2i
Desarrollo de una Distribución Muestral
16 muestras posibles (muestreo con remplazo)
Considerar todas las muestras posibles de tamaño n=2
1era 2da Observación Obs. 18 20 22 24
18 18 19 20 21
20 19 20 21 22
22 20 21 22 23
24 21 22 23 24
16 Medias Muestrales
Desarrollo de una Distribución Muestral
1era 2da Observación Obs. 18 20 22 24
18 18 19 20 21
20 19 20 21 22
22 20 21 22 23
24 21 22 23 24
Distribución Muestral (todas las medias muestrales)
18 19 20 21 22 23 240
.1
.2
.3 P(x)
x
Distribución de medias muestrales
16 Medias muestrales
_
(No es distribución uniforme)
Probabilidad de ocurrencia de una particular media muestral
Desarrollo de una Distribución Muestral
Medidas de resumen de esta distribución muestral:
2116
24211918
N
xμ i
x
1.5816
21)-(2421)-(1921)-(18
N
)μx(σ
222
2xi
x
Promedio de las medias muestrales
Desarrollo de una Distribución Muestral
Comparando la Población con su Distribución Muestral
18 19 20 21 22 23 240
.1
.2
.3 P(x)
x 18 20 22 24
A B C D
0
.1
.2
.3
Distribución de la Población
N = 4
P(x)
x_
1.58σ 21μ xx 2.236σ 21μ
Distribución de la Media Muestraln = 2
• Para cualquier población, – El valor promedio de todas las posibles medias muestrales calculadas
de todas las posibles muestras aleatorias de un tamaño dado de la población es igual a la media poblacional.
– La desviación estándar de todas las posibles medias muestrales calculadas de todas las posibles muestras aleatorias de tamaño n es igual a la desviación estándar poblacional dividida por la raíz cuadrada del tamaño de muestra.
Propiedades de una Distribución Muestral
μμx
n
σσx
Teorema
Teorema
Es considerado un estimador “insesgado”
Llamado también error estándar
7-28
Si una Población es Normal
Si una población es normal con media μ y desviación estándar σ, la distribución muestral de x también es normal con
y μμx n
σσx
Teorema 3
A medida que n se incrementa la dispersión de la distribución muestral se reduce
Distribución Poblacional Normal
Distribución Muestral Normal(tiene la misma media)
Propiedades de la Distribución Muestral
• La media muestral es un estimador insesgado
μμx
μ
xμ
• La media muestral es un estimador consistente
(el valor de x se acerca a μ a medida que n crece):
Tamaño de muestra grande
Tamaño de muestra pequeño
nσ/σx
μ
x
Población
Si n crece,
decrece
Propiedades de la Distribución Muestral
Valor Z para la Distribución Muestral de x
• El valor z para la distribución muestral de x:
Donde: = Media muestral
= Media poblacional
= Desviación estándar poblacional
n = Tamaño de muestra
xμσ
n
σμ)x(
z
7-32
Corrección por Población Finita
• Aplicar la Corrección por Población Finita si:– La muestra es grande relativa a la población (n es mayor al 5% de N)y…– El muestreo es sin remplazo
Entonces
Donde: El factor de corrección por población finita es:
1NnN
n
σ
μ)x(z
1NnN
n↑
Teorema del Límite Central
Mientras el tamaño de muestra sea suficiente-mente grande…
La distribución muestral se hará casi normal sin considerar la forma de la población
Teorema del límite Central
Si es la media de una muestra aleatoria de tamaño n tomada de una población con media y varianza , entonces la forma de la distribución
Conforme nes una distribución norma estándar n(z;0,1) (Con media cero y varianza 1).Se considera una buena aproximación cuando n>= 30.
¿Qué es suficientemente grande?
• Para la mayoría de las distribuciones, n > 30 dará una distribución muestral que es casi normal.
• Para distribuciones simétricas, n > 15 es suficiente.
• Para poblaciones con distribución normal, la distribución muestral de la media será siempre normal.
Usando la Distribución Muestral para Medias
1. Calcular la media muestral.2. Definir la distribución muestral.3. Definir la probabilidad de interés a calcular.4. Convertir la media muestral a un valor z.5. Encontrar la probabilidad usando la tabla de
distribución normal estándar.
Ejemplo1: Teorema límite central
Suponer una población con media μ = 8 y desviación estándar σ = 3. Además una muestra aleatoria de tamaño n = 36 es seleccionada. ¿Cuál es la probabilidad que la media de la muestra esté entre 7.8 y 8.2?
Ejemplo1: Teorema límite central
Solución:
Incluso si la población no tiene distribución normal, el teorema del límite central puede ser usado (n > 30)
Entonces la distribución de muestreo de es aproximadamente normal con media = μ = 8
y desviación estándar
xxμ
0.536
3
n
σσx
Ejemplo1: Teorema límite central
0.31080.4)zP(-0.4
363
8-8.2
nσ
μ- x
363
8-7.8P 8.2) x P(7.8
z7.8 8.2 -0.4 0.4
Distribución Muestral Distribución Normal Estándar
0.1554 0.1554
Distribución de la Población
??
??
?????
??? Muestrear Estandarizar
8μ 8μx 0μz x x
Ejemplo 2: Teorema límite central
Una empresa de material eléctrico fabrica bombillas de luz que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 bombillas tenga una vida promedio menos de 775 horas.
Ejemplo 2: Teorema límite central
Ejemplo 2: Teorema límite central
Ejemplo 2: Teorema límite central
En la tabla acumulada
Entonces
Ejemplo 3: Teorema límite central
Determinar la probabilidad de que el mismo grupo aleatorio tenga una vida útil de 810 y 820 horas
Ejemplo 3: Teorema límite central
Ejemplo 3: Teorema límite central
𝑃 (2>𝑧>1 )
Ejemplo 3: Teorema límite central
Distribución muestral de la diferencia entre dos promedios
Teorema:Si se extraen al azar muestras independientes de tamaños n1 y n2 de dos poblaciones, discretas o continuas, con medias y y varianzas y respectivamente, entonces la distribuión muestral de las diferncias de las medias, , esta distribuido aproximadamente de forma normal con medias y varianzas dadas por:
Distribución muestral de la diferencia entre dos promedios
Ejemplo1: Diferencia de medias
Se lleva a cabo dos experimentos independientes en los que se compara dos tipos diferentes de pintura. Se pintan 18 especímenes con el tipo A y en cada uno se registra el tiempo de secado en horas. Lo mismo se hace con el tipo B. Se sabe que las desviaciones estándar de la población son ambas a 1. Suponiendo que el tiempo promedio de secado es igual para los dos tipos de pintura, encuentre , donde , son los tiempo de promedio de secado para muestras de tamaño
Ejemplo1: Diferencia de medias
Ejemplo1: Diferencia de medias
Ejemplo1: Diferencia de medias
La tabla da = 0.9987
Ejemplo
Los cinescopios para televisión del fabricante A tiene una duración media de 6.5 años y una desviación estándar de 0.9 años; mientras que de los fabricantes B tienen una duración media de 6.0 años y una desviación estándar de 0.8 años. ¿Cuál es la probabilidad de que de una muestra aleatoria de 36 cinescopios del fabricante A tengan una duración media que sea al menos de 1 año más que la duración media de una muestra de 49 cinescopios del fabricante B?
Ejemplo 2: Diferencia de medias
Ejemplo 2: Diferencia de medias
Distribución Muestral de una Proporción
El objeto del muestreo es la estimación de la proporción de una población que satisface un determinado atributo.Ejemplos:• Un contador puede estar interesado en determinar la
proporción de saldos de cuentas por cobrar que están correctas.
• Un supervisor de producción puede desear determinar el porcentaje de productos libre de defectos.
• El departamento de investigación de mercados podría desear conocer la proporción de compradores potenciales que efectivamente compraran el producto.
Distribución Muestral de una Proporción
• En todos estos casos se puede seleccionar una muestra, calcular la proporción muestral y tomar una decisión basada en los resultados de la muestra.
• Al igual que las medias muestrales, las proporciones muestrales están sujetas al error muestral. La distribución muestral de estas proporciones son un medio para evaluar la magnitud potencial de estos errores muestrales.
Proporción Poblacional, π
π = Proporción de la población que tiene alguna característica
• Proporción muestral ( p ) proporciona un estimado de π :
• Si hay dos resultados, p tiene distribución binomial
muestra la de Tamañomuestra laen éxitos de Número
nx
p
Distribución Muestral de p
• Aproximado por unadistribución normal si:–
Donde
y
(Donde π = Proporción poblacional)
Distribución MuestralP( p )
.3
.2
.1 0
0 . 2 .4 .6 8 1 p
πμp n
π)π(1σp
5π)n(1
5nπ
Teorema 5
7-61
Valores Z para Proporciones
• Si el muestreo es sin remplazo y n es mayor al 5% del tamaño poblacional, entonces debe usar el factor de corrección por población finita: 1N
nN
n
π )π (1σ p
nπ)π(1
πp
σ
πpz
p
Estandarizar p a un valor z con la fórmula:
pσ
Usando la Distribución Muestral para Proporciones
1. Determinar la proporción poblacional, .p2. Calcular la proporción muestral, p.3. Determinar la media y desviación estándar de
la distribución muestral.4. Definir el evento de interés.5. Si np y n(1-p) son ambos mayores que 5,
entonces convertir p a valor z.6. Usar la tabla de la distribución normal
estándar para determinar la probabilidad.
Ejemplo1 : Distribución Muestral de una Proporción
• Si la proporción verdadera de votantes que apoyan la propuesta A es π = 0.4. ¿Cuál es la probabilidad que una muestra de tamaño 200 dé una proporción muestral entre 0.40 y 0.45?
Es decir: Si π = 0.4 y n = 200. ¿Cuánto es
P(0.40 ≤ p ≤ 0.45)?
Ejemplo1 : Distribución Muestral de una Proporción
Si π = 0.4 y n = 200. ¿Cuánto es P(0.40 ≤ p ≤ 0.45)?
.034640200
.4)00.4(1n
π)π(1σp
1.44)zP(0
.03464.4000.45
z.03464
.4000.40P.45)0pP(0.40
Determinar :
Convertir a la normal estándar (valor z):
pσ
Usar la tabla normal estándar: P(0 ≤ z ≤ 1.44) = 0.4251
Ejemplo1 : Distribución Muestral de una Proporción
z0.45 1.44
0.4251
Estandarizar
Distribución Muestral
Distribución Normal Estándar
Si π = 0.4 y n = 200. ¿Cuánto es P(0.40 ≤ p ≤ 0.45)?
0.40 0p
Ejemplo1 : Distribución Muestral de una Proporción
• Se discutió el error muestral.• Se introdujo distribuciones muestrales.• Se describió la distribución muestral de la media
– Para poblaciones normales.– Usando el Teorema del Límite Central (normalidad desconocida).
• Se describió la distribución muestral de la proporción.• Se calculó probabilidades usando distribuciones
muestrales.• Se discutió el muestreo de poblaciones finitas.
Recommended