Upload
hahanh
View
218
Download
0
Embed Size (px)
Citation preview
A.Morillas: Muestreo 1
MUESTREO EN POBLACIONES FINITAS
Antonio MorillasAntonio MorillasAntonio MorillasAntonio Morillas
A.Morillas: Muestreo 2
MUESTREO EN POBLACIONES FINITAS
1. Conceptos estadísticos básicos
2. Etapas en el muestreo
3. Tipos de error
4. Métodos de muestreo
5. Tamaño de la muestra e inferencia
6. Muestreo en poblaciones finitas
6.1 Muestreo aleatorio simple
6.2 Muestreo aleatorio estratificado
A.Morillas: Muestreo 3
INTRODUCCIÓN
• Dos aspectos básicos de la inferencia estadística, no vistos aún:
� Proceso de selección de la muestra:
� Tamaño adecuado en poblaciones finitas:
Métodos de muestreo
Fiabilidad y coste
A.Morillas: Muestreo 4
ETAPAS EN EL MUESTREO. ESQUEMA
1.Definir la INFORMACIÓN que se necesita
2. Determinar la POBLACIÓN y ver
LISTADO
3. MÉTODO de muestreo y TAMAÑO de la muestra
4. Cuestionario: NO RESPUESTA y garantizar FIABILIDAD (DISEÑO)
6. Conclusiones sobre la POBLACIÓN
5. Uso de la muestra para INFERENCIA
A.Morillas: Muestreo 5
TIPOS DE ERROR
• Debidos al muestreo ���� incertidumbre
• Ajenos al muestreo:
1. Definición incorrecta de la población
2. Respuestas falsas o imprecisas
3. Falta de respuesta ���� posible sesgo
4. Sesgo en la selección elementos muestrales
5. Errores de manipulación, tabulación y cálculo
• No hay un criterio general para evitarlos y/o analizarlos ���� minimizarlos
A.Morillas: Muestreo 6
MÉTODOS DE MUESTREO
• Muestreo aleatorio:• Unidad muestral elemental:
• a.1) muestreo aleatorio simple• a.2) muestreo aleatorio sistemático• a.3) muestreo aleatorio estratificado
• Unidad muestral grupo:• b.1) muestreo por áreas y conglomerados• b.2) muestreo por etapas
• Muestreo no aleatorio y semialeatorio:• En general, no “científico”; no estudia precisión:
• c.1) por cuotas• c.2) de juicio u opinión
A.Morillas: Muestreo 7
MUESTREO ALEATORIO SIMPLE
• Sirve de base a los demás métodos
• Es el más sencillo desde el punto de vista teórico
• Todos los elementos muestrales se tratan como iguales
• La selección es sin reposición
• Todas las muestras posibles son igualmente probables
• Cuando N es muy grande su coste es muy alto
A.Morillas: Muestreo 8
MUESTREO ALEATORIO SISTEMÁTICO
• Se necesita un listado ordenado de los elementos
• El orden no debe afectar a la aleatoriedad ���� sesgo
• Se selecciona al azar el primer elemento muestral (k)
menor que p=N/n ���� n grupos o clases de p elementos.
• Elegido éste, los demás se obtienen sumándole p al
anterior: k+p, k+2p,...
• El método garantiza que aparezcan elementos de todas
las clases, por lo que puede generar muestras más
representativas que el muestreo aleatorio simple
A.Morillas: Muestreo 9
MUESTREO ALEATORIO SISTEMÁTICO
(N/n)=p
N = tamaño población
n = tamaño muestraListado
k<p
k+p k+2p1 Nk+3p
El orden no debe afectar a la aleatoriedad
A.Morillas: Muestreo 10
MUESTREO ESTRATIFICADO
En ocasiones es indispensable agrupar los elementos de
la población en clases o estratos, que han de ser:
• Homogéneos en sus elementos
• Heterogéneos entre sí
Dentro de cada estrato se aplicará un muestreo aleatorio
simple o sistemático
Mejor información. Reduce errores y costes
A.Morillas: Muestreo 11
MUESTREO POR CONGLOMERADOS
• Conglomerado: grupo de elementos de la población
• La unidad de muestreo es el conglomerado
• Se seleccionan aleatoriamente cierto número de
conglomerados y se investigan todos sus elementos
• Características: homogeneidad entre conglomerados;
heterogeneidad dentro de cada conglomerado
• Se reduce problema de listado (solo para unidades
seleccionadas), no es necesario saber tamaño población,
entrevistas dentro del grupo (conglomerado)���� menos
costoso
A.Morillas: Muestreo 12
MUESTREO POR ETAPAS
• Generalización del muestreo por conglomerados
• Suele hacerse descendiendo de conglomerados más grandes a más pequeños:
• En cada etapa se aplica el muestreo aleatorio, sistemático o estratificado
• Objetivo: Reducir al mínimo el coste del listado
Provincia ���� Municipio ���� Barrio ���� Edificio ���� Familia
A.Morillas: Muestreo 13
VENTAJAS E INCONVENIENTESMUESTREO ALEATORIO SIMPLE
• Requiere que se
posea de antemano un
listado completo de
toda la población.
• Coste.
Sencillo y de
fácil
comprensión.
• Se selecciona una
muestra de tamaño n de
una población de N
unidades.
• Cada elemento tiene
una probabilidad de
inclusión igual y
conocida de n/N.
INCONVENIENTESVENTAJASCARACTERISTICAS
A.Morillas: Muestreo 14
VENTAJAS E INCONVENIENTESMUESTREO SISTEMÁTICO
Si la constante de
muestreo está asociada
con el fenómeno de
interés, las
estimaciones obtenidas
a partir de la muestra
pueden contener sesgo
de selección
• Fácil de aplicar.
• Cuando la
población está
ordenada,
asegura una
cobertura de
unidades de
todos los tipos.
• Conseguir un listado de
los N elementos de la
población.
• Determinar p= N/n.
• Elegir un número
aleatorio, k, entre 1 y p
(k= arranque aleatorio).
• Seleccionar los
elementos de la lista.
INCONVENIENTESVENTAJASCARACTERISTICAS
A.Morillas: Muestreo 15
VENTAJAS E INCONVENIENTESMUESTREO ESTRATIFICADO
• Se ha de conocer la
distribución en la
población de las
variables utilizadas
para la estratificación.
• Tiende a
asegurar muestra
adecuada a la
población.
• Estimaciones
más precisas.
• Muestra más
semejante a la
población
(variables
estratificadoras).
• Estratifica la muestra
según ciertas variables
de interés.
• Para ello debemos
conocer la composición
estratificada de la
población objetivo.
• El tamaño muestral se
reparte entre los distintos
estratos definidos en la
población, según ciertos
criterios.
INCONVENIENTESVENTAJASCARACTERISTICAS
A.Morillas: Muestreo 16
VENTAJAS E INCONVENIENTESMUESTREO CONGLOMERADOS-ETAPAS
• El error estándar es
mayor que en el
muestreo aleatorio
simple o estratificado.
• El cálculo del error
estándar es complejo.
• Es muy
eficiente
cuando la
población es
muy grande y
dispersa.
• No es preciso
tener un
listado de toda
la población.
• Menor coste.
• Se seleccionan
aleatoriamente cierto
número de conglomerados.
• Se investigan todos los
elementos de cada uno de
ellos.
• Se realizan varias fases de
muestreo sucesivas, de más
grandes a más pequeños
(embudo)
INCONVENIENTESVENTAJASCARACTERISTICAS
A.Morillas: Muestreo 17
TAMAÑO MUESTRAL E INFERENCIA
La muestra debe reproducir las características de la
población.
Hay dos cuestiones básicas:
- Cantidad de elementos de la muestra
- Generalización de sus resultados a la población
Ambas cosas, tamaño muestral y métodos de inferencia,
están relacionadas con la precisión de las estimaciones.
A.Morillas: Muestreo 18
ERROR E INTERVALO DE CONFIANZACASO DE LA MEDIA
xε µ= −
1 / 2 1 / 2
1 / 2
x x
x x
x z x z
x zn
α α
α
σ µ σ
σµ σ σ
− −
−
− ≤ ≤ +
− ≤ → =
1 / 2x zn
ασε µ −= − =
)1( α−
2/1 α−−Z 2/1 α−Z
2/α
N(0,1)
• Error:
• Intervalo de confianza (1-α):
(0,1)/
xZ N
n
µσ
−= →
A.Morillas: Muestreo 19
TAMAÑO MUESTRAL PARA LA MEDIAPOBLACIONES INFINITAS
2
1 / 2
2
2
zn α σ
ε−=
Despejando de la última expresión, para un
nivel de confianza (1-α) y un error máximo
permitido de tamaño ε, se obtiene:
(para una confianza del 95,5% el percentil de Z vale 2)
24
2n
σε
→ =
A.Morillas: Muestreo 2020
TAMAÑO MUESTRAL PROPORCIÓNPOBLACIONES INFINITAS
2
p̂
pq
nσ =Recordemos que:
Error:
Despejando:
n máxima:
1 / 2ˆ
pqp p z
nαε −= − =
2
1 / 2 4
2 2
z pq pqn nα
ε ε−= → =
max
4 4 0,25 1
2 2 2
pqn
ε ε ε×= = =
A.Morillas: Muestreo 2121
ESTIMACIÓN POR INTERVALOS
Una vez fijado el tamaño de la muestra:
• La mejor estimación por puntos del gasto medio
será la media de la muestra.
• La de la proporción, la observada en la muestra.
• Con ellas, y obtenida la varianza del estimador,
podremos construir los correspondientes
intervalos de confianza, que nos dan una idea de
la horquilla en que se mueve el verdadero valor
del parámetro.
A.Morillas: Muestreo 2222
ESTIMACIÓN POR INTERVALOS
1 / 2 1 / 2
ˆ ˆ1 / 2 1 / 2
Media :
( )
Proporción :
ˆ ˆ ( )
x x
p p
x z x z
p z p p z
α α
α α
σ µ σ
σ σ
− −
− −
− ≤ ≤ +
− ≤ ≤ +
A.Morillas: Muestreo 23
MUESTREO POBLACIONES FINITAS
• POBLACIÓN FINITA: el número de
elementos de la muestra puede llegar a ser una
proporción apreciable de los de la población.
•La precisión de la estimación sería superior, al estar mejor representada el conjunto de la
población.
•La varianza del estimador ha de corregirse por el
factor:
N -n
N -1
A.Morillas: Muestreo 24
MUESTREO ALEATORIO SIMPLETAMAÑO DE LA MUESTRA: MEDIA
• Error máximo permitido, al estimar µµµµ por la media muestral, para un nivel de confianza:
ε= z σ1-α/2 x
εσ =x z
1-α/2
• Luego fijar el error máximo permitido equivale a predeterminar la varianza del estimador (función de n), para un nivel de confianza dado - 100(1-αααα)% -
• El tamaño de la muestra puede calcularse a partir de cualquiera de estas dos expresiones )(ε , σ
x
ε∈µ (x± )
A.Morillas: Muestreo 25
MUESTREO ALEATORIO SIMPLETAMAÑO DE LA MUESTRA: MEDIA (CÁLCULO A)
• A partir de la varianza del estimador:
• Operando: 2x
σ 2 2 2n(N -1) =σ (N -n)=σ N -σ n
2x
σ 2 2n(N -1) +σ n=σ N
σ=
2 2Nz σ1-α/22 2 2(N -1)ε
2Nσ
n =2 2(N +z σ
1-α/1) σ
2- +
x
� σσσσ2 desconocida
� encuesta piloto
/=al hacer 2 2 2σ ε zx 1-α/2
2 N -nσ2σ =x N -1n
A.Morillas: Muestreo 26
MUESTREO ALEATORIO SIMPLETAMAÑO DE LA MUESTRA: MEDIA (CÁLCULO B)
2 2 2ε = z σ1-α/2 x
• Elevando el error al cuadrado:
2σ (N -n)2 2ε = z1-α/2 n (N -1)
• Introduciendo la varianza del estimador:
• Operando: 2 2 2 2 2 2 2n(N -1)ε = z σ (N -n)= z σ N -z σ n1-α/2 1-α/2 1-α/2
2 2 2 2 2n(N -1)ε + z σ n= z σ N1-α/2 1-α/2
σ=
2 2Nz σ1-α/2n=2 2 2
(N -1)ε +z σ1-
2Nσ
2 2(N -1)
α x2+σ
/
� σσσσ2 desconocida
� encuesta piloto
al hacer 2 2 2ε = z σ1-α/2 x
A.Morillas: Muestreo 27
MUESTREO ALEATORIO SIMPLEINFERENCIA SOBRE LA MEDIA
Estimación por puntos:
Estimación por intervalos:
En poblaciones finitas:
Como σσσσ2 es desconocida se estima mediante:
Haciendo operaciones ����
Para utilizar la normal, n será suficientemente grande.
Si n es pequeña y se supone normalidad ���� t de Student
∑n1x= xini=1
ˆ∈µ (x±z σ )x1-α/2
2σx
N -n2σ2σn N 1
=-x
ˆ N -12sN
ˆˆ
2s (N -n)2σ =
x n N
���� desconocida
���� factor de corrección
���� insesgado
A.Morillas: Muestreo 28
MUESTREO ALEATORIO SIMPLETAMAÑO DE LA MUESTRA: PROPORCIÓN
• Varianza del estimador:
ˆ
pq N -n2σ =p n N -1
ˆ
2Nz pq
1-αNpqn= /2
2 2(N -1)
=2
(N -1)σ + pq ε +z pq1-αp /2
ˆ
al hacer2
ε2σ =p 2
z1-α/2• Como p no se conoce, o se estima o nmax :
ˆ
20,25Nz
1-α0,25Nn = =max 2
(
/22 2
(N -1)ε +0,N - 251)σ +0,25 z1-α/2p
A.Morillas: Muestreo 29
MUESTREO ALEATORIO SIMPLEINFERENCIA SOBRE LA PROPORCIÓN
Estimación por puntos:
Estimación por intervalos:
ˆ xp=n
ˆ ˆˆ
∈p (p±z σ )1-α/2 p
ˆ ˆˆˆ
pq (N -n)2σ =p (n-1) N
x = número de observaciones con la característica estudiada
ˆ
pq N -n2σ =p n N -1
ˆ ˆpq (N -1)
(n-1) N
A.Morillas: Muestreo 3030
MUESTREO ALEATORIO ESTRATIFICADO
Población dividida en K estratos: N1+ N2 +.....+ NK = N
Tamaños muestrales de los estratos: n1+ n2 +.....+ nK= n
Medias poblacionales de los estratos: µµµµ1 µµµµ2 ......... µµµµK
Medias muestrales de los estratos: ......
Proporciones muestrales en estratos: …..
En cada estrato se hace un muestreo aleatorio simple:
• Estimadores insesgados (µµµµi, pi):
• Estimadores insesgados de la variancia de y :
ˆ )ˆ
2s (N -ni i i2σ =
x n Ni i i
xi
p̂1
p̂2
p̂K
p̂i
ˆ ˆ ( - )2ˆˆ ( -1)
p q N ni i i i
p n Ni i i
σ =
x1
x2
xK
xi
p̂i
A.Morillas: Muestreo 31
DISTRIBUCIÓN DE LA MUESTRA ENTRE ESTRATOS-1
• No hay una respuesta única
• Criterios de asignación (afijación):
1. Uniforme: todos igual; poco sentido real.
2. Proporcional: La proporción de elementos de la
población en cada estrato se aplica a la muestra:
N ni i=
N n
Nin = n
i N
A.Morillas: Muestreo 32
DISTRIBUCIÓN DE LA MUESTRA ENTRE ESTRATOS-2
3. Óptima: Pondera el criterio anterior con las varianzas de los respectivos estratos, asignando más observaciones a los estratos con mayor varianza poblacional. Es el más deseable si el objetivo único es la precisión en la estimación:
∑
N σi in = n
i KN σi i
i=1
∑
N p qi i i n = n
i KN p qi i i
i=1
Media y total:
Proporción:
���� σσσσ , encuesta piloto
���� n máxima
A.Morillas: Muestreo 33
MUESTREO ALEATORIO ESTRATIFICADOTAMAÑO DE LA MUESTRA: MEDIA
Asignación proporcional:
∑
∑
K2
N σi i 2
εi=1 2n= ; con σ =xK 21 z2 2 1-α/2Nσ + N σ
x i iN i=1
Asignación óptima: ∑
∑
2K1
N σi i 2N εi=1 2n= ; con σ =
xK 21 z2 2 1-α/2Nσ + N σx i iN i=1
Denom. de ni
A.Morillas: Muestreo 34
MUESTREO ALEATORIO ESTRATIFICADOTAMAÑO DE LA MUESTRA: PROPORCIÓN
Asignación proporcional:
Asignación óptima:
ˆ
ˆ
∑
∑
KN p qi i i 2εi=1 2n= ; con σ =
pK 21 z2 α/2Nσ + N p qp i i iN i=1
ˆ
ˆ
∑
∑
2K1
N p qi i i 2N εi=1 2n= ; con σ =
pK 21 z2 α/2Nσ + N p qp i iN i=1
A.Morillas: Muestreo 35
MUESTREO ALEATORIO ESTRATIFICADOINFERENCIA SOBRE LA MEDIA
Estimación por puntos:
K1µ= N µ
i iN i=1∑ ∑
K1x= N x
i iN i=1
Estimación por intervalos:
ˆµ (x±z σ )1-α/2 x
∈ ˆ ˆ∑K1 22 2σ = N σ
ix x2 iN i=1
A.Morillas: Muestreo 36
MUESTREO ALEATORIO ESTRATIFICADOINFERENCIA SOBRE LA PROPORCIÓN
Proporciones poblacionales de los estratos:
Proporciones muestrales de los estratos: ˆ ˆ ˆ, , .... p p p1 2 K
, , .... p p p1 2 K
Estimación por puntos:
Estimación por intervalos:
K1p= N p
i iN i=1∑ ˆ ˆ∑
K1p= N p
i iN i=1
ˆ ˆˆ
p (p±z σ )1-α/2 p
∈ ˆ ˆˆ ˆ∑
K1 22 2σ = N σip p2 iN i=1
ˆ ˆ )ˆˆ
p q (N -ni i i i2σ =
p (n -1) Ni i i