33
Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego Departamento de Estadística e Investigación Operativa Universidad de Sevilla Septiembre de 2011 INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011 Introducción al Muestreo en Poblaciones Finitas CB 1/32

Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

  • Upload
    others

  • View
    27

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Muestreo en Poblaciones FinitasIntroducción y Conceptos Básicos

José A. Mayor Gallego

Departamento de Estadística e Investigación OperativaUniversidad de Sevilla

Septiembre de 2011

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 1/32

Page 2: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Contenidos1 Objetivos y Metodología

IntroducciónConceptos y Notaciones BásicasParámetros poblacionales usuales. Variable Cuantitativa

2 Diseños MuestralesDiseño Muestral Aleatorio Simple, MAS(N,n)Diseño Muestral de Bernoulli, MB(N,p)Diseño Muestral Sistemático Uniforme, MAS(N,n)

3 Probabilidades de Inclusión4 Variables Indicadoras5 Diseños Muestrales Probabilísticos y Cuantificables6 Diseños Muestrales Simples y Complejos7 Estimación de Parámetros8 Propiedades y Características de los Estimadores9 Varianza y Error de Muestreo10 Bibliografía

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 2/32

Page 3: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

La Estadística Inferencial

La Inferencia Estadística surge de la necesidad de estudiar unapoblación empleando una pequeña parte de la misma,denominada muestra, usualmente obtenida de maneraaleatoria.

Se obvia así el estudio exhaustivo o censo, que siendo unproceso más costoso y lento, tiene su utilidad en muchosprocesos de la Estadística Pública, pero presenta suslimitaciones cuando se quieren obtener resultados económicos,ya sea en tiempo o en presupuesto.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 3/32

Page 4: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Estadística Inferencial. Enfoque de modelo probababilístico

Una característica asociada a cada elemento de una poblaciónse formaliza en una variable, Y .

La Estadística Inferencial clásica o Estadística Matemáticaclásica se desarrolla bajo la hipótesis de que Y es una variablealeatoria. Enfoque de modelo.

Con esta premisa, la muestra se formaliza como n variablesaleatorias,

(Y1,Y2, . . . ,Yn)

independientes e idénticamente distribuidas, es decir, un vectoraleatorio de componentes independientes y con la mismadistribución de probabilidad, heredada de Y .

Con este enfoque, el tamaño “físico” de la población, denotadopor N, no tiene utilidad ni presencia ya que para lograr laindependencia, se presupone implícitamente que la poblaciónes inagotable o infinita.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 4/32

Page 5: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Enfoque del Muestreo en Poblaciones Finitas

La variable de estudio, Y , no es aleatoria sino simplemente unvector de valores fijos,

(y1, y2, . . . , yN)

La muestra, m, se formaliza como un subconjunto o parte, de nelementos seleccionados de la población, empleando unprocedimiento aleatorio,

m = {i1, i2, . . . , in}

Con este enfoque, aparecen relaciones de dependenciaaleatoria en la selección de elementos. Las variables aleatorias,

yi1 , yi2 , . . . , yin

ya no son independientes.

El procedimiento de selección de la muestra tiene ahora unimportante protagonismo pues condiciona el proceso deestimación posterior.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 5/32

Page 6: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Objetivos de Muestreo en Poblaciones Finitas

Estudiar diferentes formas de seleccionar muestras medianteprocedimientos aleatorios. Estado o fase de muestreopropiamente dicho.

Desarrollar la teoría de estimación de parámetros en el contextode las Poblaciones Finitas. Fase de estimación. La finalidadúltima de todo el proceso es precisamente la estimación deparámetros.

Estudiar la interconexión existente entre procedimiento demuestreo y estimación.

Integrar todo ello con situaciones en las cuales la población sesolapa con distintas estructuras de tipo administrativo comoprovincias o seciones censales, natural como sexo o edad, etc.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 6/32

Page 7: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Conceptos y Notaciones Básicas

Población, U. Con N elementos. U = {1,2,3, . . . ,N}.

Muestra, m. Con n(m) elementos. El tamaño muestral puede servariable.

Variable de estudio, Y = (y1, y2, y3, . . . , yN).

Elemento poblacional, i ∈ U. Valor asociado de la variable yi .

Parámetro poblacional, θ(Y ). Es el objetivo de la estimación:Media, porcentaje, total, etc.

Estimador de θ(Y ), θ(Y ). Depende sólo de la muestra. Es unavariable aleatoria por ser la muestra aleatoria.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 7/32

Page 8: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Parámetros poblacionales usuales. Variable Cuantitativa

Si la variable de estudio es de naturaleza cuantitativa, como porejemplo estatura en metros o sueldo mensual en EUROS, losparámetros más usuales son,

Total poblacional

ty =N∑

i=1

yi =∑i∈U

yi

Media poblacional

yU =1N

N∑i=1

yi =1N

∑i∈U

yi

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 8/32

Page 9: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Parámetros poblacionales usuales. Variable Cuantitativa

Cuasivarianza poblacional

S2yU =

1N − 1

∑i∈U

(yi − yU)2 =1

N − 1

∑i∈U

y2i −

1N

(∑i∈U

yi

)2

Varianza poblacional

σ2yU =

1N

∑i∈U

(yi − y)2 =1N

∑i∈U

y2i −

1N

(∑i∈U

yi

)2

= y2U − y2

U =N − 1

NS2

yU

Otros parámetros menos usuales pero también empleados paraanalizar las poblaciones son la mediana poblacional, los percentilespoblacionales, el índice de concentración de Gini poblacional o elcoeficiente de variación poblacional.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 9/32

Page 10: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Parámetros poblacionales usuales. Variable Cualitativa

Si la variable de estudio es de naturaleza cualitativa, como porejemplo tener coche propio, codificada SÍ ó NO, o estado civil,codificado como SOLTERO, CASADO, SEPARADO, VIUDO, OTROS,el parámetro más usual es la proporción asociada a cada uno de losvalores o modalidades.Por ejemplo, para el estado civil1,

PS =1N

∣∣∣{i ∈ U | yi = SOLTERO}∣∣∣ =

número de solterosN

es la proporción poblacional de solteros. Si la multiplicamos por 100,obtendremos el porcentaje poblacional de solteros. De la mismaforma,

PC =1N

∣∣∣{i ∈ U | yi = CASADO}∣∣∣ =

número de casadosN

es la proporción poblacional de casados.1Si C es un conjunto, la notación |C| indica su cardinal, es decir, cuántos

elementos tiene.INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 10/32

Page 11: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Diseño Muestral

En la práctica, un método de muestreo se realiza seleccionandosecuencialmente elementos, mediante un procedimientoaleatorio.

Al final nos encontramos con una muestra, de las muchaspotenciales que podríamos haber obtenido.

Esta muestra tiene asociada una probabilidad, generada oinducida por el procedimiento aleatorio.

RESUMEN: Un método de muestreo tiene asociados unconjunto de muestras potenciales, y una distribución deprobabilidad.

Formalización: Un diseño muestral es un par d = (M,Pr),siendo M un conjunto de muestras y Pr una distribución deprobabilidad sobre M, es decir,∑

m∈M

Pr(m) = 1

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 11/32

Page 12: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Ejemplo

Para la población de N = 5 elementos,

U = {1,2,3,4,5}

la siguiente lista constituye o define un diseño muestral,

m {1,3} {1,4} {1,5} {2,4} {2,5} {3,5} {1,3,5}Pr(m) 0′1 0′1 0′1 0′1 0′1 0′1 0′4

Nótese que el tamaño de muestra es variable.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 12/32

Page 13: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Ejemplo. Diseño Muestral Aleatorio Simple

Para la población de N elementos,

U = {1,2,3, . . . ,N}

Sea M el conjunto de los subconjuntos de n elementos, siendo n ≤ Nfijo. Hay

(Nn

).

Y sea Pr la distribución de probabilidad constante o uniforme sobreM, es decir,

Pr(m) =1(Nn

) ∀m ∈ M

Dicho así queda muy teórico; es una mera formalización que en lapráctica no se emplea para seleccionar muestras aleatorias por suevidente dificultad técnica cuando N es elevado.

Nótese que ahora el tamaño de muestra es fijo.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 13/32

Page 14: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Ejemplo. Diseño Muestral Aleatorio Simple. Muestreo Práctico

Para la población de N elementos,

U = {1,2,3, . . . ,N}

Generamos números aleatorios enteros y distintos, entre 1 y N,ya sea con una tabla, una calculadora o cualquier otro métodofactible.

En caso de que surjan elementos repetidos, se rechazarán,hasta disponer de n elementos distintos, que constituirán lamuestra.

Obviamente este algoritmo genera el diseño muestral aleatoriosimple.

En general, un muestreo que dé lugar a este diseño sedenominará Muestreo Aleatorio Simple, y se abreviará medianteMAS(N,n).

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 14/32

Page 15: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Ejemplo. Diseño Muestral Aleatorio Simple. Muestreo Práctico

Para la población de N elementos,

U = {1,2,3, . . . ,N}

Generamos números aleatorios enteros y distintos, entre 1 y N,ya sea con una tabla, una calculadora o cualquier otro métodofactible.

En caso de que surjan elementos repetidos, se rechazarán,hasta disponer de n elementos distintos, que constituirán lamuestra.

Obviamente este algoritmo genera el diseño muestral aleatoriosimple.

En general, un muestreo que dé lugar a este diseño sedenominará Muestreo Aleatorio Simple, y se abreviará medianteMAS(N,n).

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 14/32

Page 16: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Ejemplo. Diseño Muestral de Bernoulli

Este diseño se genera mediante el siguiente algoritmo, denominadoMuestreo de Bernoulli,

Dada la probabilidad 0 < p < 1, se recorre secuencialmente lapoblación,

U = {1,2,3, . . . ,N}

y cada elemento i es seleccionado con probabilidad p,independientemente de los demás.

La muestra m está constituída por los elementos seleccionados.

Para este diseño, que se denota MB(N,p), M el conjunto de todoslos subconjuntos de U; hay 2N muestras potenciales. El tamañomuestral n(m) es una variable aleatoria con distribución binomial quepuede tomar todos los valores enteros entre 0 y N inclusive.

La probabilidad de una muestra será,

Pr(m) = pn(m)(1− p)N−n(m)

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 15/32

Page 17: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Ejemplo. Diseño Muestral Sistemático Uniforme

Se genera mediante el siguiente algoritmo, denominado MuestreoSistemático Uniforme de paso k ,

Dado k <= N, se genera un número aleatorio entero, γ, entre 1y k inclusives.

La muestra es,

m = {γ, γ + k , γ + 2k , · · · }

Para este diseño, que se denota MS(N, k), M el conjunto de las kposibles muestras cuyo elemento inicial está entre 1 y k . Laprobabilidad de una muestra es Pr(m) = 1/k .

Si N es múltiplo de k , N = nk , hay exactamente n bloques de kelementos, y todas las muestras posibles tienen tamaño fijo, n.

En caso contrario, N = nk + r , existe un bloque adicional de relementos, por lo que, dependiendo del inicio, unas muestras tendrántamaño n + 1 y otras n

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 16/32

Page 18: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

MAS(N, n), MB(N, n) y MS(N, k) con R

Muestreo Aleatorio Simple con R. MAS(N,n).

muestra=sample(N,n)

Muestreo de Bernouilli con R. MB(N,p).

muestra=c()

for (i in 1:N)

if (runif(1)<=p) muestra=c(muestra,i)

Muestreo Sistemático con R. MS(N, k).

gamma=1+trunc(k*runif(1))

muestra=c()

while(gamma <= N)

muestra=c(muestra,gamma);gamma=gamma+k

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 17/32

Page 19: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Probabilidades de Inclusión

Dado un diseño muestral, d = (M,Pr), si seleccionamos unamuestra aleatoria m, un elemento i , o una pareja i , j pueden estar ono en ella. Definimos,

Probabilidades de Inclusión de Primer Orden.

πi = Pr [i ∈ m] ∀i ∈ U

Probabilidades de Inclusión de Segundo Orden.

πij = Pr [i , j ∈ m] ∀i , j ∈ U

NOTA: πii = πi

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 18/32

Page 20: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Ejemplo Básico

m {1,3} {1,4} {1,5} {2,4} {2,5} {3,5} {1,3,5}Pr(m) 0′1 0′1 0′1 0′1 0′1 0′1 0′4

Sumamos las probabilidades de las muestras favorables a i ∈ m paralas πi , y a i , j ∈ m para las πij ,

π2 = Pr({2,4}) + Pr({2,5}) = 0′1 + 0′1 = 0′2π3 = Pr({1,3}) + Pr({3,5}) + Pr({1,3,5}) = 0′1 + 0′1 + 0′4 = 0′6π13 = Pr({1,3}) + Pr({1,3,5}) = 0′1 + 0′4 = 0′5π14 = Pr({1,4}) = 0′1π12 = 0

etc.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 19/32

Page 21: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Probabilidades de Inclusión para MAS, MB y MS

MAS(N,n). Espacio muestral equiprobable. Fórmula de Laplace.

πi =

(N−1n−1

)(Nn

) =nN

πij =

(N−2n−2

)(Nn

) =n(n − 1)

N(N − 1)

NOTACIÓN: f = nN . Se denomina fracción de muestreo.

MB(N,p). Un elemento es seleccionado con probabilidad p, conindependencia de los demás.

πi = p πij = p × p = p2

MS(N, k). Un elemento está en una única muestra. Doselementos entran en la muestra si “distan” un múltiplo de k .

πi =1k

πij =

1k

si |i − j | = k

0 en otro caso

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 20/32

Page 22: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Una Herramienta: Variables Indicadoras

Dado un diseño muestral, d = (M,Pr), si seleccionamos unamuestra aleatoria m, un elemento i pueden estar o no en ella.Definimos las variables indicadoras,

Ii =

{1 si i ∈ m0 si i 6∈ m

E [Ii ] = 1× Pr [Ii = 1] = πi

V [Ii ] = E [I2i ]− E2[Ii ] = πi − π2

i = πi (1− πi )

Cov[Ii , Ij ] = E [Ii Ij ]− E [Ii ]E [Ij ] = πij − πiπj

NOTACiÓN: ∆ij = πij − πiπj

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 21/32

Page 23: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

∆ij , i 6= j para MAS, MB y MS

MAS(N,n)

∆ij = πij − πiπj =n(n − 1)

N(N − 1)− n2

N2 =−f (1− f )

N(N − 1)

MB(N,p)∆ij = πij − πiπj = p2 − p2 = 0

MS(N, k)

∆ij = πij−πiπj =

1k− 1

k2 si |i − j | = k

− 1k2 en otro caso

=

k − 1

k2 si |i − j | = k

− 1k2 en otro caso

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 22/32

Page 24: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Definiciones

Diseño ProbabilísticoDiremos que un diseño muestral es probabilístico si cumpleπi > 0, ∀i ∈ U

MAS, MB y MS son probabilísticos.

Diseño CuantificableDiremos que un diseño muestral (probabilístico) es cuantificable sicumple πij > 0, ∀i 6= j ∈ U

MAS, MB son cuantificables. MS no es cuantificable

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 23/32

Page 25: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Diseños Probabilísticos y Cuantificables

Decir que un diseño es probabilístico es equivalente a decir quetodo elemento de la población aparece en al menos unamuestra del diseño.Es una propiedad deseable pues si no se cumple, ello significaque hay elementos de la población que NUNCA seránmuestreados, es decir, invisibles para el muestreo. Por estarazón, siempre emplearemos diseños probabilísticos.

La propiedad de ser cuantificable tiene importantesimplicaciones en relación al cálculo del error de muestreo, esdecir, la discrepancia que existe por el hecho de emplearmuestreo y no censo completo.

Todo diseño cuantificable es probabilístico pero no a la inversa.Es decir, hay diseños probabilísticos y no cuantificables como elDiseño Sistemático.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 24/32

Page 26: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Diseños Simples y Complejos

Los muestreos que hemos visto hasta ahora son simples:seleccionan directamente los elementos de la población.

En la práctica, esta situación es inusual. Los elementos seseleccionan después de fases previas de estructuración y/oselección de agrupaciones de elementos. Tendríamos entoncesun muestreo complejo.

EJEMPLO: Para un estudio de producción industrial enAndalucía, la muestra final de empresas puede construirserealizando OCHO muestreos aleatorios simples independientes,uno en cada provincia. MUESTREO ESTRATIFICADO.

EJEMPLO: Para una encuesta sociológica en la provincia deSevilla se puede seleccionar previamente una muestra aleatoriasimple de municipios, y en una segunda fase, se selecciona unamuestra de personas en cada municipio. MUESTREO PORCONGLOMERADOS.

De cualquier forma, el estudio del Muestreo empieza por losmuestreos simples pues son la base de los complejos

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 25/32

Page 27: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Estimadores

Dado el parámetro poblacional θ, el objetivo de la EstadísticaInferencial es aproximarlo, o estimarlo en sentido estadístico,encontrando incluso unos límites de tolerancia con unapredeterminada probabilidad, es decir, un intervalo deconfianza.

Dada la variable de estudio, Y , una muestra obtenida medianteun diseño, m = {i1, i2, . . . , in} nos proporciona una informaciónbasada en los valores de la variable para cada uno de loselementos muestrales, es decir,

{yi | i ∈ m}

Para estimar θ emplearemos una función de dichos valoresmuestrales, que denominaremos estimador, y que denotaremosθ(m)

Como función genérica de m, θ(m) es una variable aleatoria[discreta] con distribución de probabilidad inducida por el diseño.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 26/32

Page 28: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Etapas del Proceso Inferencial

FASE DE MUESTREO

Ud=(M,Pr)

−−−−−−−−−−→ m

FASE DE ESTIMACIÓN

m{yi | i∈m}

−−−−−−−−−→ θ(m)

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 27/32

Page 29: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Propiedades y Características de los Estimadores

Sesgo. Desviación Respecto a θ

B[θ] = E [θ]− θ

Estimador Insesgado. Propiedad Deseable

Diremos que θ es insesgado si,

E [θ] = θ es decir B[θ] = E [θ]− θ = 0

Error Cuadrático Medio. Calibración del Error

ECM[θ] = E [(θ − θ)2]

Estimadores Insesgados

ECM[θ] = E [(θ − θ)2] = E [(θ − E [θ])2] = V [θ]

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 28/32

Page 30: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Varianza. Intervalos de Confianza. Error

Para estimadores insesgados, podemos calibrar el error delproceso inferencial mediante la varianza.

La varianza, V [θ], es un parámetro poblacional, por lo quetambién tendremos que estimarla mediante V [θ].

El estimador θ sigue usualmente una distribución que seaproxima a la normal. Si es insesgado podemos construir elintervalo de confianza al 100× (1− α) %, donde z1−α/2 es elpercentil de la distribución normal N(0,1),(

θ − z1−α/2

√V [θ] , θ + z1−α/2

√V [θ]

)= θ ± z1−α/2

√V [θ]

ERROR TÍPICO=√

V [θ]

ERROR DE MUESTREO= z1−α/2

√V [θ]

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 29/32

Page 31: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Dependencia del Diseño

Las propiedades y características de un estimador dependen deldiseño muestral. Supongamos que θ = yU , y consideremos comoestimador la media muestral,

yU = ym =1

n(m)

∑i∈m

yi

Diseño Aleatorio Simple, MAS(N,n)

E [yU ] =∑m∈M

(1n

∑i∈m

yi

)1(Nn

) =1

n(N

n

) ∑m∈M

∑i∈m

yi

=1

n(N

n

) ∑i∈U

yi

(N − 1n − 1

)=

1N

∑i∈U

yi = yU

INSESGADO

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 30/32

Page 32: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Dependencia del Diseño

Diseño Sistemático, MS(N, k) con N = nk + r , r > 0

E [yU ] =∑m∈M

(1

n(m)

∑i∈m

yi

)1k

=1k

∑m∈M

n(m)=n+1

1n + 1

∑i∈m

yi +∑m∈M

n(m)=n

1n

∑i∈m

yi

=1

k(n + 1)

∑m∈M

n(m)=n+1

∑i∈m

yi

+1kn

∑m∈M

n(m)=n

∑i∈m

yi

6= yU en general

NO INSESGADO

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 31/32

Page 33: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_01.pdf · Muestreo en Poblaciones Finitas Introducción y Conceptos Básicos José A. Mayor Gallego

Bibliografía

Fernández García, F.R. y Mayor Gallego, J.A. (1995). Muestreo enpoblaciones finitas: Curso básico. E.U.B. Ediciones Universitarias deBarcelona.

Lohr, S.L. (2010). Sampling: Design and Analysis. 2nd Edition.Brooks/Cole. International Edition.

Särndal, C., Swensson, B. and Wretman, J. (1992). Model AssistedSurvey Sampling. Springer-Verlag. New York, Inc.

INSTITUTO DE ESTADÍSTICA DE ANDALUCÍA. Curso de Muestreo. Septiembre 2011Introducción al Muestreo en Poblaciones Finitas CB � 32/32