178
PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITAS Jos´ e Antonio Mayor Gallego

PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PROYECTO DOCENTEMUESTREO EN POBLACIONES FINITAS

Jose Antonio Mayor Gallego

Page 2: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

Indice general

1. Introduccion 1

1.1. Marco cientıfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Marco docente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3. Marco historico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3.1. Precedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3.2. Kiaer y el metodo representativo . . . . . . . . . . . . . . . . 6

1.3.3. Bowley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3.4. Neyman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.3.5. Hansen y Hurwitz . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.6. Aportaciones desde la decada de los 40 . . . . . . . . . . . . . 11

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2. Relacion de temas y comentarios a los mismos 15

2.1. Comentarios al Bloque Tematico I : Introduccion. . . . . . . . . . . . 36

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.2. Comentarios al Bloque Tematico II : Inferencia en muestreo en pobla-ciones finitas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

2.3. Comentarios al Bloque Tematico III : Muestreo aleatorio simple. . . . 56

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

2.4. Comentarios al Bloque Tematico IV : Estimacion de la varianza. . . . 67

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

i

Page 3: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

ii

2.5. Comentarios al Bloque Tematico V : Muestreo sistematico. . . . . . . 78

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

2.6. Comentarios al Bloque Tematico VI : Muestreo con probabilidadesvariables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

2.7. Comentarios al Bloque Tematico VII : Muestreo estratificado. . . . . 92

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

2.8. Comentarios al Bloque Tematico VIII : Muestreo por conglomerados. 99

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

2.9. Comentarios al Bloque Tematico IX : Empleo de informacion auxiliaren la estimacion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

2.10. Comentarios al Bloque Tematico X : Cuestiones especiales de muestreoy estimacion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

2.11. Comentarios al Bloque Tematico XI : No respuesta y otras fuentes deerror. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

2.12. Comentarios al Bloque Tematico XII : Disenos optimos y disenos con-trolados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

3. Planificacion docente y otros aspectos metodologicos 148

3.1. Extension de la asignatura, requisitos y relacion con otras materias . 148

3.2. Organizacion docente de la asignatura . . . . . . . . . . . . . . . . . 149

3.2.1. Clases teoricas . . . . . . . . . . . . . . . . . . . . . . . . . . 150

3.2.2. Clases practicas . . . . . . . . . . . . . . . . . . . . . . . . . . 150

3.2.3. Estudios de casos y supuestos practicos . . . . . . . . . . . . . 152

3.2.4. Distribucion horaria . . . . . . . . . . . . . . . . . . . . . . . 152

3.3. Materiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

3.3.1. Material bibliografico . . . . . . . . . . . . . . . . . . . . . . . 152

Jose A. Mayor Gallego. Proyecto Docente

Page 4: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

iii

3.3.2. “Software” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

Jose A. Mayor Gallego. Proyecto Docente

Page 5: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

Capıtulo 1

Introduccion

El proyecto docente que presentamos expone, como nucleo central, los conocimien-tos de Muestreo en Poblaciones Finitas que, a nuestro juicio, corresponden a losestudios de la Licenciatura en Ciencias y Tecnicas Estadısticas o tambien a la espe-cialidad de Estadıstica e Investigacion Operativa en la Licenciatura de Matematicas.El diseno de este nucleo basico de conocimientos se concretara en el capıtulo segundodel proyecto mediante un conjunto de temas comentados y sera complementado en eltercer capıtulo con una serie de consideraciones sobre la planificacion docente y otrosaspectos metodologicos.

En este capıtulo introductorio abordaremos la tarea de justificar dichos conoci-mientos desde distintas perspectivas, encuadrando la materia en diferentes marcos oambitos como son,

1. La caracterizacion de los contenidos cientıficos de la materia, tanto en terminosabsolutos como en relacion con otras ramas de la Estadıstica, en conexion consus fundamentos, metodos y objetivos.

2. La conversion o transformacion de dichos contenidos en materia docente.

3. El desarrollo historico del muestreo, como respuesta a una demanda, cada vezmayor, de tecnicas de investigacion de grandes poblaciones con complejas es-tructuras.

y que a continuacion estudiamos separadamente.

1

Page 6: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 2

1.1. Marco cientıfico

Bajo la denominacion espanola, quizas poco definitoria pero ya tan extendida,de Muestreo en Poblaciones Finitas, se entiende, basicamente, el estudio de unconjunto de tecnicas para la obtencion de muestras a partir de una poblacion finita yla estimacion de ciertos parametros a partir de las mismas. Estas dos fases o procesosfundamentales, el muestreo y la estimacion, van ıntimamente relacionados de formaque la acuracidad de las estimaciones e incluso la posibilidad de medir dicha acura-cidad estan fuertemente influenciadas por los mecanismos empleados en construir lasmuestras.

A su vez, estos mecanismos estan muy condicionados por el tipo de poblacion enestudio y las formas de acceso que se tengan sobre la misma. Pensemos, por ejemplo, enla gran diferencia existente entre el acceso a la poblacion formada por los estudiantesmatriculados en la Universidad de Sevilla, en un determinado curso academico, de loscuales existe un registro informatico completo, siendo muy facil la seleccion de unamuestra “en el ordenador”, para su posterior entrevista, y el acceso a la poblacionconstituida por productos manufacturados que conforme van saliendo de una cadenade produccion son distribuidos para ser comercializados.

Como ya hemos mencionado, la poblacion soporte es finita, y ello tiene importan-tes implicaciones en el desarrollo metodologico de la teorıa del muestreo, originandola distincion fundamental con lo que usualmente entendemos como Estadıstica Ma-tematica clasica. En efecto, aunque las poblaciones objeto de esta disciplina tambienson, en general, finitas, la modelizacion de las mismas mediante una variable aleatoria,X, que mediante un proceso de seleccion “independiente” genera una muestra,

X1, X2, . . . . . . , Xn

entendida como n variables aleatorias independientes e identicamente distribuidascomo X, permite desarrollar la teorıa de inferencia tomando como base la distribucionconjunta de la muestra, heredada del modelo X, y las distribuciones de funcionesmuestrales o estadısticos.

Por contra, el enfoque usual del Muestreo en Poblaciones Finitas no presu-pone, en principio, modelo alguno sobre la poblacion, introduciendo la aleatoriedad apartir del mecanismos de seleccion de muestra, y ello determina las distribuciones delos estadısticos conectando ası con la inferencia sobre ciertos parametros de interes.De esta forma, podemos afirmar que ambas disciplinas parten de un enfoque diferentepero tienen en comun sus metodos de trabajo, sustentados fundamentalmente sobrela base comun del calculo de probabilidades.

Jose A. Mayor Gallego. Proyecto Docente

Page 7: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 3

En lo que respecta a su campo de aplicacion podemos afirmar que el Muestreoen Poblaciones Finitas se orienta a proporcionar una base teorica solida para elconjunto de tecnicas que se utilizan en la realizacion de encuestas y en las estimacio-nes a partir de los datos obtenidos, dando solucion a los problemas que estas tareasoriginan y siendo esta la causa de la denominacion inglesa usual para esta disciplina,“Survey Sampling”,“Sampling Theory of Surveys”, etc. Ello pone de manifiesto su im-portancia como base para el estudio del comportamiento de las poblaciones humanas,en lo que se refiere a caracterısticas tan importantes como,

Parametros de tipo demografico.

Estructura economica de las sociedades.

Patrones de comportamiento.

Entorno social.

Opinion e ideologıa.

Estructura de mercados.

Indicadores de salud.

aunque su campo de trabajo se amplıa a poblaciones de cualquier tipo, con aplica-ciones en control de la calidad, biologıa, contabilidad y auditorıa, etc. De esta forma,resulta facil comprender su importancia como herramienta de primera magnitud parala toma de decisiones y ası lo han entendido los diferentes organismos estadısticosoficiales tanto estatales como a nivel internacional, que desde hace 50 anos, aproxi-madamente, vienen haciendo un uso cada vez mayor de las encuestas por muestreo,lo que a su vez ha determinado el enorme desarrollo de la teorıa del muestreo en losultimos anos, como ya tendremos ocasion de repasar al final de este capıtulo.

Como senala Sanchez-Crespo (1991), fue en 1940, en los Estados Unidos de Ameri-ca, donde se inicio el uso de las grandes encuestas de poblacion con una encuesta dedesempleo de la que se hizo cargo dos anos mas tarde el Bureau of the Census,con el nombre de “Current Population Survey”. El tan citado Bureau of the Censusha sido y continua siendo un centro de investigacion, tanto teorica como aplicada,de gran actividad, y con frecuencia ha sido calificado como Meca del muestreo. Enel han trabajado matematicos de la talla de Hansen, Hurwitz, Madow o Cochran, ysu metodologıa ha sido tomada como modelo por los organismos estadısticos de nu-merosos paıses para la realizacion de las encuestas oficiales. Hansen y Madow (1976)y Hansen (1987), en sus desarrollos historicos del muestreo, consideran dicho centrocomo determinante en los grandes avances de esta materia.

Jose A. Mayor Gallego. Proyecto Docente

Page 8: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 4

En Espana, la realizacion de encuestas oficiales a gran escala se inicia en 1964 conla Encuesta de Poblacion Activa, posteriormente integrada en la Encuesta General dePoblacion, y llevada a cabo por el Instituto Nacional de Estadıstica. Segun Sanchez-Crespo (1991), el diseno de esta encuesta figura, por su calidad, en tercer lugar anivel mundial, siguiendo al del Bureau of the Census y al del Statistics Canada. Unainstructiva y detallada exposicion del mismo se realiza en Garcıa Espana (1974).Tambien en Azorın y Sanchez-Crespo (1986) se aportan interesantes descripciones deesta y otras encuestas oficiales a nivel mundial.

La gran importancia de las macroencuestas oficiales no puede hacernos olvidarla relevancia de otras encuestas, de ambitos mas restringidos como pueden ser losestudios a nivel regional, provincial o municipal, los estudios y sondeos de mercadosrealizados por las empresas, tanto en el campo de sus clientes potenciales con elobjeto de planificar actividades, como a nivel interno para optimizar la utilizacion desus recursos; las encuestas realizadas en grandes centros sanitarios, en universidades,etc. Todas estas investigaciones pueden facilitar a los gestores el diseno de las polıticasmas adecuadas y la toma de decisiones.

1.2. Marco docente

De todo lo anterior se desprende la innegable importancia del Muestreo en Po-blaciones Finitas como conjunto de tecnicas y metodos que sustentan los procesosasociados a la realizacion de encuestas, y cuya aplicacion cubre desde el diseno pre-vio de la encuesta en relacion a la estructura poblacional, hasta la aplicacion de losestimadores mas adecuados para obtener los resultados, y la evaluacion de la calidado precision de los mismos, justificando la introduccion de esta disciplina en los planesde estudio tanto de carreras especıficas como Licenciaturas y Diplomaturas en Es-tadıstica o especialidades en Estadıstica de las Licenciaturas de Matematicas, comoen carreras de Ciencias Economicas, Empresariales, “Marketing” o Investigacion deMercados, Sociologıa, etc.

Como ya hemos mencionado, el estudio de una realidad mediante encuestas seextiende progresivamente a los ambitos mas variados, y la necesidad de que estasinvestigaciones se realicen con rigor cientıfico exige una preparacion estadıstica ade-cuada a los equipos humanos que las disenan y ponen en practica. Es innegable queesta preparacion debe estar adaptada a los niveles de requerimiento que el estudiantetendra que satisfacer como futuro profesional de la Estadıstica, siendo estos requeri-mientos decisivos para disenar un curso de muestreo adecuado.

En este sentido, y con las logicas matizaciones que habrıa que hacer por las diferen-

Jose A. Mayor Gallego. Proyecto Docente

Page 9: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 5

tes concepciones educativas, es interesante considerar la opinion de Dalenius (1988),que en su artıculo A First Course in Survey Sampling, enumera varias circunstanciaso factores a tener en cuenta para el diseno de un curso de muestreo, dando relevanciaa las siguientes,

(a) El curso se considera como parte de un curriculum estadıstico a nivel universi-tario.

(b) Debe ser impartido por expertos en estas materias, tanto a nivel teorico comopractico.

(c) Se ha de tener en cuenta el nivel de conocimientos en Probabilidad y Estadısticaque poseen los alumnos que van a realizar dicho curso.

(d) Los alumnos a los que el curso va dirigido pueden pertenecer a dos categorıas:aquellos que buscan una preparacion en muestreo por su interes en la materiapropiamente dicha, o los que estan interesados solo en el aprendizaje de susmetodos, para aplicarlos en otros campos.

En nuestro caso, y como ya mencionamos al principio, pretendemos una forma-cion en muestreo a nivel de licenciatura. Esta formacion debe ser lo suficientementeamplia para presentar el campo completo de la materia y de sus aplicaciones, y losuficientemente profunda para permitir al futuro licenciado la realizacion de estudiosmas avanzados en temas especıficos y el desarrollo de nuevas tecnicas adaptadas a lassituaciones que se le puedan presentar en el desempeno de su actividad profesional,investigadora y/o docente.

Para justificar estos objetivos generales hemos de considerar el futuro profesionalque se ofrecera a los alumnos al finalizar sus estudios, y que estara en relacion consu formacion pero tambien con la demanda social existente. Ası, sabemos que ladocencia y/o la investigacion absorbera una parte importante de titulados, y paraestas actividades resulta de gran importancia el disponer de una formacion lo massolida posible.

El otro gran campo de salidas profesionales esta constituido por el desempeno delas tareas especıficas en organismos estadısticos oficiales como el Instituto Nacionalde Estadıstica, o a nivel de nuestra region, el Instituto de Estadıstica de Andalucıa, ytambien en departamentos de estadıstica de ministerios, consejerıas y ayuntamientos.Este tipo de trabajo, por su mayor orientacion a las aplicaciones, aparenta requerir ni-veles de conocimiento menos teoricos y mas decantados a los aspectos metodologicos,no obstante esta apreciacion es erronea, y la complejidad de las actividades a desarro-llar exige amplios niveles de conocimiento. En este sentido, es importante recordar los

Jose A. Mayor Gallego. Proyecto Docente

Page 10: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 6

avances teoricos y metodologicos llevados a cabo en el ambito de organismos oficialesno estrictamente academicos como el Bureau of the Census en los Estados Unidos, oel Instituto Nacional de Estadıstica en Espana, como respectivamente senalan Han-sen (1987) y Sanchez-Crespo (1991).

Finalmente, anadiremos las salidas profesionales en secciones o departamentos deempresas que confıan en la estadıstica como una herramienta para planificar y me-jorar sus actividades y resultados, y tambien en firmas especıficamente dedicadas ala asesorıa, auditorıa, investigacion social, etc, mediante tecnicas estadısticas. Opina-mos que aunque estas posibilidades profesionales no estan plenamente desarrolladasen nuestro paıs, con el tiempo pueden alcanzar un importante auge, ofreciendo uncampo muy prometedor para profesionales bien preparados.

1.3. Marco historico

Finalmente, vamos a considerar el muestreo bajo la perspectiva de su desarrollohistorico, completando nuestra vision de la materia y anadiendo una dimension globa-lizadora que a nuestro juicio clarifica la estructura de contenidos docentes que hemosdisenado para su ensenanza.

1.3.1. Precedentes

En terminos generales, podemos afirmar que el desarrollo de las tecnicas de mues-treo aplicadas al estudio de poblaciones finitas se inicia, de manera sistematica, afinales del siglo XIX, alcanzando su maximo florecimiento durante el presente siglo yconstituyendo en la actualidad un campo de investigacion, tanto teorica como aplica-da, muy activo. No obstante, como en toda disciplina cientıfica, existen precedentesaislados muy anteriores que no pueden ser olvidados, y de los que citaremos los masrelevantes.

Es universalmente aceptado que la primera aplicacion importante del muestreode la que se tiene noticia fue realizada por el ingles John Graunt en sus estudiosdemograficos. Sus resultados se publicaron en el famoso trabajo Natural and PoliticalObservations made upon the Bills of Mortality aparecido en 1662. En este estudio,Graunt investigo un conjunto de familias pertenecientes a determinadas parroquiasde la ciudad de Londres, donde los registros resultaban fiables, y observo que habıaun promedio de tres fallecimientos anuales en 11 familias, siendo la cantidad total defallecimientos por ano en Londres aproximadamente de 13000. De este forma, Grauntconcluyo que el numero de familias era de 48000, y suponiendo un tamano medio

Jose A. Mayor Gallego. Proyecto Docente

Page 11: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 7

familiar de 8, estimo en 384000 el numero de habitantes de la ciudad.

Aunque aparentemente, Graunt era consciente del hecho de que los promediosestadısticos por el considerados variaban en el espacio y el tiempo, no llego a hacerhipotesis en este sentido, y de esta forma pudo extender al paıs entero los resultadosde estadısticas de vida, obtenidos para ciertas parroquias de la capital. Es interesanteobservar que otros notables demografos de los siglos XVII y XVIII, como WilliamPetty y Edmund Halley en Inglaterra, Per Wargentin en Suecia y Johann Peter Sus-milch en Alemania, adoptaron una postura similar, realizando inferencias aventuradassobre ciertas caracterısticas de una region completa sobre la base de los datos obteni-dos en una parte de la misma. Segun Chang (1976), esta forma de proceder es propiade un estado del desarrollo de la Estadıstica en el cual el conocimiento de un fenome-no demografico es caracterizado por un unico parametro, la media de la poblacion enestudio. Hald (1990) realiza una descripcion muy completa del trabajo de Graunt.

Otro precedente historico de gran relevancia lo constituye los estudios sobre la po-blacion de Francia, llevados a cabo por Laplace, y cuyos primeros resultados aparecie-ron en 1786. Sus metodos de muestreo y estimacion fueron similares a los empleadospor Graunt, pero el cientıfico frances vio la necesidad de tener en cuenta de algunaforma la precision de los resultados obtenidos, tanto en su control, seleccionando unamuestra de calidad, como en su medicion. Ası, con respecto a la eleccion de los ele-mentos, podemos encontrar la siguiente descripcion en su obra Theorie Analytiquedes Probabilites, publicada en 1812,

“En los 30 departamentos distribuidos sobre la superficie de Francia, y comoforma de compensar los efectos originados por las diferencias climaticas, esco-gimos aquellas comunidades cuyos alcaldes, por su entusiasmo e inteligencia,podıan proporcionar una informacion mas precisa.”

A partir de la muestra, Laplace estimo la poblacion total del paıs utilizando lo queactualmente conocemos como estimador de razon, calculando la distribucion de ladiferencia entre el verdadero valor y el estimado, y aproximando esta distribucion poruna normal. Tambien se puede considerar su plan de muestreo como un precedentedel muestreo por conglomerados. Vease Chang (1976).

1.3.2. Kiaer y el metodo representativo

Estos y otros precedentes aislados de la aplicacion del muestreo, constituyeronla excepcion en lo que a estudios estadısticos se refiere, pues la regla, hasta finalesdel siglo XIX era el empleo del metodo exhaustivo, es decir, censos. El desarro-llo sistematico de las tecnicas de muestreo se inicia con la aparicion del metodo

Jose A. Mayor Gallego. Proyecto Docente

Page 12: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 8

representativo, propuesto por el estadıstico noruego A.N. Kiaer en la decada de1890 y basado en la idea, tan “natural” para nosotros actualmente, de sustituir laenumeracion completa de la poblacion por una parte de la misma suficientementerepresentativa.

Kruskal y Mosteller (1980) describen de la siguiente forma el concepto que tenıaKiaer de la nueva metodologıa,

“En primer lugar, Kiaer pensaba en terminos de encuestas sociales y economi-cas, en las cuales se deberıa empezar seleccionando distritos, municipio, partesde ciudades, calles, etc, y seguir por la seleccion de unidades de estudio, es decir,hogares, familias o individuos. En segundo lugar, insistıa en la importancia delos tamanos muestrales, en todos los niveles de la seleccion. Y en tercer lugar,subrayaba la necesidad de extender el ambito de la muestra en todos los nivelesposibles, no solo de tipo geografico sino tambien en otros sentidos. Por ejem-plo, si para un estudio de economıa agraria, una muestra de granjas presentadeficiencias en las de tipo ganadero, se deben anadir elementos de esta clase.”

El metodo representativo fue presentado a la comunidad cientıfica, para su debate,en la reunion del International Statistical Institute (I.S.I), celebrada en Berna en1895, siendo la reaccion inicial negativa, principalmente por la poca receptividad devarios estadısticos de aquel momento. Ası, la principal oposicion, representada porG. von Mayrs de la Universidad de Munich, estaba basada en la creencia de queuna investigacion parcial nunca podrıa reemplazar a un censo completo. A pesarde esta resistencia, las ideas de Kiaer no fueron olvidadas, siendo debatidas en lassucesivas reuniones del I.S.I. celebradas en San Petersburgo en 1897, en Budapest en1901 y en Berlın en 1903. Es interesante observar que en esta ultima reunion, y enla discusion del metodo de Kiaer, el estadıstico frances L. March introdujo por vezprimera, aunque no con esta terminologıa, conceptos tales como muestreo aleatoriosimple sin reemplazamiento y muestreo aleatorio simple de conglomerados.Despues de un parentesis de mas de veinte anos, se elabora por fin un informe en lareunion de Roma en 1925, en el que se reconocen plenamente las ventajas del metodorepresentativo.

1.3.3. Bowley

Con los trabajos del ingles A.L. Bowley se da un impulso definitivo al desarrollode las tecnicas de muestreo, tal como actualmente las conocemos. Ası, ya en 1912,habıa realizado estudios de ındole social y economica, sobre la distribucion de lariqueza entre los habitantes de la ciudad de Reading, y habıa utilizado para ello una

Jose A. Mayor Gallego. Proyecto Docente

Page 13: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 9

muestra de hogares seleccionada aleatoriamente. Con anterioridad, en 1906, Bowleyhabıa trabajado en la verificacion empırica de un teorema central del lımite para elmuestreo aleatorio simple. Este estudio estaba motivado por una serie de resultadosteoricos debidos a Edgeworth y por su idea de poder realizar inferencias a partir de losresultados de las encuestas, independientemente del modelo aplicado a la poblacion.

Usando una rudimentaria tabla de numeros aleatorios proveniente del ultimo dıgi-to en una tabla del Nautical Almanac, Bowley selecciono una muestra aleatoria simplede 400 elementos de una poblacion de 3878 tasas de beneficio de companıas, extraıdasdel Investor’s Record. Estas 400 cantidades fueron recogidas en el orden en que apa-recieron, y colocadas en 40 grupos de 10 cada uno. De esta forma, Bowley comparo ladistribucion empırica de las 40 medias muestrales con una curva normal, encontrandoen elevado grado de adaptacion. Vease Smith (1976) y Bellhouse (1988).

Como afirma Bellhouse (1988), en su encuesta de 1912, mencionada anteriormen-te, Bowley probablemente consideraba equivalentes el muestreo aleatorio simple ycualquier esquema de muestreo en el cual las probabilidades de inclusion fueran lasmismas para todos los elementos. Para obtener la muestra en esta encuesta, recurrio ala seleccion sistematica de uno de cada diez edificios de Reading, a partir de una listade los mismas, siendo pues un precedente del llamado muestreo sistematico. Aunqueen trabajos posteriores reconocio las diferencias existentes entre el muestreo aleatoriosimple y el sistematico, con respecto a su eficiencia, en esta encuesta considero equi-valentes ambos procedimientos, de manera que pudo hacer consideraciones acerca dela precision de los resultados, tomando como base el citado trabajo de 1906.

Finalmente, como otras importantes aportaciones de Bowley, citaremos el des-arrollo de una teorıa para la seleccion intencional o “purposive sampling” de conglo-merados, y su trabajo preparatorio para la discusion del metodo representativo enla reunion del I.S.I. de 1925 en Roma, ya mencionada anteriormente. De este tra-bajo, publicado en el boletın de este instituto, en 1926, resaltamos dos cuestionesimportantes:

1. La importancia de que la poblacion esta definida como una lista o directorio deelementos, accesibles en caso de ser seleccionados, de donde extraer la muestra.Es decir, se requiere un marco de elementos numerados, indexados o etiqueta-dos.

2. La definicion y la teorıa del muestreo aleatorio simple estratificado conafijacion proporcional, y seleccion de elementos individuales (no conglomera-dos).

vease Hansen y Madow (1976).

Jose A. Mayor Gallego. Proyecto Docente

Page 14: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 10

1.3.4. Neyman

En 1934, J. Neyman publico en la revista de la Royal Statistical Society de Lon-dres, su importante trabajo On the Two Different Aspects of Representative Method:The Method of Stratified Sampling and the Method of Purposive Selection, que es-timulo numerosos desarrollos posteriores en la teorıa y los metodos del muestreo.Para comprenderlo basta considerar los siguientes puntos en los que Hansen y Ma-dow (1976) resumen los logros de Neyman,

1. Enfatizo la importancia de la seleccion aleatoria con respecto a la seleccion in-tencional y la necesidad de usar muestras basadas en un numero relativamenteelevado de unidades de muestreo no muy extensas cuando estas son conglome-rados de los elementos en estudio.

2. Definio el problema de la afijacion optima en muestreo aleatorio simple estrati-ficado, minimizando la varianza de la estimacion con un tamano muestral fijo.

3. Extendio el muestreo aleatorio simple estratificado al muestreo de grupos, o, co-mo hoy los llamamos, conglomerados, incluyendo la utilizacion del estimador derazon como una consecuencia inmediata del hecho de que con muestras de con-glomerados, tanto el numerador como el denominador en las medias muestrales,son variables aleatorias.

4. Introdujo el concepto de intervalo de confianza.

5. Aplico al campo del muestreo el metodo de Gauss-Markov para la obtencion deestimadores insesgados de mınima varianza.

6. Estudio el muestreo intencional,

a) Definiendo un modelo basado en lo que hoy denominamos muestras balan-ceadas.

b) Determinando las condiciones que se han de verificar para que este tipo demuestreo posea las propiedades adecuadas.

c) Estudiando los efectos del sesgo, la consistencia y la varianza, cuando di-chas condiciones no se cumple.

d) Ilustrando la perdida de robustez de este metodo.

Jose A. Mayor Gallego. Proyecto Docente

Page 15: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 11

7. Remarco la normalidad aproximada, para muestras grandes, de los estimadoreslineales, y por consiguiente, el uso del cociente tipificado,

θ − θ

σ[θ]

cuando θ es un estimador del parametro poblacional θ, y σ[θ] es un estimadorde la desviacion tıpica de θ.

Es importante observar que algunos de los resultados obtenidos por Neyman enrelacion con la afijacion optima y otras cuestiones, habıan sido hallados independien-temente por el ruso Tschuprow en 1923. Desgraciadamente, los trabajos de este yotros estadısticos de la misma nacionalidad no tuvieron difusion ni continuidad. Apesar de ello, no se pueden ignorar estas contribuciones que, segun Chang (1976),permiten afirmar sin exageracion que Rusia fue, cronologicamente, el primer centrode estudio de la moderna teorıa matematica del muestreo. Vease Zarkovich (1956,1962).

El trabajo de Neyman provoco una reaccion inmediata en la comunidad estadısticaeuropea. Ası, ya en 1935, P.V. Sukhatme estudio el problema de la afijacion optimacuando no se conocen las varianzas de los estratos, proponiendo el uso de estimacionespreliminares, y en el mismo ano, Yates y Zacopanay realizaron una formulacion masgeneral que la de Neyman, introduciendo como factor a tener en cuenta el coste derealizar el muestro.

La difusion de las ideas de Neyman a nivel mundial recibio un fuerte estımulo conlas clases y conferencias sobre muestreo que impartio en los Estados Unidos en 1937,y en cuyos debates surgieron y fueron resueltas nuevas e importantes cuestiones, comoel “muestreo doble” o “muestreo en dos fases”, lo que se recoge en Neyman (1938).

1.3.5. Hansen y Hurwitz

Las ensenanzas de Neyman en los Estados Unidos produjeron rapidamente sus fru-tos en el Bureau of Census, con los trabajos de M. Hansen, W. Hurwitz y sus colegas.Estos trabajos cubren aspectos practicos relacionados con el diseno de encuestas degran alcance, que han llegado a ser clasicas y tomadas como modelo en otros paıses,como por ejemplo la denominada “Current Population Survey”. En Stephan, De-ming y Hansen (1940), Hansen y Madow (1976) y Hansen (1987) pueden encontrarsedescripciones de los metodos de muestreo empleados en estas macroencuestas.

Jose A. Mayor Gallego. Proyecto Docente

Page 16: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 12

En relacion al desarrollo teorico de los metodos de muestreo, Hansen y Hurwitzhicieron, en los anos 1942 y 1943, aportaciones importantes al muestreo por con-glomerados, entre ellas la formulacion general de la varianza, y su relacion con elcoeficiente de correlacion entre clases. Ademas introdujeron un esquema de muestreocon reemplazamiento y probabilidades variables, ası como el estimador apropiado aeste esquema, conocido como estimador de Hansen-Hurwitz.

Citaremos tambien sus investigaciones, aparecidas en 1946, sobre el problema de lafalta de respuesta en las encuestas y su tratamiento, para cuya resolucion disenaronla metodologıa de rellamadas; y sus estudios sobre los errores ajenos al muestreo,es decir introducidos por los entrevistadores o en la manipulacion de datos, y queaparecieron publicados en dos trabajos de los anos 1951 y 1961.

Finalmente, es obligado mencionar su importante tratado de muestreo “SampleSurvey Methods and Theory”, escrito en colaboracion con W.G. Madow, y que apare-cio en 1953. Esta obra es un compendio enciclopedico de los conocimientos de muestreoexistentes hasta esta fecha, tanto a nivel de desarrollo teorico, como de aplicacionespracticas.

1.3.6. Aportaciones desde la decada de los 40

El perıodo comprendido entre la decada de los 40 y nuestros dıas ha estado plagadode numerosas aportaciones realizadas por gran cantidad de investigadores. Enume-rarlas en su totalidad se sale de la finalidad de esta breve introduccion por lo que noslimitaremos a exponer, de forma cronologica, una muestra (intencional) de las queusualmente se consideran mas decisivas para el desarrollo del muestreo.

En primer lugar, no podemos olvidar la importancia que ciertas organizacioneshan tenido en este desarrollo, ya sea por haber iniciado nuevas metodologıas de inves-tigacion con encuestas, ya sea por la relevancia de las personas que han trabajado enellos. Al ya citado Bureau of the Census, anadiremos el Laboratorio de Estadıstica dela Universidad de Iowa donde han trabajado matematicos de la talla de W. Cochrany P.V. Sukhatme, y el Indian Statistical Institute, organizado por P.C. Mahalanobis,y que tambien habıa sido pionero en la realizacion de grandes encuestas en la In-dia, a lo largo de los anos 30, para cuyo tratamiento se empezo a utilizar el metodode submuestras interpenetrantes o muestras replicadas, desarrollado inicialmen-te por Mahalanobis, y que permite controlar en cierta medida los errores ajenos almuestreo.

En 1944, W.G. Madow y L.H. Madow presentaron la teorıa del muestreo sistemati-co, que ya habıa sido utilizado de forma empırica por Bowley, y que posteriormente seenriquecio con las aportaciones de los mismos Madow y tambien de Cochran y Yates

Jose A. Mayor Gallego. Proyecto Docente

Page 17: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 13

entre otros.

En 1950 aparecen las investigaciones de R. Goodman y L. Kish sobre la seleccioncontrolada, que basicamente consiste en acotar las probabilidades de ciertas muestrasno deseadas. Y en 1951, R. Narain inicia el estudio del muestreo sin reemplazamien-to y probabilidades variables. Este campo se amplio rapidamente con importantesaportaciones de D. Lahiri en 1951, con su metodo de seleccion de elementos que pro-porciona un estimador de razon insesgado, de H. Midzuno en 1952, con su esquemapara obtener probabilidades de inclusion proporcionales al tamano, y de D. Horvitzy D. Thompson en 1952 con el desarrollo de una tecnica general basada en el empleode su estimador, para cuya varianza propusieron un estimador insesgado. En 1953,A. Sen e independientemente F. Yates y P. Grundy, enriquecieron este tema con laintroduccion de un estimador insesgado alternativo para la varianza, mas eficaz enalgunos aspectos.

Desde entonces hasta la actualidad se han desarrollado una gran cantidad de pro-cedimientos para obtener muestras sin reemplazamiento y probabilidades de inclusionvariables. Para dar una idea de la actividad investigadora en este campo diremos queen Brewer y Hanif (1983) se realiza un estudio pormenorizado de 50 metodos de estetipo.

Tambien en la decada de los anos 50 se realizan investigaciones sobre los meto-dos mas apropiados para estratificar una poblacion, siendo de especial relevancia lasaportaciones de T. Dalenius, M. Gurney, J. Hodges y G. Ekman, que proporcionandiferentes reglas para determinar los puntos de corte que delimitan los estratos, sobrela misma variable de estudio u otra auxiliar relacionada con ella.

Otro campo importante de investigacion lo constituye el desarrollo de tecnicas parael tratamiento de la falta de respuesta y de las respuestas intencionalmente erroneas.Con respecto a la falta de respuesta, este terreno ha sido enriquecido con los estudios,ya citados, de Hansen y Hurwitz en 1946, de A. Politz y W. Simmons en 1949 y 1950,y de W. Deming en 1953. Para el tratamiento de caracterısticas especiales que danlugar a respuestas falsas, se han desarrollado los metodos de respuesta aleatorizadacon las aportaciones de S. Warner en 1965 y de W. Simmons.

En tiempo mas recientes, y cuando el muestreo ha obtenido un desarrollo tecni-co importante, se empiezan a estudiar sus fundamentos teoricos con cierto sentidocrıtico. La teorıa clasica del muestreo se sustenta, basicamente en la aleatorizacionintroducida por el diseno, lo que se suele conocer como enfoque de poblacion fija.A pesar de los grandes avances obtenidos en el mismo y de la importancia practicademostrada a lo largo de los anos, V. Godambe, en 1955, demostro las limitacionesde este enfoque, en cuanto a la existencia de estimadores optimos, y su trabajo esti-mulo posteriores investigaciones sobre las propiedades deseables para los estimadores

Jose A. Mayor Gallego. Proyecto Docente

Page 18: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 14

y criterios de seleccion de los mismo, con la introduccion de nuevos conceptos talescomo admisibilidad y minimaximalidad, y ademas alento el estudio en profundidadde los fundamentos de la inferencia en el contexto del muestreo. En este sentido, ci-taremos la importante obra de C. Cassel, C. Sarndal y J. Wretman, Foundations ofInference in Survey Sampling, publicada en 1977.

Otro efecto importante de la necesidad de revisar los fundamentos del muestreoen poblaciones finitas fue el activar enormemente el estudio del enfoque alternativo,conocido como enfoque de superpoblacion, consistente en suponer que los valo-res de la variable de estudio, asociados a las diferentes unidades, no son cantidadesfijas sino realizaciones de variables aleatorias sobre las que se supone una estructuraestocastica especıfica.

Este punto vista ya fue utilizado, de forma explıcita, en 1946 por W. Cochran en suartıculo clasico sobre la eficiencia del muestreo sistematico, pero alcanza su maximoauge con los trabajos de R. Royall y su escuela, en los anos 70. Estos estudios hangenerado ciertas controversias entre los partidarios de ambos enfoques lo que a su vezha servido para enriquecer aun mas los estudios sobre el tema. Citemos por ejemplolas crıticas del mismo Hansen, recogidas en Hansen et al. (1983). Vease tambienBellhouse (1988).

Las investigaciones actuales sobre muestreo abarcan numerosos aspectos entre losque citaremos los que se relacionan con la inferencia, tanto bajo el enfoque de po-blacion fija como bajo el de superpoblacion; el analisis de los datos procedentes deencuestas realizadas con disenos complejos; y los metodos de seleccion con probabili-dades variables. Vease Azorın y Sanchez-Crespo (1986) y Sanchez-Crespo (1991).

Referencias

[1] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

[2] Bellhouse, D.R. (1988). ‘A brief history of random sampling methods’. Handbookof Statistics 6. Sampling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[3] Brewer, K.R.W. y Hanif, M. (1983). Sampling with Unequal Probabilities. Springer-Verlag. New York.

[4] Cassel, C., Sarndal, C. y Wretman, J. (1977). Foundations of Inference in SurveySampling. Wiley. New York.

Jose A. Mayor Gallego. Proyecto Docente

Page 19: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 15

[5] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

[6] Chang, W.-C. (1976). ‘Statistical theories and sampling practice’. On the His-tory of Statistics and Probability. D.B. Owen (ed.). Dekker. New York.

[7] Dalenius, T. (1988). ‘A first course in survey sampling’. Handbook of Statistics6. Sampling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[8] Garcıa Espana, E. (1974). Diseno de la encuesta general de poblacion. InstitutoNacional de Estadıstica. Madrid.

[9] Hald, A. (1990) A History of Probability and Statistics and Their Applicationsbefore 1750. Wiley. New York.

[10] Hansen, M.H. (1987). ‘Some history and reminiscences on survey sampling’.Statistical Science. 2, pp. 180-190.

[11] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol I y II. Wiley. New York.

[12] Hansen, M.H. y Madow, W.G. (1976). ‘Some important events in the historicaldevelopment of sample surveys’. On the History of Statistics and Probability.D.B. Owen (ed.). Dekker. New York.

[13] Hansen, M.H., Madow, W.G. y Tepping, B.J. (1983). ‘An evaluation of model-dependent and probability-sampling inferences in sample surveys’. J. Amer.Statist. Assoc. 78, pp. 776-807.

[14] Kruskal, W. y Mosteller, F. (1980). ‘Representative sampling, IV: the historyof the concept in statistics, 1895-1939’. Internat. Statist. Rev. 48, pp. 169-195.

[15] Neyman, J. (1934). ‘On the two different aspects of the representative me-thod. The method of stratified sampling and the method of purposive selection’.J. Roy. Statist. Soc. 97, pp. 558-606.

[16] Neyman, J. (1938). ‘Contribution to the theory of sampling human populations’.J. Amer. Statist. Assoc. 33, pp. 101-116.

[17] Smith, T.M.F. (1976). ‘The foundations of survey sampling’. J. Amer. Statist.Assoc. 139, pp. 183-204.

[18] Sanchez-Crespo, J.L. (1991). ‘El muestreo de poblaciones finitas en Espana y suposicion en el contexto internacional’. Estadıstica Espanola. 128, pp. 421-439.

Jose A. Mayor Gallego. Proyecto Docente

Page 20: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

INTRODUCCION 16

[19] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York.

[20] Stephan, F.F., Deming, W.E. y Hansen, M.H. (1940). ‘The sampling procedureof the 1940 Population Census’. J. Amer. Statist. Assoc. 35, pp. 615-630.

[21] Zarkovich, S.S. (1956). ‘Note on the history of sampling methods in Russia’.J. Roy. Statist. Soc. 119, pp. 336-338.

[22] Zarkovich, S.S. (1962). ‘Note on the history of sampling methods in Russia(suppl.)’. J. Roy. Statist. Soc. 125, pp. 580-582.

Jose A. Mayor Gallego. Proyecto Docente

Page 21: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

Capıtulo 2

Relacion de temas y comentarios alos mismos

En este capıtulo, exponemos en primer lugar la relacion de temas que cubren losconocimientos de Muestreo en Poblaciones Finitas, clasificandolos por afinidadde contenidos, en agrupaciones que denominamos Bloques Tematicos, e indicando encada tema sus correspondientes contenidos.

En la segunda parte del capıtulo, realizamos una serie de consideraciones sobrelos diferentes temas presentados. Con estos comentarios pretendemos, de una formasecuenciada segun el orden de los temas, resaltar los principales topicos y la forma deintroducirlos.

Al final de cada bloque tematico comentado se exponen las referencias realiza-das en el mismo, con el fin de agilizar la busqueda y consulta de las mismas. Estasreferencias, que comprenden tanto libros y manuales como artıculos en revistas ycompilaciones especıficas, no pretenden ser, en modo alguno, exhaustivas, ya que sufinalidad es proporcionar fuentes de informacion adecuadas al nivel a los conocimien-tos que proponemos. Ası, los criterios que se han seguido en su seleccion son la deformar un agregado de informacion lo mas completo posible y no excesivamente rei-terativo, la claridad en los contenidos, el tratamiento profundo de las cuestiones y laaccesibilidad.

17

Page 22: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 18

Relacion de temas

Bloque Tematico I. Introduccion

TEMA 1. Objetivos del muestreo en poblaciones finitas. Desarrollohistorico.

Estudio de poblaciones: Censos y encuestas.

Finalidad e importancia del muestreo en poblaciones finitas.

Campos de aplicacion.

Notas historicas.

TEMA 2. Conceptos basicos.

Poblacion, muestra y marco.

Variables y parametros.

Fuentes de error en las encuestas por muestreo.

Fases de una encuesta por muestreo.

TEMA 3. Herramientas para el desarrollo de la teorıa y la practicadel muestreo.

Generacion de variables aleatorias uniformes. Numeros aleatorios.

Seleccion de objetos con probabilidades dadas.

• Metodo acumulativo.

• Metodo de Lahiri.

Esperanza y varianza condicionadas. Resultados fundamentales.

Orden de convergencia a cero de funciones de variable natural.

Jose A. Mayor Gallego. Proyecto Docente

Page 23: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 19

TEMA 4. Diseno muestral.

Muestras ordenadas y no ordenadas.

Disenos muestrales: diferentes enfoques. Reduccion.

Tamano muestral. Parametros asociados.

Disenos muestrales relevantes.

• Diseno universal uniforme, MU(N).

• Diseno de Bernoulli, MB(N, p).

• Diseno de Poisson, MP(N,p).

• Diseno muestral aleatorio simple, MAS(N, n). Caso con reemplazamiento,MASR(N, n).

• Disenos muestrales particion o unicluster.

TEMA 5. Probabilidades de inclusion.

Probabilidades de inclusion. Matriz del diseno.

Variables indicadoras.

• Distribucion de probabilidad.

• Esperanza, varianza y covarianza.

Relaciones fundamentales.

Aplicacion a disenos muestrales importantes.

TEMA 6. Esquemas de muestreo.

Obtencion de muestras pertenecientes a un diseno

• Obtencion global.

• Obtencion secuencial.

Implementacion de un diseno muestral. Esquema de muestreo.

Teorema de equivalencia.

Esquemas muestrales relevantes.

Jose A. Mayor Gallego. Proyecto Docente

Page 24: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 20

Bloque Tematico II. Inferencia en muestreo en poblacionesfinitas

TEMA 7. Estadısticos y estimadores.

El concepto de estadıstico en en contexto del muestreo en poblaciones finitas.Distribucion en el muestreo.

Estimadores de parametros poblacionales. Operadores asociados.

Propiedades de los estimadores.

Intervalos de confianza.

Ejemplos relevantes.

TEMA 8. Construccion de estimadores.

Construccion de estimadores insesgados. Ejemplos.

• Disenos sin reemplazamiento: Estimador de Horvitz-Thompson.

• Disenos con reemplazamiento: Estimador de Hansen-Hurwitz.

Caracterizacion de estimadores lineales homogeneos insesgados respecto a unparametro lineal. Construccion.

Simetrizacion. Ejemplos.

TEMA 9. Criterios de optimalidad. Resultados de existencia.

Estimadores admisibles.

Estrategias admisibles.

Hiperadmisibilidad.

Estimadores insesgados uniformemente de mınima varianza: Existencia.

Estimadores y estrategias minimax.

Jose A. Mayor Gallego. Proyecto Docente

Page 25: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 21

TEMA 10. Estimador de Horvitz-Thompson.

Definicion y propiedades.

Varianza. Estimacion insesgada.

Caso de tamano muestral fijo: formula de Yates-Grundy-Sen.

Aplicacion al diseno muestral aleatorio simple y al diseno de Bernoulli.

TEMA 11. Estimador de Hansen-Hurwitz.

Muestreo con reemplazamiento.

Estimador de Hansen-Hurwitz. Propiedades.

Varianza. Estimacion insesgada.

Eficiencia en comparacion con el estimador de Horvitz-Thompson.

Aplicacion al muestreo aleatorio simple con reemplazamiento, MASR(N, n).

TEMA 12. Modelos de superpoblacion.

Concepto de superpoblacion.

Modelos clasicos de superpoblacion.

Estrategias optimas en el modelo GT .

Estrategias optimas en el modelo ET .

TEMA 13. Inferencia bajo modelos de superpoblacion.

Prediccion. Resultados de optimalidad.

Prediccion no basada en informacion auxiliar.

Prediccion basada en informacion auxiliar.

• Modelo de superpoblacion GR.

• Modelo de superpoblacion GMR.

Tecnicas bayesianas.

Jose A. Mayor Gallego. Proyecto Docente

Page 26: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 22

TEMA 14. Cuestiones complementarias.

Estimacion sobre multiples variables.

Tratamiento de variables cualitativas.

Estimacion en subpoblaciones.

Efectos del diseno y del estimador.

Bloque Tematico III. Muestreo aleatorio simple

TEMA 15. Diseno muestral aleatorio simple.

Descripcion y propiedades.

Obtencion de muestras aleatorias.

• Usando el diseno.

• Metodos secuenciales con conocimiento del tamano poblacional.

• Metodos secuenciales sin conocimiento del tamano poblacional.

• Obtencion simultanea de varias muestras.

• Metodo de insercion.

TEMA 16. Estimacion sobre variables cuantitativa.

Estimadores de Horvitz-Thompson para la media y el total poblacional.

Varianza y su estimacion.

Propiedades de optimalidad de y.

Caso con reemplazamiento.

Estudio de la varianza de s2y y sy

Tamano muestral.

Jose A. Mayor Gallego. Proyecto Docente

Page 27: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 23

TEMA 17. Estimacion sobre variables cualitativas.

Estimacion de la proporcion de una caracterıstica dicotomica.

Varianza y su estimacion.

Intervalos de confianza para proporciones.

Caracterısticas con mas de dos modalidades.

• Intervalos de confianza simultaneos.

Tamano muestral.

TEMA 18. Proporciones pequenas. Muestreo Inverso.

El problema de la estimacion de proporciones pequenas.

El metodo de muestreo inverso. Diseno muestral resultante.

Estimacion insesgada de la proporcion.

Varianza y su estimacion.

Tamano muestral.

TEMA 19. Estimacion en subpoblaciones.

Concepto de subpoblacion. Tecnicas para su estudio.

Estimacion del tamano de una subpoblacion.

Estimacion de parametros en la subpoblacion.

• Media.

• Total.

• Proporciones.

Jose A. Mayor Gallego. Proyecto Docente

Page 28: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 24

Bloque Tematico IV. Estimacion de la varianza

TEMA 20. Estimacion de funciones de parametros.

El problema de la estimacion de la varianza: Parametros no lineales y/o disenoscomplejos.

Estimacion de una funcion de parametros poblacionales. Metodo de analogıa.

Caso de funcion lineal. Aplicacion al diseno muestral aleatorio simple.

Caso de funcion no lineal. Metodo de linealizacion.

TEMA 21. Estimadores de la razon y del producto.

Razon de dos parametros poblacionales.

• Varianza y su estimacion.

• Razon de medias o totales poblacionales. Aplicacion al diseno muestralaleatorio simple. Estudio del sesgo.

• Aplicacion del estimador de la razon a la estimacion en subpoblaciones.

Producto de dos parametros poblacionales.

• Varianza y su estimacion.

• Producto de medias poblacionales. Aplicacion al diseno muestral aleatoriosimple. Estudio del sesgo.

TEMA 22. Metodos de replicacion y de exploracion intensiva.

Metodos de replicacion. Aplicacion.

• Justificacion teorica.

• Muestras replicadas independientes.

• Muestras replicadas dependientes.

Metodos de exploracion intensiva de una muestra.

• Jackknife.

• Bootstrap.

• Tecnicas de semimuestras.

Jose A. Mayor Gallego. Proyecto Docente

Page 29: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 25

Bloque Tematico V. Muestreo sistematico

TEMA 23. Diseno muestral sistematico. Variantes

Disenos muestrales sistematicos. Ejemplos y aplicaciones.

Diseno muestral sistematico uniforme de paso k. Probabilidades de inclusion.

Variabilidad y control del tamano muestral.

Variantes del muestreo sistematico pata controlar el tamano muestral.

TEMA 24. Estimacion de parametros. Eficiencia

Estimacion de parametros lineales.

• Media. Estimacion y varianza.

• Total. Estimacion y varianza.

• Consideraciones sobre el error de muestreo para diferentes tipos de pobla-ciones.

Eficiencia. Comparacion con muestreo aleatorio simple.

TEMA 25. Estimacion de la varianza: diferentes enfoques.

El problema de la estimacion de la varianza en muestreo sistematico.

Estimacion de la varianza bajo modelos de superpoblacion.

• Modelo de superpoblacion completamente aleatorio.

• Modelo de superpoblacion con tendencia lineal.

• Modelo de superpoblacion con tendencia periodica.

Disenos sistematicos cuantificables.

• Reorganizacion aleatoria de la poblacion.

• Metodos de distancias multiples.

• Metodos de composicion.

• Metodos de partida multiple.

Tecnicas de replicacion.

Jose A. Mayor Gallego. Proyecto Docente

Page 30: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 26

Bloque Tematico VI. Muestreo con probabilidades variables

TEMA 26. Disenos muestrales ΠPS. Generalidades

Uso de variables auxiliares de tamano. Disenos ΠPS.

Condiciones sobre las probabilidades de inclusion de primer y segundo orden.

Estudio analıtico del estimador de Horvitz-Thompson bajo modelos de variableauxiliar de tamano.

• Modelo de proporcionalidad directa.

• Modelo de regresion lineal.

TEMA 27. Disenos muestrales ΠPS con n = 2

Metodo de Brewer.

Metodo de Durbin.

Metodo de J.N.K. Rao.

Metodo Sunter.

Metodo de Narain.

Metodo de Hanurav.

TEMA 28. Disenos muestrales ΠPS con n > 2. Metodos de seleccionaleatoria.

Introduccion. Acceso aleatorio a los elementos de la poblacion.

Metodo de Lahiri-Midzuno.

• Metodo directo. Estimacion insesgada de la razon.

• Metodo con probabilidades revisadas. Limitaciones.

Metodo de Sampford.

Metodo de Hedayat y Lin.

Jose A. Mayor Gallego. Proyecto Docente

Page 31: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 27

TEMA 29. Disenos muestrales ΠPS con n > 2. Metodos de exploracionsecuencial.

Introduccion. Acceso secuencial a los elementos de la poblacion.

Metodo sistematico de Madow.

Metodo de Sunter.

Metodo secuencial cuasi-equilibrado.

TEMA 30. Esquemas muestrales PPS. Estimadores especiales

Seleccion de elementos con probilidades proporcionales al tamano y con reem-plazamiento. Estimador de Hansen-Hurwitz.

Seleccion de elementos con probilidades proporcionales al tamano y con reem-plazamiento. Estimadores especiales.

• Estimador de Des Raj.

• Estimador de Murthy.

TEMA 31. Metodo de los grupos aleatorios.

Diseno muestral de los grupos aleatorios.

Estimador de Rao-Hartley-Cochran.

Varianza y su estimacion.

Eleccion optima de los tamanos de los grupos aleatorios.

Bloque Tematico VII. Muestreo estratificado

TEMA 32. Poblacion estratificada. Diseno muestral.

Conceptos basicos de muestreo estratificado. Objetivos.

Estructura de estratos en una poblacion. Caracterısticas deseables.

Diseno muestral estratificado.

Descomposicion del estimador de Horvitz-Thompson y su varianza.

Jose A. Mayor Gallego. Proyecto Docente

Page 32: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 28

TEMA 33. Muestreo aleatorio simple estratificado. Estimaciones.

Muestreo aleatorio simple estratificado. Diseno muestral.

Estimaciones de parametros lineales.

• Media poblacional.

• Total poblacional.

• Proporcion poblacional.

Estimacion de parametros no lineales. Estimacion de la razon.

• Estimador separado.

• Estimador combinado.

• Comparacion de ambos estimadores.

TEMA 34. Afijacion.

El problema de la afijacion. Tipos de afijacion.

• Afijaciones proporcionales.

• Afijaciones optimas.

• Afijaciones optimas modificadas.

• Uso de una variable auxiliar conocida.

Tamano muestral.

TEMA 35. Eficiencia del muestreo estratificado.

Precision en relacion al muestreo no estratificado.

• Afijacion proporcional.

• Afijacion optima.

• Estimacion del efecto del diseno.

Coste en relacion al muestreo no estratificado.

Jose A. Mayor Gallego. Proyecto Docente

Page 33: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 29

TEMA 36. Metodos de estratificacion de una poblacion.

Costruccion de los estratos.

• Metodo de Dalenius-Gurney.

• Metodo de Dalenius-Hodges.

• Metodo de Ekman.

Determinacion del numero de estratos.

TEMA 37. Tecnicas especiales en muestreo estratificado.

Post-estratificacion.

• Estimacion de la media poblacional.

• Varianza y su estimacion.

Tecnicas de semimuestras.

• Semimuestras balanceadas.

• Semimuestras completamente balanceadas.

• Estimaciones de parametros no lineales.

Bloque Tematico VIII. Muestreo por conglomerados

TEMA 38. Poblacion estructurada en conglomerados. Muestreo porconglomerados en una etapa.

Estructura de conglomerados en una poblacion. Objetivos del muestreo porconglomerados.

Procedimientos practicos de muestreo por conglomerados.

Muestreo por conglomerados en una etapa.

Estimacion de parametros lineales.

• Seleccion de conglomerados mediante diseno muestral aleatorio simple.

Estimaciones directas.

Estimaciones basadas en razon.

Jose A. Mayor Gallego. Proyecto Docente

Page 34: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 30

• Seleccion de conglomerados con probabilidades de inclusion proporcionalesal tamano.

Estimacion de parametros no lineales. Razon de medias.

Efecto del diseno.

TEMA 39. Muestreo por conglomerados en dos etapas.

Muestreo por conglomerados en dos etapas. Diseno muestral.

Estimacion de parametros lineales.

• Seleccion de conglomerados y unidades finales mediante diseno muestralaleatorio simple.

Estimaciones directas.

Estimaciones basadas en razon.

• Seleccion de conglomerados con probabilidades de inclusion proporcionalesal tamano, y de unidades finales mediante muestreo aleatorio simple.

Estimacion de parametros no lineales. Razon de medias.

Seleccion de conglomerados con reemplazamiento.

Eleccion optima de tamanos muestrales.

TEMA 40. Muestreo multietapico. Tecnicas de replicacion.

Muestreo por conglomerados en mas de dos etapas. Metodologıa general.

Desarrollo del muestreo por conglomerados en tres etapas utilizando disenomuestral aleatorio simple en todas las etapas.

Metodos de replicacion.

TEMA 41. Estimaciones con disenos complejos usando el programaPC CARP.

Generalidades y ambito de aplicacion del programa PC CARP.

Estructura de los datos de entrada.

Estimadores empleados por PC CARP.

Jose A. Mayor Gallego. Proyecto Docente

Page 35: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 31

Resolucion practica de diferentes situaciones.

• Muestreo aleatorio basico.

• Muestreo aleatorio estratificado.

• Muestreo por conglomerados en una y dos etapas.

• Muestreo por conglomerados sobre una poblacion estratificada.

Bloque Tematico IX. Empleo de informacion auxiliar en laestimacion

TEMA 42. Estrategias que utilizan informacion auxiliar.

Informacion auxiliar en la fase de muestreo.

Informacion auxiliar en la fase de estimacion.

• Enfoque heurıstico del problema. Ejemplos.

• Enfoque predictivo basado en modelos de ajuste. Ejemplos.

TEMA 43. Estimadores de razon.

Solucion heurıstica.

Solucion basada en el modelo de superpoblacion de proporcionalidad directa.

• Aplicacion al diseno muestral MAS(N, n).

• Aplicacion a los disenos ΠPS.

Estrategias insesgadas y cuasi-insesgadas.

• Estrategia basada en el esquema de Lahiri-Midzuno.

• Estrategia basada en el estimador de Hartley-Ross.

• Estrategia basada en el estimador de Mickey.

• Estrategias cuasi-insesgadas.

Estimador de razon multivariante.

Estimador de razon y estratificacion.

• Estimacion separada.

• Estimacion combinada.

Optimalidad del estimador de razon.

Jose A. Mayor Gallego. Proyecto Docente

Page 36: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 32

TEMA 44. Estimadores de regresion.

Solucion heurıstica.

Solucion basada en el modelo de superpoblacion de regresion.

• Aplicacion al diseno muestral MAS(N, n).

• Aplicacion a los disenos ΠPS.

Estrategias insesgadas.

• Estrategia I de Singh y Srivastava.

• Estrategia II de Singh y Srivastava.

Estimador de regresion multivariante.

Estimador de regresion y estratificacion.

• Estimacion separada.

• Estimacion combinada.

TEMA 45. Estimadores especiales.

Estimador de diferencia.

Estimador de producto.

Bloque Tematico X. Cuestiones especiales de muestreo y esti-macion.

TEMA 46. Muestreo doble o muestreo en dos fases.

Descripcion del metodo.

Estimador de Horvitz-Thompson modificado o π∗-estimador.

Muestreo doble y estratificacion.

Muestreo doble y estimador de razon.

Muestreo doble y estimador de regresion.

Muestreo doble y estimador de diferencia.

Jose A. Mayor Gallego. Proyecto Docente

Page 37: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 33

TEMA 47. Muestreo en ocasiones sucesivas.

Descripcion del metodo.

Estimacion de la media.

Estimaciones del cambio.

Estimacion de la suma de medias.

Estimacion conjunta del cambio y de la media.

Generalizacion a mas de dos ocasiones.

TEMA 48. Muestreos no probabilısticos.

Aplicaciones de muestreos no probabilısticos.

Muestreo por cuotas.

Muestreo balanceado.

Muestreo “cut-off”.

TEMA 49. Estimacion sobre subpoblaciones muy pequenas.

Planteamiento del problema. Mixturas concentradas. Ejemplos.

Estimacion de la proporcion y el total. Limitacion de los metodos clasicos.

Cotas de confianza basadas en atributos.

• Diseno muestral aleatorio simple.

• Diseno muestral aleatorio simple estratificado.

• Disenos ΠPS.

Cotas de confianza basadas en atributos y variables.

Cotas de confianza a partir de la distribucion multinomial.

Aplicacion de tecnicas de bayesianas.

Jose A. Mayor Gallego. Proyecto Docente

Page 38: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 34

TEMA 50. Estimacion de la mediana y otros cuantiles poblacionales.

Funcion de distribucion poblacional. Propiedades y estimacion.

Estimacion de la mediana poblacional.

• Intervalos de confianza.

Estimacion de cuantiles poblacionales.

TEMA 51. Estimacion del tamano poblacional.

Metodos de captura y recaptura.

• Muestreo directo.

• Muestreo inverso.

• Estimacion de razon.

Muestreo por cuadros.

Muestreo por cuadros cargados.

Bloque Tematico XI. No respuesta y otras fuentes de error.

TEMA 52. Caracterısticas y efectos de la no respuesta.

Introduccion al problema de la no respuesta.

• Definicion y conceptos relacionados.

• Conjuntos de respuesta.

• Efectos de la no respuesta. Sesgos.

Medidas de la no respuesta.

Enfoques del problema de la no respuesta.

Jose A. Mayor Gallego. Proyecto Docente

Page 39: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 35

TEMA 53. Metodos especiales de muestreo en presencia deno respuesta.

Metodo de submuestreo en el conjunto de no respondientes.

• Planteamiento general.

• Distribucion de respuesta uniforme.

• Respuesta determinıstica.

Metodo de Deming.

Metodo de Politz y Simmons.

TEMA 54. Estimadores especiales.

Introduccion. Estimador ponderado para modelos simples de respuesta.

Modelo de respuesta homogenea por grupos.

• Estimadores ponderados.

• Estimadores ponderados y con informacion auxiliar.

TEMA 55. Imputacion.

Introduccion y conceptos basicos. Finalidad de la imputacion.

Imputacion media global y por clases.

Metodos “hot-deck” y “cold-deck”.

• “hot-deck” secuencial.

• “hot-deck” local.

Imputacion aleatoria global y por clases.

Metodos de regresion.

Imputacion multiple.

Metodologıa de Fellegi y Holt. “Edits”.

Jose A. Mayor Gallego. Proyecto Docente

Page 40: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 36

TEMA 56. Metodos de respuesta aleatorizada

Problematica en el estudio de caracterısticas comprometedoras. Efectos en lasestimaciones.

Metodo de la pregunta relacionada.

Metodo de la pregunta no relacionada.

• Con conocimiento de la proporcion verdadera de la caracterıstica no rela-cionada.

• Con conocimiento de una estimacion de la proporcion de la caracterısticano relacionada.

• Sin conocimiento de la proporcion de la caracterıstica no relacionada.

Estudio de caracterısticas con mas de dos modalidades.

Estudio de caracterısticas cuantitativas.

TEMA 57. Errores originados por marcos inadecuados y errores deobservacion.

Efecto de la imperfeccion del marco en las estimaciones. Diferentes enfoquesdel problema.

• Depuracion del marco.

• Depuracion de la muestra. Estimadores especiales.

Errores de observacion. Modelos de error.

• Estudio de la media muestral bajo diseno MAS(N, n).

• Estimacion de las componentes de la varianza.

Bloque Tematico XII. Disenos optimos y disenos controlados.

TEMA 58. Disenos optimos en modelos de proporcionalidad directa.

Planteamiento del problema. Criterios de optimalidad.

Modelo de proporcionalidad directa global.

Jose A. Mayor Gallego. Proyecto Docente

Page 41: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

RELACION DE TEMAS 37

Modelo completamente aleatorio por grupos. Transformacion en un modelo deproporcionalidad directa.

Estratificacion y modelo de proporcionalidad directa.

TEMA 59. Disenos optimos equivalentes.

Disenos muestrales π-equivalentes. Estructura de π-equivalencia. Convexidad.

Disenos muestrales optimos en una estructura de π-equivalencia.

Disenos muestrales π-equivalentes de primer orden. Estructura de π-equivalenciade primer orden. Convexidad.

Disenos muestrales optimos en una estructura de π-equivalencia de primerorden.

Aplicacion a la obtencion de disenos optimos bajo modelo de superpoblacionde proporcionalidad directa.

TEMA 60. Disenos muestrales controlados.

Concepto y aplicaciones de los disenos muestrales controlados.

Resultados basicos.

Metodos de obtencion de disenos controlados.

Jose A. Mayor Gallego. Proyecto Docente

Page 42: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 38

2.1. Comentarios al Bloque Tematico I : Introduc-

cion.

En este primer Bloque Tematico incluimos varios temas que consideramos im-portantes por aportar y desarrollar una serie de conceptos, tanto informativos comotecnicos, ampliamente manejados en el tratamiento posterior del muestreo. Estos te-mas son,

TEMA 1. Objetivos del muestreo en poblaciones finitas. Desarrollohistorico.

TEMA 2. Conceptos basicos.

TEMA 3. Herramientas para el desarrollo de la teorıa y la practicadel muestreo.

TEMA 4. Diseno muestral.

TEMA 5. Probabilidades de inclusion.

TEMA 6. Esquemas de muestreo.

Los dos primero temas de nuestro temario son introductorios y de naturaleza masdescriptiva que tecnica, en el sentido matematico de esta palabra. Ello no significa queestos temas carezcan de importancia, mas bien al contrario son temas fundamentalespues exponen la finalidad y los campos de aplicacion de la materia que nos ocupay definen conceptos basicos que seran manejados continuamente a lo largo de sudesarrollo.

El TEMA 1 se inicia justificando la necesidad de estudiar las poblaciones median-te encuestas. Esta justificacion, que actualmente nos parece tan logica por razonesde economıa y rapidez, y por la perfeccion que han llegado a alcanzar las tecnicasestadısticas, no ha estado siempre en la mente, no ya de los administradores sino tam-bien de los cientıficos que en tiempos no tan lejanos solamente confiaban en los censos,como ya hemos mencionado en la panoramica historica incluida en la introduccion deeste proyecto.

No obstante, la necesidad cada vez mayor de estudiar diferentes colectivos, no solocon fines especulativos sino tambien como ayuda en la toma de decisiones sobre los

Jose A. Mayor Gallego. Proyecto Docente

Page 43: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 39

mismos, por ejemplos en el ambito de la salud publica, del mundo del trabajo, delas economıas familiares o de la evolucion de las sociedad en sus usos y creencias, haimpuesto el uso del muestreo relegando los censos, que aunque de gran importancia,se realizan con mucha menor frecuencia por su mayor lentitud y elevado coste.

Como puede verse pues, los campos de aplicacion del muestreo son muy variados,existiendo ejemplo de su aplicacion en numerosos ambitos, incluso complementandoa los censos. Mencionaremos por ejemplo las encuestas de poblacion activa, lasencuestas para estimar el ındice de precios al consumo o las encuestas ge-nerales de poblacion, todas ellas tan relevantes en la planificacion economica de losestados. Ejemplos reales de este tipo pueden encontrarse en Des Raj (1972), Azorıny Sanchez-Crespo (1986), Sarndal, Swensson y Wretman (1992) y Cochran (1993), ysu exposicion y comentario permitiran captar adecuadamente la importancia de lastecnicas de muestreo en el mundo actual.

Para completar este tema, se expondran unas notas historicas sobre el desarrollodel muestreo en poblaciones finitas, encuadrado en la evolucion general de la Es-tadıstica, siguiendo el esquema utilizado en la introduccion de este proyecto, peroobviando los detalles tecnicos, no asimilables aun en el nivel de conocimientos enel que nos encontramos. Algunas referencias importantes para estas cuestiones sonChang (1976), Hansen y Madow (1976), Hansen (1987) y Bellhouse (1988), y sobretodo Azorın y Sanchez-Crespo (1986), que proporciona una completa panoramicahistorica, ricamente documentada.

Especial mencion se debera hacer al desarrollo historico de esta materia en nuestropaıs, y al diseno de las principales encuestas que se realizan en el mismo, como laEncuesta de Poblacion Activa (EPA) y la Encuesta General de Poblacion (EGP).Veanse Azorın y Sanchez-Crespo (1986) y Sanchez-Crespo (1991).

El desarrollo teorico del muestreo en poblaciones finitas puede considerarse encua-drado dentro del ambito general, en cuanto a metodologıa se refiere, de la estadısticamatematica. No obstante la particularidad de trabajar con poblaciones “concretas”en lugar de poblaciones “teoricas”, introduce elementos diferenciadores en muchosaspectos. Ello justifica la exposicion, en el TEMA 2, de una serie de conceptos basi-cos que, por una parte ayudaran a delimitar el muestreo dentro del campo generalde la Estadıstica, y por otra parte, seran frecuentemente utilizados a lo largo de sudesarrollo.

El soporte basico es la poblacion, conjunto finito de N elementos, que denotare-mos,

U = u1, u2, . . . , uN = 1, 2, . . . , N

Jose A. Mayor Gallego. Proyecto Docente

Page 44: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 40

Con la idea de evitar los costosos censos, dicha poblacion se estudiara utilizandouna parte de la misma denominada muestra, que se denotara por m. Existen variosenfoques del concepto de muestra dependiendo de las especificaciones que se utilicen.Ello se formalizara en un tema posterior.

La idea fundamental del muestreo en poblaciones finitas es la introduccion de laaleatoriedad en la construccion de la muestra m, siendo este, basicamente, el puntode apertura hacia el campo de la inferencia.

En la practica, la construccion de la muestra suele realizarse a partir de un so-porte real como una lista impresa, un fichero magnetico o un conjunto de elementosencuestados en un trabajo de campo. Dicho soporte real se conoce como marco ydeberıa de coincidir con la poblacion que se estudia, aunque en general suelen darsediscrepancias. Estas discrepancias pueden introducir “sesgos” en los resultados fina-les, siendo por ello de gran importancia en el proceso de estudio de la poblacion pormuestreo la adecuacion del marco a la poblacion. Todas estas cuestiones se ilustrarancon ejemplos reales que clarifiquen los conceptos mencionados.

Las caracterısticas a estudiar en una poblacion se formalizan mediante el conceptode variable, que en su forma mas general es una matriz de numeros reales,

Y =

Y 1

1 Y 12 · · · Y 1

N

Y 21 Y 2

2 · · · Y 2N

......

......

Y q1 Y q

2 · · · Y qN

q×N

donde cada fila representa una caracterıstica de tipo cuantitativo correspondiente alos elementos de la poblacion. Por ejemplo, si la poblacion U tiene como elementos lasfamilias de un determinado colectivo, la primera fila puede corresponder a los ingresosde cada familia, la segunda al numero de componentes de cada una, la tercera podrıaser 1 o 0 segun la familia tenga o no coche, etc.

Para simplificar el desarrollo, supondremos q = 1, eliminando los superındices.Ası, una variable representa un vector N -dimensional cuyo estudio se quiere reali-zar a partir de la muestra. Usualmente no se desea estudiar globalmente Y , sinoun resumen numerico de dicho vector expresable como una funcion real del tipoθ(Y1, . . . , YN) = θ(Y ), que genericamente denominaremos parametro poblacional.Los parametros mas usuales son,

Total poblacionalT (Y ) =

∑i∈U

Yi

Jose A. Mayor Gallego. Proyecto Docente

Page 45: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 41

Media poblacional

Y =1

N

∑i∈U

Yi

Cuasivarianza poblacional

S2y =

1

N − 1

∑i∈U

(Yi − Y )2 =1

N − 1

∑i∈U

Y 2i −

1

N

(∑i∈U

Yi

)2

Varianza poblacional

σ2y =

1

N

∑i∈U

(Yi − Y )2 =1

N

∑i∈U

Y 2i −

1

N

(∑i∈U

Yi

)2

Funcion de distribucion

FY (t) =1

N

∑i∈U

I[Yi,+∞)

MedianaM(Y ) = F−1

Y (0,5)

siendo uno de los objetivos de la materia que estamos tratando, la construccion deestimadores para estos parametros, basados en la informacion suministrada por lamuestra, y que tengan buenas propiedades.

Es este punto, sera interesante mencionar que, como en cualquier proceso de ti-po inductivo o inferencial, que ademas se sustenta en la recogida de informacionprocedente del mundo real, los resultados proporcionados por el muestreo puedenestar afectados de errores de diverso tipo, siendo uno de los objetivos basicos de lateorıa el estudio del denominado error de muestreo, pero sin olvidar otras fuentes deerror como pueden ser los errores producidos por la no respuesta o por respuestasfalsas, los errores producidos por la utilizacion de marcos inadecuados o los erroresde procesamiento.

Para finalizar el tema, se realizara la descripcion y el analisis de las diferentes fasesde una encuesta. Vease Aparicio (1991) y Cochran (1993).

La herramienta basica para el desarrollo de la teorıa del muestreo en poblacionesfinitas es el calculo de probabilidades, disciplina esta sobre la que el alumno ya poseeun conocimiento suficiente. Sin embargo, existen una serie de cuestiones especıficas de

Jose A. Mayor Gallego. Proyecto Docente

Page 46: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 42

notable importancia por aparecer con gran frecuencia en muestreo, siendo convenientededicar el TEMA 3 a su estudio.

La primera de estas cuestiones es la generacion de variables aleatorias uniformes,tanto continuas como discretas. Ello se plasma, en lo que a las aplicaciones se refiere,en la generacion de numeros aleatorios, desempenando un papel fundamental en lapractica del muestreo, pues los mecanismos aleatorios de seleccion, ya sea de muestrascompletas como de unidades particulares, se basan en ellos.

Con la denominacion numero aleatorio nos referiremos a cantidades aleatoriasgeneradas a partir de una variable aleatoria uniforme, que unas veces sera continuay otras discreta. Mas concretamente, describimos a continuacion estos dos tipos.

Numero aleatorio entre 0 y 1. Con esta denominacion nos referimos a unacantidad aleatoria generada a partir de una distribucion uniforme (o rectangu-lar) en [0, 1). Para denotar una cantidad, z, de este tipo escribiremos,

z ∼ U [0, 1)

Con esta notacion indicamos, indistintamente, que z es una variable aleatoriadel tipo considerado o una realizacion concreta de la misma.

Numero aleatorio entero entre 1 y K. En este caso nos referimos a unacantidad aleatoria generada a partir de una distribucion uniforme discreta quetoma todos los valores enteros entre 1 y K, ambos inclusive. Para denotar unacantidad j de este tipo, escribimos,

j ∼ U [1..K]

Es interesante observar que a partir de un numero aleatorio, z, entre 0 y 1 sepuede construir un numero aleatorio entero, j, entre 1 y K mediante la transformacionj = 1 + ENT(zK), donde ENT(·) representa la funcion parte entera.

Recıprocamente, si j ∼ U [1..K], la cantidad z = (j − 1)/K toma valores enel intervalo [0, 1), de manera uniforme, y aunque evidentemente no es un numeroaleatorio entre 0 y 1 en el sentido antes expuesto, sı resulta una aproximacion.

Se indicaran tambien los diferentes mecanismos de los que disponemos para gene-rar los distintos tipos de numeros aleatorios: tablas, calculadoras y otros dispositivos,generadores congruenciales, etc. Vease Fernandez y Mayor (1994).

Otra cuestion de gran importancia en muestreo es la seleccion de un elemento, apartir de una coleccion de los mismos, con unas probabilidades dadas, p1, . . . , pK .

Jose A. Mayor Gallego. Proyecto Docente

Page 47: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 43

En el caso de ser la distribucion de probabilidad uniforme, pi = 1/K, ∀i, bastagenerar un numero aleatorio entre 1 y K, lo que nos dara el elemento seleccionado. Enel caso general, se utilizaran o el metodo acumulativo o el de Lahiri, que deberanser justificados. Vease Lahiri (1951) y Fernandez y Mayor (1994).

En numerosas situaciones del muestreo, los procesos llevados a cabo suelen estarafectados por diferentes fuentes de aleatoriedad. Citemos como ejemplos los metodosde submuestreo donde se realiza un muestreo sobre una muestra previamente selec-cionada, o los muestreos multietapicos. El desarrollo teorico de estas situaciones sesimplifica utilizando operadores condicionados como esperanza, varianza y covarianzacondicionadas.

Ası, en este tema se definiran dichos operadores y se estudiaran los resultadosfundamentales relativos a descomposicion de operadores no condicionados como en-cadenamiento de operadores condicionados. La referencia fundamental para ello esHansen, Hurwitz y Madow (1953).

Para terminar este tema se estudiara el importante concepto de orden de con-vergencia a cero de funciones de variable natural. La importancia de esta cuestionradica en que algunos operadores relacionados con la eficiencia de estimadores, comola varianza o el sesgo, dependen de parametros poblacionales, no controlables, comopueden ser los momentos poblacionales, pero tambien de magnitudes decidibles comoel numero de elementos en la muestra que se obtiene. De esta forma resulta de graninteres el estudio del comportamiento asintotico de dichos operadores.

Ası, siguiendo a Hansen, Hurwitz y Madow (1953), diremos que una funcion devariable natural, f(n), es convergente a cero de orden h cuando n →∞, y lo denota-remos f(n) = O(1/nh), cuando se verifica,

lımn→∞

nh|f(n)| = K < ∞

Cuando la funcion es del tipo f(n, N), lo que suele ser usual en muestreo al existiruna dependencia tanto del tamano de la muestra, n, como del de la poblacion, N , lacondicion anterior se convierte en,

lımn,N→∞

nh|f(n,N)| = K < ∞

siendo n = tnN con tn una sucesion que verifique,

lımn→∞

tn = t ∈ (0, 1)

Jose A. Mayor Gallego. Proyecto Docente

Page 48: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 44

Estas cuestiones se deberıan ilustrar con algun ejemplo simple, siendo ideal paraello utilizar el muestreo aleatorio simple. Anticipando de forma somera este tipo demuestreo, e indicando que para el mismo, la varianza de la media muestral es,

V [y] =(

1

n− 1

N

)S2

y

se probara que, segun la anterior definicion, V [y] = O(1/n).

En el TEMA 4 se introduce el importante concepto de diseno muestral, que for-maliza el proceso de obtencion de una muestra a partir de una poblacion mediante unmecanismo aleatorio. Para ello, previamente se dan diversas definiciones de muestra,que se diferencian basicamente en considerar o no el orden de sus elementos, y enpermitir o no la repeticion de los mismos.

Ası, definiremos muestra ordenada con repeticion o muestra generalizada,como una sucesion ordenada y finita de elementos de la poblacion U ,

m∗ = (i1, i2, . . . , in(m∗)), n(m∗) < ∞, ik ∈ U para 1 ≤ k ≤ n(m∗)

donde los ındices ik no son necesariamente distintos. El valor n(m∗) es el numero deelementos en la muestra o tamano muestral.

Si eliminamos la posibilidad de repeticion de elementos, entonces la agrupacionresultante se denominara muestra ordenada sin repeticion, denotandose comolas anteriores,

m∗ = (i1, i2, . . . , in(m∗)), n(m∗) ≤ N, ik ∈ U para 1 ≤ k ≤ n(m∗), ik 6= il si k 6= l

Finalmente, si no se tiene en cuenta el orden ni se admiten repeticiones, la agru-pacion obtenida es un subconjunto de U que denominaremos muestra no ordenada omuestra generica,

m = i1, i2, . . . , in(m)), n(m) ≤ N, ik ∈ U para 1 ≤ k n(m), ik 6= il si k 6= l

Es muy importante resaltar que aunque el concepto de muestra que se usa funda-mentalmente es el de muestra generica, en determinadas cuestiones es necesario haceruso de los otros tipos.

Jose A. Mayor Gallego. Proyecto Docente

Page 49: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 45

Definiremos un diseno muestral como un conjunto de muestras con una distri-bucion de probabilidad asociada. Este concepto depende pues del tipo de muestraconsiderada. Ası, para el caso de considerar muestras de tipo ordenado, denotaremospor M∗ al conjunto de muestras posibles, y por p∗(·) a la distribucion de probabili-dad sobre M∗, siendo el diseno muestral la pareja d∗ = (M∗, p∗(·)). Estos disenos sedenominan ordenados.

De forma analoga podemos considerar disenos del tipo d = (M, p(·)) que se de-nominan disenos no ordenados o genericos, indicando que pueden ser obtenidos porreduccion de los anteriores.

El tema se complementa estudiando el concepto de tamano muestral ası comovarios disenos muestrales que tienen un papel relevante en la teorıa y la practica delmuestreo. Una panoramica muy completa de estas cuestiones puede encontrarse enCassel, Sarndal y Wretman (1977), Hedayat y Sinha (1991) y Sarndal et al. (1992).

En el TEMA 5 se definen y estudian las probabilidades de inclusion asociadas aun diseno muestral d = (M, p(·)),

πi1,..,ik =∑

m∈Mm3i1,..,ik

p(m)

recalcando la importancia de las de primer y segundo orden, que son los elementos dela denominada matriz del diseno, Π. En este punto, es importante observar que unprocedimiento de muestreo deberıa ser tal que πi > 0, ∀i ∈ U , es decir, todo elementode la poblacion tiene la posibilidad de entrar en la muestra. En este caso el disenomuestral (o el muestreo) se denomina probabilıstico. Existen situaciones especialesen las cuales este requerimiento no se cumple. Vease Sarndal et al. (1992).

Otro requerimiento importante es que se cumpla πij > 0, ∀i 6= j ∈ U . Cuandoello ocurre, el diseno se denomina cuantificable o estimable. La razones de ello severan mas adelante cuando se estudie el estimador de Horvitz-Thompson.

Asimismo se introduce una herramienta de gran importancia en los desarrollosteoricos del muestreo, nos referimos a las variables indicadoras de la inclusion deelementos en una muestra,

Seguidamente se desarrollan las expresiones clasicas que relacionan las probabili-dades de primer y segundo orden con ciertos momentos de la variable aleatoria tamanomuestral, particularizandolas para el caso de disenos de tamano fijo. Vease Hedayaty Sinha (1991).

Para completar el tema, se calculan las probabilidades de inclusion para algunosdisenos importantes, definidos en el tema anterior.

Jose A. Mayor Gallego. Proyecto Docente

Page 50: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 46

El concepto de diseno muestral es fundamentalmente teorico, y raras veces se uti-liza directamente en la obtencion de muestras. Por el contrario, estas suelen obtenersemediante procesos secuenciales de seleccion elemento a elemento. Ello se formalizaen el TEMA 6 mediante el concepto de esquema de muestreo, Hanurav (1966),entendido como un algoritmo, A, definido por una terna de funciones,

A = Aq1, q2, q3

donde q1 se usa para obtener el primer elemento de la muestra, q2 indica cuandofinalizar el proceso, y q3 se usa para obtener nuevos elementos. La aplicacion de dichoalgoritmo permite generar muestras ordenadas, m∗ pertenecientes a un diseno detipo ordenado, d∗ = (M∗, p∗(·)), que puede ser reducido para obtener un diseno noordenado d = (M, p(·)).

Se presentara el resultado fundamental en relacion a los esquemas muestrales, esdecir, la equivalencia existente entre ellos y los disenos muestrales de tipo ordenado.Ası, dado un diseno, d∗ = (M∗, p∗(·)), existe un unico algoritmo, A = Aq1, q2, q3,que lo genera, y recıprocamente. Este resultado fundamental es de tipo constructivosiendo interesante ilustrarlo con ejemplos simples en los que se obtenga el esquema apartir del diseno y viceversa.

Tambien es importante observar que si se consideran disenos de tipo generico ono ordenados, un esquema muestral da lugar a un unico diseno, pero un diseno puedeser implementado por diferentes esquemas, proporcionando todos ellos las mismasmuestras con las mismas probabilidades aunque los elementos se generen en distintoorden.

El tema se completa estudiando algunos esquemas muestrales que dan lugar adisenos muestrales importantes como el aleatorio simple sin reemplazamiento y conreemplazamiento, y el diseno de Midzuno. Ademas de la referencia citada, de granimportancia en el desarrollo de estas cuestiones, pueden consultarse Midzuno (1952),Cassel et al. (1977) y Hedayat y Sinha (1991).

Referencias del Bloque Tematico I

[1] Aparicio Perez, F. (1991). Tratamiento informatico de encuestas. RA-MA. Ma-drid.

[2] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

Jose A. Mayor Gallego. Proyecto Docente

Page 51: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 47

[3] Bellhouse, D.R. (1988). ‘A brief history of random sampling methods’. Handbookof Statistics 6. Sampling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[4] Cassel, C., Sarndal, C. y Wretman, J. (1977). Foundations of Inference in SurveySampling. Wiley. New york.

[5] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

[6] Chang, W.-C. (1976). ‘Statistical theories and sampling practice’. On the His-tory of Statistics and Probability. D.B. Owen (ed.). Dekker. New York.

[7] Des Raj. (1972). The Design of Sample Surveys. McGraw-Hill. New York.

[8] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[9] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol I y II. Wiley. New York.

[10] Hansen, M.H. y Madow, W.G. (1976). ‘Some important events in the historicaldevelopment of sample surveys’. On the History of Statistics and Probability.D.B. Owen (ed.). Dekker. New York.

[11] Hansen, M.H. (1987). ‘Some history and reminiscences on survey sampling’.Statistical Science. 2, pp. 180-190.

[12] Hanurav, T.V. (1966). ‘Some aspects of unified sampling theory’. Sankhya. A28,pp. 175-203.

[13] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[14] Lahiri, D.B. (1951). ‘A method of sample selection providing unbiased ratioestimates’. Bulletin of the International Statistical Institute. 33, pp. 133-140.

[15] Levy, P.S. y Lemeshow, S. (1991). Sampling of Populations. Methods and Ap-plications. Wiley. New York.

[16] Midzuno, H. (1952). ‘On the sampling system with probability proportionate tosum of sizes’. Annals of the Institute of Statistical Mathematics. 3, pp. 99-107.

[17] Sanchez-Crespo, J.L. (1991). ‘El muestreo de poblaciones finitas en Espana y suposicion en el contexto internacional’. Estadıstica Espanola. 128, pp. 421-439.

Jose A. Mayor Gallego. Proyecto Docente

Page 52: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO I 48

[18] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

[19] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York.

Jose A. Mayor Gallego. Proyecto Docente

Page 53: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 49

2.2. Comentarios al Bloque Tematico II : Inferen-

cia en muestreo en poblaciones finitas.

El presente Bloque Tematico agrupa varios temas en los cuales estudiamos dife-rentes aspectos relacionados con la estimacion de parametros, a partir de una muestraperteneciente a un diseno muestral. Aunque inicialmente se utilice el enfoque “clasi-co” de poblacion fija, tambien se dedican algunos temas al estudio de los modelos desuperpoblacion. Los temas incluidos son,

TEMA 7. Estadısticos y estimadores.

TEMA 8. Construccion de estimadores.

TEMA 9. Criterios de optimalidad. Resultados de existencia.

TEMA 10. Estimador de Horvitz-Thompson.

TEMA 11. Estimador de Hansen-Hurwitz.

TEMA 12. Modelos de superpoblacion.

TEMA 13. Inferencia bajo modelos de superpoblacion.

TEMA 14. Cuestiones complementarias.

La muestra obtenida en una poblacion U , a partir de un diseno muestral permiterecoger los datos que seran usados para inferir propiedades de dicha poblacion. Esteproceso es fundamental en la teorıa del muestreo y debe ser formalizado con pre-cision si se pretende realizar un tratamiento adecuado de los procesos inferencialessubsiguientes. Ello se realiza en el TEMA 7.

Ası, si Y es la variable de estudio, y m∗ = (i1, i2, . . . , in(m∗)) ∈ M∗ es la muestraobtenida a partir de un diseno ordenado d∗ = (M∗, p∗(·)), tenemos el concepto fun-damental de datos muestrales o simplemente datos definido como la sucesion depares,

((i1, Yi1), (i2, Yi2), . . . , (in(m∗), Yin(m∗))) = ((i, Yi) | i ∈ m∗)

4= (m∗, Y )

Jose A. Mayor Gallego. Proyecto Docente

Page 54: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 50

Podemos pues definir una variable aleatoria (en sentido amplio) Y (m∗), que tomalos valores (m∗, Y ), siendo su espacio muestral,

M∗Y = (m∗, Y ) |m∗ ∈ M∗, Y ∈ Ω

donde Ω denota el espacio parametrico de la variable de estudio, Y , usualmente RN .

Los conceptos anteriores tienen su version para muestras no ordenadas de for-ma que si tenemos m = i1, i2, . . . , in(m) ∈ M perteneciente a un diseno generico,d = (M, p(·)), definiremos los datos como el conjunto de pares,

(ii, Yi1), (i2, Yi2), . . . , (in(m), Yin(m)) = (i, Yi) |i ∈ m 4

= (m, Y )

siendo Y (m) la variable aleatoria que toma dichos valores, con espacio muestral,

MY = (m,Y ) |m ∈ M, Y ∈ Ω

La formulacion anterior nos permite definir el importante concepto de estadısti-co como una funcion (no necesariamente real), e(·), definida sobre M∗

Y , tal que, paracualquier muestra, m∗ ∈ M∗, e((m∗, Y )) depende de Y unicamente a traves de losvalores Yi tales que i ∈ m∗, y similar para el caso de muestras genericas o no or-denadas. Ası, e(Y (m∗)) es una variable aleatoria definida sobre M∗

Y que toma losvalores e((m∗, Y )) y que tiene asociada una distribucion de probabilidad discreta,P [e(Y (m∗)) = t], denominada distribucion del estadıstico.

En general, los estadısticos mas usuales en la teorıa del muestreo suelen tomarvalores reales, destacando por su importancia,

Media muestral

y(m∗, Y ) =1

n(m∗)

∑i∈m∗

Yi

Cuasivarianza muestral

s2y(m

∗, Y ) =1

n(m∗)− 1

∑i∈m∗

(Yi − y(m∗))2

Jose A. Mayor Gallego. Proyecto Docente

Page 55: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 51

Utilizando simulacion, pueden obtenerse, de forma aproximada, la distribucion deun estadıstico para un diseno muestral determinado. En Fernandez y Mayor (1994)pueden verse ejemplos de tales experiencias.

Dado un parametro poblacional real, θ(Y ), podemos usar un estadıstico apropiadopara obtener una estimacion del mismo, dicho estadıstico se denomina estimador deθ(Y ) y usualmente se denota θ(m∗, Y ) o θ(m,Y ) segun que el diseno se considereordenado o generico. Se deben destacar, por su importancia, dos clases especialesde estimadores, los estimadores lineales homogeneos, que en su forma generalpueden expresarse como,

l(m∗, Y ) =∑

i∈m∗αm∗,iYi

siendo αm∗,i coeficientes que, en general, dependen de la muestra, m∗ y de la unidadi ∈ m∗.

La otra clase destacable es la de los estimadores cuadraticos homogeneosque, en general, son de la forma,

c(m∗, Y ) =∑

i∈m∗αm∗,iYi +

∑i,j∈m∗

i6=j

αm∗,ijYiYj

siendo αm∗,ij coeficientes que, en general, dependen de la muestra, m∗ y de las unidadesi, j ∈ m∗.

Como variable aleatoria, un estimador tiene asociados, en relacion a un disenomuestral d∗, una serie de operadores, siendo los mas usados en teorıa del muestreo laesperanza, el sesgo, la varianza y el error cuadratico medio.

EsperanzaE[θ(m∗, Y )] =

∑m∗∈M∗

θ(m∗, Y )p∗(m∗)

SesgoB[θ(m∗, Y ) = E[θ(m∗, Y )]− θ

Varianza

V [θ(m∗, Y )] =∑

m∗∈M∗

(θ(m∗, Y )− E[θ(m∗, Y )]

)2p∗(m∗)

Jose A. Mayor Gallego. Proyecto Docente

Page 56: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 52

Error cuadratico medio

ECM[θ(m∗, Y )] =∑

m∗∈M∗

(θ(m∗, Y )− θ(Y )

)2p∗(m∗)

Estos operadores permiten enunciar una serie propiedades que pueden poseer losestimadores, para un diseno muestral dado, como son la insesgadez y la consisten-cia, ası como establecer criterios de mejora entre varios estimadores de un mismoparametro mediante la varianza o el error cuadratico medio, dependiendo de quedichos estimadores sean o no insesgados.

Tambien se aplicaran a la construccion de intervalos de confianza para el parame-tro a estimar. Ası, bajo el supuesto de estimador insesgado con distribucion aproxi-madamente normal, se puede obtener un intervalo a partir de la igualdad,

P[θ(m∗, Y )− z1−α/2

√V [θ(m∗, Y )] ≤ θ ≤ θ(m∗, Y ) + z1−α/2

√V [θ(m∗, Y )]

]= 1− α

donde z1−α/2 denota el cuantil correspondiente a una distribucion normal N(0, 1).

En general, si el estimador no es insesgado y la aproximacion normal no es valida,puede construirse un intervalo de confianza a partir de la desigualdad,

P[θ(m∗, Y )− k ≤ θ ≤ θ(m∗, Y ) + k

]≥ 1− 1

k2

(V [θ(m∗, Y )] + B2[θ(m∗, Y )]

)Para finalizar el tema, y como una interesante ilustracion de lo estudiado ante-

riormente, se realiza un estudio de la media muestral, y, como estimador de la mediapoblacional, Y , demostrandose las siguientes propiedades,

Para diseno muestral (generico) aleatorio simple, MAS(N, n).

E[y(m, Y )] = Y V [y(m, Y )] =(

1

n− 1

N

)S2

y

Para diseno muestral (ordenado) aleatorio simple con reemplazamiento,MASR(N, n).

E[y(m∗, Y )] = Y V [y(m∗, Y )] =1

nσ2

y

Jose A. Mayor Gallego. Proyecto Docente

Page 57: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 53

Como referencias muy utiles para este tema citaremos Cassel et al. (1977), Suk-hatme et al. (1984), Hedayat y Sinha (1991) y Chaudhuri y Stenger (1992).

Aunque no existen procedimientos generales para la construccion de estimadoresde un parametro cualquiera, θ(Y ), sı existen metodos particulares aplicables en mu-chos casos de interes, y que seran estudiados en el TEMA 8. En este sentido, si paraun diseno d∗ = (M∗, p∗(·)), θ(Y ) admite la descomposicion,

θ(Y ) =∑

m∗∈M

p∗(m∗)δ(m∗, Y ) ∀Y ∈ Ω

siendo δ(m∗, Y ) un estadıstico, entonces θ(m∗, Y ) = δ(m∗, Y ) es un estimador in-sesgado de θ(Y ). Este resultado es valido tanto para disenos ordenados, con o sinreemplazamiento, como no ordenados. Si el parametro es lineal, del tipo,

θ(Y ) =∑i∈U

aiYi

la descomposicion siguiente, valida en cualquier diseno sin reemplazamiento (ordenadoo no),

θ(Y ) =∑

m∗∈M∗p∗(m∗)

[∑i∈m∗

aiYi

πi

]

nos asegura que θ(m∗, Y ) =∑

i∈m∗ aiYi/πi es un estimador insesgado del parametro.Dicho estimador es el conocido estimador de Horvitz-Thompson y sera estudiadoen profundidad en un tema posterior.

Si el diseno d∗ = (M∗, p∗(·)) es con reemplazamiento y sus muestras se obtienenmediante n extracciones independientes (con reemplazamiento), siendo el elemento ui

seleccionado con probabilidad pi, entonces el parametro lineal admite la descomposi-cion,

θ(Y ) =∑

m∗∈M∗p∗(m∗)

[∑i∈m∗

aiYi

npi

]

es decir, θ(m∗, Y ) =∑

i∈m∗ aiYi/npi es un estimador insesgado del parametro, que seconoce con el nombre de estimador de Hansen-Hurwitz.

Jose A. Mayor Gallego. Proyecto Docente

Page 58: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 54

En este tema se estudian ademas metodos especıficos para construir estimadoreslineales homogeneos de la forma,

l(m∗, Y ) =∑

i∈m∗αm∗,iYi

insesgados para un parametro lineal.

Para finalizar el tema, se plantea la cuestion siguiente: ¿En que medida se pierdeinformacion, en relacion a la estimacion de un parametro, cuando en una muestraordenada y con posibles repeticiones de elementos, m∗, se elimina toda mencion adicho orden ası como las repeticiones, obteniendo una muestra reducida, m?.

Esta cuestion se formulara de una manera mas explıcita, de la siguiente forma:Dado un estimador de θ(Y ), θ∗(m∗, Y ), ordenado en el sentido de depender delorden (y la multiplicidad) de los elementos en la muestra, se define el estimador noordenado,

θ(m, Y ) = E[θ∗(Y (m∗))

∣∣∣r(Y (m∗)) = (m,Y )]

donde r(·) es el estadıstico reduccion, que actua sobre (m∗, Y ) eliminando el ordeny la multiplicidad de elementos en m∗, nos planteamos si θ(m,Y ) es mejor o peor queθ∗(m∗, Y ) en algun sentido. La respuesta viene dada por el resultado fundamentalsiguiente,

(a) E[θ(m, Y )] = E[θ∗(m∗, Y )]

(b) ECM[θ∗(m∗, Y )] = ECM[θ(m,Y )] + E[(θ∗(m∗, Y )− θ(m, Y ))2]

lo que nos dice que θ(m,Y ) es “mejor” que θ∗(m∗, Y ) si usamos como criterio demejora un menor error cuadratico medio.

El estimador θ(m, Y ) se conoce en la literatura como la forma simetrizada delestimador θ∗(m∗, Y ) siendo su forma explıcita,

θ(m, Y ) =∑

m∗∈M∗

r(m∗)=m

θ∗(m∗, Y )p∗(m∗)/ ∑

m∗∈M∗

r(m∗)=m

p∗(m∗)

El proceso de obtencion de θ(m,Y ) a partir de θ∗(m∗, Y ) se denomina sime-trizacion o “Rao-Blackwellizacion” por ser el resultado anterior una adaptaciondirecta del teorema de Rao-Blackwell al caso de poblaciones finitas.

Jose A. Mayor Gallego. Proyecto Docente

Page 59: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 55

El tema se completa con el clasico ejemplo de la simetrizacion de la media muestralpara el diseno muestral ordenado con reemplazamiento MASR(N, n)

Para este tema citaremos como referencias importantes Cassel et al. (1977), Suk-hatme et al. (1984), Hedayat y Sinha (1991) y Chaudhuri y Stenger (1992).

Una vez estudiados procedimientos para obtener estimadores insesgados de unparametro, en el TEMA 9 se consideran otros criterios de bondad estudiandose laexistencia de estimadores optimos en relacion a los mismos. Ası, para un determinadodiseno muestral, diremos que θ1 es mejor que θ2 si ECM[θ1] ≤ ECM[θ2], ∀Y ∈ Ω,con desigualdad estricta para al menos un Y ∈ Ω.

Ello nos permite definir el concepto de estimador admisible en una clase C deestimadores, para un diseno dado, como aquel para el cual no existe otro mejor endicha clase, y exponer los principales resultados en este campo, sobre todo los rela-cionados con la admisibilidad del estimador de diferencia generalizado. En la mismalınea, definiremos y expondremos los resultados basicos acerca de la admisibilidad deestrategias, es decir, combinacion diseno-estimador.

Debido a que el criterio de admisibilidad es amplio en el sentido de no producir ununico estimador, se introduce el criterio, mas fuerte, de hiperadmisibilidad, bajoel cual sı se obtienen resultados de unicidad en relacion al estimador de Horvitz-Thompson, introducido en el tema anterior.

Otro concepto fundamental que estudiamos en este tema es el de estimadorinsesgado uniformemente de mınima varianza o UMVUE, exponiendose losresultados clasicos de no existencia para el caso general, y de existencia bajo ciertasrestricciones, como es el caso de los disenos muestrales unicluster.

Para finalizar el tema se introduce el concepto de estimador (o estrategia) mini-max estudiandose las propiedades que, en este sentido, tiene la media muestral comoestimador de la media poblacional.

Ademas de la referencias Cassel et al. (1977), Sukhatme et al. (1984), Hedayaty Sinha (1991) y Chaudhuri y Stenger (1992), ya indicadas en el tema anterior, yde las que remarcamos la primera por su completo tratamiento de estas cuestiones,mencionamos tambien Chaudhuri y Vos (1988), Chaudhuri (1988) y Gabler (1990).

En el TEMA 10 se estudia de forma pormenorizada el estimador de Horvitz-Thompson o π-estimador, ya mencionado en temas anteriores, fundamentalmentepor sus propiedades de optimalidad.

Se desarrollara su varianza para el caso general ası como la estimacion insesgadausual para la misma, basada en los resultados sobre estimacion insesgada de formas

Jose A. Mayor Gallego. Proyecto Docente

Page 60: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 56

cuadraticas del tipo,

Q(Y ) =∑∑i,j∈U

aijYiYj

observando la importancia que tiene el que un diseno sea cuantificable.

Particularizando a disenos muestrales de tamano fijo, se obtendra la expresionde la varianza de Yates-Grundy-Sen, y su estimacion insesgada usual, estudiandosecondiciones en las cuales dicha estimacion es no negativa.

Finalmente, se aplicara el estimador de Horvitz-Thompson a la estimacion de losparametros usuales bajo diseno muestral aleatorio simple, MAS(N, n), y diseno deBernoulli, MB(N, p).

Veanse las referencias Azorın y Sanchez-Crespo (1986), Hedayat y Sinha (1991) ySarndal et al. (1992).

El estimador de Horvitz-Thompson es aplicable solo a disenos sin reemplazamien-to, sean o no ordenados, aunque el planteamiento que seguimos es sobre disenos noordenados o genericos. Cuando el diseno es con reemplazamiento, podemos utili-zar el estimador de Hansen-Hurwitz. El estudio de este estimador es el objetivoprincipal del TEMA 11.

Para ello, supondremos que la muestra, m∗, de tamano fijo n, se forma por su-cesivas extracciones independientes de elementos sobre la poblacion al completo, ydonde cada elemento, i ∈ U , tiene una probabilidad, pi, de ser seleccionado. Con esteesquema el estimador de Hansen-Hurwitz para el parametro lineal θ(Y ) =

∑U aiYi

es,

θ(m∗, Y ) =∑

i∈m∗

aiYi

npi

siendo insesgado como vimos en el Tema 9.

Se calculara su varianza y la estimacion insesgada usual para la misma. Ello per-mitira realizar un estudio de la eficiencia de las estrategias muestrales basadas en esteestimador en relacion a las que utilizan el estimador de Horvitz-Thompson.

Para completar el tema, se aplica el estimador de Hansen-Hurwitz a la estimacionde la media y el total poblacionales para un diseno muestral aleatorio simple conreemplazamiento, MASR(N, n).

Veanse las referencias Des Raj (1980), Azorın y Sanchez-Crespo (1986), Ga-bler (1990) y Sarndal et al. (1992).

Jose A. Mayor Gallego. Proyecto Docente

Page 61: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 57

El enfoque que se ha seguido hasta este momento (y que realmente se usara enla mayor parte del temario), considerando que a cada unidad, ui, de la poblacion lecorresponde un valor, Yi, fijo aunque desconocido, se puede considerar como clasicoy lo denominaremos de poblacion fija. Por contraposicion a este punto de vista,se puede hacer la hipotesis de que dichos valores Yi son magnitudes aleatorias, deforma que el vector poblacional Y = (Y1, Y2, . . . , YN), es una realizacion de la variablealeatoria Y = (Y1,Y2, . . . ,YN), con una determinada distribucion de probabilidad.

Este enfoque alternativo se denomina de superpoblacion, y en este sentido, seentiende por modelo de superpoblacion un conjunto de especificaciones sobre ladistribucion de la variable Y .

En el TEMA 12 se aborda el estudio de este enfoque comenzando por los principalesconceptos y las diferentes interpretaciones del mismo, siendo importante remarcarque los modelos de superpoblacion no son necesariamente bayesianos en el sentido deexpresar alguna suposicion subjetiva, por contra pueden ser tan objetivos como losson los modelos usados en la estadıstica clasica, pero tambien pueden hacer uso de lasherramientas de la inferencia bayesiana, aspecto este que sera tratado en el siguientetema.

Seguidamente se expondran algunos modelos clasicos de superpoblacion como elmodelo de transformacion, GT , el modelo de regresion multiple, GMR, elmodelo de transformacion intercambiable, ET , el modelo de permutacionaleatoria, ERP , y el modelo parametrico, GPI , siendo tambien considerados susdiferentes casos particulares.

En este contexto seran estudiados los resultados clasicos, debidos a Cassel, Sarndaly Wretman, sobre optimalidad de estrategias en los modelos GT y ET . Estos resultadospueden encontrarse en el artıculo de Cassel, Sarndal y Wretman (1976), y en el librode estos autores, Cassel et al. (1977), donde se expone una clasificacion completısimade los diferentes modelos, y de las estrategias optimas para los dos ultimos modelosmencionados.

El estudio de los problemas de inferencia bajo modelos de superpoblacion, y queconstituye el TEMA 13, se realizara, en principio, con un enfoque predictivo. Ası,partiendo de los datos,

(m, Y ) = (ii, Yi1), (i2, Yi2), . . . , (in(m), Yin(m)) = (i, Yi) |i ∈ m

se intentan predecir los N − n(m) valores de Y correspondientes a los elementos nomuestrales, lo que a su vez permite predecir un parametro poblacional, θ(Y ).

Jose A. Mayor Gallego. Proyecto Docente

Page 62: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 58

Una vez introducido este enfoque, se obtendran los resultados de optimalidadclasicos bajo el modelo GT y tambien bajo los modelos GPI , EPI , GR y GMR.

Seguidamente estudiaremos la prediccion no basada en informacion auxiliar, paralo cual utilizaremos el modelo parametrico EPI en tres casos diferentes, que dependendel conocimiento que se tenga sobre la distribucion comun, G(y) = G(y|θ), de losvalores de Y , y que son,

(a) G(y) absolutamente continua con media, µ, y varianza, σ2 desconocidas; y formatambien desconocida.

(b) G(y) absolutamente continua, siendo,

G(y) = G0

(y − θ1

θ2

)

donde G0(·) en una funcion conocida. Este modelo implica que las variablesaleatorias Yk tienen media comun desconocida, µ = θi + c1θ2, y varianza comuntambien desconocida, σ2 = (c2 − c2

1)θ22, siendo,

cr =∫ ∞

−∞zrdG0(z) r = 1, 2

(c) Gy es completamente conocida.

A continuacion se estudia la prediccion usando informacion auxiliar, para lo cualse consideran los modelos GR y GMR.

Para completar el tema, expondremos una introduccion al uso de tecnicas baye-sianas en el contexto de la inferencia bajo modelos de superpoblacion, y basadas enla distribucion a priori, g(Y ), del parametro deconocido pero fijo Y = (Y1, . . . , YN).

En la hipotesis de que la distribucion a priori esta indexada por un parametro, Θ,se consideraran separadamente los dos casos, Θ conocido y Θ desconocido. Finalmentese realizara el estudio bajo la suposicion de normalidad de la distribucion a priori.

Nuevamente, la referencia fundamental para todo este tema es, por su completitud,Cassel et al. (1977) siendo tambien de gran importancia Ericson (1969) en lo querespecta a las tecnicas bayesianas.

El presente bloque tematico finaliza con el TEMA 14, en el cual se estudiaranalgunas cuestiones complementarias en relacion a la estimacion de parametros. Ası,en primer lugar indicaremos la forma de extender los resultados relativos a estima-cion cuando en lugar de una se tienen varias variables de estudio. En particular

Jose A. Mayor Gallego. Proyecto Docente

Page 63: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 59

se indicara la forma de construir intervalos de confianza simultaneos basados en ladesigualdad de Bonferroni.

Tambien es este tema trataremos el estudio de variables cualitativas medianteel metodo que hace uso de variables cuantitativas auxiliares, enfatizando el caso deuna variable cualitativa con dos posibles modalidades.

Otra cuestion importante que se aborda en este tema es la estimacion de pa-rametros en subpoblaciones o subconjuntos de la poblacion, centrandonos en laestimacion del tamano de una subpoblacion, y de la media y el total de una subpo-blacion.

Para concluir el tema, se estudia la forma de calibrar la eficiencia comparada deestrategias muestrales mediante el efecto del diseno y el efecto del estimador,aplicandolo a la comparacion de los disenos usuales, en relacion a la estimacion deltotal poblacional mediante el estimador de Horvitz-Thompson.

Para este tema, pueden utilizarse como referencias basicas Sarndal et al. (1992) yFernandez y Mayor (1994).

Referencias del Bloque Tematico II

[1] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

[2] Basu, D. (1971). ‘An essay on the logical foundations of survey sampling I’.Foundations of Statistical Inference. (Godambe y Sprott, Eds.). Hold, Rinehartand Winston, Toronto.

[3] Cassel, C., Sarndal, C. y Wretman, J. (1976). ‘Some results on generalized dif-ference estimation and generalized regression estimation for finite populations’.Biometrika. 63, pp. 615-620.

[4] Cassel, C., Sarndal, C. y Wretman, J. (1977). Foundations of Inference in SurveySampling. Wiley. New York.

[5] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

[6] Chaudhuri, A. (1988). ‘Optimality of sampling strategies’. Handbook of Statis-tics 6. Sampling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

Jose A. Mayor Gallego. Proyecto Docente

Page 64: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO II 60

[7] Chaudhuri, A. y Vos, J. (1988). Unified Theory and Strategies of Survey Sam-pling. North Holland. Amsterdam.

[8] Chaudhuri, A. y Stenger, H. (1992). Survey Sampling. Theory and Methods.Marcel Dekker, Inc. New York.

[9] Des Raj. (1980). Teorıa del muestreo. Fondo de Cultura Economica. Mexico.

[10] Ericson, W.A. (1969). ‘Subjective bayesian models in sampling finite popula-tions’. J. Roy. Statist. Soc. 31, pp. 195-224.

[11] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[12] Gabler, S. (1990). Minimax Solutions in Sampling from Finite Populations.Springer-Verlag. Berlin.

[13] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol I y II. Wiley. New York.

[14] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[15] Lahiri, D.B. (1951). ‘A method of sample selection providing unbiased ratioestimates’. Bulletin of the International Statistical Institute. 33, pp. 133-140.

[16] Levy, P.S. y Lemeshow, S. (1991). Sampling of Populations. Methods and Ap-plications. Wiley. New York.

[17] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

[18] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York.

Jose A. Mayor Gallego. Proyecto Docente

Page 65: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 61

2.3. Comentarios al Bloque Tematico III : Mues-

treo aleatorio simple.

El presente Bloque Tematico se dedica al estudio pormenorizado de este impor-tante diseno muestral, en sus diferentes aspectos tanto de obtencion de la muestracomo de estimacion de parametros. Los temas incluidos son,

TEMA 15. Diseno muestral aleatorio simple.

TEMA 16. Estimacion sobre variables cuantitativa.

TEMA 17. Estimacion sobre variables cualitativas.

TEMA 18. Proporciones pequenas. Muestreo Inverso.

TEMA 19. Estimacion en subpoblaciones.

El diseno muestral aleatorio simple o diseno muestral aleatorio, MAS(N, n), esta for-mado por todas las muestras posibles de tamano n, fijo, con distribucion de probabili-dad uniforme sobre las mismas. Si adoptamos el enfoque de diseno muestral generico,entonces el espacio muestral, M , esta formado por todas las posibles combinacionesde n elementos que se pueden formar con los N de la poblacion, siendo pues,

p(m) = 1/

(N

n

)∀m ∈ M

para las muestras del diseno. Las muestras de este diseno se denominan muestrasaleatorias simples o mas abreviadamente, muestras aleatorias.

El estudio detallado de este diseno se aborda en el TEMA 15. La idea fundamentaldel diseno MAS(N, n) es dar a todas las muestras la misma “importancia”, por locual cabe pensar que no es un diseno muy apropiado cuando los elementos de lapoblacion son muy heterogeneos. A pesar de este inconveniente, este diseno suele sermuy estudiado por su relativa sencillez, por su facilidad a la hora de obtener muestras,y por que, en lo que a eficiencia se refiere, se puede considerar como una cota inferioren relacion a otros disenos mas adaptados a las particularidades de la poblacion.

Jose A. Mayor Gallego. Proyecto Docente

Page 66: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 62

La uniformidad de las probabilidades sobre las muestras se traduce en la unifor-midad de las probabilidades de inclusion, siendo en particular,

πi =n

N

4= f i ∈ U

πij =n(n− 1)

N(N − 1)i 6= j ∈ U

Es importante hacer notar que la uniformidad de las probabilidades de inclusionde primer y segundo orden no implica el diseno MAS, ni siquiera cuando el disenoes de tamano fijo, lo que se puede ilustrar incluso con ejemplos muy sencillos. VeaseFernandez y Mayor (1994).

Otras propiedades importantes del diseno muestral aleatorio simple se relacionancon la construccion de muestras aleatorias a partir de otras. Ası, si obtenemos unamuestra aleatoria, m, de tamano n, a partir de U , y obtenemos otra muestra aleatoria,m′, de tamano n′, a partir de U −m, entonces m∪m′ es una muestra aleatoria de U ,de tamano n + n′.

Analogamente, si m es una muestra de tamano n obtenida en U , y m′ es unamuestra aleatoria de tamano n′ obtenida en m, entonces m′ es tambien una muestraaleatoria, de tamano n′, obtenida a partir de U .

Con respecto a la obtencion practica de las muestras aleatorias, sera importan-te hacer una exposicion de algunos de los numerosos procedimientos para obtenermuestras aleatorias simples, que clasificaremos en la forma,

(a) Obteniendo la muestra de forma global, directamente a partir del diseno.

(b) Obtencion de la muestra en forma secuencial, elemento a elemento. Que a suvez clasificaremos en,

(b1) Con conocimiento del tamano poblacional, N .

(b2) Sin conocimiento del tamano poblacional, N .

(c) Obtencion de varias muestras.

Los metodos que usan directamente el diseno estan limitados por el elevado nume-ro de muestras,

(Nn

), existente incluso para N no muy grande. Entre estos metodos,

resulta interesante el ideado por Nigam y Gupta (1984), basado en el orden lexico-grafico.

Jose A. Mayor Gallego. Proyecto Docente

Page 67: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 63

Entre los metodos de tipo secuencial, suponiendo N conocido citaremos el muyempleado por su sencillez, consistente en extraer elementos de forma sucesiva, y conprobabilidades 1/N , rechazando un elemento si ha sido extraıdo previamente. Otrometodo, dado por Fan, Muller y Rezucha (1962) consiste en recorrer secuencialmentela poblacion de forma que para j = 1, 2, . . . , N se selecciona el elemento j-esimo conprobabilidad,

n− nj

N − j + 1

siendo nj, j > 1 el numero de elementos ya seleccionados en la j − 1 inspeccionesanteriores, y n1 = 0. Para mas detalles sobre el metodo, veanse Bebbintong (1975) ySunter (1977).

Cuando N no es conocido, puede aplicarse el metodo de Mcleod y Bellhouse (1983),que consiste en partir de una muestra provisional con los n primeros elementos de lapoblacion (dispuesta en cierto orden), y actualizar esta muestra mediante un meca-nismo probabilıstico basado en recorrer la poblacion secuencialmente. Otros metodosanalogos pueden consultarse en Bissell (1986) y Pinkham (1987).

Finalmente, existen procedimientos para extraer, de forma “simultanea” variasmuestras aleatorias no solapadas (una como caso particular). Ası Fan, Muller y Re-zucha (1962) sugieren generar un numero aleatorio entre 0 y 1 para cada elemento dela poblacion, y ordenar esta por las magnitudes de dichos numeros. En la poblacionordenada, cualquier conjunto de n posiciones predeterminadas da lugar a una muestraaleatoria de tamano n, en particular, los n primeros lugares, del n+1 al 2n, etc. VeaseSunter (1977) para una descripcion completa de este procedimiento, y Fernandez yMayor (1994) para una panoramica de los distintos metodos.

El TEMA 16 se dedica a la estimacion de la media y el total poblacional, utilizandoel estimador de Horvitz- Thompson, obteniendose los estimadores usuales, su varianzay una estimacion insesgada de la misma,

MEDIA TOTAL

Y = y T (Y ) = Ny

V [Y ] = 1−fn

S2y V [T (Y )] = N2 1−f

nS2

y

V [Y ] = 1−fn

s2y V [T (Y )] = N2 1−f

ns2

y

Jose A. Mayor Gallego. Proyecto Docente

Page 68: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 64

donde y denota el estadıstico media muestral, s2y la cuasivarianza muestral y S2

y

la cuasivarianza poblacional, relativas a la variable de estudio, Y .

Como puede verse, la varianza de las estimaciones esta directamente influenciadapor la dispersion de la variable de estudio, y puede disminuirse aumentando el tamanomuestral. Mas concretamente, y siguiendo los conceptos introducidos en el Tema 3,podemos afirmar que la varianza es de orden O(1/n).

Tambien es importante hacer notar la aparicion del estadıstico media muestral enlas estimaciones anteriores, lo que nos induce de forma logica a estudiar con ciertaprofundidad ciertas propiedades del mismos, relativas a su distribucion y optimalidad.

Con respecto a lo primero, puede ser interesante realizar un estudio de tipo empıri-co, mediante simulacion, extrayendo numerosas muestras aleatorias de una poblaciony hallando para todas ellas la media muestral de cierta variable. El estudio de talesvalores puede ayudarnos a inducir que la distribucion que se obtiene es aproxima-damente normal. Estudios de esta naturaleza, pueden encontrarse en Sukhatme etal. (1984) y Fernandez y Mayor (1994).

En el aspecto teorico, una solucion definitiva al problema de la normalidad asin-totica ha sido proporcionada por Hajek, en base a trabajos previos de Madow y deErdos y Renyi. Esta solucion se plasma en la siguiente condicion de convergencia tipoLinderberg,

Supongamos que,

lımn,N→∞

(N − n) = ∞

entonces la media muestral para una muestra de tamano n, yn tiene una distribucionasintoticamente normal si y solo si para cada ε > 0,

lım

∑τ(ε)

(Yi − Y )2/∑

(Yi − Y )2

= 0

donde,

τ(ε) =

i∣∣∣ (Yi − Y )2 > ε

n(1− f)

N

∑(Yi − Y )2

En Pathak (1988) y Cochran (1993) se realizan interesantes consideraciones sobreesta cuestion.

Jose A. Mayor Gallego. Proyecto Docente

Page 69: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 65

En cuanto a las propiedades de optimalidad de la media muestral bajo disenoMAS(N, n), sera interesante observar que los resultados que se obtienen dependen dela clase de estimadores que se consideren y de como se enfoque dicho diseno.

Ası, si nos restringimos a la clase de estimadores de Y , de la forma,

l1(m∗, Y ) =

n∑j=1

αiYij

siendo m∗ = (i1, i2, . . . , in), es decir, considerando el diseno MAS como diseno or-denado, y con los coeficientes de la forma lineal dependiendo solo del orden de lasunidades en la muestra, entonces la media muestral posee varianza mınima entretodos los estimadores insesgados de Y en dicha clase.

Y si nos restringimos a la clase de estimadores de Y , de la forma,

l2(m, Y ) =∑i∈m

αiYi

donde ahora consideramos la forma generica del diseno, y cada coeficiente dependesolo de la unidad de la poblacion correspondiente, entonces en dicha clase, y es elunico estimador insesgado, siendo pues el de mınima varianza.

Es importante resaltar, como hace Hedayat y Sinha (1991), que estos resultados nocontradicen los resultados clasicos de inexistencia de estimadores optimos, obtenidospara hipotesis mas generales que las indicadas. Tambien en dicha referencia puedeencontrarse otro resultado de optimalidad interesante, obtenido bajo la hipotesis demodelo de superpoblacion de permutacion aleatoria.

Adicionalmente, la media muestral posee tambien propiedades de admisibilidad,Roy y Chakravarti (1960), y minimaximalidad, Aggarwal (1959) y Bickel y Leh-mann (1981).

Para el estudio de estas cuestiones y la obtencion de referencias adicionales, con-sultar ademas Cassel et al. (1977), Sukhatme et al. (1984), Cochran (1993) y sobretodo Chaudhuri (1988).

Jose A. Mayor Gallego. Proyecto Docente

Page 70: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 66

Cuando el muestreo aleatorio simple se realiza con reemplazamiento, el esti-mador de Hansen-Hurwitz proporciona los siguientes resultados,

MEDIA TOTAL

Y = y T (Y ) = Ny

V [Y ] = 1n

N−1N

S2y V [T (Y )] = N2

nN−1

NS2

y

V [Y ] = 1ns2

y V [T (Y )] = N2

ns2

y

siendo en este caso muy simple el mecanismo para obtener la muestra, pues bastagenerar elementos al azar entre 1 y N , con la misma probabilidad, sin controlar lasposibles repeticiones. Un sencillo calculo comparativo mostrara como y en que medidala varianza de los estimadores es menor cuando el muestreo se realiza sin reemplaza-miento.

Volviendo al diseno MAS(N, n) propiamente dicho, se estudiaran s2y y sy como

estimadores, respectivamente, de S2y y Sy. Ası, sabemos que s2

y es insesgado respectoa S2

y pero sy no lo es respecto a Sy. En este sentido, se obtendra la aproximacion,

E[sy] ≈ Sy

(1− 1

4(n− 1)− β2 − 3

8n

)

siendo β2 = µ2/S4y , y siendo µ4 el momento central poblacional de orden 4,

µ4 =1

N

∑i∈U

(Yi − Y )4

Ademas se obtendran las aproximaciones,

V [s2y] ≈

2S4y

n− 1

(1 +

n− 1

2n(β2 − 3)

)

V [sy] ≈S2

y

2(n− 1)

(1 +

n− 1

2n(β2 − 3)

)

Jose A. Mayor Gallego. Proyecto Docente

Page 71: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 67

Veanse Hansen, Hurwitz y Madow (1953) y Sukhatme et al. (1984) para el des-arrollo de estos aspectos.

Para terminar este tema, se estudiara el importante problema del tamano muestralnecesario para obtener una determinada precision, absoluta o relativa. En este sentido,es importante senalar el compromiso que suele darse entre las limitaciones de coste ylos requerimientos de precision.

Si por ejemplo dicho coste es de tipo lineal, c(n) = c0 + c n, es decir, un costefijo mas un coste adicional por cada elemento de la muestra, y los recursos totalesdisponibles se representan por cT , se ha de verificar,

c0 + c n ≤ cT

luego n debe ser el mayor entero menor que (cT − c0)/c.

Como el coste se incrementa con el tamano muestral y el error de estimacionesdisminuye con el tamano muestral, ambos objetivos se oponen frecuentemente en latoma de la decision sobre dicho tamano. En la Figura 3.1. se representa, en funcionde n, el coste de seleccion de la muestra (la lınea oblicua), y el error, V (n), (la lıneacurva). Al estar el coste limitado por cT , el valor maximo de n es n1. Por otra parte,si el error ha de ser menor que δ, lo que requiere que n > n2. En este caso pues,la restriccion sobre el coste impide obtener la precision deseada. Vease Fernandez yMayor (1994).

El TEMA 17 se dedica a la estimacion de proporciones sobre caracterısticas de tipocualitativo, bajo diseno muestral MAS(N, n). Mediante la definicion de una variableauxiliar cero-uno, la proporcion de una caracterıstica dicotomica se expresa comouna media poblacional, pudiendose pues aplicar los resultados del tema anterior,adaptados a las particularidades de las variables cero-uno, de esta forma, llamandoP a la proporcion poblacional, y p a la proporcion muestral, se obtienen,

P = p

V [P ] =N − n

N − 1P (1− P )

V [P ] =1− f

n− 1p(1− p)

Con respecto a la obtencion de intervalos de confianza, suponiendo que p se dis-tribuye normalmente (en la practica esto sera siempre una aproximacion), tendremos

Jose A. Mayor Gallego. Proyecto Docente

Page 72: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 68

n

,,

,,

,,

,,

,,

,,

,,

,,

,,

,,

,,

,,

,,

c0 + c n

V (n)

δ

cT

n1 n2

FIGURA 3.1. Tamano muestral limitado por restriccion de coste.

el siguiente intervalo de confianza al (1− α)× 100 %,

|p− P | ≤ z1−α/2

√N − n

N − 1P (1− P )

que al desarrollar, proporciona la inecuacion,

P 2

(1 +

N − n

N − 1

z21−α/2

n

)− 2P

(p +

N − n

N − 1

z21−α/2

2n

)+ p2 ≤ 0

cuya resolucion en P produce el intervalo correspondiente. Vease Sukhatme et al. (1984)

Jose A. Mayor Gallego. Proyecto Docente

Page 73: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 69

y Cochran (1993).

Cuando la aproximacion normal no resulta satisfactoria, se pueden construir in-tervalos de confianza “exactos” basados en la distribucion hipergeometrica, lo querequiere calculos de mayor envergadura. Para mas detalles, consultar Sukhatme etal. (1984) y Cochran (1993), y sobre todo Wright (1991), donde se hace un trata-miento muy completo de esta cuestion y se proporcionan las tablas necesarias paraconstruir los intervalos.

Si la caracterıstica en estudio posee mas de dos modalidades, se generalizaran laexpresiones obtenidas para el estimador, su varianza y la estimacion de la misma.Tambien es posible construir intervalos de confianza simultaneos para cada una delas modalidades.

Para terminar este tema, se realizara un estudio del tamano muestral necesariopara obtener un determinada precision, similar al realizado en el caso de la mediapoblacional. Para estas dos ultimas cuestiones, puede consultarse Fernandez y Ma-yor (1994).

Cuando se estudia una caracterıstica dicotomica “rara”, que aparece en muy po-cos elementos de la poblacion, la estimacion P = p puede ser insatisfactoria, inclusoutilizando muestras de tamano elevado. En estas situaciones se puede utilizar el deno-minado muestreo inverso, que se estudia en el TEMA 18, este metodo, desarrolladoinicialmente por Haldane (1945) y Finney (1949), consiste en la obtencion de unamuestra, usando un esquema secuencial de muestreo aleatorio simple, tan grande co-mo haga falta para llegar a tener un determinado numero de elementos, n′, prefijadode antemano, poseyendo la caracterıstica en estudio.

Llamando n al tamano de la muestra, se tiene que ahora n′ es fijo siendo n lavariable aleatoria. En esta situacion se estudiara el diseno muestral que resulta de laaplicacion de este metodo, y se demostrara que,

P =n′ − 1

n− 1

es un estimador insesgado de P , siendo,

V [P ] =(1− n− 1

N

)P (1− P )

n− 2

un estimador insesgado de la varianza de P

Para completar este tema, se realizara el estudio del tamano muestral necesariopara obtener una determinada precision. Vease Sukhatme et al. (1984) y Fernandez

Jose A. Mayor Gallego. Proyecto Docente

Page 74: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 70

y Mayor (1994).

En el TEMA 19, ultimo de los dedicados especıficamente al diseno muestral alea-torio simple, se estudiara la estimacion de parametros sobre subpoblaciones o sub-conjuntos de U , y otras cuestiones relacionadas.

Si denotamos U s a la subpoblacion, el primer problema que plantearemos sera laestimacion de su tamano, Ns, a partir de una muestra aleatoria m. Para ello, aplica-remos los resultados generales obtenidos en el Tema 14, llegando al estimador,

Ns = Nns

n= Nps

donde ns representa el numero de elementos de la muestra m que pertenecen a U s.

Entonces, la varianza y una estimacion insesgada de la misma se hallaran aplicandolos resultados del Tema 17 sobre proporciones.

De forma analoga, se obtendran estimaciones sobre otros parametros relativos ala subpoblacion como son la media, el total y la proporcion de una caracterısticacualitativa. Veanse Sukhatme et al. (1984), Sarndal et al. (1992), Cochran (1993) yFernandez y Mayor (1994).

Referencias del Bloque Tematico III

[1] Aggarwal, O.P. (1959). ‘Bayes and minimax procedures in sampling from finiteand infinite populations I’. Ann. Math. Statist. 30, pp. 206-218.

[2] Bebbintong, A.C. (1975). ‘A Simple method of drawing a sample without re-placement’. Appl. Statist. 24, N. 1, p. 136.

[3] Bickel, P.J. y Lehmann, E.L. (1981). ‘A minimax property of the sample meanin finite populations’. Ann. Statist. 9, pp. 1119-1122.

[4] Bissell, A. F. (1986). ‘Ordered random selection without replacement’. Appl.Statist. 35, N. 1, pp. 73-75.

[5] Cassel, C., Sarndal, C. y Wretman, J. (1977). Foundations of Inference in SurveySampling. Wiley. New York.

[6] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

Jose A. Mayor Gallego. Proyecto Docente

Page 75: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 71

[7] Chaudhuri, A. (1988). ‘Optimality of sampling strategies’. Handbook of Statis-tics 6. Sampling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[8] Fan, C.T., Muller, M.E., y Rezucha, I. (1962). ‘Development of sampling plansby using sequential (item by item) selection techniques and digital computers’.J. Amer. Statist. Assoc. 57, pp. 387-402.

[9] Fernandez, F.R. y Mayor, J.A. (1994) Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[10] Finney, D.J. (1949). ‘On a method of estimating frequencies’. Biometrika. 36,pp. 233-234.

[11] Haldane, J.B.S. (1945). ‘On a method of estimating frequencies’. Biometrika.33, pp. 222-225.

[12] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol I y II. Wiley. New York.

[13] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[14] McLeod, A.I. y Bellhouse, D.R. (1983). ‘A convenient algorithm for drawing asimple random sample’. Appl. Statist. 32, N. 2, pp. 182-184.

[15] Nigam, A.K. y Gupta, V.K. (1984). ‘A method of sampling with equal or une-qual probabilities without replacement’. Appl. Statist. 33, n. 2, pp. 227-229.

[16] Pathak, P.K. (1988). ‘Simple random sampling’. Handbook of Statistics 6. Sam-pling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[17] Pinkham, R. S. (1987). ‘An efficient algorithm for drawing a simple randomsample’. Appl. Statist. 36, N. 3, pp. 370-372.

[18] Roy, J. y Chakravarti, I.M. (1960). ‘Estimating the mean of a finite population’.Ann. Math. Statist. 31, pp. 392-398.

[19] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

[20] Sunter, A.B. (1977). ‘List sequential sampling with equal or unequal probabili-ties without Replacement’. Appl. Statist. 26, N.3, pp.261-268.

Jose A. Mayor Gallego. Proyecto Docente

Page 76: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO III 72

[21] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York.

[22] Wright, T. (1991). Exact Confidence Bounds when Sampling from Small FiniteUniverse. Springer-Verlag. New York.

Jose A. Mayor Gallego. Proyecto Docente

Page 77: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 73

2.4. Comentarios al Bloque Tematico IV : Estima-

cion de la varianza.

Este Bloque Tematico tiene como objetivo el estudio de las principales tecnicasde estimacion de la varianza cuando, debido a la complejidad de los disenos o dela estructura de los parametros a estudiar, no sea posible aplicar directamente losestimadores usuales. Los temas que se incluyen en el mismo son,

TEMA 20. Estimacion de funciones de parametros

TEMA 21. Estimadores de la razon y del producto.

TEMA 22. Metodos de replicacion y de exploracion intensiva.

Aunque el problema de estimar la varianza de un estimador esta resuelto satisfac-toriamente para el caso lineal y siempre que la matriz del diseno sea asequible, con elestimador de Horvitz-Thompson; se presentan numerosas situaciones en las cuales lascondiciones no son tan “ideales”, por ejemplo cuando nos enfrentamos a parametroscon estructura no lineal y/o a disenos muestrales complicados que presentan proble-mas a la hora de calcular las probabilidades de inclusion. En el TEMA 20 se trataeste problema y se expone una solucion satisfactoria al mismo cuando se presenta elprimero de los inconvenientes indicados.

Para fijar el problema, se supone que el parametro poblacional a estimar, θ, esuna funcion,

θ = f(θ1, θ2, . . . , θq)

de otros parametros poblacionales, θ1, θ2,. . .,θq, para los cuales se dispone de estima-

dores, θ1, θ2,. . .,θq que suponemos insesgados y con varianzas y covarianzas estimadasconocidas. Entonces, el metodo de analogıa permite construir el estimador “natu-ral”,

θ = f(θ1, θ2, . . . , θq)

Cuando la funcion f es lineal, es decir,

θ = w0 +q∑

k=1

wkθk

Jose A. Mayor Gallego. Proyecto Docente

Page 78: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 74

el estimador analogico,

θ = w0 +q∑

k=1

wkθk

es insesgado, y su varianza se puede estimar mediante,

V [θ] =q∑

k,l=1

wkwlCov[θk, θl]

en este sentido, sera de gran interes, como ejemplo de lo anterior, aplicarlo al casodel diseno MAS(N, n), y combinaciones lineales usuales de parametros como suma ydiferencia de medias de diferentes variables, y diferencia de proporciones. Ejemplosde este tipo pueden verse en Fernandez y Mayor (1994). Vease tambien Sarndal etal. (1992).

El problema se presenta cuando la funcion f no es lineal, caso que es bastanteusual, por ejemplo cuando se quieren estimar tasas, razones, medias geometricas, co-eficientes de correlacion, etc. En tal caso, el metodo de analogıa sigue siendo validopara construir el estimador del parametro (aunque ya no sea necesariamente insesga-do) pero la estimacion de la varianza no es tan evidente. Para ello, introduciremos elmetodo de linealizacion, consistente en aproximar f por los terminos que forman laparte lineal cuando dicha funcion se desarrolla en serie de Taylor en un entorno de(θ1, . . . , θq). De esta forma, si tal desarrollo es factible, tendremos,

θ = f(θ1, θ2, . . . , θq) ≈ f(θ1, θ2, . . . , θq)

+q∑

k=1

∂f(θ1, θ2, . . . , θq)

∂θk

∣∣∣θi=θi | i=1,...,q

(θk − θk)

= w0 +q∑

k=1

wkθk

es decir, hemos conseguido aproximar el estimador analogico mediante una expresionlineal cuya varianza se estimara como en el caso anterior. Dicha varianza estimada dela aproximacion se utilizara tambien como varianza estimada del estimador analogico.Las unicas condiciones para la aplicabilidad de este metodo son, por una parte queel tamano muestral sea suficientemente grande, y que el desarrollo de Taylor de la

Jose A. Mayor Gallego. Proyecto Docente

Page 79: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 75

funcion f sea factible hasta el termino correspondiente. Un estudio pormenorizado deestas condiciones se da en Rao (1975). Veanse tambien Woodruff (1971), Chaudhuriy Stenger (1992) donde se estudia como ejemplo la estimacion del coeficiente decorrelacion lineal entre dos variables, Sarndal et al. (1992), Fernandez y Mayor (1994),y sobre todo Wolter (1985).

Finalmente indicaremos que el estimador analogico para el caso de funcion fno lineal, puede ser sesgado, como se vera en el tema siguiente para la razon y elproducto de medias, y diseno MAS(N, n), siendo en tal caso interesante estudiar lamagnitud de dicho sesgo para ver en que medida la varianza del estimador da unabuena aproximacion del error cuadratico medio.

En el TEMA 21 aplicamos las tecnicas introducidas en el tema anterior a dosfunciones de parametros, de especial importancia,

Razon de dos parametros poblacionales.

R =θ1

θ2

Producto de dos parametros poblacionales.

ℵ = θ1 θ2

Para el caso de la razon, utilizaremos el estimador, clasico en muestreo en po-blaciones finitas, R = θ1/θ2. Para estudiar su varianza se utilizara la aproximacionlineal,

R ≈ R +1

θ2

(θ1 −Rθ2)

que nos permitira construir la siguiente aproximacion de la varianza,

V [R] ≈ 1

θ22

(V [θ1] + R2V [θ2]− 2R Cov[θ1, θ2]

)

que podemos estimar por,

V [R] =1

θ22

(V [θ1] + R2V [θ2]− 2RCov[θ1, θ2]

)

Jose A. Mayor Gallego. Proyecto Docente

Page 80: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 76

En relacion a este estimador, se enunciara y demostrara la desigualdad (Sarndalet al. (1992)),

(E[R]−R)2

V [R]≤ V [θ2]

θ22

por su utilidad en el estudio del sesgo.

Seguidamente se estudiara, como caso particular, la razon de medias (o totales),

R =Y

X=

T (Y )

T (X)

bajo diseno muestral aleatorio simple, obteniendose el estimador,

R =y

x

y las expresiones usuales para la varianza aproximada y la estimacion de la varianza.

Este estimador es sesgado, y a partir de la desigualdad considerada anteriormentees inmediato comprobar que el sesgo verifica,

B2[R]

V [R]≤ 1− f

n

S2y

X2

es decir, dicho cociente puede hacerse tan pequeno como se quiera tomando n sufi-cientemente elevado. Ello que tiene una importante consecuencia ya que al ser,

ECM[R] = V [R] + B2[R]

podremos utilizar la varianza como una buena aproximacion del error cuadratico me-dio, por ejemplo para la construccion de intervalos de confianza. En este sentido,resultan de gran interes las consideraciones sobre el efecto del sesgo en la fiabilidadde dichos intervalos, que se realizan en Sarndal et al. (1992). Vease tambien Coch-ran (1993).

Como complemento se realizara en estudio mas pormenorizado del sesgo y delerror cuadratico medio, probandose que ambos son de orden O(1/n), siendolo pues

Jose A. Mayor Gallego. Proyecto Docente

Page 81: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 77

tambien la varianza; en particular, se obtendran las aproximaciones,

B[R] =1− f

n

(Y

X3S2

x −1

X2Sxy

)+ O(n−2)

ECM[R] =1− f

nX2

(S2

y + R2S2x − 2RSxy

)+ O(n−2)

V [R] =1− f

nX2

(S2

y + R2S2x − 2RSxy

)+ O(n−2)

En este sentido Sukhatme et al. (1984) y sobre todo el artıculo de David y Suk-hatme (1974) son referencias fundamentales. Estos autores, ademas, estudian aproxi-maciones de diversos ordenes para B[R] y ECM[R] bajo condiciones muy generales.Vease tambien Hansen, Hurwitz y Madow (1953).

Es interesante observar que aunque el estimador de la razon es sesgado para eldiseno MAS(N, n), no lo es con otros disenos muestrales, como por ejemplo el generadopor un esquema especıfico de Lahiri-Midzuno. Estas y otras cuestiones relacionadas,seran estudiadas detenidamente en el bloque dedicado al empleo de la informacionauxiliar.

Otras particularidades que han de ser estudiadas en relacion a este estimador sonla comparacion de dos razones y la razon de dos razones. Vease Cochran (1993).

El estudio del estimador de la razon se completara con su aplicacion a la estimacionde parametros sobre subpoblaciones, cuando el tamano de las misma no se conoce.Vease Fernandez y Mayor (1994).

La segunda parte de este tema se dedica a un estudio similar para el producto dedos parametros, ℵ = θ1 θ2, que se estimara mediante,

ℵ = θ1 θ2

y cuya descomposicion en la forma,

ℵ = ℵ+ θ2(θ1 − θ1) + θ1(θ2 − θ2) + (θ1 − θ1)(θ2 − θ2)

Jose A. Mayor Gallego. Proyecto Docente

Page 82: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 78

permite obtener la varianza aproximada,

V [ℵ] ≈ θ22V [θ1] + θ2

1V [θ2] + 2θ1θ2 Cov[θ1, θ2]

Estas expresiones se particularizaran para el caso de ℵ = Y X y diseno MAS(N, n),obteniendose el estimador ℵ = y x, y las expresiones usuales para la varianza aproxi-mada y la varianza estimada.

En este caso, el sesgo es muy facil de obtener, resultando,

B[ℵ] = Cov[y, x] =1− f

nSxy = O(1/n)

siendo pues,

B[ℵ] =1− f

nsxy

un estimador insesgado del mismo. Vease Sukhatme et al. (1984).

Para finalizar este bloque, se exponen en el TEMA 22 un conjunto de metodosalternativos, aplicables en situaciones para las que, por la complejidad del diseno, lasprobabilidades de inclusion son difıciles de obtener, o el diseno es no cuantificable,como se vera mas adelante, por ejemplo en el muestreo sistematico. O tambien cuandoel parametro de estudio tiene una estructura compleja, o ambas cosas a la vez.

El primer grupo de tecnicas consideradas son las de grupos aleatorios denomi-nadas tambien de replicacion y de muestras interpenetrantes. Estas tecnicas nose basan en la obtencion de una funcion muestral que nos proporcione la varianza, esdecir, no tratan de calcular V [θ], sino que se basan en la obtencion de un conjuntode K muestras, m1, m2, . . . ,mK , y valoran sobre ellas el estimador, obteniendo,

θ(m1), θ(m2), . . . , θ(mK)

con ello tenemos una aproximacion de la distribucion del estimador y podemos darcomo estimacion el siguiente valor medio,

θ∗ =1

K

K∑i=1

θ(mi)

Jose A. Mayor Gallego. Proyecto Docente

Page 83: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 79

cuya varianza puede ser estimada mediante,

V1 =1

K(K − 1)

K∑i=1

(θ(mi)− θ∗)2

justificandose esta estimacion a partir de la igualdad,

E

[1

K(K − 1)

K∑i=1

(θ(mi)− θ∗)2

]= V [θ∗]− 1

K(K − 1)

K∑∑i,j=1i6=j

Cov[θ(mi), θ(mj)]

+1

K(K − 1)

K∑i=1

(E[θ(mi)]− E[θ∗])2

cuya demostracion puede encontrarse en Fernandez y Mayor (1994).

Es decir, la esperanza de V1 es igual a V [θ∗], salvo terminos que, segun la eleccionde m1, . . . ,mK , pueden ser de pequena magnitud, e incluso nulos.

Tambien podemos estimar θ mediante la aplicacion del estimador a la muestraformada por la “conjuncion” de m1, . . . ,mK , obteniendo θ.

θ = θ(m1, m2, . . . ,mK)

que proporciona la siguiente estimacion alternativa de la varianza de θ∗,

V2 =1

K(K − 1)

K∑i=1

(θ(mi)− θ)2

cuya validez se justifica a partir de la siguiente igualdad, de inmediata deduccion,

K∑i=1

(θ(mi)− θ)2 =K∑

i=1

(θ(mi)− θ∗)2 + K(θ∗ − θ)2

En base a la misma, se concluye ademas que V1 ≤ V2, dandose la igualdad si y solo siθ∗ = θ.

Si el parametro a estimar, θ, es lineal, entonces generalmente θ∗ = θ y por con-siguiente ambas estimaciones de la varianza coinciden. En caso contrario, aunque no

Jose A. Mayor Gallego. Proyecto Docente

Page 84: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 80

coincidan seran valores muy proximos, y ambos se pueden utilizar para estimar lavarianza.

Usualmente, las muestras se toman independientes, y usando el mismo disenomuestral, con lo cual, Cov[θ(mi), θ(mj)] = 0, i 6= j. Y por estar θ(mi) igualmentedistribuidos, se verifica,

E[θ(mi)] = E[θ∗] i = 1, 2, . . . , K

siendo pues V1 insesgado de V [θ∗], y por tanto, en general V2 sera sesgado, tendiendoa proporcionar estimaciones conservativas para la varianza.

Estas tecnicas se conocen con el nombre generico de metodos de replicacionde muestras independientes o metodos de agrupaciones aleatorias indepen-dientes, debiendose su desarrollo a Mahalanobis (1939, 1944, 1946) y Deming (1956).Veanse tambien Sarndal et al. (1992) y sobre todo Wolter (1985), y para ejemplospracticos de estas tecnicas, consultar Fernandez y Mayor (1994).

Tambien es posible tomar las muestras de forma que sean dependientes, pero demanera que todas pertenezcan a un mismo diseno muestral. En tal caso, nopodemos asegurar que V1 sea un estimador insesgado de la varianza de θ∗, pues lascovarianzas en la expresion del valor esperado ya no son nulas. No obstante, cuando eltamano de la poblacion es grande en relacion al tamano muestral, las covarianzas sonusualmente de pequena magnitud y negativas, por lo que el sesgo de V1 sera tambienpequeno pero mayor que cero, es decir, V1 tiende a sobreestimar la varianza, siendopor tanto conservativo, y esta cualidad se acentua en V2.

Con la modificacion introducida, estas tecnicas son denominadas metodos dereplicacion de muestras dependientes o metodos de agrupaciones aleatoriasdependientes y aparecen por primera vez en Hansen, Hurwitz y Madow (1953).Veanse tambien las referencias citadas en el caso de grupos independientes.

El otro gran grupo de tecnicas que se estudiaran en este tema son las que denomi-namos de exploracion intensiva de una muestra. Estas tecnicas usan basicamenteuna muestra perteneciente a un determinado diseno, que es procesada segun ciertaspautas. Algunas de estas tecnicas, como el jackknife y el bootstrap, provienen del cam-po de la estadıstica matematica “clasica”, otras, como los metodos de semimuestras,son especıficas del muestreo en poblaciones finitas.

La tecnica del jackknife fue desarrollada inicialmente por Quenouille (1949,1956), como un metodo para la reduccion de sesgo en la estimacion, siendo Tu-key (1958) quien sugirio su uso como medio para estimar la varianza, y Durbin (1959)quien la aplico al caso de poblaciones finitas. De esta forma, para cierto tipo de es-

Jose A. Mayor Gallego. Proyecto Docente

Page 85: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 81

timadores sesgados, este metodo tiene el doble efecto de reducir el orden del sesgo yproporcionar una estimacion de la varianza.

En su forma mas simple, se parte de una muestra, m = (j1, j2, . . . , jn), obtenidaa partir de cierto diseno, y se consideran las n muestras obtenidas eliminando de mun elemento cada vez, es decir,

mi = m− ji i = 1, 2, . . . , n

Aplicando el estimador θ cada muestra mi obtenemos θ(mi), y a partir de estascantidades definimos los denominados pseudovalores,

θi = nθ − (n− 1)θ(mi) i = 1, 2, . . . , n

donde θ representa el estimador calculado a partir de la muestra original m. Se defineel estimador jackknife de θ de la siguiente forma,

θJ =1

n

n∑i=1

θi

Se debera estudiar la reduccion de sesgo producida por este metodo e indicar comola varianza puede ser estimada mediante,

VJ1 =1

n(n− 1)

n∑i=1

(θi − θJ)2

VJ2 =1

n(n− 1)

n∑i=1

(θi − θ)2

cuya justificacion es similar a la empleada en el caso de las tecnicas de agrupacionesaleatorias dependientes.

Veanse descripciones de este metodo y ejemplos de aplicacion en Hedayat y Sin-ha (1991), Sarndal et al. (1992), Cochran (1993) y Fernandez y Mayor (1994), y paraun estudio teorico mas profundo, consultar Wolter (1985), Sen (1988) y Efron (1990).

Otra metodologıa de estimacion de varianza importada del campo general de la es-tadıstica matematica es el conjunto de tecnicas bootstrap, Efron (1979, 1989, 1990),denominadas tambien de remuestreo.

Jose A. Mayor Gallego. Proyecto Docente

Page 86: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 82

En el contexto del muestreo en poblaciones finitas, estos metodos se basan enla generacion, a partir de una muestra m, extraıda con determinado diseno, de unapoblacion artificial, U∗ con caracterısticas similares a la poblacion en estudio U .

De U∗ se extraen muestras, de forma independiente, usando el diseno empleadoen la obtencion de m. Estas muestras se denominan muestras bootstrap, y lasdenotamos,

m1, m2, . . . ,mK

Sobre cada muestra bootstrap, podemos aplicar el estimador θ, obteniendo θ(mi) =θi, y estos valores proporcionan una estimacion de la distribucion de θ. Para estimarla varianza usamos,

VB =1

K − 1

K∑i=1

(θi − θ∗)2 donde θ∗ =1

K

K∑i=1

θi

La generacion de la poblacion U∗ a partir de la muestra m dependera del disenoutilizado. Por ejemplo, si suponemos diseno MAS(N, n) y N/n = H entero, entoncescada elemento de la muestra da lugar a H elementos con los mismos valores delas variables. Por supuesto, para la realizacion practica del metodo no es necesariogeneralmente la construccion efectiva de U∗, de manera que las muestras bootstrap sepueden obtener directamente a partir de m por mecanismos aleatorios equivalentes.

Ademas de las mencionadas de Efron, citaremos como referencias importantesDiaconis y Efron (1983), Rao (1988), Hedayat y Sinha (1991), Chaudhuri y Sten-ger (1992) y Sarndal et al. (1992).

Finalmente, mencionaremos la denominadas tecnicas de semimuestras, queconsisten en descomponer la muestra como union de dos submuestras disjuntas, usual-mente del mismo tamano (lo que exige que el tamano de la muestra original sea par),de ahı el nombre de semimuestras. Esta descomposicion no es unica, de manera queen la practica existiran un gran numero de pares de semimuestras posibles.

Puesto que dichas semimuestras se comportan como agrupaciones aleatorias, sepueden aplicar las tecnicas de replicacion ya estudiadas. En la practica no se tomantodas las semimuestras posibles pues su numero suele ser muy elevado, sino unaseleccion de las mismas.

Este metodo se aplica, fundamentalmente, en el muestreo estratificado, por locual su estudio detallado se realizara en el bloque correspondiente a dicho tipo demuestreo.

Jose A. Mayor Gallego. Proyecto Docente

Page 87: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 83

Referencias del Bloque Tematico IV

[1] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

[2] Chaudhuri, A. y Stenger, H. (1992). Survey Sampling. Theory and Methods.Marcel Dekker, Inc. New York.

[3] David, I.P. y Sukhatme, B.V. (1974). ‘On the bias and mean square error of theratio estimator’. J. Amer. Statist. Assoc. 69, pp. 464-466.

[4] Deming, W.E. (1956). ‘On simplifications of sampling design through replicationwith equal probabilities and without stages’. J. Amer. Statist. Assoc. 51, pp.24-53.

[5] Diaconis, P. y Efron, B. (1983). ‘Metodos estadısticos intensivos por ordenador’.Investigacion y Ciencia. 82, pp. 70-83.

[6] Durbin, J. (1959). ‘A note on the application of Quenouille’s method of biasreduction to the estimation of ratios’. Biometrika. 46, pp. 477-480.

[7] Efron, B. (1979). ‘Bootstrap methods: another look at the jackknife’. Ann. Sta-tist. 7, pp. 1-26.

[8] Efron, B. (1989). ‘Bootstrap and other resampling methods’. I.M.S. Bulletin.18, pp. 406-408.

[9] Efron, B. (1990). The Jackknife, the Bootstrap and other Resampling Plans.CBMS-NSF Regional Conference Series in Applied Mathematics. Vol. 38. SIAM.

[10] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[11] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol I y II. Wiley. New York.

[12] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[13] Mahalanobis, P.C. (1939). ‘A sample survey of the acreage under jute in Bengal’.Sankhya. A4, pp. 511-531.

Jose A. Mayor Gallego. Proyecto Docente

Page 88: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IV 84

[14] Mahalanobis, P.C. (1944). ‘On large-scale sample surveys’. Philosophical Tran-sactions of the Royal Society of London. B231, pp. 329-451.

[15] Mahalanobis, P.C. (1946). ‘Recent experiments in statistical sampling in theIndian Statistical Institute’. J. Roy. Statist. Soc. 109, pp. 325-370.

[16] Quenouille, M.H. (1949). ‘Approximate test of correlation in time series’.J. Roy. Statist. Soc. B11, pp. 68-84.

[17] Quenouille, M.H. (1956). ‘Notes on bias in estimation’. Biometrika. 43,pp. 353-360.

[18] Rao, J.N.K. (1975). ‘Analytic studies of sample survey data’. Survey Methodo-logy. 1, pp.1-76.

[19] Rao, J.N.K. (1988). ‘Variance estimation in sample surveys’. Handbook of Sta-tistics 6. Sampling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[20] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

[21] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York.

[22] Sen, P.K. (1988). ‘Asymptotics in finite population sampling’. Handbook of Sta-tistics 6. Sampling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[23] Tukey, J.W. (1958). ‘Bias and confidence in not-quite large samples’. Ann. Math.Statist. 29, p. 614.

[24] Wolter, K.M. (1985). Introduction to Variance Estimation. Springer-Verlag.New York.

[25] Woodruff, R.S. (1971). ‘A simple method for approximating the variance of acomplicated estimate’. J. Amer. Statist. Assoc. 66, pp. 411-414.

Jose A. Mayor Gallego. Proyecto Docente

Page 89: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO V 85

2.5. Comentarios al Bloque Tematico V : Mues-

treo sistematico.

En el Bloque Tematico V se estudian los disenos sistematicos, sus variantes, la es-timacion de parametros a partir de muestras sistematicas y los problemas que planteala estimacion de la varianza, lo que da lugar a diferentes enfoques para abordarlos.Hemos dividido este bloque en tres temas,

TEMA 23. Diseno muestral sistematico. Variantes.

TEMA 24. Estimacion de parametros. Eficiencia.

TEMA 25. Estimacion de la varianza: diferentes enfoques.

El muestreo (o diseno) sistematico no se limita a una simple regla para obtenermuestras, por contra se puede considerar como una metodologıa muy general cuyascaracterısticas basicas son la manipulacion de la poblacion en forma secuencial, y laseleccion de elementos mediante una regla repetitiva, no necesariamente estocastica,a partir de una seleccion inicial que si suele serlo.

El objetivo del TEMA 23 es la comprension y caracterizacion de este esquema, queusualmente viene impuesto por la situacion practica de muestreo a la que nos enfren-tamos: control de calidad en lıneas de produccion, auditorıa sobre ficheros secuencialesde cuentas, colectivos de personas asistentes a un evento, muestreos espaciales unidi-mensionales (como cursos de agua) o bidimensionales (como plantaciones o bosques),etc. Por ello, es importante que este tema se ilustre con ejemplos practicos, para locual son muy recomendables las referencias Azorın y Sanchez-Crespo (1986), Murthyy Rao (1988) y Levy y Lemeshow (1991).

Tambien se introduce en este tema el diseno muestral sistematico uniforme depaso k, en el cual el primer elemento se escoge aleatoriamente, con probabilidaduniforme, y los restantes elementos se seleccionan mediante “traslaciones” o saltosconstantes de k elementos, hasta agotar la poblacion. Para este diseno se hallaranlas probabilidades de inclusion, indicando el inconveniente que se presenta al no serlas de segundo orden estrictamente mayores que cero en su totalidad, es decir, es undiseno no cuantificable. El tratamiento de este problema se pospone para el Tema25.

Es interesante observar que los resultados de optimalidad obtenidos en el Tema 9para los disenos muestrales unicluster, de los cuales, el sistematico uniforme de pasok es un caso particular, pierden en parte su relevancia debido al problema indicado.

Jose A. Mayor Gallego. Proyecto Docente

Page 90: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO V 86

Por otra parte, el tamano muestral no es fijo cuando N no es divisible por k, eincluso en ciertos casos puede ser poco controlable, vease Fernandez y Mayor (1994).Para resolver estos inconvenientes existen una serie de variantes como son el metodode intervalo fraccional y el muestreo sistematico circular. Veanse Sarndal etal. (1992) y sobre todo Murthy y Rao (1988).

En el TEMA 24 se estudiara la estimacion de un parametro lineal, mediante elestimador de Horvitz-Thompson, usando en diseno sistematico uniforme de paso k,hallando la varianza del estimador, y particularizando para la media poblacional y eltotal poblacional.

Ası, para la media poblacional, se obtienen,

Y = y

V [Y ] =1

k

k∑t=1

(y(mt)− Y

)2

donde m1, m2, . . . ,mk son las diferentes muestras sistematicas.

A partir de estos resultados, es importante hacer notar que las estimaciones serantanto mejores cuanto mas representativas sean la muestras, y ello depende en granmedida del comportamiento de la variable de estudio “a lo largo” de la poblacion, enel orden de la regla sistematica. De esta forma se comprende facilmente los buenosresultados que proporciona este tipo de muestreo cuando la poblacion posee unatendencia lineal con respecto a la variable de estudio, y su ineficiencia en poblacionescon variaciones de tipo periodico.

Tambien en este tema se realizara el estudio de la eficiencia del muestreo sis-tematico en comparacion con el muestreo aleatorio simple, obteniendo el importanteresultado,

Vsis[Y ]

Vmas[Y ]= 1 +

n− 1

1− fδ

es decir, el efecto del diseno sistematico en relacion al diseno MAS(N, n), para laestimacion de la media, depende fundamentalmente del coeficiente de correlacionintra-muestral,

δ =

2k∑

t=1

∑∑i<j∈mt

(Yi − Y )(Yj − Y )

(n− 1)(N − 1)S2y

Jose A. Mayor Gallego. Proyecto Docente

Page 91: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO V 87

Vease Sukhatme et al. (1984), Azorın y Sanchez-Crespo (1986) y Sarndal etal. (1992).

El presente bloque termina con el TEMA 25, en el cual realizamos un estudio delos diferentes enfoques que se pueden realizar en el problema de estimacion de lavarianza, ya planteado en el Tema 23.

El primer enfoque que introducimos en este tema es el de superpoblacion, esdecir, suponer una determinada estructura o modelo que nos permita construir esti-madores de la varianza. Este enfoque ha sido muy estudiado por numerosos autores,de entre los cuales resaltamos Wolter (1984, 1985) y Cochran (1993).

• Superpoblacion completamente aleatoria.

Yi = µ + ei

Es[ei] = 0Es[eiej] = 0, i 6= jEs[e

2i ] = σ2

• Superpoblacion con tendencia lineal.

Yi = α + βi + ei

Es[ei] = 0Es[eiej] = 0, i 6= jEs[e

2i ] = σ2

Jose A. Mayor Gallego. Proyecto Docente

Page 92: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO V 88

• Superpoblacion con tendencia periodica.

Yi = α + sen(βi) + ei

Es[ei] = 0Es[eiej] = 0, i 6= jEs[e

2i ] = σ2

En estos modelos, Es indica la esperanza en el modelos de superpoblacion.

El tratamiento matematico de los mismos permitira obtener estimaciones validasde la varianza para los dos primeros modelos.

Para el tercer modelo, el uso del muestreo sistematico puede dar origen a grandeserrores en las estimaciones. Si por ejemplo estamos estimando Y mediante y, y elpaso del muestreo sistematico coincide con un multiplo del perıodo, 2π/β, entoncesla estimacion tendra una gran varianza, aunque la varianza estimada sera pequena, alser muy similares los valores muestrales. Por contra, si el paso es un multiplo imparde π/β, la estimacion tendra menos varianza, pero la varianza estimada sera elevada.Por esta causa, el tratamiento de tales poblaciones requiere un estudio previo de susparticularidades, empleandose usualmente tecnicas de replicacion.

El segundo enfoque del problema se realizara mediante los muestreos sistema-ticos cuantificables, en los cuales, con un procedimiento adecuado de seleccion deelementos, se consigue πij > 0, ∀i 6= j. En este sentido, se estudiaran los metodos dereordenacion aleatoria previa de la poblacion, de distancias multiples, los metodos decomposicion y los de partida multiple. Las referencias recomendadas son Murthy yRao (1988) y Hedayat y Sinha (1991).

El ultimo enfoque que se considera es la aplicacion de las tecnicas de replicacionestudiadas en el Tema 22. El tratamiento de este enfoque debera ser eminentemen-te practico, recomendandose la referencia Fernandez y Mayor (1994) que contieneejemplos de este tipo de tecnicas.

Referencias del Bloque Tematico V

[1] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

Jose A. Mayor Gallego. Proyecto Docente

Page 93: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO V 89

[2] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

[3] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[4] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[5] Levy, P.S. y Lemeshow, S. (1991). Sampling of Populations. Methods and Ap-plications. Wiley. New York.

[6] Murthy, M.N. y Rao T.J. (1988). ‘Systematic sampling with ilustrative exam-ples’. Handbook of Statistics 6. Sampling. Krishnaiah y Rao, (Eds.). North Ho-lland. Amsterdam.

[7] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera Edicion. Iowa State University Press.Ames. Iowa.

[8] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York.

[9] Wolter, K.M. (1984). ‘An investigation of some estimators of variance for sys-tematic sampling’. J. Amer. Statist. Assoc. 79, pp. 781-790.

[10] Wolter, K.M. (1985). Introduction to Variance Estimation. Springer-Verlag.New York.

Jose A. Mayor Gallego. Proyecto Docente

Page 94: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 90

2.6. Comentarios al Bloque Tematico VI : Mues-

treo con probabilidades variables.

Este Bloque Tematico abarca un conjunto de temas en los cuales se estudian pro-cedimientos de muestreo que, o bien permiten seleccionar las muestras de forma quelas probabilidades de inclusion de primer orden se adapten a determinadas pautas, loque puede producir la disminucion de la varianza del estimador de Horvitz-Thompson,o bien son las probabilidades de seleccion de elementos las que se controlan, lo que,en combinacion con estimadores especiales, se traduce tambien en la disminucion delerror de muestreo. Los temas incluidos son,

TEMA 26. Disenos muestrales ΠPS. Generalidades.

TEMA 27. Disenos muestrales ΠPS con n = 2.

TEMA 28. Disenos muestrales ΠPS con n > 2. Metodos de seleccionaleatoria.

TEMA 29. Disenos muestrales ΠPS con n > 2. Metodos de exploracionsecuencial.

TEMA 30. Esquemas muestrales PPS. Estimadores especiales.

TEMA 31. Metodo de Rao-Hartley-Cochran.

Los disenos muestrales estudiados en profundidad hasta este momento, aleatoriosimple y sistematico, no tienen en cuenta la particularidades intrınsecas de los ele-mentos. En el momento de la seleccion de un elemento, se puede decir que este no esmas que un “lugar” en la poblacion.

Desde un punto de vista intuitivo, cabe pensar que estos disenos seran apropiadoscuando la poblacion presente una uniformidad en relacion a la variable de estudio, loque se ve corroborado si se estudian las varianzas de las estimaciones correspondien-tes. No obstante, si los elementos presentan gran variabilidad, tales disenos puedenproporcionar estimaciones poco eficientes.

En el TEMA 26 se expondra el planteamiento de este problema ası como unaposible solucion sustentada en la aplicacion del estimador de Horvitz-Thompson. Parasimplificar la notacion, se supondra que el parametro a estimar es T (Y ), usando

Jose A. Mayor Gallego. Proyecto Docente

Page 95: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 91

un diseno de tamano muestral fijo. En tal caso, la varianza de la estimacion, dadapor la formula de Yates-Grundy-Sen, es una combinacion lineal de terminos del tipo(Yi/πi − Yj/πj)

2, con lo cual si fuera factible que πi ∝ Yi, ∀i ∈ U , dicha varianzaserıa nula. Esta situacion “ideal” no se dara casi nunca, sin embargo si disponemosde una variable, X, perfectamente conocida, y relacionada con Y , cabe esperar quetomando πi ∝ Xi, ∀i ∈ U , la varianza sea pequena. Dicha variable auxiliar, cuyosvalores X1, X2, . . . , XN se conocen de antemano se denomina tamano.

Esta es la base de los disenos ΠPS1 en los cuales, la seleccion de la muestra ha deser tal que,

πi = γ Xi ∀i ∈ U

con lo cual se obtiene πi = nXi/T (X), ∀i ∈ U .

Se hara notar la restriccion, obvia, nXi/T (x) ∈ (0, 1], ∀i ∈ U , es decir,

0 < nXi ≤ T (X) ∀i ∈ U

restriccion que ha de cumplir la variable de tamano.

Tambien se obtendran las restricciones 0 < πij ≤ πiπj, i 6= j ∈ U , para que laestimacion de la varianza sea siempre no negativa.

A continuacion, para completar este tema se realizara un estudio analıtico de lavarianza del estimador del Horvitz-Thompson del total, bajo los modelos de super-poblacion simplificados,

• Modelo de proporcionalidad directa.

Yi = βXi + ei

Es[ei] = 0Es[eiej] = 0, i 6= jEs[e

2i ] = σ2

1Inclusion Probability Proportional to Size.

Jose A. Mayor Gallego. Proyecto Docente

Page 96: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 92

• Modelo de regresion lineal.

Yi = α + βXi + ei

Es[ei] = 0Es[eiej] = 0, i 6= jEs[e

2i ] = σ2

desarrollando para cada uno de ellos Es

[T (Y )

].

Existen en la literatura una enorme cantidad de metodos ΠPS, muchos de loscuales se pueden encontrar en Brewer y Hanif (1983) y Chaudhuri y Vos (1988). Enlos temas siguientes de este bloque se estudiara una pequena muestra, no aleatoria,de los mismos.

Otras referencias importantes para este tema son Sukhatme el al. (1984), Hedayaty Sinha (1991) y Sarndal et al. (1992).

El TEMA 27 lo dedicaremos al estudio de varios metodos ΠPS para tamano mues-tral n = 2. Estos metodos tienen interes tanto por su aplicacion, fundamentalmente enmuestreo estratificado, como porque algunos de ellos se pueden generalizar a cualquiervalor de n.

Ası se expondran en profundidad el metodo de Brewer, el de Durbin y el de J.N.K.Rao, demostrando que son realmente metodos ΠPS, y calculando sus probabilidadesde inclusion de segundo orden, que coinciden en los tres, lo que permitira concluirque dichos metodos proporcionan el mismo diseno reducido o generico, aunque losesquemas de seleccion sean diferentes. Ademas probaremos que se cumple 0 < πij ≤πiπj, i 6= j ∈ U . Vease Hedayat y Sinha (1991).

Tambien se estudiaran con detalle el metodo de Sunter, de naturaleza secuencial,vease Sunter (1986) y Hedayat y Sinha (1991), el metodo de Narain, vease Sukhatmeet al. (1984) y Chaudhuri y Vos (1988), y el metodo de Hanurav, vease Sukhatme etal. (1984) y Chaudhuri y Vos (1988).

Los dos temas que siguen, se dedican a diferentes metodos que dan lugar a disenosmuestrales ΠPS, para tamano de muestra n > 2, y que han sido separados segun eltipo de acceso que conlleven, sobre los elementos de la poblacion. Ası, en el TEMA 28estudiamos algunos metodos con acceso “aleatorio”, en el sentido de utilizar la posi-bilidad de acceder directamente a un elemento sin pasar por el anterior. Este aspectoes de gran interes tanto teorico como practico pues el tipo de soporte disponible pararealizar el muestreo condicionara la forma de acceso.

Jose A. Mayor Gallego. Proyecto Docente

Page 97: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 93

El primer metodo que estudiamos es el de Lahiri-Midzuno, basado en el esquema yaconocido de extraer el primer elemento con probabilidad proporcional a su tamano, yel resto de los elementos mediante MAS(N, n). Este es el metodo en su aspecto basicoy proporciona las siguientes probabilidades de inclusion de primer orden,

πi =N − n

N − 1

Xi

T (X)+

n− 1

N − 1∀i ∈ U

es decir, no es realmente un metodo de tipo ΠPS. A pesar de ello lo estudiaremospor su importante propiedad de que, con el diseno que genera, R = y/x es insesgadocon respecto a R = Y /X, y tambien porque, a partir del mismo, y modificandoadecuadamente las probabilidades de seleccion iniciales, sı se puede conseguir undiseno ΠPS, aunque con ciertas limitaciones. Todas estas cuestiones se trataran enprofundidad, pudiendo ser consultadas en Lahiri (1951), Midzuno (1952), Sukhatmeet al. (1984), Hedayat y Sinha (1991) y Fernandez y Mayor (1994).

El metodo de Sampford es una generalizacion de metodo de J.N.K. Rao ya vistopara el caso n = 2. Este metodo consiste en un esquema de rechazo, en el sentido deque los elementos son seleccionados con ciertas probabilidades, y sin controlar posiblesrepeticiones, rechazando los elementos obtenidos si existe alguna repeticion. Una vezexpuesto el procedimiento, se demostrara que es ΠPS y que cumple la condicionrequerida sobre las probabilidades de inclusion. Vease Sampford (1967), Sukhatme etal. (1984) y Hedayat y Sinha (1991).

Con este metodo, las expresiones exactas de las probabilidades de inclusion sonextraordinariamente complicadas, no obstante existen aproximaciones asintoticas deorden O(N−4), dadas por Asok y Sukhatme (1976), que pueden ser utilizadas confines practicos.

Para finalizar este tema, se estudiara el interesante metodo de Hedayat-Lin ba-sado en un juego que sus autores denominan proceso de vaciamiento de cajas,consistente en someter a un conjunto de N cajas con M ≥ N elementos distribui-dos en las mismas, a series de n eliminaciones de elementos de n cajas distintas. Sedemostrara que este metodo puede proporcionar todos los disenos ΠPS posibles, conlo cual se puede escoger entre ellos, mejorando otras caracterısticas. Se recomiendacomo referencia Hedayat y Sinha (1991).

En el TEMA 29 estudiamos varios metodos de tipo secuencial, basados en la ex-ploracion de la poblacion, elemento a elemento. Esta clase de procedimientos resultaadecuada en situaciones en las cuales es difıcil o imposible un acceso directo a loselementos. De los muchos que existen, trataremos tres de ellos.

El primero es el metodo sistematico de Madow. Este metodo, ideado por Ma-

Jose A. Mayor Gallego. Proyecto Docente

Page 98: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 94

T0 T1 T2 · · · Tl−1 Tl · · · TN

X1 X2Xl XN

6 6 6 6 6

γ γ + k γ + 2k · · · γ + (j − 1)k· · · · · ·

rk k k

FIGURA 6.1. Interpretacion grafica del metodo de Madow.

dow (1949) y posteriormente modificado por Goodman y Kish (1950), es una versionΠPS de un muestreo sistematico.

Usando la notacion Tl =∑l

i=1 Xi, con T0 = 0, el metodo consiste en tomar unentero positivo, k, tal que TN = kn + r, con 0 ≤ r < k, y aplicar la siguiente regla,

1. Seleccionar un numero aleatorio γ ∼ U [1..k].

2. Construir la muestra sistematica,

mγ = l |Tl−1 < γ + (j − 1)k ≤ Tl, j = 1, 2, . . . , n(m)

En la Figura 6.1. se expone una idea grafica del metodo. En el eje horizontalsuperior se representan los tamanos acumulados. En el eje horizontal inferior, lossucesivos intervalos sistematicos, cuyos extremos se corresponden con los elementosseleccionados.

Este metodo produce como resultado un diseno ΠPS, que sin embargo no es cuanti-ficable al ser nulas muchas probabilidades de inclusion de segundo orden. Para resolver

Jose A. Mayor Gallego. Proyecto Docente

Page 99: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 95

este problema se realiza una permutacion aleatoria previa de la poblacion, con lo cualel diseno sigue siendo ΠPS, y ademas todas las parejas de elementos pueden estar enla muestra.

En este punto hay que observar que la permutacion aleatoria no tiene por que serefectuada de hecho, y que resulta mas bien un recurso teorico, pues en numerosassituaciones practicas podremos suponer que la poblacion esta dispuesta al azar.

Con esta variacion y usando metodos asintoticos, Hartley y Rao (1962) han dadoexpresiones aproximadas de orden O(N−3) para las probabilidades de inclusion desegundo orden. Por otra parte, Connor (1966) ha obtenido expresiones exactas dedichas probabilidades, aunque bastante complicadas.

Ademas de las referencias citadas, veanse Hajek (1981), Sukhatme et al. (1984),Bellhouse (1988) y Murthy y Rao (1988).

El siguiente metodo que estudiamos en este tema es el de Sunter (1977a, 1977b).Este metodo trabaja secuencialmente sobre la poblacion, ordenada en orden decre-ciente por la variable de tamano, y consigue probabilidades de inclusion de primerorden proporcionales al mismo, para la mayor parte de los elementos.

Para la descripcion general del metodo y ejemplos practicos, se recomiendan lasreferencias Sarndal et al. (1992) y Fernandez y Mayor (1994), y para los desarrollosteoricos necesarios para calcular las probabilidades de inclusion, los artıculos citadosdel autor y tambien Sunter (1986).

Para finalizar este tema, expondremos el metodo secuencial cuasi-equilibrado,Fernandez y Mayor (1995). Este metodo trabaja sobre la poblacion, ordenada demenor a mayor por la variable auxiliar.

Llamando Ti =∑i

k=1 Xk, con T0 = 0, definimos n subpoblaciones como sigue,

U1 = i ∈ U | Ti−1 <T (X)

n≤ Ti

Uk = i ∈ U | Ti−1 < kT (X)

n≤ Ti −

k−1⋃j=1

Uj k = 2, 3, . . . , n

En una exploracion secuencial de la poblacion, U , se recorren sucesivamente lassubpoblaciones U1, U2, . . . , Un. En particular, en la subpoblacion Uk, vamos a consi-derar el siguiente procedimiento para extraer un elemento,

1. Generar un numero aleatorio r ∼ U [0, 1)

Jose A. Mayor Gallego. Proyecto Docente

Page 100: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 96

2. Seleccionar el elemento ui ∈ Uk tal que,

Ti−1 ≤ r TX(Uk) +k−1∑j=1

TX(Uj) < Ti

Sus autores prueban que este metodo es de naturaleza ΠPS en cada subpoblacion,y proporcionan un esquema de tipo replicado, en paralelo, que genera un estimadorinsesgado de la varianza, con buenas propiedades de estabilidad, y que exponemos acontinuacion en forma algorıtmica.

METODO DE EXPLORACION SECUENCIAL CUASI EQUILIBRADO

i := 0, k := 1, Tg = 0

m1 := , . . . ,ml := REPETIR

r1, . . . , rl ∼ U [0, 1)

j1 := 0, . . . , jl := 0

REPETIR

i := i + 1

p := 1

REPETIR

SI ((rp TX(Uk) + Tg < Ti) Y (jp = 0))

mp := mp ∪ ijp := 1

FIN SI

p := p + 1

HASTA p > l

HASTA

(Ti ≥ k

T (X)

n

)Tg := Tg + TX(Uk)

k := k + 1

HASTA (k > n)

Jose A. Mayor Gallego. Proyecto Docente

Page 101: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 97

El TEMA 30 se dedica al estudio de los esquemas muestrales PPS2, es decir, conprobabilidades de seleccion proporcionales al tamano. Estos metodos trabajande forma que en proceso de construccion de la muestra, la seleccion de un elemento,ui, se realiza con probabilidad proporcional a Xi.

En este tema es necesario insistir en la diferencia existente entre el enfoque de losmetodos ΠPS, dirigido a la aplicacion del estimador de Horvitz-Thompson, y el delos metodos PPS, que usualmente requieren estimadores especiales.

Se empezara estudiando el caso con reemplazamiento, muy facil de aplicar pues sebasa en la repeticion de extracciones utilizando el metodo acumulativo o el de Lahiri,con distribucion de probabilidad pi = Xi/T (X), ∀i ∈ U , sin controlar las posibles re-peticiones. Este metodo se usara en combinacion con el estimador de Hansen-Hurwitz,ya estudiado en el tema correspondiente.

Cuando el muestreo es sin reemplazamiento, la muestra obtenida,

m∗ = (i1, i2, . . . , in)

es tal que el elemento (k + 1)-esimo es seleccionado en U − i1, . . . , ik, es decir, lapoblacion inicial menos los elementos seleccionados con anterioridad. Por ello, hay quemodificar las probabilidades de seleccion, dependiendo de los elementos extraıdos, dela siguiente forma,

p′i =pi

1− pi1 − · · · − pik

y el espacio muestral esta formado por todas las muestras de tamano n, siendo laprobabilidad de la muestra m∗,

p∗(m∗) =pi1pi2 · · · pin

(1− pi1)(1− pi1 − pi2) · · · (1− pi1 − pi2 − · · · − pin)

Es importante observar que el diseno que se obtiene es, por naturaleza, ordenado,aunque se podrıa “reducir” a uno generico mediante el procedimiento usual.

El primer estimador que estudiaremos en relacion a este esquema es el estimador deDes Raj (1956), enunciando y demostrando sus propiedades de insesgadez y varianzanula si fuera Yi ∝ Xi, hallando un estimador insesgado de la varianza, y probando quela varianza es siempre menor que la que se obtendrıa en el caso con reemplazamiento.Vease Sukhatme et al. (1984), Des Raj (1980) y Hedayat y Sinha (1991).

2Selection Probability Proportional to Size

Jose A. Mayor Gallego. Proyecto Docente

Page 102: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 98

Simetrizando el estimador de Des Raj, como se vio en el Tema 8, obtendremosel estimador de Murthy (1957), que obviamente tambien sera insesgado, calculandosesu varianza y una estimacion insesgada de la misma. Veanse Sukhatme et al. (1984),Fernandez y Mayor (1994), y sobre todo, Hedayat y Sinha (1991).

Para terminar este bloque tematico, desarrollaremos en el TEMA 31 el metodo deRao-Hartley-Cochran (1962), para ello expondremos previamente el diseno muestralde los grupos aleatorios, consistente en formar n grupos al azar, y extraer en cada unode ellos un elemento con probabilidad proporcional a su tamano, siendo importanteindicar algunos metodos para la construccion de dichos grupos.

Seguidamente se definira el estimador de Rao-Hartley-Cochran, demostrandoseque es insesgado y calculando su varianza y una estimacion insesgada de la misma.Para finalizar el tema, se realizara un estudio de la varianza para obtener la eleccionoptima de los tamanos que han de tener los grupos aleatorios. Veanse Sukhatme etal. (1984), Hedayat y Sinha (1991), Cochran (1993) y Fernandez y Mayor (1994).

Referencias del Bloque Tematico VI

[1] Asok, C. y Sukhatme, B.V. (1976). ‘On Sampford’s procedure of unequal proba-bility sampling without replacement’. J. Amer. Satist. Assoc. 71, pp. 912-918.

[2] Bellhouse, D.R. (1988). ‘Systematic sampling’. Handbook of Statistics 6. Sam-pling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[3] Brewer, K.R.W. y Hanif, M. (1983). Sampling with Unequal Probabilities. Springer-Verlag. New York.

[4] Connor, W.S. (1966). ‘An exact formula for the probability that two specifiedsampling units occur in a sample drawn with unequal probabilities and withoutreplacement’. J. Amer. Statist. Assoc. 61, pp. 384-390.

[5] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

[6] Chaudhuri, A. y Vos, J. (1988). Unified Theory and Strategies of Survey Sam-pling. North Holland. Amsterdam.

[7] Des Raj (1956). ‘Some estimators in sampling with varying probabilities withoutreplacement’. J. Amer. Statist. Assoc. 51, pp. 269-284.

[8] Des Raj (1980). Teorıa del muestreo. Fondo de Cultura Economica. Mexico.

Jose A. Mayor Gallego. Proyecto Docente

Page 103: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 99

[9] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[10] Fernandez, F.R. y Mayor, J.A. (1995). ‘Metodo secuencial cuasi-equilibrado enmuestreo en poblaciones finitas’. Estadıstica Espanola. 138, pp. 143-162.

[11] Goodman, L.A. y Kish, L. (1950). ‘Controlled selection - a technique in proba-bility sampling’. J. Amer. Statist. Assoc. 45, pp. 350-372.

[12] Hajek, J. (1981). Sampling from a finite population. Marcel Dekker. New York.

[13] Hartley, H.O. y Rao, J.N.K. (1962). ‘Sampling with unequal probabilities andwithout replacement’. Ann. Math. Statist. 33, pp. 350-374.

[14] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[15] Lahiri, D.B. (1951). ‘A method of sample selection providing unbiased ratioestimates’. Bulletin of the International Statistical Institute. 33, pp. 133-140.

[16] Madow, W.G. (1949). ‘On the theory of systematic sampling II’. Ann. Math.Statist. 20, pp. 333-354.

[17] Midzuno, H. (1952). ‘On the sampling system with probability proportionate tosum of sizes’. Annals of the Institute of Statistical Mathematics. 3, pp. 99-107.

[18] Murthy, M.N. (1957). ‘Ordered and unordered estimators in sampling withoutreplacement’. Sankhya. A18, pp. 379-390.

[19] Murthy, M.N. y Rao T.J. (1988). ‘Systematic sampling with ilustrative exam-ples’. Handbook of Statistics 6. Sampling. Krishnaiah y Rao, (Eds.). North Ho-lland. Amsterdam.

[20] Rao, J.N.K. (1965). ‘On two simple schemes of unequal probability samplingwithout replacement’. J. Indian Statist. Assoc. 3, pp. 173-180.

[21] Rao, J.N.K., Hartley, H.O. y Cochran, W.G. (1962). ‘A simple procedure ofunequal probability sampling without replacement’. J. Roy. Statist. Soc. B24,pp. 482-491.

[22] Sampford, M. R. (1967). ‘On sampling without replacement with unequal pro-babilities of selection’. Biometrika. 54, pp. 499-513.

Jose A. Mayor Gallego. Proyecto Docente

Page 104: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VI 100

[23] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

[24] Sunter, A. (1977a). ‘Response burden, sample rotation, and classification rene-wal in economic surveys’. Internat. Statist. Rev. 45, pp. 209-222.

[25] Sunter, A. (1977b). ‘List sequential sampling with equal or unequal probabilitieswithout replacement’. Appl. Statist. 26, N.3, pp. 261-268.

[26] Sunter, A. (1986). ‘Solution to the problem of unequal probability samplingwithout replacement’. Internat. Statist. Rev. 54, pp. 33-50.

[27] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York.

Jose A. Mayor Gallego. Proyecto Docente

Page 105: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VII 101

2.7. Comentarios al Bloque Tematico VII : Mues-

treo estratificado.

El Bloque Tematico VII se dedica al estudio del muestreo estratificado, funda-mentalmente como tecnica de reduccion de varianza, basada en la estructuracion dela poblacion mediante determinadas pautas que permitan agrupar los elementos dela misma por criterios de similaridad. Los temas contenidos en este bloque son,

TEMA 32. Poblacion estratificada. Diseno muestral.

TEMA 33. Muestreo aleatorio simple estratificado. Estimaciones.

TEMA 34. Afijacion.

TEMA 35. Eficiencia del muestreo estratificado.

TEMA 36. Metodos de estratificacion de una poblacion.

TEMA 37. Tecnicas especiales en muestreo estratificado.

El TEMA 32 se inicia exponiendo los conceptos basicos del muestreo estratificadoy sus principales objetivos. El fundamento ultimo es la division de la poblacion ensubpoblaciones o estratos dentro de los cuales exista mas homogeneidad que enla poblacion completa, en relacion a la caracterıstica que se estudia. Ası, aunquematematicamente la estructura de estratos no es otra cosa que una particion de lapoblacion,

Uhh=1,...,L conL⋃

h=1

Uh = U y Uh

⋂Ul = ∅ h 6= l

la reduccion de varianza en las estimaciones se conseguira siempre que se procure quehaya homogeneidad dentro de U1, U2, . . . , UL.

En su aspecto mas general, el muestreo estratificado se realizara aplicando, deforma independiente, y en cada estrato, un diseno muestral, dh = (Mh, ph(·)), paraobtener la muestra mh. La union de todas estas muestras dara lugar a la muestrafinal, m, perteneciente al diseno d = (M, p(·)), donde M esta formado por todas la

Jose A. Mayor Gallego. Proyecto Docente

Page 106: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VII 102

muestras que se pueden construir por union de muestras de M1, M2, . . . ,ML, y ladistribucion de probabilidad, p(·), sera,

p(m1 ∪m2 ∪ · · · ∪mL) =L∏

h=1

ph(mh)

De forma analoga, se calculara la matriz del diseno, Π, correspondiente, que ven-dra dada en funcion de las probabilidades de inclusion de los disenos aplicados encada estrato.

Para finalizar el tema, se obtendra la descomposicion usual del estimador deHorvitz-Thompson para un parametro poblacional lineal, para su varianza y parala estimacion insesgada de la misma, particularizando los resultados obtenidos parael parametro media poblacional,

Y =1

N

L∑h=1

∑i∈mh

Yi

πi

V [Y ] =1

N2

L∑h=1

∑∑i,j∈Uh

∆ijYi

πi

Yj

πj

V [Y ] =1

N2

L∑h=1

∑∑i,j∈mh

∆ij

πij

Yi

πi

Yj

πj

Como fuentes importantes de informacion introductoria y ejemplos sobre muestreoestratificado se usaran Azorın y Sanchez-Crespo (1986) y Cochran (1993).

El TEMA 33 tiene como objetivo el estudio del muestreo estratificado cuandose aplica en cada estrato, Uh, el diseno muestral aleatorio simple, MAS(Nh, nh). Estemuestreo se denomina aleatorio simple estratificado, y se denota MASE(N,n), siendoN = (N1, . . . , NL) y n = (n1, . . . , nL).

A partir de las expresiones generales del tema anterior, se obtendran ahora losestimadores clasicos para la media, total y proporcion poblacionales, ası como suvarianza y la estimacion insesgada usual de la misma. Vease Sukhatme et al. (1984),Cochran (1993) y Fernandez y Mayor (1994).

Tambien se estudiara en este tema la estimacion de parametros no lineales, utili-zando la razon de medias, R = Y /X, como ejemplo paradigmatico. Para este parame-

Jose A. Mayor Gallego. Proyecto Docente

Page 107: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VII 103

tro se estudiaran los dos estimadores usuales, es decir, el separado,

Rs =L∑

h=1

WhRh =L∑

h=1

Whyh

xh

y el combinado,

Rc =

L∑h=1

Whyh

L∑h=1

Whxh

siendo importante realizar un estudio comparativo que ponga en evidencia cuandousar uno u otro, dependiendo del numero de estratos, de los tamanos muestrales encada uno y de la relacion existente entre las variables X e Y . Vease Cochran (1993).

En el TEMA 34 se aborda el estudio de la afijacion, es decir, del reparto del ta-mano muestral total, o de los recursos economicos disponibles para realizar el mues-treo, entre los diferentes estratos. Por supuesto, la afijacion dependera de los criteriosque se consideren, y que fundamentalmente se resumen en criterios de precision ycriterios de coste. Los criterios de precision se aplican mediante la varianza de la esti-macion, y los criterios de coste mediante una funcion, C(n1, . . . , nL), que proporcionael coste de muestreo en funcion de los tamanos de muestra en cada estrato, y quesupondremos de tipo lineal,

C(n1, . . . , nL) = c0 +L∑

h=1

chnh

La primera clase de afijaciones que consideraremos son las afijaciones propor-cionales, que consisten en tomar nh proporcional al tamano del estrato, Nh. Obvia-mente, estas afijaciones tienen sus limitaciones pues no consideran la mayor o menordispersion de la variable en los estratos, sin embargo son de facil aplicacion, y puedendar buenos resultados si dicha dispersion es similar en todos los estratos. Concretando,plantearemos este tipo de afijacion con limitacion del tamano muestra total,

L∑h=1

nh = n

Jose A. Mayor Gallego. Proyecto Docente

Page 108: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VII 104

lo que origina la afijacion nh = nWh, h = 1, . . . , L, y con limitacion de coste,

c0 +L∑

h=1

chnh = C∗

que proporciona la afijacion nh = (C∗ − c0)Nh/∑L

h=1 chNh, h = 1, . . . , L.

La otra clase de afijaciones que se estudiaran son las llamadas afijaciones opti-mas, con las cuales se busca la mejora de alguno de los criterios mencionados ante-riormente. Ası, suponiendo la funcion de coste lineal, y una varianza con la siguienteforma funcional,

V [θ] =L∑

h=1

Ah

nh

+ B

donde Ah no depende de nh, hallaremos la afijacion que minimiza la varianza, a uncoste limitado, y la afijacion que minimiza el coste, con una varianza limitada. Encualquier caso se obtiene el resultado,

nh ∝ (Ah/ch)1/2 h = 1, . . . , L

En el caso de querer minimizar la varianza, a coste limitado, C∗, la afijacion resultaser,

nh =C∗ − c0)(Ah/ch)

1/2∑Lh=1(Ahch)1/2

h = 1, . . . , L

con varianza mınima,

Vmin =1

C∗ − c0

[L∑

h=1

(Ahch)1/2

]2

+ B

Y si minimizamos el coste, con varianza limitada, V ∗, la afijacion es,

nh =(Ah/ch)

1/2

V ∗ −B

[L∑

h=1

(Ahch)1/2

]h = 1, . . . , L

Jose A. Mayor Gallego. Proyecto Docente

Page 109: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VII 105

con coste mınimo,

Cmin = c0 +1

V ∗ −B

[L∑

h=1

(Ahch)1/2

]2

Como caso particular, se estudiara la estimacion de θ(Y ) = Y bajo muestreoMASE(N,n), siendo entonces Ah = W 2

hS2yh y B = −∑L

h=1 WhS2yh, obteniendose las

expresiones usuales un funcion de los costes, de los tamanos de los estratos y de lasvariabilidades en los mismos.

En el caso de transformacion de la restriccion de coste en restriccion de tamanomuestral total, n, tomando c0 = 0, c1 = · · · = cL = 1 y C∗ = n, obtendremos laconocida afijacion de Neyman (1934),

nh = nNhSyh∑L

h=1 NhSyh

h = 1, . . . , L

Estas afijaciones, bajo diseno MASE(N,n), requieren el conocimiento de las cua-sivarianzas en los estratos, S2

yh. Como ello no ocurre en general, existen variacionescomo la afijacion optima modificada consistente en sustituir S2

yh por s2yh calcula-

das mediante muestras preliminares en cada estrato. Otra posibilidad, muy utilizada,es emplear una variable auxiliar, X, totalmente conocida y relacionada con la Y , uti-lizando S2

xh en lugar de S2yh. Estudios pormenorizados de estas y otras posibilidades

se encuentran en Sukhatme et al. (1984), Sarndal et al. (1992) y Cochran (1993).

Para terminar el tema, se realizara el estudio del tamano muestral necesario pa-ra obtener una determinada precision. Vease Cochran (1993) y Fernandez y Ma-yor (1994).

En aspecto muy importante del muestreo estratificado es la calibracion de la me-jora que produce, en terminos de precision y coste, en relacion al muestreo no estrati-ficado. Esto lo realizaremos en el TEMA 35, particularizando al caso de la estimacionde la media poblacional, Y , mediante muestreo aleatorio simple estratificado.

En primer lugar estudiaremos la ganancia en precision, comparando las varianzasque se obtienen mediante muestreo aleatorio simple estratificado y no estratificado.Obviamente, los resultados que se obtengan van a depender de la afijacion. Ası, enprimer lugar se supondra afijacion proporcional, constatando como, si los terminosN−1

h pueden ser despreciados, entonces la estratificacion produce una ganancia deprecision. Resultados similares se obtienen para el caso de las afijaciones optimas.

Jose A. Mayor Gallego. Proyecto Docente

Page 110: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VII 106

En relacion a esta cuestion, la ganancia de precision puede ser resumida en elefecto del diseno,

efd =Vmas[Y ]

Vmase[Y ]

cuya estimacion sera tambien considerada.

Para terminar el tema, se realizara un estudio comparativo similar, en terminos decoste de muestreo. Todas estas cuestiones son tratadas en profundidad en Sukhatmeet al. (1984).

En el TEMA 36 estudiaremos diferentes procedimientos para definir la estructurade estratos sobre la poblacion. Esta cuestion presenta varios problemas como son elescoger la caracterıstica mas apropiada para construirlos, el determinar los lımites delos estratos y tambien la eleccion del numero de estratos que se han de considerar.

A partir de la eleccion de la variable de estudio, Y , para realizar la estratificacion,y de la suposicion de continuidad de la misma, se obtendran las reglas clasicas de Da-lenius y Gurney (1951), de Dalenius y Hodges (1959) y de Ekman (1959), justificandocomo, en lugar de la variable de estudio, Y , se puede usar una variable auxiliar, X,relacionada con ella.

En cuanto al numero de estratos a considerar, estudiaremos los desarrollos existen-tes que consideran la reduccion de varianza en funcion de L ası como las variacionesen el coste de muestreo.

Ademas de las referencias citadas, son fundamentales para este tema Sukhatmeet al. (1984) y Cochran (1993).

Para completar este bloque tematico, estudiaremos en el TEMA 37 algunas tecnicasespeciales relacionadas con el muestreo estratificado.

La primera de ellas es la post-estratificacion, utilizada en aquellas situacionesen las cuales el estrato al que pertenece una unidad no puede ser conocido hastadespues de recoger los datos. El procedimiento consiste en extraer la muestra, m,a partir de un diseno “global”, clasificando sus elementos posteriormente, segun losestratos a los que pertenecen, y formando ası las submuestras mh, k = 1, . . . , L.

Para realiza un estudio en profundidad, se supondra que la muestra m se haobtenido a partir de un diseno muestral MAS(N, n), aplicado sobre la poblacion

Jose A. Mayor Gallego. Proyecto Docente

Page 111: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VII 107

completa, y se definira el siguiente el estimador de la media poblacional,

Y post =L∑

h=1

Why(mh)

demostrandose que es insesgado y calculando su varianza aproximada y una estima-cion insesgada de la misma. Veanse Cochran (1994) y Fernandez y Mayor (1994) paralos desarrollos teoricos, y Levy y Lemeshow (1991) para ejemplos practicos de estemetodo.

La otra metodologıa que se estudiara en este tema es la tecnica de semimues-tras que encuadramos dentro de las tecnicas de exploracion intensiva de una muestra.Esta tecnica, desarrollada por McCarthy (1969), se basa en la obtencion de una mues-tra estratificada formada por dos elementos de cada estrato. Combinando de todas lasformas posibles un elemento de cada estrato, podemos formar 2L “semimuestras” conlas que es posible construir estimadores muy estables de la varianza. Sin embargo,como la cantidad 2L suele ser muy elevada, se plantea la posibilidad de tomar unnumero menor de semimuestras para obtener las estimaciones. Ello es posible, esco-giendo un conjunto determinado y mucho mas pequenos de semimuestras que han deverificar ciertas condiciones y que se denominan semimuestras balanceadas.

La condicion de balanceo se puede expresar matricialmente mediante relacionesde ortogonalidad, lo que permite construir las semimuestras balanceadas mediante lasllamadas matrices de Hadamard.

Un tratamiento muy completo de estas tecnicas se puede encontrar en Wol-ter (1985), donde ademas se dan las matrices de Hadamard hasta el orden 100, yen Fernandez y Mayor (1994). Veanse tambien Kish y Frankel (1970, 1974) y Sarndalet al. (1992).

Referencias del Bloque Tematico VII

[1] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

[2] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

[3] Dalenius, T. y Gurney, M. (1951). ‘The problem of optimum stratification II’.Skandinavisk Aktuarietidskrift. 34, pp. 133-148.

Jose A. Mayor Gallego. Proyecto Docente

Page 112: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VII 108

[4] Dalenius, T. y Hodges, J.L. (1959). ‘Minimum variance stratification’. J. Amer.Statist. Assoc. 54, pp. 88-101.

[5] Ekman, G. (1959). ‘An aproximation useful in univariate stratification’. Ann.Math. Statist. 30, pp. 219-229.

[6] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[7] Kish, L. y Frankel, M.R. (1970). ‘Balanced repeated replication for standarderrors’. J. Amer. Statist. Assoc. 65, pp. 1071-1094.

[8] Kish, L. y Frankel, M.R. (1974). ‘Inference from complex samples’. J. Roy.Statist. Soc. B36, pp. 1-37.

[9] Levy, P.S. y Lemeshow, S. (1991). Sampling of Populations. Methods and Ap-plications. Wiley. New York.

[10] McCarthy, P.J. (1969). ‘Pseudo-replication: half-samples’. Review of the Inter-national Statistical Institute. 37, pp. 239-264.

[11] Neyman, J. (1934). ‘On the two different aspects of the representative me-thod. The method of stratified sampling and the method of purposive selection’.J. Roy. Stat. Soc. 97, pp. 558-606.

[12] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York, Inc.

[13] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

[14] Wolter, K.M. (1985). Introduction to Variance Estimation. Springer-Verlag.New York.

Jose A. Mayor Gallego. Proyecto Docente

Page 113: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VIII 109

2.8. Comentarios al Bloque Tematico VIII : Mues-

treo por conglomerados.

En el Bloque Tematico VIII agrupamos los temas dedicados al muestreo por con-glomerados. Este tipo de muestreo se fundamenta, como el estratificado, en la exis-tencia de estructuras de particion, posiblemente anidadas, sobre la poblacion, perosu finalidad ya no es la reduccion de varianza sino facilitar el proceso de muestreoahorrando esfuerzo en la elaboracion de los marcos, mediante la utilizacion de divi-siones administrativas o de otro tipo. El bloque contiene los siguientes temas,

TEMA 38. Poblacion estructurada en conglomerados. Muestreo porconglomerados en una etapa.

TEMA 39. Muestreo por conglomerados en dos etapas.

TEMA 40. Muestreo multietapico. Tecnicas de replicacion.

TEMA 41. Estimaciones con disenos complejos usando el programaPC CARP.

En los disenos muestrales considerados anteriormente, se suponıa una accesibilidaddirecta al marco de la poblacion del cual son seleccionadas las unidades poblacionales,

U = u1, u2, . . . , uN

Sin embargo, en muchas situaciones no se dispone de este marco de la unidadesde la poblacion pero sı se tiene acceso a listas de algun tipo de agrupaciones delas mismas, como las manzanas de una ciudad, zonas geograficas, etc, de maneraque la poblacion esta dividida en clases, C1, C2, . . . , CM , que reciben el nombre deconglomerados, sobre los que se realiza el muestreo, obteniendose una muestra de losmismos,

mc = Cj1 , Cj2 , . . . , Cjg

A su vez, sobre cada conglomerado se puede considerar una estructura similar deconglomerados, sobre los cuales se realizarıa un proceso analogo, y ası sucesivamente.De esta forma, una estructura de conglomerados permite reproducir las complejasestructuras que poseen las poblaciones reales.

Jose A. Mayor Gallego. Proyecto Docente

Page 114: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VIII 110

C1 C2. . . Cj . . . C1(j)

-

Cj

. . . Ci(j) . . .

?

C1(j, i). . .. . . Ck(j, i)

Ci(j)

C1(j, i, k). . .. . . Cl(j, i, k)

. . . -

Ck(j, i)

Ct(j, i, . . .)

C1(j, i, . . . , t) . . . Cr(j, i, . . . , t) . . .

FIGURA 8.1. Estructura general de conglomerados.

El TEMA 38 se inicia con la exposicion de esta estructura general y la finalidadprimordial de la misma, introduciendo la notacion adecuada para facilitar su estudio,por compleja que sea.

Denotaremos por Uc la “poblacion de conglomerados” primarios y usaremos lanotacion Cj para representar el conglomerado j de Uc. Con Ci(j) representamos elconglomerado i del conglomerado Cj, con Ck(j, i) el conglomerado k de Ci(j), yası sucesivamente. Ver Figura 8.1.

El muestreo por conglomerados se llevara a cabo por sucesivos muestreos sobrelas diferentes estructuras consideradas, es decir, en general se trata de un procesomultietapico formado por la aplicacion de sucesivos disenos muestrales para obtenerlas muestras de cada etapa.

Para ilustrar adecuadamente estas cuestiones se utilizaran ejemplos practicos deestructuras de conglomerados y metodos de muestreo sobre los mismos. En Hansen,Hurwitz y Madow (1953) pueden encontrarse ejemplos de muestreo sobre zonas geo-graficas, ası como algunos procedimientos de seleccion de conglomerados.

Jose A. Mayor Gallego. Proyecto Docente

Page 115: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VIII 111

A continuacion, estudiaremos el caso mas simple de este tipo de muestreo, elmuestreo por conglomerados en una etapa, en el cual la poblacion esta divididaen conglomerados, C1, . . . , CM , que forman las unidades primarias, y cada uno de ellosesta constituido por unidades finales de U , siendo Ni el numero de elementos de Ci.Una vez obtenida la muestra de unidades primarias, sobre las unidades finales de cadauna de ellas no se realiza un muestreo sino que son estudiadas exhaustivamente.

Con esta estructura, se estudiara la estimacion de un parametro lineal medianteel estimador de Horvitz-Thompson, lo que requiere el calculo de las probabilidadesde inclusion de las unidades finales a partir de la correspondientes al diseno empleadoen la seleccion de los conglomerados. Si denotamos estas por Πc, tendremos,

πk = πci si k ∈ Ci ∀k ∈ U

πkl =

πc

ij si k ∈ Ci, l ∈ Cj

πci si k, l ∈ Ci

∀k, l ∈ U

siendo pues la estimacion de θ(Y ) =∑

U akYk,

θ =∑k∈m

akYk

πk

=∑

i∈mc

∑k∈Ci

akYk

πk

=∑

i∈mc

1

πci

∑k∈Ci

akYk =∑

i∈mc

v(Ci)

πci

donde v(Ci) denota el parametro lineal que se esta estimando, valorado sobre todoslos elementos del conglomerado Ci.

Siguiendo este esquema, estudiaremos, como casos particulares, los parametrosmedia poblacional y total poblacional suponiendo, en primer lugar, que se empleadiseno muestral MAS(M, g) para la seleccion de conglomerados. De esta forma obten-dremos las expresiones habituales para los estimadores, sus varianzas y estimacionesinsesgadas de las mismas. Es interesante observar que, por ejemplo, para la media, setiene,

V [Y ] = (1

g− 1

M)S2

z

siendo Zi = MwiY (Ci) = M(Ni/N)Y (Ci), es decir, si los conglomerados son muy

Jose A. Mayor Gallego. Proyecto Docente

Page 116: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VIII 112

parecidos, en relacion a la variable de estudio, la varianza puede ser muy elevada silos tamanos de los mismos difieren en exceso, lo que nos dice que las estimacionesobtenidas solo deberıan utilizarse si los conglomerados estan muy equilibrados en loque a tamanos, Ni, se refiere.

La resolucion de esta dificultad justificara la introduccion del estimador basadoen razon,

Y R =

∑i∈mc

T (Ci)∑i∈mc

Ni

cuya varianza se calculara usando tecnicas aproximadas.

Otra solucion al problema es utilizar un diseno ΠPS para obtener la muestra deconglomerados, tomando como variable de tamano las cantidades Ni. En tal caso,tendremos,

πci =

g

NNi i ∈ Uc

con lo cual,

Y =1

g

∑i∈mc

Y (Ci)

siendo la varianza,

V [Y ] = − 1

2g2

∑i,j∈Uc

∆cij(Y (Ci)− Y (Cj))

2

con lo que el problema antes mencionado quedarıa resuelto.

Para completar el estudio de los problemas de estimacion bajo muestreo por con-glomerados en una etapa, se realizara la estimacion del parametro razon de medias,R = Y /X, como ejemplo del tratamiento de parametros no lineales. Estas cuestionesson tratadas en profundidad por Sukhatme et al. (1984), Cochran (1993), Hedayat ySinha (1991), Sarndal et al. (1992) y Fernandez y Mayor (1994).

El tema finaliza con el estudio del efecto del diseno, suponiendo seleccion de con-glomerados mediante MAS(M, g) en relacion al diseno basico MAS(N, n), llegandose

Jose A. Mayor Gallego. Proyecto Docente

Page 117: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VIII 113

a conclusiones parecidas a las obtenidas para el muestreo sistematico. Estudios porme-norizados de esta importante cuestion pueden encontrarse en Sukhatme et al. (1984),Hedayat y Sinha (1991) y Cochran (1993).

El TEMA 39 se dedica al estudio del muestreo por conglomerados en dos etapas,en el cual, los conglomerados muestreados en la primera etapa no son estudiadosde forma exhaustiva, sino que en cada uno de ello se realizan nuevos muestreos deunidades finales o elementos.

En este caso, las probabilidades de inclusion de los elementos vendran dadas enfuncion de las correspondientes a los conglomerados, Πc, y los disenos dentro de cadauno de los conglomerados, Πi, i ∈ Uc,

πk = πcjπ

ji si k ∈ Cj ∀ k ∈ U

πkl = πcjπ

jkl si k, l ∈ Cj, k 6= l ∀ k, l ∈ U

πkl = πcijπ

ikπ

jl si k ∈ Ci, l ∈ Cj, i 6= j ∀ k, l ∈ U

lo que nos permite construir los estimadores de forma analoga a como se hizo en el casode una etapa, siendo pues el desarrollo de este tema muy similar al del anterior, aunquepresenta dificultades tecnicas superiores originadas por la necesidad de considerar laaleatoriedad procedente de cada una de las etapas, y que seran resueltas mediante lasdescomposiciones usuales de la esperanza y la varianza.

En este tema se estudia tambien el caso de obtencion con reemplazamiento delas unidades primarias, que aunque produzca perdida de precision, da lugar a ex-presiones muy simplificadas de las estimaciones y su varianza, basadas en el estimadorde Hansen-Hurwitz. Veanse Sarndal et al. (1992) y Fernandez y Mayor (1994).

Para completar el tema se realizara una introduccion al estudio de la eleccionoptima de tamanos muestrales, en la primera y segunda etapa, con diferentes funcionesde coste. Veanse Hansen, Hurwitz y Madow (1953), Sukhatme et al. (1984) y Hedayaty Sinha (1991).

Como ya se ha visto en los temas anteriores, el tratamiento de las estimaciones enmuestreo por conglomerados resulta aparentemente complejo, incluso para pocas eta-pas. En el TEMA 40 indicamos una metodologıa muy general para el tratamiento demuestreos por conglomerados multietapicos. La idea basica es la siguiente: un mues-treo en r etapas se puede considerar como un muestreo en dos etapas, englobando lasr− 1 etapas finales en una sola. Como consecuencia, las expresiones correspondientesse obtienen aplicando recursivamente las ya conocidas para dos etapas.

Jose A. Mayor Gallego. Proyecto Docente

Page 118: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VIII 114

En este tema desarrollaremos completamente un proceso de este tipo, en tresetapas, para ilustrar el metodo indicado. Ası, vamos a considerar la estimacion de lamedia poblacional, Y , suponiendo que la poblacion esta dividida en M conglomeradosCi, i ∈ Uc, y cada uno de ellos, a su vez, se divide en Mi conglomerados, Cj(i), j ∈ Ci

de Nji elementos (unidades finales) cada uno. Ademas, denotamos por Ni el numerode unidades finales del conglomerado Ci, es decir,

Ni =∑j∈Ci

Nji i ∈ Uc

realizandose el muestreo de la siguiente forma,

ETAPA 1. De la poblacion de conglomerados, Uc, se extrae una muestra, mc, de gconglomerados, usando diseno MAS(M, g).

ETAPA 2. En cada Ci, i ∈ mc se extrae una muestra, mci, de gi conglomerados,

usando diseno MAS(Mi, gi).

ETAPA 3. En cada Cj(i), j ∈ mcise extrae una muestra, mji, de nji unidades finales,

usando diseno MAS(Nji, nji). Reuniendo todas las unidades finales obtenemosla muestra final, m.

Observaremos que para una unidad final, uk ∈ U , la probabilidad de inclusion deprimer orden sera,

πk =g

M

gi

Mi

nji

Nji

k ∈ Cj(i) ∈ Ci

y aplicando el estimador de Horvitz-Thompson obtenemos,

Y =1

N

∑k∈m

Yk

πk

=1

N

M

g

∑i∈mc

Mi

gi

∑j∈mci

Nji

nji

∑k∈mji

Yk

=1

g

∑i∈mc

MNi

N

1

gi

∑j∈mci

MiNji

Ni

1

nji

∑k∈mji

Yk

e introduciendo la notacion,

wi =Ni

N

Jose A. Mayor Gallego. Proyecto Docente

Page 119: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VIII 115

wji =Nji

Ni

yji =1

nji

∑k∈mji

Yk

yi =1

gi

∑j∈mci

Miwji1

nji

∑k∈mji

Yk =1

gi

∑j∈mci

Miwjiyji

Zi = Mwiyi

Aji = Miwjiyji

obtenemos para la estimacion,

Y =1

g

∑mc

Mwiyi =1

g

∑mc

Zi = z

Y de forma totalmente analoga al caso de dos etapas, la varianza estimada ven-dra dada por,

V [Y ] =(1

g− 1

M

)s2

z +M

g

∑i∈mc

w2i V [yi]

siendo V [yi] la varianza estimada de una media en dos etapas (la segunda y la tercera).Aplicando pues nuevamente la expresion para la varianza estimada con dos etapas,obtenemos,

V [yi] =( 1

gi

− 1

Mi

)s2

ai+

Mi

gi

∑j∈mci

w2jiV [yji]

=( 1

gi

− 1

Mi

)s2

ai+

Mi

gi

∑j∈mci

w2ji

( 1

nji

− 1

Nji

)s2

ji

donde, s2ai

, i ∈ mc denota, para cada i ∈ mc, la cuasivarianza de los valores Aji, j ∈mci

, siendo ademas,

s2ji =

1

nji − 1

∑k∈mji

(Yk − yji)2 i ∈ mc, j ∈ mci

Jose A. Mayor Gallego. Proyecto Docente

Page 120: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VIII 116

Para terminar este tema, indicaremos como pueden aplicarse tecnicas de replica-cion en el caso de muestreos multietapicos complejos. Como referencia para este temase recomienda Fernandez y Mayor (1994), donde, ademas de los desarrollos teoricos,se proporcionan ejemplos practicos totalmente desarrollados.

En el TEMA 41, ultimo de este bloque, exponemos las particularidades y la for-ma de trabajar con el programa PC CARP, Fuller et al. (1989), desarrollado en elLaboratorio de Estadıstica de la Universidad de Iowa, y que permite obtener estima-ciones de parametros a partir de datos muestrales procedentes de disenos muestralescomplejos, que combinan estructura de estratos y conglomerados.

En primer lugar expondremos las posibilidades que tiene este programa y su ambi-to de aplicacion, indicando que aunque puede aplicarse incluso sobre los casos massencillos de muestreo aleatorio simple, al utilizar por defecto una estructura complejade estratos y conglomerados, ha sido necesario alcanzar este nivel de conocimientopara poder utilizarlo adecuadamente.

Es muy importante exponer la estructura especıfica que han de poseer los datosde entrada, sobre los que PC CARP actuara para obtener las estimaciones. En estosdatos, la primera columna es siempre un identificador de estratos, la segunda, unidentificados de conglomerados, y la tercera, los denominados pesos, que son canti-dades que engloban convenientemente los coeficientes que afectan a los datos en losestimadores. A partir de la cuarta columna se situan los datos muestrales.

La entrada de datos ha de estar formateada utilizando las mismas pautas que lasdel lenguaje FORTRAN, no muy generalizado en la actualidad, por lo que sera con-veniente exponer las reglas basicas de los formatos de este lenguaje.

Tambien se hara una descripcion de los estimadores genericos empleados porPC CARP, y la forma en la que, mediante el uso de una variable ficticia denominada“intercept”, que toma el valor constante 1, se pueden obtener estimaciones basadasen razon.

Finalmente, se ilustrara todo lo anterior resolviendo varios problemas tipo que vandesde el caso sencillo de muestreo aleatorio simple basico hasta el mas complejo demuestreo estratificado con muestreo bietapico en cada estrato.

Las referencias basicas para este tema son Lehtonen y Pahkinen (1995), que sepuede considerar como un curso practico de muestreo con ejemplos resueltos porPC CARP, y por supuesto el manual que acompana al programa, Fuller et al. (1989).

Jose A. Mayor Gallego. Proyecto Docente

Page 121: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO VIII 117

Referencias del Bloque Tematico VIII

[1] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

[2] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[3] Fuller, W.A., Schnell, D., Sullivan, G., Kennedy, W.J. y Park, H.J. (1989).PC CARP. Statistical Laboratory. Iowa State University. Ames. Iowa.

[4] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol. I y II. Wiley. New York.

[5] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[6] Lehtonen, R. y Pahkinen, E.J. (1995). Practical Methods for Design and Analy-sis of Complex Surveys. Wiley. Chichester.

[7] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York, Inc.

[8] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

Jose A. Mayor Gallego. Proyecto Docente

Page 122: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 118

2.9. Comentarios al Bloque Tematico IX : Empleo

de informacion auxiliar en la estimacion.

En este Bloque Tematico se han agrupado una serie de temas en los que se estudiael empleo de informacion auxiliar en la fase de estimacion.

A lo largo de temas anteriores se ha considerado ya el empleo de informacionauxiliar en lo que podrıamos llamar fase de muestreo, ası, se han estudiado los disenosΠPS y PPS, en los cuales las probabilidades utilizadas para seleccionar elementosestan afectadas por los valores de una variable auxiliar X. Tambien, en el muestreoestratificado, se ha considerado el empleo de una variable auxiliar en cuestiones talescomo la afijacion o la definicion de estratos.

Sin embargo, ahora estudiaremos diferentes formas de construir estimadores queutilicen, en la forma mas adecuada, dicha informacion auxiliar, buscando la obtencionde estimaciones eficientes. Los temas que forman este bloque son,

TEMA 42. Estrategias que utilizan informacion auxiliar.

TEMA 43. Estimadores de razon.

TEMA 44. Estimadores de regresion.

TEMA 45. Estimadores especiales.

En el TEMA 42, primero de este bloque, realizaremos una introduccion a la meto-dologıa de empleo de variables de informacion auxiliar en las estrategias muestrales,insistiendo que la incidencia de este tipo de informacion en la fase de muestreo ya hasido considerada en el estudio de los disenos con probabilidades de inclusion propor-cionales al tamano y de los esquemas con probabilidades de seleccion proporcionalesal tamano, ası como en los muestreos estratificados en los cuales la agrupacion de lavariable de estudio o la afijacion se realiza usualmente en base a una variable auxiliar.Hay muchas otras formas de emplear dicha informacion, ası, segun Hedayat y Sin-ha (1991), la utilizacion de la informacion puede aparecer en alguna de las siguientescircunstancias,

(i) La variable o variables de informacion auxiliar son conocidas para todas lasunidades de la poblacion, se aplican en la fase de muestreo, afectando al diseno,y tambien intervienen directamente en las estimaciones.

Jose A. Mayor Gallego. Proyecto Docente

Page 123: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 119

(ii) La variable o variables de informacion auxiliar son conocidas para todas lasunidades de la poblacion, no se aplican en la fase de muestreo, pero sı intervienendirectamente en las estimaciones.

(iii) La informacion auxiliar esta disponible a partir de diferentes fuentes, pero re-sulta imposible integrarlas para su uso en el diseno muestral; a pesar de ello, seintenta investigar una integracion apropiada en la fase de estimacion, empleandotanto variables auxiliares como variables de estudio.

(iv) La informacion auxiliar se obtiene solo en la recogida de datos, y se intenta usardicha informacion en la fase de estimacion.

Correspondiendo el caso (i) a los metodos estudiados fundamentalmente en elBloque Tematico VI.

En el presente Bloque Tematico trataremos especıficamente el empleo de esta in-formacion en la fase de estimacion, esto es, introduciendo la misma en los estimadoresque se apliquen. Iniciaremos esta cuestion estudiando lo que denominamos solucio-nes heurısticas, basadas en considerar el parametro a estimar como una derivacionde una expresion mas compleja, sobre la cual se sustituyen ciertas cantidades po-blacionales por muestrales. Por supuesto, un estudio posterior permitira calibrar sihemos obtenido un estimador eficiente y encontrar las mejores condiciones para suaplicacion. Por ejemplo, a partir de la expresion,

Y =Y

XX = R X

podemos definir, heurısticamente, el estimador,

Y R = R X

Este enfoque se denominara heurıstico, y en cierto modo se contrapone al otroenfoque que consideraremos, mas formal, denominado enfoque predictivo, basadoen suponer un “modelo” o relacion funcional entre la variable de estudio, Y , y lavariable auxiliar, X, de la forma Y = f(X). Si f(·) fuera conocida completamente, elconocimiento de X nos llevarıa al de Y y por tanto al de cualquier parametro θ(Y ).

Usualmente, f(·) es desconocida y su determinacion solo puede realizarse de unmodo aproximado, a partir del conocimiento de la variable X, y de la informacionsuministrada por el estadıstico,

(Xi, Yi) | i ∈ m

Jose A. Mayor Gallego. Proyecto Docente

Page 124: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 120

y con dicha informacion, buscaremos la funcion f(·) que “mejor” explique la relacionobservada y que denominaremos funcion predictora. En este sentido, es muy im-portante indicar la importancia de estudios exploratorios de los datos muestrales, porejemplo dibujando la nube de puntos, que proporcionen indicios sobre las pautasque relacionan X con Y . Vease Fernandez y Mayor (1994).

El siguiente paso sera estimar θ(Y ) mediante θ(Y ), siendo Yi, i ∈ U los valo-res aproximados a los verdaderos valores Yi, i ∈ U , proporcionados por la funcionpredictora f(·), es decir,

Yi = f(Xi) i ∈ U

Por ejemplo, para un parametro lineal del tipo θ(Y ) =∑

i∈U aiYi se tendra,

θ(Y ) =∑i∈U

aiYi =∑i∈U

aiYi +∑i∈U

ai(Yi − Yi)

cuyo primer sumando es conocido, y el segundo es desconocido, siendo funcion delerror de estimacion de f(·). Si este segundo sumando es despreciable, podemos darcomo estimador,

θ1(Y ) =∑i∈U

aiYi

en otro caso podemos estimarlo, por ejemplo mediante el estimador de Horvitz-Thompson, obteniendo el estimador alternativo,

θ2 =∑i∈U

aiYi +∑i∈m

aiYi − Yi

πi

Es importante observar que en el enfoque predictivo se combinan dos procesosestadısticos, el ajuste y la estimacion, dependiendo la bondad de las estimaciones denumerosos factores entre los que destacamos la habilidad en la conjuncion de ambosprocesos, la bondad del ajuste realizado y la estructura de la poblacion en lo queatane a las variables involucradas.

En el TEMA 43 estudiaremos los estimadores de razon, empezando por lasolucion heurıstica clasica, pero dando preponderancia al enfoque predictivo. Para

Jose A. Mayor Gallego. Proyecto Docente

Page 125: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 121

""

""

""

""

""

""

""

""

""

""

""

""

""

""

""

q qq q qq q qq qqq q qq qq qqqq qq q qq qqq q q q qq qq

q qq q qq qqqqqqqq

qqqqq qqq qq

qq q qq

q q qqqq q q q qqq q qqqqqqqq q qq qqq qq q q q q qqqq q qq q q qqqqqqqqqqqqqqqq q q qqqqqq

qqq q qqqq q q q qqqqqqqqqq

qq q qq qq qq

qqqq

q qqq

qqqqq qq q q

Y

X

FIGURA 9.1. Relacion de proporcionalidad aproximada entre dos variables.

ello, supondremos para la poblacion el siguiente modelo de superpoblacion,

Yi = βXi + εi

Es[εi] = 0Vs[εi] = σ2v(Xi)Es[εiεj] = 0, i 6= j

siendo v(·) una funcion conocida que marca la estructura de la varianza.

Graficamente, el modelo anterior indica que la nube de puntos correspondiente ala pareja (X,Y ) esta concentrada en las proximidades de una lınea recta que pasapor el origen. Vease la Figura 9.1.

Notemos que si fuera posible observar la totalidad de los valores (Xi, Yi) | i ∈ U,como en el caso de un censo, podrıamos obtener una estimacion de β basandonosen teorema de Gauss-Markov generalizado dado por C.R. Rao (1965), mediante la

Jose A. Mayor Gallego. Proyecto Docente

Page 126: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 122

resolucion del siguiente problema de minimizacion,

mınβ

∑i∈U

(Yi − β Xi)2

σ2 v(Xi)

lo que obviamente proporcionarıa,

β =

∑i∈U YiXi/v(Xi)∑i∈U X2

i /v(Xi)

Pero al disponer solo de datos muestrales, utilizaremos el metodo de estimacionpropuesto por Kish y Frankel (1974) y Fuller (1975), consistente en reemplazar lasuma poblacional por una estimacion muestral, y mas concretamente, la de Horvitz-Thompson, resolviendo el problema,

mınβ

∑i∈m

(Yi − β Xi)2

σ2v(Xi)πi

Para simplificar la solucion del mismo, tomaremos v(x) = x, lo que representauna situacion muy general, en la cual la varianza en la superpoblacion aumenta pro-porcionalmente al valor de la variable auxiliar (que ha de ser no negativa). Con estahipotesis se obtendra la solucion,

β =

∑i∈m Yi/πi∑i∈m Xi/πi

siendo pues el estimador de la media,

Y R =

∑i∈m Yi/πi∑i∈m Xi/πi

X

El calculo de la varianza se puede realizar por los metodos usuales basados enaproximacion lineal, y dependera del diseno muestral que se emplee para obtener lamuestra.

A continuacion particularizaremos la solucion obtenida al caso de muestreo alea-torio simple, obteniendo la solucion clasica,

Y R =y

xX

Jose A. Mayor Gallego. Proyecto Docente

Page 127: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 123

que en este caso coincide con la heurıstica, y calcularemos su varianza aproximada yuna estimacion de la misma. Obviamente este estimador de la media es sesgado, y susesgo sera,

B[Y R] = B[R]X

luego podemos aplicar los resultados obtenidos en el Tema 21 para el estimador de larazon en muestreo aleatorio simple, concluyendo que el sesgo es de orden = O(1/n),siendolo tambien la aproximacion de la varianza y del error cuadratico medio. Se estu-diaran tambien algunos procedimientos para reducir el sesgo como son el aumento deltamano muestral, la aplicacion de tecnicas de tipo jackknife y la estimacion del sesgo,siendo referencias fundamentales para el estudio de estas cuestiones Hansen, Hurwitzy Madow (1953), David y Sukhatme (1974), Sukhatme et al. (1984), Cochran (1993)y Hedayat y Sinha (1991).

Asimismo estudiaremos en que condiciones el estimador de razon es mas eficien-te que el estimador usual bajo muestreo aleatorio simple. Vease Fernandez y Ma-yor (1994).

Tambien realizaremos un estudio similar para los disenos ΠPS, obteniendo en estecaso,

Y R =1

n

∑i∈m

Yi

Xi

X

siendo interesante observar que dicho estimador coincide con el estimador de Horvitz-Thompson de la media usando X como variable auxiliar y probabilidades de inclusionproporcionales al tamano, siendo pues la estimacion insesgada. El estudio de su va-rianza se realizara por los metodos usuales.

A continuacion estudiaremos algunas estrategias insesgadas, comenzando por el

estimador Y R = y X/x, que usado en combinacion con el esquema de Lahiri-Midzuno,con seleccion del primer elemento con probabilidades proporcionales al tamano, pro-duce una estimacion insesgada, lo que se deduce inmediatamente a partir de losresultados obtenidos en el Tema 28 para el citado esquema. Veanse Lahiri (1951)y Midzuno (1952). Adicionalmente, estudiaremos la varianza de esta estimacion si-guiendo la lınea de Rao y Vijayan (1977). Vease tambien Hedayat y Sinha (1991).

Otras estrategias se basan en el diseno MAS(N, n). Ası, estimando Y mediante

Jose A. Mayor Gallego. Proyecto Docente

Page 128: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 124

Y′R = z X, siendo Zi = Yi/Xi, obtenemos un estimador sesgado siendo,

B[Y′R] = Z X − Y = −N − 1

NSzx

Observemos que Y′R no posee buenas propiedades pues ademas de ser sesgado, su

sesgo no disminuye aumentando el tamano muestral, siendo ademas un estimador noconsistente. No obstante el sesgo puede ser estimado insesgadamente por,

−N − 1

Nszx

y podemos entonces construir el estimador insesgado,

Y HR = zX +N − 1

Nszx = zX +

n(N − 1

N(n− 1)(y − zx)

que sı es consistente. Este estimador fue propuesto por Hartley y Ross (1954), y suvarianza sera estudiada siguiendo los trabajos de Robson (1957), y comparada con la

del estimador de razon usual, Y R, segun los trabajos de Goodman y Hartley (1958).

En la misma lınea estudiaremos el estimador de tipo razon insesgado de Mickey,Mickey (1959) y Rao (1967), que se puede considerar como una generalizacion del deHartley y Ross.

Tambien consideraremos, bajo diseno MAS(N, n), algunas estrategias cuasi-in-sesgadas, es decir, con sesgo de orden O(1/n2) como las definidas por el estimadorde Tin (1965),

Y T = Y R

[1−

(1

n− 1

N

)(s2

x

x2− sxy

xy

)]

el estimador de Beale (1962),

Y B = Y R

[1 +

(1

n− 1

N

)sxy

xy

] [1 +

(1

n− 1

N

)s2

x

x2

]−1

el estimador de De Pascual (1961),

Y DP = Y R +y − zx

n− 1

Jose A. Mayor Gallego. Proyecto Docente

Page 129: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 125

ası como las estimaciones basadas en tecnicas de jackknife, Quenouille (1956).

Ademas de las referencias citadas, veanse Sukhatme et al. (1984), Rao (1988) yHedayat y Sinha (1991).

Seguidamente estudiaremos el estimador de razon multivariante, que utilizala informacion proporcionada por p variables de informacion auxiliar,

Y MR = yp∑

i=1

wiX i

xi

siendo wi unos pesos que han de ser determinados buscando varianza mınima.

Este estimador fue propuesto por Olkin (1958) y es estudiado en profundidad porSukhatme et al. (1984).

Tambien estudiaremos las formas que adopta el estimador usual de razon bajo eldiseno estratificado MASE(N,n), es decir, la forma separada,

Y RS =L∑

h=1

Whyh

xh

Xh

y la combinada,

Y RC =

∑Lh=1 Whyh∑Lh=1 Whxh

X

comparando ambas de forma analoga a como se hacıa para los estimadores combinadoy separado de la razon de medias, en el Tema 33. Veanse Sukhatme et al. (1984),Cochran (1993) y Fernandez y Mayor (1994).

Finalmente, completaremos este tema exponiendo los resultados clasicos sobre op-timalidad del estimador de razon en el conjunto de los estimadores insesgadosbajo el modelo de proporcionalidad directa que estamos considerando, y que conducena una estrategia optima basada en un diseno muestral intencional. Para esta cues-tion, pueden consultarse Royall (1970), Royall y Eberhardt (1975), Cassel, Sarndal yWretman (1977), Royall y Cumberland (1981), Sukhatme et al. (1984) y Chaudhuriy Vos (1988).

En el TEMA 44, y siguiendo una lınea similar a la del tema anterior desarrollaremoslos estimadores de regresion, comenzando por la solucion heurıstica usual, basada

Jose A. Mayor Gallego. Proyecto Docente

Page 130: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 126

en el ajuste lineal mınimo cuadratico “muestral” entre Y y X,

Yi = α + βXi

de forma que,

Y =1

N

∑i∈m

Yi +1

N

∑i6∈m

Yi =1

N

∑i∈m

Yi +1

N

∑i6∈m

α + βXi =

= y + β(X − x)

Para realizar un desarrollo formal del enfoque predictivo supondremos el siguientemodelo de superpoblacion,

Yi = α + βXi + εi

Es[εi] = 0Vs[εi] = σ2

Es[εiεj] = 0, i 6= j

Graficamente, este modelo indica que la nube de puntos correspondiente a la pareja(X,Y ) esta concentrada en las proximidades de una lınea recta que no pasa por elorigen. Vease la Figura 9.2.

Con este modelo, se obtienen las siguientes estimaciones,

β =

∑i∈m

YiXi

πi

−(∑

i∈m

1

πi

)−1 ∑i∈m

Yi

πi

∑i∈m

Xi

πi

∑i∈m

X2i

πi

−(∑

i∈m

1

πi

)−1 (∑i∈m

Xi

πi

)2−1

α =

(∑i∈m

1

πi

)−1 ∑i∈m

Yi

πi

− β

(∑i∈m

1

πi

)−1 ∑i∈m

Xi

πi

a partir de los cuales podremos construir las estimaciones de parametros lineales comomedia y total.

Jose A. Mayor Gallego. Proyecto Docente

Page 131: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 127

q qq q q q qqqqqqqqqqqq q q q

q qq qqq

q q qqqqqq qqq q qq q qqqq q qqq qq

qqqqqqqqq qqqqqqqq qqqq q qqqq q

qqqq qq q qqqqqqqq q qqqq qqq qqqqqq q q qq

qq q q qq qq qqq qqqqqqqqqq q qq qqqq qq q q q

q q qq

Y

X

FIGURA 9.2. Relacion aproximada Yi = α + βXi entre dos variables.

Seguidamente particularizaremos para el caso de diseno muestral MAS(N, n) ob-teniendo el estimador de regresion lineal clasico,

Y L = y + β(X − x)

donde β = sxy/s2x y probaremos que es sesgado, siendo su sesgo,

B[Y L] = −Cov[β, x]

Mediante un estudio cuantitativo aproximado probaremos que,

B[Y L] = O(1/n)

Jose A. Mayor Gallego. Proyecto Docente

Page 132: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 128

y que,

∣∣∣∣ECM [Y L]−(

1

n− 1

N

)S2

y(1− ρ2)∣∣∣∣ = O(1/n2)

siendo ρ el coeficiente de correlacion lineal poblacional entre Y y X, y una igualdadsimilar se cumplira para la varianza debido a la relacion entre esta y el error cuadrati-co medio. Finalmente realizaremos una comparacion, usando orden de aproximacion

O(1/n) entre el estimador de regresion, el de razon, y Y = y, concluyendo que la esti-macion de regresion es siempre mas eficiente que y para ρ 6= 0, y tambien es siempremas eficiente que el estimador de razon a menos que la recta de regresion de Y sobreX pase por el origen, en cuyo caso son igualmente eficientes. Las referencias funda-mentales para estas cuestiones son Sukhatme et al. (1984), Hedayat y Sinha (1991) yCochran (1993).

Tambien en este tema estudiaremos estrategias insesgadas que incluyen el estima-dor de regresion o analogo. Ası, bajo el esquema muestral consistente en seleccionarlos dos primeros elementos de la muestra con probabilidad,

p(i, j) ∝ (Xi −Xj)2 i 6= j ∈ U

y el resto usando diseno MAS(N −2, n−2) en U −i, j, el estimador de regresion esinsesgado. Denominaremos a esta estrategia estrategia I de Singh y Srivastavapor haber sido sugerida por estos autores, Singh y Srivastava (1980). La varianzaexacta que se obtiene posee una expresion muy complicada, pero existen formulasaproximadas tanto para la misma como para su estimacion. Vease Hedayat y Sin-ha (1991).

Como complemento, estudiaremos tambien la estrategia II de Singh y Srivas-tava basada en extraer el primer elemento con probabilidad,

p(i) ∝ (Xi −X) i ∈ U

y el resto mediante MAS(N − 1, n− 1) en U − i, y aplicar el estimador,

Y∗L =

n(N − 1)

N(n− 1)

[y +

(X − x)(∑

i∈m Yi(Xi −X))∑i∈m(Xi −X)

]

y que tambien produce una estimacion insesgada. Veanse Singh y Srivastava (1980)y Hedayat y Sinha (1991).

Jose A. Mayor Gallego. Proyecto Docente

Page 133: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 129

La teorıa estudiada para una variable auxiliar se puede generalizar al caso dep variables auxiliares, obteniendo estimaciones multivariantes de regresion. Seesbozara simplemente el desarrollo de su teorıa puesto que es paralelo al caso de unavariable auxiliar y se basa en los mismos principios. Referencias importantes paraesta cuestion son Sarndal (1984), Sukhatme et al. (1984) y Sarndal et al. (1992).

Para finalizar este tema, y al igual que hicimos en el caso de razon, estudiare-mos el estimador de regresion bajo diseno muestral aleatorio simple estratificado,MASE(N,n), en sus versiones usuales, es decir, la separada y la combinada. Vean-se Sukhatme et al. (1984), Cochran (1993) y Fernandez y Mayor (1994).

Para completar este bloque, estudiaremos en el TEMA 45 el estimador de diferenciay el de producto.

El estimador de diferencia se puede obtener de forma heurıstica observandoque Y = Y −X + X y que si las diferencias Yi −Xi muestran cierta estabilidad, elsiguiente estimador podrıa proporcionar buenos resultados,

Y DF = y − x + X = y + (X − x)

Para realizar un desarrollo formal del enfoque predictivo supondremos el siguientemodelo de superpoblacion,

Yi = α + Xi + εi

Es[εi] = 0Vs[εi] = σ2

Es[εiεj] = 0, i 6= j

caso particular del considerado para el estimador de regresion, con β = 1. Este modelose adapta a aquellas situaciones en las cuales las diferencias entre variable de estudioy auxiliar presentan cierta estabilidad. Aplicando la tecnica usual, se obtiene,

α =

∑i∈m(Yi −Xi)/πi∑

i∈m 1/πi

a partir de la cual se obtendra el siguiente estimador de la media poblacional,

Y DF = X +

∑i∈m(Yi −Xi)/πi∑

i∈m 1/πi

Jose A. Mayor Gallego. Proyecto Docente

Page 134: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 130

que particularizado para el diseno MAS(N, n) se convierte en,

Y DF = y + (X − x)

estudiandose su varianza y una estimacion insesgada de la misma. Vease Sarndalet al. (1992) y Cochran (1993), y para ejemplos de aplicacion de este estimador yestudios de caso consultese Hansen, Hurwitz y Madow (1953).

Para terminar el tema, estudiaremos el estimador de producto de la media bajomuestreo aleatorio simple,

Y P =yx

X

sugerido por Murthy (1964), calculando su varianza aproximada,

V [Y P ] ≈ 1− f

n(S2

y + R2S2x + 2RρSxSy)

lo que nos indica que este estimador resulta apropiado cuando la correlacion entre

las variables Y y X es negativa. Tambien se estudiara el sesgo de Y P , que resultade orden O(1/n), y se esbozara el estimador multivariante de producto. VeanseSukhatme et al. (1984), Azorın y Sanchez-Crespo (1986) y Rao (1988).

Finalmente mencionaremos que en el caso de varias variables auxiliares, unascon correlacion positiva y otras negativa, con respecto a la variable Y , puede seraplicado el estimador multivariante de razon-producto, propuesto por Rao yMudholkar (1967). Vease Rao (1988).

Referencias del Bloque Tematico IX

[1] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

[2] Beale, E.M.L. (1962). ‘Some use of computers in operational research’. Indus-trielle Organization. 31, pp. 27-28.

[3] Bellhouse, D.R. (1984). ‘A review of optimal designs in survey sampling’. TheCanadian Journal of Statistics. 12, pp. 53-65.

Jose A. Mayor Gallego. Proyecto Docente

Page 135: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 131

[4] Cassel, C., Sarndal, C. y Wretman, J. (1977). Foundations of Inference in SurveySampling. Wiley. New york.

[5] Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

[6] Chaudhuri, A. y Vos, J. (1988). Unified Theory and Strategies of Survey Sam-pling. North Holland. Amsterdam.

[7] David, I.P. y Sukhatme, B.V. (1974). ‘On the bias and mean square error of theratio estimator’. J. Amer. Statist. Assoc. 69, pp. 464-466.

[8] De Pascual, N. (1961). ‘Unbiased ratio estimators in stratified sampling’.J. Amer. Statist. Assoc. 56, pp. 70-87.

[9] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[10] Fuller, W.A. (1975). ‘Regression analysis for sample survey’. Sankhya. C37,pp. 117-132.

[11] Goodman, L.A. y Hartley, H.O. (1958). ‘The precision of unbiased ratio-typeestimators’. J. Amer. Statist. Assoc. 53, pp. 491-508.

[12] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol. I y II. Wiley. New York.

[13] Hartley, H.O. y Ross, A. (1954). ‘Unbiased ratio estimators’. Nature. 174,pp. 270-271.

[14] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[15] Kish, L. y Frankel, M.R. (1974). ‘Inference from complex samples’. J. Roy.Statist. Soc. B36, pp. 1-37.

[16] Lahiri, D.B. (1951). ‘A method of sample selection providing unbiased ratioestimates’. Bulletin of the International Statistical Institute. 33, pp. 133-140.

[17] Mickey, M.R. (1959). ‘Some finite population unbiased ratio and regression es-timators’. J. Amer. Statist. Assoc. 54, pp. 594-612.

[18] Midzuno, H. (1952). ‘On the sampling system with probability proportionate tosum of sizes’. Annals of the Institute of Statistical Mathematics. 3, pp. 99-107.

Jose A. Mayor Gallego. Proyecto Docente

Page 136: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 132

[19] Murthy, M.N. (1964). ‘Product method of estimation’. Sankhya. A26,pp. 69-74.

[20] Olkin, I. (1958). ‘Multivariate ratio estimation for finite populations’. Biome-trika. 45, pp. 154-165.

[21] Quenouille, M.H. (1956). ‘Notes on bias in estimation’. Biometrika. 43,pp. 353-360.

[22] Rao, C.R. (1965). Linear Statistical Inference and its Applications. Wiley. NewYork.

[23] Rao, J.N.K. (1967). ‘The precision of Mickey’s unbiased ratio estimator’. Bio-metrika. 54, pp. 321-324.

[24] Rao, J.N.K. y Vijayan, K. (1977). ‘On estimating the variance in samplingwith probability proportional to aggregate size’. J. Amer. Statist. Assoc. 72,pp. 579-584.

[25] Rao, P.S.R.S. y Mudholkar, G.S. (1967). ‘Generalized multivariate estimator forthe mean of finite populations’. J. Amer. Statist. Assoc. 62, pp. 1009-1012.

[26] Rao, P.S.R.S. (1988). ‘Ratio and regression estimators’. Handbook of Statistics6. Sampling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[27] Robson, D.S. (1957). ‘Application of multivariate polykays to the theory ofunbiased ratio-type estimators’. J. Amer. Statist. Assoc. 52, pp. 511-522.

[28] Royall, R.M. (1970). ‘On finite population sampling theory under certain linearregression models’. Biometrika. 57, pp. 377-387.

[29] Royall, R.M. y Eberhardt, K.R. (1975). ‘Variance estimates for the ratio esti-mator’. Sankhya. C37, pp. 43-52.

[30] Royall, R.M. y Cumberland, W.G. (1981). ‘An empirical study of the ratio esti-mator ans estimators of its variance’. J. Amer. Statist. Assoc. 76,pp. 66-77.

[31] Singh, P. y Srivastava, A.K. (1980). ‘Sampling schemes providing unbiased re-gression estimators’. Biometrika. 67, pp. 205-209.

[32] Tin, M. (1965). ‘Comparison of some ratio estimators’. J. Amer. Statist. Assoc.60, pp. 294-307.

Jose A. Mayor Gallego. Proyecto Docente

Page 137: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO IX 133

[33] Sarndal, C. (1984). Inference statistique et analyse des donnees sous des plansd’echantillonage complexes. Presses de l’Universite de Montreal.

[34] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York, Inc.

[35] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

Jose A. Mayor Gallego. Proyecto Docente

Page 138: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 134

2.10. Comentarios al Bloque Tematico X : Cues-

tiones especiales de muestreo y estimacion.

Este Bloque Tematico comprende varios temas en los que son tratados algunosaspectos especiales, en relacion a la fase de muestreo, de estimacion o ambas, y quepor su caracter especıfico, o por los metodos que se emplean en su desarrollo, no sonencuadrables en los bloques clasicos considerados hasta el momento, aunque, comoveremos, sı tienen aspectos comunes con otros ya estudiados. Los temas incluidos eneste bloque son,

TEMA 46. Muestreo doble.

TEMA 47. Muestreo en ocasiones sucesivas.

TEMA 48. Muestreos no probabilısticos.

TEMA 49. Estimacion sobre subpoblaciones muy pequenas.

TEMA 50. Estimacion de la mediana y otros cuantiles poblacionales.

TEMA 51. Estimacion del tamano poblacional.

En muchas situaciones del muestreo en poblaciones finitas hemos considerado lautilizacion de cierta informacion auxiliar, usualmente, con la finalidad de mejorar lasestimaciones. Citemos por ejemplo el muestreo estratificado, en el cual la division enestratos proporciona, implıcitamente, una informacion que mejora las estimaciones,o las estimaciones de razon y regresion.

No obstante, en ciertos casos esta informacion que necesitamos no esta disponible,por ejemplo puede ocurrir que no se conozcan los tamanos de los estratos o el totalpoblacional de la variable auxiliar X. Para estas situaciones se ha ideado el muestreodoble, que se estudiara en el TEMA 46, empezando con una descripcion de esteprocedimiento, consistente en la obtencion de una muestra piloto que posteriormentees submuestreada. Esta tecnica, propuesta por Neyman (1938), sera tratada aquı deuna forma general siguiendo los siguientes pasos,

En una fase inicial se obtiene una muestra de tamano n′, usando un disenomuestral d1, m′ = i1, i2, . . . , in′, que proporciona la informacion auxiliar quenecesitaremos.

Jose A. Mayor Gallego. Proyecto Docente

Page 139: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 135

En una segunda fase, se obtiene una muestra, m, de tamano n, a partir de lamuestra anterior que ahora se comporta como poblacion, y usando un disenomuestral d2. Con la informacion proporcionada por esta segunda muestra serealiza la estimacion del parametro que se esta estudiando, y esta estimacion seapoyara generalmente en la informacion auxiliar anteriormente obtenida.

La dificultad del proceso radica en que el diseno muestral de la segunda fasedepende de la muestra obtenida en la fase primera, por lo que, en general, no esposible hallar las probabilidades de inclusion de las unidades de la poblacion en lamuestra final, lo que ilustraremos con ejemplos adecuados. Vease Sarndal et al. (1992).

Por ello enfocaremos el problema utilizando el estimador de Horvitz-Thompsonsobre las probabilidades de inclusion π∗i de que la unidad ui este incluida en la muestrafinal, m, pero condicionando a que dicha unidad este en m′,

π∗i = πd1i π

d2|m′

i

π∗ij = πd1ij π

d2|m′

ij

y de este modo, para estimar θ(Y ) =∑

U aiYi usaremos,

θ(Y ) =∑i∈m

aiYi

π∗i

donde,

Yi

π∗i=

Yi

πd1i π

d2|m′

i

=Y a

i

πd2|m′

i

= Y aai

esto es, valores doblemente ampliados, demostrandose que es un estimador in-sesgado, calculando su varianza y hallando una estimacion insesgada de la misma,basada en la expresion usual para el estimador de Horvitz-Thompson,

V [θ(m)] =∑∑i,j∈m

∆d1ij

π∗ijaiY

ai ajY

aj +

∑∑i,j∈m

∆d2|m′

ij

πd2|m′

ij

aiYaai ajY

aaj

Una vez obtenida la formulacion general, se aplicara a las siguientes situaciones,

Jose A. Mayor Gallego. Proyecto Docente

Page 140: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 136

Muestreo estratificado cuando los tamanos de los estratos no son conocidos.

Estimador de razon cuando la variable auxiliar, X, no es conocida en su totali-dad, de forma que no se dispone del valor de T (X).

Estimador de regresion en la misma situacion anterior.

Estimador de diferencia, en las mismas condiciones.

Las referencias basicas para este tema son las ya citadas previamente, y ademasHansen, Hurwitz y Madow (1953), Sarndal (1984) y Cochran (1993).

El TEMA 47 sera dedicado al estudio del muestreo en ocasiones sucesivas,utilizado cuando se quiere estudiar la evolucion cronologica de una determinada ca-racterıstica, siendo ademas la forma usual de emplear informacion auxiliar cuandoesta proviene de situaciones analogas a la que estamos estudiando, pero anteriores enel tiempo.

En principio, el estudio se realizara para el caso de dos ocasiones, en cada una delas cuales se ha obtenido una muestra. Las dos muestras ası conseguidas pueden teneruna serie de elementos comunes y otros diferentes, siendo este aspecto lo que introducelas particularidades del desarrollo a realizar. Ası, supondremos que de la poblacion,U , se extrae una muestra m1 de tamano n, de la cual se separa una fraccion, α n, deelementos que formaran parte de una muestra m2, en una segunda ocasion, junto conotros (1− α)n individuos que se escogen de los N − αn restantes,

m1 : i1 i2 . . . ik . . . inm2 : ik . . . in j1 j2 . . . jn−k−1

Utilizando esta informacion adecuadamente obtendremos estimaciones de las me-dias de la caracterıstica de estudio en ambas ocasiones, del cambio o diferencia demedias y de la suma de medias. Este desarrollo se realizara siguiendo la metodologıageneral propuesta por Hansen, Hurwitz y Madow (1953), siendo otras referenciasimportantes Jimenez (1967), Sukhatme et al. (1984) y Cochran (1993).

Para completar el tema, se estudiara la generalizacion a mas de dos ocasiones.Vease Sukhatme et al. (1983) y Cochran (1993).

Aunque la teorıa del muestreo en poblaciones finitas estudia fundamentalmenteel muestreo probabilıstico, esto es, con todas las unidades de la poblacion suceptiblesde entrar en la muestra, existen situaciones en las cuales, por ciertos motivos, no secumple tal condicion. Por ejemplo, puede resultar muy costoso e incluso imposibledisponer de un buen marco de muestreo, resultando mucho mas economico un marcoinexacto, aunque este pueda producir peores resultados.

Jose A. Mayor Gallego. Proyecto Docente

Page 141: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 137

Es decir, a veces, por razones economicas, por requerirse resultados rapidos, porel tipo de estudio que se esta realizando o porque el acceso a la poblacion ası lo con-diciona, hay que emplear metodos de muestreo que proporcionan a ciertos elementosprobabilidad nula y/o desconocida de entrar en la muestra.

El TEMA 48 se dedica al estudio de algunos de estos procedimientos. El primeroque consideraremos es el muestreo por cuotas. Este tipo de muestreo no suele serestudiado en los tratados clasicos no obstante ser muy utilizado en la practica, ensondeos de opinion y en investigaciones de mercado, por su facil implementacion ybajo coste.

El hecho de que el entrevistador tenga cierta libertad en la eleccion de los in-dividuos, con tal de mantener determinadas proporciones de ciertos factores en lamuestra final, hace que el muestreo por cuotas se pueda considerar como un muestreoestratificado con estratificacion realizada a partir de varias caracterısticas y afija-cion proporcional, pero con seleccion no necesariamente probabilıstica en cadaestrato. Veanse Barnett (1991) y Cochran (1993).

Insistiendo en este inconveniente, introduciremos los aspectos principales del mues-treo por cuotas en sus dos vertientes, con cuotas marginales y con cuotas cruza-das, y estudiaremos la problematica que se presenta para ajustar las cuotas cuandolos datos provienen de varios encuestadores. Vease Aparicio (1991).

Como referencias generales importantes podemos citar las de Moser (1952), Mosery Stuart (1953) y Sudman (1976).

A continuacion realizaremos un estudio teorico basado en la imposicion de modelosde superpoblacion, veanse Gourieroux (1981) y Smith (1983), y de modelos sobre eldesarrollo del muestreo, vease Deville (1991).

Otro procedimiento no necesariamente probabilıstico es el muestreo balanceadoen cual se utilizan una serie de variables auxiliares, X1, X2,. . .,Xq para seleccionaruna muestra, m, de manera que se verifique,

xj(m) ≈ Xj

j = 1, . . . , q

es decir, las medias muestrales y las poblacionales lo mas cerca posible, con lo cual, silas variables auxiliares estan fuertemente correlacionadas con la variable de estudio,Y , estimaremos Y mediante y(m). Vease Sarndal et al. (1992).

Para completar el tema, presentaremos las tecnicas de muestreo “cut-off” basadasen la exclusion deliberada de ciertas unidades de la poblacion que se consideran depoca importancia en relacion al estudio que se pretende realizar, o en la inclusion se-

Jose A. Mayor Gallego. Proyecto Docente

Page 142: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 138

gura de otras unidades, por su importancia. Veanse Hansen, Hurwitz y Madow (1953)y Sarndal et al. (1992).

En ciertas situaciones, la poblacion U se descompone en dos subpoblaciones, U =U1 + U2, de forma que N1 = |U1| << N = |U |, es decir, la subpoblacion U1 es muypequena, siendo necesario realizar estimaciones sobre la misma.

Ası, se dispone de una variable, Y , que toma valores estrictamente positivos enU1, y nulos en U − U1, queriendose realizar estimaciones sobre N1 o p = N1/N , ysobre T1(Y ) =

∑U1

Yi.

Este problema, que estudiaremos en el TEMA 49, tiene su equivalente, para losmodelos de distribucion de probabilidad, en el estudio de las mixturas concen-tradas o mixturas “no estandar”, que son distribuciones que se expresan comocombinacion convexa de otras, por ejemplo,

H = p F + (1− p) G p ∈ [0, 1]

siendo F una distribucion degenerada, concentrada en un punto, y p muy proximo ala unidad.

Estos modelos aparecen frecuentemente en la realidad, siendo interesante la expo-sicion de situaciones adaptadas al mismo como son las que aparecen en auditorıa,donde algunos elementos de la poblacion, en este caso cuentas, estan libres de error,mientras otros estan afectados del mismo, con diferente intensidad, siendo el objetivoprincipal del estudio la obtencion de cotas o lımites superiores para el error total enla poblacion.

Tambien en el estudio del uso de algun tipo particular de servicio por parte deuna comunidad, en la cual hay un elevado numero de elementos que nunca hacen usodel mismo, mientras otros los utilizan normalmente, se pueden emplear modelos deesta naturaleza. Estos y otros ejemplos de interes pueden ser consultados en Tamu-ra (1989), donde ademas se realiza una panoramica completa de los metodos para elestudio de este tipo de situaciones, aunque centrandose en el problema de la audi-torıa, que es el que emplearemos tambien nosotros para ilustrar dichos metodos. Otrareferencia interesante,para introducir la problematica expuesta es Aitchinson (1955).

Es importante hacer notar las limitaciones de las tecnicas clasicas del muestreoen poblaciones finitas, cuando se trata de abordar este problema, incluso el empleode procedimientos especiales como el muestreo inverso, ya estudiado en el Tema18, puede producir resultados poco satisfactorios debido al reducido tamano de lapoblacion U1. En este sentido, Neter y Loebbecke (1977) realizan un estudio empıricodel comportamiento de varios estimadores que emplean informacion auxiliar, en el

Jose A. Mayor Gallego. Proyecto Docente

Page 143: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 139

contexto de la investigacion de cuentas por muestreo, concluyendo la necesidad deutilizar muestras de tamano elevado para producir resultados fiables.

El resto del tema se dedica pues al estudio de tecnicas especiales, creadas paradar soluciones adecuadas a la problematica expuesta. Para presentar estas tecnicas,introduciremos en primer lugar las cotas de confianza basadas en atributos,que utilizan la distribucion binomial. Estas tecnicas se estudiaran en combinacioncon diferentes procedimientos de muestreo como son el aleatorio simple, el aleatoriosimple estratificado y el denominado muestreo de unidad de dolar o “dollar unitsampling”. Para su exposicion se seguira la lınea presentada en Tamura (1989) yFienber et al. (1977).

Seguidamente se estudiaran las cotas de confianza basadas tanto en atributoscomo en variables, y las cotas de confianza basadas en la distribucion multino-mial, tratando separadamente los casos de cero errores, un error y dos o mas errores.En relacion a este metodo, y para disminuir el esfuerzo computacional, estudiaremosuna modificacion del mismo, mediante tecnicas de agrupacion o “clustering”. VeanseFienberg et al. (1977) y Leitch et al. (1981).

Para finalizar el tema, expondremos la aplicacion de tecnicas bayesianas al pro-blema considerado, en la lınea de los trabajos de Cox y Snell (1979,1982).

Como ya se ha visto a lo largo del desarrollo del temario, la teorıa de estima-cion a partir del muestreo en poblaciones finitas se centra, fundamentalmente, sobreparametros poblacionales lineales o funciones mas o menos complicadas de estos, perosin intervenir el concepto de orden. La necesidad de estudiar ciertos parametros deposicion como son los cuantiles ha originado el desarrollo de estimaciones para losmismos ası como para la funcion de distribucion poblacional, intimamente relaciona-da con ellos. En el TEMA 50 se realiza el estudio de estas cuestiones. Para ello, enprimer lugar se estudia la funcion de distribucion poblacional de una variablecuantitativa, Y ,

FY (t) =1

N|i ∈ U |Yi ≤ t|

indicando sus propiedades mas caracterısticas. Esta funcion tiene interes intrınsecoobvio pero tambien se utiliza para hallar otras magnitudes como por ejemplo el ındicede Gini, de utilidad en estudios economicos, y por supuesto puede servir tambien comobase para calcular los cuantiles.

Jose A. Mayor Gallego. Proyecto Docente

Page 144: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 140

La estimacion de la funcion de distribucion se puede realizar a partir de su expre-sion como la suma poblacional siguiente,

FY (t) =1

N

∑i∈U

I[Yi,+∞)(t)

donde I[Yi,+∞)(·) representa la funcion indicadora de [Yi, +∞). Ello permite construirla siguiente estimacion a partir de una muestra m,

FY (t) =T (I[Y,+∞)(t))

N

=

∑i∈m

I[Yi,+∞)(t)/πi∑i∈m

1/πi

=

∑i∈m∩A(t)

1/πi∑i∈m

1/πi

donde hemos representado A(t) = i ∈ U |Yi ≤ t.Es importante observar que, aun conociendo el valor exacto de N , es preferible

utilizar su estimacion por razones de menor varianza, aunque haya que aproximarla, ypara que la estimacion de la funcion de distribucion verifique FY (+∞) = 1, lo que noocurrirıa necesariamente si se utilizara el valor N . La varianza de esta estimacion deuna razon de totales se estudiara mediante las tecnicas de linealizacion introducidasen el tema 20.

Para estimar la mediana poblacional, M(Y ) = F−1Y (0,5), y siguiendo la tecnica

iniciada por Woodruff (1952), introduciremos el estimador,

M(Y ) = F−1Y (0,5)

y desarrollaremos el intervalo de confianza propuesto por dicho autor, particula-rizandolo para los disenos muestrales aleatorio simple y aleatorio simple estratificado,lo que puede estudiarse con detalle en Sarndal et al. (1992)

Tambien se realizara el estudio de la estimacion de la funcion de distribucion y dela mediana utilizando disenos con probabilidades variables, Kuk (1988), y utilizandoinformacion auxiliar, Rao, Kovar y Mantel (1990).

De forma similar, se realizara la estimacion del cuantil de orden α,

Q(Y )α = F−1Y (α) α ∈ [0, 1]

Jose A. Mayor Gallego. Proyecto Docente

Page 145: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 141

mediante,

Q(Y )α = F−1Y (α) α ∈ [0, 1]

constituyendo Sedransk y Smith (1988) una referencia muy completa para el estudiode esta cuestion.

Para completar este bloque, se expondran en el TEMA 51 diversos procedimientosde estimacion del tamano poblacional, N . Este parametro poblacional es desconocidoen algunas situaciones, por lo que resulta necesaria su estimacion, tanto para usarlaen estimaciones de otros parametros, como por su importancia intrınseca en ciertasinvestigaciones. De hecho, han sido las investigaciones de tipo biologico, relacionadascon el control y mantenimiento de ciertas poblaciones animales las que han hechoavanzar este campo considerablemente. Por supuesto, estas tecnicas tambien puedenser aplicadas a otros tipos de poblaciones, para estimar, por ejemplo, el numerode asistentes a un concierto o a un espectaculo deportivo, o el numero de piezasdefectuosas en un cargamento, o el numero de globulos rojos en un milımetro cubicode sangre de un paciente.

El primer grupo de tecnicas que presentaremos es el que se basa en la captu-ra y recaptura, muy utilizados en el caso de poblaciones salvajes, consistentes enseleccionar una muestra de n′ elementos, que despues de ser marcados son restitui-dos a la poblacion. Posteriormente, y supuesto que los elementos marcados se handistribuido adecuadamente, se selecciona otra muestra de n elementos en la cual seobserva el numero de elementos marcados, realizandose la estimacion a partir de estainformacion. Ası, si denotamos por k al numero de elementos marcados, observadosen la segunda muestra, y bajo determinados supuestos sobre los disenos muestralesempleados, podemos estimar N mediante,

N =n n′

k

que se conoce como estimador de Petersen, y cuya varianza estudiaremos, siguiendo lostrabajos de Sekar y Deming (1949), siendo otras referencias importantes Seber (1970,1986, 1992), Scheaffer, Mendenhall y Ott (1987) y Thompson (1992).

La anterior estimacion presenta el problema de ser k nulo. Para resolverlo introdu-ciremos el metodo de muestreo inverso, en el cual se extraen en la segunda muestratantos elementos como hagan falta para obtener k marcados, siendo k una cantidadprefijada de antemano. Vease Scheaffer et al. (1987).

Jose A. Mayor Gallego. Proyecto Docente

Page 146: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 142

El apartado dedicado a los metodos de captura y recaptura se completa con elestudio de los estimadores de tipo razon. Vease Thompson (1992).

Hemos de observar la importancia de esta ultima referencia, que constituye, funda-mentalmente, un tratado de tecnicas de muestreo aplicadas al estudio de poblacionesanimales, y en general, dispersas sobre zonas geograficas, siendo tambien una fuentemuy interesante de ejemplos y casos practicos.

Tambien estudiaremos en este tema la estimacion del tamano poblacional median-te muestreo por cuadros, consistente en dividir la zona geografica donde reside lapoblacion en M parcelas o cuadros de area a, y obtener una muestra, m, de n cua-dros en cada uno de los cuales observamos el numero de elementos, Yi, i ∈ m. Sidenotamos por A el area total de la zona, la densidad de poblacion, τ = N/A puedeser estimada mediante,

τ =y

a

y el tamano poblacional mediante,

N =y

aA

Para finalizar el tema, expondremos una variacion del metodo anterior, que utilizala idea de diferenciar los cuadros cargados, es decir, los que contienen algun indivi-duo perteneciente a la poblacion que se estudia, y los que no lo estan. De esta forma,bajo hipotesis adecuadas, las cantidades Yi siguen, aproximadamente, distribucionesde Poisson de parametro λ = τ a, siendo pues,

e−τa

la proporcion aproximada de cuadros no cargados. Igualando esta a la proporcionmuestral de cuadros no cargados, facilmente calculable a partir de la muestra, obten-dremos una estimacion de τ y por consiguiente de N . Observemos que este metodopuede ser aplicado a la estimacion de la densidad o el numero de partıculas (bac-terias, globulos, plaquetas, etc) en medios lıquidos con tecnicas de observacion almicroscopio.

Como referencias adecuadas para el muestreo por cuadros y sus variantes citaremosCochran (1950), Swindel (1983) y Scheaffer et al. (1987).

Jose A. Mayor Gallego. Proyecto Docente

Page 147: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 143

Referencias del Bloque Tematico X

[1] Aitchinson, J. (1955). ‘On the distribution of a positive random variable ha-ving a discrete probability mass at the origin’. J. Amer. Statist. Assoc. 50,pp. 901-908.

[2] Aparicio Perez, F. (1991). Tratamiento informatico de encuestas. RA-MA. Ma-drid.

[3] Barnett, V. (1991). Sample Survey. Principles & Methods. Edward Arnold. Lon-dres.

[4] Cochran, W.G. (1950). ’Estimation of bacterial densities by mean of the mostprobable number’. Biometrics. 6, pp. 105-116.

[5] Cochran, W.G. (1993). Tecnicas de Muestreo. Decima reimpresion. CECSA.Mexico.

[6] Cox, D.R. y Snell, E.J. (1979). ‘On sampling and estimation of rare errors’.Biometrika. 66, pp. 125-132.

[7] Cox, D.R. y Snell, E.J. (1982). ‘Correction to “On sampling and estimation ofrare errors” ’. Biometrika. 69, p. 491.

[8] Deville, J. (1991). ’A theory of quota surveys’. Survey Methodology. 17,pp. 163-181.

[9] Fienberg, S.E., Neter, J. y Leitch, R.A. (1977). ‘Estimating the total overstate-ment error in accounting populations’. J. Amer. Statist. Assoc. 72,pp. 295-302.

[10] Gourieroux, C. (1981). Theorie des sondages. Economica. Paris.

[11] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol. I y II. Wiley. New York.

[12] Jimenez, V. (1967). ‘Algunos aspectos sobre los estimadores del cambio en lasencuestas continuas’. Estadıstica Espanola. 36, pp. 33-62.

[13] Kuk, A.Y.C. (1988). ‘Estimation of distribution functions and medians undersampling with unequal probabilities’. Biometrika. 75, pp. 97-103.

[14] Leitch, R.A., Neter, J., Plante, R. y Sinha, P. (1981). ‘Implementation of uppermultinomial bound using clustering’. J. Amer. Statist. Assoc. 76, pp. 530-533.

Jose A. Mayor Gallego. Proyecto Docente

Page 148: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 144

[15] Moser, C.A. (1952). ‘Quota sampling’. J. Roy. Statist. Soc. A115, pp. 411-423.

[16] Moser, C.A. y Stuart, A. (1953). ‘An experimental study of quota sampling’. J.Roy. Statist. Soc. A116, pp. 349-405. (incluye discusion y comentarios de otrosautores).

[17] Neter, J. (1986). ‘Boundaries of Statistics - sharp or fuzzy’. J. Amer. Statist.Assoc. 81, pp. 1-8.

[18] Neter, J. y Loebbecke, J.K. (1977). ‘On the behavior of statistical estimatorswhen sampling accounting populations’. J. Amer. Statist. Assoc. 72,pp. 501-507.

[19] Neyman, J. (1938). ‘Contribution to the theory of sampling human populations’.J. Amer. Statist. Assoc. 33, pp. 101-116.

[20] Rao, J.N.K., Kovar, J.G. y Mantel, H.J. (1990). ‘On estimating distributionfunctions and quantiles from survey data using auxiliary information’. Biome-trika. 77, pp. 365-375.

[21] Sarndal, C. (1984). Inference statistique et analyse des donnees sous des plansd’echantillonage complexes. Presses de l’Universite de Montreal.

[22] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York, Inc.

[23] Scheaffer, R.L., Mendenhall, W. y Ott, L. (1987). Elementos de muestreo. GrupoEditorial Iberoamerica. Mexico.

[24] Seber, G.A.F. (1970). ‘The effects of trap response on tag-recapture estimates’.Biometrika. 26, pp. 13-22.

[25] Seber, G.A.F. (1986). ‘A review of estimating animal abundance’. Biometrics.42, pp. 267-292.

[26] Seber, G.A.F. (1992). ‘A review of estimating animal abundance II’. Internat.Statist. Rev. 60, pp. 129-166.

[27] Sedransk, J. y Smith, P.J. (1988). ‘Inference for finite populations quantiles’.Handbook of Statistics 6. Sampling. Krishnaiah y Rao, (Eds.). North Holland.Amsterdam.

[28] Sekar, C.C. y Deming, W.E. (1949). ‘On a method of estimating birth and deathrates and the extend of registration’. J. Amer. Statist. Assoc. 44,pp. 101-105.

Jose A. Mayor Gallego. Proyecto Docente

Page 149: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO X 145

[29] Smith, T.M.F. (1983). ‘On the validity of inferences from non-random samples’.J. Roy. Statist. Soc. A146, pp. 394-403.

[30] Sudman, S. (1976). Applied Sampling. Academic Press, Inc. New York.

[31] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

[32] Swindel, B.F. (1983). ‘Choice of size and number of quadrats to estimate densityfrom frequency in Poisson and binomially dispersed populations’. Biometrics.39, pp. 455-464.

[33] Tamura, H. (1989). ‘Statistical models and analysis in auditing. Panel on nons-tandard mixture of distributions’. Statistical Science. 4, pp. 2-33.

[34] Thompson, S.K. (1992). Sampling. Wiley. New York.

[35] Woodruff, R.S. (1952). ‘Confidence intervals for medians and other positionmeasures’. J. Amer. Statist. Assoc. 47, pp. 635-646.

Jose A. Mayor Gallego. Proyecto Docente

Page 150: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XI 146

2.11. Comentarios al Bloque Tematico XI : No res-

puesta y otras fuentes de error.

En este Bloque Tematico hemos incluido los temas relativos a las diferentes tecni-cas que se han desarrollado en el marco de la teorıa del muestreo con el fin de resolverlos problemas que se plantean, a nivel practico, ante la ausencia de respuesta o lapresencia de errores en la misma, ya sea de forma intencionada o no, y tambien porla utilizacion de marcos de muestreo inadecuados y por la presencia de errores deobservacion. Estos temas son,

TEMA 52. Caracterısticas y efectos de la no respuesta.

TEMA 53. Metodos especiales de muestreo en presencia deno respuesta.

TEMA 54. Estimadores especiales.

TEMA 55. Imputacion

TEMA 56. Metodos de respuesta aleatorizada

TEMA 57. Errores originados por marcos inadecuados y errores deobservacion.

La ausencia de respuesta o no respuesta es un fenomeno presente en casi todaslas encuestas, aunque suele ser mas comun en el caso de entrevistas telefonicas, decuestionarios enviados por correo, o de hogares vacıos cuando llega el encuestador.

Tanto el grado de la misma como sus efectos sobre los resultados finales, puedenvariar bastante segun el tipo de encuesta que se realice. Incluso, para una mismaencuesta, puede haber grandes variaciones dependiendo de la forma en que esta se llevea cabo, siendo una garantıa de calidad de los resultados el que se tomen medidas paracontrolar al maximo la falta de respuesta, por ejemplo, seleccionando adecuadamentelos entrevistadores. Todas estas cuestiones, relativas a la descripcion del problemason consideradas en el TEMA 52, en el cual se estudiaran tambien los conjuntos derespuesta y los principales efectos negativos de la no respuesta, principalmente elsesgo que introduce en las estimaciones.

Tambien en este tema, eminentemente descriptivo, se estudiaran las medidas deno respuesta como forma de calibrar la magnitud del problema, y los diferentesenfoques existentes para su tratamiento, que se resumen en,

Jose A. Mayor Gallego. Proyecto Docente

Page 151: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XI 147

(a) Aplicar medidas, durante la realizacion de la encuesta, para reducir la no res-puesta de forma efectiva.

(b) Aplicacion de tecnicas especiales de recoleccion de datos, con estimadores “ad-hoc”.

(c) Suposicion de ciertos modelos sobre los mecanismos de respuesta que permitenconstruir estimadores especiales para corregir el efecto de la falta de respuesta.

Los enfoques (b) y (c) seran ampliamente considerados en temas posteriores, mien-tras que el enfoque (a) no sera tratado en profundidad, ya que su estudio correspondemas bien a asignaturas relacionadas con los aspectos practicos del desarrollo de en-cuestas.

Para un tratamiento adecuado de estas cuestiones, pueden consultarse Azorın ySanchez-Crespo (1986), Aparicio (1991) y Sarndal et al. (1992).

Como fuente especialmente importante por la amplitud de sus contenidos hemosde citar la obra en tres volumenes, Incomplete Data in sample Surveys, aparecida en1983, y contiene las aportaciones de numerosos autores en este campo, siendo tambienuna completa revision de los avances en el tema hasta ese ano. Esta obra, referenciadacomo “Panel on Incomplete Data (1983)”, puede ser utilizada en varios temas de estebloque, relacionados con la falta de respuesta.

En el TEMA 53 se presentaran varios metodos para el tratamiento de la falta derespuesta basados en introducir diversas modificaciones en la obtencion de los datos,y aplicar estimadores adaptados a dichas modificaciones.

El primero de ellos es el metodo de rellamadas o submuestreo de no respon-dientes, desarrollado inicialmente por Hansen y Hurwitz (1946), y que consiste enobtener una submuestra a partir de los elementos de la muestra inicial que no hanrespondido, aplicando los metodos adecuados para que en esta submuestra, respon-dan todos los elementos. Mediante este procedimiento se pueden obtener estimacionesinsesgadas a pesar de que ciertos elementos de la muestra inicial no hayan respondido.

Inicialmente, este metodo sera estudiado siguiendo el planteamiento teorico gene-ral, con aplicacion de diferentes disenos en el muestreo inicial y en el submuestreo.Posteriormente se particularizara para el diseno muestral aleatorio simple en ambasetapas, y para los casos de distribucion de respuesta uniforme y de respues-ta determinıstica. Ademas de la referencia de Hansen y Hurwitz, se encuentrandesarrollos muy completos en Sukhatme et al. (1984) y en Sarndal et al. (1992).

Como alternativa a la metodologıa anterior, tambien estudiaremos los metodos deDeming (1953) y de Politz y Simmons (1949, 1950), para cuyo desarrollo se puedenconsultar sus propias referencias, y tambien Sukhatme et al. (1984).

Jose A. Mayor Gallego. Proyecto Docente

Page 152: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XI 148

Otro enfoque diferente para controlar los efectos de la falta de respuesta, se basa enla construccion de estimadores especiales, en los cuales se introducen ponderacionesy/o utilizan informacion auxiliar. Este enfoque se desarrolla en el TEMA 54.

El tipo de ponderacion que se aplica, y la forma de emplear la informacion auxiliaresta en funcion del modelo de respuesta que se considere, es decir, del conjunto dehipotesis sobre la distribucion de probabilidad no conocida, asociada a la respuesta delos elementos de la poblacion. Para ilustrar esta cuestion, consideraremos en primerlugar varios modelos de respuesta muy simples del tipo,

P [k ∈ r|k ∈ m] = γk P [k, l ∈ r|k, l ∈ m] = γkγl

siendo m la muestra obtenida, y r la submuestra formada por los elementos que res-ponden. Con este modelo, se considerara, supuesto diseno muestral aleatorio simple,el siguiente estimador ponderado alternativo, para el total poblacional,

T1(Y ) = N

∑r Yk/πkγk∑r 1/πkγk

cuyo sesgo sera evaluado, poniendo en evidencia las limitaciones de tal modelo. De for-ma analoga se estudiara el anterior estimador ponderado para un modelo de respuestadeterminıstico.

Seguidamente, introduciremos un modelo de respuesta mas realista denominadomodelo de respuesta homogenea por grupos, consistente en suponer que lamuestra, m, puede ser particionada en H(m) grupos, m1, . . . ,mH(m), siendo en cadagrupo, mh, igual la probabilidad de respuesta. La formulacion matematica de estemodelo, para cada muestra, m, y para h = 1, . . . , H(m), es la siguiente,

P [k ∈ r|k ∈ m] = πk|m = γhm > 0 ∀k ∈ mh

P [k, l ∈ r|k ∈ m] = πkl|m = P [k ∈ r|m]P [l ∈ r|m] ∀k 6= l ∈ m

y bajo este modelo, definiremos y estudiaremos los estimadores ponderados, en sus dosvertientes, esto es, sin utilizar informacion auxiliar, y empleando dicha informacion.Como referencia basica, citaremos Sarndal et al. (1992).

El problema de la no respuesta puede englobarse en el marco mas general, de laexistencia, en los censos y en las encuestas por muestreo, de datos faltantes o “missingdata”, y tambien de datos inconsistentes. Como causas principales de estas anomalıaspodemos citar la propia perdida de datos, su deterioro o ilegibilidad y la no respuesta.

Jose A. Mayor Gallego. Proyecto Docente

Page 153: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XI 149

Se denomina imputacion al relleno o sustitucion de valores faltantes o inconsis-tentes por otros valores apropiados, con el objeto de obtener censos completos, o enel caso de muestras, estimaciones de mayor calidad. En el TEMA 55 se estudiara estaoperacion y las principales tecnicas existentes para ponerla en practica, aplicadas,logicamente, al campo del muestreo.

Despues de introducir los conceptos basicos y los principales objetivos de la im-putacion, se expondran en primer lugar los metodos de imputacion media es susvertientes global y por clases, consistentes en sustituir datos faltantes por valoresmedios, tanto a nivel general o global, como por clases, y que tienen como ventajaprincipal su facil implementacion.

A continuacion se estudiaran los metodos “hot-deck” tanto secuencial comolocal, que basicamente consisten en sustituir observaciones faltantes de elementosseleccionados en una encuesta por observaciones correspondientes a elementos sincarencias de la misma encuesta, y que coinciden con los carentes en ciertas variablesde control. Si se utilizan datos de otras encuestas y de registros historicos, el metodo sedenomina “cold-deck”. Una referencia completısima para el estudio de estos metodoses Ford (1983).

Seguidamente expondremos los metodos de imputacion aleatoria, tanto globalcomo por clases, los metodos basados en regresion, la imputacion multiple y,para completar el tema, la metodologıa de Fellegi y Holt, basada en una serie dereglas, denominadas “edits” que sirven de filtro para analizar la consistencia de losdatos, con la posterior sustitucion de los erroneos, o el relleno en caso de ausencias.

Como referencias particulares citaremos tambien Buck (1960) y por supuesto el im-portante artıculo de Fellegi y Holt (1976); y como fuentes generales, Aparicio (1991),Sarndal et al. (1992) y el “Panel on Incomplete Data (1983)”.

En el TEMA 56 seran estudiados los metodos de respuesta aleatorizada. Laimportancia de los mismos se manifiesta en aquellas situaciones en las cuales se deseaaplicar el muestreo para estudiar caracterısticas de la poblacion ante las cuales, lainformacion que se obtiene de los individuos puede estar afectada de errores intencio-nados, por ser estas caracterısticas de tipo comprometedor, motivando estos erroresla aparicion de sesgos incontrolables en las estimaciones.

Los metodos de respuesta aleatorizada se basan en aplicar un mecanismo proba-bilıstico que, afectando a las preguntas que se realizan, y por ello a las respuestas,garantice la veracidad de estas.

En primer lugar presentaremos el metodo de la pregunta relacionada, pro-puesto por Warner (1965). Este metodo se estudiara inicialmente en su forma general,utilizando el estimador de Horvitz-Thompson, particularizando a continuacion para

Jose A. Mayor Gallego. Proyecto Docente

Page 154: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XI 150

el diseno MAS(N, n).

Tambien se presentara la variacion del metodo basada en una muestra aleatoriacon reemplazamiento, con lo que la formulacion del mismo se simplifica enormemente,y se estudiara el problema de la eleccion de la probabilidad de pregunta alternativacon el objeto de que el metodo proporcione los mejores resultados. Vease Hedayat ySinha (1991), Cochran (1993) y Fernandez y Mayor (1994) para ejemplos practicos.

Seguidamente se estudiara el metodo de la pregunta no relacionada, basadoen introducir una pregunta alternativa, no relacionada con la caracterıstica de estudiosino con otra caracterıstica distinta, cuya proporcion poblacional es λ. En general,este metodo se suele conocer tambien como metodo de Simmons, vease Horvitz, Shahy Simmons (1967), y presenta variaciones segun λ sea conocida, estimada de for-ma insesgada o totalmente desconocida, que seran estudiadas separadamente. Todosestos metodos estan influenciados por una serie de parametros cuya eleccion se dis-cutira siguiendo la lıneas expuestas en los artıculos Abul-Ela et al. (1967), Horvitz etal. (1967), Greenberg et al. (1969, 1971), Moors (1971), Dowling y Shachtman (1975)y Horvitz et al. (1975, 1976) y en los libros Chaudhuri y Mukerjee (1988), Hedayat ySinha (1991), Cochran (1993) y Fernandez y Mayor (1994).

El tema se completara con el estudio de estos metodos aplicados a caracterısticascon mas de dos modalidades y tambien para caracterısticas cuantitativas. VeanseGreenberg et al. (1969, 1971), Chaudhuri y Mukerjee (1988) y Hedayat y Sinha (1991).

En el desarrollo de la teorıa del muestreo en poblaciones finitas se suele suponerque la lista o registro de la que se extrae la muestra, es decir, el marco, coincidecon la poblacion que se esta investigando. En la practica esto no siempre sucede,existiendo discrepancias que dan lugar a sesgos en las estimaciones. Esta cuestion seestudia en el TEMA 57, donde introducimos en primer lugar los tipos de asociacionexistentes entre la poblacion y el marco de muestreo, siguiendo con las diferentes clasesde imperfecciones que puede presentar el marco, y los efectos sobre las estimaciones.Dalenius (1988) y Sarndal et al. (1992) exponen un tratamiento muy adecuado deestos aspectos.

Con objeto de reducir efectos negativos introducidos por las imperfecciones de losmarcos, se pueden seguir dos enfoques basicos,

La depuracion del marco, que consiste en construir, a partir del marco inicial,un nuevo marco carente de imperfecciones. Esta solucion no siempre es factibley en general resulta muy costosa.

La depuracion de la muestra, y el empleo de estimadores especiales.

Jose A. Mayor Gallego. Proyecto Docente

Page 155: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XI 151

Estos dos enfoque seran estudiados siguiendo la lınea expuesta en Miras (1985),consistente en la comparacion de las diferentes estimaciones que se proponen, enterminos de sesgo y varianza.

La segunda parte de este tema se dedica al estudio de los errores de observaciony su influencia en las estimaciones, para ello, y siguiendo la lınea desarrollada enSukhatme et al. (1984) y Sukhatme (1988), se enfocara el problema mediante elestudio del modelo muestral general siguiente, en el que se suponen la existencia dediferentes “entrevistadores” que realizan observaciones en distintas ocasiones,

Yijk = Xi + αj + δij + εijk

donde Xi representa el verdadero valor de la caracterıstica de estudio asociada ala unidad ui; Yijk es el valor obtenido por el entrevistador j, sobre la unidad i, enla ocasion k; αj es el error constante, inherente al entrevistador j; δij es el errorproducido en la interaccion entre el entrevistador j y la unidad i; finalmente, eijk esel error generado por el entrevistador j en la observacion de la unidad i, en la ocasionk.

Bajo este modelo, con ciertas simplificaciones y suponiendo diseno muestral alea-torio simple, se realizara un estudio pormenorizado de los errores que se introducenen la estimacion de la media poblacional, ası como las diferentes componentes de lavarianza, originadas por los errores de observacion.

Ademas de la referencias citadas, que contienen ejemplos reales de aplicacion a es-tudios longitudinales, tambien son importantes las exposiciones realizadas en Hansen,Hurwitz y Madow (1953) y Cochran (1993).

Referencias del Bloque Tematico XI

[1] Abul-Ela, A.A., Greenberg, B.G. y Horvitz, D.G. (1967). ‘A multiproportionrandomized response model’. J. Amer. Statist. Assoc. 62, pp. 990-1008.

[2] Aparicio Perez, F. (1991). Tratamiento informatico de encuestas. RA-MA. Ma-drid.

[3] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

Jose A. Mayor Gallego. Proyecto Docente

Page 156: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XI 152

[4] Buck, S.F. (1960). ‘A method of estimation of missing values in multivariatedata suitable for use with an electronic computer’. J. Roy. Statist. Soc. B22,pp. 302-306.

[5] Cochran, W.G. (1993). Tecnicas de Muestreo. Decima reimpresion. CECSA.Mexico.

[6] Chaudhury, A. y Mukerjee, R. (1988). Randomized Response. Theory and Te-chniques. Marcel Dekker, Inc. New York.

[7] Chaudhuri, A. y Vos, J. (1988). Unified Theory and Strategies of Survey Sam-pling. North Holland. Amsterdam.

[8] Dalenius, T. (1988). ‘A first course in survey sampling’. Handbook of Statistics6. Sampling. Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[9] Deming, W.E. (1953). ‘On a probability mechanism to attain an economic ba-lance between the resultant error of non-response and the bias of non-response’.J. Amer. Statist. Assoc. 48, pp. 743-772.

[10] Dowling, T. y Shachtman, R. (1975). ‘On the relative efficiency of randomizedresponse models’. J. Amer. Statist. Assoc. 70, pp. 84-87.

[11] Fellegi, I.P. y Holt, D. (1976). ‘A systematic approach to automatic edit andimputation’. J. Amer. Statist. Assoc. 71, pp. 17-35.

[12] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[13] Ford, B.M. (1983). ‘An overview of hot-deck procedures’. Incomplete Data inSample Surveys, Vol. 2. Madow, W.G., Olkin, I. y Rubin, D.B. (Eds.). AcademicPress. New York.

[14] Greenberg, B.G., Abul-Ela, A.A., Simmons, W.R. y Horvitz, D.G. (1969). ‘Theunrelated question randomized response model: theoretical framework’. J. Amer.Statist. Assoc. 64, pp. 520-539.

[15] Greenberg, B.G., Kuebler, R.R., Abernathy, J.R. y Horvitz, D.G. (1971). ‘Appli-cations of the randomized response techniques in obtaining quantitative data’.J. Amer. Statist. Assoc. 66, pp. 243-250.

[16] Hansen, M.H. y Hurwitz, W.N. (1946). ‘The problem of non-response in sam-pling surveys’. J. Amer. Statist. Assoc. 41, pp. 517-529.

Jose A. Mayor Gallego. Proyecto Docente

Page 157: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XI 153

[17] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol. I y II. Wiley. New York.

[18] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[19] Horvitz, D.G., Greemberg, B.G. y Abernathy, J.R. (1975). ‘Recent develop-ments in randomized response designs’. A Survey of Statistical Design andLinear Models. J.N. Srivastava (Ed.). American Elsevier Publishing Co. NewYork.

[20] Horvitz, D.G., Greemberg, B.G. y Abernathy, J.R. (1976). ‘Randomized res-ponse: a data-gathering device for sensitive questions’. Internat. Statist. Rev.44, pp. 181-196.

[21] Horvitz, D.G., Shah, B.V. y Simmons, W.R. (1967). ‘The unrelated randomizedresponse model’. Proceedings of the Social Statistics Section. American Statis-tical Association. pp. 65-72.

[22] Miras, J. (1985). Elementos de muestreo para poblaciones finitas. Instituto Na-cional de Estadıstica. Madrid.

[23] Moors, J.J.A. (1971). ‘Optimization of the unrelated question randomized res-ponse model’. J. Amer. Statist. Assoc. 66, pp. 627-629.

[24] Panel on Incomplete Data. (1983). Incomplete Data in Sample Surveys. Vol. I,II y III. Madow, W.G., Nisselson, H. y Olkin, I. (Eds. Vol. I). Madow, W.G.,Olkin, I. y Rubin, D.B. (Eds. Vol. II). Madow, W.G. y Olkin, I. (Eds. Vol. III).Academic Press. New York.

[25] Politz, A. y Simmons, W.R. (1949). ‘An attempt to get the not-at-home intothe sample without callbacks’. J. Amer. Statist. Assoc. 44, pp. 9-31.

[26] Politz, A. y Simmons, W.R. (1950). ‘Note on an attempt to get not-at-homeinto the sample without callbacks’. J. Amer. Statist. Assoc. 45, pp. 136-137.

[27] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York, Inc.

[28] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

Jose A. Mayor Gallego. Proyecto Docente

Page 158: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XI 154

[29] Sukhatme, P.V. (1988). ‘Observational errors in behavioural traits of man andtheir implications for genetics’. Handbook of Statistics 6. Sampling. Krishnaiahy Rao, (Eds.). North Holland. Amsterdam.

[30] Warner, S.L. (1965). ‘Randomized response: a survey technique for eliminatingevasive answer bias’. J. Amer. Statist. Assoc. 60, pp. 63-69.

Jose A. Mayor Gallego. Proyecto Docente

Page 159: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XII 155

2.12. Comentarios al Bloque Tematico XII : Dise-

nos optimos y disenos controlados.

El ultimo Bloque Tematico se dedica al estudio de ciertos aspectos concretos dela optimalidad de disenos muestrales, ya sea en relacion al error de muestreo de lasestimaciones realizadas a partir de los mismos, ya sea en relacion a otros criteriosde utilidad. El muestreo en poblaciones finitas presenta numerosos aspectos bajo loscuales se pueden plantear problemas de optimalidad. Por ejemplo, Bellhouse (1984)realiza una revision de seis tipos diferentes de problemas de esta naturaleza.

Algunas de estas cuestiones ya fueron estudiadas, desde un punto de vista muygeneral, en varios temas del bloque tematico II, siendo consideradas ahora con unenfoque mas restringido y directamente aplicable, y sobre ciertos modelos mas con-cretos. Tambien estudiaremos los disenos muestrales controlados, en el sentido deacotar, controladamente, las probabilidades de ciertas muestras mas o menos preferi-das. Todas estas cuestiones son tratadas en los siguientes temas,

TEMA 58. Disenos optimos en modelos de proporcionalidad directa.

TEMA 59. Disenos optimos equivalentes.

TEMA 60. Disenos muestrales controlados.

En el desarrollo de la teorıa del muestreo aparecen con frecuencia problemas deoptimizacion en los cuales se busca mejorar la eficiencia, con respecto a algun crite-rio, usualmente relacionado con la precision de las estimaciones, dentro de una clasede disenos muestrales. En el TEMA 58 estudiaremos algunos de estos problemas, enpresencia de informacion auxiliar y bajo modelo de superpoblacion de proporciona-lidad directa del tipo,

Yi = βXi + εi

Es[εi] = 0Vs[εi] = σ2

i

Es[εiεj] = 0, i 6= j

Jose A. Mayor Gallego. Proyecto Docente

Page 160: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XII 156

con respecto a la estimacion de Y mediante el estimador de razon generico, conside-rado en el Tema 43,

Y R =1

N

∑i∈U

Yi +1

N

∑i∈m

Yi − Yi

πi

Siguiendo la lınea de Sarndal et al. (1992), utilizaremos como criterio la minimi-zacion de la varianza anticipada,

Vant[Y ] = EsEd[(Y R − Y )2]−(EsEd[Y R − Y ]

)2

donde Ed denota esperanza respecto al diseno muestral. De esta forma obtendremoslos resultados usuales respecto a las probabilidades de inclusion optimas, que han deadoptar la forma,

πi ∝ σi ∀i ∈ U

Como una aplicacion del modelo global previo, en su version multivariante, seestudiara el problema bajo el modelo completamente aleatorio por grupos,

Yi = βg + εi i ∈ Ug

siendo U1, . . . , UG una particion de U . Este modelo se reduce a un modelo de razonmultivariante definiendo la variable auxiliares G-dimensional,

Xi = (0, . . . , 1, . . . , 0) i ∈ U

donde el “1” indica en que grupo esta el elemento ui.

Finalmente estudiaremos el muestreo estratificado basado en el modelo deproporcionalidad directa propuesto por Wright (1983), y que proporciona un meto-do practico para obtener disenos con probabilidades de inclusion cuasi-optimas, en elsentido de ser muy aproximadas a la solucion optima del modelo global, anteriormenteobtenidas. Vease Sarndal et al. (1992).

En el TEMA 59 enfocamos la optimalidad de los disenos muestrales desde un pun-to de vista diferente y mas relacionado con el campo de la Teorıa de Optimizacion.A partir de la observacion de que el diseno muestral interviene fuertemente en las

Jose A. Mayor Gallego. Proyecto Docente

Page 161: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XII 157

estimaciones a traves de las probabilidades de inclusion de primer y segundo orden,es decir, de la matriz del diseno, Π, todos aquellos disenos muestrales con igual Π pro-porcionaran estimaciones igualmente acuradas, y entre estos disenos podemos buscar,ademas, los que mejoren ciertos criterios adicionales.

Ası, empezaremos definiendo los disenos muestrales π-equivalentes como aque-llos con igual matriz de diseno. Siendo interesante observar que la π-equivalenciaimplica la igualdad de esperanza y varianza del tamano muestral.

Dada una matriz de diseno, factible, Π, al conjunto de los disenos muestrales condicha matriz de diseno le denominaremos estructura de π-equivalencia generadapor Π. Estudiaremos las propiedades de dicho conjunto, fundamentalmente la deconvexidad.

Si suponemos los elementos de 2U en un cierto orden, m1, m2, . . ., un disenomuestral generico, d = (M, p(·)), sobre U , puede ser considerado como un punto delespacio producto [0, 1]t, siendo t = 2N .

Denotaremos dicho punto como x = (x1, x2, . . . , xt), y considerando los indicado-res,

Iij(k) =

1 i, j ∈ mk

0 i, j 6∈ mk

∀ i, j ∈ U, k = 1, . . . , t

se debera verificar,

t∑k=1

xkIij(k) = πij ∀i ≤ j

t∑k=1

xk = 1

xk ≥ 0 k = 1, . . . , t

Jose A. Mayor Gallego. Proyecto Docente

Page 162: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XII 158

Si denotamos,

A =

I11(1) I11(2) . . . I11(t)I22(1) I22(2) . . . I22(t). . . . . . . . . . . .

INN(1) INN(2) . . . INN(t)I12(1) I12(2) . . . I12(t)I13(1) I13(2) . . . I13(t). . . . . . . . . . . .

IN−1 N(1) IN−1 N(2) . . . IN−1 N(t)1 1 1 1

b =

π1

π2

. . .πN

π12

π13

. . .πN−1 N

1

entonces las anteriores restricciones se pueden expresar como,

Ax = b x ≥ 0

lo que representa un poliedro convexo, determinando todo punto del mismo un disenocon las mismas probabilidades de inclusion de primer y segundo orden.

Definida ası una estructura de π-equivalencia, plantearemos la busqueda de disenospertenecientes a la misma, mejorando algun criterio adicional, lo que nos conducira aun problema de programacion matematica, en el cual las restricciones son lineales,por ello al diseno ası obtenido le llamaremos optimo en relacion al criterio utilizado.

Es importante observar que si queremos obtener disenos de tipo controlado, esdecir, con las probabilidades de ciertas muestras controladas o acotadas por ciertamagnitud, π-equivalentes a uno dado, basta anadir, a las restricciones ya consideradas,otras que acoten, en la medida deseada, las probabilidad de dichas muestras. Esdecir, si denominamos W ⊆ M al subconjunto del espacio muestral formado por lasmuestras no preferidas, y queremos que la probabilidad de dichas muestras no excedael valor α ∈ [0, 1], basta anadir las restricciones,

xk ≤ α ∀k ∈ W

Como referencias basicas para esta cuestion, indicamos Wynn (1977), Foody y He-dayat (1977), Hedayat (1979), Rao y Nigam (1990, 1992) y Fernandez y Mayor (1994,1996). En estas ultimas se pueden encontrar ademas, ejemplos practicos completa-mente desarrollados.

Jose A. Mayor Gallego. Proyecto Docente

Page 163: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XII 159

Siguiendo una lınea similar, definiremos los disenos muestrales π-equivalentesde primer orden como aquellos que tienen las mismas probabilidades de inclusionde primer orden, y estudiaremos la estructura de π-equivalencia de primer orden gene-rada por un vector de probabilidades de inclusion, π = (π1, . . . , πN). Esta estructura,al igual que la de π-equivalencia, es un poliedro convexo y conduce al planteamientode la busqueda de disenos optimos sobre la misma. Vease Fernandez y Mayor (1994,1996).

Para terminar el tema, estudiaremos la obtencion de disenos ΠPS, de mınimavarianza en relacion a la estimacion de Horvitz-Thompson de un parametro lineal,θ(Y ), bajo un modelo de superpoblacion de proporcionalidad directa, del tipo,

Yi = βXi + εi

Es[εi] = 0Vs[εi] = σ2

planteando la minimizacion en las variables πij, i 6= j, de la funcion lineal EsV [θ(Y )].

El TEMA 60, ultimo de este temario, se dedica al estudio de los disenos mues-trales controlados o seleccion controlada. El estudio de este tipo de seleccionfue iniciado por Goodman y Kish (1950) y usualmente se utiliza con muestreo estra-tificado. Su finalidad principal es aumentar la probabilidad correspondiente a ciertasmuestras deseables disminuyendo la de otras muestras no deseables pero respetan-do las probabilidades de inclusion de los elementos.

Con ello se mantienen las propiedades de las estimaciones, consiguiendo hacermenos probable muestras que podrıa presentar dificultades de tipo administrativo,problemas de falta de respuesta, etc.

De esta forma, iniciaremos el tema con la introduccion de los conceptos correspon-dientes y algunos ejemplos de aplicaciones reales. en este sentido, es clasico el estudiorealizado en 1958 por la Universidad de Michigan sobre poblacion hospitalizada, y enel que se aplico la seleccion controlada. La descripcion de este y otros ejemplos puedeencontrarse en Azorın y Sanchez-Crespo (1988).

Seguidamente, siguiendo el desarrollo de Avadhani y Sukhatme (1973), expondre-mos los principales resultados teoricos relacionados con la seleccion controlada, conprobabilidades de inclusion constantes y sin reemplazamiento, a partir de los cualesse deriva el metodo que proponen estos autores y que sera ilustrado con ejemplospracticos.

Jose A. Mayor Gallego. Proyecto Docente

Page 164: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XII 160

Otro enfoque para construir disenos controlados, ya sin la restriccion de igualdadde las probabilidades de inclusion, se basa en las tecnicas presentadas en el Tema 59,que tambien permiten introducir criterios adicionales de optimalidad. Vease Rao yNigam (1990, 1992).

Referencias del Bloque Tematico XII

[1] Avadhani, M.S. y Sukhatme, B.V. (1973). ‘Controlled sampling with equal pro-babilities and without replacement’. Internat. Statist. Rev. 41,pp. 173-182.

[2] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

[3] Bellhouse, D.R. (1984). ‘A review of optimal designs in survey sampling’. TheCanadian Journal of Statistics. 12, pp. 53-65.

[4] Cochran, W.G. (1993). Tecnicas de Muestreo. Decima reimpresion. CECSA.Mexico.

[5] Chaudhuri, A. y Vos, J. (1988). Unified Theory and Strategies of Survey Sam-pling. North Holland. Amsterdam.

[6] Dalenius, T. y Gurney, M. (1951). ‘The problem of optimum stratification II’.Skandinavisk Aktuarietidskrift. 34, pp. 133-148.

[7] Dalenius, T. y Hodges, J.L. (1959). ‘Minimum variance stratification’. J. Amer.Statist. Assoc. 54, pp. 88-101.

[8] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[9] Fernandez, F.R. y Mayor, J.A. (1996). ‘Disenos muestrales π-equivalentes yequivalentes de primer orden’. A publicar en Questiio. Volumen 20.

[10] Foody, W. y Hedayat, A.S. (1976). ‘On theory and application of BIB designswith repeated blocks’. Ann. Statist. 5, pp. 932-945.

[11] Goodman, L.A. y Kish, L. (1950). ‘Controlled selection - a technique in proba-bility sampling’. J. Amer. Statist. Assoc. 45, pp. 350-372.

Jose A. Mayor Gallego. Proyecto Docente

Page 165: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

COMENTARIOS AL TEMARIO. BLOQUE TEMATICO XII 161

[12] Hajek, J. (1981). Sampling from a Finite Population. Marcel Dekker, Inc. NewYork.

[13] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol. I y II. Wiley. New York.

[14] Hedayat, A.S. (1979). ‘Sampling designs with reduced support sizes’. OptimizingMethods in Statistics. J. Rustagi (Ed.). Academics Press, New York.

[15] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[16] Ramakrishnan, M.K. (1975). ‘Choice of an optimum sampling strategy I’. Ann.Statist. 3, pp. 669-679.

[17] Rao, J.N.K. y Nigam, A.K. (1990). ‘Optimal controlled sampling designs’. Bio-metrika. 77, pp. 807-814.

[18] Rao, J.N.K. y Nigam, A.K. (1992). ‘Optimal controlled sampling: a unifiedapproach’. Internat. Statist. Rev. 60, pp. 89-98.

[19] Sarndal, C. (1984). Inference statistique et analyse des donnees sous des plansd’echantillonage complexes. Presses de l’Universite de Montreal.

[20] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York, Inc.

[21] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

[22] Wright, T. (1983). ‘Finite population sampling with multivariate auxiliary in-formation’. J. Amer. Statist. Assoc. 78, pp. 879-884.

[23] Wynn, H.P. (1977). ‘Convex sets of finite population plans’. Ann. Statist. 5, pp.414-418.

Jose A. Mayor Gallego. Proyecto Docente

Page 166: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

Capıtulo 3

Planificacion docente y otrosaspectos metodologicos

3.1. Extension de la asignatura, requisitos y rela-

cion con otras materias

Los contenidos teoricos que hemos presentado, forman el nucleo sobre el que pen-samos que ha de ser desarrollada la asignatura de Muestreo en Poblaciones Finitas.Debido a la amplitud de estos conocimientos, esta asignatura se concibe necesaria-mente como anual y con cinco horas semanales.

Para abordarla obteniendo un nivel suficiente de asimilacion y competencia, elalumno necesita una base general en Analisis Matematico y Algebra, que le permitala comprension, sin dificultad, de las tecnicas utilizadas, y una base especıfica enCalculo de Probabilidades y Estadıstica, tanto Descriptiva como Matematica, puescomo ya se ha mencionado varias veces a largo de este proyecto, el muestreo estudia demanera unificada, tanto los mecanismos probabilısticos, a veces de gran complejidad,para obtener muestras, como la teorıa de la estimacion que se realiza a partir de estas.

Por otra parte, y por sus numerosas conexiones con el campo de las encuestas,tanto en lo que se refiere a objetivos como fundamentacion teorica, la asignaturapropuesta deberıa estar adecuadamente coordinada con las existentes en el plan deestudios, y dedicadas al estudio de las mismas.

162

Page 167: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 163

Por ejemplo, en la actual Diplomatura de Estadıstica, existente en la Universidadde Sevilla, se imparte la asignatura Estadıstica y Encuestas, en la que se incluyen,entre otros, temas como,

Etapas basicas de las encuestas por muestreo.

Los marcos. Su problematica.

Muestreo por areas.

Muestreo de marcos imperfectos.

Metodos de recoleccion de datos.

El cuestionario.

La codificacion.

Muestreo por cuotas.

La no respuesta.

Encuestas a traves del tiempo.

Diseno de la Encuesta General de Poblacion.

Estadısticas espanolas basadas en encuestas por muestreo.

Por supuesto, ello no va en detrimento de que en la asignatura que proponemosse analicen, como estudios de caso, encuestas reales importantes que se llevan a caboa nivel nacional e internacional, cuestion que puntualizaremos mas adelante al tratarde la organizacion docente de la materia.

3.2. Organizacion docente de la asignatura

Como ya hemos mencionado, los contenidos de muestreo se distribuyen en unaasignatura anual, con una carga lectiva de cinco horas semanales, en las cuales serealizan las siguientes actividades:

Clases teoricas.

Clases practicas.

Estudios de caso y supuestos practicos.

Jose A. Mayor Gallego. Proyecto Docente

Page 168: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 164

3.2.1. Clases teoricas

Como su propio nombre indica, las clases teoricas se dedican a la exposicion ri-gurosa de los contenidos teoricos de la asignatura. No obstante, nuestra experienciadocente nos ha mostrado la conveniencia de introducir y justificar los temas, o gruposde temas, mediante la presentacion de los aspectos practicos o de la problematica apartir de la cual se ha desarrollado la teorıa. Por ejemplo, para motivar la introduccionde los metodos de replicacion, se podrıan describir los estudios agrıcolas llevados a ca-bo por Mahalanobis en la India, y descritos en Mahalanobis (1939, 1944, 1946), en loscuales introdujo la tecnica de submuestras interpenetrantes, con objeto de disminuirlos errores de observacion originados por los entrevistadores.

De esta forma, se evidencia la naturaleza aplicada del muestreo, su gran desarrolloteorico, originado por la necesidad de dar respuesta a los numerosos problemas queplantea el estudio de las poblaciones, y su atractiva interrelacion entre la teorıa y lapractica.

Creemos tambien muy interesante inducir al alumno a la utilizacion de materialbibliografico, basicamente manuales, donde se puedan consultar y ampliar los conoci-mientos adquiridos en las clases, y asimilarlos con otros enfoques diferentes. En estesentido en muy difıcil realizar una lista completa y adecuada en terminos absolutos,pues ello dependera de factores tales como la opinion del profesor, el acceso a dichomaterial por parte del alumnado, la orientacion que se quiera dar a la asignatura, etc.Sin embargo, sı hemos elaborado una lista de volumenes que consideramos fundamen-tales, y a los que nuestros alumnos tienen acceso. Esta lista se expone mas adelanteen un apartado especıfico que dedicamos a materiales diversos para el desarrollo dela asignatura. Adicionalmente, para trabajos especiales de ampliacion, puede reco-mendarse la consulta de artıculos aparecidos en revistas estadısticas. Estos artıculospueden ser seleccionados con varios criterios, entre los que destacamos su importanciahistorica, por haber dado lugar a una lınea de investigacion clasica, su tratamientoprofundo de algun tema muy especializado y el exponer los ultimos avances que sevan produciendo.

3.2.2. Clases practicas

Concebimos las clase practicas no de forma uniforme sino como realizacion detareas muy diversas pero que tienen en comun complementar los contenidos teoricos,consolidando conceptos, profundizando en las ramificaciones de la teorıa y resolvien-do cuestiones practicas concretas sobre obtencion de muestras y estimacion, comoaplicacion de aquella.

Jose A. Mayor Gallego. Proyecto Docente

Page 169: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 165

Estas tareas se pueden clasificar en,

Resolucion de ejercicios de naturaleza teorica, esto es, cuyo tratamiento nose reduce a la aplicacion de un algoritmo o la simple sustitucion en formulasmas o menos complicadas. En nuestra opinion, estos ejercicios resultan funda-mentales, en los niveles de ensenanza que estamos considerando, debido, poruna parte a que la extension de la materia no permite el estudio exhaustivo dela misma durante las clases teoricas, lo que impide a veces la consideracion decasos particulares, o de variantes de interes.

Por ejemplo, cuando hemos comentado los temas dedicados a la obtencion dedisenos ΠPS, hemos observado que existen en la literatura una gran cantidad deprocedimientos para ello, aunque en la clase solo podemos explicar los que, ennuestra opinion son mas relevantes. Podemos entonces reservar para las clasespracticas el estudio de algunos adicionales.

Resolucion de ejercicios de naturaleza algorıtmica o numerica, es decir,ejercicios de aplicacion practica de las tecnicas desarrolladas en la teorıa delmuestreo. Este tipo de ejercicios, que a veces pueden parecer triviales, son in-dispensables porque suponen la terminacion de todo un proceso que comienzacon el planteamiento de los problemas que aparecen en la realidad, continuacon la modelizacion teorica y la busqueda de soluciones, y finaliza precisamentecon la aplicacion “real” del modelo, mediante ejercicio en los cuales se obtie-nen muestras de poblaciones reales o simuladas y se realizan los calculos paraobtener los resultados.

Utilizacion de las herramientas informaticas disponibles para simplificar yautomatizar los diferentes procesos y calculos inherentes al muestreo. Estasherramientas, al descargarnos de tareas meramente mecanicas que realiza elordenador, nos permiten centrarnos en cuestiones mas conceptuales, a la vezque habilitan al alumno en el uso de un “software” que con gran probabilidadtendra que utilizar en su futura actividad profesional, como bases de datos,hojas de calculo y tambien programas especıficos para tratamiento de encuestaspor muestreo, como PCCARP.

En este apartado tambien contemplamos la utilizacion de programas que simu-lan el proceso completo de muestreo y estimacion sobre una poblacion, real osimulada, contenida en una base de datos informatizada. Este tipo de progra-mas no se ha disenado para la resolucion de problemas reales sino para ilustrar,de forma rapida, dicho proceso, pudiendo ser ejecutados repetidas veces lo quenos permite comparar resultados en diferentes condiciones, cambiando las po-blaciones, el diseno muestral, el tamano muestral, etc.

Jose A. Mayor Gallego. Proyecto Docente

Page 170: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 166

En el apartado de materiales, consideraremos especıficamente la utilizacion del“software”, y expondremos una muestra del mismo, disponible actualmente.

Finalmente, hemos de observar que las tareas anteriores no tienen por que des-arrollarse aisladamente, de forma que es posible y deseable que concurran durante eltranscurso de un mismo intervalo de clase practica. Por ejemplo, podemos realizar enla pizarra un ejercicio numerico de estimacion de regresion, combinada y separada,para que el alumno capte los mecanismos de calculo, y a continuacion utilizar unprograma adecuado para realizar varias simulaciones por ordenador de estas estima-ciones, y comparar los resultados obtenidos; o podemos dedicar un ejercicio teoricoal estudio de los aspectos particulares del diseno de Poisson, para realizar a continua-cion varias simulaciones de obtencion de muestras aplicando este diseno y realizar unestudio empırico de la distribucion de la variable aleatoria n(m), es decir, el tamanomuestral.

3.2.3. Estudios de casos y supuestos practicos

Esta actividad viene justificada por la naturaleza aplicada de la asignatura, y surealizacion puede ser de gran ayuda para los alumnos ya que el estudio de un conjuntoadecuado de casos practicos reales, a la vez de servir para complementar las anterioresactividades, puede suministrar un bagaje de conocimientos metodologicos muy utilpara la futura actividad estadıstica.

En este sentido, y como ya hemos mencionado varias veces a lo largo de esteproyecto, creemos de gran interes el estudio de las tecnicas utilizadas en encuestasimportantes que se realizan en diversos paıses como la Encuesta General de Pobla-cion en Espana, y en la cual se inserta la Encuesta de Poblacion Activa, GarcıaEspana (1974); la “Current Population Survey” en Estados Unidos de America, U.S.Bureau of the Census (1979), ası como otras encuestas de tipo sanitario, agrıcola,industrial, etc, Des Raj (1972).

3.2.4. Distribucion horaria

La distribucion horaria de estas actividades no debe hacerse de una forma rıgi-da, sino adaptada a las particularidades de los diferentes temas. Por ejemplo, paratemas de naturaleza mas teorica como los que estudian la inferencia o los modelosde superpoblacion, se dara preponderancia a las clases teoricas, complementandolascon algunas clases practicas dedicadas a la resolucion de problemas; por el contrario,para aquellos temas de mayor contenido practico, como los dedicados a muestreo por

Jose A. Mayor Gallego. Proyecto Docente

Page 171: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 167

conglomerados, se acentuara la carga docente en las clases practicas y los estudios decaso y supuestos practicos.

3.3. Materiales

3.3.1. Material bibliografico

Como ya hemos mencionado anteriormente, el material bibliografico que expone-mos a continuacion esta escogido con criterios de accesibilidad por parte de nuestroalumnado, y sobre todo por formar un nucleo fundamental de conocimientos bastantecompleto sobre la asignatura. Como podra observarse, la mayor parte de los textos noesta, por desgracia, en nuestro idioma, lo que puede ocasionar inconvenientes a ciertosalumnos, siendo ello debido a la escasez de tratados de muestreo escritos en espanol.Esperamos que este pequeno inconveniente se vaya resolviendo gradualmente.

1. Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

2. Brewer, K.R.W. y Hanif, M. (1983). Sampling with Unequal Probabilities. Springer-Verlag. New York.

3. Cassel, C., Sarndal, C. y Wretman, J. (1977). Foundations of Inference in SurveySampling. Wiley. New york.

4. Cochran, W.G. (1993). Tecnicas de muestreo. Decima reimpresion. CECSA.Mexico.

5. Chaudhuri, A. y Stenger, H. (1992). Survey Sampling. Theory and Methods.Marcel Dekker, Inc. New York.

6. Chaudhury, A. y Mukerjee, R. (1988). Randomized Response. Theory and Te-chniques. Marcel Dekker, Inc. New York.

7. Chaudhuri, A. y Vos, J. (1988). Unified Theory and Strategies of Survey Sam-pling. North Holland. Amsterdam.

8. Des Raj. (1972). The Design of Sample Surveys. McGraw-Hill. New York.

9. Des Raj. (1980). Teorıa del muestreo. Fondo de Cultura Economica. Mexico.

10. Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

Jose A. Mayor Gallego. Proyecto Docente

Page 172: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 168

11. Gabler, S. (1990). Minimax Solutions in Sampling from Finite Populations.Springer-Verlag. Berlin.

12. Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol. I y II. Wiley. New York.

13. Hajek, J. (1981). Sampling from a finite population. Marcel Dekker. New York.

14. Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

15. Krishnaiah, P.R. y Rao, C.R. (Eds.). 1984. Handbook of statistics 6. Sampling.North-Holland. Amsterdam.

16. Levy, P.S. y Lemeshow, S. (1991). Sampling of Populations. Methods and Ap-plications. Wiley. New York.

17. Sarndal, C. (1984). Inference statistique et analyse des donnees sous des plansd’echantillonage complexes. Presses de l’Universite de Montreal.

18. Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York, Inc.

19. Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.

20. Wolter, K.M. (1985). Introduction to Variance Estimation. Springer-Verlag.New York.

21. Yates, F. (1960). Sampling Methods for Censuses and Surveys. Tercera edicion.Griffin and Co., Londres.

3.3.2. “Software”

El muestreo, como otras ramas de la Estadıstica, conlleva en sus aplicacionespracticas la realizacion de voluminosos calculos numericos y la puesta en practica,como ya hemos tenido ocasion de comprobar en el desarrollo de la materia, de me-canismos aleatorios complejos para la seleccion de muestras. Todos estos procesos seagilizan enormemente con la ayuda del ordenador, e incluso algunos de ellos serıanpracticamente inviables sin esta herramienta, lo que requiere la utilizacion de unadecuado “software” o conjunto de programas.

Jose A. Mayor Gallego. Proyecto Docente

Page 173: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 169

En principio podemos clasificar el “software” en tres grandes grupos,

1. El de proposito general, como son los diferentes lenguajes de programacion(Fortran, Pascal, C, etc.) y otros entornos, no estadısticos, para la manipulacionde informacion, como las bases de datos y las hojas de calculo electronicas. Estasherramientas son utiles para disenar aplicaciones, y para trabajar con grandesmasas de datos como poblaciones o grandes muestras, aunque requieren uncierto dominio de las tecnicas de programacion.

2. El “software” de aplicaciones estadısticas sin tratamiento especıfico de mues-treo. En este grupo incluimos los paquetes estadısticos clasicos como BMDP,SPSS, SAS, Statgraphic, etc. Estos programas son interesantes en los anali-sis previos de los datos muestrales, para descubrir o confirmar relaciones entrevariables y determinadas tendencias, siendo tambien muy utiles por sus capaci-dades graficas.

3. El “software” disenado especıficamente para el analisis de datos mues-trales proveniente de las encuestas por muestreo. El catalogo de losprogramas disponibles de este tipo, no es muy abundante ni muy asequible. Ci-taremos entre ellos OSIRIS IV, SUDAAN y sobre todo PCCARP, Fulleret al. (1989). Este ultimo, adquirido por la Facultad de Matematicas, tiene laventaja de funcionar en microordenadores compatibles, y es utilizado como apo-yo para las clases practicas, en los temas en los cuales se estudia la estimacionde parametros a partir de datos obtenidos mediante disenos complejos (veasebloque tematico VIII).

Debido a que el “software” especıfico para muestreo es muy limitado, y cubre solouna pequena parte del temario, hemos desarrollado, basandonos en la experienciaadquirida durante varios cursos, en la ensenanza y estudio de esta materia, una seriede aplicaciones originales, que por sus objetivos, clasificamos en dos grupos,

A. Programas que, genericamente, realizan simulaciones de extraccion de mues-tras, y calculan estimaciones a partir de los datos obtenidos. Para construirestos programas hemos seguido un desarrollo paralelo al del temario, y su obje-tivo principal es ilustrar, de forma agil y flexible, los procesos probabilısticos einferenciales inherentes al muestreo en poblaciones finitas. Para complementarestos programas, se han generado, mediante simulacion, una serie de poblacionessobre las que se llevan a cabo las operaciones. A continuacion presentamos lalibrerıa existente hasta la fecha, con una breve descripcion de cada programas,

Jose A. Mayor Gallego. Proyecto Docente

Page 174: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 170

1. MDIS. Obtencion de muestras a partir de un diseno muestral.

2. MMAS. Obtencion secuencial de una muestra aleatoria.

3. MMB. Obtencion de una muestra del diseno de Bernoulli.

4. MMP. Obtencion de una muestra del diseno de Poisson.

5. DMMAS. Valoracion del estadıstico media muestral sobre muestras alea-torias.

6. DCMAS. Valoracion del estadıstico cuasivarianza muestral sobre mues-tras aleatorias.

7. HTMMB. Estimacion de la media poblacional mediante el estimador deHorvitz-Thompson, usando el muestreo de Bernoulli.

8. HHMPX. Estimacion de la media poblacional mediante el estimador deHansen-Hurwitz, usando muestreo con reemplazamiento y probabilidadesse seleccion proporcionales a una variable auxiliar.

9. FMR. Extraccion de una muestra aleatoria por el procedimiento de Fan,Muller y Rezucha.

10. MLBL. Extraccion de una muestra aleatoria por el procedimiento deMcLeod y Bellhouse.

11. VMUEST. Extraccion de varias muestras aleatorias no solapadas.

12. EMMAS. Extraccion de una muestra aleatoria y estimacion de la mediade una variable.

13. EMMASR. Extraccion de una muestra aleatoria con reemplazamiento yestimacion de la media de una variable.

14. TRMAS. Calculo del tamano muestral necesario para estimar la mediapoblacional de una variable con una precision relativa dada.

15. TAMAS. Calculo del tamano muestral necesario para estimar la mediapoblacional de una variable con una precision relativa dada.

16. EPMINV. Estimacion de la proporcion para una caracterıstica minorita-ria mediante muestreo inverso.

Jose A. Mayor Gallego. Proyecto Docente

Page 175: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 171

17. RAMAS. Estimacion de una razon de medias usando el metodo de apro-ximacion lineal y muestreo aleatorio.

18. REPIND. Estimacion de una razon de medias usando muestras replicadasindependientes obtenidas mediante muestreo aleatorio.

19. REPDEP. Estimacion de una razon de medias usando muestras replica-das dependientes obtenidas mediante muestreo aleatorio.

20. JACKRA. Estimacion de una razon de medias usando el metodo jackknifeaplicado a una muestra aleatoria.

21. MS. Obtencion de una muestra sistematica.

22. MSAL. Estimacion de una media a partir de una muestra sistematicasuponiendo que el modelo de superpoblacion es completamente aleatorio.

23. MSLIN. Estimacion de una media a partir de una muestra sistematicasuponiendo que el modelo de superpoblacion es de tendencia lineal.

24. MSREP. Estimacion de una razon mediante muestras sistematicas reli-cadas independientes.

25. LAHIRI. Obtencion de un elemento por el metodo de Lahiri.

26. MIDZ1. Obtencion de una muestra mediante el procedimiento de Midzu-no, sin usar probabilidades revisadas en la seleccion del primer elemento,y estimacion de una media poblacional usando el estimador de Horvitz-Thompson.

27. MIDZ2. Obtencion de una muestra mediante el procedimiento de Midzu-no, usando, si es factible, probabilidades revisadas en la seleccion del pri-mer elemento, y estimacion de una media usando el estimador de Horvitz-Thompson.

28. SAMPFORD. Obtencion de una muestra mediante el procedimiento deSampford, y estimacion de una media usando el estimador de Horvitz-Thompson.

29. DESRAJ. Extraccion de una muestra usando probabilidades de seleccionde elementos proporcionales a su tamano, sin reemplazamiento, y estima-cion de una media poblacional usando el estimador de Des Raj.

Jose A. Mayor Gallego. Proyecto Docente

Page 176: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 172

30. DH1. Estratificacion de una poblacion usando el metodo de Dalenius-Hodges, a partir de una tabla de frecuencias de una variable que el mismoprograma construye.

31. DH2. Estratificacion de una poblacion usando el metodo de Dalenius-Hodges, a partir de una tabla de frecuencias de una variable, que se sumi-nistra como dato.

32. PAREST. Estimacion de un parametro por muestreo estratificado.

33. RAMASE. Estimacion de la razon de medias (o totales) de dos varia-bles usando muestreo aleatorio estratificado y los estimadores separado ycombinado.

34. EMPOST. Estimacion de la media usando una muestra aleatoria simple,estratificada a posteriori.

35. EMCON1. Estimacion de la media usando muestreo por conglomeradosen una etapa.

36. RACON1. Estimacion de la razon de medias o totales usando muestreopor conglomerados en una etapa.

37. EMCON2. Estimacion de la media usando muestreo por conglomeradosen dos etapas.

38. RACON2. Estimacion de la razon de medias o totales usando muestreopor conglomerados en dos etapas.

39. EMMASINF. Estimacion de la media usando muestreo aleatorio simpley estimadores de razon y regresion.

40. EMRAEST. Estimacion de la media usando muestreo aleatorio estratifi-cado y estimador de razon separado y combinado.

41. EMREEST. Estimacion de la media usando muestreo aleatorio estratifi-cado y estimador de regresion separado y combinado.

42. WARNER. Estimacion de la proporcion de una caracterıstica compro-metedora usando el metodo de la pregunta relacionada o de Warner.

43. PREGNR1. Estimacion de la proporcion de una caracterıstica compro-metedora usando el metodo de la pregunta no relacionada con conocimientode la proporcion poblacional de la caracterıstica no relacionada.

Jose A. Mayor Gallego. Proyecto Docente

Page 177: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 173

44. PREGNR2. Estimacion de la proporcion de una caracterıstica compro-metedora usando el metodo de la pregunta no relacionada, sin conocimientode la proporcion poblacional de la caracterıstica no relacionada.

45. MASDBF. Generacion y almacenamiento de muestras aleatorias.

46. PMX. Calculo de parametros sobre una variable de una muestra o pobla-cion.

47. PMXY. Calculo de parametros sobre dos variables de una muestra o po-blacion.

48. MSDIB. Grafica de la nube de puntos correspondiente a una variable deuna muestra sistematica.

B. El otro grupo esta formado por el “software” de utilidad real, que aunque,logicamente, tambien se utiliza como apoyo a las clases practicas, tiene unosobjetivos mas amplios como son la resolucion de los problemas que se presentanen las aplicaciones reales del muestreo.

Este “software” esta siendo desarrollado, bajo nuestra direccion, por equipostecnicos pertenecientes a la Facultad de Informatica y Estadıstica de la Univer-sidad de Sevilla, y actualmente estan ya disponibles las siguientes aplicaciones,

1. Programa MPT, Domınguez y Flores (1994). Este programa permite ob-tener muestras utilizando los siguientes procedimientos con probabilidadesvariables: Midzuno, con y sin probabilidades revisadas de seleccion; sis-tematico de Madow, Sampford y Sunter. A partir de estas muestras, ymediante un lenguaje creado especıficamente para este proposito, se reali-zan estimaciones de la media y el total poblacional, ası como del error demuestreo cometido.

2. Programa MAS, Florencio (1995). Programa para realizar estimacionesde la media poblacional, el total poblacional, la proporcion poblacional yla razon de medias o totales, a partir de una muestra aleatoria. Ademasde realizar un analisis estadıstico de la muestra, calculando los parametrosusuales, puede calcular los estimadores basicos, y tambien los de razon yregresion. Tambien posee un modulo para realizar estimaciones mediantemetodos de replicacion de muestras.

3. Librerıa MLIB, Mayor, Domınguez y Gomez (1995). Librerıa de progra-mas, disenados para su utilizacion en un entorno de gestion de bases de

Jose A. Mayor Gallego. Proyecto Docente

Page 178: PROYECTO DOCENTE MUESTREO EN POBLACIONES FINITASpersonal.us.es/Jmayor/Ficheros/Proyecto.pdfde Muestreo en Poblaciones Finitas, se entiende, b´asicamente, el estudio de un conjunto

PLANIFICACION DOCENTE Y OTROS ASPECTOS METODOLOGICOS 174

datos y aplicables a varios campos del muestreo. Esta librerıa se ha cons-truido bajo una especificaciones generales, comunes para todos los modu-los, de forma que se pueda ampliar, a lo largo del tiempo, con las nuevasrutinas que se vayan creando, siguiendo las mismas pautas.

Hasta el momento, esta librerıa contiene programas para analisis, cuanti-tativo y grafico, de muestras, estimacion a partir de una muestra aleatoriasimple, tamano muestral, estimacion de parametros no lineales, metodosde replicacion y jackknife, estimacion a partir de una muestra sistematica,estimador de Horvitz-Thompson, muestreo estratificado y muestreo porconglomerados, ası como para obtener muestras aplicando varias clases dedisenos muestrales.

Referencias

[1] Des Raj. (1972). The Design of Sample Surveys. McGraw-Hill. New York.

[2] Fuller, W.A., Schnell, D., Sullivan, G., Kennedy, W.J. y Park, H.J. (1989).PC CARP. Statistical Laboratory. Iowa State University. Ames. Iowa.

[3] Flores, C. y Domınguez, J. (1994). MPT. Muestreo con probabilidades variablesy estimacion de parametros. Proyecto de Fin de Carrera. J.A. Mayor (Dir.).Facultad de Informatica y Estadıstica. Universidad de Sevilla.

[4] Florencio, J.C. (1995). MAS. Estimacion de parametros a partir de muestreoaleatorio simple. Proyecto de Fin de Carrera. J.A. Mayor (Dir.). Facultad deInformatica y Estadıstica. Universidad de Sevilla.

[5] Garcıa Espana, E. (1974). Diseno de la encuesta general de poblacion. InstitutoNacional de Estadıstica. Madrid.

[6] Mayor, J.A., Domınguez, J.L. y Gomez, A.M. (1995). ‘MLIB : librerıa de pro-gramas para la obtencion y el tratamiento de muestras de poblaciones finitas’.XXII Congreso Nacional de Estadıstica, Investigacion Operativa e Informatica.S.E.I.O. Sevilla.

Jose A. Mayor Gallego. Proyecto Docente