Cultura Estadística para la Investigación 2014-I
1
GUIA TEÓRICA N°03
POBLACIÓN, MUESTRA Y MUESTREO
I. DEFINICIONES BÁSICAS:
1. Población:
Denominamos población al universo o total de elementos (personas,
objetos, etc.) que tienen uno o más características observables de
naturaleza cualitativa o cuantitativa.
Las características observables en la población definen una variable
estadística cuyo valor numérico o no numérico, es precisamente
denominada una observación o medición.
Si la variable estadística en estudio es una sola, entonces cada elemento
de la población se puede asociar con una medición. En este sentido se
denomina población al conjunto de todas las observaciones posibles de la
variable en estudio.
Si la variable estadística es de carácter cuantitativa esta viene a ser una
variable aleatoria, donde los elementos de la población son definidos a
través de un proceso aleatorio. En este caso, la distribución de la
población es la distribución de la variable aleatoria. Por tanto se define
que la media y la varianza de una variable aleatoria vienen a ser la media
y la varianza de la población.
Por lo general el tamaño de la población puede ser finita de tamaño N o
infinita.
2. Parámetros:
Se denomina parámetro a las medidas descriptivas definidas en una
población. Los parámetros, denotados por letras griegas, vienen a ser
valores numéricos que generalmente se desconocen.
Media ( )
Varianza (2)
Proporción ( o P)
Desviación estándar ( )
Cultura Estadística para la Investigación 2014-I
2
3. Muestra aleatoria:
Viene a ser un subconjunto de elementos seleccionados de la población.
El objetivo es que esta sea representativa de la población.
El proceso de selección de la muestra de la población se denomina
muestreo.
El proceso que consiste en inferir resultados de la población aplicando la
información obtenida de la muestra inferencia estadística.
La confiabilidad de las inferencias concernientes a una población
depende si las muestras se han escogido apropiadamente de manera
que represente a la población.
Se utilizan diversas técnicas de muestreo para que las muestras
obtenidas de una población sean representativas y confiables.
4. Muestreo:
El propósito de la teoría de muestreo es hacer muestreo eficientemente,
es decir es el desarrollo de métodos de selección de muestras y métodos
de estimación de parámetros que proporcionen estimadores lo
suficientemente precisos al menor costo.
De esta forma el muestreo es definido como un proceso científico que
permite describir aspectos de un grupo de objetos sobre la base de la
información recolectada de un subgrupo de ellos, de modo que brinde un
nivel de confiabilidad aceptable y compatible con los objetivos del estudio
y con los recursos técnicos y económicos posibles.
a) Ventajas del muestreo:
Menor costo:
Debido a que los datos se obtienen de una pequeña muestra
fracción de la población total y por tanto los gastos incurridos serán
menores que aquellos que se esperarían cuando se lleva a cabo un
estudio global (Censo).
Mayor rapidez:
Fundamentalmente por la menor cantidad de información que se
tiene por procesar.
Cultura Estadística para la Investigación 2014-I
3
Mayor exactitud:
Por la mejor capacitación del personal, la mejor supervisión del
trabajo de campo y el mejor control de calidad en los resultados.
Mayor alcance:
Porque su uso es factible aun en situaciones de las que requiera de
personal altamente especializado para recolectar información.
b) Conceptos básicos de muestreo
Unidad de información:
Es el elemento individual de la población de la que se va a
recolectar los datos deseados. En el caso de encuestas por
muestreo, por lo general se llena un cuestionario para cada unidad
de información.
Unidad de muestreo:
Viene a ser el resultante de la división de una población en estudio
y que puede ser correctamente identificado durante el proceso de
selección. Es decir que la unidad de muestreo es cada unidad de
la población que puede ser elegida aleatoriamente para formar
una muestra.
Marco de muestreo:
Es la lista de todas las unidades de muestreo que conforman una
población.
Población en estudio:
Es la población que realmente de muestrea y es definida por el
marco de muestreo que se usa.
Población objetivo:
Es la población que sería deseable estudiar si se dispone de todas
las facilidades financieras, técnicas y prácticas.
Error de cobertura:
Se presenta cuando se tiene unidades de información omitidas en
un marco de muestreo.
Error de respuesta:
Cultura Estadística para la Investigación 2014-I
4
Se presenta cuando los datos correspondientes a una unidad de
información no son exactos.
c) Etapas de una encuesta por muestreo:
La diferencia entre la teoría de encuestas por muestreo y la teoría de
muestreo clásica es que las poblaciones investigadas por encuestas
por muestreo tienen un número finito de unidad. En la práctica, esta
diferencia rara vez es importante y los resultados de muestreos de
poblaciones infinitas pueden ser aplicados en poblaciones finitas.
Las principales etapas vienen son:
Determinación de los objetivos de la encuesta
Se debe tener en cuenta los siguientes aspectos:
- Las definiciones y los conceptos a estudiar
- El plan de tabulación requerido de la información básica
- La coordinación permanente con el grupo de usuarios de la
información resultante
Determinación de la población bajo muestreo
En esta etapa se debe definir con claridad la población sobre el
cual se desea hacer inferencia. Los aspectos a tener en cuenta
son:
- La determinación del alcance y la cobertura del estudio
sobre la base de los objetivos planteados.
- La determinación de la población objetivo sobre la cual se
hará inferencias.
- La determinación de la población a ser muestreada.
Datos que deben ser recopilados
En esta etapa se debe verificar que todo los datos que se deben
obtener sean relevantes para los propósitos de la encuesta, para
lo cual se debe analizar:
- El diseño del cuestionario para la encuesta
Cultura Estadística para la Investigación 2014-I
5
- La introducción de preguntas de control y verificación.
Se debe tener en cuenta que un cuestionario demasiado largo
baja la calidad de las respuestas, debido a que el error de
entrevistado tiende a aumentar.
Nivel de precisión deseado
Los resultados de encuestas por muestreo siempre están sujetos a
cierta incertidumbre debido a que se investiga solo una parte de la
población y a causa de los errores de medición. Esta
incertidumbre puede ser reducida si se toma en cuenta:
- La coordinación con el grupo de usuarios
- La determinación del nivel de precisión deseado para cada
uno de los parámetros relevantes que se va a estimar
- El hacer compatible el nivel de precisión deseado con los
recursos disponibles
- La recopilación de experiencias anteriores y similares con el
propósito de capturar información complementaria
- La determinación del tamaño de la muestra adecuado para
alcanzar el nivel de precisión deseado
Métodos de medición
En esta etapa se debe escoger el método de medición e
inspección de la población, para lo cual se debe tener en cuenta lo
siguiente:
- La elaboración de las instrucciones sobre el formulario con
el objetivo de homogenizar la forma de captura de la
información.
- La determinación de las unidades de medida
- El establecimiento de la mecánica de control de respuestas,
para contrarrestar el efecto del entrevistador y de la
persona que da la respuesta.
Cultura Estadística para la Investigación 2014-I
6
Marco de muestreo
En esta parte se divide a la población en partes llamadas,
unidades de muestreo, de las cuales deben cubrir la totalidad de la
población y no deben sobreponerse; es decir todo elemento de la
población debe pertenecer a una sola unidad de muestreo, en esta
etapa se debe tener en cuenta lo siguiente:
- La definición de la unidad de muestreo
- La identificación de la unidad informante.
- La definición de la unidad estadística, para lo cual se
recoge la información.
- La construcción del marco de muestreo, es decir la
elaboración de un directorio de todas las unidades de
muestreo.
- El control de calidad del marco (inexistencia de duplicidad u
omisión).
Selección de la muestra
Aspectos a considerar:
- Determinación definitiva del tamaño de la muestra
- La determinación de la muestra de acuerdo con el método
de muestreo elegido como el más adecuado para el
desarrollo de la investigación y según los criterios de
representatividad de la población y el costo resultante de
acuerdo a los recursos.
Encuesta piloto
En esta etapa:
- Se debe levantar una encuesta experimental, en pequeña
escala con la finalidad de probar el instrumento, sus
instrucciones y la mecánica de trabajo de campo.
- Se debe determinar las medidas correctivas necesarias.
Cultura Estadística para la Investigación 2014-I
7
Organización del trabajo de campo
En esta etapa se tiene en cuenta lo siguiente:
- Capacitación y orientación de la persona responsable del
recojo de información
- Asignación de responsabilidad funciones
- Distribución de material de ubicación de las unidades de
muestreo.
- Plan de supervisión
- Aplicación de mecánica de recojo de información
Resumen y análisis de información
- Realizar el consolidado del material de recolección de
información
- Realizar la codificación de la información y corregir los
errores.
- Procesar la información de campo, según el plan de
tabulación.
- Analizar la información y presentación del informe final.
d) Principales métodos de selección de muestra
d.1. Muestreo Probabilístico
Cuando se obtiene una muestra probabilística, uno de los puntos más
importantes es el procedimiento de selección que se utiliza, ya que la
forma y las características de los estimadores dependerán del
procesamiento de selección.
Los principales métodos de selección de una muestra de tamaño n de
una población N son:
1. Muestreo aleatorio simple:
Es la forma más común de obtener una muestra en la selección
al azar, es decir, cada uno de los individuos de una población
tiene la misma posibilidad de ser elegido. Si no se cumple este
requisito, se dice que la muestra es viciada. Para tener la
Cultura Estadística para la Investigación 2014-I
8
seguridad de que la muestra aleatoria no es viciada, debe
emplearse para su constitución una tabla de números aleatorios.
Es el método de muestreo que asegura que cada una de las
unidades de análisis tiene igual probabilidad de ser incluidos en la
muestra.
Procedimiento:
Elabore el marco de muestreo.
Determine el tamaño de la muestra
Seleccione “n” números aleatorios de la tabla de números
aleatorios.
Recopile la información de cada una de las unidades de
análisis seleccionadas.
Ejemplo 1:
Se tiene una población de 200 personas, determinar si se
trabaja con toda la población o muestra; y si se trabaja con
una muestra determinar el tamaño y escoger la muestra.
2. Muestreo Aleatorio Sistemático:
Es una técnica de muestreo que requiere de una selección
aleatoria inicial de observaciones seguida de otra selección
de observaciones obtenida usando algún sistema o regla.
El método sistemático comprende a la selección aleatoria de una
unidad de muestreo inicial, a partir de la cual, las restantes
unidades quedan sistemáticamente seleccionadas de acuerdo al
lugar que ocupa en la población.
Procedimiento:
Elabore el marco de muestreo.
Determine el tamaño de la muestra
Hallar el intervalo de selección sistemática n
Nk
Cultura Estadística para la Investigación 2014-I
9
Se elige un número aleatorio “i”, k) i (1
Posteriormente la muestra estará dado de la siguiente manera:
,...,,,,, 5432 kikikikikiiyyyyyy
Ejemplo 2:
Se tiene una población de 400 personas, determinar si se trabaja
con toda la población o muestra; y si se trabaja con una muestra
determinar el tamaño escoger la muestra por muestro aleatorio
sistemático
.
3. Muestreo Aleatorio Estratificado:
Una muestra es estratificada cuando los elementos de la
muestra son proporcionales a su presencia en la población. La
presencia de un elemento en un estrato excluye su presencia en
otro. Para este tipo de muestreo, se divide a la población en
varios grupos o estratos con el fin de dar representatividad a
los distintos factores que integran el universo de estudio. Para la
selección de los elementos o unidades representantes, se utiliza
el método de muestreo aleatorio.
En síntesis, requiere de separar a la población según grupos
llamados estratos, y de elegir después una muestra aleatoria
simple en cada estrato. La información de las muestras aleatorias
simples de cada estrato constituiría entonces una muestra global.
El procedimiento consiste en dividir a la población en estratos.
Dentro de cada estrato los elementos deben ser los más
homogéneos posibles con respecto a las características de la
variable en estudio.
Procedimiento:
Elabore el marco de muestreo.
Determine el tamaño de la muestra “n”.
Se clasifica la población en “L” estratos.
El tamaño de muestra “n” lo dividimos en “L” muestras n1, n2,
n3, ….., nL
Cultura Estadística para la Investigación 2014-I
10
Seleccionamos sub muestras de cada estrato.
Ejemplo 3
Para realizar un control de calidad para determinar en qué estado
viene la caña se realiza un muestreo aleatorio simple, puesto que
la caña puede provenir de tres tipos de proveedores.
Proveedor tipo A (estrato 1) la caña proviene de lotes de la
misma finca.
Proveedor tipo B (estrato 2) la caña proviene de fincas de
particulares en donde el ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la caña proviene de fincas de
particulares en donde el ingenio no ha tenido ningún
servicio
DATOS:
ESTRATO Ni
1 560
2 190
3 250
4. Muestreo Aleatorio por Área o Conglomerado:
Requiere de elegir una muestra aleatoria simple de unidades
heterogéneas entre sí de la población llamadas conglomerados.
Cada elemento de la población pertenece exactamente a un
conglomerado, y los elementos dentro de cada conglomerado
son usualmente heterogéneos o disímiles.
Ejemplo 4:
En el muestreo por conglomerados, éstos se forman para
representar, tan fielmente como sea posible, a toda la población;
entonces se usa una muestra aleatoria simple de conglomerados
para estudiarla. Los estudios de instituciones sociales como
iglesias, hospitales, escuelas y prisiones se realizan,
generalmente, con base en el muestreo por conglomerados.
Cultura Estadística para la Investigación 2014-I
11
El procedimiento consiste en hacer una selección de grupos o
conglomerados, que son agrupaciones de elementos que deben
ser los más heterogéneos posibles, pero homogéneos entre sí. La
muestra general está formado por todas o por una sub muestra de
la unidades en cada conglomerado.
A este muestreo también se le denomina Muestreo Unietápico de
Conglomerados
Procedimiento:
Elabore el marco de muestreo.
Determine el tamaño de la muestra “n”.
Se divide el área total (población) en áreas más pequeñas
(subdivisiones)
Se selecciona al azar algunas de estas subdivisiones.
Finalmente mediante un muestreo adecuado se
selecciona el tamaño de muestra de las subdivisiones
elegidas
Ejemplo 5:
Para un estudio que se realiza en un AA.HH el cual está formado
por 20 manzanas escoger una muestra mediante muestreo
aleatorio simple.
NUMERO MANZANA
NUMERO DE LOTE
NUMERO MANZANA
NUMERO DE LOTE
NUMERO MANZANA
NUMERO DE LOTE
NUMERO MANZANA
NUMERO DE LOTE
1 20 6 10 11 25 16 20
2 25 7 25 12 20 17 20
3 30 8 20 13 30 18 25
4 10 9 30 14 10 19 30
5 15 10 40 15 15 20 10
d.2. Muestreo no Probabilístico
A veces, para estudios exploratorios, el muestreo probabilístico
resulta excesivamente costoso y se acude a métodos no
probabilísticos, aun siendo conscientes de que no sirven para
realizar generalizaciones (estimaciones inferenciales sobre la
Cultura Estadística para la Investigación 2014-I
12
población), pues no se tiene certeza de que la muestra extraída
sea representativa, ya que no todos los sujetos de la población
tienen la misma probabilidad de ser elegidos. En general se
seleccionan a los sujetos siguiendo determinados criterios
procurando, en la medida de lo posible, que la muestra sea
representativa.
Entre los métodos de muestreo no probabilísticos más utilizados
en investigación encontramos:
1. Muestreo por cuotas:
También denominado en ocasiones "accidental". Se asienta
generalmente sobre la base de un buen conocimiento de los
estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la investigación.
Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en
un número de individuos que reúnen unas determinadas
condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo
femenino y residentes en el distrito de San Borja. Una vez
determinada la cuota se eligen los primeros que se encuentren
que cumplan esas características. Este método se utiliza mucho
en las encuestas de opinión.
2. Muestreo intencional o de conveniencia:
Este tipo de muestreo se caracteriza por un esfuerzo deliberado
de obtener muestras "representativas" mediante la inclusión en la
muestra de grupos supuestamente típicos. Es muy frecuente su
utilización en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto.
Cultura Estadística para la Investigación 2014-I
13
También puede ser que el investigador seleccione directa e
intencionadamente los individuos de la población. El caso más
frecuente de este procedimiento es utilizar como muestra los
individuos a los que se tiene fácil acceso (por ejemplo profesores
de universidades que emplean con mucha frecuencia a sus
propios alumnos).
3. Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y
estos a otros, y así hasta conseguir una muestra suficiente. Este
tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones "marginales", delincuentes, sectas, determinados
tipos de enfermos, etc.
4. Muestreo Discrecional ·
A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.
II. Fórmulas para determinar el tamaño de muestra
Para población finita cuando se quiere estimar la proporción
NZ 2
P(1 − P)
n =
(N − 1)E 2 + Z
2 P(1 − P)
Para población finita cuando se quiere estimar la media
NZ 2σ
2
n =
(N − 1)E 2
+ Z 2σ
2
Para población infinita cuando se quiere estimar la proporción
P(1 − P)Z 2
n = E 2
Para población infinita cuando se quiere estimar la media
σ 2Z 2
n = E 2