CAPÍTULO II. TEORÍA DE MUESTREO
II.1 Muestreo
Actualmente el muestreo puede ser considerado como un instrumento organizado para
obtener hechos. Permite que se tomen decisiones que toman en cuenta factores de
importancia de los problemas que se desean resolver, además de ocuparse de la adecuada
presentación de los hechos individuales registrados y de la manera en que éstos se
recopilan y resumen.
Algunas de las ventajas que se presentan, si se piensa en realizar una muestra, son
mencionadas a continuación:
Costo reducido. Si los datos obtenidos provienen de una pequeña fracción de la población,
los gastos asociados a su recopilación serán mucho menores que si se intenta realizar un
censo. Cuando se trata con poblaciones grandes, resultados precisos pueden obtenerse de
muestras que solamente representan una pequeña fracción de la población.
Mayor rapidez. Como consecuencia de lo anterior, los datos pueden recolectarse y
resumirse rápidamente con una muestra, siendo esto de vital importancia cuando se
requiere la información con urgencia.
Mayor alcance. Para la realización de algunos tipos de encuestas se cuenta con personal y
recursos limitados. Lo anterior conlleva a que la realización de un censo sea algo
impráctico, y por tanto se tiene mayor flexibilidad respecto a la información que se puede
llegar a obtener.
Mayor exactitud. Dado que se reduce el volumen de trabajo en gran medida, se puede
utilizar personal más capacitado y someterlo a entrenamiento intensivo, con el fin de tener
una supervisión cuidadosa del trabajo de campo y procesamiento de los resultados.
En el diseño de una muestra hay que considerar dos aspectos; inicialmente un proceso de
selección, en la que se incluyen en la muestra algunos elementos de la población; y
posteriormente un proceso de estimación, en el que se llevan a cabos los cálculos de las
estadísticas de la muestra, que son estimadores muestrales de valores de la población.
El diseño de una muestra considera las tareas de selección y estimación para realizar
inferencias que vayan del valor muestral al valor de la población. Un valor de la población
es una expresión numérica que sintetiza los valores de una o varias características de la
totalidad de la población; en otras palabras, una medida resumen de una cualidad de la
distribución de la variable o variables en la población definida.
El valor de la muestra, o estadística, es una estimación que se calcula a partir de los
elementos que conforman la muestra. Por el contrario, el valor de la población depende de
todos los elementos que forman parte de la población.
Una de las desventajas al utilizar el muestreo, es que dentro de los valores muestrales que
se pueden obtener, es posible llegar a toparse con algunas deficiencias resultado de una
designación de solo una fracción de la población total a ser observada en la muestra, sin
embargo, al realizar un buen diseño de muestra, se tiene como consecuencia que estos
errores tengan la menor presencia posible.
Dentro del muestreo se pueden distinguir varias formas.
1. Muestras casuales o fortuitas, en las cuales se sacan conclusiones solamente de
elementos que llegan por casualidad.
2. Selección experta, que se considera como un tipo de muestro no aleatorio, ya que
personas consideradas como expertas se encargan de escoger unidades que
consideran típicas o representativas.
3. Muestreo de cuota que es aquel en el que de acuerdo a algunas variables
demográficas, se construye una muestra relativamente proporcional a la población.
4. Muestreo de poblaciones móviles. En el que la población total es estimada de la
proporción de individuos en la recaptura, que han sido capturados de manera previa
y fueron marcados.
En los tipos de muestreo anteriores, se llevan a cabo varias suposiciones acerca de las
distribuciones de las variables de encuesta en la población. En un sentido contrario, en los
casos de muestreo probabilístico, se pueden llevar a cabo inferencias de la población por
medio de métodos estadísticos, sin tener que hacer suposiciones acerca de ella. En este
último, cada uno de los elementos de la población tiene una probabilidad conocida además
de no nula, de ser seleccionado. El valor de tal probabilidad se determina de acuerdo al
diseño de la muestra.
Las muestras probabilísticas en general son diseñadas para ser medibles, es decir, la
inferencia estadística de los valores de la población, resultado de la ejecución de un
muestreo en una población particular, pueda basarse en medidas de variabilidad.
El muestreo aleatorio simple es el proceso de selección básico y los demás procedimientos
de selección de muestras pueden considerarse como modificaciones de él.
1. Mesip, es un método de selección con igual probabilidad para todos los elementos
de la población.
2. Muestreo de elementos, en este tipo los elementos son también las únicas unidades
de muestreo.
3. La estratificación, se refiere a la selección de la muestra a partir de varias
subpoblaciones conocidas como estratos, en los que se ha divido la población.
4. La selección sistemática, se puede considerar como una alternativa de selección
aleatoria, en este caso se seleccionan las unidades de muestreo en secuencias
separadas en lista usando un intervalo de selección.
5. Muestreo en dos fases, en este caso se subselecciona la muestra final a partir de una
muestra preseleccionada más grande, que contiene información que permite
mejorar la selección final.
Un buen diseño de muestra, requiere se equilibren en la medida de lo posible 4 criterios:
a. Orientación hacía la meta. El diseño completo, tanto al momento de realizar la
selección como la estimación, debe estar orientado a los objetivos de la
investigación. Estas consideraciones deben figurar al momento de seleccionar y
definir a la población, en la medición y procedimientos de muestreo.
b. La medibilidad es una característica que permite calcular, a partir de la información
de la muestra, estimaciones válidas o aproximaciones de su variabilidad de
muestreo. Esta es la base necesaria para que se pueda llevar a cabo inferencia
estadística, y sirve como puente entre el resultado de la muestra, y el valor
desconocido de la población.
c. Practicidad, que se refiere a los problemas que deben ser resueltos para poder llevar
a cabo el diseño como se propuso de manera inicial. La simplicidad siempre debe
encontrarse entre los objetivos, ya que se reduce el riesgo de errores, y se compensa
en gran medida la pérdida de un poco de eficiencia teórica. El arte del muestreo
consiste en llevar a cabo un diseño práctico que se comporte de la mejor manera
posible, aún cuando no sea perfecto, y se adapte a un modelo.
d. Economía, que se refiere a cumplir los objetivos con un costo mínimo. Una muestra
será demasiado pequeña si los resultados que ofrece carecen de precisión suficiente
para contribuir a las decisiones. Por otro lado, una muestra será demasiado grande
si sus resultados son más precisos de lo que se requiere. Es necesario mediar estas
dos situaciones considerando el costo en el que se incurre al realizar el muestreo.
En general estos cuatro criterios suelen estar en conflicto, sin embargo, se deben equilibrar
y combinar para conseguir un buen diseño de muestreo.
A continuación se exponen características deseables de una muestra, que sin embargo no
son por sí mismos necesarios y suficientes para tener una buena muestra.
- Las muestras probabilísticas requieren de probabilidades no nulas y que sean conocidas.
- Las muestras medibles son muestras probabilísticas, diseñadas para permitir estimar la
variabilidad de muestreo.
- Los muestreos mesip, que son clases especiales de muestreo probabilístico, requieren
probabilidades iguales para cada uno de los elementos.
- Los muestreos de área usan segmentos de área como unidades de muestreo.
- Las muestras insesgadas denotan a aquellos diseños en los que el valor esperado es igual
al valor de la población.
- Las muestras precisas son aquellas que tienen errores estándar bajos.
- Las muestras económicas tienen costos unitarios bajos para una varianza fija.
- Las muestras eficientes denotan una precisión alta, es decir, baja varianza por elemento.
II.2 Muestreo Aleatorio Estratificado
II.2.1 Descripción.
En el muestreo estratificado a la población que consta de N unidades se le divide de
manera primaria en subpoblaciones con N1, N2,…, NL unidades respectivamente. Estas
poblaciones no deben contener ningún traslape, es decir, sus elementos deben ser
excluyentes, y al reunirlas deben comprender la totalidad de la población, de tal manera
que:
NNNN L =+++ ...21
A cada una de estas subpoblaciones se le denominará estrato. Para lograr el beneficio total
derivado de la estratificación, los valores de las Nh deben ser conocidos. Cuando los
estratos han sido determinados, se selecciona una muestra de cada uno de ellos, siendo esta
selección independiente en cada uno de los diferentes estratos. El tamaño de las muestras
en cada uno de los estratos se denota por n1, n2,…,nL, respectivamente.
En caso de que se haya tomado una muestra aleatoria simple en cada uno de los estratos, a
todo el procedimiento se le designará con el nombre de muestreo aleatorio estratificado.
De la muestra que se obtenga en cada uno de los estratos, se calcula la media
correspondiente, o cualquier otra estadística, y ésta se pondera apropiadamente para
obtener una estimación combinada del total de la población. Del mismo modo, se calculan
las varianzas dentro del estrato, son ponderadas adecuadamente y se suman para llegar a
una estimación combinada para la población.
La estratificación es una técnica empleada comúnmente, debido a razones diversas entre
las que encontramos:
⇒ Existencia de una gran conveniencia administrativa, ya que si se cuenta con
diversas oficinas de campo, se pueden supervisar varias encuestas en distintas
partes de la población.
⇒ Presencia de problemas de muestreo que no son homogéneos para todas las partes
de la población, por lo que al dividirla es posible conseguir estratos que compartan
características similares, lo cual es una característica deseable al realizar la
estratificación.
⇒ Se puede llegar a producir una ganancia en precisión para algunas características
que se quieran conocer de la población. Es posible llegar a dividir una población
heterogénea en subpoblaciones que sean homogéneas internamente. Si cada uno de
los estratos es homogéneo, en el hecho de que las medidas de la población varíen
muy poco de una unidad a otra, se puede obtener un cálculo preciso de la media de
cualquier estrato de una pequeña muestra de éste. Estos cálculos pueden entonces
combinarse para obtener una estimación precisa del total de la población.
⇒ La estratificación es utilizada para reducir las varianzas de las estimaciones de la
muestra; las cuales van disminuyendo de acuerdo al grado en que las medias de los
estratos difieran entre ellas y a la homogeneidad que exista dentro de ellos.
⇒ Dentro de los diferentes estratos, se pueden utilizar diferentes métodos y
procedimientos.
a. Si la distribución física de algunas porciones de la población difiere
radicalmente, puede resultar beneficioso realizar procedimientos diferentes
a las partes.
b. Puede existir contraste en las listas disponibles para diversos sectores de la
población.
c. La existencia de naturaleza diversa en los elementos en algunas partes de la
población podría requerir la utilización de procedimientos distintos.
⇒ Los estratos pueden construirse por que las subpoblaciones dentro de ellos mismos
también se consideran como dominios de estudio. Donde un dominio se define
como una parte de la población para la cual se planean estimaciones separadas en el
diseño de la muestra.
La teoría del muestreo estratificado se relaciona con las propiedades de las estimaciones de
una muestra estratificada y con la mejor opción del tamaño de la muestra nh para obtener la
máxima precisión posible.
II.2.2 Notación
El sufijo h denota el estrato e i la unidad dentro del estrato.
Nh Número total de unidades en el estrato h
nh Número de unidades en la muestra del estrato h
yhi Valor de la i-ésima unidad
Wh=Nh/N Peso del estrato h
fh=nh/Nh Fracción de muestreo en el estrato h
h
N
ihi
hN
yY
h
∑== 1
_ Media poblacional
h
n
ihi
h n
yy
h
∑== 1
_ Media muestral
( )
11
2
2
−
−=∑=
h
N
ihhi
h N
Yys
h
Varianza poblacional
2)1()( Sn
fyV −= Varianza de la media en m.a.s.
II.2.3 Propiedades de los estimadores
Para obtener la media global, el estimador utilizado en muestreo estratificado es sty ,
donde:
L
L
hhh
L
hhh
st
NNNNdonde
yWN
yNy
+++=
== ∑∑
=
=
...21
1
1 (2.1)
El estimador sty en general no es el mismo para la media muestral. Esta media
muestral, y , puede escribirse:
n
yny
L
hhh∑
== 1 (2.2)
Es evidente que y coincide con sty , dado que en cualquier estrato se cumpla con lo
siguiente:
ffóNn
Nn
óNN
nn
hh
hhh ===
Lo cual implica que la fracción de muestreo sea la misma en cualquiera de los estratos.
Este tipo de estratificación se conoce como estratificación con asignación proporcional de
nh.
A continuación se describen las propiedades principales del estimador sty en los siguientes
teoremas:
Teorema 1. Si en cada estrato el estimador muestral hy es insesgado, entonces sty es un
estimador insesgado de la media poblacional _Y .
Demostración:
( ) ∑∑==
=⎟⎠
⎞⎜⎝
⎛=
L
hhh
L
hhhst YWyWEyE
11
debido a que los estimadores son insesgados en los estratos individuales. La media
poblacional puede escribirse:
∑∑∑∑
=
== = ===L
hhh
L
hhh
L
h
N
ihi
YWN
YN
N
yY
h
1
11 1
Lo cual completa la demostración.
Teorema 2. Si las muestras se obtienen de manera independiente en los diferentes estratos:
∑=
=L
hhhst yVWyV
1
2 )()( (2.3)
donde )( hyV es la varianza de hy sobre muestras repetidas del estrato h.
Demostración:
∑=
=L
hhhst yWy
1 (2.4)
sty es una función lineal de hy con sus respectivos pesos hW . Por tanto es posible
expresar el resultado estadístico para la varianza mediante la función lineal:
∑ ∑∑= = >
+=L
h
L
h
L
hjjhjhhhst yyCovWWyVWyV
1 1
2 )(2)()( (2.5)
Sin embargo, debido a que las muestras entre estratos se eligieron de manera
independiente, los términos de covarianza desaparecen. Lo cual da como resultado la
ecuación (2.3).
Lo importante acerca de estos resultados es que la varianza de sty depende solo de las
varianzas de los estimadores de las medias de los estratos individuales hY . Si fuera posible
fraccionar una población altamente variable en estratos tales que todos los elementos
tengan el mismo valor dentro del estrato, sería posible estimar Y sin error alguno. La
ecuación (2.4) muestra que el uso del peso correcto del estrato Nh/N al estimar sty
permite alcanzar este propósito.
Teorema 3. Para muestreo aleatorio estratificado, la varianza del estimador sty es:
∑ ∑= =
−=−=L
h
L
hh
h
hh
h
hhhhst f
nSW
nSnNN
NyV
1 1
22
2
2 )1()(1)( (2.6)
Demostración. Debido a que hy es un estimador insesgado de hY , el teorema (2.2) puede
aplicarse. Además aplicado a un estrato individual:
h
hh
h
hh N
nNnS
yV−
=2
)(
Por sustitución en el resultado del teorema 2, se obtiene:
∑ ∑ ∑= =
−=−==L
h
L
hh
h
hh
h
hhhhhhst f
nS
WnS
nNNN
yVNN
yV1 1
22
2
22
2 )1()(1)(1)(
Algunos casos particulares para esta fórmula se exponen en los siguientes corolarios.
Corolario 1. Si las fracciones de muestro nh/Nh son insignificantes para todos los estratos,
∑ ∑==h
hh
h
hhst n
SWn
SNN
yV2222
2
1)( (2.7)
Corolario 2. En el caso de asignación proporcional, se hace la siguiente sustitución en 2.6:
NnN
n hh =
Reduciéndose la varianza a:
∑ ∑−=⎟
⎠⎞
⎜⎝⎛ −
= 22 1)( hhhh
st SWn
fN
nNn
SNN
yV (2.8)
Corolario 3. Si el muestreo es proporcional y las varianzas en todos los estratos tienen el
mismo valor, Sw2, se obtiene el resultado siguiente:
⎟⎠⎞
⎜⎝⎛ −
=N
nNn
SyV w
st
2
)( (2.9)
Teorema 4. Si stY = styN es el estimador de la población total Y, entonces:
∑ −=h
hhhhst n
SnNNYV
2
)()ˆ( (2.10)
Lo cual se demuestra fácilmente utilizando el teorema 3.
Si en cada uno de los estratos se toma una muestra simple aleatoria, un estimador
insesgado de 2hS es:
( )∑=
−−
=hn
ihhi
hh yy
nS
1
22
11 (2.11)
Lo que nos lleva al siguiente teorema.
Teorema 5. Con muestreo aleatorio estratificado, un estimador insesgado de la varianza es
∑=
−==L
h h
hhhhstst n
snNN
Nysyv
1
2
22 )(1)()( (2.12)
Con la siguiente alternativa para propósitos de cálculo:
∑ ∑= =
−=L
h
L
h
hh
h
hhst N
sWn
sWys
1 1
2222 )( (2.13)
II.2.4 Asignación óptima
En muestreo estratificado la selección de tamaños de muestra nh en el estrato respectivo h,
puede llevarse a cabo para minimizar )( styV con un costo específico ó para minimizar el
costo con un valor específico de )( styV .
Considerando la función de costo más simple
∑+== hhncCCto 0cos (2.14)
Entre estratos el costo es proporcional al tamaño de la muestra, sin embargo, el costo por
unidad ch puede variar entre estratos. El término c0 representa un costo fijo. Esta función de
costo resulta apropiada en los casos en que los costos de observar cada unidad en el estrato
respectivo tienen el mayor peso.
Teorema 6. Si consideramos la función de costo anterior, la varianza de la media estimada
sty es mínima para un costo C, y el costo es mínimo para una varianza V( sty )
determinada, cuando nh es proporcional a hhh cSW / .
Demostración. Teniendo lo siguiente:
∑=
+=L
hhhnccC
10 (2.15)
∑ ∑ ∑= = =
−=−==L
h
L
h
L
h h
hh
h
hhh
h
hhst N
SWn
SWf
nSW
yVV1 1 1
222222
)1()( (2.16)
Los problemas a resolver son escoger nh para minimizar V con un determinado costo, y
posteriormente escoger nh tal que se minimice el costo con un valor determinado de V.
Ambos problemas resultan equivalentes a minimizar el producto
( ) ( )∑∑∑ ⎟⎟⎠
⎞⎜⎜⎝
⎛=−⎟⎟
⎠
⎞⎜⎜⎝
⎛+= hh
h
hh
h
hh ncn
SWcC
NSW
VCV22
0
22
'' (2.17)
Lo anterior puede minimizarse usando la desigualdad de Cauchy-Schwarz. Si ah, bh son
conjuntos de números positivos:
( )( ) ( ) ∑∑∑∑∑>
−=−i ij
ijjihhhh babababa 2222 )( (2.18)
Con la expresión anterior, la siguiente desigualdad es posible:
( )( ) ( )222 ∑∑∑ ≥ hhhh baba (2.19)
sucediendo la igualdad si y solo si bh/ah es constante para toda h. En el caso presente se
considera
hhhhhhhhh
hhh cSWbancb
nSW
a === ,,
haciendo uso de la desigualdad (2.19)
( ) ( )( ) ( )22222
)'' ∑∑∑∑∑ ≥=⎟⎟⎠
⎞⎜⎜⎝
⎛= hhhhhhh
h
hh cSWbancn
SWCV
por lo tanto, el valor de nh que hace V’C’ mas pequeño es ( )2∑ hhh cSW . Ocurriendo un
mínimo cuando
hh
hh
h
h
SWcn
ab
= = k (2.20)
En términos del tamaño total de la muestra nh en el estrato, se tiene
∑∑==
)/(/
)/(/
hhh
hhh
hhh
hhhh
cSNcSN
cSWcSW
nn
(2.21)
Para completar la asignación es necesario obtener el valor de n. La solución dependerá si
se escogerá la muestra para obtener un costo determinado total C ó para obtener una
varianza determinada V para sty . En el caso de un costo fijo, se sustituyen los valores
óptimos de nh en la función de costo y se obtiene n.
( ))(
)/(
∑∑−
=hhh
hhho
cSN
cSNcCn (2.22)
Para el caso de V fija, sustituimos el valor óptimo de nh en la fórmula para )( styV .
( )∑∑∑
+= 2)/1(
/
hh
hhhhhh
SWNVcSWcSW
n (2.23)
El caso especial en el que ch = c conlleva a lo siguiente
∑∑==
hh
hh
hh
hhh SN
SNn
SWSW
nn (2.24)
El resultado anterior, en general es conocido como asignación de Neyman. Al sustituir el
valor de nh en la fórmula general para )( styV
( )N
SWn
SWyV hhhh
st∑∑ −=
22
min )( (2.25)
II.2.5 Precisión relativa de muestreo aleatorio estratificado y muestreo aleatorio
simple
Realizada de manera adecuada la estratificación puede traer como resultado una menor
varianza para la media estimada o total que la proporcionada con una muestra aleatoria
simple. Sin embargo si los valores de nh se encuentran lejos de los óptimos, la
estratificación puede tener como resultado una varianza mayor.
A continuación se describe la manera en que se obtiene ganancia por medio de la
estratificación, en comparación con el muestreo aleatorio simple.
nSfVmas
2
)1( −= (2.26)
NSW
nSW
SWn
fV hhhhhhprop
∑∑∑ −=−
=22
2)1( (2.27)
NSW
nSW
V hhhhopt
∑∑ −=22)(
(2.28)
De la identidad algebraica estándar para el análisis de varianza de una población
estratificada, se tiene
0/1)()1(
)()(
)()(
)()1(
22
22
22
22
→−+−=
−+−=
−+−=
=−=−
∑∑
∑∑∑
∑ ∑∑∑
∑∑
hh
hhh
hh
hhh
h ihhi
h h ih
ihhi
h ihi
NsiYYNSN
YYNYy
YYYy
YySN
∑∑ −+= 222 )( YYWSWS hhhh (2.29)
Por lo tanto
∑
∑∑
−−
+=
−−
+−
=−=
2
222
)()1(
)()1()1()1(
YYWn
fV
YYWn
fSWn
fn
SfV
hhprop
hhhhmas
(2.30)
Por definición de Vopt, se debe tener Vprop ≥ Vopt. De las expresiones (2.27) y (2.28)
tenemos el siguiente resultado
( )( )( )∑
∑∑
−=
−=−
2
22
)(1
1
SSWn
SWSWn
VV
hh
hhhhoptprop
(2.31)
donde ∑= hh SWS es una media ponderada de las Sh.
Lo anterior se puede ver en el desarrollo siguiente
22222
22
222
2
2
)2()(
SSWSSSW
WSSWSSW
SSSSWSSW
hhhh
hhhhh
hhhhh
−=+−=
+−=
+−=−
∑ ∑∑∑ ∑
∑∑
Al realizar algunas sustituciones
∑∑ −−
+−+= 22 )()1()(1 YYWn
fSSWn
VV hhhhoptmas (2.32)
Al analizar la ecuación anterior, se puede notar que hay dos componentes que reducen la
varianza cuando se cambia de muestreo aleatorio simple a asignación óptima. El primer
componente que la reduce, que es el término en la extrema derecha, se debe a la
eliminación de las diferencias de las medias de los estratos; la segunda, es decir, el término
medio, proviene de la eliminación del efecto de las diferencias entre las desviaciones
estándar de los estratos.
El desarrollo anterior lleva a lo siguiente cuando 1/Nh es despreciable
maspropopt VVV ≤≤
En caso que tal término no fuera despreciable, se obtendría
⎥⎦⎤
⎢⎣⎡ −−−
−−
+= ∑∑ 22 )(1)()1(
)1(hhhhpropmas SNN
NYYN
NnfVV (2.33)
Lo cual induce a pensar que en algunos casos la estratificación puede proporcionar una
varianza mayor que el muestro aleatorio simple cuando
∑∑ −<− 22 )(1)( hhhh SNNN
YYN
II.2.6 Ganancias en precisión gracias al uso de la estratificación
La variable ideal para realizar estratificación, es aquella que se va a medir en la encuesta
correspondiente. Si fuera posible hacer esto, no habría traslape entre estratos, y la varianza
dentro del estrato sería menor que la varianza global.
Prácticamente lo anterior no es posible, sin embargo, cumpliéndose las condiciones
siguientes, se puede tratar de conseguir tal situación
1. La población conste de conjuntos que varíen considerablemente en tamaño.
2. Las variables que se intentan conocer estén altamente relacionadas con el tamaño
de tales conjuntos.
3. Se cuente con una buena medida de los tamaños de los distintos estratos.
La estratificación geográfica es muy común y generalmente va acompañada por un
incremento en la precisión por la existencia de muchos factores que hacen que las personas
vivan o se reúnan en un área común, mostrando similitudes en sus características
principales. Lo cual genera estratos con mayor uniformidad.
En lo que concierne a la estratificación proporcional respecto a la óptima, cuando se tienen
subpoblaciones con tamaños grandes y pequeños estratificadas por tamaño, el muestreo
proporcional resulta ineficiente, ya que en una subpoblación grande la varianza será mucho
mayor que en una pequeña. Por lo que utilizar una asignación óptima, generará mejores
estimaciones de los valores que se quieran conocer.
II.2.7 Construcción de estratos
Para los casos en que se deseen reducciones grandes en la varianza, se buscar formar
estratos en los que las unidades de muestreo sean lo más homogéneas posibles respecto a
las variables que se desean conocer. Este objetivo se cumple cuando la variación entre
unidades de muestreo dentro del estrato sea menor que la variación de la población total.
Sean y0, yL el valor menor y valor mayor de y en la población que se encuentra en estudio.
El problema a resolver, es encontrar los límites entre estratos y1, y2,…, yL-1 tales que
∑∑==
−⎟⎠
⎞⎜⎝
⎛=
L
hhh
L
hhhst SW
NSW
nyV
1
22
1
11)( (2.34)
se minimice. Si se ignora el segundo término, resulta suficiente minimizar ΣWhSh. Debido a
que yh solo aparece en la suma en los términos WhSh y Wh+1Sh+1,se tiene lo siguiente
( ) )()( 11. ++∂∂
+∂∂
=∂∂ ∑ hh
hhh
hhh
h
SWy
SWy
SWy
(2.35)
Si se tiene que f(y) es la función de frecuencia de y,
)(,)(1
hh
hy
yh yf
yW
dttfWh
h
=∂∂
= ∫−
(2.36)
Además
∫
∫∫
−
−
−
⎥⎥⎦
⎤
⎢⎢⎣
⎡
−=h
h
h
hh
h
y
y
y
yy
yhh
dttf
dtttf
dttftSW
1
1
1 )(
)(
)(
2
22 (2.37)
Al derivar lo anterior
)()(2)(2 222hhhhhhh
h
hhh
h
hh yfyfyyfy
yS
SWyW
S µµ +−=∂∂
+∂∂
donde hµ es la media de y en el estrato h. Sumándose a ambos lados 2hS f(yh) y
posteriormente al dividir entre 2Sh
h
hhhh
h
hh
h
hh
h
hh
SSy
yfyS
WyW
Sy
SW 22)()(
21)( +−
=∂∂
+∂∂
=∂
∂ µ
1
21
2111 )(
)(21)(
+
++++ +−−=
∂∂
h
hhhh
h
hh
SSy
yfy
SW µ (2.38)
Lo que deriva en las ecuaciones de cálculo para yh
1,,2,1)()(
1
21
21
22
−=+−
=+−
+
++ LhS
SyS
Sy
h
hhh
h
hhh Kµµ
(2.39)
No obstante, estas ecuaciones no son aplicables en la práctica, ya que hµ y 2hS dependen
de las fronteras. Por tanto, es necesario realizar una aproximación que permita conseguir
los resultados deseados. Sea
∫=y
y
dttfyZ0
)()( (2.40)
Si se consideran estratos numerosos y estrechos, f(y) debería ser aproximadamente
uniforme dentro de un estrato dado. Por lo que
)()( 1
1
−−== ∫−
hhh
y
yh yyfdttfW
h
h
&
)(121
1.−−= hhh yyS &
)()( 11
1
−− −==− ∫−
hhh
y
yhh yyfdttfZZ
h
h
&
Al sustituir las aproximaciones anteriores
∑∑∑=
−=
−=
−=−=L
hhh
L
hhhh
L
hhh ZZyyfSW
1
21
1
21
1)()(12 && (2.41)
Debido a que (ZL-Z0) es fija, resulta fácil verificar que la suma de la derecha se minimiza
al hacer (Zh-Zh-1) constante. Dado f(y), la regla consiste en computar el acumulado de √f(y)
y escoger yh de tal manera que se creen intervalos de amplitud similar en la escala del
acumulado de √f(y).
II.2.8 Cantidad de estratos
El concepto general de estratificación lleva a pensar que de una población dividida en k
estratos, siempre será posible mejorar la situación llevando a cabo más subdivisiones a los
estratos. De hecho, la estratificación puede llevarse al grado de tener un número de estratos
igual número de unidades que serán seleccionadas. Sin embargo, al sobrepasar un número
prudente de estratos, el aumentar su cantidad no resulta en una reducción considerable de
la varianza cuando la estratificación para cierta variable y se hace con respecto a otra
llamada x, como se demuestra a continuación de manera sencilla. Sea x una variable
uniforme de 0 a d, además y = x + e, donde e y x no tienen correlación alguna. Entonces
)()()( eVxVyV += . Supóngase el caso en el que se tienen k estratos con la misma
amplitud. Entonces
kNN
Wk
dS hhxh
112 2
22 ===
Si la asignación de la muestra es la misma, la varianza estimada de la media poblacional es
∑ +=n
Snk
dSWnk e
yhh
2222
12
Si el número de estratos aumentara a αk, la varianza relacionada con tal número será
nS
nkd e
2
2
2
2 121
+α
En este caso el primer componente disminuye al realizar un incremento en el número de
estratos, pero el segundo componente se mantiene constante. Debido a lo anterior, se
llegará a un punto en el que el segundo componente se convierte en parte importante de la
varianza y aunque haya incrementos en el número de estratos, no habrá ganancias
significativas en la varianza.
II.3 Estratificación con más de una Variable
Dado que la mejor asignación para una variable puede no ser la mejor para otra, se debe
llegar a un arreglo para encuestas con más de una variable. El primer paso consiste en
reducir las variables consideradas en la asignación a un número relativamente pequeño
donde se consideren las más importantes. En el caso de que existan buenos datos previos,
se puede calcular la asignación óptima de cada característica y ver en que punto existen
desviaciones grandes. Puede darse el caso de variables que se encuentren tan
correlacionadas, que las asignaciones no difieran en gran medida.