Upload
raul-huertas
View
222
Download
0
Embed Size (px)
Citation preview
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 1/20
Tema 6: Muestreo
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 2/20
• hemos mencionado que las poblaciones están formadas porindividuos, pero sería mejor denominarlas unidades demuestreo o unidades de estudio:
– Personas, clulas, familias, hospitales, países!
• "a poblaci#n ideal que se pretende estudiar se denominapoblaci#n objetivo$ –
%o es fácil estudiarla por completo$ &pro'imamos mediantemuestras que den idealmente la misma probabilidad a cadaindividuo de ser ele(ido$
– Tampoco es fácil ele(ir muestras de la poblaci#n objetivo:• )i llamamos por telfono e'cluimos a los que no tienen$• )i ele(imos indiv$ en la calle, olvidamos los que están
trabajando$$$
• *l (rupo que en realidad podemos estudiar +v$($ los quetienen telfono se denomina poblaci#n de estudio$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 3/20
-uentes de ses(o
• "as poblaciones objetivo . de estudio pueden diferir en
cuanto a las variables que estudiamos$• *l nivel econ#mico en la poblaci#n de estudio es ma.or que en
la objetivo,$$$• "os individuos que se eli(en en la calle pueden ser de ma.or
edad +ma.or frecuencia de jubilados p$ej$! – *n este caso, diremos que las muestras que se elijan estarán
ses(adas$ &l tipo de ses(o debido a diferencias sistemáticas entrepoblaci#n objetivo . poblaci#n de estudio se denomina ses(o deselecci#n$
• /a. otras fuentes de error0ses(o – %o respuesta a encuestas embara1osas
•2onsumo de dro(as, violencia domstica, prácticas poco ticas,!
– Mentir en las pre(untas 3delicadas4$
• Para evitar este tipo de ses(o se utili1an la tcnica derespuesta aleatorizada$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 4/20
Tcnicas de respuesta aleatori1ada
• 5educen la motivaci#n para mentir +o no responder a las
encuestas$ – )i di(o la verdad, que dirán de mí!7
• 2#mo se hace7 Pídámosle que lance una moneda antes de responder
.! – )i sale cara que di(a la 3opci#n compremetida4
• +no tiene por qu aver(on1arse, la culpa es de la moneda – )i sale escudo que di(a la verdad
• +no tiene por qu aver(on1arse, el encuestador no sabe si hasalido cara o escudo
• &unque no podamos saber cuál es la verdad en cadaindividuo, podemos hacernos una idea porcentual sobre lapoblaci#n, viendo en cuánto se alejan las respuestas del89$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 5/20
*jemplo: /a tomado dro(as al(una ve17
100% No No sinceros!!
40% No
60% Sí
Con respuesta
aleatorizada
Sin respuesta
aleatorizada
¡No son mitad y mitad!
*l porcentaje estimado de ind$ que tom# dro(as
es:
%202,05,01
5,06,0*==
−
−≈ p
"os que deben decir la verdad
;iferencia entre los que han dicho sí . los que debían hacerlo
por que así lo indicaba la moneda
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 6/20
Tcnicas de muestreo
2#mo esco(er la muestra7
• 2uando ele(imos individuo de una poblaci#n de estudiopara formar muestras podemos encontrarnos en lassi(uientes situaciones: – Muestreos probabilistas
• 2onocemos la probabilidad de que un individuo sea ele(ido para la
muestra$• <nteresantes para usar estadística matemática con ellos$
– Muestreos no probabilistas• %o se conoce la probabilidad$• )on muestreos que se(uramente esconden ses(os$• *n principio no se pueden e'trapolar los resultados a la poblaci#n$
– & pesar de ello una buena parte de los estudios que se publican usan estatcnica$
• *n adelante vamos a tratar exclusivamente con muestreoscon la menor posibilidad de ses(o +probabilistas: aleatoriosimple, sistemático, estratificado . por (rupos$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 7/20
Muestreo aleatorio simple +m$a$s$
• )e eli(en individuos de la poblaci#n de estudio, demanera que todos tienen la misma probabilidad deaparecer, hasta alcan1ar el tama=o muestral deseado$
• )e puede reali1ar partiendo de listas de individuos de la
poblaci#n, . eli(iendo individuos aleatoriamente concomputadora$
• %ormalmente tiene un costo bastante alto su aplicaci#n$
• *n (eneral, las tcnicas de inferencia estadísticasuponen que la muestra ha sido ele(ida usando m$a$s$,aunque en realidad se use al(una de las que veremos acontinuaci#n$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 8/20
Muestreo sistemático
• )e tiene una lista de los individuos de la poblaci#n deestudio$ )i queremos una muestra de un tama=o dado,ele(imos individuos i(ualmente espaciados de la lista,donde el primero ha sido ele(ido al a1ar$
• 2><;&;?: )i en la lista e'isten periodicidades,obtendremos una muestra ses(ada$
– >n caso real: )e eli(i# una de cada cinco casas para un estudiode salud p@blica en una ciudad donde las casas se distribu.enen man1anas de cinco casas$ )alieron con mucha frecuencialas de las esquinas, que reciben más sol, están mejorventiladas,!
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 9/20
Muestreo estratificado
• )e aplica cuando sabemos que ha. ciertos factores+variables, subpoblaciones o estratos que pueden influiren el estudio . queremos ase(urarnos de tener ciertacantidad mínima de individuos de cada tipo: – /ombres . mujeres,
– Aovenes, adultos . ancianos!
• )e reali1a entonces una m$a$s$ de los individuos de cadauno de los estratos$
• &l e'trapolar los resultados a la poblaci#n ha. que teneren cuenta el tama=o relativo del estrato con respecto altotal de la poblaci#n$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 10/20
Muestreo por (rupos o con(lomerados
• )e aplica cuando es difícil tener una lista de todos los individuos
que forman parte de la poblaci#n de estudio, pero sin embar(osabemos que se encuentran a(rupados naturalmente en (rupos$
• )e reali1a eli(iendo varios de esos (rupos al a1ar, . .a ele(idosal(unos podemos estudiar a todos los individuos de los (ruposele(idos o bien se(uir aplicando dentro de ellos más muestreos por
(rupos, por estratos, aleatorios simples,!
– Para conocer la opini#n de los mdicos del sistema nacional de salud,podemos ele(ir a varias re(iones de Buatemala, dentro de ellas variosdepartamentos, . dentro de ellas varios centros de salud, .!
• &l i(ual que en el muestreo estratificado, al e'trapolar los resultadosa la poblaci#n ha. que tener en cuenta el tama=o relativo de unos(rupos con respecto a otros$ – 5e(iones con diferente poblaci#n pueden tener probabilidades
diferentes de ser ele(idas, comarcas, hospitales (randes frente apeque=os,!
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 11/20
*stimaci#n
2#mo presento los resultados7
• >n estimador es una cantidad numrica calculada sobreuna muestra . que esperamos que sea una buenaapro'imaci#n de cierta cantidad con el mismo si(nificadoen la poblaci#n +parámetro$
• *n realidad .a hemos trabajado con estimadores cadave1 que hacíamos una práctica con muestras e'traídasde una poblaci#n . suponíamos que las medias, etc!eran pr#'imas de las de la poblaci#n$
– Para la media de una poblaci#n:• 3*l mejor4 es la media de la muestra$
– Para la frecuencia relativa de una modalidad:• 3*l mejor4 es la frecuencia relativa en la muestra$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 12/20
*s @til conocer la distribuci#n de un estimador7
• *s la clave para hacer inferencia$ <lustrmoslo con un ejemplo que .a
tratamos en el tema anterior +teorema del límite central$
– )i de una variable conocemos μ y σ, sabemos que para muestras
3(randes4, la media muestral es:
• apro'imadamente normal,
• con la misma media .,• desviaci#n típica mucho menor +error estándar
– *s decir si por ejemplo μ=60 y σ=, . obtenemos muestras de tama=o
n=100,
• "a desv$ típica de la media muestral +error estándar es **C80rai1+D99C9$8
• como la media muestral es apro'imadamente normal, el E8 de los estudios
con muestras ofrecerían estimaciones entre 69FD
• ;icho de otra manera, al hacer un estudio tenemos una confian1a del E8 de
que la verdadera media est a una distancia de FD$
n EE
σ =
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 13/20
• *n el ejemplo anterior la situaci#n no era mu.
realista, pues como de todas maneras nocono1co G desconocer el intervalo e'acto paraH$
• )in embar(o tambin ha. estimadores para G .puedo usarlo como apro'imaci#n$
• Para tener una idea intuitiva, analicemos el
si(uiente ejemplo$ %os servirá comointroducci#n a la estimaci#n puntual . porintervalos de confian1a$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 14/20
• *jemplo: >na muestra de nCD99 individuos de unapoblaci#n tiene media de peso 69 I( . desviaci#n 8I($
– ;ichas cantidades pueden considerarse como apro'imaciones+estimaciones puntuales• 69 I( estima a H• 8 I( estima a G• 80rai1+nC 9$8 estima el error estándar +típico **
– *stas son las llamadas estimaciones puntuales: un n@mero concretocalculado sobre una muestra es apro'imaci#n de un parámetro$
– >na estimaci#n por intervalo de confian1a es una que ofrece unintervalo como respuesta$ &demás podemos asi(narle unaprobabilidad apro'imada que mida nuestra confian1a en larespuesta:
• /a. una confian1a del 6J de que H est en 69F9,8• /a. una confian1a del E8 de que H est en 69FD$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 15/20
*stimaci#n puntual . por intervalos
• )e denomina estimaci#n puntual de un parámetro al ofrecido por elestimador sobre una muestra$
• )e denomina estimaci#n confidencial o intervalo de confian1a para unnivel de confian1a DKL dado, a un intervalo que ha sido construido de talmanera que con frecuencia DKL realmente contiene al parámetro$
– ?bsrvese que la probabilidad de error +no contener al parámetro es L$• *n el si(uiente tema se llamará prob$ de error de tipo < o nivel de
si(nificaci#n$• alores típicos: LC9$D9 N 00 N 9$9D
– *n (eneral el tama=o del intervalo disminu.e con el tama=o muestral . aumenta
con DKL$
– *n todo intervalo de confian1a ha. una noticia buena . otra mala:• "a buena: hemos usado una tcnica que en alto de casos acierta$• "a mala: no sabemos si ha acertado en nuestro caso$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 16/20
&plicaci#n• *n los resultados estadísticos
dejamos sin interpretar partede los resultados que
obteníamos con *'cel
• OPuedes interpretar lo quefalta por sombrear7
• Puedes dar un intervalo deconfian1a para la media al6J de confian1a7
• ?bserva la asimetría$ 2rees
probable que la asimetría enla poblaci#n pueda ser cero.a que la obtenida en lamuestra es apro'$ D7
"escripti#os para N$mero de %i&os
D,E9 ,9P8
D,JD
D,EE
D,Q8
R,99
S,DDP
D,Q68
9
JJ
S,99
D,9SP ,96S
D,969 ,DR6
Media
"ímite
inferior
"ímite
superior
<ntervalo de
confian1a para la
media al E8:
Media recortada al 8:
Mediana
arian1a
;esv$ típ$
Mínimo
Má'imo5an(o
&mplitud intercuartil
&simetría
2urtosis
*stadístico *rror típ$
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 17/20
• ;eterminar el nivel de confian1a con que se trabaja, por ejemplo:E8 de confian1a, cu.o valor típico es 1C D$E6 N es el más usado$
• *stimar las características del fen#meno investi(ado$
• ;eterminar la desviaci#n estándar para muestreo de variablesNpuede ser estimada con ) de una muestra piloto de alrededor de
89 elementos$• ;eterminar la probabilidad p de que se realice el evento # la
probabilidad ' de que no se realice el evento, para el muestreo deatributos$ 2uando no se posea suficiente informaci#n de laprobabilidad del evento, se le asi(nan los má'imos valores pC 9$8,
q C 9$8, siempre q p debe de ser i(ual a D$• ;eterminar el (rado de error má'imo aceptable en los resultados
de investi(aci#n$ *ste puede ser hasta el D9N normalmente esaconsejable trabajar con variaciones de R al 6 $ ariacionessuperiores al D9 reducen demasiado la valide1 de la
informaci#n$Poblaci#n infinita
2omo calcular el tama=o de la
Muestra7
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 18/20
• Poblaci#n infinita
• Poblaci#n -inita$• Donde:
• 1 C confiabilidad
• G C desviaci#n estándar
• * C error$
• % C tama=o poblaci#n
2
2
22
)( E
z
E
z n
σ σ ==
2omo calcular el tama=o de la
Muestra7
222
22
)1( σ
σ
z E N
Nz n
+−
=
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 19/20
2omo calcular el tama=o de la
Muestra
7/23/2019 Muestreo_Estadistico_corregido
http://slidepdf.com/reader/full/muestreoestadisticocorregido 20/20
Uu hemos visto7
• )es(o de selecci#n – Poblaci#n objetivo – Poblaci#n de estudio
• ?tros ses(os – Tcnica de respuesta aleatori1ada
• Tcnicas de muestreo – %o probabilistas
– Probabilistas• m$a$s$• )istemático• *stratificado• 2on(lomerados
– *stimaci#n• *stimador
– *stimaci#n puntual – *rror estándar
• *stimaci#n confidencial• %ivel de confian1a DKL