UNIVERSIDAD DE GUAYAQUILDIRECCIÓN DE INVESTIGACIÓN Y PROYECTOS ACADÉMICOS
Curso de fortalecimiento de la investigación para personal docente
MODULO ESTADÍSTICACapitulo 2: Población, muestra y contexto.
GRUPO : DProfesor : PhD Félix Olivero
ÍNDICESubunidad 1: Muestreos probabilísticos y no probabilísticos. Formulas.Subunidad 2: Formulas para muestras grandesSub unidad 3: Formula para muestras pequeñas.
Poblaciones y muestras
• Los objetos de los que uno toma medidas para generar datos son los sujetos del estudio:
•pueden ser individuos y familias•Países y ciudades•empresas, instituciones, universidades, etc.
• La población: conjunto de sujetos sobre el cual se realiza el estudio.
• Una muestra: es un subconjunto de la población sobre el que se toma datos.
Términos estadísticos Términos estadísticos importantesimportantes
Población:Población: Un grupo que incluye todas las mediciones Un grupo que incluye todas las mediciones de interés para el investigadorde interés para el investigador(La colección de (La colección de todastodas las respuestas, las respuestas, mediciones o conteos que mediciones o conteos que son de interés)son de interés)
Muestra:Muestra:Un subgrupo de la poblaciónUn subgrupo de la población
¿¿Por qué muestrearPor qué muestrear??
Tener información de grandes poblacionesTener información de grandes poblaciones Menor costo Menos tiempo en el campo Mayor seguridad en la colección de datos Cuando es imposible estudiar a toda la
población
Población objetivo:Población objetivo: La población a ser estudiada/a la cual el La población a ser estudiada/a la cual el
investigador quiere generalizar los resultadosinvestigador quiere generalizar los resultadosUnidad de muestreo:Unidad de muestreo:La unidad más pequeña de la cual la muestra La unidad más pequeña de la cual la muestra
puede ser seleccionadapuede ser seleccionadaEsquema de muestreoEsquema de muestreo Lista de todas las unidades de muestreo de la Lista de todas las unidades de muestreo de la
cual se extrae la muestracual se extrae la muestraFormas de muestreoFormas de muestreoMétodo de seleccionar las unidades de muestreo Método de seleccionar las unidades de muestreo
del esquema de muestreodel esquema de muestreo
Tipos de muestreoTipos de muestreo
Muestras no probabilísticas
Muestras probabilísticas
Muestras no probabilísticasMuestras no probabilísticas
Muestras por conveniencia (fácil acceso)Muestras por conveniencia (fácil acceso)La muestra es seleccionada de elementos de la
población que son fácilmente accesibles Muestreo bola de nieve (amigos de Muestreo bola de nieve (amigos de
amigos….etc.)amigos….etc.) Muestreo propositivo (juicio)Muestreo propositivo (juicio)
Usted elige quien piensa que debe estar en el estudio
Muestra contingenteMuestra contingente
Muestras no probabilísticasMuestras no probabilísticas
La probabilidad de ser elegido se desconoceMenos costos – pero no es de utilidad para generalizar resultados por potenciales sesgos.
Muestras probabilísticasMuestras probabilísticas
Muestreo aleatorio Cada sujeto tiene una probabilidad
conocida de ser seleccionado Permite la aplicación de la teoría de
estadística a los resultados para: Generalizar Probar hipótesis
ConclusionesConclusiones
Muestras probabilísticas son las mejores
Asegura Representatividad Precisión
Métodos usados en muestras Métodos usados en muestras probabilísticasprobabilísticas
Muestreo aleatorio simpleMuestreo aleatorio simple Muestreo sistemáticoMuestreo sistemático Muestreo estratificadoMuestreo estratificado Muestreo de múltiples pasos Muestreo de múltiples pasos Muestreo por conglomerados (cluster)Muestreo por conglomerados (cluster)
Muestreo simple aleatorio
Tabla de números aleatoriosTabla de números aleatorios
6 8 4 2 5 7 9 5 4 1 2 5 6 3 2 1 4 06 8 4 2 5 7 9 5 4 1 2 5 6 3 2 1 4 05 8 2 0 3 2 1 5 4 7 8 5 9 6 2 0 2 4 5 8 2 0 3 2 1 5 4 7 8 5 9 6 2 0 2 4 3 6 2 3 3 3 2 5 4 7 8 9 1 2 0 3 2 53 6 2 3 3 3 2 5 4 7 8 9 1 2 0 3 2 59 8 5 2 6 3 0 1 7 4 2 4 5 0 3 6 8 69 8 5 2 6 3 0 1 7 4 2 4 5 0 3 6 8 6
Fracción de muestreoFracción de muestreoRazón entre el tamaño de muestra y el Razón entre el tamaño de muestra y el
tamaño de la poblacióntamaño de la población
Muestreo sistemático
Muestreo sistemático
Muestreo por conglomerado Muestreo por conglomerado (clúster)(clúster)
Clúster: un grupo de unidades de muestreo cercanas entre ellas, por ejemplo, viviendo en la misma área o vecindario.
Muestreo por clústerMuestreo por clúster
Sección 4
Sección 5
Sección 3
Sección 2Sección 1
Muestreo estratificadoMuestreo estratificado Muestreo de múltiples pasosMuestreo de múltiples pasos
Error sistemático (o sesgo) Respuesta inapropiada (sesgo de información)
Sesgo de selección
Error de muestreo (error aleatorio)
Errores en muestras
Error tipo 2Error tipo 2 La probabilidad de encontrar una La probabilidad de encontrar una
diferencia con nuestra muestra diferencia con nuestra muestra comparada con la población, y no hay una comparada con la población, y no hay una diferencia en realidad….diferencia en realidad….
Conocido como el α (o “error tipo 1”)Conocido como el α (o “error tipo 1”)
Usualmente situado al 5% (o 0.05)Usualmente situado al 5% (o 0.05)
Error tipo 2Error tipo 2
La probabilidad de no encontrar una diferencia La probabilidad de no encontrar una diferencia que actualmente existe entre nuestra muestra que actualmente existe entre nuestra muestra comparada con la población…comparada con la población…
Conocido como β (o “error tipo 2”)Conocido como β (o “error tipo 2”)
Poder es (1- β) y es comúnmente del 80%Poder es (1- β) y es comúnmente del 80%
Tamaño de muestra
Cuantitativa Cualitativa
2D
2σ2Zn
2
22
21
D)xFσ(σn
2
2
Dπ)π(1Zn
2DF )P-(1 P 2n
Problema 1Problema 1Un estudio a realizarse para determinar un Un estudio a realizarse para determinar un
cierto parámetro en un a comunidad. De cierto parámetro en un a comunidad. De un estudio previo se obtuvo una un estudio previo se obtuvo una desviación estándar de 46.desviación estándar de 46.
Si un error de muestreo de hasta 4 es Si un error de muestreo de hasta 4 es aceptable, ¿cuantos sujetos deberán ser aceptable, ¿cuantos sujetos deberán ser incluidos en este estudio con un nivel de incluidos en este estudio con un nivel de confianza del 99%?confianza del 99%?
RespuestaRespuesta
881~3.88024
246 x 22.58n
2D
2σ2Zn
Problema 2Problema 2 Un estudio será realizado para determinar el Un estudio será realizado para determinar el
efecto de dos medicamentos (A y B) sobre el efecto de dos medicamentos (A y B) sobre el nivel de glicemia. De estudios previos usando nivel de glicemia. De estudios previos usando esos medicamentos, la desviación estándar del esos medicamentos, la desviación estándar del nivel de glicemia fueron de 8 y 12 g/dl, nivel de glicemia fueron de 8 y 12 g/dl, respectivamente.respectivamente.
Un nivel de significancia del 95% y un poder del Un nivel de significancia del 95% y un poder del 90% se requiere para detectar una diferencia de 90% se requiere para detectar una diferencia de medias de 3 gr/dl entre los dos grupos. medias de 3 gr/dl entre los dos grupos. ¿Cuantos sujetos deberán ser incluidos en cada ¿Cuantos sujetos deberán ser incluidos en cada grupo?grupo?
RespuestaRespuesta
groupeachin
243~6.2423
)x10.512(8n 2
22
2
22
21
D)xFσ(σn
En cada grupo
Problema 3Problema 3Se busca estimar la proporción de niños Se busca estimar la proporción de niños
anémicos en una escuela preparatoria. En anémicos en una escuela preparatoria. En un estudio similar en otra escuela se un estudio similar en otra escuela se detectó una proporción del 30%.detectó una proporción del 30%.
Calcule el tamaño de muestra requerido a Calcule el tamaño de muestra requerido a un límite de confianza del 95% y un límite de confianza del 95% y aceptando una diferencia de hasta 4% en aceptando una diferencia de hasta 4% en la población.la población.
RespuestaRespuesta
505~21.504(0.04)
0.3)0.3(1 x 1.96n 2
2
2
2
Dπ)π(1Zn
Problema 4Problema 4En estudios previos, el porcentaje de En estudios previos, el porcentaje de
hipertensos entre diabéticos fue de 70% y hipertensos entre diabéticos fue de 70% y entre no diabéticos fue de 40% en una entre no diabéticos fue de 40% en una cierta comunidad. cierta comunidad.
Un investigador quiere realizar un estudio Un investigador quiere realizar un estudio comparativo para hipertensos entre comparativo para hipertensos entre diabéticos y no diabéticos e un intervalo diabéticos y no diabéticos e un intervalo de confianza del 95% y poder del 80%. de confianza del 95% y poder del 80%. ¿Cual es el tamaño mínimo de muestra a ¿Cual es el tamaño mínimo de muestra a ser tomada de cada grupo con 4% de ser tomada de cada grupo con 4% de diferencia del verdadero valor?diferencia del verdadero valor?
RespuestaRespuesta
2.24130.04
x7.80.55) -(1 0.55 x 2n 2
2DF )P-(1 P 2n
PrecisiónCosto
..
Población y muestra
Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder
abarcarlo.
Muestra (‘sample’) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debería ser “representativo” Esta formado por miembros “seleccionados” de la
población (individuos, unidades experimentales).
Muestreo aleatorio simple
Mecanismo ideal para elegir la mejor muestra posible; debe cumplir las condiciones:
Cada elemento de la población tiene la misma probabilidad de ser escogido.
Todas las posibles muestras del tamaño muestral (n) tienen la misma probabilidad de ser seleccionadas.
Muestreo aleatorio simple
Ejemplo:¿Cómo seleccionar una muestra?
1. Elaborar una lista con todos los nombres de la población.
2. Elaborar una “papeleta” o “bolilla” con cada nombre.
3. Mezclar y extraer las n papeletas o bolillas.
Este procedimiento cumple las dos condiciones antes planteadas.
Muestreo aleatorio simple
En la práctica. ¿Cómo seleccionar una muestra?
Numerar todos los sujetos de la población. Obtener lista de números aleatorios (mediante
el uso de Microsoft EXCEL).
Ejemplo. Elegir una muestra de 20 alumnos de una lista de 100 estudiantes de primer año de secundaria.
20 celdas ←→=ENTERO(ALEATORIO()*100)
Muestreo aleatorio simple
Este es el mecanismo ideal.
La estadística inferencial: se basa en este modelo ideal de muestreo aleatorio simple.
Casi todos los métodos de inferencia: suponen que la muestra se ha obtenido por este método.
En la vida real: pocas veces aplicamos este método estrictamente.
Aplicamos más habitualmente otros métodos de muestreo probabilística.
Otros muestreos probabilísticos
Métodos de muestreo probabilístico: aquellos en los que es posible calcular la probabilidad de aparición de cada una de las muestras posibles.
El muestreo aleatorio simple es un muestreo probabilístico
Otros métodos probabilísticos:
Todos los sujetos tienen igual probabilidad de formar parte de la muestra.
No todas las muestras posibles (combinaciones de n sujetos) tienen la misma probabilidad.
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
1). Cuando la varianza (S2) es conocida:
a) Para poblaciones infinitas o tamaños de población desconocida:
b) Para poblaciones finitas o conocidas:
2
22
dSZn
222
22
)1( SZNdSNZn
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
2). Cuando la varianza (S2) es desconocida:
a) Tamaño de la población N es desconocida.
b) Tamaño de la población N es conocida:
2
2
dPQZn
PQZNdPQNZn 22
2
)1(
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRADonde: n: Es el tamaño de la muestra.
N: Tamaño de la población.
Z: Factor de confiabilidad. Es 1,96 cuando es un 95% de confianza y es 2,57 cuando se establece un 99% de confianza (valor de distribución normal estandarizada correspondiente al nivel de confianza escogida).
P = 0,5
Q = 1-P = 0,5
d: Es el margen de error permisible. Establecido por el investigador.
_
X
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
Ejemplo: Estimar el tamaño de la muestra de estudio para una población de 120 estudiantes de primer año de educación en la universidad.
N= 120Z=1,96 (para un nivel de confianza al 95%).P= 0,5Q= 1-P = 0,5d = 0,1
PQZNdPQNZn 22
2
)1(
)5,0)(5,0()96,1()1120()1,0()5,0)(5,0()96,1(120
22
2
n 59,53
1504,2248,115
n
53n
EJERCICIOS DE ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
1. Estimar el tamaño de la muestra de estudio para una población de 80 estudiantes del 1er semestre carrera de CPA.
2. Se quiere estudiar el desempeño profesional de los docente de la especialidad de Matemática de la UG facultad de ciencias Administrativas, el total de docentes nombrados y contratados en la especialidad antes mencionado son 460. ¿Cuál es el tamaño de la muestra representativa que debemos elegir?