Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
1. CONCEPTOS GENERALES.
2. ASPECTOS FUNDAMENTALES EN EL MUESTREO.
3. MUESTREO PARA ESTIMAR PARAMETROS.
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
5. CÁLCULO DEL TAMAÑO MUESTRAL EN ESTUDIOS DE CASOS Y CONTROLES.
6. CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA LA ESTIMACIÓN DE UN RIESGO RELATIVO.
7. EXPERIMENTOS DE UN FACTOR (ANÁLISIS DE VARIANZA PARA MÁS DE DOS MUESTRAS)
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
1. CONCEPTOS GENERALES.
Población
Conjunto total de unidades (individuos, elementos, mediciones)
existentes en un cierto lugar durante un periodo, que poseen una
característica común que se desea estudiar. El número de elementos
que la integran constituye el tamaño de la población
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
Una población adecuadamente
designada debe definirse en términos
de:1. Elementos2. Unidades de muestreo3. Alcance 4. Tiempo
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
Población.
Ejemplo.
Una encuesta de amas de casa para evaluar el consumo de alimentos procesados:
Elemento : Mujeres
Unidades de muestreo : Mujeres de 18-50
Alcance : Región los Andes
Tiempo : 1/11 al 10/11/ 2005
1. CONCEPTOS GENERALES.
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
Marco muestral
Es una lista de todas las unidades de muestreo disponibles para su selección en la etapa del proceso de muestreo.
1. CONCEPTOS GENERALES.
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
1. CONCEPTOS GENERALES.
MuestraGrupo generalmente reducido de unidades obtenidas de la población.
MuestreoProcedimiento estadístico para seleccionar la muestra a partir de la
población, con el objeto de estudiar en ella alguna característica, y
generalizar los resultados a la población de origen
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
1. CONCEPTOS GENERALES.
Procedimientos de selección de muestras
• Muestreo simple aleatorio• Muestreo sistemático en fases• Muestreo aleatorio estratificado
• Muestreo por conglomerados monoetápico• Muestreo por conglomerados bietápico• Muestreo por conglomerados bietápico estratificado
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
2. ASPECTOS FUNDAMENTALES EN EL MUESTREO.
2.1 En el cálculo de un tamaño de muestra es una contradicción
habitual tener que conocer en la fase de diseño el valor de un
parámetro que solo se podrá estimar una vez extraída la muestra.
Para resolver este problema hay dos opciones:
Estimar el parámetro a partir de una muestra piloto.
Obtener un valor aceptable a partir de las referencias que se
tengan de trabajos o experiencias similares ya realizados.
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
2. ASPECTOS FUNDAMENTALES EN EL MUESTREO.
2.2 En la práctica, los estudios están generalmente diseñados para
estimar un conjunto grande de parámetros, y no uno solo. Sin
embargo, es necesario determinar un tamaño de muestra único. Esta
dificultad suele solventarse adoptando uno de los parámetros como
"el más importante", lo que implica otra decisión subjetiva en el
cálculo.
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
Es el muestreo que se realiza para hacer inferencia a valores poblacionales (Parámetros) tales como la media (µ) y la proporción (P) a partir de una muestra.
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Estimación de una característica específica
Los factores específicos que intervienen en el cálculo del tamaño de
muestra para estimar una proporción son:
El tamaño de la población (Finita o Infinita).
La proporción (p).
Nivel de Confianza (1-α)
Precisión del Estudio (d)
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra
2
22/
d
qpzn
qpzdN
qpzNn
22/
2
22/
)1(
POBLACIÓN INFINITA POBLACIÓN FINITA
donde:
Zα= Valor de la distribución normal al nivel de confianza dado
p = proporción esperada de la característica específica
q = 1-p
d = precisión del estudio
N = Tamaño de la población
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
Ejemplo. ¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes?, con un nivel de confianza del 95% y precisión = 3%; se estima que la proporción esperada puede ser próxima al 5%
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
Tamaños de muestra y precisión para estimación de una proporción poblacional
Tamaño poblacional: 15000 Proporción esperada: 5,000% Nivel de confianza: 95,0% Efecto de diseño: 1,0
Precisión (%) Tamaño de muestra--------------- --------------------
3,000 201
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
qpzdN
qpzNn
22/
2
22/
)1(
POBLACIÓN FINITA
N
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
qpzdN
qpzNn
22/
2
22/
)1(
POBLACIÓN FINITA
N
P
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
qpzdN
qpzNn 22
2
)1(
POBLACIÓN FINITA
N
P
Zα
Se determina con el nivel de confianza
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
qpzdN
qpzNn
22/
2
22/
)1(
POBLACIÓN FINITA
N
P
Zα
d
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
Tomando el ejemplo anterior calcular n para una población infinita
Tamaños de muestra y precisión para estimación de una proporción poblacional
Proporción esperada: 5,000% Nivel de confianza: 95,0% Efecto de diseño: 1,0
Precisión (%) Tamaño de muestra--------------- --------------------
3,000 203
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.1 Estimación de una proporción (P) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
2
22/
d
qpzn
POBLACIÓN
INFINITA
Se deja por defecto (0) por ser población infinita
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.2 Estimación de una Media (µ) poblacional.
Los factores específicos que intervienen en el cálculo del tamaño de
muestra para estimar una Media son:
El tamaño de la población (Finita o Infinita).
La varianza (S2) de la variable cuantitativa a estudiar
Nivel de Confianza (1-α)
Precisión del Estudio (d)
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.2 Estimación de una Media (µ) poblacional.
Cálculo del tamaño de muestra
2
222/
d
Szn
222/
2
222/
)1( SzdN
SzNn
POBLACIÓN INFINITA POBLACIÓN FINITA
donde:
Zα= Valor de la distribución normal al nivel de confianza dado
S2 = Varianza de la variable cuantitativa a estudiar
d = precisión del estudio
N = Tamaño de la población
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.2 Estimación de una Media (µ) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
Ejemplo: Si deseamos conocer la media de la glicemia basal de una población, con una seguridad del 95% y una precisión de ± 3 mg/dl y tenemos información por un estudio piloto o revisión bibliográfica que la varianza es de 250 mg/dl.
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.2 Estimación de una Media (µ) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
Tamaños de muestra y precisión para estimación de una media poblacional
Desviación estándar esperada: 15,810 Nivel de confianza: 95,0% Efecto de diseño: 1,0
Precisión Tamaño de muestra------------ -------------------- 3,000 107
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.2 Estimación de una Media (µ) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
2
222/
d
Szn
POBLACIÓN INFINITA
Se deja por defecto (0) por ser población infinita
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.2 Estimación de una Media (µ) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
2
222/
d
Szn
POBLACIÓN INFINITA2SS
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.2 Estimación de una Media (µ) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
2
222/
d
Szn
POBLACIÓN INFINITA2SS
Zα
Se determina con el nivel de confianza
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
3.MUESTREO PARA ESTIMAR PARAMETROS.
3.2 Estimación de una Media (µ) poblacional.
Cálculo del tamaño de muestra con el software EPIDAT
2
222/
d
Szn
POBLACIÓN INFINITA
2SS
Zα
Se determina con el nivel de confianza
d
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
Este tipo de muestreo pretenden comparar si las medias o las
proporciones de las muestras son diferentes. Habitualmente el
investigador pretende comparar dos tratamientos. Para el cálculo del
tamaño muestral se precisa conocer:
a. Magnitud de la diferencia a detectar que tenga interés clínicamente
relevante. Se pueden comparar dos proporciones o dos medias.
b. Tener una idea aproximada de los parámetros de la variable que se
estudia (bibliografía, estudios previos).
c. Seguridad del estudio (riesgo de cometer un error α)
d. Poder estadístico (1 - β) (riesgo de cometer un error β)
e. Definir si la hipótesis va a ser unilateral o bilateral.
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
El cálculo del tamaño de muestra para la comparación de medias de datos cuantitativos, cuando los dos grupos son independientes, asume que los datos siguen una distribución normal y se basa en la prueba t de Student. Los factores que intervienen en el cálculo son:
La diferencia de medias esperada entre los dos grupos (δ) La varianza (S2) o varianzas de la(s) variable(s) (del grupo control o
grupo de referencia) Nivel de Confianza (1-α) Potencia de la prueba (1-β)
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra
2
22)(2
Szz
n
donde:
Zα= Valor de la distribución normal al nivel de confianza dado
Zβ= Valor de la distribución normal para la potencia de la prueba
S2 = Varianza de la variable cuantitativa a estudiar
δ = Diferencia de medias esperada entre los dos grupos
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra
Ejercicio
En un ensayo clínico sobre el uso de una droga en embarazos gemelares,
un tocólogo desea demostrar que hay un aumento significativo en la
duración del embarazo al usar la droga frente a un placebo. El tocólogo
estima que la desviación estándar de la duración de los embarazos es de
1,75 semanas. ¿Cuántos embarazos debe observar como mínimo en cada
grupo si considera que una semana es un aumento clínicamente
importante en la duración del embarazo y quiere operar con una confianza
del 95% y una potencia del 80%?
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra
Tamaños de muestra y potencia para comparación de medias independientesDesviación estándar esperada Población A: 1,750 Población B: 1,750 Diferencia de medias esperada: 1,000 Razón entre muestras (B/A): 1,000 Nivel de confianza: 95,0%
Tamaño de muestra Potencia (%) Población A Población B--------------- ------------ ------------ 80,0 49 49
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra con el software EPIDAT
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra con el software EPIDAT
2
22)(2
Szz
n
2Ss
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra con el software EPIDAT
2
22)(2
Szz
n
2Ss
δ
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra con el software EPIDAT
2
22)(2
Szz
n
2Ss
δ
Zα
Se determina con el nivel de confianza
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4. MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra con el software EPIDAT
2
22)(2
Szz
n
2Ss
δ
Zα
Se determina con el nivel de confianza
Zβ
Se determina con la potencia de la prueba
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4.MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra con el software EPIDAT
Para el ejercicio anterior al utilizar varianzas desconocidas pero iguales se obtienen los mismos resultados. Veamos
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4.MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Independientes
Cálculo del tamaño de muestra con el software EPIDAT
2
22)(2
Szz
n
57.0
75.1
1
S
Zα
Zβ
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4.MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Emparejados
Requerimientos.
La mínima diferencia de medias entre los dos grupos que se
considere cualitativamente relevante.
La varianza (S2) o varianzas de la(s) variable(s)
Nivel de Confianza (1-α)
Potencia de la prueba (1-β)
El coeficiente de correlación de Pearson entre los valores de la
variable resultado en los dos grupos, que debe ser un valor entre –1
y 1.
Muestreo
Introducción a la Metodología de la Investigación Científica y Bioestadística
4.MUESTREO PARA CONTRASTE DE HIPOTESIS.
4.1 Comparación de dos Medias Grupos Emparejados
Ejercicio
Un investigador quiere valorar la diferencia entre el valor de la presión
sistólica en sangre en personas de mediana edad, antes y después de la
práctica de ejercicio físico. Si el investigador aspira a poder declarar una
diferencia de 2,6 mm Hg como significativa, con un nivel de confianza del
95% y una potencia del 80% ¿cuántos pacientes deberá incluir en el
estudio? Suponga que se estima una desviación estándar de 11,0 mm Hg y
un coeficiente de correlación de 0,70 entre los valores de la presión
sistólica antes y después del ejercicio.