Introduccion Nociones Basicas Sobre Muestreo

Embed Size (px)

Citation preview

  • 8/18/2019 Introduccion Nociones Basicas Sobre Muestreo

    1/9

     

     

    1

    En la mayoría de las investigaciones en Ciencias de la Salud se trabaja con muestras

    “representativas” de la población de estudio. A partir de los datos observados en la

    muestra se realizan “pruebas estadísticas” que permiten generalizar los resultados a la

    población de la que proceden, con una mínima probabilidad de error.

    Por ejemplo, en una muestra aleatoria de adultos residentes en Salamanca se encuentra

    que la prevalencia de hipertensión arterial es del 28%. Los autores, a partir del valor

    muestral, calculan el “intervalo de confianza al 95%” del parámetro en la población de

    origen de la muestra y concluyen que la prevalencia de hipertensión en la población deadultos de salamanca se encuentra entre el 22% y el 33%, con una probabilidad de error

    inferior al 5%. Es decir con una probabilidad del 95% la prevalencia de adultos

    salmantinos hipertensos estará comprendida entre el 22% y el 33%.

    Nota: La extrapolación de los resultados obtenidos en una muestra se denomina

    inferencia. El cálculo de tamaño muéstral se basa en la inferencia estadística.

    ¿  ?.

    Los individuos de una población, principalmente cuando son grandes, no siempre están

    accesibles o son difíciles de localizar, dificultando su manejo y movilizando gran

    cantidad de recursos (materiales, humanos o de tiempo). Aspectos que pueden

    comprometer la viabilidad del estudio y la generalización (inferencia) de las

    conclusiones obtenidas.

    El principio general que justifica trabajar con muestras es que resulta más barato, más

    rápido, más fácil y es más exacto que hacerlo con poblaciones completas. Es más exacto

    en el sentido de que se pueden hacer medidas más precisas y exhaustivas.

       

    La población es el conjunto de individuos a los que queremos generalizar nuestros

    resultados. Podemos distinguir los siguientes tipos de población:

      : conjunto de individuos a los que queremos extrapolar,

    generalizar o inferir los resultados obtenidos en la investigación. La población diana

    puede ser toda la población o el conjunto de individuos que presentan una característica

    de estudio (el problema de salud investigado, consumidores de tabaco, pacientes con

    infarto, etc…).

    Ejemplo: realizamos un estudio en varones fumadores mayores de 35 años con altadependencia nicotínica, para determinar la eficacia de la vareniclina para mantener el

  • 8/18/2019 Introduccion Nociones Basicas Sobre Muestreo

    2/9

     

     

    2

    abandono del hábito pasados 12 meses después del tratamiento. En este caso la

    población diana a la que generalizamos los resultados serán los varones fumadores

    mayores de 35 años con alta dependencia a la nicotina.

      : población fuente de individuos para el estudio. Como

    comentábamos, la dificultad para estudiar a la totalidad de la población de referencia (enel ejemplo, el 37% de la población española consumen tabaco), nos hace por motivos

    prácticos, definir la población accesible (de fácil localización y acceso) que será la

    población fuente de individuos para el estudio. En nuestro ejemplo puede ser los

    fumadores que acuden a los programas de cesación del consumo de tabaco a los centros

    de atención primaria.

      . Muestra representativa de la población accesible. Requiere

    cuantificar el número de individuos que componen la muestra (para obtener

    estimaciones precisas de los resultados) y la técnica de muestreo que vamos a utilizar en

    función del tipo de estudio diseñado y los objetivos del estudio.

    La selección de la población diana y la accesible requiere aplicar unos criterios de

    selección o inclusión en el estudio que hay definir en la etapa de planificación de la

    investigación. Ej: Una investigación (estudio longitudinal prospectivo) llevada a cabo

    en Costa Rica para determinar la incidencia de diabetes tipo 2 en población-urbano

    marginal, los criterios de inclusión fueron ser mayor de 20 años, tener una historia

    clínica abierta y referir al menos un factor de riesgo de diabetes (obesidad, hipertensión,

    dislipidemias, antecedentes familiares e intolerancia a la glucosa), así como tener una

    determinación de la glucosa en sangre al inicio del estudio para descartar la presencia de

    una diabetes.

       .

    Toda investigación se inicia con una pregunta de investigación y con la formulación de

    unos objetivos o hipótesis de trabajo que hay que alcanzar o demostrar para contestar a

    la pregunta inicial. La definición y caracterización de la población de estudio debe

    planificarse de forma correcta en la    del estudio. En esta etapa se debedefinir cuidadosamente la muestra de estudio y determinar dos aspectos fundamentales:

    ¿ ?

    ¿ ?

    En la fase de diseño de una investigación debemos determinar el tamaño de la muestra

    (número de individuos que la forman) y la técnica de muestreo empleada (técnica de

    selección de los individuos de una muestra).

     . La muestra debe estar formada por un número suficiente de

    elementos que permita responder a la pregunta de investigación. El tamaño muestral

    debe permitir estimar los parámetros poblacionales o contrastar la hipótesis de trabajo

    con el menor error posible.

  • 8/18/2019 Introduccion Nociones Basicas Sobre Muestreo

    3/9

     

     

    3

    La , es el procedimiento empleado para seleccionar los elementos

    que formarán parte de la muestra de estudio. La técnica utilizada debe garantizar que la

    muestra refleje las características de la población de la que procede; es decir la muestra

    debe ser “representativa” de la población de origen. Para poder extrapolar los resultados

    a la población de origen, las características de los individuos de la muestra deben sersimilares (iguales) a los de la población. Para conseguir este objetivo, a la hora de

    seleccionar los elementos de la muestra, debemos utilizar las “técnicas de muestreo”

    adecuadas para cada situación.

    Ejemplo: En una determinada población, el 58% de los individuos son mujeres. Una

    investigación realizada con una muestra representativa de esta población, deberá tener

    una proporción de mujeres similar a la de la población (58%). La muestra de estudio no

    sería representativa si la proporción de mujeres fuera del 10% o, en el caso extremo,

    estuviese formada exclusivamente por hombres.

    Si no se tienen en cuenta estos dos aspectos podemos caer en tres situaciones

    inaceptables:

    Si el tamaño muestral está sobrevalorado (más elementos que los necesarios

    para responder a la pregunta de investigación) se realizará un número

    innecesario de pruebas que acarreará pérdida de tiempo y dinero.

    Si el tamaño muestral es inferior al necesario (menos elementos), se tomará

    una cantidad insuficiente de datos, lo cual generaría imprecisión, y muy

    probablemente, no se estimaría con   el parámetro poblacional, ni se

    encontrarían diferencias significativas cuando en realidad es posible que síexistieran ( ).

    Si la muestra no refleja las características de la población no podremos

    extrapolar los resultados. Las estimaciones realizadas no corresponderán al tipo

    de pacientes de la población sino sólo a los que tengan las mismas

    características que en la muestra.

    . La estadística proporciona fórmulaspara su cálculo en todos y cada uno de los diseños de investigación en función de los

    objetivos del estudio. En todas ellas se utilizarán los criterios comentados en esta unidad

    y que se desarrollarán, de forma más extensa, en otras unidades didácticas.

    .

    Los métodos de muestreo podemos clasificarlos en dos grandes grupos: métodos

    probabilísticas y métodos no probabilisticos.

      : Utilizan el “azar” para seleccionar los “n” individuos de una

    muestra. Todos los individuos tienen la misma probabilidad de ser seleccionados y

    formar parte de la muestra. Las técnicas de muestreo probabilísticas son las de mayorvalidez a la hora de realizar inferencia estadística (generalización a la población) a partir

  • 8/18/2019 Introduccion Nociones Basicas Sobre Muestreo

    4/9

     

     

    4

    de los resultados obtenidos en una muestra. A continuación se enumeran los principales,

    y más frecuentemente utilizados, tipos de muestreo probabilístico:

    Muestreo aleatorio simple.

    Muestreo aleatorio sistemático.

    Muestreo estratificado

    Muestreo por conglomerados

    Muestreo polietápico

    Asignación aleatoria

      : No utiliza el “azar”, la probabilidad de ser seleccionados

    para formar parte de la muestra no es la misma en todos los individuos. La selección de

    los individuos, y este es su principal inconveniente, es subjetiva. Por ejemplo, una

    técnica de muestreo no probabilística, utilizada frecuentemente, es estudiar los datos de

    los que disponemos de nuestros pacientes (estudios de series de casos), no existe una

    planificación previa del tamaño muestral ni de cómo seleccionar los individuos queformarán parte de ella.

    .

    1. 

    La probabilidad de cometer un error tipo 1 o alfa (riesgo alfa).

    2.  La probabilidad de cometer un error tipo 2 o beta (riesgo beta)

    3. 

    La variabilidad (dispersión) esperada en los resultados obtenidos enla muestra, en relación con la variable de estudio*.

    *Nota: La variablidad de los datos corresponde a la desviación estándar.

    4.  Magnitud del efecto que se estudia. El tamaño del efecto queesperamos estimar. 

    *Nota: El tamaño del efecto se corresponde con la precisión de la estimación en

    los estudios descriptivos (precisión en la estimación del parámetro poblacional:

    media o proporción) y con la potencia estadística en los estudios analíticos. 

      . Es la probabilidad de rechazar, en una prueba estadística, la

    hipótesis nula cuando es cierta (o la probabilidad de rechazar la hipótesis nula cuando la

    hipótesis alternativa es, en realidad, falsa). Parámetro matemático establecido, de forma

    generalizada, por la comunidad científica en un máximo del 5% o del 1% si se es más

    restrictivo.

      . Es la probabilidad de aceptar la hipótesis nula cuando es falsa

    (o la probabilidad de rechazar la hipótesis alternativa cuando, en realidad, es cierta). Es

    un parámetro matemático establecido por la comunidad científica, de forma

    generalizada, en un máximo del 20% o, si se es más estricto, del 10%.

  • 8/18/2019 Introduccion Nociones Basicas Sobre Muestreo

    5/9

     

     

    5

     obtenidos de la variable de estudio en la

    muestra. Viene determinada por la desviación estándar esperada en las observaciones

    recogidas en la muestra. Este parámetro , por lo tanto, tendremos que

    “predecir” (establecer ), cuál será su valor previsto en el estudio. Para ello,

    podemos aproximarnos a su valor mediante alguna de las opciones siguientes:

    1. Realizar un “estudio piloto” con un número reducido de

    individuos.

    2. Utilizar las referencias de otras investigaciones publicadas.

    3. Tener en cuenta la situación más desfavorable. Es decir, aquella

    en la que se obtiene un mayor tamaño muestral*.

    * En el caso de que la variable sea cualitativa, la desviación estándar de las

    observaciones depende de proporción (p) del parámetro en la muestra. En este caso la

    situación más desfavorable, que proporciona un tamaño muestral más grande, seríaconsiderar que la probabilidad p es igual al 50%. (Nota: Esta suposición es controvertida y tienesus inconvenientes. No todos los autores están de acuerdo con ella. Si está interesado, puede leer los

    artículos incluidos en las referencias bibliográficas de Silva LC y de García Ortega).

        que queremos detectar. No es un

    parámetro matemático, sino clínico o epidemiológico (depende de factores clínicos,

    biológicos o prácticos). Determina cual es la magnitud del efecto obtenido que vamos a

    considerar como clínicamente importante.

    Es el parámetro que más influirá en el cálculo del tamaño muestral, ya que es el propio

    investigador el que debe establecer su magnitud , por ser el que mejor conoce surepercusión. El investigador ebe establecer la magnitud del efecto que va a serconsiderada como significativa, con repercusión o importancia clínica.

    Para comprender mejor el concepto, vamos a ver algunos ejemplos:

    Una investigación pone de manifiesto que la reducción de la

    mortalidad en los pacientes que reciben un tratamiento (A) es del

    20%, mientras que en el grupo control (no recibe el tratamiento A) es

    del 15%. La reducción de 5 unidades porcentuales (20%-15%=5)

    ¿representaría una mejora importante desde un punto de vista

    clínico?: según el investigador sí considera como importante elbeneficio obtenido al reducir 5 unidades procentuales los casos de

    muerte.

    En el caso anterior, si la mortalidad en el grupo control fuera del

    19%, la reducción de 1 unidad porcentual (20%-19%) ¿podría

    considerarse como clínicamente importante?: en este caso, no está

    claro si ésta reducción en la mortalidad represente un beneficio

    clínico importante. En el caso de que se considerase significativo

    esta reducción tan pequeña el número de individuos de la muestra

    tendría que ser mucho más elevada.

  • 8/18/2019 Introduccion Nociones Basicas Sobre Muestreo

    6/9

     

     

    6

    El tratamiento A utilizado para una determinada enfermedad tiene

    una eficacia del 54%. Se introduce un nuevo tratamiento (B). Se

    diseñó un estudio con el fin de determinar si el nuevo fármaco es

    más eficaz y considerar la posibilidad de sustituir al antiguo. Los

    resultados muestran que la eficacia del tratamiento B es mayor(85%). La diferencia del efecto, 29 unidades porcentuales más, se

    consideraría como significativa desde el punto de vista clínico.

    En el caso anterior, supongamos que la eficacia del tratamiento B es

    del 56%; con estos resultados, ¿podemos establecer que esta

    diferencia en eficacia es suficientemente grande o importante

    clínicamente como para cambiar el tratamiento antiguo por el

    nuevo?. Estos autores consideraron que la magnitud del efecto

    mínima que se desea (o va a tener en cuenta) para considerar mejor

    al tratamiento B fue del 10%.

    En el ejemplo con el que iniciamos esta unidad, los autores, a partir

    del valor muestral de un 28% de pacientes hipertensos en los adultos

    salmantinos, estimaron, por intervalo de confianza, que con una

    probabilidad del 95% la prevalencia de adultos salmantinos

    hipertensos estará comprendida entre el 23% y el 32%. La amplitud

    de este intervalo se corresponde con las unidades porcentuales, por

    encima y por debajo del valor muestral -28%-. En el ejemplo es de 5.

    La amplitud del intervalo refleja la precisión de la estimación y se

    corresponde con el tamaño del efecto.

    En el caso anterior, los investigadores obtuvieron una estimación por

    intervalo de confianza del parámetro poblacional más precisa:

    encontraron que la prevalencia de hipertensos se encontraba, con una

    probabilidad del 95%, entre 26% y 30%. La amplitud del intervalo es

    menor (2 unidades por encima y 2 unidades por debajo del valor

    muestral). Los investigadores consideraron importante clínicamente

    conocer el parámetro poblacional con una diferencia de 2 unidades

    porcentuales en el estudio.

    En el caso anterior, los investigadores obtuvieron una estimación por

    intervalo de confianza del parámetro poblacional menos precisa:encontraron que la prevalencia de hipertensos se encontraba, con una

    probabilidad del 95%, entre 10% y 46%. La amplitud del intervalo es

    mayor (18 unidades porcentuales por encima y 18 unidades

    porcentuales por debajo del valor muestral). Los investigadores

    habían no consideraron como aceptable esta diferencia.

    1. Cuanto menor sea el riesgo alfa mayor, será el tamaño muestral.2. Cuanto menor sea el riesgo beta, mayor será el tamaño muestral.

  • 8/18/2019 Introduccion Nociones Basicas Sobre Muestreo

    7/9

     

     

    7

    3. Cuanto mayor sea la dispersión, mayor será el tamaño muestral.

    4. Cuanto menor sea la magnitud del efecto, mayor será el tamaño muestral.

     

    Como hemos indicados en este capítulo, las investigaciones en ciencias de la salud

    obtienen conclusiones de la población basadas en el tratamiento de resultados obtenidos

    en una muestra. Los investigadores, para realizar la generalización de resultados se

    basan en la inferencia estadística.

    Las fórmulas matemáticas empleadas en el cálculo del tamaño muestral depende del

    objetivo del estudio, que puede ser (resumiendo conceptos que hemos mencionado a lo

    largo de esta unidad):

    1. Estimar parámetros de la población. Estos parámetros pueden ser una media o una

    proporción. Por ejemplo, estimar la frecuencia de fumadores o el número medio de

    cigarrillos consumidos en la población a partir de una muestra aleatoria obtenida de la

    población española. En este caso, el valor del parámetro poblacional se estima mediante

    el cálculo del , con una probabilidad de error pequeña (5%).

    El valor del parámetro poblacional obtenido es una estimación de su valor real (que

    desconocemos). Nos interesa que esta estimación se acerque lo más posible a su valor

    real, es decir, nos interesa que la estimación sea  . Recordemos que la precisión

    de la estimación está determinada por la amplitud del intervalo, de forma que cuanto

    menor sea esta amplitud mejor será la precisión de la estimación, más nos acercaremosa su valor real.

    2. Realizar un contraste de hipótesis. Comprobar si supuestos realizados sobre

    poblaciones son ciertos mediante el estudio de muestras. Por ejemplo, en una muestra

    de pacientes se observa que el 35% de los fumadores son hipertensos, mientras que,

    entre los no fumadores, es del 12%. Los autores consideran que esta diferencia es

    importante desde el punto de vista clínico, pero quieren confirmar que esta diferencia no

    es debida al azar, sino que realmente puede haber otro factor (tabaco) que condiciona

    esta diferencia observada en la muestra. Los autores realizan la prueba de contraste

    adecuada y concluyen que estas diferencias son estadísticamente significativas, que las

    diferencias no se deben al azar (a la muestra seleccionada) sino que se dan realmente en

    la población de origen de la muestra, lógicamente con una probabilidad pequeña de

    equivocarnos (

  • 8/18/2019 Introduccion Nociones Basicas Sobre Muestreo

    8/9

     

     

    8

    arterial) era estadísticamente significativa, no era debida al azar, existía otro factor (el

    tabaco) que se asociaba con la hipertensión. Establecieron que estas diferencias se

    daban en la población de origen de la muestra con una probabilidad de error pequeña

    (menor del 5%). Para llegar a esta conclusión, para determinar que las diferencias

    fueron estadísticamente significativas, realizaron una prueba de contraste de hipótesis

    (supongamos que realizaron un test de chi cuadrado).

    Recuerde que la hipótesis estadística no se corresponde con la hipótesis de investigación

    planteada al principio. La hipótesis estadística que se pretende demostrar en una prueba

    de contraste de hipótesis se denomina hipótesis nula (Ho) e implica la existencia de una

    hipótesis alternativa (Ha) que aceptaremos en el caso de rechazar la Ho.

    Ho: No existen diferencias en la frecuencia de hipertensión en fumadores.

    Ha: Existen diferencia en la frecuencia de hipertensión en fumadores.

    Observe, que la hipótesis de estudio planteada por los investigadores se corresponde conla hipótesis alternativa. Por el contrario la base estadística de contraste de hipótesis es la

    Ho; las pruebas estadísticas empleadas en el análisis aceptan o rechazan la hipótesis

    nula (no hay diferencias).

    En el análisis de los datos, si tenemos en cuenta lo que ocurre en la realidad (la hipótesis

    nula es cierta o falsa), y las conclusiones a las que llegamos en nuestro estudio (la Ho la

    consideramos como cierta o falsa), podemos obtener cuatro tipos de resultados que se

    encuentran recogidos en la tabla expuesta a continuación:

      Ho

    Cierta

    Ho

    Falsa

     

    Rechazo Ho α  1- Acepto Ho 1-α 

    Según lo recogido en la tabla podemos confundirnos en dos situaciones (rechazo la Ho

    cando es cierta y acepto la Ho cuando es falsa) y podemos llegar a una conclusiónverdadera en otras dos situaciones (aceptamos la Ho cuando es cierta y rechazamos la

    Ho cuando es falsa).

    A. Podemos cometer dos tipos de errores:

      . Es la probabilidad de rechazar, en una prueba

    estadística, la hipótesis nula cuando es cierta. La comunidad científica

    establece como error permitido un máximo del 5% o del 1%.

    En el ejemplo concluimos que “Existen diferencias en la frecuencia de

    hipertensión entre fumadores y no fumadores” cuando realmente no existen.

  • 8/18/2019 Introduccion Nociones Basicas Sobre Muestreo

    9/9

     

     

    9

      . Es la probabilidad de aceptar la hipótesis nula

    cuando es falsa La comunidad científica establece como error permitido un

    máximo del 20% o del 10%.

    En el ejemplo concluimos que “No existen diferencias en la frecuencia de

    hipertensión entre fumadores y no fumadores” cuando realmente sí existen.

    B. Igualmente podemos llegar a establecer dos conclusiones correctas:

      . Probabilidad de rechazar la hipótesis nula cuando

    realmente es falsa (es cierta la Ha).

    En el ejemplo concluimos que “Existen diferencias en la frecuencia de

    hipertensión entre fumadores y no fumadores” y, realmente existen. Llegamos

    a la conclusión correcta.

    . Probabilidad de aceptar la hipótesis nula cuandorealmente es cierta (es falsa la Ha).

    En el ejemplo concluimos que “No existen diferencias en la frecuencia de

    hipertensión entre fumadores y no fumadores” cuando realmente no existen.

    Llegamos a la conclusión correcta de que no hay diferencias.

    .

    Para finalizar el contenido de esta unidad, simplemente hacer referencia a la variablidad

    de las observaciones. Parámetro del que no podemos olvidarnos, ya que hemos

    comentado que es necesario establecerlo a priori para poder calcular el tamaño muestral.

    El concepto y la influencia de este parámetro lo veremos en las unidades siguientes.