Tamaño de La Muestra Clinico

Capítulo 18

Cálculo del tamaño de la muestra

Víctor F. Sales Carmona José Antonio Orozco Montero

CASO CLINICO

U na mujer de 50 años acude a la consulta externa del servicio de cardiología; refiere que es hlpertensa desde hace cinco años y que no

ha podido ser controlada con diversos medicamentos. En el momento de la consulta, la paciente presenta tensión arterial de

160/110 mmHg. El médico le prescribe un nuevo medicamento, Privinil, 10 mg al día durante 15 días.

Al cabo de dicho lapso de tiempo, la mujer refiere mejoría en cuanto a los síntomas y su tensión arterial es de 150/95 mmHg. Ante resultado tan favorable, al médico le Inquieta saber si esto se debe al azar o en realidad el fármaco funciona mejor que otros hipotensores. Decide realizar un estudio y se pregunta cuántos pacientes necesita incluir y qué diferencia le interesa demostrar.

INTRODUCCION

En este capítulo se describen los conceptos relacionados con la obtención del tamaño de la muestra en los proyectos de investigación experimental. Esto Incluye múltiples términos estadísticos que con frecuencia resultan confusos para el médico. Con una terminología sencilla se pretende proporcionar respuesta a una de las Interrogantes que con más frecuencia se hace el investigador clínico que se encuentra en la fase de planeaclón de un ensayo clínico controlado, quien trata de demostrar que existe una verdadera diferencia entre dos tratamientos. Dicha pregunta es: ¿cuántos pacientes se requiere Incluir en el estudio para que, al finalizarlo, éste tenga validez desde el punto de vista estadístico, es decir, que los resultados obtenidos no se deban al azar?

261

262 EPIDEMIOWGIA

También se tratan conceptos en cuanto a la determinación de tamaño de la muestra de estudios de prevalencia o Incidencia. Al respecto la determinación del tamaño de la muestra no se efectúa con el fin de obtener representatlvidad o validez externa para ésta; ello se logra tanto con una definición adecuada de la población de estudio como con una selección apropiada de la muestra (p. ej., con mecanismos aleatorios Independientes de las preferencias personales de los sujetos que conducen el estudia) y la muestra es ajena a l número de Individuos seleccionado para estudiar.

TAMAÑO DE LA MUESTRA EN ENSAYOS CLINICOS CONTROLADOS

En este caso, las preguntas sobre el tamaño de la muestra se plantean en situaciones en que generalmente un nuevo procedimiento terapéutico Va a evaluarse en forma prospectlva y su respuesta constituye uno de los aspectos más Importantes relacionados con la factibilidad de un estudia; ello no sólo en lo que se refiere a la disponibilidad del número de pacientes, sino en cuanto a los costos materiales del estudio en plan~ación.

En ocasiones, por falta de un adecuado cálculo del tamaño de la muestra, puede suceder que los resultados finalmente obtenidos carezcan de signlficancla estadistlca, aun cuando la diferencia clínica que se pretende demostrar sea importante. Esto se debe a que el llamado poder o potencia de la prueba, concepto que se explica más adelante, no se calculó de manera adecuada o simplemente no se estimó.

En otras condiciones, el estudio se ha seguido durante mucho tiempo, con inclusión de un número Importante de pacientes; cuando se realiza el análisis de los resultados se demuestra amplia diferencia Incluso desde el punto de vista estadístico. Tal diferencia probablemente hubiera podido demostrarse con un número menor de sujetos de estudio, con lo cual se habrían requerido menos pacientes en el grupo control y,Sde este modo, haltria disminuido la cifra de Individuos expuestos a recibir un tratamiento menos efectivo, asi como la utilización de recursos valiosos.

Es importante mencionar que aun cuando existen procedimientos estadisticios válidos por completo para efectuar el cálculo del tamaño de la muestra, el número obtenido sólo proporciona una estimación aproximada de la cantidad necesaria de pacientes. Junto a esto hay que considerar el hecho de que, dadas las características de estos estudios, siempre se tiene que contar con un excedente, ya que normalmente una cantidad importante de Individuos no puede Incluirse porque éstos no cumplen los criterios de inclusión o, en ocasiones, abandonan el tratamiento, o bien porque durante el experimento se cometen violaciones al protocolo, lo que obliga a excluir del estudio a ciertos sujetos. Es decir, el cálculo del tamaño de la muestra sólo brinda una Idea del mínimo de pacientes necesarios para el estudio.

CALCULO DEL TAMAÑO DE LA MUESTRA 263

UTILIDAD CLINICA EN LA TOMA DE DECISIONES

Cuando los clínicos se enfrentan a situaciones en las que tienen que decídlr sobre la alternativa de un tratamiento sustentado en estudios publ1cados en revistas médicas, deben estar seguros de que los resultados de dichos estudios tuvieron como base, además de un cuidadoso diseño de estudio , una conclusión apropiada en función de la significancia de la diferencia observada, es decir, si ésta fue a favor del tratamiento considerado como control, o bien, del tratamiento experimental. Todos estos aspectos están determinados por el número de pacientes incluidos en el estudio.

En otras circunstancias, cuando se obtiene un resultado negativo en un estudio prospectivo se pregunta: ¿el estudio il'cluyó el número suficiente de Individuos para demostrar que efectivamente no existió diferencia entre los tratamientos probados?

Todos los aspectos antes enunciados y los siguientes: las respuestas a las preguntas planteadas; los errores tipo 1 o 11 para aseverar que existe o no diferencia entre los grupos control y experimental: valores alfa y beta para definir las magnitudes o probabilidades de los e rrores tipo 1 y n, respectivamente; valores conocidos como }J I y }J2 o " 1 y"" o también como "T o "e, para expresar los valores de la variable de interés (}J denota valores promedio, "señala proporciones) en los grupos experimental y control. respectivamente; la importancia de la diferencia clínica, que también se conoce como delta (t.) o diferencia entre los grupos control o experimental. que se expresa con la diferencia de promedios o proporciones, y la decisión de utilizar uno o los dos extremos de la curva de distribución normal de probabll1dades, se describen en este capitulo y se proporciona en detalle su significado por medio de ejemplos prácticos.

DIFERENCIA CLINICA O VALOR DE DELTA

En cada caso, el valor de delta depende de la enfermedad en cuestión. Suponga el lector que es el consultante del médico que atendió a la paciente hipertensa del caso clínico inicial; para tratar de establecer la diferencia que quiere demostrarse, se pregunta al responsable del estudio si es Importante la reducción en promedio de 1 mmHg en la tensión diastólica. Lo más probable es que el experto de esta área médica señale que no lo es y considere que para una reducción tan pequeña no vale la pena Invertir recursos humanos y materiales, ya que los resultados, si fueran positivos, carecerían de interés desde el punto de vista clínico.

Pero ¿qué sucedería si, por el contrario, la diferencia Investigada fuera la reducción de la tensión diastólica de 30 mmHg? De nuevo. el experto del área quizá diría que una reducción de esa magnitud, para esta enfermedad en especial, es exagerada, también carece de valor clínico y muy probablemente genera un número Importante de efectos secunda-

264 EPIDEMIOLOGIA

rios. En una circunstancia como la ejemplificada, es probable que la reducción en promedio de 5 mmHg constituya una cifra razonable.

La especificación de la reducción promedio, que es en realidad la diferencia debida al tratamiento (<l.), es importante desde el punto de vista clínico y, en consecuencia, también en cuanto a la planeación del diseño del estudio. En el ejemplo anterior, el resultado que interesa analizar se expresa en forma de promedios; es importante reconocer esta circunstancia, ya que tanto el cálculo del tamaño de la muestra como el análisis de los resultados requiere de fórmulas estadistica s especificas.

En otras ocasiones, el interés del estudio está centrado en que el efecto del tratamiento produzca la reducción de síntomas y signos, o bien el incremento de las proporciones dé una respuesta clínicamente evaluable. Un ejemplo de estas situaciones lo constituye el estudio de algun a enfermedad neoplásica en el que se quiere saber la cantidad de pacientes para realizarlo. La finalidad principal sería obtener un mayor número de pacientes que entren en remisión, es decir, incrementar la proporción de enfermos que después de ser tratados muestren curación. En primer término, es importante reconocer 'cuál es la proporción de sujetos en quienes se logra obtener remisión con el tratamiento estándar; es decir, el que es se utiliza regularmente, que ha sIdo validado a través de estudios clínicos controlados bien diseñados y que, además de producir el m ayor número de remisiones, provoque el menor número de efectos secundarios. Por tanto, el primer paso para el cálculo del tamaño de la muestra es la cuidadosa revisión de la literatura médica con objeto de Indagar con cuál terapéutica se ha obtenido la mayor proporción de remisiones y. desde luego, con el menor número de efectos adversos. Si el mejor tratamiento (que se denominará estándar) , muestra que 60% de los pacientes obtiene remisión o desaparición de todo dato de enfermedad, este dato constituye el punto de partIda del estudio y se llamará efecto observado o proporción observada en el tratamiento control. que también se conoce como "1 o "c. El siguiente paso es la propuesta de la proporción esperada con ofro tratamiento, el cual se denomina experimental, regUlarmente llama\:lp "1 o "T, cuyos resultados se basan en estudios piloto conocidos tamblen como estudios de fase 11. Es decir, dichos estudios no se han evaluado en trabajos clínicos comparativos, pero no obstante sugieren la posibilidad de un buen resultado, que desde luego haya sido objeto de evaluación en fases preclínicas y que ahora deba validarse a través de un ensayo clínico controlado con diseño efectivo. Si se consideran las características de este segundo tratamiento, así como los resultados obtenidos con su uso, y si se supone que existen datos (de acuerdo con los estudios previos) de que se produce una proporción de remisiones del orden de 75%, la diferencia entre ambas terapéuticas (que en este caso, dada su magnitud, sí sería clínicamente importante), representa una diferencia de 15% en las proporciones y se conoce con el nombre de delta (A). Cabe aclarar que a mayor diferencia de las respuestas buscadas, entre los tratamientos control y experimental, la m u estra es menor y, por el contrario, una diferencia más pequeña entre ambos grupos requiere una muestra mayor.

CALCUW DEL TAMAÑO DE LA MUESTRA 265

ERRORES TIPOS 1 Y n y NIVELES ALFA Y DELTA

Una vez que se han defirudo cuáles son los valores que interesan, en relación con la proporción o con los promedios que se desea mejorar mediante un estudio experimental de acuerdo con la importancia desde el punto de vista clinico, esto es, "1. '" (en el caso de proporciones del grupo control y experimental, respectivamente) o 1'1, 1'2" Y 6., el paso siguiente consiste en plantear una hipótesis o respuesta tentativa por probar. En el caso de proporciones se establece que no existe diferencia entre los tratamientos control y experimental (Ho: "1 - ",) en comparación con la alternativa de que sí hay distinción entre los tratamientos (H 1: "1 ~ ",). Imagine que existe un mecanismo basado en una muestra para tomar una decisión sobre las alternativas que ofrece. la hipótesis; el mecanismo de decisión se basa esencialmente en la diferencia o sustracción de proporciones de los dos grupos. No es dificil darse cuenta que si se toma una decisión sólo hay dos posibles tipos de error. Estos errores surgen al responder las siguientes preguntas: si se encuentra diferencia entre ambos tratamientos, ¿qué tan seguro se puede estar de que ésta no ocurre únicamente por casualidad? o bien, si no se halla diferencia entre las dos terapéuticas, ¿qué tan seguro se puede estar de que efectivamente no la hay? Estas preguntas se plantean con la finalidad de evitar concluir en forma errónea la existencia o ausencia de diferencias entre ambos tratamientos. Esta situación, en el caso de la primera pregunta, también se conoce como error tipo 1; dicho en otra forma, consiste en asegurar de manera errónea que existe diferencia desde el punto de vista estadístico, cuando en realidad no la hay. En el segundo caso, el llamado error tipo II sucede cuando se asegura, también equivocadamente, que no existe diferencia estadística entre los tratamientos cuando en verdad sí se presenta. En ambas situaciones, muestras pequeñas significan mayor poslb!lldad de cometer uno u otro tipo de error.

En otras palabras, el error tipo I consiste en rechazar Hl cuando en realidad es verdadera. El error tipo II consiste en aceptar H 1 cuando en realidad es falsa. Este proceso de decisión se presenta en la figura 18-1. .

Se denomina alfa (a) al ruvel de slgnlficancia (el nivel aceptado generalmente para considerar que existe diferenCia) que no es dada por casualidad o por el azar, es decir, que al menos 19 en 20 veces el resultado sea favorable al de los dos tratamientos; dicho de otra manera, 95 veces en lOO, o bien, como estadisticamente se expresa, que el valor de p sea Inferior a 0.05 (p<0.05). Este ruvel de slgnlficancla propuesto puede ser más rígido, por ejemplo de 0.01 o de 0.001. etcétera, dependiendo del interés del Investigador. A medida que disminuye el valor de p, aumenta el nivel de slgnlficancla. En ocasiones al error tipo I también se le ha llamado error de tipo alfa; en realidad esta denominación se refiere a que el nivel para no cometer el error tipo 1, ha sido señalado en 0 .05 o 0.01. En el caso del error tipo n, dependerá de la seguridad que se quiera tener para concluir que no hay diferencia cuando, en efecto, la hay y la magnitud desde el punto de vista estadístico que se desea atribuir a este

.'

266

Resultado del estudio

EPIDEMIOLOGIA

HI verdadera

Se acepta HI Correcto

Se rechaza HI Error tipo I

Realidad

HI falsa

Error tipo 11

Correcto

Fig. 18-1. El error tipo I consiste en rechazar Hl cuando en realidad es verdadera. El error tipo 11 consiste en aceptar H 1 cuando en realidad es falsa.

valor es conocido como beta (¡J), valor que al restarse de 1, se denomln'l como poder o potencia de la prueba. En ocasiones, el error tipo n se le llama error tipo beta (¡J); en realldad, beta (¡J) se refiere a la magnitud que se desea dar a la posibilidad de concluir que no existe diferencia cuando en realldad sí la hay. El poder de la prueba se expresa como 1 - f3, y por lo regular un poder de 80 o 90%, dependiendo de las circunstancias, se considera suficiente, es decir, un valor para beta de 0.20 o 0.10. Mientras mayor sea el nivel de slgnificancia (a) que se busca y mayor el poder que se desea de la prueba (¡J), más grande será el tamaño de la muestra (fig. 18-2). Para ejemplificar los errores tipo 1 y tipo n, se retoma el caso de un estudio de las enfermedades neopláslcas. Suponga que al término del estudio se reclutaron 50 pacientes evaluables por grupo y que en el grupo experimental la proporción de remisiones fue de 65% y en el grupo control, de 55% (note que esta cifra es 5% Inferior a la que se había encontra(io en varios estudios previos). Aun cuando el grupo experimental parece ser superior en sus resull::!-dos, ello no puede asegurarse, ya que al hacerlo probablemente se estaría cometiendo un error tipo 1; esto es, que cuando se hace el anállsls estadístico, se encuentra una diferencia significativa, cuando en realldad no hay tal desde el punto de vista clínico, lo que equivale a señalar que los resultados pueden estar dados únlcamente'.por casualldad. ..)

Cuando rió,se encuentra diferencia estadística entre dos gruposr\!,qué tan seguro se puede estar de que en real!dad no existe díferencla entre los tratamientos utilizados? Una alternativa es analizar el poder de la prueba. El poder de la prueba es la capacidad de rechazar la mpótesls nula cuando ésta es verdadera. Al llevar a cabo los cálculos correspondientes, se encuentra que con los datos proporcionados en el ejerclclO anterior, el poder de la prueba es de 43%; esto significa que probablemente se está asegurando que no existe diferencia cuando en realidad puede haberla. ¿Qué sucedió en este estudio? Los datos obtenidos en el grupo control y los del grupo experimental fueron de 60 y 75%, respectivamente, por tanto, la diferencia, o delta, es de 15% y la mínima diferencia que se acepta para concluir que los tratamientos son dístintos es de 0.05 o 5%, es decir, el valor de alfa (a) de 0.05 o 5%, y el valor de beta (¡J) de 0.10 o 10%; esto significa que el poder de la prueba será de 90% y que se seleccionarán los dos extremos de la curva de posibilidades de la distribución normal o gausslana. De acuerdo con todos los

0.2

0.18

0.16

0.14

0.12

0.1

0.08

0.06

0.04

0.02

O 84

CALCUW DEL TAMAÑO DE lA MUESTRA 267

~ .-f \ / \

/ \ / \ / \ \

/ \~ \ L alfa & \.

./ hl.. beta '-.. 86 88 9'0 92 94 96 98 100

1-- Media 2 = 90 - Media 1 = 95

Fig. 18-2. Representación gráfica de los errores tipos 1 y 11.

valores enunciados y al efectuar el cálculo del tamaño de la muestra, se sugiere que ésta sea de 203 pacientes por grupo, cifra muy diferente a los 50 Individuos por grupo previamente enunciada (cuadro 18-1).

Así, es posible explicnr con mayor claridad los resultados del estudio: muy probablemente, si éste se hubiera seguido por más tiempo o si de alguna forma se hubiera incluido un número mayor de sujetos, se habría encontrado que la diferencia entre los dos grupos era estadísticamente significativa.

Esto también explica en cierta forma por qué en el grupo control el resultado fue Inferior ,¡: los descritos con anterioridad. De Igual modo, si no se hubiera demostraao diferencia entre los dos grupos, con un poder de la prueba de 90% se habría podido asegurar que la diferencia en realidad no era significativa; en consecuencia se reduciría la posibilidad de cometer error tipo n. ¿Qué habría sucedido si los Investigadores hubieran conocido cuál debía ser el tamaño de la muestra necesario para el estudio? Tal vez habrían optado por no realizar éste, ya que los resultados, aun cuando fueran favorables al grupo experimental, desde el punto de vista estadístico no habrían sido significativamente importantes, o bien como alternativa se habría elegido efectuar el estudio con la participación de varios centros hospitalarios.

En el caso ejemplificado se utilizaron proporciones tanto para el cálculo del tamaño de la muestra como para el análisis de los resultados. Los mismos conceptos se usan al calcular muestras con promedios, con la salvedad de que en esta circunstancia es necesario conocer éstos, así como la desviación estándar de estudios anteriores.

268 EPIDEMIOLOGIA

Cuadro 18-1. Tamaño de muestras por grupo para la comparación de dos proporciones en dos conjuntos independientes de pacientes. Niveles de alfa de

0.05 y poder de 0.90 (1-/31 en uno (Al y otros (Bl extremos de la curva de probabilidades de distribución gaussiana

Grupa control Grupo experimental lA) lB)

~1 1r2

0.75 0.60 165 203

0.60 0.50 421 518

0.60 0.30 46 56

0.60 0.20 24 30

0.50 0.40 421 518

0.50 0.25 63 77

0.50 0.20 42 51

0.40 0.30 387 476

0.40 0.25 165 203

0.40 0.20 88 108

0.20 0.15 981 1207

0.20 0.10 212 261

0.20 0.05 76 92

Por último, se comentó que en el cálculo del tamaño de la muestra. en este caso especifico, se utilizan los dos extremos de la curva normal de probabilidades (hIpótesis de dos colas); esto se explica porque en el estudio que se propuso, el Interés desde el punto de vista clínico consistió en observar si existía diferencia en los casos que entrarían en remisión. sin que trp.portara cuál tratamiento era mejor. En general, se s"\Igiere que los dos \;xtremos de la curva de probabilidades se usen en el 6¡i.lculo del tainaño 'de la muestra; ello, cuando va a utilizarse un procedimiento nuevo y exista la posibilidad de que brinde un beneficio, pero también que sus efectos puedan ser nocivos. En el caso de las enfermedades neopláslcas. el ejemplo sería que el tratamiento experimental fuera desconocido y que las probabilidades de que los resultados fueran iguales al tratamiento control o Incluso peores. De hecho, excepto en muy contadas ocasiones, el Investigador debe tener siempre en mente que el tratamiento experimental puede tener mayores efectos nocivos que la terapéutica estándar. Ahora bien, ¿en qué forma repercuten estos valores en el tamaño de la muestra? En el caso de que se use un solo extremo de la curva (esto es, cuando el Interés es demostrar la superioridad de un tratamiento con respecto a otro, sin que baste que sean diferentes), el tamaño de la muestra es menor que en el caso de que se utilicen los dos extremos de la curva de distribución.

CALCULO DEL TAMAÑO DE lA MUESTRA 269

Estas Ideas fundamentales se aplican en general a cualquier tipo de estudio comparativo; en la selección de un método adecuado para la determinación del tamaño de la muestra han de considerarse los siguientes puntos:

1. Debe determinarse si la variable de Interés es una proporción o un valor promedio, así como la diferencia clínicamente Importante (<l.).

2. Hay que reconocer el tipo de relacIón de los grupos por comparar, es decir, sI éstos son IndependIentes o no. El tipo de relacIón depende del dIseño del estudio; en general se puede afirmar que los grupos no son IndependIentes sI se estudian grupos cruzados (crossover) o pareados. En los ejemplos de este capítulo se manejan grupos IndependIentes. ,

3. Ha de determInarse la dIreccIón de la hipótesis. En el ejemplo, el Interés consIste en probar silos efectos del tratamIento son alternativamente dIferentes (no Importa cuál es mejor); esto ~ conoce como hipótesis de dos colas. Exlsten ocasiones en que el Interés se basa en demostrar que un tratamIento es superior con respecto a otro; esto se denomIna hIpótesis de una cola.

4. Hay que considerar los valores máxlmos tolerables de los tamaños de los errores, especificando los valores de alfa y beta.

5 Se requiere conocer la variabilIdad Intrínseca de la variable por medIr; es necesario saber la desviación estándar de la variable de Interés. Este dato puede obtenerse a partir de un estudio piloto o de la literatura.

Es probable que anotar las fórmulas que habitualmente se utilizan para el cálculc.- del tamaño de la muestra complique los conceptos que se espera hayan sIdo claros hasta aquí. En todo caso, es más convenIente proporcionar tablas en que los tamaños de las muestras ya se han calculado, según los valores de tratamIentos y controles ("1 y "2) y los nIveles de slgnlflcancla deseados (ay (J). En estas tablas sólo se muestran algunos de lo.s valores que se usan con mayor frecuencIa. Sin duda, 'á ay quien está Interesado en saber más detalles de cómo calcular el tamaño de la muestr,,', o bien quIere conocer dIferentes valores de acuerdo. con las proporcIones deseadas; en tal sItuacIón, las alternativas son remItir al lector a las referencIas que se señalan al final de este capítulo O dar una explicacIón más detallada con el uso de la fórmula que regularmente se utiliza en este tipo de situaciones, que es como sigue:

N 2(Za+Zp) + 2it(I-1i)

I grupo = <1.2

en donde:

NI grupo representa el tamaño de la muestra en cada grupo; por tanto, 2N es el tamaño total de la muestra.

Z. corresponde al valor de p dentro de la curva normal de probabilidades; así, por ejemplo, 0.05 corresponde a un valor de Z Igual a 1.645 en un solo extremo de la curva, ya 1.960 en los dos extremos.

270 EPIDEMIOLOGlA

Z~ representa el valor de p, también dentro de la curva de probabilidades. En este caso, el valor es de 0.10 que corresponde a un valor de 1.282, lo cual da un poder de prueba de 1 - ti, o sea, 0.90.

Ji corresponde al promedio de n:l y "2. ~, corresponde a la diferencia entre "1 y "2. "1, corresponde a la proporción del grupo control. "2, corresponde a la proporción del grupo experimental.

Al sustituir los valores del mismo ejemplo de las enfermedades neopláslcas en la fórmula se tiene:

N/grupo = 2 (1.960 + 1.282)2 0 .675(0.325) = 205 (0.15)2

El tamaño de la muestra es de 205 pacientes por grupo. es decir. 410 en total.

En el caso de la determinación del tamaño de la muestra, cuando los valores están expresados en promedios y el diseño es de grupos Independientes, la fórmula para calcular aquél es diferente; no obstante, el principio es el mismo. La fórmula que regularmente se usa en estos casos es;

N 2 (Za + Zp) el-

/grupo = t.

en donde los valores son los mismos que en la fórmula anterior para Z, y Zp; a - desviación estándar (valor que debe provenir de un estudio previo); t. - la diferencia entre ¡.JI y ¡.J2; ¡.JI, corresponde al promedio del grupo de control, y ¡.J2 - corresponde al promedio del grupo experimental.

Para dar un ejemplo de esta situación se utiliza de nuevo el ejemplo del hlpertensivo para el tratamiento de la hipertensión arterial esencial. Se supone que la diferencia que Interesa demostrar entre el grupo lxperimental y el grupo control es de 5 mmHg, la cual, como ya se señaló, ~'I? clínicamente Importante. SI se considera qué valor.es de la tensión iÍÍastóllca, en estudios previos bien diseñados, muestra'n que la varianza obtenida en una muestra de pacientes hlpertensos fue descrita como de 3.86 mmHg, como es fácil suponer, al Igual que en el ejemplo previo de las enfermedades neopláslcas, a mayor diferencia entre los valores del grupo experimental y control, el tamaño de la muestra será mayor. Asimismo, a mayor valor de la varianza, mayor es el tamaño de la muestra. Los valores de alfa (a) y el poder de la prueba se eligen con el mismo criterio que para los ejemplos previos; nuevamente será de alfa de 0.05, es decir de Za - 1.960 (se toman las dos colas de la distribución normal); beta ({J) de 0.10 o sea, Zp - 1.282, esto es, un poder de la prueba de 0.90.

Sustituyendo estos dos valores en la fórmula:

N/ 2 (1.969 + 1.282) z (3.86)2

grupo = . 5 13

CALCULO DEL TAMAÑO DE LA MUESTRA 271

Es decir, se requieren 26 pacientes en total. o sea, 13 por grupo. La varianza se puede estimar a partir de una muestra de valores como el resultado de la suma de las diferencias, elevadas al cuadrado, entre los valores de cada su.Jeto y el valor promedio de la muestra. La raiz cuadrada de la varianza se conoce como desviación estándar.

Al igual que en el calculo del tamaño de la muestra con proporciones, también en el caso de promedios es factible utilizar tablas que se han elaborado para este propósito. La tabla que aparece en el cuadro 18-1. puede usarse para el cálculo del tamaño de la muestra usando promedios, y los grupos son independientes.

En el cuadro 18-2 se señala el valor de delta estandarizado y el tamaño de la muestra correspondiente de acuerdo con los valores señalados para alfa (a) y beta ({J), es decir, 14 pacientes por grupo , canti,dad muy similar a la que se obtiene con la fórmula antes descrita.

DETERMINACION DEL TAMAÑO DE MUESTRA PARA ESTUDIOS DE PREVALENCIA O ESTIMACION DE VALORES MEDIOS

POBLACIONALES

En este tipo de estudios formalmente no existe hipótesis por probar; el interés principal radica en la determinación (o estimaCión) de un porcentaje de interés de cierta población (p, eJ., la prevalencia de seropositividad de VlH en la población de donadores de sangre de cierto hospital). Cuando la variable de interés es cuantitativa, el valor de Interés puede ser un valor promedio (¿cual es la tensión arterial diastólica promedio en adultos sanos en la ciudad de México?). En ambos casos, debe quedar claro que no existe una hipótesis como tal. sino que e! problema se reduce a estimar con precisión la medida de Interés (la proporción de VlH o e! valor medio de tensión arterial).

Para entender la manera en que el tamaño de la muestra influye en la precisión de! cálculo, si la distribución de la medida de int.erés es normal o gaussiana, el efecto que se logra al incrementar dichoJamaño es que se ':obtienen curvas menos dispersas. La flgura 18-3 mue!¡,tra el efecto en la forma de curvas normales al incrementar el tamaño de. la muestra de una población hipotética de 10 a 20 sujetos para la determinación de un valor medio de interés (dado que se quiere mostrar el efecto de N en la forma de las curvas, éstas se pueden suponer centradas alrededor del valor O, sin que ello afecte de ninguna manera el argumento; en realidad, debían estar centradas alrededor de! verdadero, pero desconocido, valor media). En las curvas normales es posible interpretar el área bajo la curva como probabilidades. Así, para la curva correspondiente a un tamaño de N - lO, se puede calcular que la probabilidad de que el verdadero valor medio de interés se encuentre entre -6.20 y 6.20 es de 95%; en cambio, para la curva correspondiente a N ~ 20, para la misma probabilidad de 95%, el Intervalo se reduce; -4.38 a 4.38 (el cálculo de dichas probabilidades está muy relacionado con la estimación por medio de intervalos de confianza). En general, si se incrementa el tamaño de la muestra, entonces el intervalo disminuye. La idea fundamental es definir un error

272 EPIDEMIOWGIA

Cuadro 18·2. Se señala el valor de delta estandarizado y el tamaño de la muestra correspondiente de acuerdo con los valores para alfa (a) y beta (¡J)

Nivel de significancia

Una cola a = 0.025 a = 0.05 Dos colas a = 0.05 a = 0.1

Delta estandarizado p = 0.01 0.05 0.1 0.2 P = 0.01

0.08 59 42 34 26 50 0.85 52 37 31 23 45 0.90 47 34 27 21 40 0.95 40 30 25 19 36 1.00 38 27 23 17 33 1.10 32 23 19 14 27 1.20 27 20 16 12 23 1.30 23 17 14 11 20 1.40 20 15 12 10 17 1.50 18 13 11 9 15

El va lor de delta estandarizado se obtiene con la siguiente f6rmula:

Delta estandarizado .. /JI - P2 a

0.05 0.1

35 28 31 25 28 22 25 20 23 18 19 15 16 13 14 11 12 10 11 9

en donde: PI, es el promedio en el grupo control; pz. el promedio en el grupo experimental; d, es la desviación estánoar.

Sustituyendo con valores la fórmu la se tiene:

Delta estandarizado .. 9~.~:O .. 1.30, resultado del mecanismo de decisión.

0.2

21 18 16 15 14 11 10 9 8 7

máximo permisible (un Intervalo de error máximo tolerable) e Incremen· tar el tamaño de la muestra (n) hasta no alcanzar este error.

En términos estadísticos, al Incrementar el tamaño de la muestra se obtiene una reducción en la varlanza o varlabllidad de la medida de Interés, lo que Implica una estimación más precisa de esta medida.

Debe quedar claro que para llevar a cabo dicho proceso es necesario tener una Idea de la varlabilldad de la curva curfudo n - 1 (o formalmente, de la desviación estándar poblaclonal) ; esta vartabllidad es Inherente al proceso de medición y se debe tanto a factores biológicos como a características del Instrumento de medición. Este valor se puede obtener a través de un estudio piloto o de una búsqueda en la literatura.

Por ejemplo, se desea estimar el tiempo medio de supervivencia a partir del diagnóstico de pacientes con cáncer en un sitio y estadio particular. Por medio de un estudio piloto en 10 sujetos, se sabe que la desviación estándar del tiempo de supervivencia es de 43.3 meses. Se quiere calcular el tiempo medio de supervivencia con un error máximo de ±4 meses y con una confianza de 95%.

En este caso, la fórmula para determinar el tamaño de la muestra está dada por:

I I I

CALCULO DEL TAMAfl'O DE lA MUESTRA

en donde: e - error máximo a tolerar - cuatro meses u - desviación estándar - 43.3 meses Z. - limite asociado a la confianza deseada - 1.96

273

Hay que mencionar que, en el ejemplo, se supone una distribución normal en los tiempos de supervivencia; si éste no fuera el caso, debe modificarse la fórmula correspondiente, aunque la Idea fundamental es la misma.

CONCLUSION

El cálculo del tamaño de la muestra constituye una parte' fundamental tanto de los estudios en que alguna Intervención terapéutica va a realizarse (esto es, esencialmente en los ensayos clínicos controlados) como de aquéllos de prevalencia o incidencia. Aun cuando existen diversos métodos para su cálculo, los principios en general son muy sImilares; esto, al tomar en cuenta los resultados en promedios o proporciones de los estudios previamente realizados, que deben ser el punto de partida de dicho tipo de trabajos. De Igual modo, son Importantes los niveles alfa (a) y beta ({J), con la flnalldad de llegar a conclusiones válidas, así como los valores esperados tanto del grupo control, habitualmente conocido, como del grupo experImental, del que existe

0.2

0.18 / 1"\

0.16

0.14 !.'

Ó.12 .. 0.1

0.08

0.06

0.04

0.02

o

/ \ / .,... 1-..\ J

// '\..\ " , f '\

// \\ 77 \\.

// \"-.-/~ ~"'-

I I I I I I I I -10 -8 -4 -2 o 2 4 6 8 10

Fig. 18-3. Distribución de la media de muestra. n ; número de casos.

274 EPIDEMIOLOGIA

casi siempre un antecedente que tiene que ser validado para poder generalizar los resultados.

Por último. es Importante mencionar que el cálculo del tamaño de la muestra tiene una estrecha relación con la factibilidad de la ejecución del estudio; después de conocer el número necesario de pacientes, una opción razonable seria no efectuar el estudio si éste rebasa la capacidad del sitio donde pretende llevarse a cabo o las posibilidades de organización de un trabajo multlcéntrlco. Para los lectores interesados en profundizar en ello, se proporciona una amplia serie de referencias en las que el tema se aborda con mayor complejidad.

REFERENCIAS

Bradford Hlll A: Texto básico de estadística médJca. BuenosAires: El Ateneo. 1980;220·229. Bulpitt C: Confldence Intervals. Lancet 1987;28:494-497. eoItan T: Statlstlcs In medicine. Bostan: Little Brown and Company. 1974. Daniel W: Bloestadística. México: Llmusa. 1982;91-95. Freyman J. Chalmers T. Smlth H: The lmportance oC beta. the type 11 error and sample

slze In the design and interpretatJon oí the randomized control tria!' N Eng J Med 1978;299;690-694.

Frledman L: Fundamentals oC cl1n1caI trlals. 2nd ed. Uttleton. Massachusetts: PSG PubUshing Company. 1985.

Haybtttle JL, Fowler JF. Emery EW: The number of patlents requlred In a cUntea! tria!. Br J Rad 1971;44;122-125.

LanchIn JM: Introductlon to sample size determinatlon and power analysis for cUruca! trials. Contr Clin Trtals 1980;2:93- 103.

Levtn J: Fundamentos de estadística en la Investigación social. México: Harla. 1977;94-98. Sackett D: CUntcal epidemiology. Am J EpldemJol1969;89:125-128. Sackett D: Rules of ev1dence and cUrucal recommendatIons on the use of antlthrombotlc

agents. Chest 1986;89: 125- 128. Schlesselman J: Plannlng a longitudinal study: I. Sample size determination. J Chronlc

DJs 1973;26;553-560.

~-.

Documents

Tamaño de La Muestra Clinico