6
GUÍA ACADÉMICA UNIVERSIDAD NACIONAL DE COLOMBIA Revista de la Facultad de Medicina 2001; 49 (3):175-180 Aspectos sobre diseño y tamaño de muestra en estudios de pruebas óstí 13gn cas Ricardo Sánchez Pedraza, Profesor Asociado, Departamento de Psiquiatría y Centro de Epidemiología Clínica. Iairo Echeverry Raad, Profesor Asociado, Departamento de Pediatría y Centro de Epidemiología Clínica, Facultad de Medicina, Universidad Nacional Dirección para SUMMARY This article deals with general and parti- cular aspects related with the meaning and development of diagnostic tests. Its main subject is about the elements needed for the appropriate sample size in these kind of studies. En este artículo se presentan algunas consideraciones generales y particula- res con respecto al significado y desa- rrollo de los estudios sobre pruebas diagnósticas. El centro del mismo se dedica a la formulación de los elemen- tos necesarios que subyacen al cálculo del tamaño de muestra en este tipo par- ticular de diseños. INTRODUCCIÓN En Medicina, una Prueba Diagnóstica (Px.Dx.) es cualquier dato que, perci- bido a través de alguno de nuestros sen- tidos, puede modificar las probabilida- des de un diagnóstico. Dentro de estos términos una Px.Dx. no sólo es aquella que puede ser verificada en un labora- torio, sala de rayos X, o unidad de pa- tología, después de un proceso tecno- lógico complejo, sino también, mediante lo observado, lo auscultado, lo palpa- do, lo percutido y demás elementos del ejercicio semiológico cotidiano (1). En este sentido, y como elementos para efectuar un mismo diagnóstico, se pue- den tener al alcance, por un lado unas pruebas sofisticadas, costosas e invasivas, y por el otro, sencillas pre- guntas, la observación o medición del tamaño, color u olor de un individuo o de una parte de su anatomía, la forma de saludar, la descripción de su com- portamiento, etc. En forma habitual las Px.Dx. se han utilizado en el intento de establecer con exactitud y precisión la presencia de alguna enfermedad o condición; sin embargo, también juegan papel impor- tante en el establecimiento de factores de riesgo, estadío o evolución clínica de las enfermedades, respuesta a las terapias e intervenciones, o en la pre- dicción de los desenlaces intermedios o finales (2,3). Los datos obtenidos para establecer la situación pasada o actual suelen llamar- se pruebas diagnósticas y los que proyectan sus resultados, con predic- ción de lo que puede suceder se cono- cen como pruebas pronósticas (4). El diagnóstico va en un sentido (del clí- nico hacia su paciente), y la enferme- dad en otro (del paciente al médico). Dicho de otra manera, el diagnóstico es lo que uno cree que el paciente tiene y la enfermedad es lo que realmente el individuo tiene. Un diagnóstico es apro- piado si ambos sentidos coinciden (4). Dado que esto es un asunto difícil, y a la vez esencia del proceso diagnóstico, el establecimiento de la presencia de una enfermedad se realiza más en términos de probabilidades de su ocurrencia. El proceso en el que se construye la probabilidad de decirle a alguien que está enfermo o que padece alguna con- dición, mediante el acopio necesario de Px.Dx. se denomina proceso diagnós- tico (1). Diagnosticar significa clasifi- car a los individuos en alguna condi- ción (5), sea esta una taxonomía nosológica, un síndrome, una enferme- dad, el estadío evolutivo, etc. Cada Px.Dx, sin importar sus caracte- rísticas, métodos utilizados, costos o sitio en la historia natural de la enfer- medad en la que se ejecute, es suscep- tible de ser medida en su rendimiento operativo (1). Características operativas de las pruebas diagnósticas En el proceso de mejoramiento conti- nuo de calidad, la tecnología de la sa- lud está a la caza de elementos diag- nósticos o pronósticos que cada día, con mayor validez y precisión, y me- nor costo y riesgo, sean más costo- 175

Formula Para Prueba Diagnostica

Embed Size (px)

Citation preview

Page 1: Formula Para Prueba Diagnostica

GUÍA ACADÉMICA UNIVERSIDAD

NACIONALDE COLOMBIARevista de la Facultad deMedicina 2001; 49 (3):175-180

Aspectos sobre diseño y tamaño de muestra en estudios de pruebasd· óstí13gn casRicardo Sánchez Pedraza, Profesor Asociado, Departamento de Psiquiatría y Centro de Epidemiología Clínica. Iairo Echeverry Raad, ProfesorAsociado, Departamento de Pediatría y Centro de Epidemiología Clínica, Facultad de Medicina, Universidad Nacional Dirección para

SUMMARY

This article deals with general and parti-cular aspects related with the meaning anddevelopment of diagnostic tests. Its mainsubject is about the elements needed forthe appropriate sample size in these kindof studies.

En este artículo se presentan algunasconsideraciones generales y particula-res con respecto al significado y desa-rrollo de los estudios sobre pruebasdiagnósticas. El centro del mismo sededica a la formulación de los elemen-tos necesarios que subyacen al cálculodel tamaño de muestra en este tipo par-ticular de diseños.

INTRODUCCIÓN

En Medicina, una Prueba Diagnóstica(Px.Dx.) es cualquier dato que, perci-bido a través de alguno de nuestros sen-tidos, puede modificar las probabilida-des de un diagnóstico. Dentro de estostérminos una Px.Dx. no sólo es aquellaque puede ser verificada en un labora-torio, sala de rayos X, o unidad de pa-tología, después de un proceso tecno-lógico complejo, sino también, mediantelo observado, lo auscultado, lo palpa-do, lo percutido y demás elementos delejercicio semiológico cotidiano (1). En

este sentido, y como elementos paraefectuar un mismo diagnóstico, se pue-den tener al alcance, por un lado unaspruebas sofisticadas, costosas einvasivas, y por el otro, sencillas pre-guntas, la observación o medición deltamaño, color u olor de un individuo ode una parte de su anatomía, la formade saludar, la descripción de su com-portamiento, etc.

En forma habitual las Px.Dx. se hanutilizado en el intento de establecer conexactitud y precisión la presencia dealguna enfermedad o condición; sinembargo, también juegan papel impor-tante en el establecimiento de factoresde riesgo, estadío o evolución clínicade las enfermedades, respuesta a lasterapias e intervenciones, o en la pre-dicción de los desenlaces intermedioso finales (2,3).

Los datos obtenidos para establecer lasituación pasada o actual suelen llamar-se pruebas diagnósticas y los queproyectan sus resultados, con predic-ción de lo que puede suceder se cono-cen como pruebas pronósticas (4).

El diagnóstico va en un sentido (del clí-nico hacia su paciente), y la enferme-dad en otro (del paciente al médico).Dicho de otra manera, el diagnósticoes lo que uno cree que el paciente tiene

y la enfermedad es lo que realmente elindividuo tiene. Un diagnóstico es apro-piado si ambos sentidos coinciden (4).Dado que esto es un asunto difícil, y ala vez esencia del proceso diagnóstico,el establecimiento de la presencia de unaenfermedad se realiza más en términosde probabilidades de su ocurrencia.El proceso en el que se construye laprobabilidad de decirle a alguien queestá enfermo o que padece alguna con-dición, mediante el acopio necesario dePx.Dx. se denomina proceso diagnós-tico (1). Diagnosticar significa clasifi-car a los individuos en alguna condi-ción (5), sea esta una taxonomíanosológica, un síndrome, una enferme-dad, el estadío evolutivo, etc.

Cada Px.Dx, sin importar sus caracte-rísticas, métodos utilizados, costos ositio en la historia natural de la enfer-medad en la que se ejecute, es suscep-tible de ser medida en su rendimientooperativo (1).

Características operativas de laspruebas diagnósticas

En el proceso de mejoramiento conti-nuo de calidad, la tecnología de la sa-lud está a la caza de elementos diag-nósticos o pronósticos que cada día,con mayor validez y precisión, y me-nor costo y riesgo, sean más costo-

175

Page 2: Formula Para Prueba Diagnostica

SÁNCHEZ R, ECHEVERRY J.

efectivos en el establecimiento o deter-minación del estado de las cosas.

Esto se logra mediante el proceso devalidación en el que un grupo de indivi-duos se somete tanto a una pruebadiagnóstica nueva como ante el estándarde referencia (patrón de oro o "Gold Stan-dard"), que no es otra cosa que la mejorprueba diagnóstica disponible para esta-blecer la verdadera condición o situaciónde un paciente.

Fruto de este proceso de validación seestablece para la prueba en cuestión unconjunto de indicadores de exactitud quehan sido llamados CaracterísticasOperativas de las Pruebas Diagnósticas(COPD).

Las COPD tradicionales son la Sensibili-dad (capacidad de la prueba en detectarlos enfermos), la Especificidad (capaci-dad de la prueba de detectar a los sanos),el Valor Predictivo Positivo (A la preva-lencia del estudio, cuál es la probabilidadde enfermedad si la prueba resultara po-sitiva?), y el Valor Predictivo Negativo(A la prevalencia del estudio, cuál es laprobabilidad de estar sano si la pruebaresultara negativa?).

Últimamente se han utilizado resúmenesde los anteriores indicadores (6,7), comolas razones de verosimilitud positivas,del inglés positive likelihood ratios ó (+)LR, las razones de verosimilitud negati-vas, del inglés negative likelihood ratiosó (-)LR, Y más recientemente las razo-nes de ventaja diagnóstica, del inglésDiagnostic Odds Ratio (DOR) (2). Es-tos indicadores se han convertido en me-didas de resumen de las COPD, con sumautilidad en el establecimiento más sólidoy depurado de las características intrín-secas de ellas, en las selección más apro-piada de un punto de corte en la prueba,en la escogencia de la prueba más ade-cuada entre homólogas o en la determi-nación de probabilidades pos-prueba (1).

El estudio de una prueba diagnósticaEl diseño general de una prueba

176

diagnóstica es el de un estudio transver-sal comparativo (8). En general, para sudesarrollo se toma un grupo de indivi-duos enfermos y otro de sanos (selec-cionados en forma ideal, de un universo,tras un proceso aleatorio), definidos entales condiciones a la luz de un mismoestándar de referencia. A continuaciónunos y otros son sometidos, en formaenmascarada e independiente, a la lectu-ra de la prueba bajo investigación (9).

La calidad de un estudio de Px.Dx. serelaciona con aspectos del diseño, conlos métodos para reclutar la muestra (enla selección), con la ejecución de las prue-bas (en la medición) y con lo completodel reporte del estudio (10,11). Un as-pecto trascendente, pero un tanto des-cuidado a nuestro juicio, como es el nú-mero mínimo necesario de pacientes parala obtención de indicadores precisos,será discutido más adelante.

De manera más específica, con respec-to a la muestra de pacientes (1,2,4,9,12),esta debe ser seleccionada consecutiva oaleatoriamente, reclutada como unacohorte no clasificada según su estadode enfermedad, en escenarios en dondela prueba bajo estudio pudiera ser reali-zada en el futuro. El proceso de selec-ción y referencia utilizado y las caracte-rísticas demográficas y clínicas de lospacientes deben ser completamente des-critas. Es óptimo incorporar en la mues-tra todo el espectro de enfermedad: Si enla muestra sólo se incluyen individuos se-veramente enfermos y claramente sanos,la prueba puede no detectar enfermoscuando se aplica en poblaciones en lascuales hay estadías menos severos de laenfermedad. Esto cobra especial impor-tancia cuando el resultado de la pruebaque se estudia se correlaciona con la se-veridad de la enfermedad; cuando el ren-dimiento operativo de una prueba semodifica en la medida en que se modifi-ca el espectro de enfermedad, esa prue-ba revela Sesgo de Espectro (l3).

En lo referente al diagnóstico por el.Qª=trón de referencia (1,2,4,9,14), los mé-

todos y las pruebas deben ser descritosen detalle. El diagnóstico de la condicióndebe ser el más cercano a la verdad, y elmismo estándar de referencia debe ha-ber sido aplicado a todos los pacientespor igual, desconociendo cualquier datoadicional de ellos, incluso cómo resulta-ron en la prueba bajo estudio. Es funda-mental disponer de un patrón de oro ade-cuado: Para evaluar una nueva Px.Dx.es necesario que en la muestra se inclu-yan individuos en los que se haya iden-tificado con buen grado de certeza eldesenlace de interés. Si el patrón de oroque me ha definido dicho desenlace esimperfecto se corre el riesgo de califi-car como falsos positivos a individuosno detectados por el patrón de oro ocomo falsos negativos a los errónea-mente detectados positivos por el pa-trón de oro.

Eh relación con la prueba bajo estudio(1,2,4,9,14), su aplicación debe serdescrita con detalle. A los miembrosde la muestra se les deben efectuar lasevaluaciones de forma enmascarada, osea que el investigador que evalúa laprueba debe desconocer el resultado delpatrón de oro y el que aplica el patrónde oro debe ignorar el resultado de laprueba que se estudia. Se deben haberreportado todos los resultados inclusoaquellos con resultados indeterminadoso en "zona gris" y haberse realizadoantes de iniciar cualquier tratamiento.Evidencia empírica reciente (16,17),ha revelado que los sesgos más impor-tantes en los estudios de PxDx., radi-can en el diseño y muy particularmen-te en los siguientes, en su orden:i. Reclutar por separado a "enfermos"y a "sanos" (Sesgo de selección).

ii.Dada una información preliminararrojada por la prueba bajo estudio,ejecutar diferentes patrones de refe-rencia a enfermos y a sanos (Sesgode medición en la verificación).

iii.Determinar la prueba bajo estudiosiendo conocedor (no enmascarado)de la real condición de salud de losindividuos, o viceversa, establecer lasituación real del individuo mediante

Page 3: Formula Para Prueba Diagnostica

ASPECTOS SOBRE DISEÑO Y TAMAÑO DE MUES1RA

el estándar de referencia conociendoel resultado arrojado por la pruebabajo estudio (Sesgo de medición porun diagnóstico conocido).

Resultados de una pruebadiagnósticaAl culminar el proceso se contará concuatro posibles pares de resultados in-herentes a las pruebas, dos aciertos ydos errores: En los pares de aciertos,la prueba resulta positiva y el individuose encuentra realmente enfermo (ver-dadero positivo) o la prueba resulta ne-gativa y el individuo realmente es sano(verdadero negativo). En los errores,la prueba resulta positiva y el individuose encuentra realmente "sano" o librede la condición bajo estudio (falso po-sitivo) o la prueba resulta negativa y elindividuo realmente está enfermo (fal-so negativo).

Las observaciones epidemiológicas tie-nen dos fuentes de error (18-20): Elerror sistemático y el aleatorio. El errorsistemático es la desviación sistemáti-ca de la verdad y por ello es llamadotambién sesgo (21). El sesgo sueleintroducirse ya sea en la selección delos individuos o en los procesos y ele-mentos para medición de ellos, seanestos los instrumentos de medida o losobservadores. Exactitud, ausencia desesgo o validez, son conceptos simila-res, aunque no idénticos.

El error aleatorio es aquel que se pre-senta debido al azar y puede producir-se por efectos de la variabilidad bioló-gica del individuo, del observador y delos instrumentos de medida (22).Reproducibilidad, confiabilidad, con-fianza, consistencia o precisión sonpalabras que sugieren un escaso erroraleatorio.

La ausencia de sesgos no excluye loserrores aleatorios y viceversa. Porejemplo, si un báscula se encuentradescalibrada con un exceso de 200 gra-mos en cada medida, pero de maneraconsistente en los mismos sujetos,

medida tras medida, los resultados ob-tenidos muestran poca variabilidad, di-ríamos que dicha báscula es inexactapero precisa. El instrumento está ses-gado (descalibrado) pero con poco erroraleatorio (preciso). El interésepidemiológico es la obtención deindicadores de frecuencia o de efectoque sean ante todo válidos y precisos(23).

Aunque suene reiterativo, si un estudiotoma un grupo significativo y suficientede individuos sanos y enfermos, conun perfil similar al que presenciaríamosen el ejercicio clínico, y a todos los con-fronta de manera enmascarada e inde-pendiente a través tanto de una pruebabajo estudio como del estándar de re-ferencia, diríamos que ese estudio depruebas diagnósticas es válido (o seaque no se cometieron errores sistemá-ticos o sesgos en el proceso de selec-ción y medición), y por lo tanto no sedesautorizan los resultados obtenidos(22).

Pero lo anterior no anula la posibilidadde que se hayan introducido erroresaleatorios en el estudio, y que por estolos resultados puedan haberse presen-tado sólo por efecto del azar. Este efec-to no permite tener la suficiente con-fianza y precisión en los estimadoresdel indicador operativo de la pruebadiagnóstica en consideración.

No existen pruebas perfectas; cada unaposee un grado relativo de aciertos yerrores. Una prueba útil será aquella enla que la relación entre los aciertos ysus costos, supere el de los errores ysus costos (6).

Teniendo como referente el diseño ge-neral presentado previamente, se pue-den plantear diferentes modalidades deestudio de una prueba diagnóstica:1. Se tiene un patrón de oro robusto y

se quieren conocer las característi-cas operativas de una nueva prueba,contrastando sus resultados con esepatrón de oro.

Rev Fac Med UN Col 2001 Vol.49 N°3

ii. Se quieren comparar dos pruebas,una de las cuales tiene característi-cas operativas reconocidas.

iii,Se quieren comparar dos pruebas,contrastando su exactitud.

iv.Se desea evaluar la concordanciaentre dos pruebas diagnósticas.

El tamaño de la muestra (TM)Una de las maneras de disminuir la po-sibilidad de errores aleatorios en un es-tudio, es calcular el número mínimonecesario de observaciones o indivi-duos para obtener unos resultadosprecisos y consistentes.

Para resumir, el calcular un tamaño demuestra (TM) permite establecer demanera precisa el verdadero estimadordel rendimiento operativo de una prue-ba diagnóstica o de la diferencia en elfuncionamiento de dos pruebas, con unnivel tolerable de error aleatorio. Llamala atención la escasez de literatura alre-dedor de este tópico, así como la faltade un consenso, evidente en los múlti-ples enfoques que se plantean en dife-rentes artículos sobre evaluación dePX.Dx.

Teniendoencuentalosdiversosdiseñosquepueden plantearse para el estudio de unaPx.Dx,no tienesentidoestablecerun únicométodo para el cálculo del TM. Por estarazón, ante la pregunta: ¿Qué tamaño demuestra necesito?, la respuesta será: De-pendeel diseñoque tengael estudio.

Si se tienen en cuenta las característi-cas específicas del diseño del estudio,considerando cómo se efectúe el plan-teamiento de hipótesis, se pueden te-ner presentes las siguientes opciones:l. Se tiene un patrón de oro robustoy se quieren conocer las caracterís-ticas operativas de una nueva prue-ba, contrastando sus resultados conese patrón de oro: Teniendo en cuen-ta que algunos estudios de PX.Dx. conesta estructura pueden semejar un dise-ño en el cual se analiza una eventual aso-ciación entre una condición (enfermedado diagnóstico) y un método para

177

Page 4: Formula Para Prueba Diagnostica

SÁNCHEZ R, ECHEVERRY J.

detectarla o medirla (prueba), una aproxi-mación muy general estima que un ta-maño debe ser suficiente cuando quieraque hay mínimo 10 individuos en cadacasilla marginal de la tabla de 2x24• Es-tos valores deberán ser ajustados deacuerdo con el número de individuoscon y sin la condición que se buscadiagnosticar, aspecto que se mostraráposteriormente.

2. Se quiere evaluar una hipótesissobre características de una nuevaprueba: En estos casos lo que se quie-re evaluar es si las características de lanueva prueba (sensibilidad, especifici-dad o valores predictivos) difieren delas de la prueba convencional. Esto seilustra con el siguiente ejemplo:

Existe una prueba de referencia "A" ydespués de varios estudios se sabe quesu sensibilidad es del 90%. Se desarro-lló una nueva prueba "B" cuya sensibi-lidad se quiere comparar con la de laprueba de referencia. ¿se puede demos-trar que es diferente la sensibilidad dela nueva prueba?De acuerdo con el procedimiento deuna prueba de hipótesis, el planteamien-to sería el siguiente:~: Sensibilidad de A = Sensibilidad de BHa:Sensibilidad de A toSensibilidaddeB

Dichas hipótesis estarán planteadasen términos de proporciones.Si se considera que los pacientes o lasobservaciones en las cuales se va aaplicar la nueva prueba son muy simi-lares a los utilizados en otros estudiospara evaluar la prueba de referencia,puede no ser necesario volver a aplicaresta última prueba. En tal caso se asu-me que la sensibilidad de la prueba dereferencia "A", expresada como pro-porción, es conocida y que el objetivodel estudio es estimar la sensibilidad dela nueva prueba "B".

Para el cálculo del tamaño de la mues-tra se utiliza la siguiente función que,con un nivel de significación a y unpoder de 1-B, permite comparar una

178

proporción conocida 1t1 con una pro-porción 1t2 que se va a estimar (24):

N= {Z¡'al2" [1t¡(1-1t¡)] +Z¡.B" [1tP-1t2)]}2

02En esta función 1t1 es el valor conocidode la sensibilidad, especificidad o valo-res predictivos de la prueba patrón, 1t2es el valor que se espera tenga la prue-ba en dichos parámetros, y s- 1t2 -1ti"

En el ejemplo que se ha mencionado, sise anticipa que la nueva prueba puedetener una sensibilidad del 95%, los va-lores dentro de la función para calcularla muestra serían los siguientes:

1t1 = 0.91t2 = 0.958 = 0.05

Los valores de Z l-u/2 y Z I-B son térmi-nos constantes derivados de la distri-bución normal y se presentan en lastablas 1 y 2. El valor ex,también deno-minado significación o probabilidad deerror tipo 1, corresponde a la probabi-lidad que asignamos al error de recha-zar la hipótesis nula cuando esta es cier-ta. En investigación clínica suele fijar-se en el 5% (0.05), aunque, dependien-do del caso, pueden asignarse valoresmenos estrictos (10% ó 0.1) o más es-trictos (1% ó 0.01). El valor B corres-ponde a la probabilidad de cometer errortipo 2, es decir de no rechazar la hipótesisnula cuando esta es falsa. Usualmente seestablece en un 10 ó 20% (O.l ó 0.2).

Al reemplazar los valores correspon-dientes en la función se obtiene un TMde 238 individuos, que es el número depacientes a los cuales hay que aplicarla nueva prueba para encontrar una di-ferencia significativa en los valores desensibilidad.

Tabla 1. Valores Z para diferentes niveles dealfa, pruebas a dos colas.

a a/2 l-a/2 Z l-al2

0.1 0.05 0.95 1.6449()n~ OO?'i o Q7'i 1 Q¡;

0.025 0.0125 0.9875 2.24140.01 0.005 0.995 2.5758

Tabla 2. Valores Z para dos niveles de beta.

B 1-B Z ¡.S

0.2 0.8 0.84162

0.1 0.9 1.2816

Dado que en la práctica clínica los va-lores predictivos dependen fuertemen-te de la prevalencia de la condición quela prueba mide, se debe hacer la estimaciónde dichos valores con base en el teorema deBayes, de la siguiente manera (25):

Sensibilidad xPrevalenciaVpp=------------------------Sensibilidad x Prevalencia + (l-Sensibilidad) x (l-Prevalencia)

VPN = __ Es-,-p_ec...::.ifi_lc_id_ad_x_:(_l-_P_re_val __en...:.cia:_! _

Especificidad x (l-Prevalencia) + (1-Especificidad) x Prevalencia

El tamaño de la muestra necesario será aquelque resulte mayor luego de calcularlo paralos escenarios de sensibilidad, especificidado valores predictivos, o aquel dependientede la característica que resulte más impor-tante para la prueba que se está evaluando,por ejemplo la sensibilidad si se trata de unaprueba de tamizaje.

3. Se desea evaluar una hipótesis sobrediferencia de proporciones: En este casose aplican simultáneamente dos pruebasdiagnósticas a los mismos individuos. Sequiere evaluar la hipótesis nula de no dife-rencia en las exactitudes que arroja la prue-ba y el estándar de referencia. Hay que te-ner en cuenta que en tal situación los datosno son independientes, razón por la cual elcálculo del tamaño de la muestra sobre lapremisa de diferencia de proporciones enmuestras independientes resulta erróneo.

Cuando se plantean hipótesis sobre dife-rencia de proporciones en pruebasdiagnósticas que se aplican en un mismoindividuo, se utiliza la exactitud de la prue-ba. Recordemos que la exactitud es eltotal de verdaderos positivos y verdade-ros negativos que arroja la prueba, y quepuede expresarse como una proporción.En tal caso las hipótesis se plantean de lasiguiente manera:

Ho: Exactitud de A = Exactitud de B

H,,: Exactitud de A -:f:. Exactitud de B

Page 5: Formula Para Prueba Diagnostica

ASPECTOS SOBRE DISEÑO Y TAMAÑO DE MUESTRA

Plantear las hipótesis de esta manerasupone que se dispone de un patrón deoro de muy buena calidad, contra el cualse están contrastando las dos pruebas.

La tabla 2x2 correspondiente podríatener esta estructura:

Resultados exactos*

Si No

Prueba A

Prueba B

*Resultados exactos: Corresponden a lasuma de verdaderos positivos y negati-vos. En cada celda de la columna corres-pondiente a "Si", se incluye el número decasos verdaderos positivos y verdade-ros negativos para cada una de las pruebas.

Teniendo en cuenta la situación de noindependencia, la anterior tabla 2x2puede construirse de tal modo que lasunidades que queden en cada celda seanlos pares de observaciones efectuadossobre un mismo individuo. El diseñode la tabla es ahora el siguiente:

Prueba AResultados exactos

Si No Total

v» Si r s r+s¡:o.g'"ro .c:! o

..0- -g No<l) ::12 :c >(

o...~ <l) t u t-i-u

Total r+t s+u N pares

Esta tabla tiene la estructura utilizadaen la prueba de McNemar (26). En estetipo de estadístico se trabaja con losdenominados pares discordantes, queson los correspondientes a las celdas sy t, ya que los pares concordantes (cel-das r y u) no dan información sobrelas diferencias que se están evaluando(27). La proporción de discordantes(1tDiscordantes) puede calcularse así:

Rev Fac Med UN Col 2001 Vo1.49 N"3

(s+t)

1tDiscordante = N pares

El cociente 'JI dice qué tanto mayor es la discordancia de la prueba B en relación con ladiscordancia de la prueba A. En la tabla de pares equivale a dividir s entre t:

'JI = s/t

Para calcular el tamaño de la muestra es necesario anticipar la proporción de discordanciaentre las dos pruebas y el cociente 'JI. La función que se aplica es la siguiente:

N={Z¡ OI2(\jI+ 1)+Z¡_B--J[(\jI+ 1)2-(\jI-l )ZreDiSCOrdanCiaW

('JI -1Y re2Discordancia

Si se quieren comparar dos pruebas con una probabilidad de discordancia de 0.15, teniendouna discordancia tres veces mayor en una prueba que en otra, se tienen los siguientesvalores para reemplazar en la función:

re Discordancia = 0.15'JI=3Z l-an = 1.96Z lB = 0.841

Con los anteriores valores se requiere una muestra de 207 individuos a los cuales aplicar lasdos pruebas.

4 Se quiere evaluar una hipótesis de concordancia: En tal caso se asume que hay Nsujetos evaluados por dos pruebas diferentes. Así, la probabilidad estimada de desacuerdoentre las dos pruebas es:

1t tne: d+N

Donde d es el número de desacuerdos entre las dos pruebas. Como puede verse, aquí seaplica un criterio similar al del caso en el que se plantea la evaluación de diferencia deproporciones.

Para una amplitud determinada W1tde un intervalo de confianza al1 00(1a)%, el tamaño dela muestra será:

N= 41t Dis (1- 1tDis) Z21-a/2

WZ1t

¿Cuántos enfermos y cuántos sanos?Para definir el número de pacientes en la muestra con y sin la condición que se estámidiendo, el criterio es incluir un número similar de pacientes dentro de cada uno de losposibles espectros de la enfermedad, esto es, intentar en lo posible reproducir la prevalenciao todo el espectro de la enfermedad, similar al que se verifIcaría en la práctica clínica. Porejemplo, si la enfermedad tiene tres niveles de severidad (leve, moderado y grave), y eltamaño calculado de muestra son 400 pacientes, se deberían incluir 100 pacientes sin laenfermedad, 100 leves, 100 moderados y 100 severos.

Otro criterio, fundamental cuando se evalúan características operativas, es que la propor-ción de enfermos y sanos en muestra refleje la prevalencia de la condición que se buscadiagnosticar, en la población en la cual se aplicará la prueba. En general, es recomendableincluir más individuos enfermos que sanos, aunque se estén creando artifIcialmenteprevalencias superiores al 50%, ya que de esta manera se tendría más oportunidad deincluir pacientes con espectros de enfermedad desconocidos o posiblemente no detectables.

179

Page 6: Formula Para Prueba Diagnostica

sÁNCHEZ R, ECHEVERRY J.

1. Echeverry J, Ardila E. Pruebasdiagnósticas y proceso diagnóstico. En:Ardila E, Sánchez R, Echeverry J. Estra-tegias de Investigación en Medicina Clí-nica. Bogotá: Editorial Manual Moderno:2001.

2. Deeks JJ. Systematic reviews onevaluations of diagnostic and screeningtest. BMJ 2001 ;323: 157-162.

3. Ruiz A, Ruiz JG. Fundamentos de In-vestigación Clínica. Exámenes diagnósti-cos: Aproximación a su uso racional. Pe-diatría 1993;28(2):111-119.

4. Kramer HC. Medical Test: Objective andQuantitative Guidelínes. SAGEPublications, Inc. Newburry Park, Cal,USA. 1992. Chapter: 14.

5. De Almeida N. Epidemiología sin Nú-meros: Una introducción crítica a la cien-cia epidemiológica. Serie Paltex N.28.OMS-OMS. 1992.

6. Suchman AL, Dolan JG. Odds andLikelihood Ratio. In: Griner, Panzer RJ,Greenland P, eds. Clinical diagnosis andthe laboratory. Logical strategies forcornmon medical problems. Chicago: YearBook Medical Publisher., 1986:36-43.

7. Zweig MH, Campbell G. Receiver -Operating Characteristic Curve (ROC)Plots: A fundamental Evaluation Tool inClínical Medicine. Clin Chem1993;39(4):561-77.

8. López F. Interpretación de PruebasDiagnósticas. En: López F. Manual deMedicina Basada en la Evidencia. Edito-rial Manual Moderno & JGH Editores,2000.

9. Dawson-Sanders B, Trapp RG. Proce-dimientos para valorar diagnósticos. En:Dawson-Sanders B, Trapp RG.Bioestadística Médica. Manual Moder-no, México 1990:265 -82.

10. Cochrane Methods Group on Systematic

REFERENCIAS BIBLIOGRÁFICAS

Review of Screening and Diagnostic Test.Recommended methods [update 6 jun1986]. www.cochrane.org/cochrane/sadtdoc l.htm

11. Reid MC, Lachs MS, Feinstein AR. Useof methodological standards in diagnostictest research. Getting better but still nogood. JAMA 1995;274:645 - 651.

12. Knapp RG, Miller m MC. ClínicalEpidemiology and Biostatistics.Baltimore:Williams & Wilkins: 1992. p42-43.

13. Lachs MS, Nachamkin 1, Edelstein PH,et al. Spectrum Bias in the Evaluation ofa Diagnostic Tests: Lessons from therapid Dipstick Test for Urinary Tractinfection. Ann Int Med 1992;117:135 -140.

14. Knapp RG, Miller MC. Describing thePerformance of a Diagnostic Test In:.Knapp RG, Miller MC. Clinicalepidemiology and biostatistics. Malvern(Pennsylvania): Harwal PublishingCompany, Baltimore,Williams &Wilkins:1992: 31-51.

15.Bates AS, Margolis PA, Evans A.Verification bias in paediatric studiesevaluating diagnostic tests J Pediatr1993;122: 585 -90.

16. Lijmer JG, Mol BW, Heisterkamp S,Bonsel GJ, Prins MH, Van derMaeulen JHP et al. Empirical evidenceof design-related bias in studies ofdiagnostic test. JAMA 1999;282:1061-66.

17. Begg CB. Biases in the assessment ofthe diagnostic tests. Stat in Med1987;6:411 -23.

18. Knapp RG, Miller MC. Describing thePerformance of a Diagnostic Test In:.Knapp RG, Miller MC. Clinicalepidemiology and biostatistics. Malvern(Pennsylvania): Harwal Publishing

Company, 1992: 31-51.19. Sox HC, Blatt MA, Higgins MC,

Marton KI. Probability: QuantifyingUncertainty. In: Sox HC, Blatt MA,Higgins MC, Marton KI. MedicalDecision Making. Boston: ButterworthPublishers, 1988: 103 -46.

20. Riegelman RK. Hirscb RP. Cómo estu-diar un estudio y probar una prueba: lec-tura crítica de la literatura biomédica. 2a.Ed. Washington, DC. : OPS, 1992. Publi-cación científica: 531.

21. Ransohoff DF, Feistein AR. Problemsof spectrum and bias in evaluating theefficacy of diagnostic test. N Eng JMedI978;299:926 -30.

22. Rothman KJ, Greenland S. Precisionand validity in a Epidemiologic Studies.In: Rothman KJ, Greenland S. ModernEpidemiology. Second Edition.Lippincott Raven publishers,Philadelphia, 1998: 115- 134.

23. Rotmnan KJ, Greenland S. Precisionand validity in Epidemiologic Studies. In:Modern Epidemiology Rotmnan KJ,Greenland S. 2a Edition. Lippincott-Ravenpublishers. Philadelphia. 1998:115-34.

24. Machin D, Campbell M, Fayers P,Pinol A. Sample size tables for clinicalstudies, 2nd ed.Oxford: BlackwellScience: 1997. p. 21.

25. Tobias A. Summary statistics report fordiagnostic tests. Stata Technical Bulletin2000;56: 16-18.

26. Norman GR, Streiner DL.Bioestadística. Madrid: Mosby/DoymaLibros: 1996. pp. 155.

27. Rosner B. Fundamentals of Biostatistics.4th ed. Belmont: Duxbury Press: 1995. pp.378-379.

28. Machín D, Campbell M, Fayers P, Pinol A.Sample size tables for clinical studies, 2nded.Oxford: Blackwell Science: 1997. p. 71.

Correspondencia: Ricardo Sánchez Pedraza ([email protected]), Iairo Echeverry [email protected]); Centro de Epidemiología Clínica, Instituto Materno Infantil

180