29
Validez de la estimación Una estimación epidemiológica es el producto final del diseño del e realización de los estudios, y el análisis de datos. Vamos a llamar que conduce a una estimación (diseño del estudio, la realización y de estimación. El objetivo general de un estudio epidemiológico pue ser visto como la precisión en la estimación. Más específicamente, en los capítulos anteriores, el objetivo de un estudio epidemiológi estimación válida y precisa de la frecuencia de una enfermedad o de exposición sobre la aparición de una enfermedad en la población de estudio.Inherente a este objetivo es la opinión de que la investiga es un ejercicio de medición. A menudo, un objetivo adicional es obt estimación de que es generalizable a las poblaciones objetivo relev consiste en seleccionar una población de origen para su estudio que objetivo o se puede argumentar que sienta los efectos similares a l La precisión en la estimación implica que el valor del parámetro qu medición se calcula con un error pequeño. Errores en la estimación tradicionalmente clasificados como aleatorios o sistemáticos. A pes aleatorios en el muestreo y análisis de los temas puede llevar a er en las estimaciones finales, los principios importantes de diseño d la consideración por separado de las fuentes de errores aleatorios errores sistemáticos en las estimaciones se conoce comúnmente como contrario de sesgo es la validez, de modo que una estimación que ti sistemático puede ser descrito como válida. Análogamente, el opuest aleatorio es la precisión, y una estimación con errores aleatorios descrito como preciso.Validez y precisión son los dos componentes d La validez de un estudio generalmente se divide en dos componentes: inferencias, ya que pertenecen a los miembros de la población de or interna) y la validez de las inferencias, ya que pertenecen a perso población (validez externa o generalización). La validez interna im inferencia de la población de origen de los sujetos de estudio. En P.129 de la causalidad, que corresponde a una medición precisa de los efe variación aleatoria. Bajo este esquema, la validez interna se consi previo para la validez externa. La mayoría de las violaciónes de la validez interna se pueden clasi categorías generales: el sesgo de confusión, sesgo de selección, y donde el último es el sesgo producido por mala medición de las vari estudio. La confusión se describe en términos generales en el Capít el sesgo de selección específicos y los problemas de medición se de capítulos 7 y 8. El presente capítulo se describen las formas gener problemas en los estudios epidemiológicos. El capítulo 10 se descri limitar el error aleatorio, el capítulo 11 trata de las opciones en que pueden mejorar la precisión general, y el capítulo 12 muestra c pueden ser descritas e identificadas utilizando diagramas causales. introducción a las estadísticas de los capítulos 13 y 14 capítulos, métodos básicos para ajustar por factores medidos, mientras que el presenta métodos para ajustar factores de confusión no medidos, el

Validez de la estimación

Embed Size (px)

Citation preview

Validez de la estimacin Una estimacin epidemiolgica es el producto final del diseo del estudio, la realizacin de los estudios, y el anlisis de datos. Vamos a llamar a todo el proceso que conduce a una estimacin (diseo del estudio, la realizacin y anlisis) el proceso de estimacin. El objetivo general de un estudio epidemiolgico puede generalmente ser visto como la precisin en la estimacin. Ms especficamente, como se describe en los captulos anteriores, el objetivo de un estudio epidemiolgico es obtener una estimacin vlida y precisa de la frecuencia de una enfermedad o del efecto de una exposicin sobre la aparicin de una enfermedad en la poblacin de origen del estudio.Inherente a este objetivo es la opinin de que la investigacin epidemiolgica es un ejercicio de medicin. A menudo, un objetivo adicional es obtener una estimacin de que es generalizable a las poblaciones objetivo relevantes, objetivo que consiste en seleccionar una poblacin de origen para su estudio que, o bien es un objetivo o se puede argumentar que sienta los efectos similares a los objetivos. La precisin en la estimacin implica que el valor del parmetro que es el objeto de la medicin se calcula con un error pequeo. Errores en la estimacin son tradicionalmente clasificados como aleatorios o sistemticos. A pesar de los errores aleatorios en el muestreo y anlisis de los temas puede llevar a errores sistemticos en las estimaciones finales, los principios importantes de diseo del estudio surgen de la consideracin por separado de las fuentes de errores aleatorios y sistemticos. Los errores sistemticos en las estimaciones se conoce comnmente como sesgos; lo contrario de sesgo es la validez, de modo que una estimacin que tiene poco error sistemtico puede ser descrito como vlida. Anlogamente, el opuesto de error aleatorio es la precisin, y una estimacin con errores aleatorios poco puede ser descrito como preciso.Validez y precisin son los dos componentes de precisin. La validez de un estudio generalmente se divide en dos componentes: la validez de las inferencias, ya que pertenecen a los miembros de la poblacin de origen (validez interna) y la validez de las inferencias, ya que pertenecen a personas ajenas a esa poblacin (validez externa o generalizacin). La validez interna implica la validez de la inferencia de la poblacin de origen de los sujetos de estudio. En los estudios P.129 de la causalidad, que corresponde a una medicin precisa de los efectos, aparte de la variacin aleatoria. Bajo este esquema, la validez interna se considera un requisito previo para la validez externa. La mayora de las violacines de la validez interna se pueden clasificar en tres categoras generales: el sesgo de confusin, sesgo de seleccin, y la informacin, donde el ltimo es el sesgo producido por mala medicin de las variables de estudio. La confusin se describe en trminos generales en el Captulo 4, mientras que el sesgo de seleccin especficos y los problemas de medicin se describen en los captulos 7 y 8. El presente captulo se describen las formas generales de estos problemas en los estudios epidemiolgicos. El captulo 10 se describe cmo medir y limitar el error aleatorio, el captulo 11 trata de las opciones en el diseo del estudio que pueden mejorar la precisin general, y el captulo 12 muestra cmo los prejuicios pueden ser descritas e identificadas utilizando diagramas causales. Despus de una introduccin a las estadsticas de los captulos 13 y 14 captulos, 15 y 16 ofrecen mtodos bsicos para ajustar por factores medidos, mientras que el captulo 19 presenta mtodos para ajustar factores de confusin no medidos, el sesgo de

seleccin y de clasificacin errnea. La dicotomizacin de validez en los componentes internos y externos podra sugerir que la generalizacin es simplemente una cuestin de extender las inferencias sobre una poblacin de origen a una poblacin objetivo. La seccin final de este captulo se ofrece una visin diferente de la generalizacin, en la que la esencia de la generalizacin cientfica es la formulacin de abstractos (por lo general causal) teoras que relacionan las variables de estudio entre s. Las teoras son abstractas en el sentido de que no estn vinculados a poblaciones especficas, sino que se aplican a un conjunto ms general de las circunstancias que las poblaciones especficas en estudio. La validez interna de un estudio an es un requisito previo para el estudio de contribuir de manera til a este proceso de abstraccin, pero el proceso de generalizacin es otra cosa aparte de los problemas de validez interna y la mecnica del diseo del estudio. Confusin El concepto de factores de confusin se introdujo en el captulo 4. A pesar de la confusin se produce en la investigacin experimental, que es un tema mucho ms importante en los estudios observacionales. Por lo tanto, aqu se revisan los conceptos de confusin y factores de confusin y luego discutir otras cuestiones en la definicin y la identificacin de factores de confusin. Al igual que en el captulo 4, en esta seccin vamos a suponer que el objetivo es estimar el efecto que la exposicin tuvo en las personas expuestas en la poblacin de origen. Este efecto es el real (o cuenta) efecto de la exposicin. Vamos a indicar brevemente cmo la discusin se debe modificar la hora de estimar contrafactual (o potenciales) efectos de la exposicin, tales como el efecto que podra tener la exposicin de los no expuestos. El captulo 12 examina los factores de confusin en el contexto de los diagramas causales, que no hacen estas distinciones explcitas. La confusin como la mezcla de los efectos En el nivel ms simple, la confusin puede ser considerado una confusin de los efectos. Especficamente, el efecto aparente de la exposicin de inters est distorsionada porque el efecto de factores extraos se confunde-o mezclado con el efecto de la exposicin real (que puede ser nula). La distorsin introducida por un factor de confusin puede ser grande, y se puede llevar a una sobreestimacin o subestimacin de un efecto, dependiendo de la direccin de las asociaciones de que el factor de confusin tiene con la exposicin y la enfermedad. La confusin puede incluso cambiar la direccin aparente de un efecto. Una definicin ms precisa de la confusin comienza por examinar la manera en que los efectos se estiman. Supongamos que queremos estimar el grado en que la exposicin ha cambiado la frecuencia de la enfermedad en una cohorte expuesta. Para ello, debemos estimar la frecuencia de la enfermedad habra sido en este grupo haba estado ausente de la exposicin y comparar esta estimacin de la frecuencia observada en la exposicin. Debido a que la cohorte expuesta, esta ausencia de la exposicin es contrafactual (contrariamente a los hechos) y por lo que la frecuencia deseada sin exponer la comparacin es inobservable. Por lo tanto, como un sustituto, se observa la frecuencia de la enfermedad en una cohorte no expuesta. Pero rara vez podemos tomar esta frecuencia no expuesta la manera ms justa que representa lo que la frecuencia habra estado en la cohorte expuesta la exposicin haba estado ausente, debido a que la cohorte no expuesta puede diferir de la cohorte expuesta de muchos factores que afectan la frecuencia de la enfermedad,

adems de la exposicin.Para expresar este problema, se dice que el uso de los no expuestos como el referente a la expuesta se confunde, porque la frecuencia de la enfermedad en los expuestos difiere de la de los no expuestos, como resultado de una mezcla de dos o ms efectos, una de las cuales es el efecto de la exposicin. P.130

Los factores de confusin y de confusin sustitutos Los factores externos que son responsables de diferencia en la frecuencia de la enfermedad entre los expuestos y no expuestos se llaman factores de confusin.Adems, los factores asociados con estos factores externos causales que pueden servir como sustitutos de estos factores tambin son comnmente llamados factores de confusin. El ejemplo ms extremo de este sustituto es la edad cronolgica. Aumento de la edad est fuertemente asociada con el envejecimiento, la acumulacin de mutaciones en las clulas y el dao tisular que conduce a la enfermedad, pero aumenta la edad no es causa de los cambios patognicos la mayora de estos (Kirkland, 1992), debido a que es slo una medida de cunto tiempo ha pasado desde su nacimiento. Independientemente de si un factor de confusin es una de las causas de la enfermedad de estudio o simplemente un sustituto para una causa, una caracterstica principal es que si est perfectamente medido ser de prediccin de la frecuencia de la enfermedad en los no expuestos (de referencia) de cohorte. De lo contrario, el factor de confusin no se puede explicar por qu la cohorte no expuesta no representar adecuadamente a la frecuencia de la enfermedad de la cohorte expuesta iba a experimentar en la ausencia de la exposicin. Por ejemplo, supongamos que todos los hombres eran expuestos y no expuestos todos eran mujeres. Si los hombres no expuestos tienen la misma incidencia que las mujeres no expuestas, el hecho de que todos los no expuestos eran mujeres, ms que los hombres no podra ser responsable de cualquier confusin que est presente. En el punto de vista simple, la confusin se produce slo si se producen efectos extraos se mezclan con el efecto en estudio. Ntese, sin embargo, que la confusin puede ocurrir incluso si el factor en estudio no tiene ningn efecto. Por lo tanto, "la mezcla de efectos" no debe interpretarse en el sentido de que la exposicin en estudio tiene un efecto. La mezcla de los efectos viene alrededor de una asociacin entre la exposicin y factores extraos, independientemente de si la exposicin tiene un efecto. Como otro ejemplo, considere un estudio para determinar si los bebedores de alcohol presentan una mayor incidencia de cncer oral que los no bebedores. El tabaquismo es un factor externo que est relacionado con la enfermedad entre los no expuestos (el fumar tiene un efecto sobre la incidencia de cncer oral entre los abstemios de alcohol). El tabaquismo tambin est asociado con el consumo de alcohol, porque hay muchas personas que son generales "abstemios", abstenerse del consumo de alcohol, el tabaquismo, y tal vez otros hbitos. En consecuencia, los bebedores de alcohol entre los que se incluyen una mayor proporcin de fumadores que se encuentran entre los no bebedores.Debido a que fumar aumenta la incidencia de cncer oral, los bebedores de alcohol tendrn una incidencia mayor que los no bebedores, independientemente de cualquier influencia de la ingesta de alcohol en s, simplemente como consecuencia de la mayor cantidad de consumo de tabaco entre los bebedores de alcohol. Por lo tanto, el efecto aparente de consumo de alcohol se ve

distorsionada por el efecto del tabaquismo, el efecto del consumo de tabaco se mezcla con el efecto del alcohol en la comparacin de los bebedores de alcohol con los no bebedores. El grado de sesgo o distorsin depende de la magnitud del efecto del tabaquismo, la fuerza de asociacin entre el alcohol y el tabaquismo, y la prevalencia de tabaquismo entre los no bebedores que no tienen cncer oral. De cualquier ausencia de un efecto del tabaco sobre la incidencia del cncer oral o ausencia de una asociacin entre el tabaquismo y el alcohol no se llevara a confusin. Fumar debe estar asociado a cncer bucal y el consumo de alcohol para que sea un factor de confusin. Propiedades de un factor de confusin En general, una variable debe estar asociado tanto con la exposicin en estudio y la enfermedad en estudio para ser un factor de confusin. Estas asociaciones no, sin embargo, definir un factor de confusin, de una variable pueden tener estas asociaciones y, sin embargo no ser un factor de confusin. Hay varias maneras de que esto puede suceder. La forma ms comn se produce cuando la exposicin en estudio tiene un efecto. En esta situacin, cualquier correlacin de que la exposicin tambin tienden a ser asociados con la enfermedad como una consecuencia de su asociacin con la exposicin. Por ejemplo, supongamos que el consumo de cerveza con frecuencia se asocia con el consumo de pizza, y supongamos que el consumo de cerveza con frecuencia es un factor de riesgo para el cncer rectal. Que el consumo de pizza ser un factor de confusin? Al principio, podra parecer que la respuesta es s, porque el consumo de la pizza se asocia tanto con el consumo de cerveza y con el recto P.131 cncer. Pero si el consumo de pizza se asocia con el cncer rectal, debido a su asociacin con el consumo de cerveza, no sera de confusin, de hecho, la asociacin del consumo de pizza con cncer colorrectal sera entonces debe enteramente a la confusin por el consumo de cerveza. Un factor de confusin debe estar asociado a la aparicin de enfermedades, aparte de su asociacin con la exposicin. En particular, como se explic anteriormente, la variable aleatoria posibles factores de confusin debe estar asociado a la enfermedad entre los no expuestos (de referencia) los individuos. Si el consumo de la pizza se asocia con el cncer de recto entre los bebedores de cerveza, entonces se podra confundir. De lo contrario, si se asocia con el cncer rectal debido a su asociacin con el consumo de cerveza, que no poda confundir. De forma anloga, con esta restriccin sobre la asociacin entre un factor de confusin potencial y la enfermedad, el potencial de confusin debe estar asociado con la exposicin entre la poblacin de origen de los casos, para esta asociacin con la exposicin es cmo los efectos de la posible confusin se mezclan con los efectos de la exposicin. En este sentido, cabe sealar que un factor de riesgo que es independiente de la exposicin en la poblacin de origen puede (y normalmente ser) se asocia con la exposicin entre los casos, por lo que no se puede tomar la asociacin entre los casos como una estimacin vlida de la asociacin en la poblacin de origen. Los factores de confusin como factores de riesgo extraos Tambin es importante aclarar qu queremos decir con la extraa expresin en la frase "factor de riesgo ajeno". Este trmino significa que el factor de la asociacin con

la enfermedad surge de una cadena causal que no sea el objeto de estudio. En concreto, tenga en cuenta el diagrama causal donde las flechas representan la relacin de causalidad. La presin arterial elevada como factor de confusin? Sin duda, es un factor de riesgo para la enfermedad, y tambin se correlaciona con la exposicin, ya que puede resultar de fumar. Incluso es un factor de riesgo para la enfermedad entre los individuos no expuestos, porque la presin arterial elevada puede ser consecuencia de otras causas que fumar. Sin embargo, no se puede considerar un factor de confusin, ya que el efecto de fumar est mediada a travs del efecto de la presin arterial. Cualquier factor que representa un paso en la cadena causal entre la exposicin y la enfermedad no debe ser entendido como un factor de confusin ajena, sino que requiere un tratamiento especial como un factor intermedio (Groenlandia y Neutra, 1980; Robins, 1989, vase el captulo 12). Por ltimo, una variable puede satisfacer todas las condiciones anteriores, pero no podr hacerlo despus del control de alguna variable de confusin otra parte, y por lo tanto ya no puede ser un factor de confusin dentro de los estratos de la confusin segundo. Por ejemplo, puede ocurrir que (a) el factor de confusin primero ya no est asociada con la enfermedad dentro de los estratos de la confusin en segundo lugar, o (b) el factor de confusin primero ya no est asociado con la exposicin dentro de los estratos de la confusin segundo. En cualquier caso, el factor de confusin primero es slo un sustituto para el factor de confusin segundo. En trminos ms generales, el estado de una variable como un factor de confusin puede depender de otras variables que se controlan cuando se hace la evaluacin, es decir, ser un factor de confusin est condicionada a lo que el mundo est controlado. A juzgar por el papel causal de un potencial de confusin Consideremos el caso simple, pero comn de una variable binaria de la exposicin, con el inters centrado en el efecto de la exposicin en una determinada poblacin expuesta, en relacin a lo que habra sucedido si no hubiese estado expuesta la poblacin. Supongamos que una poblacin no expuesta se selecciona como la comparacin (referencia) grupo. Un potencial de confusin es entonces un factor que est asociado con la enfermedad entre los no expuestos, y no es afectada por la exposicin o enfermedad. Podemos comprobar este ltimo requisito, si sabemos que el factor precede a la exposicin y la enfermedad. Asociacin con la enfermedad entre los no expuestos es un criterio ms difcil de decidir. Aparte de los posibles factores de confusin simples y obvias ahora, como la edad, el sexo y el consumo de tabaco, los datos epidemiolgicos disponibles son a menudo ambiguos en cuanto a potencia predictiva, incluso cuando lo hacen establecer el orden del tiempo.Basta con decidir si tiene capacidad predictiva sobre la base de una prueba estadstica suele ser demasiado sensible para detectar todos los factores de confusin importantes, y como resultado puede producir estimaciones muy confundido, tal como demuestran ejemplos reales (Groenlandia y Neutra, 1980). Una respuesta a la ambigedad y la falta de sensibilidad de los mtodos epidemiolgicos para la deteccin de factores de confusin es hacer un llamamiento a las dems pruebas sobre el efecto del potencial de confusin sobre la enfermedad, incluyendo nonepidemiologic (por ejemplo, clnica o social) de los datos y las teoras mecanicistas quiz sobre los posibles efectos sobre el potencial factores de confusin. La incertidumbre acerca de la evidencia o el mecanismo puede justificar el

manejo de un posible factor de confusin ya que tanto la confusin y la confusin no en los diferentes anlisis. Por ejemplo, al evaluar el efecto del caf en las enfermedades del corazn, no est claro cmo tratar a los niveles de colesterol srico. Los niveles elevados son un factor de riesgo para enfermedades del corazn y puede estar asociada con el uso del caf, pero el colesterol en suero pueden mediar la accin de uso del caf en el riesgo de enfermedad cardaca. P.132 Es decir, niveles elevados de colesterol puede ser un factor intermedio en la secuencia etiolgico en estudio. Si el tiempo de ordenamiento de uso del caf y la elevacin del colesterol no puede ser determinado, se podra llevar a cabo dos anlisis, uno en el cual se controla el colesterol en suero (que sera apropiado si el caf no afecta el colesterol en suero) y una en la que no est bien controlada ose trata como un producto intermedio (que sera ms apropiado si el caf afecta el colesterol srico y no est asociada con los factores determinantes no controlados de colesterol en suero). La interpretacin de los resultados depender de cul de las teoras sobre el colesterol en suero eran correctas.Grficos causales proporcionar un medio til para representar estas relaciones multivariables y, como se explica en el Captulo 12, permiten la identificacin de factores de confusin para el control de la estructura de la grfica. Criterios para un factor de confusin Podemos resumir hasta ahora con la observacin de que para una variable a ser un factor de confusin, debe tener tres necesaria (pero no suficiente, o la definicin), las caractersticas que vamos a discutir en detalle. A continuacin se sealan algunas limitaciones de estas caractersticas en la definicin y la identificacin de factores de confusin. 1. Un factor de confusin debe ser un factor de riesgo para la enfermedad extraa. Como se mencion anteriormente, un posible factor de confusin no tiene por qu ser una causa real de la enfermedad, pero si no lo es, debe ser un sustituto de una causa real de la enfermedad que no sea la exposicin. Esta condicin implica que la asociacin entre el potencial de confusin y la enfermedad debe ocurrir dentro de los niveles de la exposicin del estudio. En particular, un factor potencialmente confusin debe ser un factor de riesgo en el nivel de referencia de la exposicin en estudio. Los datos pueden servir como una gua para la relacin entre el potencial de confusin y la enfermedad, sino que es la relacin real entre el factor potencialmente confusin y la enfermedad no, la relacin aparente observada en los datos, que determina si se puede producir confusin.En grandes estudios, que estn sujetos al error de muestreo inferior, esperamos que los datos que reflejan ms de cerca la relacin subyacente, pero en estudios pequeos que los datos son una gua menos confiable, y se debe considerar otra evidencia, externo ("conocimiento previo") con respecto a la relacin del factor de la enfermedad. El siguiente ejemplo ilustra el papel que el conocimiento previo puede jugar en la evaluacin de los factores de confusin. Supongamos que en un estudio de cohorte de fibras de vidrio en el aire y el cncer de pulmn, los datos muestran ms tabaco y ms casos de cncer entre los muy expuestos, pero no existe relacin entre el tabaquismo y el cncer de pulmn dentro de los niveles de exposicin. La ausencia de una relacin de este ltimo no quiere decir que un efecto del hbito de fumar no est confundida (mixta) con el efecto estimado de las fibras de vidrio: Es posible que parte

o la totalidad de los cnceres en exceso en el muy expuestos se produzcan slo por fumar, y que la falta de una asociacin fumar-cncer en la cohorte de estudio fue producido por un factor de confusin no medido de dicha asociacin en esta cohorte, o por un error aleatorio. Como ejemplo contrario, supongamos que realizamos un estudio de cohorte de la exposicin solar y el melanoma. Nuestra mejor informacin disponible indica que, despus de controlar por edad y rea geogrfica de residencia, no hay ninguna relacin entre el nmero de Seguro Social y la aparicin del melanoma.Por lo tanto, no considerara el nmero de Seguro Social, un factor de confusin, con independencia de su asociacin con el melanoma en la cohorte de la exposicin de referencia, porque pensamos que no es un factor de riesgo para el melanoma en esta cohorte, la edad y una zona geogrfica (es decir, pensamos Social nmeros de Seguro no afectan a las tasas de melanoma y no son marcadores de algn factor de riesgo de melanoma es la edad y el rea).Incluso si el control de nmero de Seguro Social iba a cambiar la estimacin del efecto, la estimacin resultante de efecto sera menos exacto que el que ignora el nmero de Seguro Social, teniendo en cuenta nuestra informacin previa acerca de la falta de confusin real por el nmero de seguro social. Sin embargo, ya que la informacin externa se limita por lo general, los investigadores se basan a menudo en sus datos para inferir la relacin de los posibles factores de confusin a la enfermedad. Esta dependencia puede ser racionalizado si uno tiene buenas razones para sospechar que la informacin externa no es muy relevante para un propio estudio. Por ejemplo, una de las causas de la enfermedad en una poblacin ser causalmente relacionado con la enfermedad en otra poblacin que carece de las causas de los componentes complementarios (es decir, factores de susceptibilidad, vase el captulo 2). Una discordancia entre los datos y la informacin externa sobre un factor de riesgo conocidas o sospechadas por lo tanto, puede ser seal de una insuficiencia en el detalle de la informacin acerca de factores que interactan en lugar de un error en los datos. Esta explicacin puede ser menos creble para variables tales como edad, sexo y tabaquismo, cuyo conjunto de relacin con la enfermedad a menudo se piensa que es bastante estable en todas las poblaciones. En P.133 de forma paralela la informacin, externa sobre la ausencia de un efecto de un posible factor de riesgo puede ser considerada inadecuada, si la informacin externa se basa en estudios que tuvieron un sesgo importante hacia el valor nulo. 2. Un factor de confusin debe estar asociado a la exposicin en estudio en la poblacin de origen (la poblacin en riesgo de que los casos se derivan). Para producir los factores de confusin, la asociacin entre un factor potencial de confusin y la exposicin debe estar en la poblacin de origen de los casos de estudio. En un estudio de cohortes, la poblacin de origen corresponde a la cohorte de estudio y por lo tanto, esta condicin slo implica que la asociacin entre un factor de confusin y la exposicin de la que existe entre los sujetos que componen la cohorte. As, en los estudios de cohortes, la asociacin exposicin-factor de confusin puede determinarse a partir de los datos del estudio solo y ni siquiera tericamente, dependen de los conocimientos previos si no hay error de medicin est presente. Cuando la exposicin en estudio ha sido asignado al azar, a veces se piensa errneamente que la confusin no puede ocurrir debido a la asignacin al azar de la exposicin garantas ser independiente de la (no asociado con) otros factores. Por

desgracia, esta garanta de la independencia es slo en promedio a travs de repeticiones del procedimiento de asignacin al azar. En casi cualquier aleatorizacin dado nica (asignacin), incluyendo aquellos en los estudios reales, habr asociaciones aleatorias de la exposicin a factores de riesgo extraos. Como consecuencia, la confusin puede ocurrir y ocurre en los ensayos aleatorios. Aunque esta confusin al azar tiende a ser pequeo en los grandes ensayos clnicos aleatorizados, a menudo ser grande dentro de pequeos ensayos y en pequeos subgrupos de ensayos de gran tamao (Rothman, 1977). Por otra parte, la falta de adherencia pesada o incumplimiento (incumplimiento del protocolo de tratamiento asignado) o desercin puede dar lugar a una considerable confusin no aleatorio, incluso en grandes ensayos clnicos aleatorizados (vase el captulo 12, especialmente la figura. 12-5). En un estudio caso-control, la asociacin de la exposicin y el potencial de confusin debe estar presente en la poblacin de origen que dio origen a los casos. Si la serie de control es grande y no hay sesgo de seleccin o un error de medicin, los controles de proporcionar una estimacin razonable de la asociacin entre la variable potencial de confusin y la exposicin en la poblacin de origen y se puede comprobar con los datos del estudio. En general, sin embargo, los controles no adecuada puede estimar el grado de asociacin entre el factor de confusin potencial y la exposicin en la poblacin de origen que produjo los casos de estudio. Si se dispone de informacin sobre esta asociacin de la poblacin, que puede ser utilizado para ajustar los hallazgos de la serie de control. Lamentablemente, la informacin externa confiable sobre las asociaciones entre los factores de riesgo en la poblacin de origen rara vez est disponible. As, en estudios de casos y controles, la preocupacin por el grupo de control tendr que ser considerado en la estimacin de la asociacin entre la exposicin y el factor de confusin potenciales, por ejemplo, a travs de anlisis de sesgo (Captulo 19). Considere la posibilidad de un estudio anidado de casos y controles de la exposicin ocupacional a fibras de vidrio en el aire y la aparicin de cncer de pulmn que los casos seleccionados al azar y los controles de los casos y las personas en situacin de riesgo en una cohorte de trabajadores. Supongamos que se conoca la asociacin entre la exposicin y el consumo de tabaco en la cohorte completa, como era de si esta informacin se registraron en toda la cohorte. A continuacin, podra utilizar la discrepancia entre la verdadera asociacin y la asociacin exposicin-fumar observado en los controles como una medida del grado en que el muestreo aleatorio no haba para producir controles representativos. Sin importar el tamao de esta discrepancia, si no se encontr asociacin entre el tabaquismo y la exposicin en la cohorte de la fuente, el fumar no sera un factor de confusin verdadero (aunque parece ser uno de los datos de casos y controles), y sera la estimacin no ajustada ser la mejor estimacin disponible (Robins y Morgenstern, 1987). De manera ms general, podemos usar cualquier informacin en toda la cohorte de realizar ajustes en la estimacin de casos y controles, de un modo anlogo a los estudios en dos etapas (captulos 8 y 15). 3. Un factor de confusin no debe verse afectado por la exposicin o la enfermedad. En particular, no puede ser un paso intermedio en el camino causal entre la exposicin y la enfermedad. Este criterio se satisface automticamente si el factor precede exposicin y la enfermedad. De lo contrario, el criterio requiere informacin fuera de los datos.El

investigador debe tener en cuenta las pruebas o las teoras que tienen que ver si la exposicin o la enfermedad puede afectar el factor. Si el factor es un paso intermedio entre la exposicin y la enfermedad, no debe ser entendido como simplemente una confusin P.134 factor que, en su lugar, un anlisis ms detallado que tenga en cuenta su naturaleza intermedia se requiere (Robins, 1989; Robins y Groenlandia, 1992;. Robins et al, 2000). A pesar de las tres caractersticas de los factores de confusin se toman a veces para definir un factor de confusin, que es un error hacerlo por razones conceptuales y tcnicos. La confusin es la confusin o mezcla de efectos externos con el efecto de inters. Las dos primeras caractersticas son ms que consecuencias lgicas de la definicin bsica, las propiedades que un factor que debe cumplir con el fin de confundir. La tercera propiedad excluye situaciones en las que los efectos no se puede separar de una manera directa (salvo en casos especiales). Tcnicamente, es posible para un factor de poseer las tres caractersticas y todava no tienen sus efectos mezclados con la exposicin, en el sentido de que un factor puede producir ningn exceso espuria o dficit de la enfermedad entre los expuestos, a pesar de su asociacin con la exposicin y su efecto sobre la enfermedad. Este resultado puede producirse, por ejemplo, cuando el factor es slo uno de varios posibles factores de confusin y el exceso de incidencia producida por el factor de entre los expuestos est perfectamente equilibrado por la incidencia de exceso producido por otro factor en los no expuestos. La discusin anterior omite una serie de sutilezas que surgen en la determinacin cualitativa de las variables que son suficientes para controlar el fin de eliminar la confusin. Estos aspectos cualitativos, se discutir el uso de diagramas causales en el captulo 12. Es importante recordar, sin embargo, que el grado de confusin es una preocupacin mucho mayor que su mera presencia o ausencia. En un estudio, una proporcin de la tasa de 5 puede llegar a ser 4,6 despus del control de la edad, mientras que en otro estudio una proporcin de la tasa de 5 puede cambiar a 1,2 tras el control de la edad. Aunque la edad es la confusin en ambos estudios, en el primero la cantidad de factores de confusin es relativamente poco importante, mientras que en las ltimas cuentas de confusin para casi todos los de la asociacin cruda. Mtodos para evaluar cuantitativamente la confusin se describir en los captulos 15 y 19. Sesgo de seleccin Sesgos de seleccin son las distorsiones que se derivan de los procedimientos utilizados para seleccionar a los sujetos y de los factores que influyen en la participacin en el estudio. El elemento comn de esos sesgos es que la relacin entre exposicin y enfermedad es diferente para los que participan y para todos aquellos que tericamente debera haber sido elegibles para el estudio, incluyendo aquellos que no participan. Debido a que las estimaciones del efecto estn condicionados a la participacin, las asociaciones observadas en el estudio representan una mezcla de fuerzas que determinan la participacin y las fuerzas que determinan la aparicin de la enfermedad. El captulo 12 examina el sesgo de seleccin en el contexto de los diagramas causales. Estos diagramas muestran que es a veces (pero no siempre) es posible

separar los efectos de la participacin de las de los determinantes de la enfermedad utilizando los mtodos estndar para el control de la confusin. Para emplear el control analtico como se requiere, entre otras cosas, que los factores determinantes de la participacin de medirse con precisin y no se ve afectada tanto por la exposicin y la enfermedad. Sin embargo, si los factores determinantes se ven afectados por los factores de estudio, el control analtico de los factores determinantes de no corregir el sesgo y puede incluso empeorar la situacin. Algunas de las formas genricas de sesgo de seleccin en los estudios de casos y controles se describe en el Captulo 8. Entre ellos se incluyen el uso de grupos de control incorrectos (por ejemplo, los controles integrados de los pacientes con enfermedades que se ven afectados por la exposicin del estudio). Consideramos aqu algunos otros tipos. Sesgo de autoseleccin Una fuente comn de sesgo de seleccin es la auto-seleccin. Cuando los Centros para el Control de Enfermedades investig la incidencia de leucemia entre los soldados que haban estado presentes en la prueba de ahumado Atmica en Nevada (Caldwell et al., 1980), el 76% de las tropas identificaron como miembros de ese grupo haba conocido los resultados. De este 76%, 82% haban sido localizadas por los investigadores, pero el otro 18% de contacto con los investigadores, por iniciativa propia en respuesta a la publicidad sobre la investigacin. Esta auto-referencia de los sujetos de ordinario se considera una amenaza para la validez, porque las razones de la auto-referencia puede estar asociada con la variable estudiada (Criqui et al., 1979). En el estudio prueba atmica ahumado, hubo cuatro casos de leucemia entre los 0,18 x 0,76 = 14% de los miembros de la cohorte que se refirieron a s mismos y cuatro entre los 0,82 x 0,76 = 62% de los miembros de la cohorte trazadas por los investigadores, para un total de ocho casos entre el 76% de la cohorte con los resultados conocidos. Estos datos indican que el sesgo de autoseleccin era un problema pequeo, pero real, en el estudio de ahumado. Si el 24% de la cohorte con resultados desconocidos tuvieron una incidencia de la leucemia como la P.135 de los temas trazados por los investigadores, es de esperar que slo el 4 (24/62) = 1.5 o casos de una o dos se produjo entre este 24%, para un total de tan slo nueve o 10 casos en toda la cohorte. Si por el contrario asumimos que el 24% con resultados desconocidos tuvieron una incidencia de la leucemia como la de los sujetos con resultados conocidos, que se calcula que 8 (24/76) = 2.5 o acerca de los casos dos o tres se produjo entre el 24%, para un total de 10 o 11 casos en toda la cohorte. Podra ser, sin embargo, que todos los casos entre el 38% (= 24% + 14%) de la cohorte que estaba sin localizar se encuentran entre los auto-reporte, dejando ningn caso entre las personas con resultados desconocidos. El nmero total de casos en toda la cohorte sera entonces slo el 8. Auto-seleccin tambin puede ocurrir antes de los sujetos se identifican para su estudio. Por ejemplo, es de rutina para encontrar que la mortalidad de los trabajadores activos es menor que la de la poblacin en su conjunto (Fox y Collier, 1976; McMichael, 1976). Este "efecto saludable de trabajo", presumiblemente se deriva de un proceso de seleccin, tal vez en gran medida auto-seleccin, que permite a personas relativamente saludables para ser o seguir siendo los trabajadores, mientras que los que se quedan parados, jubilados, discapacitados, o de otra manera fuera de

la poblacin activa de los trabajadores son como un grupo menos sanos (McMichael, 1976; Wang y Miettinen, 1982). Mientras que el efecto saludable de trabajo ha sido tradicionalmente clasificado como un sesgo de seleccin, se puede ver que no refleja un sesgo creado por acondicionamiento de la participacin en el estudio, sino ms bien por el efecto de otro factor que influye tanto en la condicin de trabajador y de alguna medida de la salud. Como tal, el efecto saludable de trabajo es un ejemplo de la confusin en lugar de un sesgo de seleccin (Hernn et al, 2004), como se explica ms adelante. Berksonian Blas Un tipo de sesgo de seleccin que fue descrito por primera vez por Berkson (1946) (aunque no en el contexto de un estudio caso-control), que lleg a ser conocido como el sesgo de Berkson o sesgo Berksonian, se produce cuando tanto la exposicin y la enfermedad afecta a la seleccin y especficamente porque afectan seleccin. Es paradjico, ya que puede generar un sesgo a la baja cuando tanto la exposicin y la enfermedad aumenta la posibilidad de la seleccin, lo que puede inducir sesgo a la baja una asociacin negativa en el estudio si la asociacin en la poblacin de origen es positivo, pero no tan grande como el sesgo . Un ejemplo dramtico de Berksonian sesgo se present en la controversia inicial sobre el papel de los estrgenos exgenos en la causa de cncer de endometrio. Varias de control de casos se haba informado de una asociacin fuerte, con un aumento de 10 veces en el riesgo para las mujeres que toman estrgenos con regularidad durante un nmero de aos (Smith et al, 1975;. Ziel y Finkle, 1975; Mack et al, 1976. ; Antunes et al, 1979).. La mayora de los investigadores interpretaron este incremento en el riesgo como una relacin causal, pero otros sugirieron que los estrgenos estaban simplemente haciendo que los cnceres que se diagnostican en lugar de que se produzca (Horwitz y Feinstein, 1978). Su argumento se basaba en el hecho de que los estrgenos inducen sangrado uterino. Por lo tanto, la administracin de estrgenos de suponer que a las mujeres a buscar atencin mdica, lo que causa una variedad de afecciones ginecolgicas para ser detectado. El sesgo resultante se conoce como sesgo de deteccin. El remedio para el sesgo de deteccin que Horwitz y Feinstein propuesta era utilizar una serie de control de las mujeres con enfermedades benignas ginecolgicas. Estos investigadores pensaron que las condiciones benignas tambin estara sujeta a los sesgos de deteccin, y por lo tanto con una serie de control que comprende a las mujeres con condiciones benignas, sera preferible a la utilizacin de una serie de control de las mujeres con otras enfermedades malignas, enfermedades ginecolgicas, o no la enfermedad, ya que estudios anteriores haba hecho. La falla en este razonamiento es la suposicin incorrecta de que los estrgenos causado una proporcin sustancial de cnceres de endometrio que se diagnostica que de otro modo habran quedado sin diagnosticar. Incluso si la administracin de estrgenos avances de la fecha del diagnstico de cncer de endometrio, como un avance en el momento del diagnstico no es necesario en s mismo conducir a un sesgo importante (Groenlandia, 1991a). Posiblemente, una pequea proporcin de casos preexistentes de cncer de endometrio que de otro modo no habran sido diagnosticados ha llamado la atencin, pero es razonable suponer que este cncer que no es in situ (Horwitz y Feinstein excluida en los casos in situ) por lo general progresa a causar sntomas que llevan al diagnstico (Hutchison y Rothman, 1978). A pesar de un escenario permanente, no progresiva precoz del cncer de endometrio es una posibilidad, los

estudios que excluidos, en los casos in situ de la serie de casos todava se encuentran una fuerte asociacin entre la administracin de estrgenos y el riesgo de cncer de endometrio (por ejemplo, Antunes et al., 1979). El grupo alternativo de control propuesto comprende a las mujeres con condiciones ginecolgicas benignas que se presuma de no causar sntomas que llevan al diagnstico. Tal grupo proporcionara una sobreestimacin de la proporcin de la poblacin de origen de los casos expuestos a los estrgenos, porque P.136 la administracin de estrgenos en efecto causara el diagnstico de una proporcin sustancial de las condiciones benignas. El uso de una serie de control con condiciones ginecolgicas benignas, produciendo as un sesgo que subestima seriamente el efecto de los estrgenos exgenos sobre el riesgo de cncer de endometrio. Otro remedio que Horwitz y propuesta de Feinstein fue examinar la asociacin en las mujeres que se presentaron con hemorragia vaginal o se haban sometido a tratamiento para el tipo de sangrado. Debido a que tanto la exposicin (estrgenos exgenos) y de la enfermedad (cncer endometrial) aumenta fuertemente el riesgo de hemorragia, la restriccin a las mujeres con sangrado o tratamiento para el sangrado es en un sesgo Berksonian tan graves que fcilmente se podra disminuir el riesgo relativo observado por cinco veces (Groenlandia y Neutra, 1981). Una importante leccin que debemos aprender de esta controversia es la importancia de considerar los sesgos de seleccin cuantitativa, ms que cualitativa. Sin reconocimiento por la magnitud de los posibles sesgos de seleccin, la eleccin de un grupo de control puede resultar en un sesgo tan grande que una asociacin fuerte est ocluido; alternativamente, una asociacin insignificante podra fcilmente ser exagerado. Mtodos para el examen cuantitativo de sesgos se discuten en el captulo 19. Otra leccin es que se corre el riesgo de inducir o empeorar el sesgo de seleccin cada vez que uno utiliza los criterios de seleccin (por ejemplo, requiere la presencia o ausencia de ciertas condiciones) que estn influenciados por la exposicin en estudio. Si estos criterios tambin estn relacionados con la enfermedad de estudio, grave sesgo Berksonian es probable que se produzca. Sesgo de seleccin Distinguir la confusin El sesgo de seleccin y la confusin son dos conceptos que, dependiendo de la terminologa, a menudo se superponen. Por ejemplo, en estudios de cohortes, los sesgos producidos por seleccin diferencial al inicio del seguimiento se llaman a menudo un sesgo de seleccin, pero en nuestra terminologa son ejemplos de factores de confusin. Considere la posibilidad de un estudio de cohortes se compara la mortalidad por enfermedades cardiovasculares entre los estibadores y trabajadores de oficina. Si las personas en buena forma fsica auto-seleccin en el trabajo de estibador, debemos esperar que los estibadores a tener una menor mortalidad cardiovascular que la de los trabajadores de oficina, incluso si se trabaja como estibador no tiene ningn efecto sobre la mortalidad cardiovascular. Como consecuencia, la estimacin de crudo de ese estudio no puede considerarse una estimacin vlida del efecto del trabajo de estibador en relacin con el trabajo de oficina en la mortalidad cardiovascular. Supongamos, sin embargo, que la aptitud de un individuo que se convierte en un leador puede ser medido y comparado con la aptitud de los trabajadores de oficina. Si tal medicin se realiza con precisin en todos los sujetos, la diferencia en la

aptitud podra ser controlado en el anlisis. As, el efecto de seleccin se elimina por el control de los factores de confusin responsables de la polarizacin. Aunque el sesgo resultante de seleccin de las personas para las cohortes, es en realidad una forma de la confusin. Debido a que las mediciones sobre la aptitud a la entrada en una ocupacin generalmente no estn disponibles, los esfuerzos del investigador en esa situacin se centr en la eleccin de un grupo de referencia que experimentan las fuerzas de seleccin mismos como la ocupacin de destino. Por ejemplo, Paffenbarger y Hale (1975) realizaron un estudio en el que compararon la mortalidad cardiovascular entre los grupos de estibadores que participan en los diferentes niveles de actividad fsica en el trabajo. Paffenbarger y Hale presume que los factores de seleccin para el ingreso de la ocupacin fueron similares para los subgrupos que participan en la actividad de las tareas ms exigentes de alta o baja, porque las asignaciones de trabajo se hicieron despus de entrar en la profesin. Este diseo sera reducir o eliminar la asociacin entre la condicin y convertirse en un estibador. Al comparar los grupos con diferentes intensidades de la exposicin dentro de una ocupacin (comparacin interna), los epidemilogos ocupacionales reducir la diferencia en las fuerzas de seleccin que acompaa a las comparaciones entre los grupos profesionales, y por lo tanto reducir el riesgo de confusin. Lamentablemente, no todos sesgo de seleccin en los estudios de cohortes pueden ser tratadas como factores de confusin. Por ejemplo, si la exposicin afecta a la prdida en el seguimiento y la segunda afecta el riesgo de sesgo de seleccin se debe a que el anlisis est condicionado por una consecuencia comn (que queda en el seguimiento est relacionado tanto con la exposicin y el resultado). Este sesgo podra surgir en un estudio de la mortalidad profesional si la exposicin hizo que la gente a abandonar la ocupacin temprana (por ejemplo, pasar de un trabajo activo para un trabajo de escritorio o la jubilacin) y que a su vez condujo a la prdida tanto para el seguimiento y con un mayor riesgo de la muerte. Aqu, no hay lnea de base de covarianza (confusin) la creacin de diferencias en el riesgo entre los grupos expuestos y no expuestos, sino que la exposicin en s se genera el sesgo. Tal sesgo sera irremediable, sin ms informacin sobre los efectos de la seleccin, e incluso con esa informacin el sesgo no puede ser eliminado por el control de covarianza simple. Esta posibilidad subraya la necesidad de un seguimiento exhaustivo de los estudios de cohortes, por lo general requiere un sistema de vigilancia de los resultados de la cohorte. Si P.137 tal sistema no est en su lugar (por ejemplo, un sistema de reclamaciones de seguro), el estudio tendr que implementar su propio sistema, que puede ser costoso. En los estudios de casos y controles, las preocupaciones acerca de la eleccin de un grupo de control se centran en los factores que podran afectar a la seleccin y el reclutamiento en el estudio. Aunque los factores de confusin tambin deben ser considerados, pueden ser controladas en el anlisis si se miden. Si los factores de seleccin que afectan caso y la seleccin de control son en s mismos no afectados por la exposicin (por ejemplo, sexo), cualquier sesgo de seleccin que producen tambin puede ser controlado mediante el control de estos factores en el anlisis. La clave, entonces, para evitar sesgos de confusin y de seleccin debido a las covariables pre-exposicin es determinar de antemano y como medida de numerosos

factores de confusin y de los factores de seleccin como sea posible. Para ello se requiere un buen objeto del conocimiento. En los estudios de casos y controles, sin embargo, los sujetos se seleccionan a menudo se produce despus de la exposicin y el resultado, y por lo tanto, hay un elevado potencial de sesgo debido a la exposicin combinada y los efectos de la enfermedad en la seleccin, como ocurri en el estrgeno y los estudios de cncer de endometrio que los sujetos a restricciones pacientes con sangrado (o para los pacientes que recibieron procedimientos mdicos especficos para el tratamiento de la hemorragia). Como se muestra mediante grficos causales (Chaper 12), el sesgo de seleccin tales efectos conjuntos por lo general no puede ser tratado por el control de covarianza bsica. Este sesgo tambin puede surgir en los estudios de cohortes, e incluso en los ensayos aleatorios en los cuales los sujetos se pierden durante el seguimiento. Por ejemplo, en un estudio de la mortalidad laboral, la exposicin podra causar que las personas dejan la ocupacin anticipada y que a su vez podra producir tanto una falta de localizar a la persona (y por tanto la exclusin del estudio) y un mayor riesgo de muerte. Estas fuerzas se traducira en una probabilidad reducida de la seleccin entre los expuestos, con una reduccin mayor entre los casos. En este ejemplo, no hay ninguna referencia covarianza (confusor) crear diferencias en el riesgo entre los grupos expuestos y no expuestos, sino que la exposicin en s est ayudando a generar el sesgo. Tal sesgo sera irremediable, sin ms informacin sobre los efectos de la seleccin, e incluso con que la informacin no puede ser eliminado por el control de covarianza simple. Esta posibilidad subraya la necesidad de comprobacin exhaustiva de los resultados en la poblacin de origen en los estudios de casos y controles, y si no existe un sistema determinacin est en su lugar (por ejemplo, un registro de tumores de un estudio de cncer), el estudio tendr que implementar su propio sistema. Debido a que muchos tipos de sesgo de seleccin no se puede controlar en el anlisis, la prevencin de sesgo de seleccin mediante la seleccin apropiada de control puede ser crtico. La estrategia usual para este prevencin consiste en tratar de seleccionar un grupo de control que est sujeto a las mismas fuerzas selectivas como el grupo de casos, en la esperanza de que los sesgos introducidos por la seleccin de control de la cancelacin de los sesgos introducidos por la seleccin de casos en las estimaciones finales. Para alcanzar este objetivo ni siquiera aproximadamente es difcil de lograr, sin embargo, a menudo es la nica estrategia disponible para responder a las preocupaciones sobre el sesgo de seleccin. Esta estrategia y otros aspectos de la seleccin de controles se discutieron en el captulo 8. Para resumir, la seleccin diferencial que se produce antes de la exposicin y la enfermedad conduce a la confusin, y por lo tanto pueden ser controlados por los ajustes para los factores responsables de las diferencias de seleccin (vase, por ejemplo, los mtodos de ajuste se describe en el captulo 15). En contraste, el sesgo de seleccin como se describe generalmente en la epidemiologa (as como la literatura experimental de diseo) surge de seleccin afectada por la exposicin en estudio, y puede ser ms all de cualquier ajuste prctico. Entre estos sesgos de seleccin, podemos distinguir un sesgo Berksonian en el que tanto la exposicin y la enfermedad afecta a la seleccin. Algunos autores (por ejemplo,. Hernn et al, 2004) intento de utilizar grficos para proporcionar una base formal para la separacin de sesgo de seleccin de los factores de confusin al equiparar el sesgo de seleccin con un fenmeno denominado

colisionador de sesgo, una generalizacin de Berksonian sesgo (Groenlandia, 2003a; Captulo 12 ). Nuestra terminologa ms acorde con las denominaciones tradicionales en los que el sesgo de seleccin de pre-exposicin es tratada como una forma de confusin. Estas distinciones se analizan ms adelante en el captulo 12. Sesgo de informacin Error de medicin, errores de clasificacin, y el sesgo Una vez que los temas que se han identificado en comparacin, se debe obtener la informacin sobre ellos para utilizar en el anlisis. El sesgo en la estimacin de un efecto puede ser causado por errores de medicin en la informacin necesaria. Este sesgo es a menudo llamado sesgo de informacin. La direccin y la magnitud depende en gran medida si la distribucin de errores para una variable (por ejemplo, la exposicin o enfermedad) P.138 depende del valor actual de la variable, los valores reales de otras variables, o los errores en la medicin de otras variables. Para las variables discretas (variables con slo un nmero numerable de valores posibles, como los indicadores para el sexo), el error de medicin generalmente se llama error de clasificacin o de errores de clasificacin. Error de clasificacin que depende de los valores reales de otras variables que se llama error de clasificacin diferencial. Error de clasificacin que no dependen de los valores reales de las otras variables se llama clasificacin errnea no diferencial.Error de clasificacin que depende de los errores en la medicin o clasificacin de otras variables que se llama error dependiente, de lo contrario el error se llama error de independiente o no dependiente. Correlacionada de error se utiliza a veces como sinnimo de error dependiente, pero tcnicamente se refiere a los errores dependientes que tienen un coeficiente de correlacin distinta de cero. Gran parte del debate que sigui se referir a errores de clasificacin de las variables binarias. En esta situacin especial, la sensibilidad de un mtodo de medicin de la exposicin es la probabilidad de que alguien que est realmente expuesto se clasifican como expuestos por el mtodo. La probabilidad de falsos negativos del mtodo es la probabilidad de que alguien que est realmente expuesta a ser clasificados como no expuestos, sino que es igual a 1 menos la sensibilidad. La especificidad del mtodo es la probabilidad de que alguien que est verdaderamente no expuestos se clasifican como no expuestos. La probabilidad de falsos positivos es la probabilidad de que alguien que est realmente expuestos sern clasificados como expuestos, sino que es igual a 1 menos la especificidad. El valor predictivo positivo es la probabilidad de que alguien que est clasificado como expuesto est realmente expuesta. Por ltimo, el valor predictivo negativo es la probabilidad de que alguien que est clasificado como no expuestos es verdaderamente expuestos. Todos estos trminos tambin se puede aplicar a las descripciones de los mtodos para la clasificacin de la enfermedad o la clasificacin de un potencial de confusin o modificador. La clasificacin errnea diferencial Supongamos que un estudio de cohorte se lleva a cabo para comparar las tasas de incidencia de enfisema en los fumadores y no fumadores. El enfisema es una enfermedad que puede ir sin diagnosticar, sin atencin mdica especial. Si los fumadores, debido a la preocupacin acerca de la salud relacionados con los efectos del hbito de fumar o como consecuencia de los efectos en la salud del hbito de

fumar (por ejemplo, bronquitis), busque atencin mdica en un grado mayor que los no fumadores, a continuacin, el enfisema podra ser diagnosticado con ms frecuencia entre los fumadores que entre los los no fumadores simplemente como una consecuencia de la mayor atencin mdica.Fumar causa enfisema lo hace, pero a menos que se tomaron medidas para garantizar comparables de seguimiento, este efecto podra ser sobreestimada: Una parte del exceso de incidencia de enfisema no sera un efecto biolgico del tabaquismo, sino que sera un efecto del tabaquismo sobre la deteccin de de enfisema. Este es un ejemplo de errores de clasificacin diferencial, debido a falta de diagnstico de enfisema (incapacidad para detectar los casos verdaderos), que es un error de clasificacin, se presenta con mayor frecuencia para los no fumadores que para los fumadores. En los estudios caso-control de las malformaciones congnitas, la informacin a veces se obtiene de la entrevista de las madres. Las madres de casos que hayan dado a luz a un beb malformado, mientras que la gran mayora de las madres del grupo control que haya dado a luz a un beb aparentemente sano.Otra variedad de errores de clasificacin diferencial, que se refiere a recordar como los prejuicios, pueden resultar si las madres de bebs con malformaciones recordar o informar de las exposiciones reales de manera diferente que las madres de nios sanos (aumento de la sensibilidad de la retirada de la exposicin entre los casos), o con mayor frecuencia recuerdan o informan de la exposicin que hizo en realidad no se producen (reduccin de la especificidad del recuerdo de la exposicin entre los casos). Se supone que el nacimiento de un nio malformado sirve como un estmulo a una madre a recordar y reportar todos los eventos que podran haber desempeado algn papel en el resultado desafortunado. Es de suponer que estas mujeres va a recordar y reportar las exposiciones como las enfermedades infecciosas, traumatismos, y las drogas con ms frecuencia que las madres de nios sanos, que no han tenido un estmulo similar. Una asociacin sin relacin a cualquier efecto biolgico ser el resultado de este sesgo de recuerdo. El sesgo es una posibilidad en cualquier estudio de casos y controles que se basa en la memoria de tema, porque los casos y los controles son por definicin las personas que difieren con respecto a su experiencia de la enfermedad en el momento de su retiro, y esta diferencia puede afectar a retiro y presentacin de informes. Klemetti y Saxen (1967) encontraron que la cantidad de tiempo transcurrido entre la exposicin y la retirada fue un indicador importante de la precisin del recuerdo; estudios en los que el tiempo medio transcurrido desde la exposicin fue diferente para los casos entrevistados y los controles por lo tanto podra sufrir una clasificacin errnea diferencial . El sesgo causado por errores de clasificacin diferencial puede exagerar o subestimar su efecto. En cada uno de los ejemplos anteriores, la clasificacin errnea generalmente exagera los efectos en estudio, pero los ejemplos de lo contrario tambin puede ser encontrado. P.139

La clasificacin errnea no diferencial Mala clasificacin no diferencial se produce cuando la proporcin de sujetos mal clasificados en la exposicin no depende de la situacin del sujeto con respecto a otras variables en el anlisis, incluyendo la enfermedad. Clasificacin errnea no

diferencial la enfermedad se produce cuando la proporcin de sujetos mal clasificados en la enfermedad no depende de la situacin del sujeto con respecto a otras variables en el anlisis, incluyendo la exposicin. El sesgo introducido por la clasificacin errnea no diferencial independiente de una exposicin binaria o de la enfermedad es predecible en la direccin, es decir, hacia el valor nulo (Newell, 1962; Teclas y Kihlberg, 1963; Gullen et al, 1968;.. Copeland et al, 1977). Debido a los efectos imprevisibles de la relativamente mala clasificacin diferencial, algunos investigadores ir a travs de los procedimientos elaborados para asegurar que la clasificacin errnea no diferencial ser, como el cegamiento de las evaluaciones de exposicin con respecto al estado de resultados, en la creencia de que esto garantizar un sesgo hacia el valor nulo. Por desgracia, incluso en situaciones en las que se lleva a cabo el cegamiento o en estudios de cohortes en el que los resultados de la enfermedad an no han ocurrido, el colapso de los datos de exposicin continua o categrica en unas pocas categoras puede cambiar el error no diferencial de mala clasificacin diferencial (Flegal et al, 1991;. Wacholder et al. , 1991). Incluso cuando se logra la clasificacin errnea no diferencial, que puede venir a expensas de un aumento total de sesgo (Groenlandia y Robins, 1985; Drews y Groenlandia, 1990). Por ltimo, como se ver, nondifferentiality s sola no garantiza un sesgo hacia el valor nulo. Contrariamente a las ideas falsas populares, la exposicin no diferencial o clasificacin errnea enfermedad a veces puede producir un sesgo lejos de la hiptesis nula si la exposicin o la enfermedad variable tiene ms de dos niveles (Walker y Blettner, 1985;. Dosemeci et al, 1990) o si los errores de clasificacin dependen de los errores cometidos en otras variables (Chavance et al, 1992;. Kristensen, 1992). La clasificacin errnea no diferencial de la exposicin Como ejemplo de la clasificacin errnea no diferencial, tenga en cuenta un estudio de cohortes comparando la incidencia de cncer de laringe entre los bebedores de alcohol con la incidencia entre los no bebedores. Supongamos que los bebedores en realidad tienen una tasa de incidencia de 0,00050 aos-1, mientras que los no bebedores tienen una tasa de incidencia de 0,00010 aos-1, slo una quinta parte tan grande. Supongamos tambin que dos tercios de la poblacin de estudio se compone de los bebedores, pero slo el 50% de ellos lo reconocen. El resultado es una poblacin en la que se identifican de un tercio de los sujetos (correctamente) como bebedores y tienen una incidencia de la enfermedad de 0,00050 aos-1, pero los otros dos tercios de la poblacin est compuesta por igual nmero de bebedores y no bebedores, todos los cualesestn clasificados como no bebedores, y entre los cuales la incidencia promedio sera de 0,00030 aos-1 en lugar de 0,00010 aos-1 (Tabla 9.1). La diferencia de tasas ha sido P.140 reducido por la clasificacin errnea de 0,00040 aos 1 a 0,00020 ao-1, mientras que la proporcin de la tasa se ha reducido de 5 a 1,7. Este sesgo hacia los resultados de valor nulo de la clasificacin errnea no diferencial de algunos bebedores de alcohol como los abstemios. Cuadro 9.1. Efecto de la clasificacin errnea no diferencial del Consumo de Alcohol en la estimacin de la diferencia de tasas de incidencia y relacin de tasas de incidencia de cncer de la laringe (datos hipotticos)

Tasa de incidencia ( 105 y) la diferencia de tipo ( 105 y) Razn de las tasas Sin errores de clasificacin 1.000.000 de bebedores de 50 40 5.0 500.000 los no bebedores 10 La mitad de los bebedores clasificado con los no bebedores 500.000 consumidores de 50 20 1,7 1.000.000 de "no bebedores" (50% son en realidad los bebedores) 30 La mitad de los bebedores clasificados con los no bebedores y no bebedores, un tercio de clasificarse a los bebedores 666,667 "bebedores" (25% son en realidad los no bebedores) 40 6 1,2 833,333 "no bebedores" (60% son en realidad los bebedores) 34 La clasificacin errnea puede ocurrir simultneamente en ambas direcciones, por ejemplo, los no bebedores tambin puede estar mal clasificados como bebedores. Supongamos que, adems de la mitad de los bebedores que se clasifiquen como no bebedores, un tercio de los bebedores fueron mal clasificados como bebedores tambin. Las tasas de incidencia resultante sera 0,00040 aos-1 para los clasificados como bebedores y 0,00034 aos-1 para los clasificados como no bebedores. El error de clasificacin adicional, pues, casi oculta por completo la diferencia entre los grupos. Este ejemplo muestra cmo el sesgo producido por la clasificacin errnea no diferencial de una exposicin dicotmica ser hacia el valor nulo (de ninguna relacin), si el error de clasificacin es independiente de los errores de otros. Si el error de clasificacin es lo suficientemente grave, el sesgo pueden arrasar completamente una asociacin e incluso invertir la direccin de la asociacin (aunque la inversin se producir slo si el mtodo de clasificacin es peor que la clasificacin de las personas al azar como "expuestos" o "virgen"). Considerar como una tabla de ejemplo 9-2. El panel superior de la tabla se muestran los datos esperados de un hipottico estudio caso-control, con la exposicin medida como una dicotoma. El odds ratio es de 3,0. Ahora bien, supongamos que la exposicin se mide con un instrumento (por ejemplo, un cuestionario) que da lugar a una medida de la exposicin que tiene especificidad del 100%, pero slo el 80% de sensibilidad. En otras palabras, todos los verdaderamente P.141 los sujetos no expuestos estn correctamente clasificados como no expuestos, pero slo hay un 80% de probabilidades de que un sujeto expuesto se ha calificado correctamente expuesta, y por lo tanto una probabilidad del 20% ser un sujeto expuesto errneamente clasificados como no expuestos. Se supone que el error de clasificacin es no diferencial, lo que significa para este ejemplo que la sensibilidad y especificidad del mtodo de medicin de la exposicin es el mismo para los casos y controles. Tambin se supone que no hay error en la enfermedad de medicin, de la que automticamente se deduce que los errores de exposicin son independientes de los errores de la enfermedad. Los datos resultantes se dan en el segundo panel de la mesa. Con la reduccin de la sensibilidad en la medicin de la exposicin, el odds ratio es parcial, ya que su valor aproximado espera se reduce desde 3,0 hasta 2,6. Tabla 9-2 clasificacin errnea no diferencial con dos categoras de exposicin Expuestos No expuestos

Los datos correctos Casos 240 200 Controles 240 600 OR = 3,0 Sensibilidad = 0,8 Especificidad = 1,0 Casos 192 248 Controles 192 648 OR = 2,6 Sensibilidad = 0,8 Especificidad = 0,8 Casos 232 208 Controles 312 528 OR = 1,9 Sensibilidad = 0,4 Especificidad = 0,6 Casos 176 264 Controles 336 504 OR = 1,0 Sensibilidad = 0,0 Especificidad = 0,0 Casos 200 240 Controles 600 240 OR = 0,33 O, razn de momios. En el tercer panel, la especificidad de la medida de la exposicin se supone que es 80%, de modo que hay una probabilidad de 20% que alguien que est en realidad no expuestas se incorrectamente clasificado como expuesto. Los datos resultantes producen un odds ratio de 1,9 en lugar de 3,0. En trminos absolutos, ms de la mitad del efecto ha sido destruida por la mala clasificacin en el tercer panel: la odds ratio superior es de 3,0 - 1 = 2,0, mientras que es de 1,9 - 1 = 0,9 sobre la base de los datos con el 80% de sensibilidad y 80 % de especificidad en el tercer panel. El cuarto panel de la Tabla 9-2 ilustra que cuando la suma sensibilidad y especificidad a 1, la estimacin resultante espera ser nulo, independientemente de la magnitud del efecto. Si la suma de la sensibilidad y la especificidad es menor que 1, entonces la estimacin resultante esperado ser en la direccin opuesta del efecto real. El ltimo panel de la tabla muestra el resultado cuando la sensibilidad y la especificidad son iguales a cero. Esta situacin es equivalente a etiquetar todos los sujetos expuestos como no expuestos y viceversa. Esto conduce a una razn de probabilidad esperada que es la inversa del valor correcto. Errores de clasificacin tan drstica podra ocurrir si la codificacin de las categoras de exposicin fueron invertidos en la programacin de computadoras. Como se ve en estos ejemplos, la direccin del sesgo producido por la clasificacin errnea no diferencial independiente de una exposicin dicotmica es hacia el valor nulo, y si el error de clasificacin es extrema, la mala clasificacin puede ir ms all del valor nulo y la direccin inversa. Con una exposicin que se mide mediante su divisin en ms de dos categoras, sin embargo, una exageracin de una asociacin puede

ocurrir como resultado de la clasificacin errnea no diferencial independiente (Walker y Blettner, 1985;. Dosemeci et al, 1990). Este fenmeno se ilustra en la Tabla 9-3. Los datos previstos correctamente clasificados en la Tabla 9.3 muestran una odds ratio de 2 para una exposicin baja y 6 de alta exposicin, en relacin con la no exposicin. Ahora bien, supongamos que hay una probabilidad del 40% que una persona con alta exposicin no est bien clasificado en la categora de exposicin bajo. Si este es el error de clasificacin slo y es no diferencial, los datos previstos seran los que se observan en el panel inferior de la Tabla 9-3.Tenga en cuenta que slo la estimacin de los cambios bajos de exposicin, sino que ahora contiene una mezcla de personas que tienen una baja exposicin y la gente que tienen una alta exposicin, pero que han sido incorrectamente asignados a una baja exposicin. Debido a que las personas con alta exposicin llevan consigo el mayor P.142 riesgo de la enfermedad que viene con una alta exposicin, la estimacin del efecto resultante de una baja exposicin est sesgado al alza. Si algunos individuos de baja exposicin haba sido incorrectamente clasificada como de haber tenido una alta exposicin, a continuacin, la estimacin del efecto de la exposicin para la categora de alta exposicin estara sesgado a la baja. Tabla 9-3 con tres categoras de clasificacin errnea de la exposicin Exposicin La exposicin no expuesta Alta Baja Los datos correctos Casos 100 200 600 Controles 100 100 100 O=2O6= 40% de la alta exposicin 4 baja exposicin Casos 100 440 360 Controles 100 140 60 OR = 3,1 o 6 = O, razn de momios. Este ejemplo ilustra que cuando la exposicin cuenta con ms de dos categoras, el sesgo de clasificacin errnea no diferencial de la exposicin para una comparacin dado puede estar lejos del valor nulo. Cuando la exposicin es politmica (es decir, tiene ms de dos categoras) y no hay clasificacin errnea no diferencial entre dos de las categoras y no otras, el efecto de las estimaciones de estas dos categoras se har con preferencia hacia los dems (Walker y Blettner, 1985; Birkett, 1992 ). Por ejemplo, el sesgo en la estimacin del efecto de la categora de bajo de la exposicin en la Tabla 3.9 se dirige hacia la de la categora de alta exposicin y lejos del valor nulo. Tambin es posible error de clasificacin no diferencial independiente a la tendencia sesgo estima lejos de la nula o para invertir una tendencia (Dosemeci et al., 1990). Estos ejemplos son muy escasos, sin embargo, porque la inversin de tendencia que no puede ocurrir si la medicin de la exposicin media se incrementa con la exposicin real (Weinberg et al., 1994d). Es importante sealar que la presente discusin se refiere a los resultados esperados en virtud de un tipo particular de mtodo de medicin. En un determinado estudio, las fluctuaciones aleatorias de los errores producidos por un mtodo puede dar lugar a estimaciones que estn ms lejos de la hiptesis nula de lo que sera si no hay error

se presente, incluso si el mtodo satisface todas las condiciones que el sesgo de garanta hacia el valor nulo ( Thomas, 1995; Weinberg et al, 1995;. Jurek et al, 2005).. El sesgo se refiere slo a la direccin espera que, si no sabemos cules fueron los errores en el estudio, en el mejor de lo que podemos decir solamente que la odds ratio observada es probablemente ms cercano a la hiptesis nula de lo que sera si los errores estuvieron ausentes. A medida que aumenta el tamao del estudio, la probabilidad disminuye de que un resultado particular, se apartan sustancialmente de sus expectativas. La clasificacin errnea no diferencial de la enfermedad Los efectos de la clasificacin errnea no diferencial de la enfermedad se parecen a los de la clasificacin errnea no diferencial de la exposicin. En la mayora de las situaciones, la clasificacin errnea no diferencial de una evolucin de la enfermedad binario produce un sesgo hacia el valor nulo, siempre que el error de clasificacin es independiente de los errores de otros.Hay, sin embargo, algunos casos especiales en los que tales errores de clasificacin no produce un sesgo en la proporcin de riesgo. Adems, el sesgo en la diferencia de riesgo es una simple funcin de la sensibilidad y especificidad. Considere la posibilidad de un estudio de cohortes en el que 40 casos, en realidad se producen entre 100 sujetos expuestos, y 20 casos, en realidad se producen entre 200 sujetos no expuestos. Entonces, la relacin riesgo real es (40/100) / (20/200) = 4, y la diferencia de riesgo real es 40/100 - 20/200 = 0,30.Supongamos que la especificidad de deteccin de la enfermedad es perfecto (no hay falsos positivos), pero la sensibilidad es slo el 70% en ambos grupos de exposicin (es decir, la sensibilidad de deteccin de la enfermedad es no diferencial y no depende de errores en la clasificacin de la exposicin). Los nmeros esperados detectados entonces ser 0,70 (40) = 28 casos expuestos y 0,70 (20) = 14 casos no expuestos, que producen un riesgo esperado-proporcin estimacin de (28/100) / (14/200) = 4 y un esperado el riesgo de diferencia de estimacin de 28/100 - 14/200 = 0,21. Por lo tanto, la clasificacin errnea de la enfermedad no produjo ningn sesgo en la proporcin de riesgo, pero la espera de riesgo-diferencia de estimacin slo es 0.21/0.30 = 70% de la diferencia de riesgo real. Este ejemplo ilustra cmo la enfermedad de la clasificacin errnea no diferencial independiente, con una especificidad perfecta no sesgar la estimacin de riesgorelacin, pero se la baja el sesgo de la magnitud absoluta de la estimacin de riesgo de diferencia por un factor igual que la probabilidad de falsos negativos (Rodgers y MacMahon, 1995) . Con este tipo de errores de clasificacin, el odds ratio y la razn de tasas se mantendr un sesgo hacia el valor nulo, aunque la tendencia ser pequeo cuando el riesgo de enfermedad es baja (