View
9
Download
3
Category
Preview:
DESCRIPTION
Ejemplo de la distribucion de poisson
Citation preview
REGRESIÓN DE POISSON
Bibliografía:
V. Abraira, A.Pérez de VargasMétodos Multivariantes en Bioestadística. Ed. Centro de Estudios Ramón Areces. 1996.
Variables de Poisson Una variable es de Poisson cuando es el resultado de observar el número de eventos que ocurren en un intervalo temporal o espacial de tamaño dado (s), cumpliendo las siguientes condiciones: El número de eventos que ocurren en el intervalo es independiente del número de los
que ocurren fuera del mismo. Existe un intervalo lo suficientemente pequeño, de tamaño h, para el que la
probabilidad de que en el mismo ocurra un sólo evento es proporcional al tamaño del intervalo, es decir es h, siendo por tanto (constante) la probabilidad de que ocurra un evento en un intervalo de tamaño unidad.
La probabilidad de que en cualquier intervalo de tamaño h ocurran dos o más eventos, es prácticamente 0.
Ejemplos de este tipo de variables, con intervalos temporales, son: número de llamadas que recibe una central telefónica en una hora, número de accidentes, durante un año, en un cruce de carreteras, número de mutaciones que perduran en una especie, durante un milenio. Ejemplos con intervalos espaciales: número de células en el campo del microscopio; número de bacterias patógenas en un estanque, etc. A veces se usan variables de Poisson con "intervalos" que no son espaciales ni temporales sino de otro tipo. Por ejemplo, para medir la frecuencia de una enfermedad se puede contar, en un tiempo dado, el número de enfermos en una cierta población, dividida en "intervalos" de, por ejemplo, 10.000 habitantes. Al número de personas enfermas en una población de tamaño prefijado, en un instante de tiempo, se le denomina prevalencia de la enfermedad en ese instante y es, por tanto, una variable de Poisson. Otra medida para la frecuencia de una enfermedad, es la incidencia, que es el número de personas que enferman en una población susceptible de enfermar, en un periodo de tiempo determinado. En este caso el intervalo es de personas-tiempo, habitualmente personas-año, y es también una variable de Poisson. Habitualmente ambas medidas se expresan para intervalos de tamaño unidad, o dicho de otro modo, en lugar de la variable número de enfermos, se usa el parámetro (el riesgo, en el caso de la prevalencia, y la densidad de incidencia, en el de incidencia).
La función densidad de probabilidad para una variable de Poisson es:
-( )( ) 0 ,1, ..
!
y ss ef y y .y
siendo s el tamaño del intervalo. La media y la varianza de esta variable son ambas iguales a s. La variable está caracterizada por el parámetro (probabilidad de una ocurrencia en la unidad de medida) y por el tamaño del intervalo s. Un modelo de regresión para una variable de Poisson es un modelo que permite estudiar si dicha variable depende, o no, de otra u otras variables. Si una variable de Poisson de
parámetro es independiente de otra variable X, se cumple = | X , por consiguiente, un modelo de regresión es una función de en X que a través del coeficiente de X permite investigar la relación anterior, y como en los modelos lineal y logístico, fácilmente generalizable a más variables independientes.
MODELO DE REGRESIÓN DE POISSON Para una única variable independiente X, es un modelo de la forma:
o, para simplificar la notación, simplemente:
0 1ln X
donde ln significa logaritmo neperiano, 0 y 1 son constantes y X una variable que puede ser aleatoria o no, continua o discreta. Este modelo se puede fácilmente generalizar para k variables independientes:
0 1ln ... 1 kk X X
Por lo tanto 0 es el logaritmo de (probabilidad de que ocurra un evento en un intervalo de tamaño unidad) cuando todas las variables independientes son cero, y i es el cambio en el logaritmo de (o logaritmo del cociente de cuando la variable Xi aumenta una
unidad, manteniéndose constantes las demás o, dicho de otro modo, 0e es la
probabilidad de que ocurra un evento en un intervalo unidad cuando todas las variables
independientes son cero y ieel cociente de dicha probabilidad para un aumento de una
unidad en la variable Xi (riesgo relativo). Obsérvese que, al igual que en la regresión logística, el modelo supone efectos multiplicativos, es decir, si la variable Xi aumenta n
unidades, la probabilidad para la variable de Poisson se multiplica por iin n e e
es
decir, la potencia n-ésima de ie
Teniendo en cuenta, que para una variable de Poisson: = s el modelo también se puede poner en función de como:
0 1 1ln ln ... k k = s X X
Ejemplo Se quiere comparar la incidencia de cáncer de piel en 2 ciudades, para ello se registran los cánceres de piel aparecidos en el último año, 18 para la ciudad A y 30 para la B, cuyas poblaciones respectivas son 350.000 y 410.000. Se trata de variables de Poisson con intervalo de personas-tiempo. Asumiendo que ambas poblaciones se han mantenido constantes a lo largo de ese año y que todos los individuos eran susceptibles de enfermar, los tamaños de los intervalos son respectivamente 350.000 y 410.000 personas-año y la mejor estimación de las densidades de incidencia:
0 1
30y
410.000
18
350.000
Definiendo la variable X = 0 para la ciudad A y X = 1 para la B, estos resultados se pueden expresar con un modelo de regresión, siendo:
0 0ˆ ln - 9,875
el logaritmo de la densidad de incidencia en la ciudad A y 1̂ el logaritmo de la razón de densidades de incidencia, es decir:
1 11
0 0
ˆ ln 0,353 = 0,353 1,423e
Por lo tanto, la densidad de incidencia en B es 1,423 la de A (42,3% más alta).
Evidentemente, para comparar ambas incidencias, simplemente hay que comparar 1̂
con cero o 1ˆe
con 1. Se puede plantear que esta diferencia en las incidencias pueda ser debida, simplemente, a que ambas ciudades tengan una pirámide de población distinta (es sabido que la incidencia del cáncer es distinta para distintos grupos de edad) o quizás, y sería una hipótesis más interesante a investigar, a algún otro factor. Si se conoce la distribución de las poblaciones para los distintos grupos de edad, así como el grupo al que pertenece cada enfermo, se puede plantear un modelo:
0 1 1 2 2ln X X
siendo X1 la ciudad y X2 el grupo de edad. En este modelo α1 es la razón de densidades de incidencia para ambas ciudades controlando por la edad. Si 1 es distinto de 0, se puede concluir que existe algún factor, distinto de la edad, en ambas ciudades que incide en el cáncer de piel.
Estimación de los coeficientes Para estimar los coeficientes de un modelo de Poisson se utiliza el método de máxima verosimilitud. Este procedimiento es matemáticamente complejo, pero lo que importa para el usuario es:
1º El proceso es iterativo, es decir se dan a los coeficientes unos valores arbitrarios (habitualmente, aunque no necesariamente, el valor 0). La solución final no depende de estos valores
2º A partir de estos valores iniciales se construye una matriz p con los valores previstos por el modelo para las observaciones de la variable dependiente.
3º A partir de esta matriz y de la matriz X de diseño (construida igual que en regresión lineal), se calculan los nuevos estimadores, que se comprueba si son ya la solución, en cuyo caso se para el proceso y en caso contrario se repite el proceso. En la práctica, y para evitar convergencias asintóticas, también se para el proceso si los nuevos estimadores difieren de los anteriores en menos de una cierta cantidad, llamada límite de convergencia.
En este último paso hay que invertir una matriz y eso puede dar problemas de colinearidad
Distribución muestral de los estimadores
Hay un teorema (teorema del límite central en la estimación por máxima verosimilitud) que dice estos estimadores son asintóticamente normales y su matriz de varianzas-covarianzas es
= -J -1 = -(X'pX) -1
y su estimación se calcula, particularizando para los coeficientes estimados.
Contrastes de hipótesis y estrategias de modelización Teniendo en cuenta lo anterior los contrastes de hipótesis sobre cada coeficiente se hacen con la prueba de Wald y los contrastes de hipótesis sobre el modelo completo, o sobre un conjunto de coeficientes, con el logaritmo del cociente de verosimilitudes. Por otro lado las estrategias de modelización son exactamente las mismas que las vistas en los capítulos previos. Ejemplo Supóngase que en las ciudades del ejemplo anterior, la población y los cánceres de piel aparecidos se distribuyen como sigue para distintos grupos de edad:
Ciudad A Ciudad B
Edad Población Cáncer Población Cáncer 0 – 30 120.000 3 130.000 431 – 60 200.000 7 220.000 10
> 60 30.000 8 60.000 16 Estímese, mediante un modelo de Poisson, la razón de densidades de incidencia para ambas ciudades, controlando por la edad. Se crea el siguiente archivo con cuatro variables:
EDAD CIUDAD POBLACION CANCER1 0 120.000 32 0 200.000 73 0 30.000 81 1 130.000 42 1 220.000 103 1 60.000 16
para independizar el resultado de como cambien las densidades de incidencia entre los distintos grupos de edad, se crean a partir de la variable EDAD dos variables indicadoras, EDAD1 y EDAD2, con el primer esquema discutido en regresión lineal y para estudiar la posible interacción entre CIUDAD y EDAD, se crean las variables CIXED1 y CIXED2 con los productos de CIUDAD´EDAD1 y CIUDAD´EDAD2 respectivamente.
El modelo completo tiene, por lo tanto, cinco variables: CIUDAD, EDAD1, EDAD2, CIXED1 y CIXED2.
El ajuste para este modelo es:
NOMBRE DE LOS DATOS: eje2poisVARIABLE DEPENDIENTE: CANCERVARIABLE TAMAÑO: POBLA
NUMERO DE VARIABLES INDEPENDIENTES: 5 A SABERCIUDAD EDAD1 EDAD2 CIXED1 CIXED2
NUMERO DE CASOS: 6NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 15 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0
VARIABLE
ALFA EXP(ALFA)
EE. ALFA Ji2 p
Const. -10.59663 .00003 .57735 336.86620
.00000
CIUDAD .20764 1.23077 .76376 .07391
.78227
EDAD1 .33647 1.40000 .69007 .23775
.63158
EDAD2 2.36712 10.66666 .67700 12.22533
.00060
CIXED1 .05373 1.05520 .90895 .00349
.95139
CIXED2 -.20764 .81250 .87797 .05593
.80834
LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -32.88131LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -11.39070Ji-Cuadrado modelo= 42.98121 GL= 5 p= .00000
El ajuste del modelo, con la prueba del logaritmo del cociente de verosimilitudes es significativo. El primer contraste a realizar es sobre la interacción. Como las variables CIXED1 y CIXED2 son indicadoras y no tienen sentido por sí solas, hay que realizarlo globalmente para las dos con el logaritmo del cociente de verosimilitudes. Se ajusta, por lo tanto, a un modelo sin ellas. El resultado es: NOMBRE DE LOS DATOS: eje2pois VARIABLE DEPENDIENTE: CANCERVARIABLE TAMAÑO: POBLA NUMERO DE VARIABLES INDEPENDIENTES: 3 A SABERCIUDAD EDAD1 EDAD2
NUMERO DE CASOS: 6 NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 15 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0 VARIABLE
ALFA EXP(ALFA)
EE. ALFA
Ji2 p
Const. -10.55314 .00003 .41299 652.96970
.00000
CIUDAD .13023 1.13909 .30131 .18681
.66947
EDAD1 .36802 1.44486 .44909 .67153
.58226
EDAD2 2.23495 9.34601 .43171 26.80163
.00000
LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -32.88131LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -11.47604Ji-Cuadrado modelo= 42.81053 GL= 3 p= .00000Ji-Cuadrado modelo anterior= .17068 GL= 2 p= .91773 No se puede rechazar la hipótesis nula de no existencia de interacción (p=0,91773), por lo tanto se eliminan dichas variables del modelo. Para este último modelo la matriz estimada de covarianzas de los estimadores es:
MATRIZ DE COVARIANZAS
Const.
CIUDAD EDAD1 EDAD2
Const. .171 CIUDAD -.050 .091 EDAD1 -.143 -.000 .202 EDAD2 -.136 -.013 .143 .186
El próximo contraste a realizar es para las variables EDAD1 y EDAD2, que también tiene que ser global. Se ajusta a un modelo sin ellas y el resultado es: NOMBRE DE LOS DATOS: eje2pois VARIABLE DEPENDIENTE: CANCERVARIABLE TAMAÑO: POBLA NUMERO DE VARIABLES INDEPENDIENTES: 1 A SABER CIUDAD NUMERO DE CASOS: 6 NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 15 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0 VARIABLE
ALFA EXP(ALFA)
EE. ALFA
Ji2 p
Const. -9.8753 .00005 .23570 1755.39400
.00000
CIUDAD .3526 1.42276 .29814 1.39869
.23503
LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -32.88131LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -32.16458Ji-Cuadrado modelo= 1.43345 GL= 1 p= .22908Ji-Cuadrado modelo anterior= 41.37708 GL= 2 p= .00000
Obsérvese que esta última estimación coincide con la calculada anteriormente. Con la prueba del logaritmo del cociente de verosimilitudes no se puede rechazar (p=0,00000) que no haya efecto de la edad. En el modelo que contiene la edad, la razón de densidades de incidencia entre las dos ciudades es 1,13909 y no es significativamente distinta de 1 (p=0,66947 con la prueba de Wald). Nótese que la edad es una variable de confusión (con el modelo que sólo contiene la ciudad, la estimación es 1,42276) y por tanto el modelo adecuado para hacer las estimaciones es el que contiene la edad. El intervalo de confianza al 95%, también calculado por el programa, aunque en la salida anterior no se presenta, es (0,631, 2,056).
Para estimar, por ejemplo, con ese modelo la densidad de incidencia para el grupo de mayores de 60 años en la ciudad B, recuérdese que para la ciudad B, CIUDAD=1 y para ese grupo de edad, EDAD1=0 y EDAD2=1, por lo tanto según el modelo:
0 1 3ˆ ˆ ˆ - 10,55314 + 0,13023 + 2,23495 - 8,18796 e e e 0,00027 obsérvese que, como el ajuste del modelo es muy bueno, coincide con la estimación que se puede obtener directamente de los datos:
= 16 / 60.000 = 0,00027 pero el modelo permite, además, calcular un intervalo de confianza para dicha estimación. Para ello hay que calcular:
0 1 3 0 1 3 0 1 0 3 1 3ˆ ˆ ˆ ˆ ˆ ˆ ˆˆ ˆ ˆ ˆ ˆ ˆ ˆ , ˆ ˆ , ˆ ˆ , ˆVar Var Var Var 2 Cov 2 Cov 2 Cov
0,171 + 0,091 + 0,186 - 2 x 0,050 - 2 x 0,136 - 2 x 0,013 = 0,05
su error estándar es
0,05 = 0,224 y por lo tanto el intervalo de confianza al 95% es
- 8,18796 1,96 x 0,224 = ( 0,00018 , 0,00043 )e
y del mismo modo para los otros grupos de edad y/o la otra ciudad.
Otras lecturas Silva Ayçaguer L.C., Barroso Utra I.M. Selección algorítmica de modelos en las aplicaciones biomédicas de la regresión múltiple. Medicina Clínica. 2001;116:741-745.
La colinealidad en la regresión de Poisson Del mismo modo que en la regresión logística, para estimar los coeficientes hay que invertir la matriz J = X’pX siendo además la inversa de J la matriz de varianzas-covarianzas de los mismos. Por consiguiente, si dicha matriz es singular el modelo es irresoluble y si es casi-singular existen problemas de precisión numérica y estadística, siendo, además, inestable la estimación. Como entonces, aunque no es un problema de colinealidad en sentido estricto se sigue hablando, por analogía, de colinealidad y, también, el diagnóstico de la misma se hace de análoga manera, es decir, calculando los índices de condición para la matriz J también escalada para que su diagonal principal esté formada por unos, y calculando a partir de los autovectores de la misma, la matriz de descomposición de la varianza de los estimadores. Evidentemente, por no ser un problema de colinealidad, el factor de inflación de la varianza tampoco es útil ahora.
También en el caso de la regresión de Poisson, y a diferencia de la regresión lineal, la matriz J no depende sólo de los datos, sino también de los coeficientes del modelo (a través de p) y pudiera darse el caso de que, en el proceso iterativo de estimación y para unos ciertos valores iniciales de los coeficientes, J fuera singular en algún paso del proceso alejado de la solución final y que, sin embargo, si se partiera de otros valores iniciales se pudiera acabar la estimación sin problemas. También puede ocurrir que, debido a la falta de precisión ligada a la casi-colinealidad de algún paso intermedio, el método de Newton-Raphson no convergiera para unos valores iniciales y, sin embargo, si convergiera para otros. En caso de que aparezcan estos problemas, un modo de minimizarlos es, ayudándose del diagnóstico de colinealidad, intentar la estimación con distintos valores iniciales, incluyendo estimaciones aproximadas de los coeficientes (obtenidas, por ejemplo, a partir del método usado en el ejemplo).
Hay que tener en cuenta, también, que debido a los grandes valores que suele tener la variable s, tamaño del intervalo, en algunos modelos (en el ejemplo desarrollado en este texto son cientos de miles, pero en problemas de estimación de tasas de mortalidad por países puede ser de decenas o centenas de millones) pueden aparecer problemas de precisión o, incluso, desbordes (se denomina así al hecho de que un número sea mayor que la capacidad de la porción de memoria reservada en el ordenador para almacenarlo) en los algoritmos de estimación. En estos casos se puede dividir dicha variable por una constante adecuada, es decir, se expresa la población en miles de personas o en centenas de miles, entonces el parámetro queda multiplicado por ese mismo factor, pero en el modelo ese cambio sólo afecta a 0 (se le sumará el logaritmo de dicha constante) y no al resto de los coeficientes. Si en el ejemplo anterior se divide la población por 1.000, los modelos encontrados serán exactamente los mismos excepto el coeficiente 0 al que se le sumará ln1.000=6,908.
Ejemplo Los “salida” del PRESTA del diagnóstico de colinealidad para el modelo del ejemplo anterior en el que se ha dividido la población por 1.000 es:
REGRESION POISSON CON LOS COEFICIENTES:Const.: -3.6454 CIUDAD: .1302 EDAD1: .3680 EDAD2 : 2.2350
FACTOR
AUTOVALOR
INDICE CONDICION
1 2.64356 1.000002 1.00497 1.621883 .27931 3.076464 .07216 6.05269
PROPORCION DE VARIANZA EN LOS FACTORES
FACTOR Const. CIUDAD
EDAD1 EDAD2
1 .0163 .0423 .0140 .0182 2 .0003 .0014 .1838 .0802 3 .0375 .8924 .0586 .1435 4 .9459 .0639 .7436 .7581
Donde, con los criterios discutidos regresión lineal, no se aprecian problemas de colinealidad.
Relación entre los modelos de Poisson y logístico El intervalo s en el que está definida una variable de Poisson se puede dividir en un conjunto de n subintervalos de tamaño h, cada uno de los cuales es tan pequeño que en ellos sólo puede ocurrir, a lo sumo, un evento, y la probabilidad de que ocurra es la constante . Por lo tanto, en cada uno de estos intervalos, el número de eventos que ocurren es 0 ó 1, con probabilidades 1 - y respectivamente, es decir, es una variable binomial puntual. Una variable de Poisson es, en consecuencia, la suma de n variables binomiales puntuales, es decir, es una variable binomial de parámetros n y . Como no hay una manera única de elegir los subintervalos, el parámetro n no está bien definido, sin embargo, el tamaño h tiene que ser suficientemente pequeño, por lo tanto n será grande.
En consecuencia, todos los problemas que se pueden plantear con un modelo de Poisson, también se pueden plantear con un modelo logístico, si se dispone de los datos individualizados y, como era de esperar, se obtiene el mismo resultado. Hay que tener en cuenta, no obstante, que el modelo logístico modeliza el odds, mientras que el de Poisson modeliza la probabilidad, por lo tanto los coeficientes sólo coincidirán cuando la probabilidad sea pequeña. Nótese que la inversa no siempre es cierta, hay problemas que se pueden plantear con un modelo logístico y no con un modelo de Poisson, como
por ejemplo, un estudio caso-control, en el que la probabilidad no se puede estimar (por tanto, tampoco modelizar) y, sin embargo, sí se puede el odds ratio.
Ejemplo
En un estudio para establecer la eficacia de una vacuna contra la gripe en dos grupos de edad, se mide, durante una semana de invierno, la prevalencia de la misma en dos muestras aleatorias de individuos vacunados y no vacunados en los dos grupos de edad. Se obtienen los siguientes resultados:
Vacunados No vacunadosEdad Total Gripe Total Gripe
20 - 60 80 3 91 5> 60 50 5 43 10
El número de individuos con gripe en cada una de las situaciones es una variable de Poisson, para la que se puede plantear un modelo de regresión. Para cada individuo, el tener, o no, gripe, es una variable binomial puntual para la que se puede plantear un modelo logístico. Para ajustar a un modelo Poisson hay que partir de un archivo como el siguiente:
EDAD VACUNA TOTAL
GRIPE
0 1 80 31 1 50 50 0 91 51 0 43 10
Para ajustar a un modelo logístico hay que crear un archivo en que cada individuo sea una observación. Sería: EDAD VACUNA GRIPE
0 1 1 3 observaciones: individuos vacunados, edad 20-60, con gripe
0 1 0 77 observaciones: individuos vacunados, edad 20-60, sin gripe
1 1 1 5 observaciones: individuos vacunados, edad >60, con gripe
1 1 0 45 observaciones
0 0 1 5 observaciones
0 0 0 86 observaciones
1 0 1 10 observaciones
1 0 0 33 observaciones
y los ajustes correspondientes:
REGRESION DE POISSON NOMBRE DE LOS DATOS: eje5pois VARIABLE DEPENDIENTE: GRIPE VARIABLE TAMAÑO: TOTAL NUMERO DE VARIABLES INDEPENDIENTES: 2 A SABEREDAD VACUNA
NUMERO DE CASOS: 4 NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 8 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0 VARIABLE
ALFA EXP(ALFA)
EE. ALFA
Ji2 p
Const. -2.79827 .06092 .37835 54.70174
.00000
EDAD 1.28379 3.61029 .43865 8.56527
.00357
VACUNA -.68495 .50412 .43865 2.43822
.11406
LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -12.72912LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -7.18156Ji-Cuadrado modelo= 11.09511 GL= 2 p= .00410 INTERVALOS DE CONFIANZA AL 95% DE LOS EXP(ALFA)EDAD 1.52810 8.52966VACUNA .21337 1.19102
El riesgo relativo para la vacuna, controlado por la edad, es 0,50412 (la probabilidad de que un individuo vacunado contraiga la gripe es aproximadamente la mitad que la de un individuo sin vacunar) con un intervalo de confianza de (0,21337, 1,19102), por lo tanto, no es significativamente distinto de 1. REGRESION LOGISTICA INCONDICIONAL NOMBRE DE LOS DATOS: eje52poi VARIABLE DEPENDIENTE: GRIPE NUMERO DE VARIABLES INDEPENDIENTES: 2 A SABEREDAD VACUNA
NUMERO DE CASOS: 264 NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 7 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0 VARIABLE
ALFA EXP(ALFA) EE. ALFA Ji2 p
Const. -2.71567 .06616 .38959 48.58808 .00000EDAD 1.43544 4.20149 .46417 9.56352 .00217VACUNA -.78082 .45803 .46780 2.78598 .09094 LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -78.09814LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -71.93247Ji-Cuadrado modelo= 12.33133 GL= 2 p= .00230 INTERVALOS DE CONFIANZA AL 95% DE LOS "ODDS RATIO"
EDAD 1.69159 10.43545VACUNA .18310 1.14577
El odds ratio para la vacuna es 0,45803 y tampoco es significativamente distinto de 1. En este caso, y como la probabilidad de contraer la gripe no es pequeña, ambos estimadores no coinciden. Sin embargo, si se calcula por ejemplo, la probabilidad de que una persona mayor de 60 años y no vacunada contraiga la gripe con el modelo de Poisson:
- 2,79827 + 1,28378 = = 0,22e y con el modelo logístico:
1
- 2,71567 + 1,43544
- 2,71567 + 1,43544
ep 0,22
e
que como se observa, sí coinciden.
Recommended