Ejemplo de Ajuste de Modelo de Regresión Poisson

Preview:

DESCRIPTION

Ejemplo de la distribucion de poisson

Citation preview

REGRESIÓN DE POISSON

Bibliografía:

V. Abraira, A.Pérez de VargasMétodos Multivariantes en Bioestadística. Ed. Centro de Estudios Ramón Areces. 1996.

Variables de Poisson Una variable es de Poisson cuando es el resultado de observar el número de eventos que ocurren en un intervalo temporal o espacial de tamaño dado (s), cumpliendo las siguientes condiciones:  El número de eventos que ocurren en el intervalo es independiente del número de los

que ocurren fuera del mismo. Existe un intervalo lo suficientemente pequeño, de tamaño h, para el que la

probabilidad de que en el mismo ocurra un sólo evento es proporcional al tamaño del intervalo, es decir es h, siendo por tanto (constante) la probabilidad de que ocurra un evento en un intervalo de tamaño unidad.

La probabilidad de que en cualquier intervalo de tamaño h ocurran dos o más eventos, es prácticamente 0.

 Ejemplos de este tipo de variables, con intervalos temporales, son: número de llamadas que recibe una central telefónica en una hora, número de accidentes, durante un año, en un cruce de carreteras, número de mutaciones que perduran en una especie, durante un milenio. Ejemplos con intervalos espaciales: número de células en el campo del microscopio; número de bacterias patógenas en un estanque, etc. A veces se usan variables de Poisson con "intervalos" que no son espaciales ni temporales sino de otro tipo. Por ejemplo, para medir la frecuencia de una enfermedad se puede contar, en un tiempo dado, el número de enfermos en una cierta población, dividida en "intervalos" de, por ejemplo, 10.000 habitantes. Al número de personas enfermas en una población de tamaño prefijado, en un instante de tiempo, se le denomina prevalencia de la enfermedad en ese instante y es, por tanto, una variable de Poisson. Otra medida para la frecuencia de una enfermedad, es la incidencia, que es el número de personas que enferman en una población susceptible de enfermar, en un periodo de tiempo determinado. En este caso el intervalo es de personas-tiempo, habitualmente personas-año, y es también una variable de Poisson. Habitualmente ambas medidas se expresan para intervalos de tamaño unidad, o dicho de otro modo, en lugar de la variable número de enfermos, se usa el parámetro (el riesgo, en el caso de la prevalencia, y la densidad de incidencia, en el de incidencia).  

La función densidad de probabilidad para una variable de Poisson es: 

-( )( ) 0 ,1, ..

!

y ss ef y y .y

 siendo s el tamaño del intervalo. La media y la varianza de esta variable son ambas iguales a s. La variable está caracterizada por el parámetro (probabilidad de una ocurrencia en la unidad de medida) y por el tamaño del intervalo s. Un modelo de regresión para una variable de Poisson es un modelo que permite estudiar si dicha variable depende, o no, de otra u otras variables. Si una variable de Poisson de

parámetro es independiente de otra variable X, se cumple = | X , por consiguiente, un modelo de regresión es una función de en X que a través del coeficiente de X permite investigar la relación anterior, y como en los modelos lineal y logístico, fácilmente generalizable a más variables independientes.

MODELO DE REGRESIÓN DE POISSON Para una única variable independiente X, es un modelo de la forma: 

o, para simplificar la notación, simplemente: 

0 1ln X

 donde ln significa logaritmo neperiano, 0 y 1 son constantes y X una variable que puede ser aleatoria o no, continua o discreta. Este modelo se puede fácilmente generalizar para k variables independientes:

0 1ln ... 1 kk X X

 Por lo tanto 0 es el logaritmo de (probabilidad de que ocurra un evento en un intervalo de tamaño unidad) cuando todas las variables independientes son cero, y i es el cambio en el logaritmo de (o logaritmo del cociente de cuando la variable Xi aumenta una

unidad, manteniéndose constantes las demás o, dicho de otro modo, 0e es la

probabilidad de que ocurra un evento en un intervalo unidad cuando todas las variables

independientes son cero y ieel cociente de dicha probabilidad para un aumento de una

unidad en la variable Xi (riesgo relativo). Obsérvese que, al igual que en la regresión logística, el modelo supone efectos multiplicativos, es decir, si la variable Xi aumenta n

unidades, la probabilidad para la variable de Poisson se multiplica por iin n e e

es

decir, la potencia n-ésima de ie

 Teniendo en cuenta, que para una variable de Poisson: = s el modelo también se puede poner en función de como: 

0 1 1ln ln ... k k = s X X

  

Ejemplo Se quiere comparar la incidencia de cáncer de piel en 2 ciudades, para ello se registran los cánceres de piel aparecidos en el último año, 18 para la ciudad A y 30 para la B, cuyas poblaciones respectivas son 350.000 y 410.000. Se trata de variables de Poisson con intervalo de personas-tiempo. Asumiendo que ambas poblaciones se han mantenido constantes a lo largo de ese año y que todos los individuos eran susceptibles de enfermar, los tamaños de los intervalos son respectivamente 350.000 y 410.000 personas-año y la mejor estimación de las densidades de incidencia: 

0 1

30y

410.000

18

350.000

 Definiendo la variable X = 0 para la ciudad A y X = 1 para la B, estos resultados se pueden expresar con un modelo de regresión, siendo: 

0 0ˆ ln - 9,875

 

el logaritmo de la densidad de incidencia en la ciudad A y 1̂ el logaritmo de la razón de densidades de incidencia, es decir: 

1 11

0 0

ˆ ln 0,353 = 0,353 1,423e

 Por lo tanto, la densidad de incidencia en B es 1,423 la de A (42,3% más alta).

Evidentemente, para comparar ambas incidencias, simplemente hay que comparar 1̂

con cero o 1ˆe

con 1. Se puede plantear que esta diferencia en las incidencias pueda ser debida, simplemente, a que ambas ciudades tengan una pirámide de población distinta (es sabido que la incidencia del cáncer es distinta para distintos grupos de edad) o quizás, y sería una hipótesis más interesante a investigar, a algún otro factor. Si se conoce la distribución de las poblaciones para los distintos grupos de edad, así como el grupo al que pertenece cada enfermo, se puede plantear un modelo: 

0 1 1 2 2ln X X

 siendo X1 la ciudad y X2 el grupo de edad. En este modelo α1 es la razón de densidades de incidencia para ambas ciudades controlando por la edad. Si 1 es distinto de 0, se puede concluir que existe algún factor, distinto de la edad, en ambas ciudades que incide en el cáncer de piel. 

Estimación de los coeficientes Para estimar los coeficientes de un modelo de Poisson se utiliza el método de máxima verosimilitud. Este procedimiento es matemáticamente complejo, pero lo que importa para el usuario es:

1º El proceso es iterativo, es decir se dan a los coeficientes unos valores arbitrarios (habitualmente, aunque no necesariamente, el valor 0). La solución final no depende de estos valores

2º A partir de estos valores iniciales se construye una matriz p con los valores previstos por el modelo para las observaciones de la variable dependiente.

3º A partir de esta matriz y de la matriz X de diseño (construida igual que en regresión lineal), se calculan los nuevos estimadores, que se comprueba si son ya la solución, en cuyo caso se para el proceso y en caso contrario se repite el proceso. En la práctica, y para evitar convergencias asintóticas, también se para el proceso si los nuevos estimadores difieren de los anteriores en menos de una cierta cantidad, llamada límite de convergencia.

En este último paso hay que invertir una matriz y eso puede dar problemas de colinearidad

Distribución muestral de los estimadores

Hay un teorema (teorema del límite central en la estimación por máxima verosimilitud) que dice estos estimadores son asintóticamente normales y su matriz de varianzas-covarianzas es

= -J -1 = -(X'pX) -1

y su estimación se calcula, particularizando para los coeficientes estimados.

Contrastes de hipótesis y estrategias de modelización Teniendo en cuenta lo anterior los contrastes de hipótesis sobre cada coeficiente se hacen con la prueba de Wald y los contrastes de hipótesis sobre el modelo completo, o sobre un conjunto de coeficientes, con el logaritmo del cociente de verosimilitudes. Por otro lado las estrategias de modelización son exactamente las mismas que las vistas en los capítulos previos. Ejemplo  Supóngase que en las ciudades del ejemplo anterior, la población y los cánceres de piel aparecidos se distribuyen como sigue para distintos grupos de edad: 

  Ciudad A Ciudad B

Edad Población Cáncer Población Cáncer 0 – 30 120.000 3 130.000 431 – 60 200.000 7 220.000 10

> 60 30.000 8 60.000 16 Estímese, mediante un modelo de Poisson, la razón de densidades de incidencia para ambas ciudades, controlando por la edad. Se crea el siguiente archivo con cuatro variables: 

EDAD CIUDAD POBLACION CANCER1 0 120.000 32 0 200.000 73 0 30.000 81 1 130.000 42 1 220.000 103 1 60.000 16

 para independizar el resultado de como cambien las densidades de incidencia entre los distintos grupos de edad, se crean a partir de la variable EDAD dos variables indicadoras, EDAD1 y EDAD2, con el primer esquema discutido en regresión lineal y para estudiar la posible interacción entre CIUDAD y EDAD, se crean las variables CIXED1 y CIXED2 con los productos de CIUDAD´EDAD1 y CIUDAD´EDAD2 respectivamente.

El modelo completo tiene, por lo tanto, cinco variables: CIUDAD, EDAD1, EDAD2, CIXED1 y CIXED2.

El ajuste para este modelo es:

NOMBRE DE LOS DATOS: eje2poisVARIABLE DEPENDIENTE: CANCERVARIABLE TAMAÑO: POBLA

NUMERO DE VARIABLES INDEPENDIENTES: 5 A SABERCIUDAD EDAD1 EDAD2 CIXED1 CIXED2

NUMERO DE CASOS: 6NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 15 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0 

VARIABLE

ALFA EXP(ALFA)

EE. ALFA Ji2 p

Const. -10.59663 .00003 .57735 336.86620

.00000

CIUDAD .20764 1.23077 .76376 .07391

.78227

EDAD1 .33647 1.40000 .69007 .23775

.63158

EDAD2 2.36712 10.66666 .67700 12.22533

.00060

CIXED1 .05373 1.05520 .90895 .00349

.95139

CIXED2 -.20764 .81250 .87797 .05593

.80834

  LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -32.88131LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -11.39070Ji-Cuadrado modelo= 42.98121 GL= 5 p= .00000

El ajuste del modelo, con la prueba del logaritmo del cociente de verosimilitudes es significativo. El primer contraste a realizar es sobre la interacción. Como las variables CIXED1 y CIXED2 son indicadoras y no tienen sentido por sí solas, hay que realizarlo globalmente para las dos con el logaritmo del cociente de verosimilitudes. Se ajusta, por lo tanto, a un modelo sin ellas. El resultado es: NOMBRE DE LOS DATOS: eje2pois VARIABLE DEPENDIENTE: CANCERVARIABLE TAMAÑO: POBLA  NUMERO DE VARIABLES INDEPENDIENTES: 3 A SABERCIUDAD EDAD1 EDAD2

 NUMERO DE CASOS: 6 NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 15 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0 VARIABLE

ALFA EXP(ALFA)

EE. ALFA

Ji2 p

Const. -10.55314 .00003 .41299 652.96970

.00000

CIUDAD .13023 1.13909 .30131 .18681

.66947

EDAD1 .36802 1.44486 .44909 .67153

.58226

EDAD2 2.23495 9.34601 .43171 26.80163

.00000

  LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -32.88131LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -11.47604Ji-Cuadrado modelo= 42.81053 GL= 3 p= .00000Ji-Cuadrado modelo anterior= .17068 GL= 2 p= .91773 No se puede rechazar la hipótesis nula de no existencia de interacción (p=0,91773), por lo tanto se eliminan dichas variables del modelo. Para este último modelo la matriz estimada de covarianzas de los estimadores es: 

MATRIZ DE COVARIANZAS 

Const.

CIUDAD EDAD1 EDAD2

Const. .171      CIUDAD -.050 .091    EDAD1 -.143 -.000 .202  EDAD2 -.136 -.013 .143 .186

 El próximo contraste a realizar es para las variables EDAD1 y EDAD2, que también tiene que ser global. Se ajusta a un modelo sin ellas y el resultado es: NOMBRE DE LOS DATOS: eje2pois VARIABLE DEPENDIENTE: CANCERVARIABLE TAMAÑO: POBLA  NUMERO DE VARIABLES INDEPENDIENTES: 1 A SABER CIUDAD NUMERO DE CASOS: 6 NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 15 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0  VARIABLE

ALFA EXP(ALFA)

EE. ALFA

Ji2 p

Const. -9.8753 .00005 .23570 1755.39400

.00000

CIUDAD .3526 1.42276 .29814 1.39869

.23503

  LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -32.88131LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -32.16458Ji-Cuadrado modelo= 1.43345 GL= 1 p= .22908Ji-Cuadrado modelo anterior= 41.37708 GL= 2 p= .00000 

Obsérvese que esta última estimación coincide con la calculada anteriormente. Con la prueba del logaritmo del cociente de verosimilitudes no se puede rechazar (p=0,00000) que no haya efecto de la edad. En el modelo que contiene la edad, la razón de densidades de incidencia entre las dos ciudades es 1,13909 y no es significativamente distinta de 1 (p=0,66947 con la prueba de Wald). Nótese que la edad es una variable de confusión (con el modelo que sólo contiene la ciudad, la estimación es 1,42276) y por tanto el modelo adecuado para hacer las estimaciones es el que contiene la edad. El intervalo de confianza al 95%, también calculado por el programa, aunque en la salida anterior no se presenta, es (0,631, 2,056).

 Para estimar, por ejemplo, con ese modelo la densidad de incidencia para el grupo de mayores de 60 años en la ciudad B, recuérdese que para la ciudad B, CIUDAD=1 y para ese grupo de edad, EDAD1=0 y EDAD2=1, por lo tanto según el modelo:

0 1 3ˆ ˆ ˆ - 10,55314 + 0,13023 + 2,23495 - 8,18796 e e e 0,00027  obsérvese que, como el ajuste del modelo es muy bueno, coincide con la estimación que se puede obtener directamente de los datos: 

= 16 / 60.000 = 0,00027 pero el modelo permite, además, calcular un intervalo de confianza para dicha estimación. Para ello hay que calcular: 

0 1 3 0 1 3 0 1 0 3 1 3ˆ ˆ ˆ ˆ ˆ ˆ ˆˆ ˆ ˆ ˆ ˆ ˆ ˆ , ˆ ˆ , ˆ ˆ , ˆVar Var Var Var 2 Cov 2 Cov 2 Cov

0,171 + 0,091 + 0,186 - 2 x 0,050 - 2 x 0,136 - 2 x 0,013 = 0,05

 su error estándar es  

0,05 = 0,224  y por lo tanto el intervalo de confianza al 95% es 

- 8,18796 1,96 x 0,224 = ( 0,00018 , 0,00043 )e

 y del mismo modo para los otros grupos de edad y/o la otra ciudad.

Otras lecturas Silva Ayçaguer L.C., Barroso Utra I.M. Selección algorítmica de modelos en las aplicaciones biomédicas de la regresión múltiple. Medicina Clínica. 2001;116:741-745.

La colinealidad en la regresión de Poisson Del mismo modo que en la regresión logística, para estimar los coeficientes hay que invertir la matriz J = X’pX siendo además la inversa de J la matriz de varianzas-covarianzas de los mismos. Por consiguiente, si dicha matriz es singular el modelo es irresoluble y si es casi-singular existen problemas de precisión numérica y estadística, siendo, además, inestable la estimación. Como entonces, aunque no es un problema de colinealidad en sentido estricto se sigue hablando, por analogía, de colinealidad y, también, el diagnóstico de la misma se hace de análoga manera, es decir, calculando los índices de condición para la matriz J también escalada para que su diagonal principal esté formada por unos, y calculando a partir de los autovectores de la misma, la matriz de descomposición de la varianza de los estimadores. Evidentemente, por no ser un problema de colinealidad, el factor de inflación de la varianza tampoco es útil ahora.

También en el caso de la regresión de Poisson, y a diferencia de la regresión lineal, la matriz J no depende sólo de los datos, sino también de los coeficientes del modelo (a través de p) y pudiera darse el caso de que, en el proceso iterativo de estimación y para unos ciertos valores iniciales de los coeficientes, J fuera singular en algún paso del proceso alejado de la solución final y que, sin embargo, si se partiera de otros valores iniciales se pudiera acabar la estimación sin problemas. También puede ocurrir que, debido a la falta de precisión ligada a la casi-colinealidad de algún paso intermedio, el método de Newton-Raphson no convergiera para unos valores iniciales y, sin embargo, si convergiera para otros. En caso de que aparezcan estos problemas, un modo de minimizarlos es, ayudándose del diagnóstico de colinealidad, intentar la estimación con distintos valores iniciales, incluyendo estimaciones aproximadas de los coeficientes (obtenidas, por ejemplo, a partir del método usado en el ejemplo).

Hay que tener en cuenta, también, que debido a los grandes valores que suele tener la variable s, tamaño del intervalo, en algunos modelos (en el ejemplo desarrollado en este texto son cientos de miles, pero en problemas de estimación de tasas de mortalidad por países puede ser de decenas o centenas de millones) pueden aparecer problemas de precisión o, incluso, desbordes (se denomina así al hecho de que un número sea mayor que la capacidad de la porción de memoria reservada en el ordenador para almacenarlo) en los algoritmos de estimación. En estos casos se puede dividir dicha variable por una constante adecuada, es decir, se expresa la población en miles de personas o en centenas de miles, entonces el parámetro queda multiplicado por ese mismo factor, pero en el modelo ese cambio sólo afecta a 0 (se le sumará el logaritmo de dicha constante) y no al resto de los coeficientes. Si en el ejemplo anterior se divide la población por 1.000, los modelos encontrados serán exactamente los mismos excepto el coeficiente 0 al que se le sumará ln1.000=6,908. 

Ejemplo  Los “salida” del PRESTA del diagnóstico de colinealidad para el modelo del ejemplo anterior en el que se ha dividido la población por 1.000 es:

REGRESION POISSON CON LOS COEFICIENTES:Const.: -3.6454 CIUDAD: .1302 EDAD1: .3680 EDAD2 : 2.2350 

 FACTOR

AUTOVALOR

INDICE CONDICION

1 2.64356 1.000002 1.00497 1.621883 .27931 3.076464 .07216 6.05269

PROPORCION DE VARIANZA EN LOS FACTORES 

FACTOR Const. CIUDAD

EDAD1 EDAD2

1 .0163 .0423 .0140 .0182 2 .0003 .0014 .1838 .0802 3 .0375 .8924 .0586 .1435 4 .9459 .0639 .7436 .7581

 Donde, con los criterios discutidos regresión lineal, no se aprecian problemas de colinealidad.

Relación entre los modelos de Poisson y logístico El intervalo s en el que está definida una variable de Poisson se puede dividir en un conjunto de n subintervalos de tamaño h, cada uno de los cuales es tan pequeño que en ellos sólo puede ocurrir, a lo sumo, un evento, y la probabilidad de que ocurra es la constante . Por lo tanto, en cada uno de estos intervalos, el número de eventos que ocurren es 0 ó 1, con probabilidades 1 - y respectivamente, es decir, es una variable binomial puntual. Una variable de Poisson es, en consecuencia, la suma de n variables binomiales puntuales, es decir, es una variable binomial de parámetros n y . Como no hay una manera única de elegir los subintervalos, el parámetro n no está bien definido, sin embargo, el tamaño h tiene que ser suficientemente pequeño, por lo tanto n será grande.

 En consecuencia, todos los problemas que se pueden plantear con un modelo de Poisson, también se pueden plantear con un modelo logístico, si se dispone de los datos individualizados y, como era de esperar, se obtiene el mismo resultado. Hay que tener en cuenta, no obstante, que el modelo logístico modeliza el odds, mientras que el de Poisson modeliza la probabilidad, por lo tanto los coeficientes sólo coincidirán cuando la probabilidad sea pequeña. Nótese que la inversa no siempre es cierta, hay problemas que se pueden plantear con un modelo logístico y no con un modelo de Poisson, como

por ejemplo, un estudio caso-control, en el que la probabilidad no se puede estimar (por tanto, tampoco modelizar) y, sin embargo, sí se puede el odds ratio.

 Ejemplo

 En un estudio para establecer la eficacia de una vacuna contra la gripe en dos grupos de edad, se mide, durante una semana de invierno, la prevalencia de la misma en dos muestras aleatorias de individuos vacunados y no vacunados en los dos grupos de edad. Se obtienen los siguientes resultados: 

Vacunados No vacunadosEdad Total Gripe Total Gripe

20 - 60 80 3 91 5> 60 50 5 43 10

El número de individuos con gripe en cada una de las situaciones es una variable de Poisson, para la que se puede plantear un modelo de regresión. Para cada individuo, el tener, o no, gripe, es una variable binomial puntual para la que se puede plantear un modelo logístico. Para ajustar a un modelo Poisson hay que partir de un archivo como el siguiente: 

EDAD VACUNA TOTAL

GRIPE

0 1 80 31 1 50 50 0 91 51 0 43 10

 Para ajustar a un modelo logístico hay que crear un archivo en que cada individuo sea una observación. Sería: EDAD VACUNA GRIPE  

0 1 1 3 observaciones: individuos vacunados, edad 20-60, con gripe

0 1 0 77 observaciones: individuos vacunados, edad 20-60, sin gripe

1 1 1 5 observaciones: individuos vacunados, edad >60, con gripe

1 1 0 45 observaciones

0 0 1 5 observaciones

0 0 0 86 observaciones

1 0 1 10 observaciones

1 0 0 33 observaciones

 y los ajustes correspondientes: 

REGRESION DE POISSON NOMBRE DE LOS DATOS: eje5pois VARIABLE DEPENDIENTE: GRIPE VARIABLE TAMAÑO: TOTAL  NUMERO DE VARIABLES INDEPENDIENTES: 2 A SABEREDAD VACUNA

 NUMERO DE CASOS: 4 NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 8 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0  VARIABLE

ALFA EXP(ALFA)

EE. ALFA

Ji2 p

Const. -2.79827 .06092 .37835 54.70174

.00000

EDAD 1.28379 3.61029 .43865 8.56527

.00357

VACUNA -.68495 .50412 .43865 2.43822

.11406

  LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -12.72912LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -7.18156Ji-Cuadrado modelo= 11.09511 GL= 2 p= .00410 INTERVALOS DE CONFIANZA AL 95% DE LOS EXP(ALFA)EDAD 1.52810 8.52966VACUNA .21337 1.19102

  El riesgo relativo para la vacuna, controlado por la edad, es 0,50412 (la probabilidad de que un individuo vacunado contraiga la gripe es aproximadamente la mitad que la de un individuo sin vacunar) con un intervalo de confianza de (0,21337, 1,19102), por lo tanto, no es significativamente distinto de 1. REGRESION LOGISTICA INCONDICIONAL NOMBRE DE LOS DATOS: eje52poi VARIABLE DEPENDIENTE: GRIPE  NUMERO DE VARIABLES INDEPENDIENTES: 2 A SABEREDAD VACUNA

 NUMERO DE CASOS: 264 NUMERO MAXIMO DE ITERACIONES: 20CONVERGENCIA OBTENIDA EN 7 ITERACIONESCASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0  VARIABLE

ALFA EXP(ALFA) EE. ALFA Ji2 p

Const. -2.71567 .06616 .38959 48.58808 .00000EDAD 1.43544 4.20149 .46417 9.56352 .00217VACUNA -.78082 .45803 .46780 2.78598 .09094 LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -78.09814LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -71.93247Ji-Cuadrado modelo= 12.33133 GL= 2 p= .00230 INTERVALOS DE CONFIANZA AL 95% DE LOS "ODDS RATIO"

EDAD 1.69159 10.43545VACUNA .18310 1.14577

  El odds ratio para la vacuna es 0,45803 y tampoco es significativamente distinto de 1. En este caso, y como la probabilidad de contraer la gripe no es pequeña, ambos estimadores no coinciden. Sin embargo, si se calcula por ejemplo, la probabilidad de que una persona mayor de 60 años y no vacunada contraiga la gripe con el modelo de Poisson: 

- 2,79827 + 1,28378 = = 0,22e y con el modelo logístico: 

1

- 2,71567 + 1,43544

- 2,71567 + 1,43544

ep 0,22

e

 que como se observa, sí coinciden. 

Recommended