Upload
truongnga
View
215
Download
0
Embed Size (px)
Citation preview
1 / 40
Descripcion de tablas de contingencia
Guillermo Ayala GallegoUniversidad de Valencia
15 de octubre de 2008
Probabilidad y tablas de
contingencia
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
2 / 40
Distribucion conjunta y tabla de contingencia
3 / 40
X e Y dos variables categoricas con I y J categorıas.Un sujeto puede venir clasificado en una de I × J categorıas.Dada una muestra podemos construir la siguiente tabla dondeconsideramos X= toma aspirina o placebo (I = 2) e Y = sufreataque cardıaco o no (J = 2).
Ataque fatal Ataque no fatal No ataquePlacebo 18 171 10845Aspirina 5 99 10933
Esta tabla recibe el nombre de tabla de contingencia o tabla de
clasificacion cruzada.
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
4 / 40
Su distribucion conjunta viene dada por
πij = P (X = i, Y = j),
con i = 1, . . . , I y j = 1, . . . , J .Las distribuciones marginales son
πi+ = P (X = i) =J
∑
j=1
P (X = i, Y = j) =J
∑
j=1
πij
π+j = P (Y = j) =I
∑
i=1
P (X = i, Y = j) =I
∑
i=1
πij
Distribucion condicional
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
5 / 40
Habitualmente una variable, por ejemplo Y , esuna variable respuesta y la otra, X es explicativa opredictora.En esta situacion no tiene sentido hablar dedistribucion conjunta.Distribucion condicionada de Y a X
P (Y = j|X = i) = πj|i =πij
πi+
Independencia y homogeneidad
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
6 / 40
Son independientes si
πij = πi+π+j.
En particular, la condicionada es igual a lamarginal.
πj|i = π+j con j = 1, . . . , J.
Si X e Y son variables respuesta entonceshablamos de independencia.Si Y es respuesta y X explicativa hablamos dehomogeneidad.
Tablas de contingencia
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
7 / 40
Test positivo Test negativo TotalEnfermo n11 n11 n1+
No enfermo n21 n22 n2+
Total n+1 n+2 n
Distribucion conjunta estimada.πij Test positivo Test negativo Total
Enfermo n11/n n11/n n1+/nNo enfermo n21/n n22/n n2+/n
Total n+1/n n+2/n 1
Tablas de contingencia
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
8 / 40
Test positivo Test negativo TotalEnfermo n11 n11 n1+
No enfermo n21 n22 n2+
Total n+1 n+2 n
πj|i Test positivo Test negativo TotalEnfermo n11/n1+ n11/n1+ 1
No enfermo n21/n2+ n22/n2+ 1
Sensibilidad y especificidad
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
9 / 40
πj|i Test positivo Test negativo TotalEnfermo n11/n1+ n11/n1+ 1
No enfermo n21/n2+ n22/n2+ 1
Un ejemplo: en filas indicamos si tiene o no cancer yen columnas el resultado del test.
πj|i Test positivo Test negativo TotalEnfermo 0,82 0,18 1
No enfermo 0,01 0,99 1
Sensibilidad Proporcion de enfermoscorrectamente diagnosticados.
π1|1 = P (Y = 1|X = 1).
Sensibilidad y especificidad
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
9 / 40
πj|i Test positivo Test negativo TotalEnfermo n11/n1+ n11/n1+ 1
No enfermo n21/n2+ n22/n2+ 1
Un ejemplo: en filas indicamos si tiene o no cancer yen columnas el resultado del test.
πj|i Test positivo Test negativo TotalEnfermo 0,82 0,18 1
No enfermo 0,01 0,99 1
Sensibilidad Proporcion de enfermoscorrectamente diagnosticados.
π1|1 = P (Y = 1|X = 1).
Tipo de muestreo
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
10 / 40
¿Como hemos obtenido la muestra?
Muestreo de Poisson: Los conteos Yij sonvariables Poisson independientes con medias µij .Muestreo multinomial: Fijamos el tamano totaln pero no los totales de fila y columna.Muestreo multinomial independiente:
Fijamos los totales de fila considerando Y comovariable respuesta y X como explicativa.
Tipo de muestreo: verosimilitud
Probabilidad ytablas decontingencia
Distribucionconjunta y tabla decontingencia
DistribucioncondicionalIndependencia yhomogeneidad
Tablas decontingencia
Tablas decontingencia
Sensibilidad yespecificidad
Tipo de muestreo
Tipo de muestreo:verosimilitud
Un ejemplo
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
11 / 40
Muestreo de Poisson
∏
i
∏
j
e−µijµ
nij
ij
nij!
Muestreo multinomial
n!∏
i
∏
j nij!
∏
i
∏
j
πnij
ij .
Muestreo multinomial independiente
∏
i
ni+!∏
j nij!
∏
j
πnij
j|i .
Un ejemplo
12 / 40
Accidente mortal Accidente no mortalCon cinturonSin cinturon
Vamos a recoger todos los accidentes del proximo mes. Nofijamos el numero total. Muestreo de Poisson.Tomamos un muestra aleatoria de 200 accidentes que tuvieronlugar el mes pasado. Fijamos el tamano total de la muestra.Muestreo multinomial.Tomamos una muestra de 100 accidentes donde hubo muertos yotros 100 en los que no hubo muertos. Fijamos los totales decolumna. Muestreo multinomial (binomial aquı) independiente.
Comparacion de dos proporciones
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
13 / 40
Comparacion de dos proporciones
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
14 / 40
Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.
Comparacion de dos proporciones
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
14 / 40
Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.
Comparacion de dos proporciones
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
14 / 40
Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.
Comparacion de dos proporciones
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
14 / 40
Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.
1 21 π1|1 π2|1
2 π1|2 π2|2
Comparacion de dos proporciones
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
14 / 40
Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.
Exito FracasoGrupo 1 π1|1 π2|1
Grupo 2 π1|2 π2|2
Comparacion de dos proporciones
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
14 / 40
Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.
Exito FracasoGrupo 1 π1|1 π2|1
Grupo 2 π1|2 π2|2
π1|i = πi
π2|i = 1 − π1|i = 1 − πi
Comparacion de dos proporciones
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
14 / 40
Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.
Exito FracasoGrupo 1 π1 1 − π1
Grupo 2 π2 1 − π2
Comparacion de dos proporciones
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
14 / 40
Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.
Exito FracasoGrupo 1 π1 1 − π1
Grupo 2 π2 1 − π2
Queremos comparar π1 con π2.
¿Como comparamos?
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
15 / 40
Podemos estudiar la diferencia de las proporciones
π1 − π2.
O el riesgo relativo:
π1
π2.
O bien el cociente de odds (odds ratio)
θ =π1/(1 − π1)
π2/(1 − π2).
Odds y odds ratio
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
16 / 40
Si π es la probabilidad de exito entonces los oddsse definen como
Ω =π
1 − π.
Equivalentemente
π =Ω
Ω + 1.
En una tabla 2 × 2 tenemos los odds en la fila i
Ωi =πi
1 − πi
.
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
17 / 40
El cociente de los odds de las dos filas sera el oddsratio.
θ =π1/(1 − π1)
π2/(1 − π2).
Se tiene facilmente que
θ =π11π22
π12π21.
Por ello tambien se le llama el cociente de losproductos cruzados.
Propiedades del odds ratio
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
18 / 40
Puede ser cualquier valor positivo.θ = 1 significa que no hay asociacion entre X eY .Valores de θ alejados de 1 indican una asociacionmayor.Se suele trabajar con log θ pues entonces el valorque tenemos es simetrico respecto a cero.El odds ratio no cambia cuando intercambiamosfilas y columnas.
Nota de R
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Comparacion de dosproporciones
¿Comocomparamos?
Odds y odds ratio
Propiedades delodds ratio
Nota de R
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
19 / 40
notaR/notaR004.pdf
Asociacion parcial en tablas 2 × 2
estratificadas
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
El problema
Un ejemplo
¿Por que?
Nota de ROdds ratioscondicionales ymarginales
Independenciamarginal eindependenciacondicionadaAsociacionhomogenea
Tablas I × J
20 / 40
El problema
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
El problema
Un ejemplo
¿Por que?
Nota de ROdds ratioscondicionales ymarginales
Independenciamarginal eindependenciacondicionadaAsociacionhomogenea
Tablas I × J
21 / 40
Cuando estudiamos el efecto de X sobre Ydebemos de controlar las covariables que puedeninfluir en la relacion.Lo mejor es mantener las covariables relevantesconstantes.Un efecto de X sobre Y puede representar unefecto de la (o las) covariables sobre las variablesX e Y .Esto no es facil en estudios observacionales.
Un ejemplo
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
El problema
Un ejemplo
¿Por que?
Nota de ROdds ratioscondicionales ymarginales
Independenciamarginal eindependenciacondicionadaAsociacionhomogenea
Tablas I × J
22 / 40
Consideramos los procesamientos por asesinatosmultiples en Florida entre 1976 y 1987.
Pena de muerteVıctima Acusado Si No % Sı
Blanco Blanco 53 414 11,3Negro 11 37 22,9
Negro Blanco 0 16 0,0Negro 4 139 2,8
Total Blanco 53 430 11,0Negro 15 176 7,9
23 / 40
Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.
23 / 40
Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.
23 / 40
Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.Consideramos como covariable la raza de la vıctima.
23 / 40
Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.
Pena de muerteVıctima Acusado Si No % Sı
Blanco Blanco 53 414 11,3Negro 11 37 22,9
Negro Blanco 0 16 0,0Negro 4 139 2,8
Total Blanco 53 430 11,0Negro 15 176 7,9
23 / 40
Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.En el paıs de la igualdad se condena mas a los negros.
¿Por que?
24 / 40
La explicacion tiene que venir de la asociacion existente entre laraza de la vıctima y las variables que cruzamos marginalmente.Hay una gran asociacion entre raza de vıctima y raza delacusado (odds ratio de 87)
Vıctima vs acusado Vıctima vs veredictoBlanco Negro
Blanco 467 48Negro 16 143
Si NoBlanco 64 451Negro 4 155
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
El problema
Un ejemplo
¿Por que?
Nota de ROdds ratioscondicionales ymarginales
Independenciamarginal eindependenciacondicionadaAsociacionhomogenea
Tablas I × J
25 / 40
Los blancos tienden a matar mas a blancos.Si matas a un blanco tienes una mayorprobabilidad de que te condenen.Esto es un ejemplo de la paradoja de Simpson(1951).
Nota de R
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
El problema
Un ejemplo
¿Por que?
Nota de ROdds ratioscondicionales ymarginales
Independenciamarginal eindependenciacondicionadaAsociacionhomogenea
Tablas I × J
26 / 40
Datos de asesinatos multiples en Florida:notaR/notaR007.pdf
Odds ratios condicionales y marginales
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
El problema
Un ejemplo
¿Por que?
Nota de ROdds ratioscondicionales ymarginales
Independenciamarginal eindependenciacondicionadaAsociacionhomogenea
Tablas I × J
27 / 40
Las asociaciones marginales y condicionalespueden ser descritas mediante el odds ratio.Supongamos una tabla 2 × 2 × K.Tenemos µijk, frecuencia esperada en la celdacorrespondiente.Fijamos Z = k, y tenemos
θXY (k) =µ11kµ22k
µ12kµ21k
que serıan los odds ratio condicionales.Los odds ratio marginales serıan
θXY =µ11+µ22+
µ12+µ21+
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
El problema
Un ejemplo
¿Por que?
Nota de ROdds ratioscondicionales ymarginales
Independenciamarginal eindependenciacondicionadaAsociacionhomogenea
Tablas I × J
28 / 40
Sustituyendo los µijk por las frecuenciasobservadas tenemos los odds ratio muestrales.Un valor de uno en un odds ratio suponeindependencia bien marginal (si θXY =) o biencondicionada a que Z = k (si θXY (k) = 1).notaR/notaR010.pdf
Independencia marginal e independencia
condicionada
29 / 40
La independencia condicionada a Z = k significa
P (Y = j|X = i, Z = k) = P (Y = j|Z = k),
para todo i, j.Si lo anterior es cierto para todo valor de Z entonces se dice queX e Y son condicionalmente independientes dada Z y severifica:
πijk =πi+kπ+jk
π++k
para cualquier i, j, k.La independencia condicional no implica la independenciamarginal.
Asociacion homogenea
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
El problema
Un ejemplo
¿Por que?
Nota de ROdds ratioscondicionales ymarginales
Independenciamarginal eindependenciacondicionadaAsociacionhomogenea
Tablas I × J
30 / 40
Una tabla 2 × 2 × K tiene una asociacion XYhomogenea cuando
θXY (1) = . . . = θXY (K).
El tipo de asociacion entre X e Y es el mismopara las distintas categorıas de Z.Si existe una asociacion XY homogenea entoncestambien tenemos una asociacion XZ homogeneay una asociacion Y Z homogenea.
Un ejemplo
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
El problema
Un ejemplo
¿Por que?
Nota de ROdds ratioscondicionales ymarginales
Independenciamarginal eindependenciacondicionadaAsociacionhomogenea
Tablas I × J
31 / 40
X = fumador (si, no)Y = cancer de pulmon (si, no)Z = edad (< 45, 45 − 65, > 65)Los odds ratio observados son
θXY (1) = 1,2 θXY (2) = 3,9 θXY (3) = 8,8
El efecto de fumar se acentua conforme la edad esmayor.
Tablas I × J
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
Medidas resumen deasociacionUn ejemplo:Theil,1970
Tendenciasordinales: paresconcordantes ydiscordantes
32 / 40
Medidas resumen de asociacion
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
Medidas resumen deasociacionUn ejemplo:Theil,1970
Tendenciasordinales: paresconcordantes ydiscordantes
33 / 40
Los ındices mas interpretables son del estilo delcoeficiente de determinacion R2.Sea V (Y ) una medida de variacion de ladistribucion marginal de Y (dada porπ+1, . . . , π+J).Sea V (Y |i) la misma medida para la distribucioncondicionada de Y a X = i, π1|i, . . . , πJ |i.Este tipo de ındices consideran
V (Y ) − E[V (Y |X)]
V (Y )
conE[V (Y |X)] =
∑
i
πi+V (Y |i).
Un ejemplo: Theil,1970
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
Medidas resumen deasociacionUn ejemplo:Theil,1970
Tendenciasordinales: paresconcordantes ydiscordantes
34 / 40
Utilizamos la entropıa
V (Y ) =∑
j
π+j log π+j
Obtenemos el coeficiente de incertidumbre
U = −
∑
i
∑
j πij log(πij/πi+π+j)∑
j π+j log π+j
U = 0 significa que X e Y son independientes.U = 1 significa que para cada i, πj|i = 1 paraalgun j.
Tendencias ordinales: pares concordantes y
discordantes
35 / 40
Satisfaccion en el trabajo
Ingresos Muy Poco Moderadamente Muy
Dolares insatisfecho insatisfecho satisfecho satisfecho
< 15000 1 3 10 6
15000 − 25000 2 3 10 7
25000 − 40000 1 6 14 12
> 40000 0 1 9 11
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
Medidas resumen deasociacionUn ejemplo:Theil,1970
Tendenciasordinales: paresconcordantes ydiscordantes
36 / 40
Tenemos dos medidas ordinales. Cabe esperar unatendencia monotona.Consideramos pares concordantes si un valormayor de X va asociado a un valor mayor de Y .Un par es discordante cuando un valor mayor deX va asociado a un valor menor de Y .Un par esta empatado cuando coinciden en laclasificacion de X e Y .En el ejemplo tenemos
C = 1331, D = 849.
Parece que hay una tendencia de mayor ingresomayor satisfaccion.
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
Medidas resumen deasociacionUn ejemplo:Theil,1970
Tendenciasordinales: paresconcordantes ydiscordantes
37 / 40
Si X e Y son independientes entonces laprobabilidades de concordancia y discordancia son:
Πc = 2∑
i
∑
j
πij
(
∑
h>i
∑
k>j
πhk
)
,
y
Πd = 2∑
i
∑
j
πij
(
∑
h>i
∑
k<j
πhk
)
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
Medidas resumen deasociacionUn ejemplo:Theil,1970
Tendenciasordinales: paresconcordantes ydiscordantes
38 / 40
Condicionado a que no hay empate lasprobabilidades de concordancia y discordancia son
Πc/
(
Πc + Πd
)
y Πd/
(
Πc + Πd
)
La diferencia de las probabilidades es la gamma(Goodman y Kruskal, 1954):
γ =Πc − Πd
Πc + Πd
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
Medidas resumen deasociacionUn ejemplo:Theil,1970
Tendenciasordinales: paresconcordantes ydiscordantes
39 / 40
La version muestral serıa
γ =C − D
C + D
La gamma trata simetricamente a las variables(como el coeficiente de correlacion).−1 ≤ γ ≤ 1.Si invertimos las categorıas de una variable lagamma cambia de signo.|γ| = 1 significa que hay una relacionperfectamente monotona.
Probabilidad ytablas decontingencia
Comparacion de dosproporciones
Asociacion parcialen tablas 2× 2
estratificadas
Tablas I × J
Medidas resumen deasociacionUn ejemplo:Theil,1970
Tendenciasordinales: paresconcordantes ydiscordantes
40 / 40
γ = 1 si Πd = 0.γ = −1 si Πc = 0.Independencia implica γ = 0. El recıproco no escierto.Ejemplo de satisfaccion con el trabajo:
γ = 0,221.
Una ligera tendencia se observa de que unosingresos mayores suponen una mayor satisfaccion.notaR/notaR011.pdf