192
OBSERVACIONES ANÓMALAS EN MODELOS DE VARIABLE DEPENDIENTE CUALITATIVA Tesis Doctoral Autor: Gregorio R. Serrano García Directora: Mercedes Gracia Diez Departamento de Economía Cuantitativa Facultad de Ciencias Económicas y Empresariales Universidad Complutense de Madrid 1993

Anomalias Del Modelo Lineal General

Embed Size (px)

Citation preview

Page 1: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS

EN MODELOS DE VARIABLE

DEPENDIENTE CUALITATIVA

Tesis DoctoralAutor: Gregorio R. Serrano García

Directora: Mercedes Gracia Diez

Departamento de Economía CuantitativaFacultad de Ciencias Económicas y Empresariales

Universidad Complutense de Madrid

1993

Page 2: Anomalias Del Modelo Lineal General

A mis padres,Gregorioy Epifanía

A EnstasiaGarcía, in memoriam

Page 3: Anomalias Del Modelo Lineal General

Agradecimientos

La mayordeudade gratituddurantela realizaciónde estaTesis la he contraidocon

mi directora, MercedesGracia. Sin su constanteapoyo personaly profesional,nunca

hubiesevisto la luz estetrabajo.

También quisiera expresar mi agradecimientoa Alfonso Novales, y muy

especialmentea Emilio Domínguez,Miguel Jerezy SoniaSotocapor su valiosaayuda

duranteel tiempo de realizaciónde estetrabajo.

Fuera del terreno profesional, quisiera agradecerel apoyo moral que, en todo

momento, he recibido de mis padresy hermano,y la infinita pacienciay dedicaciónde

Auxi.

A todosellos, y a los compañerosde Departamentoquehan mostradoalgún interés

por estetrabajo, muchasgracias.

Page 4: Anomalias Del Modelo Lineal General

y

.1

Capítulo 1. Modelos con Variable Dependiente Cualitativa 4

1. 1. Introducción1.2. Modelos de elecciónbinaria

1.2.1. Derivaciónde los modelosde elecciónbinaria1.2.2. Formas ltncionales

1 .2.2.A. El modelo linealde probabilidad¡.2.2.8.El modeloprobit binario1.2.2.C. El modelo logit binario1.2.2.D. Otros modelosbinarios

1.3. Estimaciónde Modelos de Elección Binaria1.3.1. Estimación de Máxima Verosimilitud1.3.2. Estimaciónde máxima verosimilitud por procedimientos

1.4. Contrastede hipótesis1 .4. 1. Contrastede restriccioneslineales1.4.2. Contrastegeneralde hipótesisde exclusiónbasadoen

multiplicadoresde Lagrange1.4.3. Intervalosde confianzapara las probabilidadesestimadas

1.5. Previsióncon modelosdevariabledependientebinaria1.5.1. El problemade la previsiónagregada1.5.2. Métodos de previsiónagregada

1 .5.2.A. Métodode enumeraciónmuestral1.5.2.8. Métodode clasificaciónpor características

lineales

el principio de

Capítulo 2. ObservacionesAnómalas en Modelos de Elección Binaria: Planteamiento yConsecuencias

2.1. Introducción2.2. El problemade observacionesanómalasenel modelo lineal general

2.2.1. Observacionesanómalasen el modelo lineal general .

2.2.2. Métodosde tratamiento2.3. Anomalíasen modelosde elecciónbinaria

2.3.1. Planteamientodel problema2.3.1 A. Anomalíasgeneradaspor el lado de la varíanza2.3.1.8. Anomalíasgeneradaspor el lado de la media .

2.3.2. Inconsistenciadel estimadormáximo-verosímil

477

11121213171919212424

26293131343536

38

384141454849495354

CONTENIDOS

Contenidos

Introducción

Page 5: Anomalias Del Modelo Lineal General

CONTENiDOS VI

2.3.3. Sensibilidadde los modelos 562.4. Resultadoscon datossimulados 59

2.4.1. Planteamientode los modelos 592.4.2. Aspectostécnicosde la simulación 602.4.3. Resultadosde la simulación . . . . 61

Capítulo 3. ObservacionesAnómalasen Modelos de Elección Binaria: Detección . . . . 69

3.1. Introducción . . . . 693.2. Instrumentosde detecciónen e! MLG 71

3.2.1. Instrumentosde diagnósticoapriori 713.2.2. Estadísticosde influencia 74

3.2.2.A. Algunos resultadosprevios 743.2.2.8.Estadísticosde influencia: observacionesindividuales 763.2.2.C. Estadísticosde diagnóstico:grupos y otras extensiones 80

3.2.2.D. Algunos tratamientospara el problemadel enmascaramien-to 83

3.3. El problemade la detecciónde anomalíasen MEB: el análisisde residuos 863.4. Procedimientosde detecciónde observacionesanómalasen los MEB . 91

3.4.1. Estadísticospara la detecciónde observacionesanómalasen los modelosde elecciónbinaria 91

3.4.2. Estadísticosde influencia: grupos de observacionesy otros casosparticulares 96

3.4.3. Detecciónde observacionesinfluyentesen MER 993.5. Resultadoscon datossimulados ¡02

Capítulo 4. ObservacionesAnómalas en Modelos de Elección Múltiple 110

4.1. Introducción 1104.2. Modelos de variabledependientecualitativamúltiple 112

4.2.1. Planteamientode los modelosa partir de la teoríade la utilidad 1124.2.2. El modelo logit multinomial 1144.2.3. El modelo probit multinomial 1154.2.4. Especificaciónde la utilidad observaday condicionesde identificación . 1174.2.5. Otros aspectosde los modelosmultinomiales 119

4.2.5.A. La propiedadde Independenciade las Alternativas Irrele-vantes(IIAP) 120

4.2.5.8. Variación en gustos 1224.3. Estimaciónde los modelosde elecciónmúltiple 125

4.3.1. Estimaciónde máximaverosimilitud 1254.3.2. Estimaciónde máximaverosimilitud por procedimientoslineales . . . . 129

4.4. Observacionesanómalasen modelosmultinomíales 1314.4.1. Observacionesanómalas en modelos de elección discreta múltiple:

planteamiento 1324.4.2. Estadísticosde detecciónde observacionesanómalasen los modelosde

elecciónmúltiple 1334.5. Resultadoscon datos simuladosparael modelo logit mú[tiple 136

4.5.1. Planteamientode los modelos ¡364.5.2. Resultadosde la simulación 137

Page 6: Anomalias Del Modelo Lineal General

CONTENIDOS VII

Capítulo 5. Aplicaciones con datos reales

S.l. Introducción5.2. Eleccióndc tipo de interésfijo frente a variable

5.2.1. Planteamientodel modelo5.2.2. Resultadosempíricoscon los modelosoriginales5.2.3. l)etecciónde observacionesanómalas

5.3. Análisis de los datosde Pregibon(1981)

Conclusiones

Conclusionesgenerales

Extensiones

Apéndices

A. 1. ConcavidadGlobal de las Funcionesde Verosimilitud de los MEEA.2. NotassobreMétodos Numéricosde OptimizaciónNo Restringida

A.2. 1. Planteamientodel problemaA.2.2. Criteriosde convergenciaA.2.3. Criteriosparadeterminarla longitud de pasoA.2.4. Métodos tipo NewtonA.2.5. Métodos quasi—NewtonA.2.6. Métodos queno empleanderivadasA.2.7. Un algoritmo especializado:El algoritmo EM

A.3. Datosde los ejemplosdel Capítulo 5

Referencias .

143

143144144146148154

158

158159

161

161164164166168168170172173175

178

Indice de Autores ‘SS

Page 7: Anomalias Del Modelo Lineal General

INTRODUCCIÓN

Los modelos de variable dependientecualitativa o de elección discreta han

experimentado,en los últimos tiempos,un importanteaugeen cuantoa su utilización en

la investigacióneconómica.Esto, seguramente,esdebido a la mayordisponibilidad de

basesde datos microeconómicasy a la importacia crecientedel denominadoanálisis

microeconómicode la ,nacroeconom(a.

En estecontexto,seha desarrolladoun conjuntodeherramientasfundamentalesa

la hora de trabajar con cualquier modelo: estimadoresóptimos, estadísticospara el

contrastede hipótesise instrumentosde predicción. No obstante,otros aspectosde esta

clase de modeloshan recibido muchamenosatención,en particular, los relativos a la

diagnosisdel modelo.

En estetrabajose consideraun problemaconcretoen la interacciónmodelo-datos:

la existenciade observacionesanómalas,que resultanfrecuentesen las muestrasdecorte

transversal.Al intentar describirel comportamientode la muestramedianteun modelo,

puedehaberun conjunto reducidodeobservacionesque,debidoa su falta de homogenei-

dad con el resto de la muestra, distorsionen sustancialmentelos resultados de la

estimación,incluso si seutilizan muestrasde grantamaño.En estetrabajo, sesuponeque

dichasobservacionesno sedebena errores en los datos, sino a que en la muestrahay un

grupo de observacionesque procedende una población diferenteque el resto. Por tanto,

estetrabajo secentraen un tipo muy concretode errores: los que tienensu origen en el

hechode que entre los datos seencuentraun conjuntode observacionesgeneradaspor un

procesoestocásticodistinto del que sigue la mayoríade la muestra.

Siguiendoeste planteamiento,el primer objetivo del trabajo es mostrar que,

contrariamentea lo que se ha propuestoen la mayoríade la literatura anterior, en los

modelosde eleccióncualitativa los análisis que seapoyanen los residuos,o en simples

extrapolacionesde los resultadosparael modelolineal general,no resultanadecuados.Ello

sedebea que sólo seobservauna realizacióndicotómicade la variabledependiente,por

lo queel valor de los residuosestáacotadoy no proporcionainformaciónrelevantesobre

la probabilidadque tiene un dato de ser anómalo.

Page 8: Anomalias Del Modelo Lineal General

INTRODUCCIÓN 2

El segundoobjetivo del trabajo se centra en derivar estadísticoso medidasde

influencia para la detección de anomalíasen los modelos de variable dependiente

cualitativa. Este es el primer paso para, posteriormente,decidir el tratamiento más

adecuadoque debedarsea las observacionesque sehan detectadocomoanómalas.

El problemade las anomalíasen los modelosde variabledependientecualitativaha

sido tratado con anterioridad: Pregibon (1981), Jennings (1986) y Copas (1988) son

algunas referencias. Estos trabajos analizan, básicamente,los modelos logit y su

planteamientopuederesumirseen los siguientespuntos: i) no partende una definiciónde

dato anómalo, considerandocomo anomalíatoda observacióncuyo residuo en valor

absolutoes grandey u) adaptana los modelosde eleccióndiscretalos procedimientospara

la detecciónde anomalíasutilizadosen los modeloslinealesque, en gran medida,sebasan

en el análisisde residuosy enevaluarel efectodecadaobservaciónen la estimaciónde

los parámetrosdel modelo. Además,estostrabajosno partende unadefinición estadística

de datoanómalo,ni analizanlas consecuenciasque estetipo de observacionestienensobre

los resultadosde la estimacióndel modelo.

En estetrabajose enfocael problemade formadiferente,partiendocíe ladefinición

de observaciónanómalaque habitualmentese utiliza en la literaturaeconométrica:una

observaciónanómala esaquella queno seha generadopor elmismomodelo estocástico

que sesuponepara las restantesobservacionesmuestrales[Box y Tiao (1968)]. A partir

de estadefinición, sedemuestraque, en los modelosde eleccióncualitativa, la existencia

de anomalíasen la muestraafectaa la consistenciadel estimadorde máximaverosimilitud.

Ello sedebea que la presenciade estasobservacioneshacequela funciónde verosimilitud

del modelo sea diferentede la habitual.

Este trabajo está organizadocomo sigue. En el Capítulo 1 se lleva a cabo una

revisión de los modelosde eleccióncualitativa, con la finalidad de establecerla notación

básicay presentaruna seriede resultadosutilizados en los siguientescapítulos.

En el Capítulo 2 se abordael problemade las anomalíasen los modelosde

elecciónbinaria (MEB). En primer lugar, seexponenlos problemasque aparecenen el

modelo lineal generalpara,posteriormente,analizarlas particularidadesque este tipo de

observacionespresentanen los modelosde elecciónbinaria. Estascaracterísticaspropias

de los modelosde variabledependientecualitativahacenque no seainmediatala extensión

de los planteamientosde diagnosisdesarrolladosparael modelo lineal general.

Page 9: Anomalias Del Modelo Lineal General

INTRODUCCIÓN 3

En el Capítulo3 se trata el problemade la detecciónde anomalíasen los MEB.

Los resultadosque se desarrollanse encuentranen la línea de robustecerla metodología

de estimación,tal y comoseproponeen Box (1980)y Peñay Ruiz-Castillo(1982 y 1984),

parael caso de los modeloslinealesde regresión.Con estepropósito, en estecapítulose

derivanestadísticoso medidasde influenciaparala detecciónde anomalíasen los MEB.

Estees el primer pasopara,posteriormente,decidir el tratamientomás adecuadoquedebe

darsea las observacionesquese han detectadocomo anómalas.

En el Capítulo 4 se generalizanlos resultadosde los Capítulos2 y 3 para los

modelosde eleccióncualitativamúltiple (MEM> más utilizadosen la práctica: e! modelo

logit multinomial y el modelo probit multinomial. El planteamientode observaciones

anómalas,así como los principales resultadossobre su diagnosis son análogosa los

desarrolladospara los modelosde elecciónbinaria. En los Capítulos2, 3 y 4 tambiénse

ilustran los principalesresultadosteóricosconexperimentosde Monte Carlo.

Porúltimo, en el Capítulo5 se aplica la metodologíade detecciónde observacio-

nes anómalasdesarrolladaen los Capítulos2 y 3 a dos muestrasde datos reales: la

muestrautilizada por Dhillon et al. (1987) en un estudiosobre la elecciónde tipos de

interésfijos frenteatipos variablesparapréstamoshipotecariosy la muestrautilizadapor

Pregibon(1981) en un experimentomédico. El objetivo de estosanálisis se centra en

ilustrar la necesidadde analizarlos datosempleadosen cualquierestudio,antesde pasar

a la interpretaciónde los resultadosde estimaciónobtenidos.

Page 10: Anomalias Del Modelo Lineal General

CAPITULO 1

MODELOS CON VARIABLE DEPENDIENTE BINARIA

1.1. Introducción

El problema genérico que se plantea en Econometríaconsisteen explicar el

comportamientoo realizarprevisionesde una(s) variable(s)endógena(s)a través de un

conjunto de variablespredeterminadas.Un caso particularde estasituación,consisteen

analizarel comportamientode los individuos cuandotienenque elegir entreun conjunto

de alternativasmutuamenteexcluyentes.En este análisis, la variable dependientedel

modelo representala elección realizadapor cadaindividuo, por lo que es cualitativa,

mientras que las variables explicativas recogenlas característicasdel decisor y de las

alternativasdisponiblestal y comoéstelaspercibe.Con estosmodelossetratade explicar

las decisionesde los individuos en términosde probabilidady suaplicaciónmás inmediata

es la prediccióndel comportamientoindividual y/o agregadofuera de la muestra.

Los modelosde eleccióncualitativase han utilizado ampliamente,en aplicaciones

biométricas.antesqueenaplicacioneseconómicas.Los biómetrashanusadoestosmodelos

paraestudiarproblemasde estímulo-respuestacomo,porejemplo, el efectode diferentes

dosisde un medicamentoen la recuperacióno no recuperaciónde un paciente.

En economíaestos modelos se utilizan generalmentepara explicar decisiones

económicasdiscretascomo,por ejemplo,la participaciónde los individuos en el mercado

de trabajo, la elecciónde ocupación,la pertenenciaa sindicatos,la comprade bienesde

consumoduraderos,etc. Por tanto, la motivación y derivaciónde estos modelossuele

realizarsea partir de la teoríade ladecisióny, en concreto,de la regladedecisiónbasada

en la utilidad.

Otra característicacomún de estos trabajoses la hipótesis implícita de que los

decisorestienenun comportamientoracional;estoes,sus preferenciasson consistentesy

transitivas.Laconsistenciaimplicaquecadadecisor,bajocircunstanciasidénticas,utilizará

Page 11: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARíA 5

la misma regla de decisión y, en consecuencia,elegirá la misma alternativa. La

transitividad implica que si la alternativaA espreferidaa la B y éstaespreferidaa la C,

entoncesla alternativaA espreferidaa la C.

En la teoría microeconómica del consumidor, o teoría de las preferencias

individuales,cadasujetoelige aquellacombinaciónde bienesque le resultapreferible y

que satisface su restricción presupuestaria.Esta combinación óptima, se obtiene

maximizandola función de utilidad del individuo sujetaa su restricciónpresupuestaria,lo

que permitederivar las funcionesde demanda.Sin embargo,en la teoría de la elección

discreta, la función de utilidad de cadaindividuo sólo puedetomar un númeroreducido

de valores, tantos como alternativas disponibles, por lo que dicha función no es

diferenciablerespectoa las cantidades.Consecuentemente,el conceptode una relación

continuaentre la cantidaddemandaday un conjuntode variablesexplicativas,carecende

sentido y, por tanto, los modelos teóricosdebenbasarsedirectamenteen las funciones

individualesde utilidad.

En estecapítulose llevaa cabounarevisiónde los modelosde eleccióncualitativa.

con la finalidadde establecerla notaciónbásicay presentarunaseriede resultadosquevan

a utilizarseen los siguientescapítulosdel trabajo.

En la Sección1.2 serevisanlos modelosde elecciónbinaria, en los que la variable

dependientetoma sólo dos valores, correspondientesa las dos alternativasposibles. Se

comienzacon la derivación de estos modelos y se especificansus distintas formas

funcionales, prestandoespecial atención a los más utilizados: el modelo lineal de

probabilidad,el modelo probit y el modelo logit.

En la Sección1.3 se trata la estimaciónde los modelosde elecciónbinaria. En

concreto, se resume el procedimiento de estimaciónpor máxima verosimilitud y la

obtenciónde estimacionesmáximo-verosímilespor métodoslineales.

La Sección1.4 sededicaal contrastede hipótesis.En primer lugar, seconsidera

el problemade contrastaruna hipótesis lineal generaly, posteriormente,setrata el caso

del contrastede hipótesisde exclusión,utilizando el principio de los multiplicadoresde

Lagrange. Además,se estudiael problemade la derivaciónde intervalos y regionesde

confianzatantoparalos parámetrosdel modelo comoparalas probabilidadesindividuales.

Page 12: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 6

En la Sección1.5 seplanteael problemade prediccióncon los modelosde variable

dependientebinaria,prestandoespecialatenciónala predicciónde las decisionesagregadas

de la poblaciónobjeto de estudio.

Page 13: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 7

1 .2. Modelos de eleccián binaria

Los modelosde elecciónbinaria (MEB) tienen su origen en la experimentación

biomédica,en la que, de una forma natural, esposiblecodificar los resultadosen éxito y

fracaso. En estecontexto,sesuponela existenciade una variablelatenteo respuestano

observable,cuyosvalores dependende un conjunto de variables, y que da lugar a una

observaciónbinaria codificadanormalmentecomo uno o cero.

En el campode la economía,los modelosde variablecualitativase planteanen un

contextode tomade decisionesporparte de los individuos. En estasituación,existe una

variablelatenteparacadaalternativa,que puedeinterpretarsecomo la utilidad asociadaa

cadauna de ellassegúnes percibidaporel decisor. El individuo elige aquellaopción que

le reportauna mayor utilidad.

Finalmente,se verá que, tanto el planteamientode variable latentecomo el de

eleccióndiscreta, dan lugar a modelosequivalentes.

1.2.1. Derivación de los modelos de elección binaria

Seaunavariableendógenalatentey que puedeexplicarsea travésde unafunción

lineal de un conjuntode k variablesexógenasx~ y un vectorde parámetrosa de dimensión

kx 1, más un término de perturbación’,por lo que dicha relaciónpuedeplantearse:

= x1Ta + con E(e1) = O y V(e1) = o2 vi [1.2.1]

de modo que si y1 sobrepasaun determinadonivel, seobservaun éxito en el casoi-ésimo

y, por el contrario, si se mantienepor debajode dicho nivel, seobservaun fracaso. La

interpretaciónde la variable¡atente<dependede la naturalezaexactadel problemaobjeto

de estudio. Por ejemplo,en una situaciónen queel objetivo seaanalizarla decisiónde un

individuo sobreadquirir o no un bienduradero,<puedeconsiderarseun indicadorde la

predisposiciónde compra,que dependede las característicasconcretasdel sujeto.

En estaclasede modeloses necesariodefinir una función indicador Yty1) que

relacionala variablelatentecon la observabledenotadapor y1, tal que:

Aunque el supuesto de linealidadno es necesarioen ningúncaso,siniplifica considerablementeel análisis.

Page 14: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 8

<=0[1.2.2]

~ >~. <~

Aunqueen esteplanteamientono esrelevantela formafuncionalde .~U), conviene

teneren cuentaque, en determinadoscasos,definicionesalternativasproducenmodelos

conceptualmentediferentes.Porotra parte, seelige el valor cerocomovalor crítico de la

elección. Sin embargo,estaeleccióntampocoesrelevanteparael análisissiempreque se

rncluyaun términoconstanteentrelos regresores.En estecaso,un puntode cortedistinto

de ceroquedaráreflejadocomo un cambiode origen.

En estecontexto,si FQ) es la funciónde distribuciónde e~, quesesuponeindepen-

dientede x1, se puededefinir la probabilidadde respuestao de eleccióncomo:

= T .r¿ =0)1’ = P(y1 = 1 ¿u) P(y xa[1.2.3]

= P(e1 = -¿u fa) = 1-F(-xfa)

o bien:

P(y, = O ¿u) = 1 —1’, = F(—xfcc) [1.2.4]

Si la funciónde densidadfl~> asociadaa essimétrica, que esla situaciónmás

frecuente,entonces:

1% = F(x fa) [1.2.51

De hecho,el supuestode simetría no es necesario, puestoque, sin pérdida de

generalidad,laecuación[1.2.11podríahaberseplanteadocomo = <a - ~,, y siguiendo

los pasos expuestosanteriormente,se obtiene que P, F(x~hx) sin requerir ninguna

característicaparticular de F(~).

Obsérveseque la ecuación[1.2.3] no estádefinida de forma única respectoal

vector a, puestoque:

Page 15: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 9

Pr= = vx>o [1.2.61

por lo que, convencionalmente,seemplea una normalizaciónespecíficaparacadafunción

de distribución, lo quese traduceenelegir un X determinadode forma que la varianzade

e, seaconocida.De estemodo, el modelo latenteresulta:

y1 = xf¡3 + e~ con EXc) = O y Wc) = vi [12.7]

dondefi = aIX y u02 esconocidoy dependede la función de distribución que se suponga

parae~, lo que no afectaa la función indicadorni al modeloobservable.Incorporandoesta

restricción, la ecuación[1.2.5] resulta:

/‘, = F(xf/2) [1.2.3]

Es importanteseñalarque estetipo de modelosno permiteestimarel valor de y1

paraun vector x~ dado, sino la probabilidadde que y1 tome un cierto valor, es decir, la

probabilidadde que el decisor opte por una de las alternativasque se le presentano

alcanceun cierto nivel de respuestaa un estímulo.

A continuación,sedesarrollaun planteamientoalternativode los MEB más ligado

a la Teoría Económicay que se debea McFadden(1973). En estecontexto, sesupone

que, en lugar de una variable latente,el individuo percibedos variables no observables

para el investigador,que indican la utilidad que le reportacadauna de las alternativas.

Dicha utilidad se considera determinadapor una componentesistemática (que es

determinista y contiene los componentesmás representativosde la misma) y por una

componentealeatoria(que refleja las característasno observablesde los individuos, como

los gustos y los erroresde medidaen las variables>. Entonces,manteniendoel supuesto

de que la componentesistemáticaes lineal en los parámetros,se tiene:

* 7-YO ~ [1.2.91

• 7-

En un contextode maximizaciónde la utilidad, el decisoreligeaquellaalternativa

con mayorvalor de la variablelatentepor lo que,en estecaso, la función indicador que

relacionala variablelatentecon la observablees:

Page 16: Anomalias Del Modelo Lineal General

MODELoS CON VARIABLE DEPENDIENTE BINARIA 10

= ji :: ~ = jYí<~ [1.2.101

< y~0

y la probabilidadde elecciónresulta:

P= P(y 1 x) = ~o1;=~2)

— P(¿uIa1÷e~ =XJa0+C10) [1.2.11]

= P[e0—e11 =xf(a,—a)1

De nuevo, es necesarioimponer restriccionespara la identificación del modelo.

Esto puedehacersenormalizando,enprimer lugar, la varianzade la diferenciaentre las

perturbaciones.Esta normalizacióndependede la distribución que se supongay, en

general, puedeexpresarse:

7-cii x1 (a1—a0) [1.2.12]1 = Pfe~ =¿u~7-q2,-x

paracualquierX > O, dondee = (e10 - e~1)¡X de forma que V(e1) = a02 esconocida.

Por otraparte,todavíaexisteninfinitos vectores/21 y /20 talesque su diferenciasea

igual a la misma constante,por lo que tambiénse impone la restricción:

fi0 — 0~, ¡2 = fi~ — fi~ [1.2.131

de modo que sólo puedeestimarsede forma únicael vector /2. Por tanto, la probabilidad

de elecciónresulta:

1-’ = P(y = 1 ¿u) = P(e1 =¿¡2) = F(xJ/3> [1.2.14]

dondeF() es la función de distribuciónde e~.

Aunque con este planteamientoaparecendos variables aleatorias, tan sólo es

necesariohaceralgún supuestosobre la distribución de e~, de forma que los modelos

resultantesde la derivaciónde variablelatentey de decisiónsonequivalentes.

Page 17: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 11

En las dos formas alternativasde derivaciónde modelosbinarios que acabande

exponerse,se ha supuestoque el vector x~ estáformadopor un conjuntode variablesque

caracterizanal decisor. Sin embargo,un modelo másgeneral incluiría entre las variables

explicativas un conjunto z~ (j = 0, 1) de q variables que caracterizanlas alternativas

disponiblestal y corno las percibeel individuo. Esteenfoqueda lugar a los denominados

modelosde eleccióncondicional [Luce (1963), McFadden(1973)]. En ellos, el modelo

latentees:

7- Tyo =xjc¿ +z••3+e

La probabilidaddeelección, incluyendorestriccionesanálogasa las de [1.2.12] y

[1.2.13] resulta:

1< = P(e1 = + (z~z~)Ty) [1.2.16]

y denotandopor:

Hl [1.2.171y ~‘ = L~i¿u’ = II

el modelo [1.2.15]puedereescribirsecomo un MEB semejanteal de la ecuación[1.2.71.

Estageneralizaciónno aportanadaal análisisen modelosbinarios,pero sí es relevanteen

una situación de elecciónmúltiple.

1.2.2. Formas funcionales

Una vez derivado conceptualmenteel modelo, para definirlo es necesario

especificarcómosedistribuye la perturbacióno bien ladiferenciaentrelas perturbaciones

de cadaalternativa, lo que da lugar a los distintosmodelosconcretos.En estetrabajo, tan

sólo sesuponentres característicasgeneralesde la funciónFQ): i) que es continuay dos

vecesdiferenciable,u) que esestrictamentecrecienteen todo su dominio de definición y

Iii) que su función de densidadasociadaesunimodal, esto es, que tiene un sólo óptimo

local que, consecuentemente,esel óptimo global.

Page 18: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 1 2

1 .2.2.A. El modelo lineal de probabilidad

El modelo mássimple, que se conocecomo modelolineal deprobabilidad(MLP),

se deriva a partir de la hipóteisis de que e~ sigue una distribución uniforme entre dos

valoresprefijados-L y L, conL > O. La probabilidadde elecciónen estecaso resulta:

O si ¿u¡fi<—L

= XT~ = x~Tfi +L ~ —L=.rj¿3=L [1.2.18]

Jflc)de1

2L

1 si x,7-fi>L

Pese a su simplicidad, este modelo presentaserios inconvenientesteóricos

especialmenteen los puntos-L y L, dondela primeraderivadano escontinua. Además,

al trabajarcon muestrasreales,inevitablementeocurreque algunosindividuoselijen una

alternativaparala que la probabilidadprevistaescero.Esteproblemasedebeal supuesto

de que la función de densidadde s~ sehacecero a partir de los puntos -L y E.

Debidoaestosproblemas,sehandesarrolladomodelosquedescribende formamás

realistalas probabilidadesde elección.En lapráctica,el modelolineal de probabilidadsólo

se utiliza para calcular estimacionesiniciales consistentesde los parámetros,que se

emplearánpara inicializar procedimientositerativos de estimaciónde otros modelos.

1.2.2.B. El modelo probit binario

Una hipótesis lógica sobrelas perturbacioneses suponerque son la suma de un

númeroelevadode componentesno observables,que conducena la decisión.Dadoeste

supuesto, por el teoremacentral del límite, la distribución de las perturbaciones

convergeríaa una distribución normal.

Concretamente,resultahabitualsuponerquee,~y e, siguendistribucionesnormales

con media nula y varianza finita, por lo que ¿~- será también normal con media cero.

2 Obsérveseque la elecciónde os límites de la distribución es irrelevante,puesto que no son irás que

parámetrosde escala,y generalmentese empleaL = 1/2.

Page 19: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE RINARIA 13

Incorporandola restricciónde identificacióndadaen [1.2.121,que para el modeloprobit

es V(c1) = «2 1, la probabilidadde eleccióna partir de [1.2.14] es:

1’ = = x~7-fi)

xtT$

1~ 12= j exp(—-..cJde, = J~k(e)de = [1.2.19]2 -~

= ~(x/j3)

donde4{) y 4<) denotan,respectivamente,la función de distribución y de densidadde

una variable aleatorianormal estándar.Obsérveseque las probabilidadesde eleccióndel

modeloprobit binariono dependende las varianzasde cadaperturbaciónosucovarianza.

1.22.0. El modelo logit binario

Aunque el modelo probit es intuitivamente razonabley el supuestosobre la

distribuciónde las perturbacionestiene un fundamentoteórico, presentael inconveniente

de que la probabilidad de respuestano tiene una forma cerrada; es decir, se expresa

mediante una integral. Esto haceque, en algunoscasos,sea convenienteutilizar una

función de distribución que, manteniendola forma de la normal, sea más sencilla

analíticamente.Uno de estosmodelosesel logil binario.

El modelologit suponequee~ sigueunadistribuciónlogísticao, másprecisamente,

una distribución del cuadrado de la secante hiperbólica (sech2), cuya función de

distribución es:

F(u) = exp[(u —u>!r] ~ < u < oc [1.2.20]

1 * exp[(u — p)Ir]

y cuya función de densidadasociadaes:

f(u) = exp[(u — LI.2.21]r{1 +exp[(u—g)1,-J}2

dondep¿eslaesperanzade la distribucióny la desviacióntípicaesrr/x13. Seconocecomo

función de distribución logística estándarcuandoen [1.2.201, ¡.¿ O y r 1. y en este

caso se cumpleque:

Page 20: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 14

f(u) = F(ufll —F(u)] [1.2.221

La distribución logísticatiene un aspectosemejantea la normal,aunquelas colas

son másgruesas.Paraobtenerla distribuciónlogísticade a~, esnecesariosuponerque~

y e, son independientesy se distribuyen idénticamentevalor extremo<distribución del

valor extremotipo lo Gumbel[Johnsony Kotz (l97O)]~). Como en los casosanteriores,

es necesario imponer una normalizaciónen la escalay usar la distribución logística

estándar,con lo que se tiene que E(a1) — O y V(e1) = «4’ = rV3.

Dadaestahipótesis, la probabilidadde elecciónpuedeexpresarse:

= 7-P<e1=x~¡Y)

exp(x/13) 1 [1.2.23]

1 + exp(xjfi) 1 + exp(—xjfi)

- A(¿u3)

donde,en lo sucesivo,AÚ y No denotanla función de distribución y de densidadde una

variablealeatorialogísticaestándar.

Es importanteseñalarque la diferentenormalizaciónde escalaelegidaparacada

uno de los tres modelosexpuestos,haceque los parámetrosestimadosno seandirectamen-

te comparables.Pararelacionarlos parámetrosdel modelo lineal de probabilidad(MLP)

con L = 1/2 y el probit con u = 1, convienehacernotar que la desviacióntípica de la

distribución uniforme (-L, L) es£113 y, en nuestrocaso,estáfijada en 1/213, mientras

quees unitariapara el modeloprobit. Estanormalizaciónimplica que los coeficientesdel

modelo probit serán 213 veces mayores que los del modelo lineal de probabilidad.

Siguiendoun razonamientoanálogo,los coeficientesdel modelo logit serán ir/13 veces

mayoresque los del correspondientemodeloprobit normalizado.Estaequivalenciapuede

tenerdosaplicaciones:i) hacercomparablesmodelosque no lo serían,al tenerdiferentes

escalaslos vectoresde parámetros,y u) emplearlas estimacionesdel MLI’ transformadas,

como condiciones iniciales para estimar los otros modelos por métodos numéricos

iterativos.

La distribucióndel valor extremo(IIVD) se derivadel limite dela distribucióndel mayor(o menor) valorde un conjunto de variables aleatorias. La EVD del mayor valor tiene función de distribuciónÑu) = exp{-expl-(u-M)ír!}, y es unimodal y no simétrica.

Page 21: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 15

Finalmente,es importanteseñalarque, aunquese ha mantenidoel supuestode

linealidad de los argumentosen la probabilidad de respuesta,el modelo logir permite

introducir de forma sencillaun cierto tipo de no linealidad. Estehechoresultaparticular-

mente interesante para representardiferentes esquemasde comportamiento de la

probabilidadde elección,sin tener que empleardiferentesfuncionesde distribución. En

general,un modelo univariantedicotómico se puedeescribir:

1’, = P(y. = 1) = F(v(x~,6)), i= 1,2 n 11.2.24]

donde v(~) es una función arbitraria elegida por el investigador. Cuando F() es la

distribución logística y se mantienela relación lineal entrevariables y parámetros,se

obtienelo que McFadden(1978) denominalogit universal[Amemiya (1981)1.

A partir de [1.2.23] y [1.2.24], la probabilidadde elecciónresulta:

P.= A(x53) = [1.2.25]1 + exp[—v/x~ fi)]

donde, por ejemplo, si se suponeque v(¿u/j3) = b~ + 51(x/’IP, para & 0.084 y

1.702, la función anterior es aproximadamenteigual a la función de distribución

normal.También,con valoresde los parámetros~ 0.012 y 8, 0.601 seconsigueuna

aproximaciónaceptablea la función de distribución uniforme entre -4 y 4. Estas

aproximacionesse muestranen las Figuras 1.1 y 1.2.

Page 22: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 16

Figura 1.1: Aproximación de la distribuciónnormal medianteun modelo logit generalizado.

1 0»

11.9 7. — —

7-013

-‘7<A

6 >7y

05

0.•; 7’7, ¡

0? ,-.,

7— ¡ — —0? ~ -L

01

—4 —Á —:2 —I 0 1 2 >2 4

§0

0

LO ¡0

(1 (3

II

4).

—>2 —1 0

4

2 3

Figura 1.2: Aproximación de la distribuciónuniformemedianteun modelo logit generalizado.

Page 23: Anomalias Del Modelo Lineal General

MODELOS CON VARIAStE DEPENDIENTE BINARIA 17

1.2.2.D. Otros modelos binarios

Aunque los modelosprobit y logit son, con diferencia, los másutilizados, se han

propuesto otras funciones de distribución para proporcionar diferentes patrones de

respuestade las probabilidadesde elección.Aunqueestetrabajo se centraen los modelos

logit y probit, los resultadosson válidos para otros modelos,como los que se exponena

continuación.

Otras funciones de distribución que se han consideradoen la literatura son las

siguientes:

1. Distribución de Cauchy o del arcotangenteestándar.

= 1‘2

+ Iarctan(.rJfi)ir

[1.2.26]

cuya función de densidadasociadaes:

ir1

1 + u’—oc < u <:2 oc [1.2.27]

2. Distribución de Burr [Burr (1942)1.

P=l— c,k >0, x¿Tfi >0 [1.2.28]

cuyafunción de densidadasociadaes:

f(u) = cku~’[1 +

c,k >0, u >0

y que se usa, fundamentalmente,para tratar variables aleatoriasque toman solamente

[1.2.29]

valorespositivos.

Page 24: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 1 8

3. Exponencialtruncadapor la derecha.

4/2)1jexP[—(L — 1 si x1’j3<Lsi x1

Tfi=L

4. Exponencialtruncadapor la izquierda.

— exp[—(xJfi — L)] si xg3>L

o si xffi=L

[1.2.30]

PI = j [1.2.311

donde,en [1.2.3<>]y [1.2.31], L esel punto de truncación.

Page 25: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARíA 19

1 .3. Estimación de Modelos de Elección Binaria

En general, la estimaciónde los modelosde respuestabinaria se puedellevar a

cabopor máximaverosimilitud, con la excepcióndel modelo lineal de probabilidad,que

puedeestimarseconsistentemente(aunque no eficientemente)por mínimos cuadrados

ordinarios (MCO).

En estasección,como en el restode estetrabajo, el análisis serestringeal caso

más frecuente en aplicaciones económicas,que es el de observacionesindividuales

obtenidaspor muestreoaleatorio simple. Un tratamiento de la estimacióncon datos

agrupados,estoes, cuandosedisponede un conjunto importantede observacionescon

idéntico vector de características,se encuentraen Cox y Snell (1989) o en Amemiya

(1981) entreotros. Porotraparte,la formulacióny las condicionesde existencia,asícomo

las propiedadesde] estimadormáximo-verosímil(EMV) bajodistintosdiseñosdemuestreo,

puedenrevisarseen Cosslett(1981ay 1981b) y Manski y McFadden (1981). Entre los

esquemasde muestreono aleatoriosimple, el más frecuenteen la prácticaesel muestreo

basadoen la elección(choicebasedsampling),cuyoprimertratamientoapareceen Manski

y Lerman (1977).

1.3.1. Estimación de Máxima Verosimilitud

Dadoel modelo en [1.2.13],para una muestraaleatoriade tamañon, la función

de verosimilitud es:

n

X.y) = ]j~J P’ (1 p)<’t) [1.3.1],=1

Definiendo¡Y, = P, y tomandologaritmos setiene:

t1

f(fi X, y) = ln~t = £[y1lnF + (l—y.)ln(1—F)1 [1.3.2]¡=1

El vector gradientedel logaritmo de la función de verosimilitud es:

Page 26: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 20

ve-2L~ ~ Hl (y.-F4x~ [1.3.3]E)

dondefes la funciónde densidadasociadaa5, mientrasqueel hessianopuedeescribirse:

= 32f - t [#l-Y;]f2x<.~< t [t1;;j~~x~[1.3.4]8/27-6/2

siendofi, la derivadade [a función de densidadrespectoa ¿u/ls.

Asimismo, la matrizde informaciónes la menos esperanzade [1.3.4], esto es:

J(¡3) = —E(V2 E) = 2 J¡ T [1.3.51

~-, 171Bajo condiciones de regularidad no muy restrictivas, y especialmenteen losmodelosen los que se centraeste trabajo, la función de verosimilitud es globalmente

cóncava[véaseMcFadden(1973 y 1983), Amemiya(1985)o Núñez<1990),entreotros].

Por tanto, el estimador máximo verosímil 13 de ¡3, si existe, es único. Además es

consistentey \/‘W (¡3 — ¡3) sedistribuye asintóticamentenormalcon esperanza0k y matriz

de varianzascovarianzas1 (un) I(¡’PF’. Los resultadosnecesariosde teoríaasintóticaque

permiten concluir lo anterior se encuentranen Silvey (1970), Cox y Hinkley (1974) y

Amemiya (1985). Un planteamientogeneral sobre la concavidadde la función de

verosimilitud para modelos binarios debida a Nuñez (1990) se presenta en el

Apéndice A.1.

La maximizaciónde la función de verosimilitud o, lo que es equivalente,la

soluciónde las ecuacionesde las condicionesde primer ordende [1.3.3], debellevarsea

cabonuméricamente.En el Apéndice A.2 sepresentauna revisión breve de los métodos

habitualmenteempleadospararesolverel problemade maximizarunafunciónobjetivo sin

restricciones.

Page 27: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 21

1 .3.2. Estimación de máxima verosimilitud por procedimientoslineales

Siguiendo a Amemiya (1985), un algoritmo de optimización más eficiente

computacionalmenteque el de Newton, y que permiteuna interesanteinterpretacióndel

modelo [1.2.13] es el métododescoring de Fisher. En estealgoritmo se empleala matriz

de informacióncomoaproximaciónal hessianoy el pasoen cadaiteraciónvienedadopor

[véaseApéndice4.21:

[1.3.6]¡3 = /27 +

La expresión[1.3.6] puedetambiénplantearse:

/2 7+1 = [V(I~i?) j4 [VI(fi’) + ¡(¡3’) 13’1 [1.3.8]

y sustituyendoel gradientey la matriz de informaciónpor las expresiones[1.3.3] y [1.3.5]

resulta:

Vf(13’) + «13’) 13~ =f¡%- 5

)

E A

F,(l-F)+ A x~(x%3)

~=i 5(1 —E)

=2~=I É(i-É»

1 +f(x113’) —

dondela virgulita sobreE1 yf denotaque estasfuncioneshan sido evaluadasen el vector

¡3’. Agrupandotérminos y operando,la ecuación[1.3.8] puedeescribirsecomo:

-1

iiI /2

-5)fiE jl-É)

,=i E.[1.3.9]

que puedeinterpretarsecomo el estimadorpor mínimoscuadradosordinarios(MCO) de

¡3 en la regresión:

= j~T/2 + u. [1.3.101

[1.3.9]

donde

Page 28: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 22

- y1—/x82’+É, [1.3.11]y1

y

Por tanto, un procedimientode estimaciónlineal máximo-verosímilparacualquier

modelo binario vendríadadopor los siguientespasos:

PasoO: Elegir un vector 130 de estimacionesiniciales. Fijar el contadorde iteracionesa

cero, r = O y elegir unatoleranciaparael criterio de paradae1.

Paso1: Verificar si se ha producido la convergencia,usandolos criterios de parada

establecidos.De no serasí, seguircon el paso2.

Paso2: Evaluar las funcionesde densidady distribucióndel modeloa estimaren xJW ytransformarla variabley1 y el vectorx1 de acuerdocon las expresiones[1.3.11]

y [1.3.12]. Seguircon el paso3.

Paso3: Estimar por MCO la regresión [1.3.10]. Los estimadoresque resultan son

idénticos a los obtenidospor el método de scoring para cada iteración. Hacer

r 7 + 1 y volver al paso 1.

Otra derivación alternativa del algoritmo propuesto, puede llevarse a cabo

[Amemiya (1981, 1985)] del siguientemodo. Seael modelo no lineal:

y1 E(x17-13) + u. [1.3.13]

dondeu, es una variablebinaria que toma los valores 1-P1 con probabilidadP, y -P1 con

probabilidad 1-1’, de forma que:

E(a) O y y(a) = P,(1 —1’) [1.3.14]

Si se lleva a cabounaaproximaciónlineal del modelo medianteunaexpansiónpor

Taylor de F(xj¡3’41) en torno a un vectorde condicionesiniciales 13’, se obtieneque:

Page 29: Anomalias Del Modelo Lineal General

MODELOs CON VARIABLE DEPENDIENTE BINARIA 23

= F(x1T13’) + f(x

17-¡flx

1Tq3~+~ — 13’) + [1.3.15]

Teniendoen cuentaqueR -. O enprobabilidadsi ¡Y esunaestimaciónconsistente

de ¿3. sustituyendoel modelo [1.3.13] en la ecuación[1.3.15]. la aproximaciónpuede

escribirse:

y1 — F(x1

T/f> + f(xJfi’)(xJff) = f(xJfi’) x,T/3’4-’ + u, [1.3.16]

El modeloen [1.3.16] es lineal conperturbacionesheterocedásticas,cuyavarianza

es E/l-E,). Por lo tanto, la estimacióneficiente del mismo por mínimos cuadrados

ponderados,coincidecon la estimaciónMCO del modelo [1.3.10].

Page 30: Anomalias Del Modelo Lineal General

MoDeLos CONVARIABLE DEPENDIENTEBINARIA 24

1 .4. Contraste de hipótesis

En esta sección se presentanun conjunto de resultadossobre el contraste de

hipótesisen los modelosde elecciónbinaria. En primer lugar, setrata el casode hipótesis

lineales, y posteriormente,en un contexto más general, se utiliza el principio de

Multiplicadores de Lagrange para plantear contrastespara hipótesis nulas del tipo

a estoes, de exclusiónde algún tipo de variables,paracualquierfunciónFo

que cumpla las condicionesde regularidad.

1 .4.1. Contraste de restricciones lineales

Se considerael contrastede una hipótesisgeneral lineal de la forma:

H0: R/2 = r [1.4.1]

donde R es una matriz de constantesconocidasmxk, r es un vector m>< 1 también

conocido y ademásse cumple que m =k y que rango(R) = ni. En lo que sigue, se

distingueentreel casoen que m 1 y ni > 1.

Siguiendo a Amemiya (1985), es sencillo comprobarque si ni = 1, bajo la

hipótesisnula:

R V(13)IRT

donde VQ3) es una estimaciónconsistentede la matriz de covarianzasdel vector de

parámetrosestimado, que generalmenteserá la inversa de la matriz de información.

Tambiénse puedeutilizar la distribución tnk para llevar a caboel contrasteaunque,al

utilizar muestrasgrandes,hecho en el que se apoyanlos resultadosde convergencia,

resultamás apropiadoel empleode la distribución normal [Amemiya (1981)].

Un casoparticular del que seacabade exponeresel contrastede significaciónde

un parámetroindividual. En esecaso,el estadísticode contrastese reducea:

Page 31: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 25

[1.4.3]

V( fl~)

donde V($.) esel elementoj-ésimo de la diagonalprincipal de V(13).

Cuandom > 1, puedeemplearsealguno de los conocidoscontrastesde Wald

(WT), Razón de Verosimilitudes (LRT) o Multiplicadores de Lagrange(LMT) ¡Engle<1983)). El contraste de Wald requiere un estimador no restringido consistente y

asintóticamentenormal, asícomo unaestimaciónconsistentede la matriz de covarianzas4.

El estadísticocorrespondientepuedeescribirse:

WT (Rfi —r)’4R V(13)R7-Y’ (R(3 -r) -.[1.4.4]

Obsérveseque si m = 1, el estadísticode Wald sereduceal cuadradodel estadísticoque

figura en [1.4.2].

El estadísticode contrastede razónde verosimilitudesse formula como:

LRT = 2[f(fl) - ~(fiR)] -~[1.4.5]

donde «13> y 1(PR> denotan,respectivamente,el logaritmode la función de verosimilitudevaluadaen el máximo y en el estimadorbajo la hipótesis nula. Este

asociadoa la estimaciónmáximo-verosímily parasu cálculoesnecesario

máximode la función de verosimilitud del modelo sin restriccionescomode verosimilitud bajo la hipótesis nula, lo que generalmentesuponeestimadores.Por estarazón, esteestadísticono sueleemplearseen la

contrastede restriccioneslinealesgenerales.

El contrastede multiplicadoresde Lagrangetambiénestá ligado

máximo-verosímil y requiere evaluar el gradiente del logaritmo deverosimilitud bajo la hipótesisnula, así comouna estimaciónconsistente

covarianzas.El estadísticode contrastepuedeescribirse[Engle(1983)1:

LMT = VC(13R)Q(13Ñ)’ X7f(13,~) —*

estadísticoestá

evaluartantoel

el de la función

obtener ambos

prácticapara el

a la estimación

la función de

de la matriz de

[1.4.61

Aunque es habitual usarel estimadormáximo-verosímily la inversade la matriz de información, no esnecesariopara la aplicación de este contraste [Arnemiya(1981)1.

Page 32: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 26

1 .4.2. Contraste general de hipótesis de exclusión basado en elprincipio de multiplicadores de Lagrange

En esteapartadoseanalizael contrastede hipótesisparamétricasgeneralesquese

puedenplantearcomo H0: a —

0q [Godfrey (1988, cap. 6>]. Este tipo de contrastesde

exclusiónes muy flexible si se introducenrelacionesno linealesentre las variables. Seaun modelo más generalque los que sehan tratado en el apartadoanterior, en el que la

componentesistemáticaes una función genéricav(zja, x¡f3) donde; es un vector de q

variablesexógenasy a es un vectorqx 1 de parámetrosdesconocidos.La función vQ) es

tal que verifica:

v(0,xf/2) = 4~/2 [1.4.71

siendo continua y diferenciablecon primeras derivadascontinuas. Bajo el supuesto

anterior, siguiendolos pasosdadosen las ecuaciones[1.2.L]-[1.2.5] setiene que:

1”. E[v(za, x/2)I (1.4.8]

Aplicando el principio de los mult¿~licadoresde Lagrange(LM) [Engle (1983)1,la adecuacióndel modelo se puede analizar contrastandoel conjunto de restricciones

a = La construccióndel estadísticode contrasterequiereevaluarel gradientedellogaritmo de la función de verosimilitud bajo la hipótesis nula y el estimadormáximo-verosímil bajo la hipótesisnula. Parasimplificar la notacióndefinimos: u 07- (aT, ¡37-);

íí) v410) v(4a, x/}3); iii) Vr(O) BVí(0)180r dondeOr es el componenter-ésimo delvectorO, r 1 k+q; iv) ¶7v

1(O) 8v1(O)I8O; y) E1(O) FlvJO)]. El EMV restringido

sedenotapor O = (Oj. ¡flT•

El vectorgradientedel logaritmo de la funciónobjetivo resultaen estecaso:

~y~5) Vv(O) [1.4.9]80 5(1-E)

Davidsony MacKinnon (1984) argumentanque el cálculo del hessianopuedeser

complicadoen estecontextoy utilizan la forma OPG5 equivalente,de modo que estiman

la matrizde informacióncomo W(O)TW<6), donde W(O> esuna matrizn X (k+q> cuyas filas

son los vectores gradientede cadaobservación.El estadísticopuede calcularsecomo:

Quter Product of/he Gradient: productoexterior del gradiente.

Page 33: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 27

LM1 = nR2~, donde R2

4 esel R2 no centradode la regresiónde un vector de unossobre

W(O) y sigue una distribución Xq Una versiónequivalentedel test es:

= [L2?,t][n-~-~

]

[1.4.10]

= [~+][z;’Í;ft

]

que,bajo lahipótesisnula, sigueunadistribucióncentradaE4 n-k.q~ Laevidenciaparaotros

modeloseconométricos[Godfrey (1988, cap.3)], esque esteestadísticono tiene un buen

comportamientoen muestraspequeñas.La alternativaes, claramente,utilizar la matriz deinformaciónen lugarde su estimaciónconel equivalenteOPG. La matrizde información,

en estecaso, resulta:

1(0) = —E(W£) = Vv(O) Vv(O~ [4.4.11]

¡-1 5(1-5)

por lo que el estadísticode contraste[Engle (1983)] es:

LM2 =Vk?(&)7-[I(&)]’ Vf(&) [1.4.12]

que puede interpretarsecomo la suma explicada en la regresión de los residuos

estandarizados:

= y,—E1(O) 11.4.13][F(&) (1 F(&)>]I/2

sobre:

S,(Ó) [E/ii) f/¿&) 11/2 [1.4.14](1 — E/ii)) Vv(O)

T

con lo que el estadísticoen [1.4.6] puedeescribirse:

LM, = s®7-S(&)[S(IJYS«hY’S(&)7-s«1) [1.4.15]

y es análogoa los estadíst¡cosderivadosen Gourierouxet al. (1987)que sebasanen el

conceptode residuosgeneralizados.

Page 34: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 28

La hipótesis11<>: a — se puedecontrastarcomparandoel valor del estadísticoconel valor crítico de una distribuciónX2

1 El estadísticoLM2, tiene una versiónequivalente

que sedistribuye como una~qn.kq y análogoa ~1 cuya expresiónes:

E, = [±±~±][:¿s;t] [1.4.161

Por otra parte,paracontrastarla hipótesisde omisióndevariablesen un MEB, se

puedeutilizar el siguienteplanteamiento,dondeseconsidera:

y/O) = xfl3 + zfa [1.4.17]

como expresióndel modeloalternativo.Comoenelcasodel modelolineal general(MLG),

el EMV restringido /2 no seráconsistentepara /2 si a !=0q El problemaes que, mientras

que las expresionesde la inconsistenciadel estimador son sencillas de derivar para elmodelode regresiónlineal general,en el caso de los modelosde elecciónbinaria se deberecurrir aaproximacionesbasadasen el supuestode quelos elementosde a estánpróximos

acero. Godfrey (1988) consideraaproximacionesal vector esperanzade la distribuciónde

<¡¡(0 - O) bajo una secuenciade alternativaslocalesIi~: a = 5/Vn. 5% c ~.

Sead,(O) 82(O)18f3, D21(O) 822(O)/6/28aFy D2}0) = 822(0)18/2b/2T. El EMV

restringidosatisfaced40) = 0« y, bajo I¡~, se tiene:

djii) d/O) — D21(0) D22(O)(13 — /2) [1.4.18]

y de lo anterior, despejando,resulta:

— ¡s — —VWrD=jo)í-’dj@+ [D22<6)¡-’D21(O)ó

El primer elementodel lado derechode [1.4.19] es asintóticamentenormal con

esperanzanula y matriz de covarianzasfinita, mientrasqueel segundotérmino converge

en probabilidada un vector con elementosfinitos, no todos nulos. Por tanto, el vectoresperanzade la distribución asintóticade V(13 —¡3) es plim [D22(O)UD21(O)B.Así, el

efectoaproximado(inconsistencialocaf) debidoa la omisión de las variablesde Z puedeestimarse:

6 El término inconsistencialocal no es riguroso.El EMV de 13 es consistentebajo H~ con (¡3 - 13) O~Qt’).

Page 35: Anomalias Del Modelo Lineal General

MODELos CON VARIABLE DEPENDIENTE BINARIA 29

1 AA

[D22(0)f’D21(O)5 = [D,,(O)j1D

21(O) a [1.4.20]N

Laexpresión[1.4.20] puedecombinarsecon las expresiones[1.4.13]-[1.4.14] para

obteneruna simplificación paralos MEB. Paraestosmodelos, la inconsistencialocal de

¡3 debidoa variablesomitidases:

«13) = [XTOXF’XTUZa [1.4.21]

dondeX y Z son las matricesde datos cuyai-ésima fila es y 4 respectivamente,y 9

esuna matriz diagonal it xn cuyo elementocaracterísticoes:

2

- _________ [1.4.22][5(1-5.)]

A

De la expresión [1.4.21], se deduceclaramenteque «/2) es el estimadorpor

mínimoscuadradosponderadosde la regresiónde Za sobreX, con matriz de pondera-

ción 9.

1.4.3. Intervalos de confianza para las probabilidades estimadas

Partiendode los estadísticosexpuestosen el Apartado 1.4.1, es sencillo derivar

intervalosde confianzaparaparámetrosindividuales,así comoregionesde confianzapara

el conjunto de parámetrosdel modelo. Sin embargo,otro aspecto interesantede la

ínferencia,que puedepresentaralgunadificultad adicional,esel cálculo de intervalosde

confianzaparaP,. Esteasuntoseabordaa continuación.

Puestoque el estimadormáximo-verosímilde /3 sigue una distribución asintótica

normal multivariantecon esperanza/2 y matrizde covarianzasV($), la variable¿/2sigue

una distribución:

N(x7-¡3, x 7-Vjhx) [1.4.23]

Bajo la especificación lineal de la parte sistemáticadel modelo que se ha seguido

anteriormente,para un modelo generalse tiene que F’(P) ¿/2, y de ahí:

Page 36: Anomalias Del Modelo Lineal General

Mooaos CON VARIABLE DEPENDIENTE BINARIA 30

x 7-13 - EWP) [1.4.24]

es un estadísticopivote para P,, que sigue una distribución normalestándar.

Definiendo ~ como el percentil de la distribución normal para un nivel de

significación a, se puedeescribir:

¡~ __________ ~ It!2 - [1.4.25]

L v(13)x)1¡2 = 1 ay despejando:

P[x 7-13 — tjx 7-V(13)x)í¡2 =E’(P) =x 7-13 + t,(x TV(13)X)í/2] = — a [1.4.26]

Teniendoen cuentalas propiedadesde FQ) y, en particular, que esestrictamente

crecienteen su dominio, el intervalodeconfianzaa un nivel 1 - a paraP, resulta:

{Flx 7-13 — ~~2(x7-V(13)x)I/2] Ijr ~13 + 1~2(x 7-V(13)x)í¡24 [1.4.27]

Page 37: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 31

1 .5. Previsión con modelos de variable dependiente binaria

Una de las principales razonespara la construcción de modelos de variable

dependientecualitativaes su utilización para la previsión de las decisionesagregadasde

unapoblaciónobjetode estudio.En estasecciónsepresentanlos principalesmétodospara

realizarprevisión agregada.Un análisismás extensode estastécnicaspuedeencontrarse

en Ben-Akiva y Lerman (1985, cap. 6), Daganzo(1979, caps. 4 y 5) y Cramer(1991,

cap. 5).

En esta sección, no se hace especial diferencia entre modelos binarios y

multinomiales,debido a que las técnicasque se describenson de aplicacióngeneral. No

obstante,cuandoexistandiferenciasrelevantesse haránnotar de forma explícita.

1.5.1. El problema de la previsión agregada

Se supone que el número de decisores en la población, denotadopor N. es

conocido. Si se conoceel vector de característicasx1 para todos los individuos de la

población,calcularunaprevisióndel númerode individuos queoptaríanpor la alternativa

j es, al menosconceptualmente,sencillo. Estaprevisión,que se conocecomo demanda

agregada,sería:

N

11.5.11i=1

donde7%esel númerototal de individuos que eligen la alternativaj,P,1 es la probabilidad

de que el individuo i elija la alternativaj y P~ es la probabilidad de que un individuo

genéricocon vector de característicasx elija la alternativaj-ésima.

Nótese que AÚ es el valor esperadodel númerode individuos que elegirían la

alternativaj-ésima,y esun estimadorinsesgadoy consistentedel verdaderovalor, estoes,

de los individuos que efectivamenteeligenj. Una forma más convenientede expresar

[1.5.1] esformularlaen términos relativos,esdecir, estimarla proporciónde individuos

que elegiríanj. Estaproporciónsedenominagenéricamenteparticipación:

Page 38: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 32

xv. = {SP9=EIP) 11.5.2]}

i=1

El problemadel planteamientoanteriores que es poco realista, puesto que muy

raramentese puedeconocerel vector de característicasparatoda la poblacióny, aunque

así fuera, el esfuerzocomputacionalparacalcularprevisionessobrepoblacionesgrandes

podría ser muy elevado. Partiendo de [1.5.2], si se conoce la distribución de las

característicasx, en la poblacióng(x), puedeescribirseque:

= JP~g(x)dx = E~(P) [1.5.3]x

dondeP9 es una función de x. Generalmente,g(x) esdesconociday, aunqueno lo fuese,

un tratamientogeneralde la expresión(1.5.3] podríasersumamentecomplejodependiendo

de las formasconcretasde las funcionesdentrode la integral.

El propósitode los métodosde previsiónagregadaes,por tanto, reducirla cantidad

de datos y cálculosnecesariospararealizarla previsión objetivo.

Aunquehastael momentosólo se ha expuestoel tratamientogeneralpararealizar

previsionesde la demandatotal (N1) o de la participación(xv1), la formade tratar cualquier

otra magnitudde interésasociadaala alternativa]que, en general,sepuededenotarcomo

T>(x,/2), consisteen calcular o aproximarEj~(x,¡3)]. Bajo el supuestode que se conoce

el vector x para todos los individuos de la población, esto puede llevarse a cabo

calculando:

1E~[T/x,¡3>] = —~fl(x~,¡3) [1.5.41

o, de forma más precisa:

E~[fl(x~/2)] = J7i(x~¡3)~(x)dx [1.5.5]x

y comopuedeobservarse,el tratamientode la proporciónes un casoparticularen el que:

Page 39: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 33

T/x, /2) = P [1.5.6]

Una medida usualmenteempleadaen la evaluaciónde los efectosque tienen

cambiosen unavariableexplicativasobrela variabledependiente,es laelasticidad.Dicha

medida tiene la ventaja de estar normalizada por la dimensión de las variables. La

elasticidadde la probabilidadde elecciónde la opción] antevariacionesen la variablek

es, en general:

~jk = X~ a~ a lnP. [1.5.7]É ax~

Paraderivarcasosparticularesseránecesariodiferenciarentreel caso en que la

variable estéasociadaa la alternativa]o a otras alternativas(elasticidadcruzada). Para

modelosbinarioscomo los descritosen las seccionesanteriores,las elasticidadesresultan:

111k = ~

flkxkE(XT¡3) [1.5.81

110k = ~PkXk f(x 7-1

»

1 —F(x7-/2)

En los casosparticularesde los modeloslogit y probit, la expresiónanteriorpuede

escribirse:

= ¡3kxdl —P)[1.5.91

~Ok = flkXkPí

parael modelo logit, y:

~1k = ______ [1.5.10]

>10k /2kXk1

—4’(x7-13>

parael modelo probit.

La elasticidad agregadade cada alternativa, esto es, la variación porcentual

agregadade la probabilidadde elecciónde dichaalternativaanteuncambioen la variable

Page 40: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 34

k-ésima,puedecalcularseparticularizandolas expresiones[1.5.4] ó [1.5.5] en función de

la información disponible,haciendo: T/x, ¡3> =

1.5.2. Métodos de previsión agregada

Siguiendoa Ben-Akiva y Lerman(1985), los métodosde previsión agregadase

fundamentanen la realizaciónde hipótesissimplificadorassobreel modelo de elección,

la población,o ambos. Los métodosbásicosque puedenconsiderarseson los siguientes:

• Enumeraciónmuestral: Se utiliza una muestrarepresentativade la poblacióny

seextrapolanlos resultados.La muestrano tieneporquéseraleatoria,pudiendo

emplearsemuestrasestratificadasendógenaso exógenas.

• Clasificación por características: Se divide la población en G subgrupos

homogéneosy parala previsión se utiliza un individuo mediorepresentativode

cadagrupo. La previsiónagregadaseobtienecomo la mediaponderadade las

obtenidasparacadasegmento,utilizandocomoponderacioneslos pesosde cada

estratoen la población.

• Diferencialesestadísticas:Seaproxima la distribuciónde las característicasen

la poblaciónpor sus momentosy seutilizan dichos momentosen la aproxima-

cióndelas previsionesagregadas.Generalmente,sóloseconsideranlos primeros

y segundosmomentosrespectoa la mediade la distribución.

• integración expl(cita: Se intenta evaluar de forma aproximadala expresión

[1.5.3]. Este método requierehaceralgúnsupuestosobrela distribución de las

característicasindividuales. Puesto que habitualmentex incluye variables

continuasy discretas,esaintegral debetomarseen sentidoamplio.

En lo que sigue, sepresentanlos dos primerosmétodos,puestoque son los más

utilizados y requierenmenoshipótesisparasu desarrollo.Se prestaespecialatenciónal

estimadorde la proporción de individuos que eligen cadaalternativa (w~), aunquees

posiblegeneralizarloa cualquierotra medidade interésidentificando: fl(x1, 13) = P,~.

Page 41: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 35

1 .5.2.A. Método de enumeración muestral

La forma más simple de aplicar este método consisteen utilizar una muestra

aleatoriarepresentativade la poblaciónobjeto de estudio.La proporciónde individuosque

optanpor la alternativaj puedeestimarsemediante:

1= — y?. [1.5.13]¿=1

donden es el tamañomuestral.

Estemétodopuedeusarsetambiéncuandola muestraesestratificada(endógenao

exógenamente);estoes, cuandodiferentesgruposde la poblaciónestánrepresentadosen

la muestraen proporcionesdistintas de las queposeenen la población. En estecaso, el

método se aplica primero utilizando la expresión[1.5.13] para los individuos de cada

grupo y, posteriormente,se obtienela estimaciónglobal calculandounamediaponderada

de las estimacionesintra-grupo:

K

~ (1.5.141k=1 N

dondeNk esel tamañodel grupok en la poblacióny nk esel tamañode ese mismo grupo

en la muestra.Obviamente,sepuedenobtenerestimacionesde la participaciónde cada

estratoutilizando el componenteentrecorchetesde la expresión[1.5.14].

Esteprocedimientoes el másempleadoen la prácticapor su relativasencillezyeconomíade cálculo, siendoademásinmediatala obtenciónde previsionesparagruposde

población.Lasprevisionesobtenidassonconsistentessi las estimacionesde los parámetrosson consistentes,aunquela varianzade la previsión estarásujetaa dos fuentesde error:

el debidoal muestreoy el asociadoa la estimación.Puededemostrarse[Cramer (1991,

cap. 5)] que la varianzadel estimador[1.5.13]es:

f ~T

aw. 1V%) = —1 1 V($) ~ [1.5.15]¡ t i

y paracualquiermagnitudde interés,comola elasticidad,la varianzaseobtienede forma

similar.

Page 42: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 36

1 .5.2.B. Método de clasificación por características

El métodode clasificaciónporcaracterísticasseutiliza cuandono sedisponede unamuestra representativade la población, o cuandose intenta realizarprevisión para un

grupode poblaciónescasamenterepresentado(o no representado)en la muestradisponible.Como se verá a continuación,y pesea lo atractivo que resultadesdeun punto de vistaIntuitivo, estemétodoes inconsistente,aunquela inconsistenciapuedereducirsea nivelespoco significativos si se toman las precaucionesadecuadas.

Esteprocedimientoes unaextensiónlógica del métododel individuo medio, porlo que primero se exponeéste, basadoen construir un individuo representativode la

población o del grupo de población objeto de interés, denotado por x, y obtenerestimacionespoblacionalesevaluandolas magnitudesde interésparaesteindividuo medio.

La participaciónresulta:

w = PJ~) E(i7-13) [1.5.16]

y en general:

La inconsistenciasedebea que,parauna funciónno lineal, la mediade la variable

dependienteparaun rangode valoresde las independientesno es necesariamenteigual ala función evaluadaen la mediade las variables independientes.

La inconsistenciaes proporcional al rango de variación de x, por lo que es unprocedimientoescasamenteútil para tratar poblacionesen conjunto. Sin embargo,si la

poblaciónseestratificaen gruposhomogéneosy seagreganlas previsionesde cadagrupo,la inconsistenciadisminuye y puedeser una buenaaproximación.Estaes la ideasobrela

que se basael procedimientode clasificaciónpor características.

Formalmenteel métodode previsiónpor clasificaciónpor característicassigue lassiguientesetapas:

Paso1: Se particionala poblaciónen G grupos excluyentesy exhaustivos,cadauno de

los cuales correspondea un rango de variación del vector de característicasdefinido por el conjunto {XJ, cumpliendoque:

Page 43: Anomalias Del Modelo Lineal General

MODELOS CON VARIABLE DEPENDIENTE BINARIA 37

Úx=x [1.5.lSjg

donde X denotael espaciode las variables explicativas. A veces puede sernecesariorecurrir a métodosmultivariantes,comoel análisisde conglomerados.

para determinar los conjuntos {Xg}, aunquetambiénpuedenser fijados por elinvestigador.

Paso 2: Para cada grupo, obtener el individuo representativo ¿Vg y el tamañodel grupo

en la población que, en algunasocasiones,puedeser necesarioestimar.

Paso3: El estimadorde la proporciónde individuos que eligen la alternativa]con estemétodoresulta:

[1.5.19]g=I

dondeNg esel númerode individuosen el g-ésimogrupo, PI es el tamañode lapoblación y PJi~) es la probabilidad de que el individuo medio elija la alter-

nativa].

La clavede esteprocedimientoresideen la particiónde la poblaciónen segmentos.

Cuantosmás estratosse definan, menor será la inconsistenciadel estimador. Por otraparte,convieneponerde relieve que el criterio quedebeconsiderarsea la horade definirlos gruposno esel de homogeneidaddel vector¿Vi, sinoquela homogeneidaddebeexigirse

en la componentesistemática[Ben-Akivay Lerman (1985,pag. 138)].

A la hora de aplicar estemétodo, tambiénhay que considerarque la clasificación

utilizando todaslas variablesexplicativaspuedeconducira unainfinidad de grupos, lo queimpondría un costede procesoinnecesario.Con objeto de tener un númerode gruposrazonable,es recomendablerealizar la agrupaciónbasándolaen las variablesprincipales;

esto es, variablesque tenganel mayor pesoen la probabilidadde elecciónindividual (las

derivadasde las probabilidadesde eleccióno las elasticidadesserian los indicadoresaconsiderar) ignorando el resto. También conviene teneren cuentaque los grupos conescasarepresentaciónen la poblacióncontribuyenpocoa refinar la estimación,por lo quese puedeprescindirde ellos.

Page 44: Anomalias Del Modelo Lineal General

CAPÍTULO 2

OBSERVACIONES ANÓMALAS EN MODELOS DE

ELECCIÓN BINARIA: PLANTEAMIENTO Y

CONSECUENCIAS

2.1. Introducción

Citandoa Hocking (1983),debeadmitirseque “... el ajustede ecuacionesa datos

observados[frentea datosprocedentesde experimentoscuidadosamentediseñados]es, enel mejor de los casos,un asuntopeligroso . Inevitablemente,existeunadistanciaentreun modelo y la realidad; una cosa es especificar un modelo y otra que ese modelorepresenteadecuadamentelos datos. En estecontextosurgeun conjuntode problemasenla interacciónmodelo-datoscomo, porejemplo, erroresnuméricos,muestreoinadecuado,

cifras erróneaso defectosde codificacióno, incluso, que el modelo mismoseauna malaaproximacióna los hechosque pretendeexplicar:

• Los errores numéricosaparecenen cualquieranálisis,debidoa la necesidadde

trabajarcon representacionesnuméricasde precisiónfinita. De todos modos,este tipo de error no provoca problemas serios si se toman las debidasprecauciones,muy especialmenteen los algoritmosnuméricosque se emplean

pararealizarla tareasde cálculo,desdela inversiónde unamatriz a los métodos

de estimaciónno lineal.

• Respecto a la cuestión del diseño inuestral, lo deseable, como sugiere

Snee(1983),seríacontarsiemprecon muestrasquerepresentenadecuadamentela poblaciónen estudio,basadasen un diseñoexperimentalprevio. Desafortuna-damente,en economía,casi siemprese disponede unamuestradada en cuyodiseño no ha participado el investigador, por lo que los resultadosestarán

siemprecondicionadosa la muestradisponible.

Page 45: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 39

• Los errores en las cifras surgenmása menudo con algunos tipos de datos que

con otros. Un modelo de seriestemporalesque utiliza datos de ContabilidadNacional y un númeromoderadode observaciones,es difícil que contengaesta

clasede erroressi la muestraseha revisadocon ciertaatención.Sin embargo,

una muestrade corte transversalde gran tamaño,obtenidaenviandocuestiona-

nosa individuos, puedetenerbastanteserrores:algunosencuestadosinterpreta-

rán mal ciertas preguntas, otros darán información incorrecta de formadeliberada,habráerroresde transcripcióna soportemagnético,etc.

• La espec(ficacióndelmodeloestambiénun problemasustancialy, potencialmen-te, una nuevafuentede erroresparael análisis. El supuestode linealidaden losparámetros,el conjuntode las variablesexplicativaso la formafuncionalelegidapuedenno ser adecuados.En esteaspecto,sólo un profundoconocimientodelproblemaque sedeseatratar y el uso, en la medidade lo posible,de herramien-tas de diagnosispuedenayudar a modelizarcorrectamente.

En estetrabajoseconsideraun problemaconcretoen la interacciónmodelo-datos:la existenciade observacionesanómalas,queresultanfrecuentesen las muestrasdecorte

transversal.Al intentar describir el comportamientode la muestramedianteun modelo,puedehaberun conjuntoreducidode observacionesque, debidoa su falta de homogenei-dad con el resto de la muestra, distorsionensustancialmentelos resultados de laestimación,incluso si se utilizan muestrasde gran tamaño.En estetrabajo,sesuponequedichas observacionesno sedebena errores en los datos,sino a queen la muestrahay ungrupo de datos que procedende unapoblacióndiferente queel resto. Por tanto, en lo que

sigue, el análisis se centraen un tipo muy concretode errores: los que tienen su origenen el hecho de que entre los datos se encuentraun conjunto (usualmentepequeño)deobservacionesgeneradaspor un procesoestocásticodistinto del que sigue la mayoría dela muestra.

Un ejemplo sencillo del problema que origina la presenciade observaciones

anómalas,puede plantearsedel siguiente modo [Kraskeret al. (1983)]: medianteunaencuesta,se obtieneunamuestrade tamañon de cierta población de individuos, con el

objeto de estimar la esperanzade algunacaracterísticade dichapoblación,que sigueunadistribucióncon esperanzaji y desviacióntípica a. Sin embargo,conuna probabilidadwaparecenobservacionesprocedentesde una población distinta, con esperanza/1+15 ydesviación típica ka. En estas circunstancias,el error cuadrático medio de la media

muestral i~ es: [(1 — — wk2) * Mún(l — w)]a2In. Sin pérdidade generalidad,si sesuponequea 1, 5=1,k=2 y w =0.05,el error cuadráticomedioes0.0025 + 1 .20/npor

Page 46: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 40

lo que, en este caso, no hay una gran ventaja en usar muestras mayores de 1000

observaciones y los recursos se podrían destinar a mejorar la calidad de los datos.

En este capítulo se aborda el problema de las anomalías en los MEB. Este tema ha

sido tratado con anterioridad: Pregibon (1981), Jennings (1986) y Copas (1988) son

algunas referencias. Sin embargo, estos trabajos no parten de una definición estadística de

dato anómalo, ni analizan las consecuencias que este tipo de observaciones tienen sobre

los resultados de estimación del modelo. En las páginas siguientes se abordan estos

aspectos y se demuestra que en los MEBla presencia de observaciones procedentes de una

población diferente que las restantes afecta a la consistencia del estimador MV.

El capítulo está organizado como sigue. En la Sección 2.2 se considera el caso del

modelolineal general(MLG), dondese analizanlos tipos de observacionesanómalasquepuedenaparecery se lleva a cabo una breve revisión de los métodosutilizadosparasu

tratamiento. El objetivo de esta sección es presentar el problema de las anomalías en el

MLG, como punto de partida para abordar el mismo problema en los MEB.

A continuación, en la Sección 2.3, se plantea el problema de observaciones

anómalas en los modelos de elección binaria y se analizan las consecuencias que puede

tener su presencia en el estimador de máxima verosimilitud del modelo. En concreto, se

muestra que ante la presencia de anomalías, el estimador de MV es inconsistente.

Por último, en la Sección 2.4 se ilustran numéricamente los resultados generales

de la Sección 2.3 usando datos simulados. Para ello, se consideran los dos modelos que

se emplean más frecuentemente en la práctica: el modelo probit y el modelo logit.

Page 47: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 41

2.2. El problema de observaciones anómalas en el modelolineal general

En esta sección se define, en primer lugar, lo que se entiende por observación

anómala. Seguidamente, se ilustran de forma muy general los problemas que se plantean

en el modelo lineal general (MLG) cuando aparecen observaciones anómalas en la muestra

y, por último, se presenta un breve resumen de los métodos para su tratamiento.

2.2.1. Observacianes anómalas en el modelo lineal general

Siguiendo a Box y Tiao (1968), una observación anómala puede definirse como

aquella que no se ha generadopor el mismo experimentoaleatorio que las restantes

observacionesmuestra/es.Por tanto, la diferencia en el proceso generador de los datos,

suponiendo que la hipótesis sobre la forma funcional de su distribución sea la correcta,

puede tener básicamente dos fuentes de procedencia: i) distintas varianzas en el término

de perturbación (y por lo tanto, en la variable dependiente) y u) distintas esperanzas de la

variable dependiente, aunque no en el término de perturbación. Por supuesto, se puede

contemplar el caso en el que la distribución de las observaciones anómalas es diferente,

tanto en sus primeros momentos como en la forma funcional, pero esto complicaría

innecesariamente el análisis.

Partiendo de la definición anterior, en un modelo de regresión lineal pueden existir

dos tipos de anomalías7, tal y como se ilustra en la Figura 2.1 [Peña y Ruiz-Castillo

(1982 y 1984)] para el caso de una variable explicativa. En la regresión de z, sobrex~, el

punto A puede considerarse un dato anómalo, ya que corresponde a un valor de z1 muy

alejado de la media de las restantes observaciones muestrales y por tanto, es poco probable

que su presencia se deba al mismo mecanismo que ha generado los restantes datos. Tal y

como se indica en la figura, la presencia de un punto como éste desplazaría hacia arriba

la recta estimada por MCOy su residuo sería grande.

Por otra parte, el punto B también puede considerarse anómalo, ya que tanto el

valor de z1 como de x~ están muy alejados de sus valores medios. Sin embargo. aunque este

punto afectaría gravemente a la pendiente y a la constante de la recta estimada, su residuo

Estamosignorandoconscientementela posibilidadde que existan otros erroresen los datos.

Page 48: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 42

Figura 2.1: Dos ejemplos clásicosde anomalías.

sería muy pequeño en valor absoluto (mucho menor que el de otras observaciones no

anómalas). Por tanto, la inspección de residuos es un instrumento de análisis importante

para la detección de anomalías, aunque no suficiente, ya que sólo sirve para detectar las

del tipo A. En este sentido, la utilización de estadísticos que midan el peso de cada

observación o grupo de observaciones sobre los coeficientes estimados Icomo, por

ejemplo, el propuesto por Cook (1977)], es también un elemento fundamental en la

detección de anomalías.

Ahora se considera el punto C. Este caso parece semejante al punto B, pero al

contrario que en éste, es muy probable que la observación C haya sido generada por el

mecanismo que relaciona z~ con x1, aun que para un valor extremo en el espacio de las X,

sobre cuya distribución no se hace ningún supuesto. Esta clase de puntos no pueden ser

considerados anómalos sobre la base de la definición que estamos empleando, puesto que

no se puede descartar que correspondan al mecanismo aleatorio implícito, aunque tienen

un elevado peso en la estimación por MCOdel modelo. De hecho, esta clase de puntos

puede contener información muy relevante para la estimación, pero también puede hacer

que la varianza de los parámetros estimada sea significativamente inferior a la que se

habría obtenido sin la presencia de los mismos.

1k

• —-A-. •

A--

A.—

e..a

9’a1•

1 —

~2~~~/

—A1

____ E(z)NL>

z,(B)

xi

Page 49: Anomalias Del Modelo Lineal General

OBsERVACIoNEs ANÓMALAS EN MES: PLANTEAMIENTO Y CONSECUENCIAS 43

En la Figura 2.2 se presentan algunas configuraciones de interés que pueden

aparecer en los datos. El caso (A) es una situación extrema en la que un sólo punto, como

el C, determina completamente la recta estimada. En este caso, la muestra es poco

informativa, pero un punto alejado de~ resto puede hacer que los coeficientes estimados

sean significativos cuando, en realidad, no existe una relación.

El caso (B) representa una situación en la que debido a la presencia de dos

observaciones anómalas que se compensan, la recta estimada no sufriría variación. En estecaso se observarían dos residuos grandes y de signo contrario. Al utilizar estadísticos que

evalúan el efecto de cada observación sobre los coeficientes estimados Icomo por ejemplo

el de Cook (1977)1, ambas observaciones resultarían anómalas, puesto que la eliminación

de una de ellas nos llevaría a la presencia de una anomalía como la del punto A de la

Figura2.1. Sin embargo, conjuntamente ambas anomalías no presentan problemas sobre

los coeficientes estimados, aunque tendrán un efecto importante sobre la varianza estimada

de dichos coeficientes.

En (C) y (D) se ilustran situacionesdonde la detecciónde las anomalíases

considerablementemás complicadaque en los casos anteriores. En amboscasos, los

residuosasociadosa los puntosB y 8’ son pequeñosen valor absolutopero, además,laeliminaciónde uno sólo de dichos puntosno provoca~un cambiosignificativo de la recta

estimada,por lo que no sedetectaríancomoanómalosa partir de un estadísticoqueevalúeel efecto de cada observaciónpor separado.En estos casos, se dice que apareceun

problemade enmascaramiento.

Paraterminaresteapartado,es importanteseñalarqueen la literaturano existeuna

terminologíade uso generalizadoparareferirseal tipo de problemaque nos ocupa,por loque esconvenienteaclararalgunascuestionesde léxico. Comoseha indicadoanteriormen-te, en este trabajo se entiendepor observaciónanómala o atípica aquella que ha sidogeneradapor un procesoestocásticodistinto del que sesuponepara la mayor partede la

muestra,mientrasqueseutiliza el términode observacióninfluyenteparadesignaratodaobservaciónque tengaun efectosignificativo sobre la estimacióndel modelo.

Page 50: Anomalias Del Modelo Lineal General

LI

tJoz-eooo0cooaao.o-eoo

y->

¡¡

N1

~rn>1

4

..

m

LI-

wP~

aa

L’1M

Page 51: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 45

De acuerdocon estoscriterios, los puntos A y B de la Figura2.1 son anómalosy ademásinfluyentes;porel contrario,el puntoC de la mismafiguraes influyente,puesto

que puede tener un efecto importanteen la matriz de covarianzasde los coeficientes

estimados(aunqueno en el valor de dichos coeficientes),pero no puedeconsiderarse

anómalo. A puntos comoel C se les denominaobservacionesextremas. De hecho, una

observaciónextremaes unaanomalíaen el espaciode las variablesexplicativas(esevalor

del vector x~ espoco probable),mientrasque lo que denominamosobservaciónanómala

lo es respectoa la distribucióndel término de perturbacióno de la variabledependiente.

2.2.2. Métodos de tratamiento

En la literatura econométricase ha estudiado ampliamenteel problema del

tratamientode observacionesanómalaspara los modeloslineales de regresiónestática

[Belsley et al. (1980), Box y Tiao (1968), Cook (1977), Kraskeret al. (1983), Weisberg

(1983)sonalgunasreferencias].Principalmentelosdesarrollospuedenagruparseen cuatro

clases:

• Diagnosisy detección[Belsleyet al. (1980),Cook (1977)]. En estalínease trata

de desarrollarestadísticosque ayudena decidir si los supuestosbásicosdel

modelosonaceptablesy, por tanto, permitencuestionarla homogeneidadde la

muestra.Parael caso de observacionesanómalas,el método más extendidoy

usadodesdeel nacimientode las técnicasde regresiónesel análisisde residuos.

No obstante,en los últimos añosseha producidoun considerableaumentode

estadísticospara la detecciónde observacionesinfluyentesen modeloslineales.

Básicamente,hay dos tipos de medidaspara caracterizarlas observaciones

influyentes: i) las de distancia de las variables explicativas x¿ al centro de

gravedaddel espaciode las K (valoresextremos)y u) medidasdel efecto que

tieneuna observación,o un grupode ellas,sobrelos aspectosmásrelevantesdel

modelo que, generalmente,son los parámetrosestimadosy/o las previsiones.

• Análisisde influencia jCook y Weisberg(1982)]. La ideageneraldel análisisde

influenciaconsisteen estudiarlos cambiosen el modelo estimado,o en otros

aspectosdel anális¡s. cuandose introduceuna perturbaciónen algunos de los

elementosque componenel modelo (variablesexplicativas, término de error,

variable explicada>. Mientras que los diagnósticos se usan para encontrar

problemascon un modelo y unosdatosdados,el análisisde influenciase basa

Page 52: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 46

en suponerqueel modeloescorrectoy estudiarla sensibilidadde un estimadorparticular bajo un esquemade perturbacióndado.

Básicamente,el análisispartede un modelo sencillo como, por ejemplo:

~ ~ +5~+~ [2.2.1]

donde z es un vector unitario. A partir de este planteamiento,se derivanexpresionesanalíticas que describen el comportamientode los diferentescomponentesdel modelo (estimaciones,previsiones,etc.) cuando15 es distintode cero.

• Estimación robusta y de influencia acotada [Huber (1981), Krasker et al.(1983)J. El desarrollode métodosrobustosde estimaciónse basaen ponderarlas observacionesen proporción inversaa su pesoen la estimacióndel modelo

base.No se haceningún supuestosobre la procedenciade las anomalías,perose intenta limitar su efectoen la estimación.

Los métodosde influenciaacotadasonsemejantesa los robustos,aunquebasan

sus ponderacionesen medidasdel efectode cadaobservaciónsobre la estima-ción, como por ejemplo el estadísticode Cook [Cook(1977)1. La diferenciaentreestos métodos frente a los métodos robustosse basaen que limitan elefecto de cada observaciónsobre un aspectobien definido del problema,

mientras que los métodos robustos generalmentebasan las funciones deponderaciónen el tamañode los residuos.

• Transformacionesde los datos [Atkinson(1982)]. El principio generalde esta

metodología consisteen transformar las variables de modo que el modeloresultantecumpla las hipótesis de partida. Un ejemplo puedeplantearsedelsiguientemodo [Boxy Tiao (1968)]: seaun modelo de regresiónlineal dondelas perturbaciones,debidoa la presenciade anomalías,no siguenunadistribu-

ción normal. En este caso,se podríabuscaruna transformaciónde la familiaBox-Cox de modo que, una vez transformadala variabledependientey/o lasexplicativas,se puedamantenerel supuestode normalidaden la perturbación.No obstante,esteplanteamientono estáexentode problemas: O puedeocurrir

que una sola observaciónanómaladicte la transformacióny u) debido a unplanteamientoerróneodel modelo, al imponer algunatransformacióna priori

surgenobservacionesaparentementeanómalas.

Page 53: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 47

Muy ligadaal primergrupo (métodosde diagnosisy detección),aparecela ideaderobustecerla metodologíade estimación[Box(1980),Peñay Ruiz-Castillo (1982y 1984)],que se basaen analizardetalladamentelos datosdisponibles,tanto a priori comouna vezllevado a caboel procesode estimaciónpor algúnmétodo convencionalapropiado. Esta

metodologíasebasaen el usode estadísticosdediagnósticoe influenciay, posteriormente,

en tomar de decisionessobre qué hacer con cadaobservacióno grupo de observacionespara las que se ha comprobadoalgún efecto serio sobre los resultadosdel modelo.

Metodológicamente,estaidearesultaatractiva,ya queno implica el mecanicismoasociado

a otros planteamientos.En estalínea sedesarrollanlos resultadosde estetrabajo.

Page 54: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENcIAS 48

2.3. Anomalías en modelos de elección binaria

El problemade la deteccióny el análisisde las consecuenciasde las observaciones

anómalase influyentesen los modelosde eleccióndiscretaha recibidomenosatenciónenla literaturaque en los modelos lineales.Los resultadosexistentessongeneralizacionesdelos obtenidosparael modelo lineal de regresión.Parael caso de los MEB, el problema

de la detecciónde observacionesinfluyentesse tratapor primeravez en Pregibon(1981),queplanteaestadísticosgeneralesde diagnosisen modeloslogit. Posteriormente,Jennings

(1986) cuestionaalgunosaspectosdel trabajode Pregibony amplia algunosresultados,Copas(1988) tratael problemade anomalíasdebidasaerroresde codificaciónde los datosy Bedrick y Hill (1990) enfocanel problemadesdeel punto de vista del análisis deinfluencia; en la misma línea, en Lesaifre y Albert <1989) se estudia el caso de los

modelosde elecciónmúltiple. Porotra parte,Cook y Weisberg(1980)generalizanalgunosresultados de Cook (1977) para los modelos lineales generalizados(GLM), Williams(1987) tambiénpresentaresultadossobrediagnosisparalos GLM, Green(1984)desarrollaalternativasde estimaciónlinealesy de estimaciónrobustay resistenteparael casode losGLM, algunode cuyoscasosparticularesincluye modelosde elecciónbinaria. Por último,

Aranda-Ordaz(1981) y Guerreroy Johnson(1982) tratanla transformaciónde variablespara modeloscon datosbinariosagrupados.

Estos trabajosanalizan,básicamente,los modeloslogit y su planteamientopuederesumirseen los siguientes puntos: i) no parten de una definición de dato anómalo,considerandocomo anomalíatoda observacióncuyo residuoen valor absolutoesgrande

y u) adaptana los MEB los procedimientosparala detecciónde anomalíasutilizados enlos modeloslinealesque, en gran medida,sebasanen el análisisde residuosy en evaluarel efectode cadaobservaciónen la estimaciónde los parámetrosdel modelo.Sin embargo,no tienen en cuentalas particularidadesde los MEB, que hacenque dichos métodosno

seandirectamenteaplicables.

En estetrabajose trata el problemade forma diferente,partiendode la definición

de observaciónanómalaque habitualmentese utiliza en la literaturaeconométricay que

se ha introducido anteriormente:una observaciónanómala es aquella que no se ha

generadopor el mismomodeloestoccisticoquesesuponepara las restantesobservaciones

muestra/es(Box y Tiao (1968)1. A partir de esta definición, se demuestraque, en los

modelos de elección binaria, la existencia de anomalías en la muestra afecta a laconsistenciadel estimadorde máximaverosimilitud. Ello sedebea que la presenciade

Page 55: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MES: PLANTEAMIENTO Y CONSECUENCIAS 49

estasobservacioneshaceque la función de verosimilitud del modelo seadiferente de lahabitual.

2.3.1. Planteamiento del problema

Consideremosla ecuación[1.2.71utilizadaparaderivarun MEB. Estaecuaciónes

un modelo lineal de regresiónen el que la variabledependiente< no es observable,lavarianzade las perturbacioneses conocidaeigual a «2 y secumplenlas restanteshipótesishabitualesdel modelo. En particular, la ecuación[1.2.71estableceque las variablesy1’ sehangeneradopor el mismomodeloestocástico;estoes, lasy’ sedistribuyenindependien-temente,con E(y’) = xTIS y V(y1’) «02. De hecho,puede suponerseque y,’ sigue la

misma distribución que e~. Entonces, teniendoen cuenta la definición de observaciónanómalaque se acabade formular, un valor dey’ seráanómalosi no se ha generadopor[1.2.71.Obsérveseque el hecho de que y’ sea una variable latente no significa queteóricamenteno puedapresentarcomportamientosanómalo?.

Segúnesto, puedenconsiderarsedostipos de anomalíasen la variabley» aquellas

generadaspor una distribución con distinta varianza que las restantesobservacionesmuestralesy aquellasgeneradaspor unadistribucióncon distinta media. A continuación

se estudianamboscasos.

2.3.1 .A. Anomalías generadas por el lado de la varianza

La primer forma de modelizarla presenciadeobservacionesanómalasen el modelo[1.2.7jJessuponerque, aunquelas perturbacionese, se distribuyen i.i.d. Eh, existe unapequeñaproporcióndesconocidaco deperturbacionesquesiguenla mismadistribución, con

esperanzanula y varianzaa¿W, dondeJi > 1 [ver, por ejemplo, Box y tao (1968y 1973) y Peñay Ruiz-Castillo (1982y 1984)]. Esto es, sesuponeque las variablese, en[1.2.7] provieneno de una distribución E( ¡ cre> o de una F( 1 a0

2h2) con proporciones(]-w) y w respectivamente.En Box y Tiao<1968)sedemuestraque,bajoestascondiciones

y parael caso en que F~) es la distribuciónnormal, las perturbacionesen [1.2.7] puedenconsiderarsei.i.d. con una función de distribución quees unacombinaciónlineal de dos

8 Por ejemplo, si y1 representala predisposiciónque tieneel individuo i-ésimo a adquirirun automóvil de

lujo, que se suponedependeúnica y positivamentede su renta,entoncesun valor anómalode y seríael de unindividuo con rentamuy alta que odia los cochesde lujo o el de un individuo con rentamuy baja que ganaunautomóvilde lujo enunarita. Enamboscasos,el valor de y1’ esanómaloporqueno sehageneradopor el modeloconsiderado.

Page 56: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 50

funciones de distribución normales y que depende de w y h. En este trabajo, se extiende

ese planteamiento al caso genérico, de forma que se supone que la distribución de las

perturbacioneses:

G(c) = (l—co)F(e1 1 O.u~) .4. coF(e1 0,rrgh2) [2.3.1]

donde ÑOdenota la función de distribución con varianza normalizada conocida o] y FhQ)

la función de distribución con varianza u~2W. Esto es, si a’ = O se tiene que

G(e1) = F(e4 O,a~2). por lo que se mantiene la hipótesis sobre la distribución de e,. Pero

ante la presencia de un porcentaje a’ de observaciones anómalas, la distribución de e4 esla indicada en [2.3.1]. Además en este caso, para todo 1:

E(a) = O

V(e) = <4(1 + cn(h2 — 1)1 [2.3.2]

por lo que la varianzade la distribución G(e) es mayor que «02.

La implicación fundamentalde que las perturbacionesen el modelo [1.2.71sedistribuyan como en (2.3.11 es que se produce un cambio en la forma funcional que

determina P,, por lo que, a partir de (2.3.1]:

P = = (1—o4F1 + = E, + ~ (Eh—E) [2.3.31

donde E, y F,., denotan F(x,’1t3) y F4x/’/3) = F(xJIS/h), respectivamente.

Obsérvese que, si o> = O, entoncesP1 = E1, que es el MEBde la ecuación [1.2.8].

Sin embargo, ante la presencia de este tipo de anomalías, la especificacióncorrectaen la

determinación de P, viene dada por la ecuación [2.3.3],que establece que P, = 9., donde

U es igual a E, más un término adicional cuya magnitud depende de Ji y a’.

En la Figura 2.3 se representan las funciones ~ y U1 para el caso particular en que

FQ) es la distribución normal estándar (‘Inj)), ¡2 = 7 y Co = 0.15. Dado que E14 es una

función de distribución normal con media nula y varianza mayor que la unidad, esta

función se encontrará por encima de E, para valores de x1Tl3 < O y por debajo de E para

valores de x17f3 > 0, mientras que G(~), al ser una combinación lineal convexa de ambas,

se encuentra entre Fo y EJe>.

Page 57: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 51

Figura 2.3: Representaciónde las funciones ~,, ‘b,,, y O.

Por tanto, se tiene que:

x53<0=~ tft4~ ~

=

xjT13 > ~ “‘hi <~1t U4 c

para !~ < 1/2

para P.= 1/2

para 1’,> 1/2

Luego U4 tendrá la forma que se indica en la Figura2.3 y la discrepanciaentreE,

y U dependerádel valor de los parámetrosJi y a’. Parael casogeneral,a partir de [2.3.3j

/1

.7

2~

-7

1 00

¡‘-~~ O ¡So

025 -7

7-

7-

-7

7-

0 004

‘7

.1’

¡ ¡

o

o

si 11

[2.3.4]

se tiene:

Page 58: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 52

¿KG-F)

da’[2.3.5]

_______ = 81% 8F(x,’13/h)Co— = LO =oif { 2:#1 t-i#}

8k 8k 8k

por lo que ambas derivadas son positivas cuando x1T¡3 < O y negativas para valores

X4T¡3 > O. Por lo tanto, cuanto mayor sea el valor de a’ y/o Ji, mayor será, en términos

absolutos, la diferencia entre U1 y E4.

Según estos resultados, el logaritmo de la función de verosimilitud correspondiente

al modelo [2.3.3] es:

= E{y,lnLF,+a’(1%—F)] (1—y) ln[1—F,—a’(E,~—Ffl} [2.3.6]1 ‘4

de forma que sólo si a’ = 0, [2.3.6] coincide con el logaritmo de la función deverosimilitud del modelo [1.3.2]. En cambio, si existe un porcentajea’ de observaciones

con varianza mayor que «4~ la expresión [2.3.6] es la función objetivo que debería

maximizarse para obtener las estimaciones MV del vector ¡3. El problema es que esta

función depende de los parámetros a’ y Ji que, por lo general, son desconocidos.

Por otra parte, la maximización de [2.3.6] por los procedimientos expuestos en la

Sección 1.3 presenta considerables problemas.En concreto, si It) es la distribución

normal, la función de verosimilitud no está acotada [Day (1969), Quandt y Ram-

sey (1978)]. El desarrollo de un procedimiento de estimación adecuado para este caso es

algo que no se plantea en este trabajo, aunque el camino a seguir sería la utilización dealguna variante especializada del algoritmo EM, que se describe en el Apéndice A.2. No

obstante, el objetivo de la ecuación [2.3.6] es mostrar el tipo de error (le especificación

que se comete si se ignora la presencia de observaciones anómalas en un MEBy se utiliza

E, en lugar de G, para calcular la verosimilitud de cada observación.

La consecuencia inmediata de este error de especificación en la función de

verosimilitud, es que el vector ¡3 y las probabilidades 1~1 se estimarán inconsistentemente.

Este sesgo asintótico no puede evaluarse de forma general ya que depende de a’ y Ji,

aunque sí es posible evaluar la inconsistencialocal como se desarrolla en el Aparta-do 2.3.2. Sin embargo, como indican las ecuaciones [2.3.5], es claro que el sesgo sera

mayor cuanto mayor sea el número de observacionesanómalasen la muestray cuanto

mayor sea la varianza de la distribución que ha generado dichas observaciones.

Page 59: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 53

La inconsistencia en la estimación de los parámetros como consecuencia de la

presencia de este tipo de anomalías demuestra una diferencia sustancial de los modelos de

elección binaria con respecto al modelo lineal general donde, a pesar de la presencia de

anomalías generadas por el lado de la varianza, los estimadores por MCOsiguen siendo

ínsesgados y consistentes, aunque no eficientes [véase,por ejemplo, Peña y Ruíz-Cas~

tillo (1982) y (1984)1.

Es importante señalar que este resultado se basa en que, si existen anomalías en la

muestra, la función de distribución de e, viene dada por la expresión [2.3.11.Esta

expresión es una forma de modelizar la presencia de observaciones anómalas, bajo el

supuesto de que todas ellas provienen de la misma distribución con media nula y varianza

mayor que a~2. No obstante, este supuesto se hace por simplicidad, ya que otros supuestos

alternativos sobre la generación de anomalías por el lado de su varianza, conducirían a

errores de especificación del mismo tipo en la función de verosimilitud. En particular, el

análisis anterior puede extenderse fácilmente al caso en que las anomalías se consideren

generadas por un conjunto de distribuciones EQ) con distintas varianzas, todas ellasmayores que «02. En lo sucesivo, se mantiene el supuesto simplificador, aunque no

restrictivo, de que sólo hay dos grupos de observaciones en la muestra.

2.3.1.B. Anomalías generadas por el lado de la media

Un segundo tipo de observaciones anómalas puede deberse a que una proporciónde las variables y’ se haya generado por una distribución con distinta media que las

restantes. Esta situación podría modelizarse suponiendo que, aunque las variables y4’ siguen

una distribución FQ), existe un porcentaje desconocido w de estas variables que, aunque

también se distribuye FQ), su esperanza es E(y,’) x/’y, donde -y !=¡3. Obviamente, sila proporción w es grande, se podría decir que existe un cambio estructural; esto es, que

la población a analizar se compone de dos grupos de individuos distintos entre sí. Sin

embargo, el caso que se considera en este trabajo es cuando co es pequeño y sólo se trata

de unos pocos individuos atípicos. En estas circunstancias, la función de distribución de

y,’ vendrá dada por:

H(y,) = (1 —co)E(y, x/’fi,a~) + a’F(y1 1 x¿T~y,u~) [2.3.7]

por lo que es inmediato que:

Page 60: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 54

P. = P _[y’ >0] = E(x4T ¡3) + a’ [F(x/’y) - F(x ¡¡pl [2.3.8]

De manera similar al caso anterior, ignorar el segundo término del lado derecho

de la ecuación [2.3.8], conduce a un error de especificación en la determinación de P,. De

nuevo, si se ignora este término y se utiliza F1 en lugar de H, para calcular la verosimilitud

de cada observación, los parámetros del modelo se estimarán de forma inconsistente.

Obsérvese que, según [2.3.8], para un x4 dado, el que la función H1 estépor encimao por

debajo de E1. dependerá del valor de los coeficientes en el vector y. En cualquier caso, la

discrepancia entre ambas funciones será mayor cuanto mayor sea a’ y/o la diferencia entre

los componentes de y y ¡3. Conviene tener presente que dicha diferencia no será tanto en

magnitud (puesto que ambos están normalizados y operan sobre las mismas variables), sino

en el ángulo que forman.

De igual forma que en el supuesto de diferentes varianzas, este análisis puede

extenderse fácilmente al caso de que las anomalías se consideren generadas por un

conjunto de distribuciones EQ) con distintas esperanzas. Este supuesto más general

conduciría a errores de especificación en la función de verosimilitud del mismo tipo que

los vistos hasta ahora.

2.3.2. Inconsistencia del estimador máximo-verosímil

Para demostrar la inconsistencia del EMV ante la presencia de observaciones

anómalas de acuerdo con los esquemas planteados en el apartado anterior, se utiliza la

expresión de inconsistencia local de la ecuación [1.4.21]. Para ello, previamente hay que

parametrizar la presencia de anomalías siguiendo el esquema general de errores de

especificación presentado en el Apartado 1.4.2.

Para el caso de anomalías por el lado de la varianza, se puede seguir un desarrollo

similar al que se presenta en Godfrey (1988) para un esquema general de heterocedasíici-

dad, donde:

V(c) = <4 = <4k42, ¡ = 1,2 n [2.3.9]

de forma que, imponiendo la restricción de normalización de [1.2.6], resulta:

Page 61: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 55

pr. [2.3.10]

donde Ji es desconocido. Sin embargo, se puede suponer que:

Ji, = Ji(z/k) tal que Ji(O) = 1 y Ji’(0) # 0 [2.3.11]

y, además, puede suponerse que: JiQ) = expQ) [Davidson y MacKinnon (1984)J. Bajo

estas circunstancias se plantea la hipótesis nula H0: a =

0q’ lo que hace posible evaluar

la inconsistencia local del EMVde ¡3 para pequeñosalejamientos de la hipótesis nula.

Manteniendo la notación de la Sección 1.4, a partir de [2.3.10] se tiene que:

v,(O) = x4

1/3/h(;.’a), con lo que el problema queda reducido a uno de omisión de las

variables ;. Realizando una aproximación de Taylor de primer orden y suponiendo que

los componentes de a están próximos a cero, resulta:

v~(6) - Xf¡3 x[fi-h~(0)(x[¡3)zfa [2.3.12]h(z[a)

donde se ha tenido en cuenta que Ji(O) = 1. De [2.3.12] se puede eliminar el término Ji’(O)

[Godfrey (1988)] puesto que es irrelevante para contrastar H0: a =

0q y puede ~sarsela

aproximación de la expresión de inconsistencia local que aparece en [1.4.21].

Por otra parte, se puede suponer, sin pérdida de generalidad, que las n1 primeras

observaciones se han generado con el modelo [1.2.71y que, para las restantes, la única

diferencia es que V(e1) = «¿Ji. Entonces, se puede plantear que:

Ji, = 1 ~aZ,, [2.3.13]

donde a es un escalar y

si [2.3.141

4.

n

Esta especificación corresponde a una situación donde V(e,) = u~2 para las

primeras n1 observaciones,VN e) = para las restantes y los elementos de ¡3 se estiman

ímponiendo la normalización del primer grupo. El parámetro a puede interpretarse como

Ji - 1, resultando que, a partir de (2.3.12], la variable omitida para obtener la especifica-

Page 62: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MES: PLANTEAMIENTO Y CONSECUENCIAS 56

ción bajo la hipótesis nula es (x/YPz., que es un vector n xl con los primeros n1 elementos

iguales a cero y los restantes iguales a x/Y3. Sustituyendo este vector por Z y a por h-l

en la expresión [1.4.21] con U definida en [1.4.22], se obtiene la expresión de inconsisten-

cia local del EMVde ¡3 bajo la hipótesis nula.

Davidson y MacKinnon (1984) presentan resultados

muestra que, con el problema de variables omitidas, la

preferible para llevar a cabo los contrastes. La expresión

requiere para evaluar la expresión en [1.4.14] es:

[avio/aalVv1QhT —

La V4h/8 ¡3j

de Monte Carlo en los que se

varianteLM, de [1.4.15) es

del término adicional que se

[2.3.15]( T -,

[—xi= ¡L i

por lo que es inmediata la aplicación de las expresiones [1.4.13] y [1.4.14] para evaluar

el estadístico de [1.4.15].

De un modo similar se puede parametrizar la situación en que las observaciones

anómalas proceden de diferentes vectores de parámetros. En este caso se tiene que:

v4(6) = xh3.4-zfa [2.3. 161

donde ahora:

[2.3.17]1,2n

y el vector a puede interpretarse como la diferencia entre los vectores 1? y y de (2.2.71.

En este caso, también es posible evaluar la expresión de inconsistencia local de] EMV. no

siendo necesaria la aproximación de Taylor. y derivar expresiones del estadístico Liv!, para

llevar a cabo el contraste.

2.3.3. Sensibilidad de los modelos

En este apartado se analiza la sensibilidad del estimador máximo-verosímil ante la

presencia de observaciones atípicas en el caso de los dos modelos de elección binaria más

utilizados: el modelo probit y el modelo logit.

Page 63: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 57

En lo que sigue se utiliza la definición de residuo habitual en econometría [véase

Pregibon (l981). Jennings (1986) y Cox y Snell (1989), por ejemplo]; esto es:

e. = y, E(y. x) = y, — 1’, [2.3.18]

Partiendo de [2.3.28], el gradiente de la función de verosimilitud en [1.3.3] puede

escribirse:

Vf = = wex [2.3.191

d¡3 ~

donde:

fi_ E4(l-E) [2.3.20]

El estimador máximo-verosímil se define igualando la expresión [2.3.19] a0k’ la

cual presenta una gran similitud con el estimador por mínimos cuadrados ponderados en

un modelo lineal. En la Figura 2.4 se representan las ponderaciones w, de los modelos

probit y logit para un rango dado de valores de x4TIS.

Obsérvese que a partir de las expresiones [2.3.20] y [1.2.22], para el modelo logit

se tiene que: w, = 1 Vi; esto es, todas las observaciones tienen idéntico peso en la función

de verosimilitud. Por el contrario, en el caso del modelo probit binario, it’, es una función

convexa con un mínimo en cero, lo que implica que las observaciones con valores

extremos de x,T¡3 tienen las mayores ponderaciones en las condiciones de primer orden de

la función de verosimilitud.

La propiedad anterior puede interpretarse como que el modelo logit será más

robusto que el probit ante valores extremos en el espacio de las X. Dicha propiedad es un

reflejo de la forma de la distribución normal, donde las colas son más finas que en la

logística, por lo que valores escasamente probables tienen un efecto más importante en la

estimación.

Otra forma de ilustrar este resultado consiste en despejar w, en función de e, en

[2.3.20], que para el modelo probit resulta:

Page 64: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 58

— 44~-1(i/2 ~11/2—le 1 ¡4 [2.3.21]w.

Nuevamente, la función w, es convexa, lo que significa que valores con residuos grandes,

esto es, próximos a la unidad en valor absoluto, tendrán un peso en la estimación superior

al de otras observaciones. Ambas interpretaciones son equivalentes puesto que, a diferencia

de un modelo lineal, en los MEB, sólo pueden producir residuos elevados en valor

absoluto observaciones tales que x1T¡3 sea elevado, es decir, valores en las colas.

Figura 2.4: Representaciónde ‘y4 paralos modelosprobit y logit.

Page 65: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 59

2.4. Resultados con datos simulados

En esta sección se ilustran los resultadosteóricos de las seccionesanteriores

utilizando datos simulados. En concreto, se analizan los sesgos en la estimación MVde

modelos probit y logit derivados de la existencia de anomalías en la muestra.

2.4.1. Planteamiento de los modelos

Consideramos un MEBcon una sola variable explicativa y término constante, en

el que las observaciones se han generado mediante el siguiente mecanismo:

y4 =Q +f32x4+e4 [2.4.1]

{¿ :: s~:~ [2.4.2]

La variable explicativa se ha generado, en todos los casos de observaciones noanómalas, como una normal, x4—iidN(0,1) yel vector de parámetros es: ¡3 = (-0.65, j)T

Para este vector de parámetros, y usando tanto la distribución logística como la normal

para c~, la proporción de unos en la muestra es aproximadamente del 25%.

A partir de este mecanismo, se han creado muestras donde se incluye un porcentaje

a’ de observacionesy1’ generadas por la misma distribución que para el resto, pero con

momentos distintos de los que se acaba de señalar. En particular, se consideran los

siguientes casos, cuyos planteamientos teóricos se han discutido en la Sección 2.3:

Caso 1: Un porcentaje a’ de observaciones y1’ en la muestra proviene de. una distribución

con la misma media que las restantes observaciones, pero con Ji2 = 7.

Caso 2: Un porcentaje w de observaciones y4’ proviene de la misma distribución con

varianza igual a «02, pero con distinta media que las restantes observaciones. En

concreto, se ha incluido una proporción Co de observaciones tales que

Page 66: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 60

E(y,’) = <‘y, donde ~~(1 ..0•5)T Obsérvese que se ha considerado un caso

extremo, en el que las componentes del vector y son muy diferentes a las del

vector ¡3, formando un ángulo de 178~ aproximadamente.

Caso 3: Un porcentaje Co de observaciones están caracterizadas por E(y¿*) = x%3, e

idéntica varianza que las demás, donde ¿ = (-0.5, 0.5)’ y, además, para estas

observaciones, x4—udN(5,1). Esto es, las componentes del vector ¿no son muy

distintas de las del vector ¡3 (forman un ángulo de 140 aproximadamente)pero,

es de esperar que, para las observaciones anómalas, una proporción importantede los valores de x, sean mucho mayores que los de las restantes observaciones.

Estos tres esquemas pretenden reflejar situaciones que pueden producirse con cierta

frecuencia en el análisis de datos de corte transversal. El caso 1 se basa en la idea de que

la heterocedasticidad aparece frecuentemente en datos de sección cruzada. Los casos 2 y

3 pueden interpretarse como originados por las técnicas de muestreo, básicamente elmuestreo estratificado ¡ Azorín y Sanchez-Crespo (1986)], técnica con la que se pueden

estar incluyendo en la muestra elementos de subpoblaciones distintas entre sí; por un lado,

respecto del comportamiento, aunque no respecto a sus variables características (caso 2)

y por otro, respecto de sus variables características aunque homogéneas en su comporta-

miento (caso 3).

2.4.2. Aspectos técnicos de la simulación

Todos los cálculos, en esta sección y en el resto del trabajo, se han llevado a cabo

utilizando el paquete matemático GAUSS386 versión 2.2.

Un primer aspecto relevante en estos experimentos, es la técnica para generar

variables aleatorias. Esta cuestión se ha resuelto de diferente modo para cada una de las

distribuciones utilizadas. En el caso de la normal, se han utilizado las funciones internas

del paquete estadístico después de comprobar la adecuación de <tichas funciones

(independencia de diferentes muestras generadas consecutivamente y ajuste a la normal).

Para generar variables aleatorias logísticas se usa la transformación integral IjAr-

náiz (1978)], de modo que se generan valores de z4 a partir de una distribución uniforme

(0,1) usando la función interna de GAUSS, y el valor de la variable aleatoria se obtiene

evaluando K>(z4). Una interesante discusión sobre estos aspectos del análisis econométrico

puede encontrarse en Quandt (1983).

Page 67: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 61

La estimación de los modelos se ha realizado por el método de máxima

verosimilitud por procedimientos lineales, descrito en el Apartado 1.3.2. En este proceso

se utiliza un sólo criterio de parada basado en los parámetros, que puede formularse:

k[2.4.3]E Ñ~;t-é» =10-a

rl

En este caso,

las variables.

Todos

replicado 500las diferentes

no se utilizan criterios relativos debido a la homogeneidad en la escala de

[osexperimentos se han realizado con muestras de tamaño ti = 200 y se han

veces. Los resultados que se presentan en las tablas son valores medios, para

replicaciones. de los siguientes estadísticos:

• Las estimaciones de los parámetros ~ y ¡32 y la desviación típica de I~2, puestoque es la de mayor interés en cualquier aplicación empírica.

• El error cuadráticomedio (ECM) definido como:

[2.4.4]ECM = (~¡3)T(~¡3)

que es una medida de la precisión de la estimación.

e La sumade residuosal cuadrado(SSR) definida como:

[2.4.5]SSR ~ (y, -

¡=4

como medida alternativa de la precisión de la estimación al ECM.

2.4.3. Resultados de la simulación

En las Tablas 2.1 a 2.6 se presentan los resultados de la estimación MVpara cada

uno de los tres casos expuestos en el Apartado 2.4.1, para los modelos probit y logit.

En la primera fila de las tablas, figuran las medias de las estimaciones muesrirales de los

parámetros con a> = 0.0; esto es, sin anomalías en la muestra.

A partir de estas tablas, un primer resultado que requiere algún comentario es el

sesgo positivo y sistemático en las estimaciones de los parámetros con las muestras sin

Page 68: Anomalias Del Modelo Lineal General

OBsERVACIoNES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 62

observaciones anómalas y que se debe a que el estimador MVes sesgadoen este tipo de

modelos. Cox y Hinkley (1984, pag. 309) derivan expresiones generales para el sesgo

basadas en evaluar los términos de tercer orden de la aproximación de Taylor que se

emplea para maximizar la función de verosimilitud [véaseApéndice A.2] y como ejemplo,

Copas (1988, pag. 230) obtiene la expresión particular para un modelo logit con una sola

variable explicativa, que es:

~ x P, (1 — 1’) (2P~ — 1) [2.4.6]2 (rx;P,e -1’))

y que tiene el mismo signo que el parámetro /3, por lo que generalmente estará

sobreestimado en términos absolutos. Utilizando una aproximación de 1’, alrededor de

= O y suponiendo valores pequeños de /3, se sugiere que el sesgo puede aproximarse por

0.034/3.

Centrando la atención en el problema de observaciones anómalas, los resultados

más importantes de la simulación, pueden resumirse en los siguientes puntos:

• En los tres casos considerados, tanto en el modelo probit como en el logit, el

valor de los parámetros estimados se aleja de su valor teórico a medida que

aumenta el porcentaje de anomalías en la muestra, como cabría esperar a partir

de las conclusiones de la Sección 2.3. Como consecuencia de este sesgo de

estimación, el ECMy la SSR presentan valores más altos cuanto mayor es a>,

con la única excepción del caso 3, tanto para el modelo probit como para el

logit. La explicación de este hecho es que al tratarse de observaciones extremas,

pero generadas con parámetros similares a las observaciones no anómalas, los

errores de previsión son menores.

• Además, tal y como cabría esperar, las desviaciones típicas apenas cambian en

los casos 1 y 2 puesto que las observaciones son homogéneas y la variación sólo

se debe al factor de ponderación de [2.3.20]. Por el contrario, para el caso 3,

con observaciones extremas, la desviación típica sufre un fuerte cambio, ya que

los valores extremos de x, provocan una importante disminución en la matriz de

varianzas estimada a partir de la inversa de [1.3.5].

• Los resultados para el caso 1 figuran en las Tablas 2.1 y 2.4 para el modelo

probit y logit, respectivamente. Obsérvese que los sesgos en la estimación de $~y /t son menores que en los otros casos. Esto es debido a que, aunque la

Page 69: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 63

varianza de las observaciones anómalas es igual a 7, estas observaciones están

aleatoriamente distribuidas alrededor de la recta teórica x¡í3, por lo que seproduce una cierta compensaciónasimétrica. Dicha asimetría se debe a que, no

todas las observaciones anómalas son percibidas por el modelo. En este sentido,

cabe resaltar que no ocurriría lo mismo si, por ejemplo, en una muestra dada,los valores anómalos de y4’ fuesen sistemáticamente positivos. En muestras

generadas por el mismo mecanismo, pero donde se ha tomado el valor absoluto

de las perturbaciones correspondientes a las observaciones anómalas, forzando

a que haya muchas más anomalías de y4’ positivas que negativas, se obtienen

unos cambios considerablemente mayores que los presentados en las Tablas 2.1

y 2.4.

• El caso 2, donde existen observaciones muestrales con una media muy distintade las restantes, parece especialmente grave (Tablas 2.2 y 2.5). Obsérvese que,

solamente con un 5% de este tipo de anomalías en la muestra, los sesgos de

estimación en los dos parámetros son muy elevados, siendo casi tan altos como

los detectados en el caso 1 cuando a’ = 30%. En la práctica, lógicamente se

desconoce el origen de las anomalías existentes; sin embargo, este análisis

muestra que es erróneo pensar que un número reducido de anomalías no pueda

tener efectos apreciables en la estimación del modelo, ya que esto depende tanto

del tipo como de la magnitud de las mismas.

• Los resultados de las simulaciones para el caso 3 se muestran en las Tablas 2.3y té. Este caso trata de reflejar una situación habitual en la práctica, donde

para los individuos anómalos, no sólo la variable dependiente del modeloproviene de otra distribución, sino que también las variables explicativas toman

valores muy distintos que para el resto de la muestra. Obsérvese que, aunque,

en el caso que consideramos, el vector de parámetros b no es muy distinto del

que se ha utilizado para generar las restantes observaciones, los sesgos en la

estimación de los parámetros son importantes, especialmente el de la ordenada

en el origen.

• Comparando los diferentes resultados entre los modelos probit y logit se

observa, tal y como se sugiere en el Apartado 2.3.2, que el segundo es más

robusto que el primero ante los distintos esquemas de anomalías, aunque esa

diferencia es menor de lo que cabía esperar a la vista de la Figura 2.4.

Page 70: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 64

• Por último, un aspecto también relevante es que, a pesar de que los porcentajes

de observaciones anómalas en las tablas pueden tomar valores demasiado

grandes,como el 30%, esto no debe interpretarse como que realmente puede

existir un 30% de observaciones anómalas en la muestra sin que el investigador

lo haya notado sino, más bien, como una medida del efecto que podrían producir

esa proporción de observaciones anómalas con los parámetros dados o un

número inferior con parámetros característicos más extremos.

Tabla 2.1. Estimaciones MVcon anomalías en la muestra: modelo probit, caso 1.A A d

dtq3,) ECM SSR

0.0 -0.6519 1.0070 0.1449 0.0338 29.23

2.5 -0.6415 0.9945 0.1440 0.0360 29.995.0 -0.6276 0.9699 0.1414 0.0374 30.167.5 -0.6090 0.9331 0.1380 0.0416 30.86

10.0 -0.5985 0.9193 0.1361 0.0426 31.66

12.5 -0.5759 0.8901 0.1334 0.0502 31.75

15.0 -0.5647 0.8600 0.1308 0.0557 32.41

17.5 -0.5495 0.8459 0.1295 0.0653 32.75

20.0 -0.5368 0.8190 0.1267 0.0723 32.97

22.5 -0.5182 0.7994 0.1249 0.0849 33.525.0 -0.5185 0.7814 0.1237 0.0941 33.99

27.5 -0.4902 0.1510 0.1212 0.1158 34.48

30.0 -0.4829 0.7370 0.1199 0.1226 34.81

Page 71: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: PLANTEAMIENTO Y CONSECUENCIAS 65

Tabla 2.2. Estimaciones MVcon anomalías en la muestra: modelo probit, caso 2A /

/3, dtQ32) ECM SSR

0.0 -0.6594 1.0280 0.1473 0.0353 29.26

2.5 -0.5740 0.9064 0.1347 0.0467 31.24

5.0 -0.5056 0.8306 0.1271 0.0770 33.13

7.5 -0.4516 0.7644 0.1215 0.1199 34.71

10.0 -0.3978 0.6916 0.1156 0.1811 36.29

12.5 -0.3488 0.6431 0.1118 0.2379 37.90

15.0 -0.2994 0.5959 0.1085 0.3071 39.28

41.5 -0.2553 0.5598 0.1056 0.3666 40.57

20.0 -0.2144 0.5138 0.1030 0.4430 41.81

22.5 -0.1815 0.4757 0.1009 0.5111 42.62

25.0 -0.1508 0.4438 0.0995 0.5742 43.75

27.5 -0.1105 0.4157 0.0980 0.6477 44.72

30.0 -0.0763 0.3845 0.0969 0.7234 45.38

Tabla 2.3. Estimaciones MV con anomalías en la muestra: modelo probit, caso 3.A

/3, /3, dtÓ~) ECM SSR

0.0 -0.6658 1.0300 0.1470 0.0384 29.15

2.5 -0.6580 0.9918 0. 1454 0.0444 28.73

5.0 -0.6575 0.9567 0.1431 0.0497 28.20

7.5 -0.6503 0.9226 0.1403 0.0572 27.84

10.0 -0.6407 0.8711 0.1342 0.0695 27.68

12.5 -0.6386 0.8625 0.1333 0.0702 26.88

15.0 -0.6448 0.8323 0.1298 0.0804 26.32

17.5 -0.6296 0.7993 0.1246 0.0913 26.06

20.0 -0.6402 0.7803 0.1219 0.0999 25.44

22.5 -0.6292 0.7589 0.1185 0.1069 24.88

25.0 -0.6323 0.7360 0.1134 0.1155 24.37

27.5 -0.6294 0.7253 0.1112 0.1253 23.78

30.0 -0.6189 0.6954 0.1050 0.1390 23.56

Page 72: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 66

Tabla 2.4. Estimaciones MVcon anomalías en la muestra: modelo logit, caso 1.

A

dt(j%) ECM SSR0.0 -0.6540 1.0140 0.1940 0.0634 38.40

2.5 -0.6505 1.0020 0.1938 0.0622 38.73

5.0 -0.6252 0.9897 0.1924 0.0663 39.02

7.5 -0.6264 0.9513 0.1894 0.0667 39.35

10.0 -0.5893 0.9343 0.1869 0.0714 39.55

12.5 -0.5918 0.9111 0.1863 0.0741 39.89

15.0 -0.5838 0.9036 0.1850 0.0762 40.39

17.5 -0.5696 0.8170 0.1827 0.0839 40.20

20.0 -0.5574 0.8651 0.1815 0.0855 40.64

22.5 -0.5409 0.8253 0.1793 0.1043 41.08

25.0 -0.5328 0.8129 0.1777 0.1082 41.30

27.5 -0.5234 0.8148 0.1181 0.1057 41.59

30.0 -0.5111 0.7996 0.1774 0.1150 41.71

Tabla 2.5. Estimaciones MVcon anomalías en la muestra: modelo logit, caso 2A ¿

¿3, dt(¿%) ECM SSR

0.0 -0.6635 1.0360 0.1960 0.0133 38.54

2.5 -0.6003 0.9543 0.1887 0.0695 39.35

5.0 -0.5489 0.9043 0.1840 0.0761 40.24

7.5 -0.5134 0.8482 0.1805 0.1016 41.42

10.0 -0.4482 0.1874 0.1752 0.1398 42.21

12.5 -0.405 0.7407 0.1711 0.1751 42.95

15.0 -0.3556 0.6970 0.1682 0.2260 43.64

17.5 -0.3061 0.6520 0.1655 0.2840 44.28

20.0 -0.274 0.6022 0. 1625 0.3456 45.05

22.5 -0.2411 0.5714 0.1603 0.3932 45.54

25.0 -0.1995 0.5413 0.1584 0.4582 46.20

27.5 -0.149 0.4944 0.1557 0.5474 46.59

30.0 -0.1077 0.4683 0.1545 0.6181 47.24

Page 73: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 67

Tabla 2.6. Estimaciones MVcon anomalías en la muestra: modelo logit, caso 3

/3, dt(W) ECM SSR

0.0 -0.6611 1.0230 0.1952 0.0681 38.37

2.5 -0.6473 0.9407 0.1839 0.0785 38.23

5.0 -0.6506 0.8734 0.1712 0.0855 37.94

7.5 -0.6718 0.8243 0.1603 0.0973 37.37

10.0 -0.6627 0.8016 0.1520 0.1033 36.88

12.5 -0.6507 0.7467 0.1396 0.1220 36.87

15.0 -0.6539 0.7093 0.1295 0.1350 36.60

17.5 -0.6627 0.7059 0.1250 0.1406 35.87

20.0 -0.6413 0.6776 0.1172 0.1564 35.71

22.5 -0.6668 0.6478 0.1091 0.1728 35.50

25.0 -0.6628 0.6452 0.1057 0.1764 34.84

27.5 -0.6445 0.6254 0. 1006 0.1866 34.72

30.0 -0.6633 0.6195 0.0971 0.1901 34.12

Por último, se ilustra cómo los sesgos en la estimación de los parámetros del

modelo se traducen en que las probabilidades P4 también se estiman inconsistentemente.

La Figura 2.5 contiene las probabilidades estimadas con el modelo probit en el caso 3 para

valores de a’ = 0.0%, 15% y 30%. Obsérvese que estos sesgos también pueden ser

considerablemente altos. Además, las probabilidades estimadas son especialmente

importantes para realizar previsión agregada, lo puede dar lugar a errores de previsión

muyelevados.

Page 74: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: PLANTEAMIENTO Y CONSECUENCIAS 68

———————9, -9

xx-/ 9

99

/99

9

99

9

9/7

9/9

y9

.7’ / ___ ~< cok

9’ “‘ - — — St

— 9, ‘9’ -~ ——— ~ÁJ)— -9

—9

~I —5 —4 0 1 2

xi

1 00 -

0 2’ 5

051)

0 2-5

0.00

2 :t

Figura2.5: Ilustración del cálculode las probabilidadesestimadasen el Caso 3.

Page 75: Anomalias Del Modelo Lineal General

CAPÍTULO 3

OBSERVACIONES ANÓMALAS EN MODELOS DE

ELEcCIÓN BINARIA: DETECCIÓN

3.1. Introducción

En este capítulo se trata el problema de la detección de anomalías en los MEB.

Comose ha indicado en el Apartado 2.2.2, los resultados que se desarrollan se encuentran

en la línea de robustecerla metodologíade estimación, tal y como se propone en Box

(1980) y Peña y Ruiz-Castillo (1982 y 1984) para el caso de los modelos lineales de

regresión. Con este propósito, en este capítulo se derivan estadísticos o medidas de

influencia para la detección de anomalías en los MEB. Este es el primer paso para,

posteriormente, decidir el tratamiento más adecuado que debe darse a las observaciones

que se han detectado como anómalas.

Siguiendo este planteamiento, el primer objetivo de este trabajo es mostrar que,

contrariamente a lo que se ha propuesto en la mayoría de la literatura anterior, en los MEB

los análisis que se apoyan en los residuos, o en simples extrapolaciones de los resultados

para el modelo lineal general, no resultan adecuados. Ello se debe a que sólo se observa

una realización dicotómica de la variable dependiente, por lo que el vaLor de los residuos

está acotado y no proporciona información relevante sobre la probabilidad que tiene un

dato de ser anómalo.

En La Sección 3.2 se presenta una amplia batería de estadísticos generalmente

utilizados en la detección de observaciones anómalas en el modelo lineal general. Esto

sirve como fundamento de los principales resultados del capítulo.

En la Sección 3.3 se exponen las particularidades que presentan los MEBa la hora

de detectar observaciones anómalas e influyentes, y que hacen que no sea suficiente el

empleo de simples extrapolaciones de los resultados de la sección anterior.

Page 76: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DrECCIÓN 70

¡En la Sección 3.4 se deriva un estadístico de influencia aplicable a los MEBy se

discute su aplicabilidad, así como sus diferencias respecto a los expuestos en la

Sección 3.2. Además, se plantea la metodología que sería deseable aplicar a un MEBa

fin de determinar la presencia de observaciones influyentes.

Por último, en la Sección 3.5 se ilustran los resultados de la sección anterior

aplicándolos a un conjunto de datos simulados, como los que se utilizaron en la

Sección 2.4, con objeto de validar los estadísticos de la Sección 3.4.

Page 77: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DETECCIÓN 71

3.2. Instrumentos de detección en el MLG

En la Sección 2.3 se han presentado los problemas derivados de la presencia de

observaciones anómalas en los modelos de elección binaria. Antes de entrar en los

mecanismos de detección de anomalías específicos para los MEB, vamos a exponer los

principales resultados para el MLG, puesto que los resultados de la Sección 3.4 se basan,

parcialmente. en los de ésta.

En términos generales, existen dos medidas estadísticas básicas que, individualmen-

te y combinadas, permiten caracterizar la presencia de observaciones anómalas. En primer

lugar, las denominadas medidas a priori, que señalan los vectores de observaciones de

variables explicativas alejados del centro del espacio muestral de las X. En segundo lugar,

las medidas a posteriori, que ofrecen información sobre el efecto de cada observación (o

grupo de observaciones) sobre los resultados de estimación relevantes del modelo,

principalmente sobre los coeficientes estimados. Este segundo grupo de estadísticos son

los denominados estadísticosde influencia.

3.2.1. Instrumentos de diagnóstico a priori

Sea el modelo lineal de regresión:

y = Xj3 + e [3.2.1]

donde y es la variable endógena continua, X es la matriz de variables exógenas, ¿3 es el

vector de parámetros desconocidos y, por último, e es un vector de perturbaciones.

Sea II = X(XTXYIXT, la matriz de proyección en el modelo lineal general. La matrizU es idempotente y semidefinida positiva con rango(H) rango(X) = k, siendo su

elemento característico:

= {HÚ} = xJ(x?Xy¡x1 [3.2.2]

La matriz U puede utilizarse para analizar el efecto que cada observación tiene

sobre la variable y4 estimada. Dado que 5 = Uy, para una observación concreta se puede

plantear:

Page 78: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 72

II

y, = >3 h~y1 = >3 h0y1 + /14 y [3.2.31

La interpretación de la expresión anterior es que /14 (~ h~~) mide el efecto que tiene la y4

observada sobre la y4 ajustada.

También se puede interpretar h4 como una medida directa de distancia. Si se denota

por 3< la matriz X en diferencias respecto a las medias de cada columna, se puede definir

la distancia de cada vector de observación x4 al centro de las X como:

= (x4 ~iY¡iÑTXj(x, —i) [3.2.4]

de modo que es posible demostrar que [Peña(1987)]:

/14 = 1 1 + d.) [3.2.5]— (ti

esto es, fr es una transformación monótona de la distancia [3.2.4] de cada observación al

centro del espacio muestral de las X.

Es fácil demostrar que h4 tiene las dos propiedades siguientes:

un = =1[3.2.6]

>3 = 1<

por lo tanto, si una matriz X está perfectamente equilibrada, esto es, todas sus observacio-

nes tienen el mismo peso, se tendría que: /1, = k/nVi. De hecho, tal y como argumentan

Belsley et al. (1980), cuando h4 toma valores superiores a 2k/ti la observación en cuestión

requiere mayor atención y para valores superiores a 3k/ii se puede afirmar que la

observación es extrema respecto de las restantes observaciones en X.

En Belsley et al. (1980~ se sugiere el empleo de la matriz ampliada Z = [y Xl de

forma semejante a como se ha expuesto para la matriz X, con el fin de detectar

observaciones alejadas del centro de gravedad de Z. Este punto de vista añade la

consideración de y como fuente potencial de anomalías, como es el caso de observaciones

para las que x4 no presenta ningún problema pero y4 está muy alejado del centro de las y.

Las medidas de distancia [3.2.41o [3.2.Sj se pueden adaptar de forma inmediata a este

caso, con tan sólo sustituir 3< por Z.

Page 79: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 73

Adicionalmente. se aconseja el empleo del estadísticode Wilks [Belsley et al.

(1980, pag. 26)1 para contrastar la diferencia de medias entre dos poblaciones. En &

problema que nos ocupa, una población estaría definida por la observación ¡ y la otra por

el resto de los datos. El estadístico de Wilks puede plantearse:

W(±)= ~ —Ii) + ______ [3.2.7]

donde t~ es la fila ¡ de la matriz Z centrada respecto a la media y d~ es el residuo

estudentizadodefinido por:

e. — [3.2.81

1—

donde 5(1) es la desviación típica residual estimadaomitiendola observacióni. Suponiendo

que Z estáformadapor ti muestrasindependientesde una distribución normalk variante

(se estáexcluyendoel término constante)9,es posibledemostrarque:

n-k L-WQ) -e.Fkk [3.2.9]

k W(Z)

La particularizacióndel estadísticode Wilks para la matrizX resulta:

= ____ (1 —/1) [3.2.101n—l

y bajo supuestos equivalentes a los realizados anteriormente, es decir, que las filas de X

son muestrasaleatoriasde una normal k-1 variante (se está excluyendo el término

constante), se puede demostrar que:

k — 1 lVGe4) k-I,n-k-1 [3.2.111

Aunque los supuestos realizados para derivar las distribuciones de [3.2.9] y

[3.2.11] resultan un tanto restrictivos, la distribución es útil para obtener, al menos,

indicaciones de los valores críticos de los estadísticos propuestos.

Paraderivar la distribucióndel estadísticosepartedel supuestode queambaspoblacionescuyadiferenciade mediasse intentacontrastarsiguenunadistribuciónnormal,lo que obviamente,no es posibleparael términoconstante.

Page 80: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MES: DETEcCIÓN 74

Para terminar este apartado, conviene poner de relieve que los estadísticos

derivados no pueden considerarse,en ningún caso, concluyentessobre la posible

anormalidadde una observaciónen el sentidoestablecidoen el Capítulo2. Sin embargo,

sí presentaninformación relevantesobrela rarezarelativade la observacióncomparada

con las restantes,tanto de 3< como dey, lo que es un claro indicativo de que es necesario

prestarmayoratenciónal datoconcreto.

3.2.2. Estadísticos de influencia

La mayoríade los estadísticosque se presentanenesteapartadomidenel efecto

que tiene la eliminación de una observación(o un grupo de observaciones)sobre los

resultadosde la estimacióndel modelo, principalmente,sobreel vectorde coeficientesy

su matriz de covarianzas.

3.2.2.A. Algunos resultados previos

En primer lugar, se trata el problema de cómo evaluar eficientemente los elementos

de un modelo estimado por MCOcuando se elimina de la muestra un conjunto de

observaciones denotado por 1. De esta forma, se utiliza el subíndice 1 entre paréntesis (1)

para indicar que a una matriz le faltan las filas pertenecientes al conjunto 1, y el subíndice

1 sin paréntesis para indicar que la matriz está formada exclusivamente por las filas del

conjunto 1. Un primer resultado matemático, que va a utilizarse posteriormente, es el

denominadolema de inversiónde matricesque puede formularse:

(A +BCD>-’ = A’ - A’B(C” +DA”By’DA1 13.2.12]

donde A es una matriz mxm,Bes tnxk, Ceskxk,Deskxmy, además, A y C son no

singulares.

En el modelo lineal general es evidente que:

<3<rn - 3<T3< - 3<73<,[3.2.13]

X~y -

Con el fin de aplicar el lema de inversión de matrices a las expresiones anteriores, se hace:

Page 81: Anomalias Del Modelo Lineal General

OBsERVACIONES ANÓMALAS EN MEE: DETEcCIÓN 75

A =3<T3<

cl

B =X,. T

[3.2.14]

D=X,

donde p denota el número de filas de 3<,.

Aplicando (3.2.12] a la primera igualdad de [3.2.13], es inmediato que:

(X FX»~I + (xTÁQ-IXJJ — X(XTX)-IXÍ]X (XTX~’ [3.2.15]

Sustituyendo la expresión [3.2.15] en el estimador mínimo cuadrático de ¡3 sin el conjunto

1, y despejando, es sencillo demostrar que:

= ¡~ ~i- (X~’XY’X,[4 —X,(X~XY’X71 (X,fi ‘-y) [3.2.16]

Expresión que permite calcular la estimación MCOde ¡3 omitiendo el conjunto 1 de

observaciones a partir de la estimación con las ti observaciones muestrales.

También son de interés las siguientes definiciones. Se denomina vector de residuos

previstosal vector de residuoscalculadoa partir de estimacionesde ¡3 sin un conjuntode

observaciones,estoes:

= y — [3.2.17]

En particular, e1<,> es el vector de residuos previstos para el grupo de observaciones del

conjunto 1.

La matriz de proyección H, parael conjuntode observacionesomitidas resulta:

[3.2.18]H1= 3<(3<T3<)-I3<T

y la varianza residual estimada, sin las observacionespertenecientesa1, se puede calcular

como:

(ti —k —p)sJ, = (ti —k)s2 — e¡%

0(I~ —H)e«,~ [3.2.19]

donde s2 = eTe/n~k.

Page 82: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECcIÓN 76

3.2.2.B. Estadísticos de influencia: observaciones individuales

Los estadísticos de influencia y herramientas de diagnosis que se presentan a

continuación, se apoyan principalmente en los trabajos de Belsley et al. (1980), Krasker

et al. (1983). Peña (1987) y Atkinson (1985), así como en los artículos de Cook (1977)

y Cook y Weisberg (1980). En este apartado se considera el caso de eliminar una

observación cada vez, es decir, se presentan estadísticos que miden el efecto de una

observación en los resultados de estimación del modelo. La exposición que se presenta no

es exhaustiva, debido a la amplia batería de estadísticos que es posible derivar. Para una

revisión más completase puede consultar Belsley et al. (1980) o Cook y Weisberg (1982).

Se debe comenzar señalando que, en la diagnosis de un modelo, los residuos

grandeshan sido considerados como una indicación de problemas en la especificación del

mismo, puesto que indican una discrepancia entre el valor observado y estimado de la

variable endógena. De hecho, un mínimo análisis de diagnosis de un modelo consiste en

la inspección gráfica de los residuosestandarizados,que se pueden formular en términos

de Ji como:

y4 ‘-y, [3.2.20]e, — __________

s 1-Ji.

aunque algunos autores [Krasker et al. (1983)] prefieren utilizar los residuosestudentiza-dos, que emplean la desviación típica residual estimada sin la observación i:

e. = [3.2.21]s 1-Ji.

(4>

Estos residuos siguen una distribución t cuando la perturbación e, sigue una distribución

normal. Obsérvese que el empleo de la desviación típica residual estimada sin la

observación i, refuerza el efecto de anomalíasi el residuo correspondiente es grande, pero

no tendrá ninguna ventaja si el residuo es pequeño, puesto que la estimación de a apenas

cambiará.

Además del análisis de residuos, se puede plantear el estudio del efecto que produce

la observación ¿ en los valores ajustados. Más concretamente, se trata de medir cómo se

ve afectada la previsión del i-ésimo valor de la variable endógena cuando ésta ha sido

omitida en la estimación. Dicha medida es el residuo previsto definido en [3.2.17] que,

para la observación eliminada, puede escribirse:

Page 83: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 77

= y4 — y4(0 = y4 — x¿TI3<,~ 1i3.2.22i1

Dado que y4 e son independientes, la varianza de e4<1> es [Atkinson (1985)1:

u2[ 1 +x¡T(XJ?%yYIx.] = ~ [3.2.23]1 -h

Para estimar la varianza de la perturbación,Atkinson (1985) sugiereutilizar el estimadorsin la observación i, de forma que una medida de la discrepancia entre el valor observado

y el previsto, o lo que es lo mismo, el residuoprevisto estudentizadopara la i-ésima

observaciónresulta:

e1<,) = e4«> e- [3.2.24]

s<~ 11(1 — Ji)

que sigue una distribución ~ bajo el supuesto de normalidad para e,. Unainterpretación

interesante de (3.2.24] puede hacerse considerando que el residuo previsto estudentizado

es el residuo estandarizado corregido por el ratio de desviaciones típicas estimadas con y

sin la observación en cuestión. Este residuo es el que Belsley et al. (1980) denominan

RSTUDENT.

Sin embargo, el análisis de residuos tiene un interés limitado, puesto que la forma

más adecuada de analizar la influencia de una observación sobre las estimaciones de un

modelo de regresión se basa en comparar los resultados de la estimación con la muestra

completa y sin la observación objeto de interés. Esta comparación puede centrarse tanto

en la y ajustada como en los coeficientes estimados o en su matriz de varianzas y

covarianzas, aunque como se verá más adelante, los dos primeros ofrecen la misma

información.

Siguiendo a Belsley et al. (1980), una medida elemental se basa en comparar el

vector de coeficientes estimados con y sin la observación i-ésima. El estadístico

correspondiente se denomina DEBETA y se obtiene de forma inmediata a partir

de [3.2.16]:

(3<%4 x. e. [3.2.25]

1-Ji1

Alternativamente, se puede evaluar el efecto que tiene la observación i sobre el valor

ajustado de la observación j-ésima. Multiplicando la expresión anterior por xj resulta:

Page 84: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 78

= h~e

1 —Ji. [3.2.261

Un paso lógico a partir de [3.2.25] consiste en obtener una medida escalar, para

lo cual se normaliza la expresión por la matriz de varianzas-covarianzas y el número de

coeficientes en ¡3, lo que da lugar a:

(13 —1~ )T(3<T)<7)($ — ¡3<,)) [3.2.27]= kV

que es el estadístico propuesto por Cook (1977).

Una forma más conveniente para el cálculo de c4 puede derivarse sustituyendo la

expresión [3.2.161 en [3.2.27]. resultando:

e7 Ji4 — e~~2k [3.2.28]

ks2(1 /1)2 k(1 —/14)

que refleja la relación entre c4 y los residuos estandarizados de [3.2.20]. Una derivación

alternativa para e4 se obtiene evaluando la diferencia entre los vectores de valores ajustados

con y sin la observación /:

— Ñ¿]¼X(~ —

kV[3.2.29]

- (Y - 9)T(5 9

)

ks2

que puede interpretarse como una medida del efecto que se produce en el vector de valores

ajustados ante la ausencia de la i-ésima observación.

Atkinson (1985) sugiere el empleo del estadísticode Cook mocftficado,similar al

DFFITS de Belsley et al. (1980), que puede escribirse:

r 112

jk

¿4= 1—Ji4,] IeÍ(Úl [3.2.30j

Las diferencias entre el estadístico [3.2.30] frente al de [3.2.28], además de usar la raíz

cuadrada positiva, son las siguientes: i) para el caso en el que todas las observaciones de

la matriz 3< tienen idéntico peso (Ji, = k/n), resulta que t, = ¡ , por lo quela distancia

Page 85: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DETECCIÓN 79

entre las estimacionesse debeal vector y, y u) el empleo de s<~ en lugar de s como

estimaciónde rs, así comoutilizar e4~ en vezde e,comoen el estadísticooriginal, refuerza

el efecto de la anomalía si el residuo es grande. La ventaja de estas modificaciones es que

el estadístico resultante concede más peso a las observaciones anómalas que c,.

El estadístico de Cook formulado en [3.2.27] tiene una clara interpretación

geométrica: la magnitud de la distancia entre las estimaciones de ¡3 puede evaluarse

comparando c4 con las probabilidades de la distribuciónTknk centrada. Por ejemplo, si

= Ek~k(O.5), significa que la eliminación de la observación i desplaza la estimación

mínimo cuadrática de ¡3 a la frontera de la elipse de confianza del 50%, lo que resulta un

cambio apreciable. Cook (1977) sugiere que, idealmente, ninguna observación debería

provocar un desplazamiento superior al 10%.

Otro aspecto relevante en la estimación de un modelo, es la matriz de varianzas de

los coeficientes, donde también quedarán reflejados los efectos de la presencia de

observacionesanómalasen la muestra. Más concretamente,una medida de influencia

podríaobtenerseevaluandoel cambioen la regiónde confianzadel 1-a cuandoseeliminauna observación.El volumendel elipsoidede confianzaesproporcionalal determinante

de la matriz de covarianzas,lo que puedeexpresarsecomo:

Eec _____ [3.2.31]

y cuandoseelimina la i-ésima observación,el volumen resulta:

2k ]l}2

‘x S0 ¡ [3.2.32]

L jBelsley et al. (1980) denominanCOVRATIO al estadístico:

COVRATIO = [i%~] 2 - s21 1-Ji. [3.2.33]

y tomandoel logaritmo de COVRATIOse obtiene una medida que toma el valor nulo

cuandoel volumenno seha visto afectadopor la eliminaciónde i. Evaluandoel estadístico[3.2.33]parasituacionesconcretas,Belsley etal. (1980,pag. 22) determinanunosvalores

críticos para COVRATÍO , considerandoque una observacióntiene un efectoapreciablesíel estadísticocae fuera del intervalo 1 + 3k/ii. Cook y Weisberg (1980) utilizan el

Page 86: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DEmCCIÓN 80

logaritmo del COVRATÍO, pero ajustadopor los valores de la distribución E de la

definición de la región de confianza.

Por último, Peña(1987) presentauna medidaglobal de la robustezdel modeloque

denominacoeficientede robustez,y que puededefinirse:

e,7 1-’= >3 ej«~ Ln — (k + t) 52(1. hVj [3.2.34]

Es claro que B2 estáacotadoentrecero y uno, de forma que tomarávalorespróximos a

la unidad cuandolos valores ajustados9~<~ esténpróximos a ~,, y se aproximaráa cerocuantomayor sea la diferenciaquepresenten,es decir, cuandomásafectadosesténpor laeliminación de la observaciones.

3.2.2.0. Estadísticos de diagnóstica: grupas y otras extensiones

En general, no es complicado extender los estadísticos presentados en el apartado

anterior al caso en que se desea medir el efecto que se produce cuando se eliminan grupos

de observaciones. La dificultad estriba en que los criterios de selección de grupos no son

únicos ni concluyentes. En el peor de los casos, sería necesario decidir un tamaño máximo

de grupo e ir probando con todos los grupos posibles de tamaño menor o igual al máximo

lo que, obviamente, sólo es posible en muestras relativamente pequeñas y para tamaños

máximos reducidos. En este apartado, se generalizan los estadísticos del Apanado3.2.2.Bpara el caso en que se eliminan grupos de observaciones y en el Apartado 3.2.2.D se

presentan algunos resultados para tratar el problema del enmascaramiento.

Uno de los mayores inconvenientes al tratar con grupos de observaciones, es que

algunas de las magnitudes escalares expuestas para una sola observación se convierten en

vectoriales o matriciales; esto ocurre, por ejemplo, con el estadístico Ji,. Para transformar

una matriz como U, en [3.2.18] en una medida escalar, Cook y Weisberg (1980, 1982)

proponen emplear la traza; otra alternativa [Atkinson (1985)] seria emplear el determinan-

te. Esta multiplicidad de definiciones refleja el hecho de que la idea de peso en la

estimación no es tan clara cuando se trata con grupos de observaciones.

La extensión de los estadísticos de influencia del apartado anterior a casos de

eliminación de grupos de variables es inmediata, utilizando los resultados del Aparta-

Page 87: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DETECCIÓN 81

do 3.2.2.A. En particular, a partir de [3.2.16] la influencia de un conjunto de observacio-

nes puede evaluarse utilizando:

(lAc 1’) (3< ‘Y) (ÑO - 13

)

kV

[3.2.35]

4(1 — H,Y’H1 (I~

kV

estadísticosimilar al de las ecuaciones [3.2.27] y [3.2.30]. Si en lugar de ~2 se emplea sJ>ylos residuosprevistos e,<0, se obtendría un estadístico modificado similar al de [3.2.30].

Un modo alternativo de calcular c, de forma aproximada puede derivarse a partir

de la matriz de influenciaM [Peñay Yohai (1991)1, que seobtieneevaluandoel efectoconjuntode la eliminaciónsimultáneade las observacionesi-ésima yj-ésimade la muestray cuyo elementogenéricoes:

9)T(9 -9~,)

cefi.. [3.2.36]

ti)

ks2(1 —/13(1—Ji)

donde9«> e 9~ son los vectores de valoresajustadoseliminado las observaciones¡ y jrespectivamentey Ji

1) son los elementosde la matrizHdefinidosen [3.2.2]. Nóteseque ladiagonal principal de M estáformadapor el estadísticode Cook de [3.2.28] paracada

observación.

Basándoseen el comportamientode la función de influencia teórica, Peña y

Yohai (1991)sugierenque una forma aproximadade evaluarc1 es:

= >3 >3 m~, [3.2.37]¿El jEl

Otra extensióninmediata,consisteen particularizarlas expresionesanteriorespara

parámetrosindividualeso conjuntosde parámetros.De hecho,el análisisde influencia enconjuntosde parámetroses unade las extensionesmásinteresantes,sobretodo cuandoelconjuntode variables puededividirse en grupos de forma natural. Por ejemplo, en un

modelo lineal, dondelos coeficientesde las variablesson de mayorinterésque el términoconstante,o en modelosde eleccióndiscreta, dondepuededistinguirseentrevariables

característicasdel individuo y variables característicasde la alternativa.

Page 88: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DETECCIÓN 82

La particularizaciónde las expresionesgeneralesanteriores,puedeplantearsede

la siguienteforma [Cook y Weisberg(1980), Atkinson (1985)]. Se puedesuponerque el

conjuntode parámetrosde interéssonm elementosque secorrespondencon las filas delvector O R’1’3, donde RT es una matriz mxk de constantesconocidas, con ran-go(R) = ni =k. La matriz de varianzasde la estimaciónpor mínimoscuadradosde O es

o2RT (XTXVR. Por tanto, una medidade influenciaanálogaal estadísticoen [3.2.35]para

estecaso es:

ce(O) = (& — &)T[RT(X%IR]’(& — [3.2.38]mV

que tambiénpuedeexpresarse:

c/O) e/YI — H)-~X1NX2\I~— H)-

1e, [3.2.39]m

donde:

N = (X%-IR[RT(X%-IRIIRT(XLXYA [3.2.40]

El efectode eliminar unasolaobservaciónsobre O puedeescribirse:

.2 T

c4(O) = e, X, Nx~ [3.2.41]m(1 -Ji)

que es sencillo de calcular, puestoque N no dependede la observacióneliminada.

Un caso particular interesante, se produce cuando se analiza un grupo de

parámetros,por ejemplo, los últimos m componentesdel vector ¡3. En esecaso:

R 193 = (

0,n>«k-,n> ‘ni) ¡3 = <¡3k-ni. 0k) [3.2.42]

y el estadísticode [3.2.39] puedeescribirse[Atkinson (1985)]:

k ei’(I~c1(O) = — — H,jy

1G, (1 — [3.2.43]ni mV

donde U1 = X,(X,TX4(3<, es la matriz de proyecciónsobrelas últimas m variables del

modelo.Cuandosólo seelimina unaobservación,laexpresión[3.2.43] puedereducirsea:

Page 89: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DETECCIÓN 83

c(6) — e42 (/1¿ — g) [3.2.44]

mV (1 —Ji)2

dondeg, es el elementoi-ésimo de la diagonalprincipal de ¿EJ,.

Para e! casode un modelo de regresión,el estadísticopara todos los parámetros

exceptola constante,queda:

c1(6) — e4~

2 (Ji4 — un) [3.2.45]

Finalmente,esposibleparticularizarla mayoríade los estadísticosplanteadosparaanalizar la influencia sobreun sólo parámetro.En estecaso particular RT(XTXYIR=

esto es, el elementoj-ésimo de la diagonalprincipal de la matriz de varianzasde (3. Elestadísticode Cook resulta:

c.(i3.) — ~ [3.2.46]25 1)-

Naturalmente,estasformulacionespuedenmodificarseen el sentidode la expresión[3.2.30], introduciendoel estimadorde la varianzaresidualcon la observaciónomitiday

diferentesdefinicionesde residuo.

3.2.2. D. Algunos tratamientos para el problema del enmascaramiento

El problema de enmascaramientose produce la muestra incluye un grupo de

observacionestalesquesu influenciaconjuntadisimulael efectoindividual de cadaunadeellas, provocandoque éste no sea detectadomedianteel uso de los estadísticosque

analizanunaobservacióncadavez. Estaclasedegruposde observacionespuedenpresentarpatronesbien distintos, comose ilustrabaen la Figura 2.2.

Los estadísticosparagrupos,derivadosen el Apartado3.2.2.C,puedenutilizarse

paraanalizarla influenciade cualquierconjuntodeobservaciones.La dificultadestribaendeterminareficientementelos gruposcuya influenciasepretendemedir, entendiendopor

eficientecualquiermétodoque, proporcionando[osresultadosperseguidos,no requierala

Page 90: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 84

exploraciónexhaustivade todos los gruposde distintostamañosposiblesde observaciones.

A continuaciónseexponenbrevementedosestrategiaspara tratar el problemasiguiendolos planteamientosde Peñay Yohai (1991> y Rousseeuwy van Zomeren (1990>.

El métodopropuestopor Peñay Yohai (1991)sebasaen la matriz M definidaen

[3.2.39] y sejustifica medianteun argumentoheurístico. El planteamientoprácticoesel

siguiente:

Paso1: Calcular los autovectorescorrespondientesa los k autovaloresno nulos de la

matriz de influenciaM.

Paso2: Utilizando los autovectoresasociadosa los m mayoresautovalores,seleccionar

los paresde conjuntosde observacionesQ y ¼]= 1 m =k, incluyendoen

cadauno de ellos las observacionescuyo componentedel autovectorsea grande

y positivo o negativo, respectivamente.

Paso3: Empleandolos estadísticosparaevaluarla influenciade gruposde observaciones,determinarlos grupos de observacionesinfluyentes.

En Peña y Yohai (1991) se aplica el método a diversos conjuntos de datos ya

utilizados en la literatura y se pone en evidenciaque estemétodo permite seleccionar

eficientementegrupos de observacionesinfluyentesque pasandesapercibidosal emplear

estadísticosde influenciaindividual y con un costecomputacionalmuy inferior al de otros

métodospropuestosen la literatura. Convieneponerde relive que el costede cálculo no

es alto puestoque: i) existenalgoritmoseficientesespecíficospara evaluar los mayoresautovaloresde un matriz real simétrica,por lo que no es necesarioevaluarlostodos’0, y

u) no esnecesarioalmacenaren la memoriadel ordenadortodalas matricesM y H, puesto

que los elementos mu pueden ser evaluadosa medida que sean necesitadossi laslimitacionesde espaciolo exigen.

Rousseeuwy van Zomeren(1990)planteanuna estrategiacompletamentedistinta,

basadaen la búsquedade elipsoidesde confianzade volumenmínimo. La ideabásicaes

caracterizarun elipsoide tal que, minimizando el volumen, deje fuera a un número

reducidode observaciones.Aunquees un planteamientoatractivo,el mayorinconveniente

se debea que resultamuy costosoen términosde cálculo, ya que paratener la seguridad

~ Una revisión de algoritmos para el cálculo de autovalores y autovectores para distintas matrices puede

verse en Raiston y Rabinowitz (1978, cap. 10) y código eficiente para realizar los cálculos puede encontrarse enSmith et al. (1974).

Page 91: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 85

de que se ha encontradoel elipsoide óptimo es necesariollevar a cabo una búsquedaexhaustivaen el espaciode variablesexplicativas[Véasela discusiónquesigueal artículo].

Page 92: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECcIÓN 86

3.3. El problema de la detección de anomalías en MEB: elanálisis de residuos

A pesar del planteamientoteórico desarrolladoen la Sección2.3, en la práctica,

no se sabea priori si existenobservacionesanómalasen la muestra,ni muchomenoscuál

es la distribuciónque las hagenerado.Por lo tanto, al igual queen los modeloslineales,

la formahabitualde detectarla presenciade estasobservacionesesmediantela inspección

de los datos muestrales,de maneraque un datoseconsideraanómalosi espoco probable

quehayasido generadopor la distribuciónquesesuponeparalas restantesobservaciones.

Sin embargo,el análisis para la detecciónde anomalíasen los MEB presentaalgunas

peculiaridadesrespectoa los modeloslinealesde regresión.Ello sedebea queen un MIER

sólo seobservauna realizacióndicotómicade la variabledependientey4

El objetivo de esta sección es mostrar que en el proceso de detección de

observacionesanómalasen los MEB, los residuosno jueganel mismo papel que en los

modelos lineales. Ello sedebea que en un modelo de variablede eleccióncualitativa el

valor de los residuosestáacotadocomo consecuenciade la censura que presentala

variable y~ , de la que sólo se sabesi es mayor o menorque cero.

Definiendoel residuocorrespondientea la observacióni-ésimacomo la diferencia

entrey4 y P4, tal y comoseha indicadoen el Apanado 2.3.2:

e4 = y — [3.3.1]

dondeE(e4) = O y 1’(e) = ¡‘4(1 — Pi>. A partir de [3.3.1]esobvio quee estáacotadoentre

(~1,l)1í pudiendotomar, paracadaobservación,solamentedosvalores: (1 — P4) y —P.

En Pregibon(1981),dondese trataporprimeravezel problemade la detecciónde

observacionesanómalasen los MEB, seconsideracomoanomalíatodaobservaciónque,

unavez estimadoel modelo,presentaun residuoe, próximoa launidaden valor absoluto.

En consecuencia,en el citadotrabajoseproponeel análisisde residuoscomo un elemento

de diagnosis para la detección de valores anómalosy se analizan los efectosen los

coeficientesestimadosasícomoalgunosestadísticosbasadosen los residuose, estandariza-

dos. En el contexto del trabajo citado, esto tiene bastantesentido, ya que se trata,

11En el modelo lineal de probabilidad el intervalo es cerrado puesto que puede haber residuos iguales a uno

en valor absoluto. Sin embargo, dado que este modelo se utiliza escasamente en la práctica, no se considera estecaso particular.

Page 93: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 87

principalmente,de observacionesagrupadasy modelos linealesgeneralizados,en los quelos residuosno planteanlas mismasdificultadesque en los MEB.

Posteriormenteeste análisis se extiende,entreotros, por Williams (1987), queplanteaestadísticosde diagnósticogeneralespara modeloslinealesgeneralizadosa partir

de los resultadosde Pregibon (1981) y utiliza un enfoquede análisis de influencia.

Copas(1988)analizalos modelosbinariosbajo el supuestode queaparecenerroresen los

datos, como por ejemplo, de codificación. Bedrick y Hill (1990) planteanun enfoquealternativo para modelos logit, pero tambiénbasadoen el análisis de influyencia. El

principal inconveniente del análisis de influencia se encuentra en que se plantean

situacionesexcesivamentepuras, que, en muchoscasos, no reflejan la realidadde losdatos, donde lo frecuentees que aparezcangrupos de observacionesdiferentes de lamayoríade la muestray que puedenalterarapreciablementelos resultadosdel análisis.

Respectoal empleode los residuosen modelosde elecciónbinaria, Jennings(1986)

critica el trabajode Pregibon(1981), señalandolos puntossiguientes:i) los residuose4 nosoncomparablesa los residuosMCO, ya que cadae4 dependede x< a través de P, por loquecadaresiduotiene unadistribución únicay los residuosestandarizadosno siguenuna

distribuciónnormaly, u) eliminar de la muestradatosconun residuopróximo a la unidaden valor absolutoequivalea truncarla muestrapor unasolacola, conel consiguientesesgo

en la estimaciónde los parámetros.En estesentido,paraJennings“... las anomalíassonnecesarias...

En relación con la discusión anterior, nuestro punto de vista es que si una

observaciónpresentaun residuoe, próximo a uno en valor absoluto, simplementequieredecir que la P(y4=j x4) < a, donde] = 0, 1 y a es pequeño;esto es, que el valor que

toma y1 en la muestraespocoprobable. Pero no quieredecir que se trate necesariamentede una observaciónanómala, puede ocurrir que y4 se encuentreen las colas de la

distribución. Por consiguiente, estamos de acuerdo con Jennings en que no debeneliminarsede la muestralas observacionesatendiendoexclusivamentea que el residuo

correspondientese encuentrecercanoa uno en valor absoluto, pero no porque “lasanomalíassean necesarias”,sino porque es posible que estas observacionesno sean

anómalas.

La afirmaciónanteriorpuedeilustrarsemediantela Figura3.1, dondeseconsiderael caso del modelo probit. La parte inferior de la figura contienela nube de puntos

(y1t 4) (en estecaso,x4 = (1 x4)’) asociadaal modelo [1.2.7]y la correspondienterectateórica. En la partesuperiorde la figura se han trasladadoal eje de abscisaslos valores

Page 94: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB DErEcCION 88

—t 0 2 23

Figura 3.1: Ejemplos de anomalías en un modelo probit.

de la rectateóricax¡fi, mientrasqueen el eje de ordenadasse representanlas probabilida-desteóricasP, y los valoresobservadosde y4. LasprobabilidadesE’, seobtienenevaluandola función de distribución normal estándar en 4’í3, mientras que los valores de y4

respondena la relación [1.2.2]. El problema es que la muestradisponible para la

estimacióndel modelo está formadasolamentepor los pares (y4, x5, por lo que no se

observala nube de puntos de la parte inferior de la figura. Entonces,puedendarse las

siguientessituaciones:

• Consideremosel puntoC en la parteinferior de la Figura,correspondientea unvalor negativodex1 y a un valor muy grandey positivode ». En el casode unmodelolineal, dondeobservásemosYc’ estepuntopresentaríaun residuogrande

y positivo, por lo queconsideraríamosconunaprobabilidadaltaque se trata deun dato anómalo. Sin embargo,en el caso de un modeloprobit, la realizaciónde Yc > O es y< = 1, por lo que el correspondienteresiduo e4 serápositivo ycon un valor próximo a 1.

Page 95: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MES: DETECCIÓN 89

• Consideremosahorael punto D, dondeparael mismo valor negativode x4, elvalor de y, es negativo y está a la mismadistanciade la recta teórica que elpuntoC. Igual queantes,si observásemosYD’ estepuntopresentaríaun residuo

grandeaunquenegativo. No obstante,el residuo e4 que obtenemos,una vezestimadoel modelo, seriamuy próximoacero,puestoque, en estecaso,y~ = Oal ser y13 < O.

Con esteejemplo, se trata de ilustrar que dos observacionesigualmenteanómalas

puedenpresentar,dependiendodel signo de la variable no observabley1 un residuopróximo a uno o a cero. Sin ignorar que, en estos modelos,unaanomalíadel tipo C es,por lo general, más peligrosa que una del tipo D, se pueden extraer las siguientes

conclusiones:

• Que unaobservacióní tenga un residuopróximo a cero no implica que no se

trate de unaobservaciónanómala.En el casomássimple de una solavariableexplicativa, observacionescon x, < O e y1~ < O ó x1 > O e y1~ > O puedenpresentarun residuo muy pequeñoy ser realmenteanómalas,comoes el casodel punto D en la Figura 3.1. Nóteseque en un modelo lineal tambiénpuedehaber observacionesanómalascon un residuo próximo a cero, pero dichasanomalíasno son del tipo D, que podríadetectarsefácilmentepor su residuosi

se observasey1,

• Que una observacióntenga un residuopróximo a la unidad en valor absoluto

puedeser un indicio de que se tratade una observaciónanómala,pero no tieneque ser necesariamenteasí. Por ejemplo,una vez estimadoel modeloprobit, elpuntoE de la Figura3.1 presentaríaun residuo e4 positivo y próximo a uno (de

hecho, idéntico al del punto C) aunque,en este caso, si se observaseYE nohabríarazón parapensarque se trata de un dato anómalo.

En definitiva, los residuosresultantesde la estimaciónde un modeloprobit, o decualquierotroMEB, no son informativossobrela probabilidadquetienecadaobservación

de ser anómala.Comoseacabade ilustrar, residuospróximos en valor absolutoa uno oa cero pueden correspondertanto a observacionesanómalas como a observaciones

generadaspor el modelo considerado.Esta es la mayor diferenciaque presentanestosmodelosrespectoa los modeloslineales,dondeel análisisde residuosno permitedetectartodo tipo de anomalías(sólo las del tipo A de la Figura 2.1), pero donde un residuograndesí presentaevidenciade que el correspondientedatopuedeser anómalo.

Page 96: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 90

Por último, hay que señalar que, aunque el análisis de residuos no sea elInstrumentoadecuadopara la detecciónde anómalosen los MEB, dicho análisis puederesultarde interésparadetectarotros problemas.En una muestradada,cabeesperarque

un porcentajepequeñode observacionespresenteun residuopróximoa la unidaden valorabsoluto, seano no anómalas.Si esteporcentajees elevadopuededebersea una de las

siguientescausas:Ó a un error de especificación,en el sentidode que las variablesen x-no son relevantespara explicar la variabley4’ y, por tanto, las probabilidadesE’, y, u) a

la existencia,al menos,de dos grupos distintosde individuosen la muestra(la noción decambioestructural), que debe identificarsey modelizarsede la forma másadecuada.

Page 97: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 91

3.4. Procedimientos de detección de observaciones anóma-las en los MEB

De la exposición en la secciónanterior, se deduceque la forma adecuadaparadetectarsi unaobservaciónes anómalaen un MEB, debeser medianteun estadísticoquemida el efectode esaobservaciónsobre la estimaciónMV de los parámetrosdel modelo.

Comose ha demostradoen el Capítulo2, la existenciade observacionesanómalasgeneraun error de especificaciónen la funciónde verosimilitud del modelo, que puedeconducira sesgosen La estimaciónde los parámetros.Por lo tanto, si el efectode una observaciónen el valor de los coeficientesestimadosesgrande,dichoefectopuedeconsiderarsecomo

unamedidadel sesgode estimaciónprovocadopor la presenciade esaobservaciónen lamuestra.

En esta sección,se deriva un conjuntode estadísticosque miden la influenciadeobservacionesindividualeso gruposde observacionessobrelos dosaspectosfundamentalesdel modelo: los parámetrosy las probabilidadesestimadas.La estrategiageneralde estas

derivacionesutiliza el modelo linealizado [1.3.10] y el estimadormáximo-verosímilporprocedimientos lineales [1.3.9], y se aplican los planteamientosgenerales de los

estadísticospara el modelo lineal general de la Sección 3.4 teniendo en cuenta lasparticularidadesde los MEB, que hacenque no todos los resultadosanterioresseande

aplicación inmediata.

En concreto, el procedimientode estimaciónmáximo-verosímil lineal permiteevaluar,con un costede cálculo reducido, las estimacionesde los parámetroscuandose

elimina un conjuntode observaciones,imprescindibleparapoderutilizar los estadísticoscuandola muestracon la que se trabajaes de gran tamaña.

3.4.1. Estadísticos para la detección de observaciones anómalas enlos modelos de elección binaria

El estadísticoqueproponemosa continuaciónes unaadaptacióndel presentadoen

[3.2.27]y mide el efectode cadaobservaciónsobre la estimaciónMV de /3 en el modelo[1.2.7]. Parasu derivación, se puedeutilizar el Teorema4.30 de White (1984,pag. 70):

Page 98: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 92

Seaun vector de variablesaleatoriasO de dimensiónk. Si O -*

dondeE es la matriz (kxk) de covarianzasasintóticade O, y existe unamatriz É simétrica y definida positiva tal que plim É = S~ enton-

ces OT2YIO~.xY

Por tanto, teniendoen cuentaque: i) el vector ¡3 de estimacionesMV sigue unadistribuciónasintóticanormalcon media¡3 y cuya matriz de covarianzaspuedeestimarsecon la inversade la matriz de información 1(13) ¡ en [1.3.5],y u) el procedimientoMV

garantizaque plim 1(13V’ = I(¡3Y’, se tiene que:

(¡3 - ¡3)T 7433 - ¡3) -* [3.4.1]

Entonces,denotandopor ¡3«} la estimaciónMV de ¡3 eliminando la observacióni-ésima,una medidade la distanciaentre 13 y 13«> vendrá dadapor el estadístico:

= (13 — 13y¡ (13 — 13<,.» [3.4.2]

Este estadístico,que es semejanteal que apareceen [3.2.27], proporcionauna

medidade la distanciaentre 13 y 13<~ en términosde nivelesde significación. Esto es, apartir del valor de ¿ y de la tabulaciónde la distribuciónXk, puededeterminarseen que

medidala eliminacióndel punto i desplazael vector de coeficientesestimadosdentro dela región de confianzade ¡3, calculadasobre 13, a un nivel de significación determinado.Por ejemplo, si ¿~ = 0.57 y k = 2, se puededecir que la eliminación de la observacióni-ésimadesplazala estimaciónde ¡3 hastael borde de la región de confianzade nivel 25 %

centradaen 13. Cook (1977)sugiere,sobrela basede experimentosrealizadosen modeloslineales,que es deseablequecada 13<..> seencuentredentro de la región de confianzadenivel 10%. Sin embargo,pensamosque lo importantede un estadísticode estetipo, no esla eleccióndel nivel de significaciónparael que se realizael contraste,sino el análisisde

las observacionespara las queel estadísticotoma un valor másalto en términosrelativos.Como es obvio, éstas serán las observacionescon una probabilidad más alta de seranómalas.

Para evaluar eficientementeel estadísticode [3.4.2], es necesarioemplearlas

expresionesdesarrolladasen el Apanado 3.2.2.A para el estimador por mínimoscuadradosordinarios cuandose elimina una observaciónde la muestra. En este caso,

dichas expresionesdeben aplicarse al modelo linealizado de [1.3.10]. Así, dadaunaestimaciónMV de ¡3 en la iteración r y una vez transformadaslas variables, resulta:

Page 99: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MER: DETECCIÓN 93

13<.> = 13 + (XTXykf.[ 1 — XTXV12~]4 (~T13 j~>

donde, tal y como se ha definido en la Sección1.3:

yi .4.f(x¡13~) —E4

•94 =

[3.4.3]

[3.4.4][171 É)iI1/2

- fi

= F(X/’13~)

[3.4.5]

= f(x~T13’> [3.4.6]

siendo X unamatriz cuyas filas vienendadaspor la expresión[3.4.5].

Sustituyendo[3.4.3] en [3.4.2] y teniendoen cuentaque:

1=xx

[3.4.7]e:— e.

[E’4(1 —

- ~7,

- y4 — x4 »

donde e4’ es el residuo estandarizadode un modelo de elección binaria, el estadístico[3.4.2]puedeescribirse:

e~2gT(~T~ylg

c. =

[1 ~X¡(XTXyIXjj

‘2

e, /2,

(1-kv[3.4.8]

quees unaexpresiónsimilar a [3.2.28],donde,en general,hq =t(kTXY~< y/i41~F4.

A pesarde la similitud conlos estadísticosde influenciaderivadosparael modelo

lineal generalen la Sección3.2, el estadísticot~ presentaun conjuntode particularidadesque puedenresumirseen tres puntos:

• En primer lugar, el efectode la i-ésimaobservaciónno ha sido completamenteeliminado al utilizar la expresión[3.4.3], puestoque las variables han sido

transformadascon informaciónque dependede dichaobservación.Así, aunque

Page 100: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 94

estainformaciónno tengaun efectoimportante,tampocoel resultadoes idéntico

al de [3.2.18]. En estecaso, la expresión[3.4.3] puede interpretarsecomounpaso por el algoritmo de scoring en el que no se utiliza información de laobservación i-ésima. Es posible eliminar completamenteel efecto de laobservaciónen cuestióniterando hastala convergencia,aunqueen estecaso, elcostede cálculo del estadísticopuedeser demasiadoelevado.

• Parael modelo lineal general,se planteabauna discusión sobre qué residuosutilizar en los estadísticos.Comoseveía, numerososautoreshansugeridoel usodel residuo estudentizado.Aunque en estecasotambiénes posible definir losresiduosprevistosy estandarizarlos,la naturalezadiferente del modoen que seinterpretanlos residuoshaceque la discusiónseabastantemenosfructífera. Porun lado, debidoa que cadaresiduo tiene distinta varianzay, por otro, debidoa

que la evaluaciónde las funcionesF(•) y f(.) para 13<~ puedeser excesivamente

costosa.

• También para el modelo lineal se argumentabaque, en algunos casos, es

preferibleemplearestimadoresde la desviacióntípicaresidualqueno incluyesen

el residuo i-ésimo. En los MEB, estadiscusiónes improcedente,puestoque lavarianzade las perturbacionesestápredeterminada,debidoa las restriccionesdeidentificaciónexpuestasen la Sección1.2.

Es importante señalar que un estadísticosimilar al de la ecuación [3.4.8] se

proponeen Pregibon(1981). En estecaso,para su derivaciónse utiliza el algoritmo deNewton, en lugar del algoritmo de scoring, en el procesode estimaciónMV. Dado queel citado trabajo se restringe al caso particular de los modelos logit y que, con la

distribución logística, la expresión de la matriz hessianaen (1.3.4] se reduce a:-LA(1-A4)x/’x1, siendoA, la funciónde distribuciónlogísticaevaluadaen<¡3, el estadísticoanálogoa ¿ resultantetiene una expresiónsencilla. Sin embargo,esto no ocurre, por

ejemplo, con el modeloprobit, dondela utilización del hessianode [1.3.4], complicaríainnecesariamentela expresióndel estadístico.En estesentido,la expresiónen [3.4.8] es

considerablementemás general, ya que puedeaplicarsea cualquierMEB. Además, lamatriz de información evaluada en el óptimo, y no el hessiano, es la matriz queteóricamentedebeutilizarseparaestimarla matriz de covarianzasde ¡3 en el cálculode ¿~.

Otra ventajarespectoal planteamientode Pregibon(1981) es la mayor simplicidad

de cálculo en el procedimientolineal iterativo quesederiva del empleodel algoritmo de

scoring frente al de Newton. Green(1984) planteaun esquemade estimaciónbasadoen

Page 101: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 95

el algoritmo de scoring para aplicarlo a la familia de modelos lineales generalizados’2,aunqueno explota las característicasespecialesde los modelosbinarios.

En el Apartado3.2.2.B, al plantearmedidasde influenciaparaunaobservación,

se ha comprobadoque, en el MLG utilizando el estadísticoc4, es idéntico medir la

influenciapara el vectorde parámetrosestimadosque parael vector9. Paralos modelosbinariosesto no es cierto, por lo que es necesarioderivar un estadísticoespecíficoquemida la influenciasobre it el vectorde probabilidadesestimadas.Utilizandola expansiónde Taylor de primer orden en [1.3.15] para el caso en que se elimina la i-ésimaobservación,la probabilidadestimadasepuedeaproximar de la siguienteforma:

E(x1T13<,.>) F(x¡13) + f(x~T13)x/(13<.> — 13) 13.4.9]

A partir de [3.4.9], la diferenciaen la probabilidadestimadapara la observación

j al eliminar la observacióni-ésimapuedecalcularsecomo:

F(x713<,.>) F(x713) + f(x,T13)xjT(13<,.> — ¡3) [3.4.10]

y la diferenciaentre las probabilidadesestimadaspara toda la muestraresulta:

É’-t = —~Z’ X(fi<,.> —13) = ~+1~2 x ~ 13~ [3.4.11]

donde ~‘ y ‘4’ son matrices diagonalesde dimensión n con elementogenéricof y

É (1 — É,), respectivamente.

Por tanto, una medidade influenciasobre las probabilidadesestimadases:

¿/P) =(É — F7(É —

2’ [3.4.12]e4 /24

(1 ~/z)2

donde,en general:

/r = .f.T(XTÑE1(X’4~Ñ)(XTXVILT y /24 /2,4 [3.4.13]

12 Green (1984) denomina a este algoriuiio Míninws Cuadrados Ponderados Iterativos. Estrictamente,

sugiere la palabra reponderados (reweighted), pero parece que esa noción ya se encuentra implicira en la palabraiterativos.

Page 102: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MES: DETECCIÓN 96

La diferencia entreel estadístico[3.4.121y [3.4.81 se encuentraen la matriz 4’,

y la interpretaciónes que, en un modelo no lineal, el cambioen los argumentosde lafunción no tiene por qué ser igual que la variaciónen la función. Más concretamente,lo

que indica la expresión[3.4.131 es queel cambioen las probabilidadesestimadasno sólodependedel cambioen los parámetros,sino de la situación inicial de dichaprobabilidad,

síendomayorel cambiocuantomáspróxima seencuentrea05. Es importanteseñalarqueel empleodel estadístico[3.4.14]es especialmenteimportanteen situacionesen las queel objetivo sea realizarprevisionesagregadasparapoblacionesgrandes.

La conclusiónde esteapartadoes que el conjunto de particularidadesreseñadas,

tanto referentesa los estadísticosquemidenel efectode observacionesindividuales,comosobre el comportamientogeneralde los MEB en lo referentea observacionesanómalas,

hacen que la extrapolación de resultados para modelos lineales o modelos linealesgeneralizadosseaclaramenteinsuficienteparaarrojaralgunaluz sobreel problemaquenos

ocupa.La principal deficienciade la mayoríade la literaturaexistentesobreel problemade las observacionesanómalasen los MEB, es que tratadel mismo modotodo el conjunto

de modeloslinealesgeneralizados,sin considerarlos casosespeciales,y estasituaciónesla que hacemásdifícil la aplicaciónde los métodosa los datosobjeto de análisis.

3.4.2. Estadísticos de influencia: grupos de observaciones y otroscasos particulares

Comose ha expuestoen el Apartado 3.4.1, a partir de la linealizacióndel modelo

binario [1.3.10],se puedenderivarestadísticosde influencia individual semejantesa losdesarrolladospara el MLG en la Sección 3.2. Siguiendo en esta línea, es posibleparticularizarlos resultadosanterioresa situacionesen las que seeliminan conjuntosde

observaciones,asícomoevaluarel efectode dichasobservacionesparaun subconjuntodelos parámetrosdel modelo.

Una iteración por el algoritmo de scoring eliminando la información de las

observacionesdel conjunto1 puedeplantearsecomo:

¡3<,.> = 13 + (X~XV’X,11~ —X,ÚtTZ’Ñ1

TJ (X1¡3 ..j,) [3.4.14]

dondeX e Y estánformadaspor lasobservacionestransformadascomoen [3.4.41-(3.4.5].La inversade la matriz de información resulta:

Page 103: Anomalias Del Modelo Lineal General

OBSEAVACIONES ANÓMALAS EN MEB: DETECCIÓN 97

(XTX)-’ = (XTX)-’ + (xTxyix¡[I .g(gr1gylgTfg(grgy [3.4.15]

En lasexpresiones[3.4.14]y [3.4.15],no sehaeliminadocompletamenteel efectodel conjuntode observacionesen 1 y sepodría iterar hastala convergencia.No obstante,

si las observacioneseliminadasno son influyentes, dichoprocesoiterativo no introduciría

variacionesimportantes.Por el contrario,si el efectodel conjuntoesrelevante,la iteraciónposterior reforzaríael efectode anomalíade la observación.Dado que para muestrasdegran tamaño, las consideracionesde tiempo de cálculo son importantes, no resultanecesariocontinuar el procesoiterativo, excepto, tal vez, en situacionesdudosas.Dehecho,no iterarhacemásrobustoel estadísticoante la posibilidadde rechazarobservacio-

nes no anómalasaunque,en cambio, reducela probabilidadde detectaruna observaciónanómala.

A partirde [3.4.14], la influenciade un conjuntode observacionespuedeevaluarseutilizando un estadísticosimilar a [3.2.35], quepuedeplantearse:

= (13 ¡P(XTÑM13 —7s~

[3.4.16]= e,T(I~ —I%)’Ñ

1(1~ —Ñ1y’e,

donde Ñ1 = X1(XÑXy’X,.

También en los MEB se puededefinir una matriz de influencia semejantea lamatriz M en [3.2.39], que puede emplearsepara evaluar de forma aproximadael

estadístico[3.4.161,así como paradetectar observacionesque presentanproblemasdeenmascaramiento.En este caso,el elementogenéricoresulta:

e4 ~ h..1». = __________ [3.4.17]

(1—h,$1—Jt»)

quedebeinterpretarseen términos de los valoresajustadosde la variableendógena94 en

el MEB linealizado.Nóteseque la diagonalprincipal de Al estáformadapor el estadísticode [3.4.8] paracadaobservación.

De maneraanálogaa comoseplanteóparael estadístico[3.4.8],esposibleobtener

expresionesalternativaspara [3.4.16] y [3.4.17]basadasen medir el cambio en lasprobabilidadesestimadas, en lugar de evaluar la diferencia entre los vectores de

parámetros. En particular, la matriz de influencia alternativa tiene como elemento

genérico:

Page 104: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 98

(3.4.191

donde/r estádefinido en [3.4.14].

Como se puso de relieve en la Sección3.2, es convenientederivar expresionesparticularespara evaluarla influenciade grupos de observacionessobre un subconjuntode los parámetrosdel modelo. El interéssecentraen m elementosque se corresponden

con las filas del vector O = RTIS, dondeRT es unamatriz mxk de constantesconocidas,con rango(R) = m =k. La matriz de varianzasde la estimaciónmáximo-verosímilde O

es R ‘iI(13W’R. Unamedidade influenciaanálogaal estadísticoen [3.4.16]aplicadaa una

combinaciónlineal de los parámetrosoriginales es:

= (&<~ — &)T[RT(XTXyIRj’(&<~ — [3.4.20]

= e,.’~(1~ — ÑIXÑXT(í Ñyle

donde:

Ñ = (X’XV’ R[RT(9 TXY’R$’R T(X TXy’ [3.4.21]

En particular, el efectode eliminar unasola observaciónsobre O puedeescribirse:él(O) = e

12.4Ñ2. [3.4.22]

(1 —h4)2

que essencillo de calcular puestoque Ñ no dependede la observacióneliminada.

En los MEB es frecuentela presenciade un cierto númerode variablescualitativas

entre las variablesexógenas,por lo que, en muchasocasioneses interesantemedir elefectode un grupo de observacionessobre un subeonjuntode parámetros.Sin pérdidade

generalidad,se puedesuponerque los parámetrosde interésson los últimos m componen-

tes del vector ¡3. En esecaso:

R T¡3 = (Q,x(k-m) 1) ¡3 = (&-n.+ ¡3k) [3.4.23]

El estadístico[3.4.201puedeescribirse:

Page 105: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB DETECCIÓN 99

¿t1(O) = c1 — e1 ~(I,,— Ñy’C, (I~ — [3.4.24]

donde C1 = X}ÑJX,)-’X2, y 1K, es la submatrizformada por las últimas m columnas

de X. Cuandosóloseelimina unaobservación,la expresiónanteriorquedasimplificadaa:

¿4(0) = e4~2(h

4—g~) [3.4.25](1 -kV

dondeg1, es el elemento¡-ésimode la diagonalprincipal de G,.

El estadístico[3.4.8] puedeparticularizarseparael casoen que sedeseemedir elefectode unaobservaciónen la estimaciónde un parámetrof3~ del vector¡3. Denotandopory, el elementoj-ésimo de la diagonal principal de la matriz ‘(13V’, es inmediato que elestadístico:

¿(fi) = — 0)2 [3.4.26]1’.

proporcionauna medidadel desplazamientoqueexperimentala estimacióndel coeficiente

3~ cuandoseelimina de la muestrala observacióni-ésima.

3.4.3. Detección de observaciones influyentes en MEB

A partir de la exposiciónde las Secciones3.2 y 3.3, así como los estadísticos

planteadosen la Sección 3.4, se puede desarrollar una estrategiade diagnosis deobservacionesanómalaspara los modelosde elecciónbinaria, que puedeplantearsede Jasiguienteforma.

En una primera etapa, es necesario utilizar los instrumentos a priori del

Apartado3.2.2.A, asícomoel estadísticoh~ en [3.2.2] paraevaluarla dispersiónde lasobservacionesmuestrales,lo queproporcionainformaciónsobrepotencialesobservaciones

extremas. Alternativamente, puede usarse el estadístico de Wilks. Aunque valoresmoderadamentealtos de estosestadísticosno son concluyentes,permiten fijar la atención

sobre algunasobservacionesen fases posteriores. 1-Lay que tener en cuentaque estosestadísticossólo son válidos para variables continuas. Esto supone una limitación

importante ya que, trabajandocon modelos de elección discreta, resulta frecuente lapresenciade variablesexógenascualitativas.

Page 106: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DETECCIÓN 100

Una vez estimado el modelo, también es convenienteutilizar el estadístico

/2 = Zf(XTXYIZ queutiliza la variablestransformadasen lugarde lasoriginales.Aunqueéste tiene la misma interpretaciónqueh~, puedecontenerinformacióndiferente debidoala no linealidaddel modelo. El empleode fl4 sigue los mismoscriterios; estoes, localizar

observacionesextremasy potencialmenteinfluyentes.

El siguientepaso es, lógicamente,calcular el estadístico¿ definido en [3.4.8].Valoreselevadosde ¿indicaránla presenciade posiblesobservacionesanómalas.En este

sentido, la principal dificultad estribaen que no existenformasconcluyentesde evaluarvalorescríticos paradichoestadístico.No obstante,sí sepuedeobtenervaloresindicativosutilizando las tablasde la distribución X

2k• Además, lo másimportantees la comparaciónde efectos relativos, por lo que resulta recomendablerealizar comparacionesde lasestimacionesobtenidascontoda la muestray eliminandoun conjunto,usualmentepequeño,formado por aquellasobservacionescon un valor elevadodel estadísticorespectoa la

mediadel mismo para toda la muestra.

Una vez determinadoun conjunto de observacionesindividualmenteinfluyentes,

convieneanalizarla posibilidadde que existanobservacionesenmascaradasutilizandoel

procedimientode Peñay Yohai (1991) descritoen el Apartado 3.2.3. Una vez más, no

se puedenofrecer valores críticos concluyentesy, en parte, dependedel criterio del

analistala decisiónsobre el efectode cadagrupo, medido a través del estadístico¿~ en[3.4.16], así como las posiblescausasde la presenciade observacionesanómalaspara

tomar las decisionesfinales sobrelos grupos de observacionesproblemáticas.

Otros estadísticosque se desarrollaronparael modelo lineal no tienen especial

ínterésaquí. Por ejemplo, en el Apartado3.2.2 se puso de relieve la importancia deanalizarel efectosobre la matriz de varianzasde los parámetros,para lo cual se sugeríaemplearel estadísticoCOVRL4T!O en [3.2.33]. Para los MEB, se puededemostrarque

dicho estadísticoresulta 11(1 — h) y, por tanto, proporcionala mismainformaciónqueseobtieneal analizar /2~.

Por último, es importante señalarque el conjunto de instrumentosde detecciónplanteadoanteriormenterevela la presenciade observacionesinfluyentesen la muestra,

aunqueningunode ellos haceindicacióndel posibleorigen de las mismas.Una forma deobteneralgunainformación al respecto,es utilizando los contrastesdesarrolladosen el

Apartado2.3.2.

Page 107: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DETECCIÓN 101

Los contrastesmencionadospuedenutilizarsepara,una vez detectadasobservacio-nes influyentes, determinarla fuente de anomalía,suponiendoque ésta sea única. Noobstante,en los experimentosde Monte Cario realizados,no resultaronconcluyentesenningúncasosobreel tipo de anomalía,aunquesi resultabansuficientementepotentescomo

para contrastarla hipótesisnula de que las observacionesseleccionadascomopotencial-menteanómalasno habíansido generadaspor el mismo procesoque las restantes.

Page 108: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MER: DETECCIÓN 102

3.5. Resultados con datos simulados

En estasecciónsepretendeilustrar el funcionamientode los estadísticospropuestosen la Sección3.4 en algunosaspectosconcretos.En particular, seevaluantres elementos

de la metodología planteadautilizando los modelos y los casos de anomalíasde laSección2.4. En primer lugar, seplanteasi el criterio de selecciónde puntosde corteparac4 basadoen compararel cocienteentreel estadísticoy su valor medio para la muestrapermite diferenciar las observacionesanómalas.En segundolugar, se analizael punto

crítico que hacemínimo el 62CM de las estimacionesdefinido en (2.4.41en comparacióncon los valorescríticos indicativos que seobtendríande unadistribución ¿. Por último,se analizala detecciónde observacionesquepresentanefectoenmascaramientoutilizando

el métodode Peñay Yohai (1991) aplicadoa la matriz M definidaen [3.4.17].Sólo se

presentanresultadospara el modeloprobit puestoque, de forma similar a comoocurríaen la Sección2.4, los resultadosparael modelo logit son casi igualesa los del probit.

Los modelosutilizados, los casosanalizadosy los aspectostécnicosrelevantesde

estasecciónya fuerondescritosen la Sección2.4. El modeloconsideradoes un MEB conuna sola variableexplicativa y término constante:

y4 = + ¡32x1 e [3.5.1]

Las observacionesse han generadomedianteel siguientemecanismo:

y, [3.5.2]

La variableexplicativa se ha generado,en todos los casosde observacionesnoanómalas,comounanormal,x1—iidN(O,1) y el vectorde parámetroses: ¡3 = (-0.65, 1)T•

Los casosde observacionesanómalasconsideradosson:

Caso 1: Un porcentajew de observacionesy1~ en la muestraprovienede unadistribucióncon la misma mediaque las restantesobservaciones,pero con /22 =

Caso2: Un porcentajecn de observacionesy4 proviene de la misma distribución convarianzaigual au], perocondistintamediaquelas restantesobservaciones.Unaproporciónco de observacionessontalesqueE(y’) = <y, dondey = (1,

Page 109: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 103

Caso3: Un porcentajew de observacionesestán caracterizadaspor E(y,*) = x4

15, e

idéntica varianzaque las demás,donde 5 = (-0.5,0•5)T y, además,paraestas

observaciones,x4 — lid ¡‘45,1).

El propósito de la primera simulación es comprobar hasta qué punto lasobservacionesanómalaspuedendiferenciarsede las no anómalasa partir del estadístico[3.4.8]. En las Tablas3.1-3.3aparecenvalores medios,para500 replicaciones,de los

siguientes estadísticos: la media del estadístico¿, para todas las observacionesde lamuestra,la mediadel estadístico¿~ para las observacionesno anómalas(¿(8)), la media

del estadísticot, para las observacionesanómalas(¿4(M)) y el ratio ¿4(M)/c7~(B). La primera

columnade cadatabla indica el porcentajede observacionesanómalaspresenteen lasmuestras.

A la vista de las citadastablas, cabehacer los siguientescomentarios:

• El valor del estadísticode influenciaresultamuy homogéneocon independencia

del nivel de anomalíaspresentesen la muestra,tomandoun valor de aproxima-damentek/n. Por el contrario, la media de ¿4 para las observacionesbuenas

disminuye, indicandoqueestasobservacionestienenmenosefectoen la estima-

ción a medidaque aumentaó. A medidaque creceel númerode observacionesanómalas,el valor del estadísticodisminuye,siendoun claro indicativo de quese produceun efectode enmascaramiento:cuantasmásobservacionesanómalasse encuentranpresentes,menor será la influencia de cada una de ellas por

separado.No obstante,el valor medio del estadísticoparaestas observacionesse encuentrasiemprepor encimade la mediapara las no anómalas.

• Teniendoen cuentala última columnade cadatabla, un punto crítico mínimoparael estadísticode influenciaseencontraría,aproximadamente,entredos ycinco veces el valor medio para la muestra,que en estos casos,estaríaentre0.02 y 0.05. El valor critico de la distribución X

2k con dos gradosde libertada

un nivel de confianzadel 10% es, aproximadamente,0.2.

• A la hora de aplicar estecriterio, debetenerseen cuentaque será másválidocuantasmenosobservacionesinfluyentesse encuentrenen la muestra,ya quees

una medida de influencia individual. Sin embargo,aparecenproblemas deenmascaramientono será tan útil. Por otra parte, también es necesario

considerarel número de observacionesque sobrepasanel nivel crítico: si elnúmeroesexcesivo,habráque elegir comoinfluyentesaquellasobservaciones

Page 110: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DETECCIÓN 104

con valor máselevadopuestoque, si seeliminanobservacionesno anómalas,se

estáeliminando información relevante,produciendosesgosimportantesen la

estimación.

Tabla 3.1. Valores medios del estadístico¿4: modeloprobit, caso 1.

w7o t/B) é/B)Ié/M)

0.0 0.0101 0.0101 — — --

2.5 0.0102 0.0098 0.0262 2.68 2.57

5.0 0.0104 0.0094 0.0289 3.07 2.787.5 0.0104 0.0090 0.0276 3.07 2.66

10.0 0.0104 0.0087 0.0255 2.92 2.4512.5 0.0105 0.0085 0.0249 2.93 2.3615.0 0.0106 0.0084 0.0232 2.78 2.19

17.5 0.0106 0.0082 0.0220 2.69 2.07

20.0 0.0106 0.0080 0.0210 2.63 1.9822.5 0.0106 0.0078 0.0204 2.63 1.9225.0 0.0107 0.0077 0.0198 2.59 1.85

27.5 0.0106 0.0076 0.0184 2.42 1.74

30.0 0.0106 0.0075 0.0181 2.42 1.70

Page 111: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 105

Tabla 3.2. Valores medios del estadístico¿,: modeloprobit, caso 2.

cv t~(B) ¿(Al) ¿4(B)I¿4(A’f)

0.0 0.0101 0.0101 -- — --

2.5 0.0107 0.0088 0.0862 9.79 8.03

5.0 0.0110 0.0080 0.0669 8.34 6.107.5 0.0112 0.0075 0.0578 7.75 5.15

10.0 0.01 13 0.0072 0.0479 6.66 4.25

12.5 0.0112 0.0069 0.0412 5.94 3.6715.0 0.0112 0.0068 0.0357 5.22 3.20

17.5 0.0111 0.0068 0.0313 4.60 2.8220.0 0.0110 0.0068 0.0280 4.13 2.5422.5 0.0109 0.0068 0.0251 3.66 2.29

25.0 0.0108 0.0069 0.0226 3.27 2.09

27.5 0.0108 0.0070 0.0208 2.96 1.92

30.0 0.0107 0.0072 0.0188 2.62 1.76

Tabla 3.3. Valores mediosdel estadísticoÓ: modeloprobit, caso 3.

c(B) é/AI) t1(B)/¿4(AI) ¿/A’fj It

0.0 0.0102 0.0102 — —

2.5 0.0118 0.0101 0.0757 7.49 6.44

5.0 0.0135 0.0098 0.0842 8.57 6.22

7.5 0.0146 0.0097 0.0748 7.73 5.14

10.0 0.0149 0.0095 0.0638 6.73 4.28

12.5 0.0154 0.0095 0.0562 5.89 3.66

15.0 0.0160 0.0093 0.0539 5.78 3.37

17.5 0.0158 0.0093 0.0465 5.02 2.95

20.0 0.0158 0.0093 0.0420 4.53 2.65

22.5 0.0165 0.0090 0.0423 4.71 2.57

25.0 0.0158 0.0089 0.0368 4.14 2.3227.5 0.0155 0.0090 0.0329 3.69 2.12

30.0 0.0149 0.0089 0.0291 3.29 1.95

Page 112: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 106

El siguientegrupo de simulacionestambiénse ha diseñadopara evaluarcriterios

de selecciónóptimade puntosde cortedel estadísticode influenciat~. En estecaso,seha

investigadoel valor crítico tal que, eliminandoaquellasobservacionescon ¿, > c, , el

error cuadráticomedio de la estimacióndefinido en [2.4.4] sea mínimo.

Paracadaunade las muestrasgeneradassecalcula( y serealizaunabúsquedapor

el métodode la rejilla para determinarel valor de ¿4 que minimiza el 13CM de las

estimacionessin las observacionesque superanel valor crítico, En las Tablas3.4-3.6se

presentanlos resultadosparael modeloprobit. En las columnasaparecen,paracadavalor

de úi, las mediasde las 500 replicacionesde los siguientesestadísticos:el valor crítico de

c4 que minimiza el ECM de las estimaciones(é), el ECM una vez eliminadas las

observacionescuyovalor de¿ supera< y entreparéntesis,el 13CM sin eliminarobserva-

ciones(tomadode las tablasde la Sección2.4), el númerode observacionesdetectadas

comoanómalasy, en la última columna,el númerode observacionesrealmenteanómalas

entre las detectadas.Teniendoen cuentalos resultadosobtenidos, se puedenhacer los

siguientescomentarios:

• El principal resultadoes que, comopuedeapreciarse,el punto de corteóptimo

es muy sensibleal tipo de anomalíaque apareceen la muestra.La conclusión

de estoes que, condatosreales,no esposibledeterminarun punto de cortedeaplicación general, por lo que es necesariala intervencióndel analista que

deberáprobardiferentespuntoscríticos considerandoel númerode observacio-nes eliminadasasí comolos efectos individualesy los conjuntos.

• Los peores resultados en cuanto al número de observacionesanómalas

detectadas,se producenen el caso3 (Tabla 3.6). Esto es debidoa queestasobservacionesanómalasse debenavaloresextremosde la variableexplicativa,y el modo de llevar acabo la detecciónes utilizando los estadísticosa priori en[3.2.2] y el estadístico /24. No obstante, el ECM, una vez eliminadas lasobservacionescon ¿ > c1 mejoraapreciablementeen todos los casos.

• El enmascaramientohaceque el valor critico del estadísticodisminuyaa medida

que aumentael númerode observacionesanómalas,de modo que se eliminanmásobservaciones,aunquela proporciónde observacionesanómalaseliminadas

se mantiene,aproximadamente,constante.

Page 113: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETEcCIÓN 107

Tabla 3.4. Error cuadráticomediode las estimacionesMV eliminandolas anomalíasde

la muestrautilizando el estadístico¿~: modelo problí, caso 1.

e ECM(b (ECM) N0 OES N0 ANOES

0.0 0.2665 0.0298 (0.034) 0.85 --

5.0 0.2257 0.0192 (0.037) 1.93 0.4010.0 0.1864 0.0175 (0.043) 2.93 1.03

15.0 0.1556 0.0159(0.056) 4.11 1.81

20.0 0.1174 0.0141 (0.070) 5.97 3.10

25.0 0.0871 0.0155 (0.094) 7.74 4.3130.0 0.0692 0.0162 (0.120) 9.80 5.89

Tabla3.5. Error cuadráticomedio de las estimacionesMV eliminandolas anomalíasde

la muestrautilizando el estadístico¿4: modeloprobit, caso 2.

¿7 ECM<» (ECM) N0 OBS N0

0.0 0.2439 0.0294(0.035) 1.07 --

5.0 0.1175 0.0155(0.077) 5.66 2.29

10.0 0.0502 0.0290(0.180) 12.40 6.32

15.0 0.0252 0.0543(0.307) 21.06 11.27

20.0 0.0166 0.0969(0.443) 27.40 15.9125.0 0.0142 01615 (0.574) 30.48 19.1830.0 0.0129 0.2531 (0.723) 32.91 21.32

Tabla 3.6. Error cuadráticomediode las estimacionesMV eliminandolas anomalíasde

la muestrautilizando el estadístico¿4: modeloprobit, caso 3.

ECM«> (ECM) N0 OBS N0 ANOBS

0.0 0.2438 0.0298 (0.038) 1.10 --

5.0 0.3778 0.0250(0.050) 1.76 . 0.31

10.0 0.3465 0.0229 (0.069) 2.49 0.6615.0 0.30>6 0.0203 (0.080) 3.66 0.97

20.0 0.2650 0.0256(0.100) 5.02 1.41

25.0 0.3001 0.0325(0.115) 5.58 1.71

30.0 0.1741 0.0372(0.139) 6.50 2.15

Page 114: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEB: DETECCIÓN 108

El último conjunto de simulacionestrata de ilustrar la detecciónde observaciones

anómalascuandoexisteun problemade enmascaramiento,estoes,cuandola presenciade

un cierto númerode observacionesanómalashaceque los efectosindividualesde cadauna

de ellas quedendisimulados. Para ello, se utiliza el método de Peñay Yohai (1991)

aplicadoa la matriz de influenciadefinidaen [3.4.171.

La principal dificultad a la hora de instrumentarel método, es que requiere la

intervencióndel investigadorparadeterminarlos gruposde observacionespotencialmente

influyentes,lo que era inapropiadopararealizar un volumen importantede simulaciones.

Por ello, se recurrió a la aplicaciónde la técnicade forma no estricta, y se considera

potencialmenteanómalacualquierobservacióntal quesucomponenteasociadoacualquiera

de los dos autovectoresno nulos fuesesuperior a 0.15. Naturalmente,esta forma de

utilización ofrece resultadosbastantepeores de los que se obtendrían aplicándola

correctamentea una muestrareal, peroes suficienteparailustrar el buenfuncionamiento

del mecanismocuandose aplicaa los MEB.

En las Tablas3.7-3.9se presentanlas medias, para 500 replicacionesy para

distintos valoresde w, de los siguientesestadísticos:el valor del estadísticode influencia

¿~ para el grupo de observacionestales que algún componenteasociadode los dos

autovectores principales es superior a 0.15, el ECM una vez eliminadas dichas

observacionesy, entreparéntesis,el ECM sin eliminarías, el númerode observaciones

eliminadasy, por último, el númerode observacionesanómalasentrelas eliminadas.A

la vista de los resultadoscabehacerlos siguientescomentarios:

• Se puedeafirmar que el método, aún utilizado inadecuadamente,funcionabien

en situacionesen las que efectivamentese produceenmascaramiento;esto es,

cuandow es elevado.En particular, en los casos1 y 2, el ECM se reducea la

mitad para los valores más elevadosde la proporción de anomalías(25%

y 30%).

• Cuandola proporciónde anomalíases pequeñao nula, el mal uso del método

haceeliminar observacionesno anómalas,provocandoun ECM superioral que

se obtendríamanteniéndolasen la muestra.

• Dadoque los autovectoresestánnormalizados,sistemáticamenteseelimina un

númerodeobservaciones(aproximadamente12), con independenciade quesean

o no anómalas.El problemaes que, cuandoson observacionesbuenas,estos

Page 115: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEE: DETECCIÓN 109

datos estánen las colas, y se produceel efecto, ya comentado,de pérdidade

información relevante.

Tabla 3.7. Error cuadráticomedio de las estimacionesMV eliminandolas anomalíasde

la muestrautilizandoel procedimientode Peñay Yohai (1992): modelo probit, caso 1.

ECM0> (ECM) N0 OBS N0 ANOBS

0.0 10.55 0.3463 (0.034) 14.43 --

5.0 10.47 0.2552(0.037) 13.73 1.68

10.0 10.87 0.2074(0.043) 13.58 3.29

15.0 10.57 0.1274 (0.056) 13.28 4.5520.0 11.06 0.0922(0.070) 13.44 5.98

25.0 11.16 0.0869(0.094) 13.68 6.36

30.0 10.55 0.0672(0.120) 13.02 7.36

Tabla 3.8. Error cuadráticomediode las estimacionesMV eliminandolas anomalíasde

la muestrautilizandoel procedimientode Peñay Yohai (1992): modelo probit, caso 2.

15.0 11.10 0.1052(0.307) 12.64 7.55

20.0 11.93 0.1819(0.443) 13.20 9.1525.0 10.13 0.2895 (0.574) 11.35 8.86

30.0 9.96 0.3948(0.723) 12.46 10.03

Tabla3.9. Error cuadráticomedio de las estimacionesMV eliminandolas anomalíasde

la muestrautilizando el procedimientode Peñay Yohai (1992): modelo probit, caso3.

ECM<» (ECM) N0 OBS N0 ANOBS

0.0 10 57 0.3660(0.038) 13.90 --

5.0 11 27 0.2613(0.050) 12.86 0.36

10.0 II 72 0.2168(0.069) 13.21 0.75

15.0 II 00 0.2177(0.080) 12.77 0.97

20.0 10.86 0.1990(0.100) 11.77 1.31

25.0 1070 0.1626(0.115) 12.48 1.63

30.0 1132 0. 1458 (0.139) 12.77 2.44

Page 116: Anomalias Del Modelo Lineal General

CAPÍTULO 4

OBSERVACIONES ANÓMALAS EN MODELOS DE

ELECCIÓN MÚLTIPLE

4.1. Introducción

En este capítulose generalizanlos resultadosde los Capítulos2 y 3 para losmodelosde eleccióncualitativamúltiple (MEM) másutilizados en la práctica: el modelologit multinomial y el modeloprobit multinomial. Comose ilustra másadelante,tanto el

planteamientodel problemade observacionesanómalas,comolos principalesdesarrollos

parasu tratamientoson análogosa] de los modelosde elecciónbinaria, por lo se utilizagran parte de las discusionesde capítulosanteriores.

Sin entraren consideracionessobre hastaquépuntoel planteamientode la función

de utilidad refleja adecuadamenteel comportamientoindividual, el empleode los MEMen economíapartedel supuestode que el decisorelige aquellaalternativadel conjuntofactible que maximiza la utilidad esperada.Aunque es posiblederivar estosmodelosbajootrosplanteamientos,en particularel modelologit, enestecapítulose mantieneel supuesto

de maximizaciónde la utilidad.

El modelo logit, debidoa la forma cerradade las probabilidadesde elecciónes elmásutilizadoenaplicacionesprácticas,aunquetienealgunaslimitacionespararepresentar

decisionesen las quepuedehaberuna importantesustituibilidadentrealternativas.Por elcontrario, el modelo probit es menosutilizado, sobre todo porque es más complejo y

costoso,y sólo compensacuandolas propiedadesdel logit lo haceninadecuado.

En la Sección4.2 sederivan los modelosde eleccióncualitativamúltiple a partir

de la teoríade la utilidad y se analizanlas restriccionesnecesariasparasu estimaciónasícomo algunas propiedades, en particular, la de independenciade las alternativas

irrelevantesy las limitacionesen modelizarefectosindividua]es.

Page 117: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 111

A continuación,en la Sección4.3, seplanteala estimaciónde estos modelospor

máximaverosimilitud y sedesarrollaun método máximo-verosímilpor procedimientoslinealesanálogoal derivadopara los MER en el Capítulo1. Debido a que los resultados

sobrela distribuciónasintóticade los estimadoresmáximo-verosímilessonanálogosalos

de los MEB. no se derivanexpresionesespecíficaspara los modelos tratados en estecapítulo, pueses suficientecon aplicar las de las Secciones1.3-1.5 utilizando la nueva

notación.

En la Sección4.4, se extiendeel planteamientode observacionesanómalasdel

Capítulo2 y sederivanestadísticosadecuadosparadetectarlapresenciadeobservaciones

anómalasen modelosde elecciónmúltiple. El cálculode estosestadísticospuedellevarse

acabode unaforma computacionalmenteeficientegraciasal procedimientodeestimación

máximo-verosímilpor procedimientoslinealesque seproponeen [a secciónanterior.

Por último, en la Sección4.5, se ilustran, con datos simulados, los principales

resultadosde las seccionesanterioresaplicadosal modelo logit multinomial.

Page 118: Anomalias Del Modelo Lineal General

OBsERVAcIONEs ANÓMALAS EN MEM 112

4.2. Modelos de variable dependiente cualitativa múltiple

4.2.1. Planteamiento de los modelos a partir de la teoría de lautilidad

En la Sección1.2 seplantearonlos modelosde elecciónbinaria bajo el supuesto

de la existenciade unavariabledependienteno observableque indicabala preferenciadel

individuo por cadaunade las alternativasque se le presentaban.En estalínea, sederivan

los modelosde estasección.Un planteamientoalternativoparae] modelo logit, másligado

al problemade clasificación,puedeencontrarseen Maddala(1983, pags.34-37).

Ahora se supone que el individuo i puede elegir entre un conjunto de m

alternativas.De la elecciónde la alternativa],el individuo obtendráuna cierta utilidad,

que se denorapor U,~. de forma que Uf = [U11,..., Uím] es el vector formado por las

utilidades que el individuo i-ésimo obtendríade cada posible alternativaen caso de

elegirla. Dicha utilidad dependeráde un conjuntode factoresobservables,entrelos cuales

se encuentranfundamentalmentelos atributos de la opción y las característicasdelindividuo que puede medir el investigador, así como un conjunto de componentesnoobsevablesc,~. Denotandopor ; el vector de las característicasrelevantesde la opciónjpercibidaspor i y por x~ el vectorde las característicaspersonalesrelevantesdel individuo

í-ésimo que puedeobservarel investigador,en general,se puedeescribirque:

U~= v(z~, Xb 6) + e~ = y1 + c,1 y] [4.2.1]

donde a y,1 se le denomina utilidad observableo representativa. Adicionalmente,e!

investigadorconoce(o supone)la forma funcional de vú que dependede un vector de

parámetrosO. Naturalmente,el sujetoelegirá aquellaopción que le reporte una utilidadmayor, esdecir, elige la alternativak, si y solo si’

3:

U,k=UÚ Y] j!=k 14.2.2]

En estecontexto,c~ se consideraun componentealeatoriono observableque no

dependede; ni de x~. Puestoque U,1 no esobservable,no sepuedepreverperfectamente

la eleccióndel individuo. No obstante,sí sepuedeestimaruna medidade la utilidad del

13 Aunque en la comparaciónse utiliza el signo mayor o igual, el individuo elige una y sólo una de ellas.

Page 119: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 113

individuo (y) y con ella inferir su decisión; esto es, estimar la probabilidadde que el

individuo elija la alternativa].

Ademásde las variablesen x~ y ;, seobservala alternativaelegidapor el sujeto.

Más formalmente, se define una función indicador 9~U1) que traduce la utilidad no

observabledel individuo paracadauna de las alternativasen un vectory~ de dimensión

mxl conelementogenéricoYa’ de modo que:

= .7(U) = 1 1s¡U,k=UÚ Ni] k#j 14.2.3]

y ~ y,1 = 1. Es decir, el individuo sólo elige unade las alternativasque sele presentan.

La función .9t%) transformael mecanismode decisiónen un vectorde ceros con

un uno en laposicióncorrespondientea laalternativaelegidaporel individuo. La elección

de 9t~) implica hacerun supuestosobreel modoen que el individuo toma la decisión,y

enestasituación,distintashipótesispuedendar lugar a diferentesmodeloso a interpreta-

cíones alternativasde una misma forma funcional del modelo [Maddala (1983) y Ben-

Akiva y Lerman (1985)1.

Obsérveseque, segúnel planteamientoque seha seguidohastaahora,la elección

por partedel individuo es determinista,es decir, la probabilidadde elegir la alternativa

k es uno o cero, dependiendode que secumplao no la condición [4.2.2j.

Paracaracterizartotalmenteel problemafalta definir un punto importante.Seaunconjunto de individuos que seenfrentanal mismo conjuntode alternativasy que poseen

idénticosvaloresde la partede utilidad observable.El investigador,no obstante,observará

diferenteseleccionesporpartede los distintos individuos debidasal componentealeatorio

de [4.2.1]. Entonces,definiendoy1 comoel númerode individuos en la muestraque han

elegido la opción j-ésima, esto es: y1 = ¿ y~, se puededefinir la probabilidad de

eleccióno de respuestade la alternativaj por el individuo i, que sedenotaj’1~ como el

límite de la proporciónde individuos que, paraidénticos valoresde utilidad observable,

elegirían la alternativaj cuandoel númerode sujetos investigadostiende a infinito. Por

tanto, la probabilidadde elecciónse defineen términosde lo queel investigadorobserva,

y no en función del comportamientoindividual.

Page 120: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 114

Estaúltima definiciónes fundamentalen la interpretaciónde lo que sigue, puesto

que el sujetono tieneprobabilidadesde elegir, el sujetoelige. Por el contrario, lo queel

investigadorhacees estimar la probabilidad(límite de proporción)de que el individuo

prefierauna ciertaalternativa,condicionadoa la parte de la utilidad que puedeobservar.

Dadala definiciónanterior, la probabilidadde elecciónserála probabilidadde que

se mantengala condición [4.2.2] dados los componentesobservadosde la utilidad

(y,1 = v(¾,x1.O)), esto es:

>‘* P(U,k=(JV~ y] 1 k!=j)

— P(vlk*e.k =v~+e~, “‘] k !=j) [4.2.41

— P(e,1~&~= V1~ — v~,Vjlk#j)

— Fk(vlk — y,1,..., v1~ —

dondeFkQ) esla funciónde distribuciónmarginalde e~-e~ vj#k. En general,FQ) seráuna

función de distribución conjunta que se evalúa para m-1 alternativas y la última

probabilidadsecalculateniendoencuentaquelas probabilidadesde eleccióndebensumar

la unidad.La interpretaciónde la expresión[4.2.4] esque la probabilidadde elecciónde

la alternativak-ésima es una función que dependede la diferenciaentre las utilidades

observablesderivadasde la alternativak y las restantes.

Finalmente,con respectoa la forma funcional de v~, el planteamientomás usual,

siguido en estetabajo, es una especificaciónlineal para la utilidad representativa:

6)T T [4.2.5]

y.. = v(z~, ir1, = + x~ ¡3~(1

4.2.2. El modelo lagit multinomial

De forma similar a como se planteóen el Capítulo 1, para definir totalmenteel

problema, bastaríacon elegir una distribución adecuadapara £Ú~Cík, aunquees más

interesantederivaralgunadistribuciónparae0.

Se suponeuna muestrade n individuos, cadauno de los cualesse enfrentaa un

conjunto idéntico de m alternativas, y en la que cadauno de ellos tiene idéntica utilidadrepresentativay0 para todas las alternativas. En estecaso particular, la probabilidadde

eleccióndadaen [4.2.4] sereducea:

Page 121: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 115

P(e. = e~, ~] 1 k !=j)= P(e,k = max(e,1,..., Cil,•••, 8,,,,)> [4.2.6]

donde,para un m suficientementegrande,y paracualquierhipótesissobrela distribución

de e,~, ¿~ max(e1,...,el,,,) se distribuirá asintóticamentede acuerdocon la distribucióndel valor extremo(EVD). Bajo hipótesisdistribucionalesmás fuertesparae,~, porejemplo,

normalidad, la convergenciade la distribución81k a la EVD es muchomás rápida.

Por tanto, se suponeque e~ y], sedistribuzy idénticae independientemente(ud)

EVD. Dada estadistribución de la componenteno observabley partiendode [4.2.41,

medianteun sencillo cambiode variable, se obtieneque:

= exp(v,) vk [4.2.7]

E exp(v0)

rl

que no es más que lafunción de distribución logística.

La función en [4.2.7] estáacotadaentrecero y uno, y es continua y derivable

~ v,1ER.Además,si v,i~-~~Pa~O, ypor el contrario, si v0- co =oP0-. 1; es decir,

cuantamenos(más)utilidad representativaobtengael individuo ide laalternativa],menor

(mayor)probabilidadde eleccióntendrádichaalternativa.Por último, esobvio que14.2.7]

tambiéncumpleque S~P,1 = 1.

De forma análogaa comose expusoparael modelo logit binario en el Aparta-

do 1.2.2.C, transformacionesadecuadasde y0, representadaspor G(v), permitenque la

forma funcional dada en [4.2.7] se aproxime arbitrariamentea otras funciones de

distribución. Esto es lo que sedenominael modelo logit universal.

4.2.3. El modelo prob¡t multinomial

En el modelo logit del Apartado 4.2.2 se ha supuestoque los componentesno

observablesde la utilidad e,1 se distribuyen ud EVD. En estasecciónse modifica dicha

hipótesis manteniendolos restanteselementosdel modelo. Ahora se suponeque los

componentese~ de El siguen una distribución normal multivariante con vector de

esperanzasOrn. Esto es:

Page 122: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN M~M 116

— N(O, S,) [4.2.8]

con una función de densidadconjunta:

fle) = «e~) = (21) »~ S.K’exp(—le]’Ste) [4.2.9]

y funcionesde densidadmarginal:

1/e) = t1(e) = (2r<’ exp[—1(41[4.2.10]

donde m es el número de alternativasy cg = {S,11} son los elementosde la diagonal

principal de S1, mientrasque las covarianzasse denotanUUk. La diferencia fundamental

estribaen que ahora,con la distribución normalconjunta, los e~ puedentenercovarianzas

no nulas.

A pesarde que el modelo probit da lugara representacionesmásgeneralesque el

logit, presentamayoresdificultadesde estimaciónque lo hacenpocoadecuadocuandoel

númerode alternativases grande.Bajo el supuestode que el individuo eligeaquellaalter-

nativa que le reportala mayor utilidad, se tiene que:

= 1k — 1k y ~ k !=fl [4.2.11]P(e,1—e < y —

que es la expresiónen [4.2.4]. Paradesarrollaruna expresiónequivalentea [4.2.7] es

necesarioespecificar:

~ •~t.

‘½= J ~lk J de11... f ~~¡k

[4.2.12]£ •t —v e +V —y• J de1~4í~...• f «e)de

que es la probabilidadde elecciónen el modelo probit.

Alternativamente,la probabilidadde elecciónsepodríahaberderivadoanalizando

la distribución conjunta de las md variables aleatorias6,j~6¡k’ que también siguen una

distribuciónnormalmultivariante.Entonces,P1,,, puedeobtenerseapartir del hechode que

la sumade las probabilidadesde elecciónes igual a la unidad. En esecaso,es necesario

evaluaruna integral múltiple de ordenm-1, que no simplifica el problemacomputacional

cuandom essuperiora tres.

Page 123: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 117

Obsérveseque si se comparacon la forma funcional de las probabilidadesde

elección del modelo logit en [4.2.7], la ecuación[4.2.12] es bastantedesalentadora,

principalmentepor lo costosoen términos de cálculo que suponela evaluaciónde una

integral de ordenm- 1 paracadauna de las ni- 1 probabilidadesde eleccióny cadauno de

los n individuos. La conclusiónde lo anteriores que, pesea lo atractivodel planteamiento

generaldel probit, sólo resultade utilidad prácticacuandoel númerode alternativases

relativamentepequeno.

Debido a dicha dificultad de evaluaciónse han derivadométodosque permiten

calcular expresionescomo [4.2.12] a un costereducido. Lo más utilizados son [véase

Daganzo(1979>]: 0 integraciónnumérica,u) métodode simulacióny iii) aproximación

de Clark. Naturalmente,el costeen que se incurre es la pérdidade precisiónque, en

algunoscasos,puedeserconsiderable.

4.2.4. Especificación de la utilidad observada y condiciones de iden-tificación

Comoseha indicadoanteriormente,sesuponeunautilidad representativalineal en

los parámetros,que sepuedeescribir como:

= <a + x1% wjoj [4.2.13]

donde w4T ¡~T <1 y o~ = [¿ flfl.

Es importanteteneren cuentaqueapartir de [4.2.7] y [4.2.12] las probabilidades

de eleccióndependende las diferenciasentre las utilidadesrepresentativas,y no de los

valoresque tomen éstas.Este hechotiene una clara implicación: no todos los parámetros

específicosparacadaalternativapuedenserestimados.Suponiendoqueel decisordispone

de ni alternativas,de [4.2.4] setiene que P1,,, dependede - V1,,,, Ni~j!=m,y sustituyendo

[4.2.131en estaexpresiónresulta:

Page 124: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 118

vé~vím = T — 4 —

— (z~ — z&)Ta + xJ(131 — fi) [4.2.14]

— (z.. — z- )Ta + x7131

‘1 —

Por tanto, esobvio que existeninfinitos conjuntosde paresde vectores~ y l~m que

verifican que sus diferenciasseanigualesa fi. Por ello, convencionalmenteseimpone la

normalización:

I<=fiffl firn j!=m [4.2.15]

It =0

dondelos m-1 vectores son los que puedenestimarse.

Otra cuestiónimportanteque deberesaltarsea partir de [4.2.4] es que, puestoque

en la determinaciónde la probabilidad de elección sólo influyen las diferenciasen la

utilidad representativa,las variables que son constantesentrealternativasno influyen en

la probabilidadde elección.Por lo tanto, tambiénhay que aplicar una normalizaciónpara

las variables propias de cadaalternativa.

El resultadode esteconjuntode restriccionesde identificaciónes que las utilidades

observablesserán:

= (z,.. — z1/a + y] !=ni

[4.2.16]y1,,, =0

y las probabilidadesde elecciónresultan,parael modelo logit:

~ík — exp(vk) _ exp(v1) « k !=niE exp(v0) 1 ~ exp(v,1)

1

Un 1 + ~ exp(v)

J j~n2

y parael probit:

Page 125: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 119

~ik fde¿k j de,¿... j de1~ 1[4.2.18]

e ~v —vJ delk.l •.. J «e1)de

Porúltimo, convienehacernotarqueal igual queocurreen los modelosde elección

binaria, las probabilidadesdeelecciónparacadaindividuo no seven alteradaspor cambios

de escalaen la utilidad. Los modelos:

U. = w~‘0 + e [4.2.19]

ji 4j ,j

y

= wJO~/X + eIX [4.2.20]

sonobservacionalmenteequivalentes.Por tanto, sólo podemosobtenerestimacionesde los

parámetros O hasta un factor de escala, y es necesario imponer una normalización

suponiendoquevar(e) ‘úij esconocida,y los parámetrosestimadoslo son hastaun factor

de escalaa, que es la desviacióntípica de e« vi,].

4.2.5. Otros aspectos de los modelos multinomiales

En estasecciónse discutenbrevementedos aspectosimportantesa la hora de

modelizarsituacionesrealesutilizando modelosde elecciónmúltiple. En particular, se

analiza la propiedad de independencia de las alternativas irrelevantes, que es una

consecuenciadel supuestode independenciaentre las perturbacionesen un modelo logit

y las dificultadesde modelizarla variación en gustos.

Page 126: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 120

4.2.5.A. La propiedad de Independencia de las Alternativas Irrele-vantes <IIAP)

Se dice que secumple la I!AP14 paraun modelo, cuandoel ratio de las probabili-

dades de elección entre dos alternativas del conjunto disponible para el decisor. es

constantee independientede las restantesalternativas.

La formulacióndel modelo logit en [4.2.7] verifica estapropiedadpuestoque:

exp(vlk) 1 ~ exp(v,>) exp(vk)_ ___________________ — _______ = exp(vlk — y) y k,l [4.2.21]

P11 exp(v,1) ¡ ~ exp(v) exp(v11)

Como puedeverseen (4.2.21], el ratio de las probabilidadessólo dependede la

diferencia entre las componentesobservablesde la utilidad de las alternativask y 1, con

independenciade cuántasalternativasseencuentrandisponibleso de las característicasde

las mismas.Estapropiedadno esnecesariamentenegativa,puestoque permiterepresentar

algunassituacionesreales,aunquetambiénresultainapropiadaen otras ocasiones.

Un ejemploclásicodel problemade la IIAP es el conocidocomo el del autobús

rojo y el azul. Seaun viajero que tiene la posibilidadde trasladarseen automóvil (Auto)

o en una línea de autobúscon vehículosrojos (BusR), y que paraambasalternativasla

utilidad representativaes idéntica.En estasituación:PIAUZO = ~¿BusR = 1/2. Si se poneen

circulación una nuevalínea idénticaen todo a la roja exceptoporque los vehículosson

azules (RusA), deberíaocurrir que ~IBUSR’~¿BUSA 1. De acuerdocon [4.2.21], en el

modelologit [4.2.7], el ratioP Au,I~í B~R = 1 debeserconstantecon independenciade que

hayao no otras alternativas,esteratio continuarásiendo la unidad. El único valor que

cumple las condicionesanterioreses: = ~iBusR = ~¿BusÁ = 1/3, lo que obviamente

no es verosímil. En buenalógica, lo que ocurriría es que: ~¡Áu~ú = 1/2, P,B,~R = 1/4 y

= 1/4. Es decir, la probabilidadde ir en automóvil no deberíaverse afectadaporla introducciónde una nueva líneadeautobús,aunquela línea inicia] (la roja> sí severía

afectadadebido a la (supuesta)indiferencia de los individuos hacia los colores de los

autobuses.En este caso, las probabilidadesde elecciónestaríaninfraestimadaspara el

automóvil, pero sobreestimadaspara los autobuses.

~ Independence of !rrelevant Alternatives Property: Propiedadde Independenciade as Alternativas

Irrelevantes

Page 127: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 121

Por el contrario, una situaciónen la que la IIAP es útil puedeplantearsecomo

sigue. En unasituación de elecciónde modo de transporte,el conjunto de alternativasal

que se enfrentacadaindividuo puedeser infinitamente grande(ademásde los clásicos

automóvil y autobús, podemos incluir bicicleta, burro, patinete,etc.). Si el interés se

centraen un par de mediosde locomoción(automóvil y autobús,porejemplo), sepueden

agrupar todos los restantesen una sola opción o simplementeexcluir de la muestraa

aquellossujetosque no hubiesenelegidoni automóvil ni autobús.La IIAP, en estecaso,

permiteestimarcorrectamentelas probabilidadesde elecciónde interés(Train (1986)¡.

Otra aplicación interesantede la IIAP consisteen estimar probabilidadespara

alternativasque no estándisponiblesen el momentode la estimación.Si se creeverosímil

el cumplimientode la IIAP, el modelo que se estima para el cojunto de alternativas

vigentespuedeserempleadoparaestimarprobabilidadesde elecciónde alternativascuyas

característicaspuedansuponerse(o conocerse),aunquedichasalternativasno existan.Por

ejemplo, en el casode la demandade automóviles.Si se ha estimadola probabilidadde

elecciónpara una seriede marcasy modelosconcretos,sepuedeprever la probabilidad

de elecciónde un nuevomodelousandolas característicasquepresentaráo, de otro modo,

evaluar la aceptaciónpotencial de diferentesmodelosutilizando las característicasque

podríanser incluidas en el vehículo.

La primerasoluciónparael problemade la IIAP en el casode que no sea realista,

consiste en utilizar otra forma funcional para FQ), como por ejemplo la normal

multivariante, que no posee la IIAP. Sin embargo, se pueden plantear soluciones

manteniendola forma logísticapara la probabilidad de elección. En el ejemplo de los

autobuses,es sencillo demostrarque el problemase solucionaespecificandola utilidad

representativa:

G(v1 Auto) = y1 Auto

[4.2.22]

G(v.) = + y0 = BusR, RusAJ

con p = In 1/2. En general, el factor de correcciónpi es desconocidoy es necesario

Jncluir, entre la variables exógenas,una constantepropia para cada alternativa. Lainclusión de estaconstantesuponeque en la fasede estimación,seobtienenestimaciones

de los factores de correcciónnecesariospara evitar (al menosen parte) los desajustesprovocadospor la IIAP. Esta inclusión, en cambio, haceque no se puedanestimarprobabilidadesparaalternativasno incluidasen la muestra,a no ser que se conozcasu

factor de ajuste.

Page 128: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 122

Por otra parte, el modelo probit no presentael problema de independenciade

alternativasirrelevantes. Esto es debido a que se permiten covarianzasno nulas en la

matrizde varianzasde los componentesno observablesde la utilidad. De hecho,esposible

imponerrestriccionessobrela correlaciónentrelas perturbaciones.Esto permite,además,

contrastarla validez del modelo respectode otro estimadosin la estructuraimpuestaa

priori.

Sea,nuevamente,unasituaciónde elecciónde modode transporte.Lasalternativasque se presentanal individuo son: automóvil propio (1), metro (2) y autobús (3).

Posiblemente,las alternativas(2) y (3) son altamentesustitutivas,y la elecciónentreellases independientede (U. La situaciónque previsiblementese darási desapareceel metro,es que los individuos vayan en autobúsy viceversa,y en menor medida recurrirán al

coche.

Considerandoque la situación anterior es una representaciónplausible de la

realidad, la matriz de varianzascovarianzasrestringidaquedará:

[2 1rs1 u12 u

2[4.2.23]i [u2t3]U

siendoposiblecontrastarsi el modeloconla restriccióndecovarianzasrepresentalos datos

de igual forma que el no restringido.

4.2.5.B. Variación en gustos

Otro punto importanteen este tipo de modeloses que la inclusión de efectos

individuales, lo que puedeentendersecomomodelizarla variaciónengustos,tiene ciertas

limitacionesen el modelo logit.

El supuestosubyacentees que unacierta característicade las alternativasno es

igualmentevaloradapor los individuos, lo que sepuedeilustrar conel siguienteejemplo.Supongamosque la utilidad observablede la elecciónde modo de transporteal lugar de

trabajodependedel costede la alternativa(C1) y de otro conjunto de características.Es

claro que un mismocosteno esvaloradode igual modopor diferentesindividuos. Por lo

tanto, la utilidad observablepuedeformularse:

Page 129: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 123

V.=cxC.+wJO [4.2.24]y ‘j 9j

dondea es un parámetro específicopara el sujeto i. En estecaso, bajo un planteamientodeterminista,sepuedesuponerque la valoracióndel costeseráinversamenteproporcional

a la renta del individuo ¡ (R):

= 1... [4.2.25]It

y sustituyendoen [4.2.24J:

y, =~ +w4TO [4.2.26]

donde Cfi?1 puedeinterpretarsecomola interaccióncoste-renta.

En el modelo logit, el tratamientode factores individualesda lugara un problema

si éstos dependende variables no observableso poseenalgún componentealeatorio.Supongamosque en [4.2.25]:

a1 = .2~. + [4.2.27]

donde t es una variable aleatoriacon E(fl = O y varianzafinita. En esta situación,

[4.2.25] queda:

y, = c& [E] + + <o. [4.2.28]

de forma que la utilidad puedeescribirsecomo:

U0 a(Q/ R,) + + + [4.2.29]

c&(C1/R) + wJ01 .‘.

donde< = ~C,+ c~ ya no sedistribuye idénticae independientementeEVD, comoserequiereparael modeloqueestamostratando.De hecho,puestoque~ esigual entrealter-

nativas, la cov(e$e~) !=O, v],k. Peroademás,como C~ varíaentre alternativas,ahora

var(e0*) !=var(e,k), Vj!=k.

Page 130: Anomalias Del Modelo Lineal General

OBSERvAcIONES ANÓMALAS EN MEM 124

Lo que sugierela discusiónanterior es que el supuestohabitualmenteutilizado de

que los componentesno observablesde la utilidad se distribuyen independientementeesbastanterestrictivo. Su principal deficiencia reside en que no permite la presenciadecorrelación entre alternativas (sustituibilidad), situación bastante realista y cuyaconsecuenciamásclara es la IIAP.

Nuevamente,el modeloprobit no presentaestetipo de problemas,ya que permitecovarianzasno nulasentrelos componentesno observables,haciéndolomás flexible que

el modelo Iogit.

Page 131: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 125

4.3. Estimación de los modelos de elección múltiple

4.3.1. Estimación de máxima verosimilitud

El tratamientomásextendidoy generalmentesatisfactorioparala estimacióndelvector de parámetrosO en un MEM, es la estimaciónmáximo-verosímil.La función deverosimilitud parala observacióni-ésimacondicionadaa la información disponiblees:

m

£= 5E,(O w < ~ = ‘1¿k [4.3.11

1=1

Esto es, comocadaindividuo elige una sola alternativa(sólo un elementodey1 es

distinto de cero) se puededefinir £~ = ~ik como laprobabilidadde elección(estimadapor

el observador)de que el individuo elija la alternativapor la que realmenteopta.

Por lo tanto, la función de verosimilitud muestralresulta

1~ It It

£ =£(OIW,Y) =fl£ =11 flp¾ [4.3.2]

y tomandologaritmos

It ni

E = ln£(O W, Y) = ~ ~]y0lnP,1 [4.3.3],=I j=I

que es la función a maximizar,donde¡-‘a dependede O y de los datos segúnla especifica-

ción de y0 y de la función de distribución de los componentesno observables.Convieneresaltarque puestoquey0 es cero para las alternativasno elegidas,[4.2.18]es la suma,

paratodos los individuos, del logaritmo de la probabilidadde la alternativaelegida.

A continuación,sedesarrollanlas expresionespara los modeloslogit y probit que

se hantratadoen los apartadosanteriores.Supongamosn individuosy ni alternativas.Para

cada individuo se dispone de ni vectores; de dimensión k1 x 1 de atributos de lasopciones,y un vectorx1 de dimensiónk2>< 1 de característicaspersonales.Además,también

se observael correspondientevector de decisióny]’ = [y1 , yJ formadopor m-1 cerosy un uno en la posición de la alternativaelegidapor el individuo.

Page 132: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 126

Los vectoresde parámetrosa estimar serán: i) el vector a de dimensión *1 x 1

correspondientea las variables en ;, y u) I~ = [/37/37 fimi”] de dimensión(m- ) 1<, x 1, formadopor los vectoresde parámetrosde cadaalternativaasociadosa x1, y

dondese ha impuesto la normalización[4.2.161.El vectordel conjuntode parámetroses

= [aT, fiT1 de dimensiónkXl, donde1< = 1<1 + (ni-1?rk2.

El vector w0 de variables se puededefinir del siguiente modo. Seat~ un vector

(ni-1»k.x 1, particionadoen bloquesde 1<, elementosque contieneen su ]-ésimo bloqueel vector x~, y en el resto vectoresde 1<2 ceros; estoes, 4 = [Of, Of 4 of ji, demodoquesecumpleque<a = 4fi~, j = 1 ni —1. Entonces,sedefine w¿ = [z~ik 41’de forma que, sujeto a la normalización[4.2.16], se cumpleque: wJO = + <I3~.

Entonces,se define la matriz w de dimensiónkxm-1:

W.T

~1~

wiI

T

1~

LWÍm -

~II .1

~í2 1

X~ ... Xí~ O

z O ... O x1112k,

ZImIk O

x.jk

O xl

[4.3.41

donde z11característicaspersonalesdel

SeaIV

de elecciónde

son las variablesque describencómo el individuo ¡ percibe las k~

de la alternativa],mientrasque x11,...,.xík denotanlas 1<2 características

individuo i-ésimo.

E E

= pT = [~‘11, P~ P~,,.j = [Fa, ¿2’ •~, ím.1I el vectordeprobabilidades

las alternativasdel individuo i. Tambiénsedenotapor:

4=

aF..Ua(wJo>

L a(w410)

[,ú]y 1, =V~~f~-~] [4.3.5]

A partir de lo anterior,esclaro que:

Page 133: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 127

ar‘Y

7WBE.

y =

¡=1 B(wjO)2

uy; [4.3.61

y por lo tanto:

[4.3.7]86

El logaritmo de la función de verosimilitud en [4.3.3], teniendoen cuenta las

restriccionesde identificaciónen [4.2.16], sepuedeescribir:

n mi

e = rr YUIRE,,LI ji

[4.3.8]

y el gradienteresulta:

vi, =ErY,~+w,f,, = ~ W1JDy1

U

dondeD, = diag(F,, F,~.1). Definiendo la matriz de covarianzasde y1 como:

4= E[%—P~)%—P)’) =D1 — FET

y utilizando el lema de inversión de matrices de [3.2.12] puede demostrarse

D, ‘y, = <(y, - E1), por lo que otro modo de expresarel gradienteen [4.3.9] es:

ve = £ WfD[’y, = ~3W1JA¿ (y1-F1)

Finalmente,usandola equivalenciaasintótica:

1(0) = ____

la matriz de informaciónpuedeescribirse:

1(0) = i: W,f,Ajf,TW,T

[4.3.9]

[4.3.10]

que

[4.3.11]

-EIM186

[4.3.12]£TJ.

[4.3.13]

Page 134: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 128

Parael modelo logit multinomial, las expresionesanteriorespuedensimplificarse

considerablemente,puestoque en este casoparticularA1 = f. El logaritmo de la función

de verosimilitud de [4.3.8] sepuedeescribir como:

2 = E E y~, lnP.

= E E v,1[v0 — In ~ exp(v,1>]1 J Y

~ Y~ÍWIO — E E y,1ln[~ exp(wJO)] [4.3.14]Y 1

= E y,rW~O — E ~ y0ln[~ exp(w~TO)]¡ 3 1

= E y1TW¡TO — E InFE exp(wjO)]

donde,en la última igualdad,se ha usadoel hechode que cadaindividuo sólo elige una

alternativa.El vectorgradienteresulta:

81? = E »~ ~ ~ w0exp(wJO

)

— ¡ E exp(w~TO)~/

=E V’¡y E WP [4.3.15]

=E Wjy,—P,)

y el hessiano:

— 822 = E W.P1%— P)TW [4.3.16]

Por último, la matriz de información en el modelo logit multinomial es:

1(0) = ~ W1A1W¡ [4.3.17]

La función de verosimilitud de estosmodelosesglobalmentecóncavaen general,

por lo que la maximizaciónde [4.3.3] puederealizarseporalgunode los métodosusuales

de optimizaciónnuméricaexpuestosen el ApéndiceA.2. Debido a las propiedadesde la

función de verosimilitud, el algoritmo Newton-Raphsono el de scoring son elecciones

adecuadas[véaseDaganzo(1979)y Ben-Akiva y Lerman(1985)].

Page 135: Anomalias Del Modelo Lineal General

OBSERVAcIONES ANÓMALAS EN MEM 129

Bajo condicionesde regularidadno muy restrictivas, los parámetrosestimados

siguenunadistribuciónasintóticanormaly, en general,sonaplicablestodos los resultados

de las Secciones1.3, 1.4 y 1.5 paramodelosbinarios. Esto es, todos los contrastesderesitricciones lineales, así como el principio de multiplicadoresde Lagrange son de

aplicación inmediata, con la única precauciónde observar la dimensióndiferentede lasvariables explicativas,que ahoraforman una matriz kxm-1 paracadaobservación.

4.3.2. Estimación de máxima verosimilitud por procedimientoslineales

Un resultado importantepara poder derivar los estadísticosde influencia para

modelosbinarios de la Sección3.4 era la posiblidad de estimar el modelo por máximaverosimilitud, pero con el procedimientolineal derivadoen el Aparado 1.3.2. En esta

secciónseplanteaun problemasimilar y seobtienenexpresionespara poderestimar unmodelo logit multinomial medianteprocedimientoslineales.

La iteraciónpor el procedimientode scoringde [A.2.7]-[A.2.8] puedeescribirse:

r+Io = + [cfI [4.3.18]

A partir de las expresionesdel gradientey la matriz de informaciónen [4.3.11]y

[4.3.13] respectivamentesetiene que:

~r+í = Fr wjÁ:íjjwj] -I VV/A;’ (y, -É) + [y W}A;IJTWF] &i-~ [4.3.19]

= [zwJÁit¾il]-‘ [~w,JÁ;IÑ - P,

dondela virgulita denotaque las expresionesestánevaluadasen &‘. La expresiónanterior

puedeinterpretarsecomo el estimadorpor mínimoscuadradosgeneralizados(MCG) delmodelo de ni-1 ecuacionesen forma reducida:

y, - = ITwTOr+I + u1 [4.3.20]

conE(u1) = Orn y V(u1) = ¡Ir

Page 136: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 130

Otra derivación alternativadel algoritmo propuestopuedehacersedel siguientemodo. Seael modelo no lineal:

= F(WÍTO) u. [4.3.21]

dondeu~ es un vectorde variablesbinarias que toma los valores1-P0 conprobabilidadP,3.

y -P1 con probabilidad1-P0, de forma que:

E(a) = Orn y V(u) = diag(P1~ — ppT = A1 [4.3.221

Si se lleva a cabo una aproximaciónlineal del modelo [4.3.21] medianteunaexpansiónpor Taylor de F(W,T&r+I) alrededorde un vector de condicionesiniciales Ii’, seobtiene:

F É. + {i] (¡>r+I •T) + [4.3.23]

Teniendoen cuentaqueR, —* O enprobabilidadsi O esunaestimaciónconsistente

de 6. Sustituyendoen la ecuación[4.3.21]y despejando,la aproximaciónpuedeescribirse:

.4 A7’yi — I.’1 + f1 WT&t = /TWTOr+I + u. [4.3.24]

que es la expresiónen [4.3.20].

Una vez más, para el modelo logit multinomial las expresionesanteriorespuedensimplificarseconsiderablemente.En particular, en la expresión[4.3.24]no hay másquesustituir1, por A, y el pasode scoring de [4.3.19]resulta:

= [Ew.Á1wtj- [r W~y - P + Á1w¡T&i] [4.3.25]

Page 137: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 131

4.4. Observaciones anómalas en modelos multinomiales

En esta secciónseextiendenlos resultadospreviosde estetrabajo, desarrollados

paralos modelosbinomiales,alos dosmodelosde elecciónmúltiple másutilizados.Desdeun punto de vista general,esta extensiónno requiereplanteamientosadicionales,y el

problemabásicoconsisteen trabajarcon un vector de variablesdependientesde mayor

dimensión. Esteaumentode dimensiónsetraduceen una mayorcomplejidadanalíticaal

derivar instrumentosdediagnósticoapropiados,aunquelas cuestionesconceptualessobre

el tratamientode observacionesanómalasen modelosde variabledependientecualitativa

semantienen.

En particular, los residuosno son un instrumentoapropiadoy es necesarioderivar

estadísticosanálogosa los de la Sección3.4 que midan el efecto de unaobservaciónoconjunto de observacionessobre el vector de parámetrosdel modelo. En estepunto, el

problemade dimensiónhaceque ahoraseanecesariodefinir unamedidaescalardel efectode las observacionessobrelas probabilidadesestimadasparaderivarun estadísticoanálogo

al t, en [3.4.8].

Tambiénseránecesariodesagregarlos instrumentosdediagnósticoa priori, puesto

que, en general,en los modelosmultinomialespuedenaparecerdos tipos de variables:lascaracterísticasindividuales y las característicasde las alternativas, por lo que seranecesarioinvestigarseparadamente,individuosextremosy alternativasextrañasrespecto

al conjunto. Esto será especialmenteimportante para aquellas variables que no seanmedidasobjetivas, sino indicadoresde la percepciónque tiene el individuo sobre losatributosde la opción.

No obstante,los instrumentosy la forma de utilizarlos, es análogaa la expuesta

para los modelosde elecciónbinaria, por lo que nos remitimos a la línea argumentalymetodológicadesarrolladaen dicha sección.

Page 138: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 132

4.4.1. Observaciones anómalas en modelos de elección discretamúltiple: planteamiento

De formaanálogaa lo expuestoparamodelosbinarios, losproblemasderivadosde

la presenciade observacionesanómalasen las muestrase ha tratadopoco y. en general,

bajo planteamientosmetodológicosdistintos de los desarrolladosen este trabajo. Lostrabajosanterioressehancentradoen un marco,aparentementemásamplio, comosonlosmodelos linealesgeneralizadoso se han basadoen un enfoquede análisis de influencia.

Entre estos trabajos se puedencitar Lesaffre y Albert (1989) que enfocanel problemadesdeel punto de vista del análisis de influenciay seestudiael caso de los modelosde

elecciónmúltiple. Por otra parte,Cook y Weisberg(1980)generalizanalgunosresultadosde Cook (1977) para los modeloslinealesgeneralizados(GLM), Williams (1987) tambiénpresentaresultadossobrediagnosisparalos GLM, Green(1984)desarrollaalternativasde

estimaciónlinealesy de estimaciónrobustay resistenteparael casode los GLM, algunode cuyoscasosparticularesincluye modelosde elecciónmúltiple.

Comose planteóanteriormentepara modelosbinarios, en estetrabajose trata el

problema partiendo de la definición de observaciónanómala que se ha introducido

anteriormente:una observaciónanómala es aquella queno se ha generadopor el niismo

modelo estocásticoque sesuponepara las restantesobservacionesmuestrales [Box yTiao (1968)].

A partir de estadefinición,y utilizando los resultadospara los modelosbinariosessencillodemostrarquela existenciade anomalíasen la muestraafectaala consistenciadelestimadordemáximaverosimilitud. Ello sedebeaquelapresenciadeestasobservaciones

haceque la función de verosimilitud del modelo seadiferente de la habitual.

El planteamientobásicosiguelas líneasde la Sección2.3. Considerandoque unaproporción de observacionesha sido generadapor un procesodiferente a las restantes

observacionesdel modelo, se puedesuponerque las probabilidadesde elecciónde cadaindividuoestánformadaspor unacombinaciónlineal de funcionesdedistribución. Por unaparte, de la verdadera,y por otra, de la distribuciónde las observacionesanómalas.Estanuevacombinaciónlineal debeverificar quela sumade las probabilidadesde elecciónseala unidad.

Bajo esteplanteamiento,sepuedenformular probabilidadesde elecciónanálogasalas de los Apanados2.3.I.A y 2.3.1.B,y la funciónde verosimilitud en [4.3.1]tendríaambostipos de componentes.Nuevamente,los desarrollosdel Apanado2.3.2, sobre la

Page 139: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 133

Jnconsistenciadel estimadormáximo-verosímilsonde aplicacióninmediataaestecaso,porlo que no se repitenaquí.

Se puedenconsiderardos tipos de anomalíasen la variabley,1 : aquellasgeneradas

por una distribución con distinta varianza que las restantesobservacionesmuestralesyaquellasgeneradaspor una distribucióncon distinta media.

Con los MEM, esteplanteamientopuededar lugara casosparticularesdiferentes

de los modelosbinarios, por ejemplo, si se suponendistintasvarianzaspara diferentescomponentesdel vectordeperturbacionesparacadaobservación.Sobreesteaspectocabedecir que, si bien es unaposibilidad, la interpretaciónde la fuentede anomalíashaceque

seanpocoplausiblesy, por otra parte,en modeloscomoel logit multinomial, esnecesarioque todos los elementosdel vector de perturbacionessiganla mismadistribución. Por lotanto, estos casossepuedentraducir en nuevoserrores de especificaciónque afectaránatodos los parámetrosdel modelo(no sólo a los de la alternativapara la queseproduzcan),

por lo que el efectode observaciónanómalapuedemantenerse.

4.4.2. Estadísticos de detección de observaciones anómalas en losmodelos de elección múltiple

Nuestro primer objetivo es desarrollarun estadísticoque permitamedir el efecto

de eliminar unaobservacióncadavez sobrelos coeficientesestimados.Paraello, separtedel estimadormáximo-verosímilpor procedimientoslineales en (4.3.19], con el fin de

obtener,de forma computacionalmenteeficiente,estimacionesde fi cuandoseelimina unaobservación. Sobre este punto, convienedestacarque, aunquese han derivado otrosestimadoresde máxima verosimilitud por procedimientoslineales, como en Amemi-

ya (1S85), la parametrizaciónempleadapara derivar el estimadoren (4.3.19] permitellevar a cabolas siguientesfasesde esteanálisisconmuchamayorsencillez. En concreto,Amemiya (1985). deriva los diferentes bloques de los elementosque componen el

estimadora partir de bloquesde parámetros.

En primer lugar, es necesariodesarrollarexpresionesdel estimadorque permitanobtenerestimacionesde ¡3 cuandose elimina una observación,eficientemente.Paraello,

se introduceprimerola siguientenotación:

Page 140: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 134

‘¾=Lw [4.4.1]

donde I~ y f están definidas en [4.3.4] y [4.3.5], respectivamente.Además, seaA = diag(A ¡1) la matriz diagonal por bloques de dimensión (m-l)nx(m-l)n y

vi«j.

Partiendode las definicionesanteriores,y dadauna condicióninicial del estimadorW, el estimadoren [4.3.19]en notaciónmatricial puedeescribirsecomo:

O = [WTAdWLIWIA-IY (4.4.2]

donde ?T = [9,,...,.94 y:

>,. =y. - y + vi~¡ [4.4.3]

En este contexto, la eliminaciónde una observaciónesequivalentea eliminar las

m-1 filas asociadasde la matriz W. Así, denotandocon el subíndice(i) aquellasmatrices

de las que se ha eliminado la observacióni, setienen las siguientesigualdades:

(W’t’Vv) = VVTAIW — 14A[iW, [4.4.4](0

(W’A~ y> - wti< y - -<1) y

1 [4.4.5]

Aplicando el lema de inversiónde matricesdado en [3.2.12] a [4.4.4] resultaque:

(WJAiW)J = (WÑI-’Wr[4.4.61

(WÑI -i W)-iwT[A - IV(WTA -l WY’ ViJ]-’W3IWTA -i WY’

Posmultiplicando[4.4.6] por la expresiónen [4.4.5] y despejando,queda:

-1 [A ~W(WTAí~íWT11(~

0(j) =0 — (WTA-I W9’W.LnI ~ — WT~> [4.4.7]

Bajo los mismos planteamientosque en la Sección3.4, una primera medida delefectoque tiene la i-ésimaobservaciónsobreel vectorde coeficientesestimadosresulta:

Page 141: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 135

= (0(,., — OY[WÑI ‘W] (&~ — &) [4.4.8]

Sustituyendola expresión[4.4.7] en [4.4.8] se obtiene una expresión,más sencilla decalcular,parael estadísticode influenciaen [4.4.8]:

= ~<§«A— N)N1(A1 — N1)¿<,.> [4.4.9]

donde N = 14§(W’A íW) WÑ

Dada la normalidad asintóticadel estimadormáximo-verosímil, la interpretación

en términos de regionesde confianzadel vector de parámetrosestimadosque seexpusopara los modelosbinarios sigue siendoútil paraseleccionarpuntosde corte indicativos.

Una última extensiónde estosestadísticosseencuentra,naturalemente,en evaluarel efecto que tiene una observaciónanómalasobre un conjuntode parámetros.Estecasoesespecialmenteimportanteen estecontexto,dondeel vector de parámetrosestaformado

tantopor subconjuntosde parámetros:los propios de cadaalternativay los asociadosa lascaracterísticasde las distintasopciones.De forma semejanteacomose hizoanteriormente,en primer lugar seconsiderauna medidade influenciaparael vector ~ = RO.

Unavez obtenidaslas estimacionesmáximo-verosímilesde 0, resultaevidenteque

la matriz de varianzas-covarianzasde ~ es:

R(WTA ‘14y1RT [4.4.10]

Por tanto, un estadísticoanálogoa [4.4.8]puedeformularse:

= (0<) — ¡J)TRT[R(WTA4 11/fíR?11R(0() — &> [4.4.11]

Sustituyendola expresión [4.4.7] en [4.4.11] y particularizandopara disintaseleccionesde R se obtieneel conjunto de estadísticosespecializadosde interésanálogosa los del Capítulo3.

Page 142: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 136

4.5. Resultados con datos simulados para el modelo logitmúltiple

Con el propósito de ilustrar que la presenciade observacionesanómalasinduceelmismo tipo de problemasen los modelos multinomiales, así como la analogía del

estadísticodedeteccióndeobservacionesanómalas[4.4.91respectodel derivadoen [3.4.81para modelos binarios, se ha realizado un subconjuntode las simulacionesque se

presentaronen los Capítulos2 y 3 paramodelosbinarios.

4.5.1. Planteamiento de los modelos

Seconsideraun modelologit conunasolavariableexplicativay términoconstante,

en el que las observacionesse hangeneradomedianteel siguientemecanismo:

= fi~ + fi,x. +

[4.5.1]

Y¿2 fi20 + fi2iXj + 812

y seobservaun vectorde variablesbinarias:

= 1 si < =y<)’ ]=2,3

y12 = 1 Si Y¡2 =YJ j=1,3 [4.5.2]

y5 = 1 demás casos

La variableexplicativase ha generado,en todos los casosde observacionesno

anómalas, como una normal, x — lid N(0, 1) y los vectores de parámetros son:(0.5, 2.57y ¡32 = (-0.5, 05)T~ Paragenerarlas perturbacionesdistribuidasEVD de

cadaecuación,seha empleadola transformaciónintegral,de modoaná]ogoacomosehizoparalas perturbacioneslogísticasen la Sección2.4. Dadoque ahorase trataconmodelosde elecciónmúltiple, las muestrasson de tamaño500. Cadaexperimentose replicó 500

veces.

A partir de estemecanismo,sehancreadomuestrasdondese incluye un porcentaje

w de observacionesy~ generadaspor la mismadistribución que parael resto, pero conmomentosdistintos de los que se acabande señalar. En particular, se consideranlos

siguientescasos,cuyos planteamientosteóricosse han discutidoen la Sección2.3:

Page 143: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 137

Caso 1: Un porcentajew de observacionesy1~ en la muestraprovienede unadistribucióncon la misma media que las restantesobservaciones,pero con la varianza

multiplicada por un factor h2 = 7.

Caso 2: Un porcentajew de observaciones~ proviene de la misma distribución con

varianzaigual a a0

2, pero con distinta mediaque las restantesobservaciones.En

concreto, se ha incluido una proporción w de observaciones tales queE(y

0~) = <-y1,] = 1, 2, donde-n = (0.2, 10)T y ~Y2 = (-1.0, 0.27. Obsérvese

que se ha consideradoun caso extremo, en el que las componentesde losvectoresy son muy diferentesa las de los vectores¡3.

Caso3: Un porcentaje w de observacionesestán caracterizadaspor E<y,~*) = x,Taj,

j 1, 2, e idénticavarianzaquelas demás,dondebi = (-0.5, 1~0)T ya2 = (0.3,-1~ Paralas observacionesanómalas,x1—lid N(5,1). Esto es, las componentes

de los vectoresa son parecidasa las de ¡3 pero, es de esperarque, para lasobservacionesanómalas,una proporción importantede los valores de x sean

mucho mayoresque los de las restantesobservaciones.

La interpretaciónde estos tres esquemas,expuestaen la Sección 2.4, es la

siguiente. El caso 1 sebasaen la ideade que laheterocedasticidadaparecefrecuentemente

en datosde seccióncruzada.Los casos2 y 3, puedeninterpretarsecomooriginadospor

las técnicasde muestreo,básicamenteel muestreoestratificado[Azoríny Sanchez-Crespo

(1986)1, técnica con la que se puede estar incluyendo en la muestra elementosde

subpoblacionesdistintas entre sí; por un lado, respectoal comportamiento,aunquenorespectoa sus variables características(caso 2) y por otro, respectoa sus variables

característicasaunquehomogéneasen su comportamiento(caso3).

4.5.2. Resultados de la simulación

En las Tablas 4.1-4.3sepresentanlos resultadosde la estimación,utilizandoel

método de máxima verosimilitud del Apaflado 4.3.2 para diferentesproporcionesde

observacionesanómalas.En las tablasfiguran, paradistintasproporcionesde observacio-nes anómalasen la muestra,los coeficientesestimados,las desviacionestípicasestimadas

de los coeficientesasociadosalas variablesexplicativas,el error cuadráticomediodefinidoen 12.4.41y la sumade cuadradosde residuosde cadaecuacióndefinidaen [2.4.5].

Page 144: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 138

Tabla 4.1. EstimacionesMV con anomalíasen la muestra: modelo logit multinomial,

caso 1

ño ¡ti $20 Ql dt(¡3,,) dt($2~) ECM SSRI SSR2 SSR3

0.0 0.5104 2,5264 -0.5023 0.4993 0.2265 0.1907 0.1380 69.21 62.10 78.72

2.5 0.4928 2.4560 -0.4970 0.5037 0.2205 0.1878 0.1415 70.49 62.85 79.54

5.0 0.4673 2.4072 -0.4889 0.4815 0.2170 0.1848 0.1521 71.20 63.95 80.50

7.5 0.4690 2.3128 -0.4749 0.5008 0.2095 0.1828 0.1588 73.45 64.81 81.11

10.0 0.4603 2.2648 -0.4677 0.4879 0.2058 0.1803 0.1739 74.29 65.56 81,75

12.5 0.4444 2.1828 -0.4590 0.4629 0.1998 0.1765 0.2145 75.95 66.95 83.03

¡5.0 0.4291 2.1433 -0.4603 0.4527 0.1969 0.1745 0.2513 76.87 67.54 83,84

¡7.5 0.4360 2.0856 -0.4225 0.4724 0.1927 0.1725 0.2923 78.55 69.07 84,34

20.0 0.4206 2.0356 -0.4278 0.4570 0.1889 0.1701 0.3374 79.68 69.64 85.12

22.5 0.4102 ¡.9777 -0.4143 0.4369 0.1852 0.1676 0.3965 81.13 71.12 86,37

25.0 0.3909 1.9204 -0.4138 0.4225 0.1812 0.1655 0.4624 82.53 72.00 87.58

27.5 0.3886 1.8866 -0.4082 0.4237 0.1788 0.1638 0.5058 83.45 72.46 87.91

30.0 0.3753 1.8374 -0.4061 0,4174 0.1757 0.1626 0.5734 85.08 73.43 88.79

labIa 4.2. Estimaciones MV con anomalías en la muestra: modelo logit multinomial,caso2

it ñ0 It1 dtGS1) dt~321) ECM SSR1 SSR2 SSR3

0.0 0.5072 2.5280 -0.4999 0.5027 0.2265 0.1903 0.1441 69.15 62.30 78.962.5 0.4891 2.4446 -0.5207 0.4852 0.2200 0.1877 0.1338 70.57 62.22 79.66

5.0 0.4899 2.4072 -0.5346 0.4922 0.2169 0.1875 0.1483 71.14 61.73 79.997.5 0.4738 2.3102 -0.5525 0.4640 0.2094 0.1848 0.1643 72.89 62.02 81.27

10.0 0.4572 2.2519 -0.5736 0.4400 0.2050 0.1835 0.1960 73.86 61.94 82.1312.5 0.4515 2.2059 -0.5911 0.4378 0.2017 0.1825 0.2214 74.99 61.54 82.6415.0 0.4464 2.1513 -0.6071 0.4351 0.1972 0.1816 0.2650 76.16 61.37 83.29

17.5 0.4268 2.0837 -0.6228 0.4067 0.1923 0.1789 0.3147 77.30 61.66 84.4820.0 0.4142 2.0442 -0.6389 0.3976 0.1895 0.1786 0.3559 78.26 61.47 85.21

22.5 0.4127 1.9865 -0.6492 0.3928 0.1852 0.1769 0.4147 79.58 61.49 85.89

25.0 0.4023 1.9423 -0.6646 0.3846 0.1822 0.1762 0.4698 80.89 61.39 86.8527.5 0.3973 1.9050 -0.6756 0.3825 0.1795 0.1758 0.5222 81.73 61.41 87.48

30.0 0.3781 1.8474 -0.7043 0.3456 0.1756 0.1737 0.6108 83.01 61.05 88.72

Page 145: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 139

Tabla 4.3. EstimacionesMV con anomalíasen la muestra: modelo logit multinomial,

caso 3

$IO ~20 It1 dtQ3~~) dt(Q~) ECM SSRI SSR2 SSR3

0.0 0.5035 2.5224 -0.4993 0.5093 0.2261 0.1907 0.1475 69.38 62.29 78.772.5 0.4908 2.4911 -0.5196 0.4910 0.2266 0.1919 0.1478 67.36 60.48 76.95

5.0 0.4739 2.4357 -0.5364 0.4744 0.2250 0.1922 0.1776 66.24 58.93 75.46

7.5 0.4759 2.3995 -0.5437 0.4594 0.2254 0.1945 0.1920 64.72 57.39 73.6210.0 0.4673 2.3686 -0.5555 0.4487 0.2256 0.1955 0.1857 63.01 55.72 71.6712.5 0.4584 2.3005 -0.5533 0.4278 0.2233 0.1953 0.2284 61.54 54.73 69.99

15.0 0.4442 2.2407 -0.5748 0.4103 0.2213 0.1970 0.2865 60.41 53.12 68.5617.5 0.4386 2.1839 -0.5895 0.3768 0.2200 0.1979 0.3477 58.64 51.47 66.58

20.0 0.4485 2.1536 -0.5917 0.3803 0.2204 0.2002 0.3606 57.34 49.89 64.60

22.5 0.4184 2.0952 -0.6093 0.3543 0.2189 0.2004 0.4115 55.67 48.57 63.14

25.0 0.4229 2.0711 -0.6245 0.3464 0.2199 0.2038 0.4596 54.14 46.56 61.06

27.5 0.4059 2.0135 -0.6446 0.3373 0.2180 0.2052 0.5206 52.53 44.92 59.25

30.0 0.3848 1.9430 -0.6641 0.2964 0.2149 0.2052 0.6176 51.16 43.73 57.79

A la vista de estos resultados,es posiblehacer las siguientesconsideraciones:

• De forma análogaa lo que ocurría para los modelosbinarios, el estimador

máximo-verosímilessesgado.Esto puedeapreciarseen la primerafila de cada

tabla, dondeno hay observacionesanómalasen la muestra.

• La presenciade observacionesanómalasen la muestra,de forma semejanteacomo ocurría para los modelos binarios, induce importantessesgosen loscoeficientesestimados,más que en las desviacionestípicas estimadas.Como

puedeobservarse,en todos los casos,los sesgosdependenpositivamentede la

proporción de observacionesanómalas, confirmando la inconsistenciadelestimadormáximo-verosímilantela presenciade esteproblema.

• A diferenciade lo que ocurríacon los modelos binarios, dondelos sesgosde

estimacióneranbastantediferentessegúnel tipo de anomalíapresente,en lastablasanterioressepuedeobservarque la magnitudde los cambiosessemejante,

con independenciadel tipo de anomalíapresente.También el ECM tiene uncomportamientohomogéneoen todos los casos. Esto, posiblemente,se puede

Page 146: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 140

atribuir a la mayorcomplejidadde los modelos,que haceque el efecto de las

observacionesanómalasse repartaentretodos los coeficientesdel modelo.

• Comopuedeobservarse,la sumade cuadradosde residuoses máspequeñaen

el caso3 que en los demáscasos.La explicación de estehecho,comosucedía

en los modelosbinarios se puedeatribuir a que, las observacionesextremasen

este caso,dadoque los parámetrosson parecidosa los del niodelo verdadero,

son másfáciles de prever.

En las Tablas 4.4-4.6sepresentanlos valores mediosdel estadísticode influenciaindividual paratoda la muestra,así como las mediasparalas observacionesno anómalas

y anómalas.En las dosúltimas columnasfiguran los ratiosentrela mediadel estadístico

c para las observacionesno anómalasy anómalasy los ratios entre la media para las

observacionesanómalasy la muestracompleta.

Tabla 4.4. Valores mediosdel estadísticoé~: modelo logit multinomial, caso 1.

t,(B) é1(M) t/M)/é~(B) é~(M)/é,

0.0 0.0080 0.0080 -- -- --

2.5 0.0081 0.0078 0.0190 2.4243 2.3377

5.0 0.0082 0.0076 0.0183 2.3909 2.2355

7.5 0.0082 0.0074 0.0174 2.3402 2.123810.0 0.0082 0.0072 0.0169 2.3428 2.0654

12.5 0.0082 0.0071 0.0158 2.2131 1.919715.0 0.0082 0.0070 0.0155 2.2277 1.8812

17.5 0.0082 0.0068 0.0150 2.2044 1.818920.0 0.0082 0.0067 0.0144 2.1599 1.7532

22.5 0.0083 0.0065 0.0142 2.1692 1.7158

25.0 0.0083 0.0064 0.0138 2.1428 1.666727.5 0.0083 0.0063 0.0134 2.1080 1.6143

30.0 0.0083 0.0063 0.0130 2.0679 1.5662

Page 147: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 141

Tabla 4.5. Valores medios del estadístico él: modelo logit multinomial, caso2.

n7c é,(B) é1(M) ¿Y(M)Ié(B) &(M)/é,

0.0 0.0081 0.0081 -- —

2.5 0.008! 0.0079 0.0158 2.0024 1.95155.0 0.0081 0.0077 0.0146 1.8898 1.8093

7.5 0.0081 0.0076 0.0146 1.9269 1.800110.0 0.0081 0.0075 0.0138 1.8428 1.699612.5 0.0081 0.0074 0.0133 1.8099 1.6423

15.0 0.0081 0.0073 0.0132 1.8178 1.6192

17.5 0.0082 0.0074 0.0129 1.8016 1.578920.0 0.0082 0.0070 0.0126 1.7951 1.5488

22.5 0.0082 0.0070 0.0123 1.7586 1.5012250 00082 0.0069 0.0121 1.7574 1.477627.5 0.0081 0.0068 0.0116 1.6992 1.4244

30.0 0.0082 0.0067 0.0115 1.7069 1.4083

Tabla4.6. Valores mediosdel estadísticoé1: modelo logil multinomial, caso3.

q t1(B) é1(AI) é/M)/é,(B) ñ(AI)¡é1

0.0 0.0081 0.0081 -- — --

2.5 0.0083 0.0082 0.0134 1.6398 1.6130

stO 0.0086 0.0083 0.0141 1.1030 1.64527.5 0.0088 0.0084 0.0143 1.7024 1.6161

10.0 0.0091 0.0085 0.0143 1.6844 1.576512.5 0.0093 0.0087 0.0135 1.5555 1.4537

15.0 0.0097 0.0087 0.0152 1.7452 1.5697

17.5 0.0097 0.0089 0.0136 1.5290 1.398720.0 0.0401 0.0090 0.0144 1.6055 1.4321

22.5 0.0102 0.0092 0.0138 1.4998 1.3476

25.0 0.0105 0.0093 0.0140 1.5148 1.3421

27.5 0.0106 0.0095 0.0135 1.4241 1.2749

30.0 0.0108 0.0097 0.0134 1.3866 1.2425

Page 148: Anomalias Del Modelo Lineal General

OBSERVACIONES ANÓMALAS EN MEM 142

En estegrupode simulaciones,los resultadossonanálogosalos obtenidosparalosmodelosbinarios. A la vistade las tablas,esposiblehacerlas siguientesconsideraciones:

• Dadoquese tratade un estadísticode influencia individual, la mayordiferencia

entreel valor mediopara las observacionesanómalasy no anómalasseproducepara valores bajos de w. Para proporciones elevadas de observaciones anómalas,

el efecto individual de cada una de ellas queda enmascarado por las restantes y,

por tanto, la media del estadísticoindividual es inferior, aunquesiemprepor

encima de la media para las observaciones no anómalas.

• Como ya ocurríaen los modelosbinarios, en el caso 3 la diferenciaentre el

estadístico individual para observacionesanómalasy no anómalases inferior queen los demás casos, debido a que estas observaciones sonextremasen el espaciode variables explicativas, pero dado que sus vectoresde parámetrosson muysemejantes a las observaciones no anómalas,la influenciaes limitada.

• A la hora de aplicar este criterio, debe tenerse en cuenta que será tanto más

válido cuanto menos observaciones influyentes se encuentren en la muestra, ya

que es una medida de influencia individual, y si aparecen problemas de

enmascaramiento no será tan útil. Por otra parte, también es necesario

considerar el número de observaciones que sobrepasan el nivel critico: si el

número es excesivo, habrá que elegir como influyentes aquellas observaciones

con valor más elevado puesto que, si se eliminan observaciones no anómalas, se

está eliminando información relevante, por lo que se pueden llegar a introducir

sesgos importantes en la estimación.

Page 149: Anomalias Del Modelo Lineal General

CAPiTULO 5

APLICACIONES CON DATOS REALES

5.1. Introducción

En este último capitulo se aplica la metodologíade detecciónde observaciones

anómalas desarrollada en los Capítulos 2 y 3 a dos muestras de datos reales. Aunque las

simulaciones realizadas ilustran bien el funcionamiento de los estadísticos propuestos, los

modelos planteadosno reflejan exactamentesituacionesreales,donde lo frecuenteseraencontrar pocas observaciones que condicionanlos resultadosde la estimacióny cuya

fuente de procedencia no se suele conocer.

En la Sección 5.2 se analiza la muestra utilizada por Dhillon et al. (1987), en un

estudio sobre la elección de tipos de interés fijos frente a tipos variables para préstamos

hipotecarios. El objetivo de esteprimer ejemploes ilustrar la necesidadde analizarlos

datos empleadosen cualquier estudio y, en particular, en los modelos de variabledependientecualitativa en busca de observacionestales que su sola presenciapuedacondicionar los resultadosde un análisis.

En la Sección 5.3 se aplican los planteamientos metodológicos desarrollados

anteriormente al mismo conjunto de datos utilizado en el trabajo de Pregibon (1981). El

interés principal se centra en comprobarque, comose ha argumentadoen el Capítulo2,los residuos son un instrumento muy limitado a la hora de detectarobservacionesínfluyentes y que, además, los estadísticosde influencia individual pueden resultar

insuficientesparadetectarsituacionesde enmascaramiento.Además, se ilustra el empleo

del métodode Peñay Yoliai (1991)aplicadoamodelosde variabledependientecualitativa.

Page 150: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 144

5.2. Elección de tipo de interés fijo frente a variable

En una nota en el Journal of Money, Credit andBanking, Dhillon et al. (1987)planteanel estudio de las característicaspersonalesy financieras que hacen que losindividuos elijan tipos de interés fijos o variables a la hora de contratar sus préstamos

hipotecarios. El artículo utiliza un modelo probit para determinar los principales factores

que influyen en la decisión. El interésprincipal del estudiosecentraen contrastarlas dos

posturasque dominan los planteamientosteóricos sobre el tema: la primera, pone de

relieve la independencia de las características personales del prestatario en la elección del

tipo, dados los precios y los términos del contrato’5; la segunda,supone información

asimétrica;estoes,dadaslas condicionesdel mercado,los prestatariospuedenfavorecerse

no revelandosus característicaspersonalesa la hora de firmar el contrato16.

5.2.1. Planteamiento del modelo

El modelobásico utilizado por Dhillon et al. (1987) relacionala probabilidadde

queun individuoelija, dadassuscaracterísticaspersonalesy las condicionesdel mercado,

un tipo de interésvariablepara un préstamohipotecario.

Los datos utilizadosson los queacompañan,en soportemagnético,al libro de Lott

y Ray (1992). Aunque estos autores afirman que se trata de los datos utilizados porDhillon et al. (1987), la variablePR (ratio entrelos pagoscon interésfijo y variable) noapareceen el archivo. Esto no plantea ningún inconvenienteserio, puestoque losresultadossonsemejantesalos obtenidosen el artículo original, aunquela omisiónde esta

variablepuedeexplicarlas diferenciasnuméricasobtenidas,enconcretoen la estimación

del término constante.

La muestraestácompuestapor 78 clientesde un bancohipotecariode Louisiana(EE.UU.). Los préstamosfueron concedidosduranteel períodoque va desdeenerode

1983 a febrerode 1984. Del total de observaciones,46 eligieron un tipo de interésfijo y

La información es simétrica, y el efecto de las características personales ya se encuentra incluido en los

términos del contrato.

¡6 La información asimétrica supone que existen características personales que, de conocerse, podrfan

perjudicar al prestatario.

Page 151: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 145

32 un tipo de interésvariable no acotado.Todos los préstamosa interés fijo teníanun

plazode vencimientode 30 años. Lasvariablesdisponiblesaparecendefinidasen la Tabla~.1 y un listado completode los datos utilizados se incluye en el ApéndiceA.3.

Los autores especificanun modelo probit no restringido utilizando todas las

variables disponibles(Modelo 3) y dos versionesrestringidasdel mismo. El Modelo 1

excluye las variables LA y STL, con el fin de contrastar la significación de dichas

variables económicaspersonales,mientras que el Modelo 2 excluye las variables de

característicaspersonales,con el propósito de contrastar la hipótesis de informaciónasimétrica.Unavariablefundamentalen el trabajoes la prima de riesgo, que se mide por

la diferenciade los tipos del Tesoroa diez y un año.

Tabla 5.1. Variablesen el modelo de elecciónde tipos de interés.

Variabledependiente

ADJ Ficticia, el individuo elige tipo de interésvariable, 1 = Sí.

Variablesexógenasde condicionesde mercadoy característicasdel contrato

FIMARYLD

PTS

MAT

Tipo de interésfijo.Margensobreel tipo de interés variable.Diferenciaentreel tipo de interésdel Tesoroa 10 añosmenosel de 1año.Ratio entreel tipo de interésfijo y variable.

Ratio entrelos vencimientosde los préstamoshipotecarioscon tipovariabley fijo.

Variablesexógenasde característicaspersonales

EA135

ElECE

MCSE

MOB

Edaddel prestatario.Años de escolarizacióndel prestatario.

Ficticia, el prestatariocompraviviendapor primeravez, 1 = Sí.Ficticia, existeun co-prestatario,1 = Sí.

Ficticia, el prestatarioestácasado,1 = Casado.Ficticia, el prestatariotrabajapor cuentapropia, 1 = Sí.

Movilidad: añosen la direcciónactual.

Variables exógenas de características económicas

NW

LA

STL

Riquezanetadel prestatario.Activos líquidos.Compromisosdel prestatarioa cortoplazo.

Page 152: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 146

5.2.2. Resultados empíricos con los modelos originales

En la Tabla 5.2 aparecenlos resultadosde la estimaciónde los tres modelos

consideradospor los autoresdel trabajo. Paraello se ha utilizado el métodode máxima

verosimilititud por procedimientoslineales expuestoel Apartado 1.3.2. Debajo delcoeficiente asociado a cada variable figura la desviación típica estimada. En las tres

últimas filas de la tabla, se ofrecen, para cada modelo, el logaritmo de la función deverosimilitud definido en [1.3.2], el valor del estadísticode contrastede razón de

verosimilitudesen [1.4.5] (bajo el modelo restringido)y el númerocondiciónde la matrizde varianzas-covaríanzasestimadaí?.

Siguiendo a Dhillon et al. (1987), y a la vista de los resultados de la Tabla 5.2 se

puedenhacerlas siguientesconsideraciones:

• Las variablesde precio resultanclaramentesignificativasy tienenlos signosque

cabría esperar,con la excepciónde la prima por riesgo (YLD) y el ratio de

vencimientos(MAT), que no son individualmentesignificativas.

• Las variablespersonalesno sonsignificativasindidividualmenteen ninguno de

los modelosque las incluyen, aunquellevandoa cabo un contrastede razónde

verosimilitudesentrelos Modelos 2 y 3, sí resultanconjuntamentesignificati-

vas’8, lo que presentauna evidenciaa favor de la hipótesis de informaciónasimétrica.

• Lasvariablesdecaracterísticaseconómicas(LA y STL) no resultansignificativas

en ningún caso, ni individual, ni conjuntamente.

• El númerocondición de las matricesde varianzas-covarianzases muy elevado

en todos los casos.Esto es un indicativo claro de que la estimaciónestámal

condicionaday, por tanto, pequeñoscambiosen la muestrapuedeninducir avariacionesimportantesen los coeficientesestimados.

~ Ratio entre el mayor y el menor autovalor de la matriz de varianzas-covarianzas

iS El valor tabularde la distribuciónxSes de 12.0 al 90% y de 14.1 al 95%. El valor del estadísticode

contraste es 16.8.

Page 153: Anomalias Del Modelo Lineal General

APLICAcIONES CON DATOS REALES 147

Tabla5.2. Estimaciónde los modelosoriginales de Dhillon et al (1987).

Constante

FI (Tipo fijo)

MAR (Margen)

YLI) (r10-r1>

PTS(Puntos)

MAT (Ratio de venci-

mientos)

BA (Edad)

BS (Estudios)

FTB (Primeracomprade

vivienda)

CB (Co-prestatario)

MC (Casado)

SE (Cuentapropia)

MOB (Movilidad)

NW (Riqueza neta)

LA (Activos líquidos)

STL (Compromisosa c. p.)

-3.4855

(5.2870)

0.9786

(0.3911)

-0.6268

(0.2588)

-2.2381

(1.43lO)

-0.7226

(0.3 753)

-1. 1366

(0.8927)

-0.003 1

(0.0390)

-0.1094

(0.0967)

0.2398

¡ (0.5208>-0.8061

(0.6044)

-1.0358

(0.6557)

-0.5906

(1.2238)

-0.0882

(0.0521)

0.1349

(0.090]>

Variable Modelo 1 Modelo 2 Modelo 3

In £ -31.53 .39.21 3073LRT 1.60 16.96

N0 condición 1.7e+6 1.4e+05 2.4e+06

-1.8774

(4. 2249)

0.4987

(0.2772)

-0.4310

(0.1736)

-2.3 840

(1.0880)

-0.2999

(0.2415)

-0.0592

(0.6147)

-3. 1077

(5.8775)

1.0081

(0.4107)

-0.7052

(0.2123)

-2.5251(1.5881)

-0.8303

(0.3977)

-1. 1644

(0.8946)

-0.0040

(0. 0429)

-0. 1083

(0.0998)

0.1434

(0.5583)

-1.0666

(0.6922)

-1.0586

(06728)-1.1275

(1,5598)

-0.0930

(0.0550)

0.1288

(01053)

0.0146

(0.0350)

0.0161

(0.0283)

0.0838

(0.0422>

Page 154: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REAtES 148

En la Tabla 5.3 aparecenlas elasticidades,calculadasmediantelas expresiones

[1.5.10], de la probabilidadde elegir un tipo de interésvariablerespectode las variables

continuasdel Modelo 3. Comopuedeobservarse,la variableque puedeproducirmayores

cambiosen la decisiónes el tipo de interés fijo. Un incrementodel 1 ?o puedellegar a

producir un importanteaumentoen la probabilidadde elegir el tipo variable (de hastaun

48%). No obstante,hay que teneren cuentaque el cambioen la decisióndel individuo

sólo seproducecuandolaprobabilidadde elecciónde ésteseencuentrapróximaa0.5, por

lo que seríanecesarioun cambiosustancialdel tipo de interés fijo para inducir cambios

en la decisión.

Tabla5.3. Elasticidades,parael Modelo 3, de la probabilidadde elegir un tipo de interésvariablerespectode las variablescontinuas.

Variable Media D.t. Mm Max

FI 17.23 13.29 0.00 47.86

MAR -2.49 2.62 -9.95 0.07YLD -5.41 4.26 -15.56 -0.00

PTS -1.69 1.67 -8.21 0.00MAT -1.55 1.23 -5.07 -0.00NW 0.30 0.38 -0.00 2.30

BA -0.19 0.16 -0.89 -0.00ES -2.21 1.81 -7.92 -0.00MOB -0.65 1.38 -7.95 -0.00STL 0.23 0.31 0.00 1.83LA 0.09 0.24 0.00 1.80

Conestos resultados,los autoresconcluyenque “... engeneral,las características

individualesdel prestatariotienenuna influenciadébil en el tipo de préstamoelegido. Hay

una tendenciaa que algunasclasesde prestatarios,... tienenpreferenciapor los tipos de

Interésvariable. Esto es consistentecon la hipótesisde informaciónasimétrica” Dhillonet al. (1987, pág. 265).

5.2.3. Detección de observaciones anómalas

En este apartadose aplica la metodologíadesarrolladaen la Sección3.4 para

detetectarobservacionesanómalase influyentes.En la Tabla 5.4 sepresentanun conjunto

Page 155: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 149

de instrumentos de diagnosis desarrolladosen el Capítulo 3 para un conjunto de

observacionestalesque presentabanvaloresapreciablesen algunode ellos.

Por columnas, la Tabla 5.4 contiene: el número de la observación, el estadístico

de distancia definido en [3.2.2], el estadístico u, de distancia para las variables

transformadas con las expresiones [3.4.4]-[3.4.5], el residuo definido en [3.3.1], el

estadísticode influencia individual de [3.4.8] y, por último, los componentesde los

autovectores asociados a los dos mayores autovalores de la matriz de influencia M definida

en ~

Tabla 5.4. Estadísticosde diagnósticopara las observacionesmássignificativas.

¿ Ji1 e1 y5 0.2006 0.3072 0.5854 0.9040 0.0460 -0.0010

14 0.3737 0.6298 06990 10.6700 -0.9762 0.011815 0.1491 0.5046 0.6070 3.1750 -0.0025 -0.007522 0.1905 0.2090 -0.8115 [.4380 0.0339 0.000123 0.1531 0.2305 -0.5074 0.4009 0.0094 0.000724 0.1531 0.2305 -0.5074 0.4009 0.0094 0.000725 0.1531 0.2305 -0.5074 0.4009 0.0094 0.000726 0.1905 0.2090 -0.8115 1.4380 0.0339 0.000135 0.0987 0.3097 -0.5198 0.7037 -0.0264 -0.000437 0.8889 0.9615 -0.2322 277.2000 -0.0103 -0.999845 0.3373 0.0315 -0.0008 0.0000 0.0001 0.000046 0.3579 0.0570 -0.0020 0.0001 0.0015 0.000053 0.1101 0.3102 -0.3445 0.3426 -0.0076 0.000155 0.0604 0.1820 -0.8855 2.1030 0.0194 0.005358 0.1353 0.4689 -0.6062 2.5580 0.0160 0.007059 0.4819 0.5944 -0.1261 0.5211 0.0338 0.001361 0.1650 0.3417 -0.3911 0.5066 0.1577 0.002162 0.1456 0.4145 -0.4997 1.2070 -0.0379 0.000063 0.3541 0.0832 -0.0042 0.00434 0.0028 0.000064 0.0637 0.2432 -0.4694 0.3757 0.0250 0.002167 0.1159 0.4599 -0.5995 2.3600 0.0022 0.002768 0.0976 0.1798 0.8874 2.1060 0.0815 0.004769 0.0996 0.3206 0.6719 1.4220 0.0102 -0.0023Ji 0.1208 0.1890 0.7418 0.8257 0.0478 0.003776 0.1211 0.2318 0.8253 1.8560 -0.0180 0.003677 0.1890 0.4327 0.4205 0.9757 -0.0072 0.001078 0.1482 0.3224 0.3790 0.4286 0.0343 0.0010

A la vista de la Tabla 5.4 se pueden hacer los siguientes comentarios:

• El estadístico 4 en [3.2.2] calculado para las variables continuas del modelo

sugiere que las observaciones 14 y 37 son extremas, muy especialmente esta

última. Una vez estimado el modelo por el procedimiento MV lineal del

Page 156: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 150

Apartado 1.3.2 y transformadas las variables, el estadístico Ji confirma que

existenalgunasobservacionesextremasen el espaciode las X.

• Atendiendoal estadísticopara cadaobservación,puedecomprobarseque la

número 37 toma un valor extremadamente elevado. También la observación 14

tiene una influencia alta, aunqueconsiderablementemenor que la 37. Nótese,

que el valor de la distribución Xis para una probabilidad del 10% es de 8.6,

aunqueestepuntocritico puedeconsiderarseelevado.Obsérvesetambiénque la

media del estadístico¿ para la muestracompletase encuentrapor encimade

cuatro, aunqueesamedia estámuy afectadadebido al valor extremo de la

observación37. Utilizando la mediade las observaciones,eliminandola 37, un

valor crítico bajo es, aproximadamente,1.5. Por último, un punto critico

mínimo seencuentraen 2k/ti, pero a la vista de la tabla, puederesultaren la

eliminación de un númeroexcesivode observaciones.

• Comose puso de relieve en los Capítulos 2 y 3, los residuos en los modelos de

variabledependientebinaria no sonuna indicaciónde la posibleanormalidadde

una observación. Comomuestra la Tabla 5.4, las observaciones cuyos residuos

son más elevadosno presentanningunaevidenciade anormalidadcuando seprestaatencióna los estadísticosde influencia’9.

• Según estos resultados, las observaciones14 y 37 puedencalificarse como

influyentes. El valor del estadísticode influenciaparael conjuntode ambasob-

servacionesresultaser 176.7. Además,dadoel carácterextremo de ambas,y

que la muestra es de tamaño reducido, la decisión adecuada es eliminarías en la

estimación.

• Paraanalizarel posibleefectode enmascaramientoprovocadoporestasobserva-

ciones, seha utilizado el procedimientode Peñay Yohai (1991) aplicadoa lamatriz Al definida en [3.4.17]. En las dos últimas columnasde la Tabla5.4aparecen los correspondientes componentes de los autovectores asociados a los

dos mayores aucovalores de Al. Como puede apreciarse, ambos autovectores

estánclaramentedominadospor las observaciones14 y 37, respectivamente.

También se puedecomprobarque la observación61, que no aparecía como

19 Aunquenose incluyenen la tabla,los residuosestandarizadostampocopresentabanvaloresespecialmente

elevados.Tan sólo un pequeñoporcentajede las observacionesteníaun valor superiora dosen valorabsolutoy ningúnresiduo sobrepasabatres en valor absoluto.

Page 157: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 151

potencialmenteinfluyente considerandolos estadísticosanteriores, tiene un

componenteasociadorelativamenteelevadoenel primerautovector(aproximada-

menteel doble que la siguienteobservación>,por lo que tambiénse incluye en

el grupode observacionesinfluyentes.El valor delestadísticode influenciapara

las tres observacionesresultaser de 170.4.

• Dado el reducido tamaño muestra>, pareceaconsejableno eliminar másobservacionessin contarcon informaciónadicionalsobreel diseñode la mues-

tra, Adicionalmente, se consideraronalgunas otras observaciones20como

potencialmenteinfluyentes. Los resultadosdel estadísticode influenciaconjunta,así comoel análisisde la muestrano permitíanconcluir que realmentelo fueran,

por lo que es preferible mantenerlas en la muestra.

En la Tabla 5.5 aparece la estimación de los tres modelos de la Tabla 5.2,

eliminando el efecto de las observaciones 14, 37 y 61. A efectos de comparación, en la

última columna de la tabla se incluye el Modelo 3 estimadohasta la convergenciasin

dichasobservaciones(Modelo Y).

Las principales diferencias con respectoa las estimaciones resumidasen la

Tabla5.2 son:

• Al contrario que con los modelosde la Tabla 5.2, realizando un contraste de

razón de verosimilitudes, sepuede rechazarla hipótesis de que las variablesfinancieras personales, LA y STL, son no significativas. Adicionalmente, se

confirma menor aversiónal riesgo de los individuos más ricos (coeficientes

positivos y significativosde LA y NW).

• La importanciade las variablespersonales,utilizando el mismo contrasteque

con los datosoriginales,puedeconsiderarsesuperior.Algunasvariablespasan

a ser individualmente significativas, en concreto: BA, BS y CB.

20 En particular,se llevarona cabopruebasincluyendocomo influyentes,ademásde las mencionadas14,

37 y 61, las observaciones68 y 69

Page 158: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 152

Tabla 5.5. Estimación de los tres modelosconsideradoseliminando el efecto de las

observaciones14, 37 y 61

C oristante

FI (Tipo fijo)

MAR (Margen)

YLO (r10-r1)

PTS (Puntos)

MAT (Ratio de vencimien-

[05)

BA (Edad)

ES (Estudios)

ETE (Primeracomprade

vivienda)

CB (Co-prestatario)

MC (Casado)

SE (Cuentapropia)

MOB (Movilidad)

NW (Riquezaneta)

LA (Activos líquidos)

STL (Compromisosa c. p.)

-4.5046 ¡

(5.4612)

0.8075

(0.3 966)

-0.3098

(0.3021)-1.4383

(1.6207)

-0.7358

(0.3867)

0.1122

(1.0311)-0.2141

(0.0737)

-0.0123(0.0398)

-0.0866(0.0971)

0.0021(0.5338)-0.8557

(0.6268)

-0.6201(0.6802)

-0.4544

(1.2332)0.1867

(0.0951)

-1.1074

(4.2720)

0.5402

(0.2826)

-0.5000

(0.1864)-2.9296

(1.2077)-0.3719

(0.2704)

-0.1849(0.6404)

0.0816(0.0430)

-4.7255

(6.0367)0.7735

(0.4197)

-0.2779

(0.3163)

-0.6247

(1.8326)

-0.6362

(0.4105)

0.3134

(1.0958)

-0.1958

(0.0849)-0.05 14

(0.0468)-0.1120

(0. 1011)-0.3887

(0.5908)

-1.3870

(0.7348)

-0.3346

¡ (0.7104)

-3.6371

(1.9868)

0.1974

(0.1154>0. 1506

(0.0879)

0.0462

(0.0306)

Variable Modelo 1 Modelo 2 Modelo 3 Modelo V

In 1? -42.80 -39.41 -55.46 -22.39LRT 25.32 32.10

N0 condición 1.7e+6 1.4e+5 2.2e+6 1.9e-4-6

-5.5329

(6.2820)

1. 1339

(0.4488)

-0.2064

(0.3082)

-0.58 17

(1.9498)-1.1011

(0.4857)

-0.2943(1.1719)

-0.0602

(0.0664)

-0.2311

(0.1156)

-1.4168

(0.9045)

-1.8438(0.9051)

-0.4495(0.7130)

-4.2153(2.4431)

-0.7308

(0.2861)

0.6 143(0.2305)

00699

(0.0762)0.06 14

(0.0372)

Page 159: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 153

• Los cambiosen los coeficientesestimadosparael Modelo 2 son muy pequeños,

lo que hace suponerque la fuente de las anomalíasprocedede variables de

característicaspersonales.Estehechoes lógico ya que,dadoel lapsode tiempo

en quesetomaronlos datos,no cabeesperarqueel mercadosufrieravariaciones

sustanciales.

• Debidoa los cambiosen los coeficientes,las elasticidadesestimadastambiénhancambiado.Como puede apreciarseen la Tabla 5.6, las elasticadadesde las

variables que ahora son significativas son claramentesuperiores a las que

aparecíanen la Tabla 5.2.

Tabla5.6. Elasticidades,parael Modelo 3, de la probabilidadde elegir un tipo de interés

variablerespectode

nes 14, 3>7 y 61.

las variablesContinuasunavez eliminadoel efectode las observacio-

Variable Media D.t. Mm Max

FI 14.28 13.59 0.00 56.80

MAR -1.01 1.22 -5.75 0.04YLD -1.43 1.33 -5.84 -0.00PTS -1.30 1.35 -5.63 0.00

MAT 0.44 0.42 0.00 2.01NW 0.47 0.72 -0.00 4.00

BA -2.72 3.11 -16.30 -0.00135 -2.41 2.30 -11.84 -0.00

MOB -2.16 5.48 -31.05 -0.00STL 0.62 0.81 0.00 3.75LA 0.62 1.30 0.00 9.14

Finalmente,sepuedeconcluir que, a diferenciadel artículooriginal, las variables

personalessí resultanser relevantesa la hora de explicar la elecciónde tipo de interésy,

por tanto, estosresultadosapoyanclaramentela hipótesisde informaciónasimétrica.La

menoraversiónal riesgo de los individuos másricos, sugeridapor Dhillon et al. (1987)

tambiénquedacontrastada,asi comola mayoraversiónde los individuos de másedad.Tal

y comoellosconcluyen,hay algunostipos de individuos queprefierenmásclaramentelos

tipos de interésvariables: aquellasfamilias con co-prestatarios,las parejascasadasy los

individuos con elevadamovilidad.

Page 160: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 154

5.3. Análisis de los datos de Pregibon (1981)

En Pregibon (1981) se presenta,comoejemplo, el análisis de unos datos sobre

vaso-constricciónen la piel de los dedos. Los datos procedende Finney (1947), aunque

aparecenlistadosen la Tabla 1 del artículo, de dondese hantomado. En el ApéndiceA.3

se incluye el listado completode estasobservaciones.

Las variableendógena(VC) es binaria, y estácodificadacomo uno si el individuo

presentóvaso~constricciónen la piel de los dedosy ceroen casocontrario. Las variables

exógenasson la Lasa (tasa)y el volumen (vol) de aire inspiradoduranteuna fasepasajerade vaso-constricciónde la piel de los dedos.Pregibon(1981) estimaun modelo logit conlas variables en logaritmos. Utilizando el algoritmo de máxima verosimilitud por

procedimientos lineales desarrollado en el Apartado 1.3.2, el modelo estimado,

numéricamente idéntico al del artículo original, resulta ser:

In ____ — —2.875 + 4.562 lnrasa. + 5.179In vol.-r

(1.319) (1.835) (1.862)

En la Tabla 5.7 se muestran los estadísticos de diagnóstico para todas las

observaciones de la muestra. Por columnas, la Tabla 5.7 contiene: el número de la

observación, el estadístico de distancia definido en [3.2.2], el estadístico Ji1 de distancia

para las variables transformadas con las expresiones [3.4.41-13.4.5],el residuodefinido

en [3.3.1], el estadístico de influencia individual de [3.4.8] y, por último, los componentes

de los autovectoresasociadosa los dos mayoresautovaloresde la matrizde influenciaM

definida en [3.4.17].

Page 161: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 155

Tabla 5.7. Estadísticosde diagnosisparatodas las observacionesen la muestra.

fi, Ji, e, é,. ¡

0.04640.01790.07870.92520.21840.2705

-0.001105097

-0.0087-0.0009-0.0014-0.2047-0.37530.06150. 15920.02420.00500.8941

-0.53460.0547

-0.0114-0.1495-0.5120-0.65190.1007.002480.1173

-0.44690.4465

-0.00970. 2776

-0. 0000-0.59260.22880.22600.1890

-0.4469-0.19190.3322

0.00550.00090.00591. 28700.04140.07870.00000.06520.00030.00000.00000.05250. 13950.00400.03370. 00110.00010.98450. 20030.043340.00050.022 10.09350. 15580.00740.00160.01010.05970. 19610.00060. 16610.00000.08240.02020.01800.03520.05970.02930.0295

23456789

loII121314¡51617181.92021222324252627282930313233343536373839

0. 14560.14120.039 10.01010.04530.05500.02960.01200.00470.02550.01870.052 10.05 120.04230.05900.080 10. 14070.005 10.02570.05 130.07470.00320.01340.02 100.03800.02350.04220.01390.03550.03800.08250.42030.01510.02450.02300.04840.01390.01710.0176

0.09270.04290.06120.08670.11580.15240.00760.05590.03420.00720.00970.14810.16280.05510.13360.04020.0 1720.09540.13150.05250.03730. 10150.076 10.07170.05870.05480.066 10.06470. 16820.05070.24590.00000.05100.06010.05520.11770.06470.10000.053 1

-0.0797-0.0279-0.02890.21370.03740.0958

-0.00050. 11320.00000.0000

-0.0002-0.1351-0.2096-0.03060.0413

-0.0259-0.00710.07120.4290

-0.0434-0.01080.00850.24330.3898

-0.0666-0.0120-0.09480.0221

-0.44080.0066

.0.44630.00000. 1302

-0.0501-0.07250.03260.0221

-0.0458-0.1384

-0.0132-0.0085-0.02080.6863-0.0143-0.0048-0.00 16-0.1152-0.0102-0.00 14-0.0020-0.1014-0.1185-0.0189-0.0257-0.0109-0.00360.6072

-0.1442-0.0168-0.0119-0.0911-0.1278-0.0892-0.0185-0.0232-0.0161-0. 11900.i233

-0.01190.0432

-0.0000-0.0922-0.0041-0.0028-0.0200-0. 1190-0.09950.035 1

A la vista de los estadísticos de la Tabla 5.7 se pueden hacer la siguientes

afirmaciones:

• Considerandoel estadísticoÉ, las observaciones4 y 18 resultan claramenteinfluyentes, tanto de forma individual como conjunta, puesto que ambas exceden

2el valor crítico de la distribucíonx que, para un 10% de confianza,es0.584.

Page 162: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 156

El valor medio del estadísticoresulta ser 0.1. El estadísticode influencia

conjuntaresultaser 5.6.

• Las observación32, así como las 1, 2 y 17 que podían ser potencialmente

influyentes,dadoque se encuentranalejadasdel centrodel espaciode las X, no

revelaronnadaconcluyentea la vista de ¿, y de los componenentesasociadosde

los autovectores.

• Al analizar la existencia de un posible efecto de enmascaramiento, se observa

que el segundoautovectorestáclaramentedominadopor las observaciones4 y

18, ambasinfluyendoen el mismo sentido(igual signodel componenteasociado

del autovector). Sin embargo, en el primer autovector se observan dos grupos

de observacionesdominantes,el formado por la 19 y la 24, ambascon signo

positivo, y el formado por la 29 y 31, ambascon signo negativo. Los estadísti-

cosde influenciaconjuntaresultaronser 1.26 parael par {31, 29} y 0.85 para

el par {24, 19}. Por tanto, pareceque, al menosel primer grupoesanómalo(un

valor elevadodel estadísticode influenciaconjunta)y estáenmascaradopor las

observaciones4 y 18 quetienenel mismosentidode influencia(mismo signoen

los componentes de los autovectores).

• En su trabajo, Pregibon (1981) sólo detecta las observaciones 4 y 18, puesto que

sólo éstas muestran tanto un residuo como un estadístico individual elevado. No

obstante, el grupo [4, 18, 29 , 31} acumulauna influenciade 9.48, siendo el

conjunto de mayor influencia. Nuevamente,y a falta de informaciónadicional,

se puede eliminar este conjunto de observaciones.

En la Tabla 5.8 se muestranlas estimacionesdel modeloeliminandoel efectodel

grupo de observacionesde la primera fija de la tabla. En la fila inferior, apareceel

estadístico de influencia conjunta.

Page 163: Anomalias Del Modelo Lineal General

APLICACIONES CON DATOS REALES 157

Tabla 5.8. Estimaciones del modelo de Pregibon eliminando

observacionesy estadísticosde influenciaconjunta.

distintos conjuntos de

1 = {0} ~4,18} {29. 3Q fl9, 24}{4, 18,29, 31}

Const

Tasa

Vol

-2.8754

4.5617

5.1793

-5.8591

8.1523

9.0431

-3.4866

5.2717

4.7612

-2.3026

4.0575

5.3940

-6.7427

9.1817

8.6468

-- 5.5680 1.2620 0.8459 9.4840

Comopuedeobservarse,el efectodel grupo {29, 31} es muy pequeño,especial-mente si se comparacon el efecto de los restantes.El grupo {4, 18} es el de mayor

influencia, pero cuandoseañadeel par {29, 31} el cambioresultaaún másapreciable.

Como conclusión de esta seccióncabedecir que, para detectarobservaciones

anómalas,no es suficiente con el análisis de residuos y los estadísticosde intluencia

individal, sino que,además,es necesarioanalizarla influenciadegruposde observaciones.

Para seleccionar eficientemente dichos grupos de observaciones, el método propuesto por

Peña y Yohai (1991), aplicado a una matriz de influencia propia de los modelos de

elección cualitativa, mantienela validez del planteamientoaplicadoa los modelosde

regresiónlineal.

Page 164: Anomalias Del Modelo Lineal General

CONCLUSIONES

Conclusiones generales

La principal conclusiónque sepuedeobtenerde estetrabajoes que, como se ha

pueste de relieve, la presenciade observacionesanómalas en modelos de elección

cualitativatiene comoconsecuenciala inconsistenciadel estimadormáximo-verosímil.La

detecciónde observacionesanómalasen dicha clase de modelos presentadiferencias

sustancialescon respectoa los modeloslineales,o a los linealesgeneralizados,que hacen

necesarioderivar una metodologíapropiaparaabordarel problema.

En este trabajo se ha analizado el efecto de las observacionesanómalasbajo

planteamientosparamétricosy se handerivadoinstrumentosde detecciónapropiadospara

modelosdeeleccióndiscreta. Las principalesaportacionesdeestetrabajopuedenresumirse

en los siguientespuntos:

• El estimador máximo-verosímil en los modelos de variable dependiente

cualitativa, ante la presenciade observacionesanómalas,es inconsistente.Se

demuestra que la inconsistencia depende tanto de la proporción de observaciones

anómalasexistentescomode los parámetrosque caracterizanla distribuciónde

dichos datos.

• Los residuos,y en general,la meraextrapolaciónde los planteamientosparael

modelo lineal general, no son un instrumento apropiado.Se han derivado

estadísticos específicos que miden el efecto de una observación o conjunto de

observacionessobreel vectorde parámetrosdel modelo. En general,es posible

adaptarlos instrumentosutilizadosparael modelo lineal generalo los modelos

linealesgeneralizados,peroestasextensionesdebellevarsea caboconsiderando

las particularidadesde los modelosde variabledependientecualitativa.

• Se han derivado estadísticos de influencia para su aplicación tanto a modelos de

elección binaria como múltiple. Además, se han particularizado dichos

estadísticosparael análisisde influenciasobregruposde parámetroso conjuntos

de observaciones.

Page 165: Anomalias Del Modelo Lineal General

CoNcLusIoNEs 159

• Utilizandoexperimentosde Monte Carlo, sehan comprobadolos efectosde las

observacionesanómalasque sugeríanlos desarrollosteóricosy sehan validado

los estadísticospropuestos,poniendode relievesus limitacionescuandoaparecen

efectosde enmascaramiento.

• Definiendo las matrices de influencia adecuadas, se ha extendido el plantemiento

de Peña y Yohai (1991) para tratar el enmascaramiento en modelos de elección

binaria. También se ha comprobado su funcionamiento, tanto con datos

simuladoscomo con datos reales.

• Se ha desarrollado un algoritmo de máximaverosimilitud por procedimientos

linealesparamodelosde eleccióncualitativamúltiple. Estealgoritmo,semejante

al de Amemiya (1985),permite estimareficientementelos modeloseliminando

conjuntosde observaciones,lo que haceposiblela derivaciónde estadísticosde

influenciapara estaclasede modelos.

Finalmente, con el conjunto de instrumentos desarrollados, se ha planteado una

metodologíade diagnosisy detecciónaplicadaa dos muestrasde datos.

Extensiones

Una primeraextensiónposible,es la derivaciónde unaversión del algoritmo EM

particularizadapara la estimaciónde modelosconanomalías.La ideabásicaessepararlosconjuntos de observaciones anómalas y no anómalas utilizando los estadísticos de

influencia y estimar los parámetroscaracterísticosde ambos conjuntos mediante un

procedimiento iterativo que contemplara ambos pasos.

Una segundaextensión importantese centra en un análisis exhaustivode los

estadísticosLM propuestospara contrastar las hipótesis correspondientessobre laprocedencia de las anomalías. A la vista de los resultados obtenidos, el principal problema

es su falta de potenciapara discriminarentrelas posiblesfuentesde anomalías,aunque

funcionanbien paracontrastarsi determinadosconjuntosde observacioneslo son.

Una última extensiónrelevantees el análisisde valorescríticos de los estadísticos

de influenciapropuestos.Sibien parecedifícil determinarsusdistribucionesteóricas,una

extensiónde granutilidad puedeser el desarrollode distribucionesempíricasquepermitanla clasificaciónde observacionesde unaforma objetiva, sin requerir el análisispormenorí-

Page 166: Anomalias Del Modelo Lineal General

CONCLUSIONES 160

zado del investigador. Esta idea también es aplicable al procedimiento de Peña y

Yohai ([991) paradeterminargruposde observacionesinfluyentes.

Page 167: Anomalias Del Modelo Lineal General

APÉNDICES

A.1. Concavidad Global de las Funciones de Verosimilitud delos MEB

Es importanteanalizar la concavidadde las funciones de verosimilitud de los

modelosbinarios y, especialmente,de los modelosprobit y logit por dos razones:i) para

una función de verosimilitud estrictamente cóncava, si existe un EMV, este será único, y

¡1) desdeel puntode vistadel procedimientoiterativo no restringidoquese utilice, apesar

del incumplimientode algunade las hipótesisrealizadassobrela funciónde verosimilitud,

la concavidad asegura la convergencia de los algoritmos.

Aunque la concavidad de la función de verosimilitud para probit y logit binarios

ha sido ampliamente demostrado en la literatura [Amemiya (1985) es un ejemplol, en un

artículo reciente Núñez (1990) plantea una clase general de modelos de elección binaria

y derivacondicionesbajo lascualesla funcióndeverosimilitudseráestrictamentecóncava.

A continuaciónsepresentanlos principalesresultadosde dicho trabajo.

Definición D.A.1.1. Clase4’ de funcionesde densidad.SeafQ)la función de densidad

de unavariablealeatoriade tipo continuo. Se dicequef ~ 4’ si y sólo si se verifican las

siguientes condiciones:

A. f’(x) > O, vx < O, y

B. f(x)=f(—xYVxER.

Partiendode la definición anterior, las principalescaracterísticasde las funcionesque pertenecena dichaclasepuedenresumirseen:

1> Son funcionescontinuasy estrictamentepositivassobre.11.

2) Sif E tf’(x) < O, Vx > 0.

3) Alcanzan su máximo en x=O y éstees único.

4) Sif E ‘1’, se cumple que

Algunas densidades pertenecientes a la clase definida son la normal, la logística o

la Cauchy.

Page 168: Anomalias Del Modelo Lineal General

APÉNDICES 162

o1J f(x) = rf(x)~ - [A.1.1]

-~ >6

Lema L.A.1.I. Sea el MEB definido en [1.2.13]. Si F(~) es la función de distribución

correspondientea una función de densidadji?) tal quef 6 ‘1’, se tiene que si In FQ) es

estrictamentecóncava,entoncesIn £ tambiénlo es.

LemaL.A.1.2. SeafQ) una función de densidad de la clase ‘1’, y sea F() su función de

distribución asociada.Entonces:

A. In Fo es estrictamentecóncavaen R~.

13. Si ademásexistef’(0),entoncesIn FQ) esestrictamentecóncavaen R~ U {0}.

TeoremaT.A.1.1. Condiciónsuficientedeconcavidadestrictade In L(O). Sea un MEB

como el planteadoen [1.2.13], y seafi~) la función de densidad correspondiente a la

distribuciónFQ). Consideremosla función gQ) definida por:

F(z)g(z) = ~ vzER [A.1.2]

si se cumplenlas siguientescondiciones:

A. fE’I’.

8. Existe una función hQ) continua, tal que:

1) f(z) = c exp[ h(z) dz] dondec es una constante, y

2) h(zYg(z)< 1, Y z E RL

entoncesla función de verosimilitud In Li) es estrictamente cóncava.

La aplicación inmediata de estos resultados es la demostración de la concavidad en

el caso del modelo logit y el modelo probit, y la única dificultad estriba en encontrar la

función /4~) apropiada.Para el primero de ellos sepuedecomprobarque:

1(z) exp Ii lii. dz] [A.1.3]1 +ez j

por lo que h(z) = (l—é)/(l+et), c = 1 y además h(z)g(z) = 1 — ¿ < Lv z E RL

Parael modelo probit se tiene que:

Page 169: Anomalias Del Modelo Lineal General

APÉNDICES 163

1(z) = lexp( Jzdz) [A.1.41½/Ir

donde en este caso h(z) = —z y c = 1/J2r. Además:

h(z)g(z) = —z j>exp¡ZJJ dt

= exp(zH2)f —z exp(—t2/2)dt < [A.1.5]~00

< exp(zV2)J —texp(—t2/2)dt= 1

Para una función de verosimilitud obtenida a partir de una distribución general será

necesariodemostrarque el hessianoes una matriz definida negativa que es condición

suficiente[Bazaraay Shetty (1979)]. A partir de la expresión[1.3.4], el hessianode la

funciónde verosimilitud sepuedeescribir como:

= ~ ¡[(y1 —2y1F1+Fhf, +(y1—F)F1(1 —F)x83] [A.1.6]

HL [E1(1-F912

y siguiendoa Amemiya (1985), es necesariodemostrarla positividad del numeradorde

[A.1.6], que puedeplantearsecomo una función:

g(y,z) (y-2yF+F2)f + (y-flF(1 -ñz [A.1.7]

y es necesariocomprobarque esestrictamentepositiva paray = 0, 1 y cualquier valor

de z.

Page 170: Anomalias Del Modelo Lineal General

APÉNDICEs 164

A.2. Notas sobre Métodos Numéricos de Optimización NoRestringida

El métodode estimaciónesun aspectofundamentalde cualquierinvestigaciónsobre

modelos econométricos, sobre todo cuando los modelos implicados son no lineales. Las

funcionesde verosimilitud de los modelostratadosen estetrabajo son cóncavas,lo queevita el posible problema de óptimos parciales. Pese a estas buenas propiedades,

seleccionarun método de optimización eficiente sigue siendo un aspectocentral del

problema[ver Bunch (1988)].

En este apéndicese presentanun conjunto de técnicasgeneralesde optimización

y seanalizacon especialatenciónsuaplicacióna problemasde máximaverosimilitud. Para

un análisisenprofundidadde estos temasse puedenconsultar: Dennisy Schnabel(1983)

o Gilí et al. (1981), y pararevisionesde los métodosGoldfeld y Quandt(1972)y Quandt

(1983>.

A.2. 1. Planteamiento del problema

Sea el problema:

respectoal vectorx = (x, x2T, dondef:E’ —. Res un campoescalarque, en general,

supondremosdos vecesdiferenciable,con derivadascontinuas,aunqueeste supuestonosiempre es necesario. El procedimientoanalítico general para resolver el problema,

consisteen planteary resolverel sistemade ecuacionesquevienedadopor suscondiciones

de primer orden:

¿3f(x> — [A.2.2j

8x

Una vez determinado el conjunto de vectores 0 E E’ que satisfacen estas

condiciones,debecomprobarsecuálesde estospuntossatisfacentambiénlas condiciones

de segundoorden,esto es, que la matriz hessiana H<x*) sea definida negativa.

El enfoqueanalítico para resolver problemas de optimización, se caracteriza por

la generalidad de su planteamientos, así como un elevado rigor matemático.Sin embargo,

Page 171: Anomalias Del Modelo Lineal General

APÉNDICES 165

muchosproblemasprácticosno puedenresolverseanalíticamente.En el extremoopuesto,

los métodosnuméricosson poco generales,ya que cadaalgoritmo estáespecializadoen

unos pocos casos concretosy su fundamentomatemáticoes poco riguroso; a cambio,

puedenresolvernumerososproblemasprácticos.

En este Apéndice, trataremos algunos aspectos de la resolución numérica de

programasmatemáticos.Paraello, se presentandistintastécnicasquepermitencalcularuna

sucesiónde valores 2 Y que, idealmente,convergeráa la solución óptima del

problema.

Comenzaremosdefiniendo un esquemaque contienetodos los elementosque se

encuentranen los métodosbasadosen direccionesde búsqueda,que son los de uso másfrecuenteen aplicacioneseconométricas.Para la definición matemáticade este algorit-mo—tipo, emplearemosla siguiente notación:

2: Óptimo del problema.it Valor de la función objetivo alcanzadoen la k—ésimaiteración.xt: Estimaciónde 2 en la k—ésimaiteración.¡9: Dirección de búsquedadel óptimo utilizadaen la k—ésimaiteración.gk: Gradientede f<x) evaluadoen Y.

Gk: [-Iessianode f(x) evaluadoen Y.

Asimismo, todos los algoritmosquediscutiremoscompartenunaseriede elementos

comunes:i) se disponede unascondicionesiniciales, estoes, un valor inicial del vector

de variables 2 para iniciar el proceso de cálculo, u) un criterio para determinar en que

direccióndel espacioE’ seencuentransolucionesmejoresque la actual(vectordepaso),

Iii) un criterio paradeterminarcuántohay que avanzaren la direccióndel vectorde paso

(longitudde/paso),y por último, iv) un criterio de convergenciaque permita determinar

si la soluciónactual cumple las condicionesde primer ordencon el gradode precisión

requerido. Debido a la existenciade estoselementoscomunes,todos los algoritmos que

vamosa tratar puedendescribirsedentro del siguienteesquemade cálculo:

PasoO: Inicialización: Situar el contadorde iteracionesken cero. Seleccionararbitraria-

menteunaestimacióninicial del óptimo 221, el máximo númerode iteracionesadmisiblesK y una toleranciapara los criterios de paradae.

21 La elecciónde x0 puedeser un problemaserio en s~ mismo,puestoque generalmentela convergenciaes

más rápidacuantomáspróximo se encuentrex0 al máximo. Por otra parte, en problemasde estimación,esconveniente(cuandono necesario)que .r/’ seauna estimaciónconsistente,aunqueesto es irrelevantea efectoscomputacionales.

Page 172: Anomalias Del Modelo Lineal General

APÉNDICEs 166

Paso1: Comprobarsi se cumplenlas condicionesde convergenciaen la iteraciónactual.Si se cumplen, se toma Y como aproximación suficiente a 0 y finaliza el

proceso. Si no se cumplen, se sigue con el paso 2.

Paso2: Determinaruna direcciónde búsqueda¡9.

Paso3: Determinaruna longitud de pasoo~k.

Paso4: Y~’ = Y + ¿~9.

Paso5: Hacer k = k + 1. Si k =1<, volver a comenzar una iteración en el paso 1, en

otro caso,detenerel proceso.

Por otra parte, consideraremosque la característicaesencialde un algoritmo es laforma en la que segenerala secuenciade vectores¡9. Los demásaspectos,aún siendo

importantes,no parecensuficientementesustancialescomoparaque una variaciónen lasmismascaractericeun nuevo algoritmo.

Laelecciónde un algoritmodebehacersedesdedistintos puntosde vista quesuelen

implicar un intercambiode ventajase inconvenientes,ya que no existe un algoritmo que

sea el mejor desde todos los puntos de vista y para todos los problemas que pueden

plantearse.Dos aspectosfundamentalesa la hora de elegir un algoritmo son: i) su

robustez,esto es, el grado hasta el que el algoritmo en cuestión sea capaz de dar una

estimacióndeY del verdaderomáximox tal que UY — jj < e, paraalgún e dado y

positivo; Ii) su coste computacional,que se supone,de algún modo, proporcional al

número de iteraciones y evaluaciones de la función objetivo, memoria de ordenador,

tiempo de cálculo,operacionesde lectura/escritura,etc y iii) sus propiedadesespecíficas

pararesolver la familia de problemasque nos interesan.

A.2.2. Criterios de convergencia

El criterio de convergenciaes un elementoarbitrario del algoritmo de forma que,

si se cumple la condición que lo caracteriza,se consideraque el algoritmo ha alcanzado

un solución satisfactoria. Sea Y~’ la estimación actual de 0 obtenida mediante un

algoritmocualquieray seaunatoleranciaarbitrariae > O. En estascircunstancias,algunos

posiblescriterios de terminaciónson:

Page 173: Anomalias Del Modelo Lineal General

APÉNDICEs 1 67

A. =e, esto es, detener el algoritmo si el paso es pequeño. Un criterio

semejanteal anteriorpuedeplantearsede la siguientemanera:

B. — f =e, intuitivamente, detenerel algoritmocuandola mejoraen

la función objetivo es pequena.C. jg”’ = e, que es equivalente a una comprobación aproximada del

cumplimientode las condicionesnecesariasde primer orden.

D. =e (i = ¡ ti), que supone una comprobación de las condiciones

necesariasmásestrictaque con el criterio C.

Existen otros criterios para decidir si el procesode cálculodebedetenerseen la

iteraciónactual. Sin embargo,todos ellos sebasanen las mismas ideas: i) comprobarel

cumplimientoaproximadode las condicionesde primerordeno bien u) detenerel proceso

iterativo si el pasoespequeñoo iii) si la función objetivo mejora poco.

Todos estoscriterios sonválidosaunquetienen el defectode que son sensiblesa

la métricaen queestádefinidoel problema.Porello, si un mismoalgoritmovaa utilizarse

pararesolverproblemasdefinidosen distintosespaciosmétricos,resultadifícil determinar

un valor adecuadode e. Para resolver esta dificultad, conviene usar un criterio deconvergencia adimensional.

Otra consideración relevante es la velocidad a la que converge el algoritmo, que

generalmentevendrádeterminadapor la eleccióndel modode cálculo de ¡1. Se dice que

un algoritmo es cuadrciticamenteconvergentesi alcanza el máximo de una función

cuadráticaacotadaen una iteración.Asimismo, se dice que un algoritmo es linealmente

convergentesi alcanzael óptimo de una función lineal acotadaen una iteración. Por

último, se dice que una algoritmo posee convergenciasuperlineal si, aplicado a una

función cuadráticaacotada,convergeal óptimo en un número finito de iteraciones.Para

una discusión más formal sobrelas propiedadesde convergenciapuedeverse Bazaraay

Shetty (1979) y Dennis y Schnabel(1983).

Las nocionesde convergenciacuadráticay superlinealson importantes,puestoque

a menudo se puede suponer que la función objetivo es aproximadamente cuadrática (a]

menos en un entorno de óptimo) de forma que f(x) queda bien aproximadapor un

desarrollode Taylor de segundoorden. Un problemáadicionalquesurgeen problemasde

Page 174: Anomalias Del Modelo Lineal General

APÉNDICES 168

estimaciónes los que, si el restode laaproximaciónno convergeacerocuandoel tamaño

de la muestraempleadaaumentaarbitrariamente,la estimaciónde los parámetrosen el

óptimo puedeestar sesgada[Cox y Hinkley (1974)1.

A.2.3. Criterios para determinar la longitud de paso

En la práctica,existenmuchoscriterios paradeterminarla longituddel pasoak en

una iteración cualquiera. La mayor parte de estos métodos intenta garantizar que, una vez

realizadala iteración,no seproduzcaun empeoramientoen el valor de la funciónobjetivo.Una discusión de estosprocedimientospuedeencontrarseen Bazaraay Shetty (1979) y

Dennis y Schnabel(1983).

En realidad, sólo hay un criterio que tenga una base

paso óptima. La idea en que se basael procedimientoesvector de desplazamientopk, el valor de la función objetivo

paso es función de una sola variable:

f(Y~1) - ftY + ~ p’)

objetiva, el de la longitud de

sencilla. Una vez elegido el

que se alcanzará después del

[A.2.41

donde sólo se desconoce ak, que será el valor positivo que produzca un aumento mayor

de la función objetivo. Por tanto, es posible calcular de forma óptima la longitud del

desplazamientoutilizandoun algoritmo eficientede optimizaciónparaproblemasde una

sóla variablecomo, por ejemplo,el de Fibonacci [ver Gilí et al, (1981)].

A.2.4. Métodos tipo Newton

El puntodepartidade los métodostipo Newton, consisteen aproximar

desarrolloen serie de Taylor de segundoorden alrededorde Y y optimizar

resultante,esto es, resolverel problema:

Max f(xk) + g¡T(x»~ —Y) + ~ Xk)TGI~X~d —9)2

Aplicando la condición necesaria de primer orden a la aproximación

despejandoY~’, el paso de Newrnn-Raphson resulta:

f(x) por un

la función

[A.2.5]

[A.2.14] y

Page 175: Anomalias Del Modelo Lineal General

APÉNDIcES 169

9+1 = 9 - [G(xk)]-íg(xk) [4.2.61

Estecriterio proporciona,por tanto, el máximoaumentode valor de la aproxima-

ción de segundoordende la función en un entornode Y si Gk es una matriz estrictamente

definida negativa.

La expresiónanteriores la basede los denominadosalgoritmostipoNewton,cuyo

objetivoes reducirel costecomputacionalmanteniendolas propiedadesde convergencia

del algoritmo de Newtonen el que sebasan.Paraello, sustituyenel hessianoen [4.2.16]

por aproximacionesadecuadas.La expresióngeneralde estosalgoritmoses:

9+1 = 9 — ak[HkIíg(xk) [4.2.7]

dondela dirección de búsquedaes¡9 = -fltf’g(Y).

Algunas eleccioneshabitualesde H y a en problemasde estimaciónson: i) la

matriz de informaciónde los parámetrosy = 1, lo que produce el algoritmo de scoring:

jjk = -E ~fiT] = [4.2.8]

dondeE es, normalmente,el logaritmode la funciónde verosimilitudobjetivo y O el vector

de parámetros a estimar, u) utilizar la forma del producto exterior del gradiente:

1< < ae1H = ¡ J 1— [4.2.9]

y = 1 que da lugar al algoritmo Gauss—Newton,que se suele emplearen problemas

en los que la función objetivo es una suma de cuadrados;o bien iii) hacer II =

rl = 1 que es el método del gradiente o máximo ascenso22,cuyas propiedadesde

convergencialo hacenadecuadoparainiciar cualquierprocesoiterativo.

El algoritmo de Newton-Raphsonposeeexcelentespropiedadesde convergencia

local; estoes, si separtede un punto relativamentecercanoal óptimo y ademásrequiere

que H seadefinida negativa. De no cumplirse este último requisito, las iteraciones podrían

representaralejamientosdel objetivo. Para evitar este inconvenientese han sugerido

diferentesprocedimientos,peroel mássimple de utilizar y queofrece resultadosóptimos

22 El métododel gradientetambiénpuedederivarsedirectamenteoptimizandoun desarrolloen serie de

primer ordenen un entornodel vectorde pmebaactual, añadiendouna restricciónde normalizaciónarbitrariaparaacotarel resultado.

Page 176: Anomalias Del Modelo Lineal General

APÉNDICES 170

consisteen perturbar los elementosde la diagonalprincipal de H con lacantidadmínima

que asegureque la matriz es definida negativa.Este planteamientoda lugar al algorit~no

de ascensocuadrático [Goldfeld, Quandty Trotter (1966)].

A.2.5. Métodos quesí—Newton

La idea fundamentaltras estosmétodoses similar a los expuestosen el apartado

anterior: mantenerlas buenaspropiedadesdel algoritmo de Newton pero reduciendoel

costede cálculo en cada iteración y garantizandoel condicionamientoen signo de los

autovaloresde ¡1k~ Para conseguiresto, los métodosquasi—Newtonoptan por actualizar

(en vez de calcularcomo los tipo Newton) la matriz H en cadaiteración,utilizando para

ello información de las primerasderivadasy los resultadosde la iteraciónanterior. Este

planteamientoda lugar a unaampliafamilia de algoritmosde optimizacióneficientes,con

elevadastasasde convergenciay computacionalmentemenoscostososque los expuestos

másarriba. Las característicasde estaclasede algoritmospuedenresumirseen: i) en cada

iteración, la búsquedaesunidimensional,u) el algoritmo sólocalculavaloresde la función

objetivo y primerasderivadas,y iii) en la iteración k—ésima, sólo emplea información

calculadaen las iteraciones~ty k— 1.

El desarrollo de los métodos quasi—Newton parte de considerar la expansión del

gradientealrededorde Y en la dirección # = Y~’ — Y = ctkpk:

g(xk + sk) [4.2.10]

La curvaturadeF en la dirección t está dada por tú/st, que puede ser aproximada usando

informaciónde primer orden:

gtT~k~k — (g(xk + 9) ~gk)Tsk [4.2.11]

Esta relación será exacta para un modelo cuadrático, y se puede suponerque la

aproximaciónesadecuadaen un entornodel máximo.

Al comienzo de la iteración k por un método quasi—Newtonse dispone de un

/zessianoaproximado1? y, normalmente,secomienzacon = 1,, o con un Hessiano

calculado,si es posible. Si seconsidera¡3k como el hessianode función cuadrática,la

direcciónde búsquedaes la soluciónal sistema:

Bkpk = gk [4.2.12]

Page 177: Anomalias Del Modelo Lineal General

APÉNDICEs 1 71

Una vez se ha calculadoX”4’, se obtiene una nuevaaproximaciónal hessiano

actualizando Ht, de acuerdo con la expresión:

= + [4.2.13]

donde ~Jkes la matriz de actualizaciónque se calculaa partir de la información de las

primerasderivadas.Además,el hessianoactualizadodeberíaaproximarla curvaturade E

en la dirección del vectorde pasost es decir, cumplir lo que se denominacondiciónquasi—Newton:

B ~ 9 yk [4.2.14]

donde 9 = g(Yt1) — g(Y). La selección apropiada de (1 requiereimponerque la nueva

actualizaciónsea simétrica y cumpla la condición quasi—Newton. Además, la matrizresultantedeberíaserdefinida negativa.Diferenteseleccionesde U dan lugar a distintos

algoritmosde una misma familia.

Si se hace(4 = u¿ con u = 9 — 39 y se imponenlas restriccionesexpuestas,se puedeobtenerunafamilia de actualizacionesdenominadaPoweIl—Symmetnc—Broyden

[Gilí et al. (1981)]. Haciendoy = 9 — Bk? se obtiene la actualización Davidon-Fletcher-

Powell (DFP):

= ______ B~s~>v”~’B~ + 1 ykykT + (tTBksOwkwk [4.2.15]~T>qk

5k kT kys

donde:

1wk — kT5k y — 1 Bksk [4.2.16]

?TBksk

En general, seconsideraque la mejor de toda la familia de actualizacioneses eldenominadométodoBrovden— Fletcher—Goldfarb— Shanno(BFGS),cuyaactualizaciónes:

= Bk — 1 BkS*SkTBk + ~i......y~ykT [4.2.17]trBksk 9T~k.

Si además del empleo de alguna de estas actualizaciones, se determina la longitud

de paso de forma óptima, esto es, se elige rl tal que para Y y ¡9 dadosse cumpla:

Page 178: Anomalias Del Modelo Lineal General

APÉNDICES 172

a F(Xk akpk) = O [A.2.1S]

8 rl

los algoritmosexpuestosgenerandireccionesconjugadasy se aseguraque la actualización

del hessianoesdefinida negativa.

Unavariaciónde los métodosquasi—Newtonesel algoritmoBHHH[Brendtet al.(1974)1,queutiliza técnicasde actualizacióncomo las expuestas,pero aplicadasla matriz

de informacióndel lugar del hessiano.A pesarde que fue concebidoparaproblemasde

estimación,hay evidenciasde que su rendimientogeneral no es superior al de otros

métodostipo Newton o quasi—Newton, y no es muy empleadoen la práctica.

A.2.6. Métodos que no emplean derivadas

En principio, los métodosde optimizaciónque no requierenusarderivadasson

atractivosya que: i) en ocasionesno se conocenlas expresionesanalíticas de las derivadas

de la función objetivo y u) el cálculo de derivadases una tareacostosaen términos de

tiempode cálculo. Por otraparte,estosmétodossuelentenergarantizadasu convergencia

a algún máximo, con independencia de la concavidad de la función objetivo. Sus

ínconvenientesprincipalessondos: lentitud en la convergencia,incluso en la proximidad

del óptimo, y elevadocostecomputacional,al tener que evaluar la función objetivo un

elevadonúmero de veces.

Unaclasedealgoritmossin derivadas,empleala nociónde búsquedaen unarejilla

de puntos. Un procedimientosencillo seobtienecomenzandoen algúnpuntox0 y evaluar

la función enA y en los 2n puntosde la rejilla dadapor A ±hv1, dondev~ (i = 1 n)

es un vectorcon un uno en la posición i—ésimay cerosen el resto, y h es la anchura de

la rejilla. Se pasa de A a un Y tal quef(x’) = supf(x0±hv~,). El procedimientose repite

partiendode Y hastaque no se obtienemejora. En ese caso,se reducela anchurade la

rejilla Ji y se continúahastaalcanzarun valor de Ji especificadode antemanoque serála

precisióncon la que seobtieneel óptimo.

Un métodode búsquedaalternativoy máseficientees el de Hookey Jeeves(1961).Este algoritmo emplea dos tipos de movimientos: i) búsquedasexploratoria, que se

realizanendireccionesparalelasa los ejes de coordenadas,y u) búsquedaspatrón, que se

hacenen una dirección dada por una combinación lineal de las direccionesde las

búsquedasexploratoriasanteriores.Si unabúsquedaexploratoriay la siguientebúsqueda

Page 179: Anomalias Del Modelo Lineal General

APÉNDIcES 173

patrón resultanen una mejorade la función objetivo, se aceptan;de lo contrario, se hace

un movimientoen la direcciónexploratoria. En general,secomienzacon un valor fijadode Ji y secontinúahastaque se ha reducidolo suficiente,aunqueuna modificacióncon la

que se ganaeficienciaconsistenen calcularh en cadaiteración.

Un problemaserio con el tipo de algoritmosque sólo modifican unavariableencadapasoes que puedenno convergertodas las variables simultáneamente.Aunque engeneral funcionanbien si sedetieneel procesocuandola mejoraen la funciónobjetivoes

pequeña,el gradientepuedeser no nulo a lo largo del recorridodel algoritmo e incluso

es posibleque itere indefinidamente.

Por otra parte,tambiénesposiblecombinarlos algoritmosexpuestosen el apartado

anteriorcon un criterio de aproximaciónnumérica,que permite llevar a caboel proceso

de optimizaciónsin un conocimientoexplícito de la forma funcional de las primeras ysegundasderivadasde la función objetivo.

Por ejemplo, parael casode funcionesde una sólavariable,se puedeobteneruna

buenaaproximacióndel valor de la primeraderivadautilizando la siguienteexpresión:

f(x + áx) -f(x) - f(x - Ax) -f(x

)

f’(x) = ___________________________ [A.2.1912

que correspondeal método de aproximaciónpor d<ferencias centrales. Aplicando unprocedimientosimilar, tambiénpodríaobtenerseunaaproximaciónnuméricaa los valores

de la segundaderivada.

El uso de estas técnicastiene la ventaja indudablede que permite trabajar sinconocer la forma funcional exactade las derivadasde la función objetivo. Sin embargo,

siempretienenun cierto costeen términos de precisión.

A.2.7. Un algoritmo especializado: El algoritmo EM

Un algoritmoespecialmenteefectivoen problemascondatosincompletos(muestras

censuradaso truncadas)o con variablesno observables,esel denominadoalgoritmo EM,

Page 180: Anomalias Del Modelo Lineal General

APÉNDICES 174

cuyaspropiedadesbásicasse exponenen Dempsteret al. (1977) y algunasextensionesenRuud (1991).

El problema de datos incompletos puedeplantearsesuponiendouna variable

aleatoriax con funciónde densidadf(x O), ademássesuponequeexisteunarelacióncon

una variable y observable.El problemase producedebidoa que una observaciónde y noidentifica de forma únicaa la x correspondiente,aunquepuedeestimarsela probabilidad

de que la observacióny hayasido generadapor un conjuntode ir. Las observacionesdey se suponengeneradaspor:

g(y O) = {f(x O)& [4.2.20]

Un ejemplosencilloes el modelode regresióncambiante(switchingregression)con

una estructura:

y1 = x ffi, + u,1 con probabilidad ir[4.2.21]

7,- + u21 con probabilidad 1 —T

y. = xdonde x1 son variables exógenas, que puedenser no observables,y~ es la variableendógena,ii,, ~, sonvectoresde parámetrosdesconocidosy u11, u12 son las perturbacioneshabituales. La probabilidad ir es desconociday tampoco se conoce a que régimen

pertenecenlas observaciones.

Los pasosfundamentalesdel algoritmo EM sonel paso E (Esperanza) y el pasoM

(Maximización),que se llevan a caboen cadaiteracióny que puedenresumirseen:

PasoE: Dadoun valor del vector de parámetros0k y los datos observadosy, obtener

estimacionesde Y medianteE(x y,tt), que puedeser unamezclade funciones

discretas y continuas. Las expresionesa utilizar dependerándel problema

concretoque se trate.

PasoM: Usando los valores estimadosY, maximizar la función de verosimilitud del

problemacompleto(como si seobservaranlas x) paraobtenerte’. Estaetapa

se llevaráa caboutilizando algúnalgoritmo de los expuestosanteriormente.

Si la secuenciade estimacionesobtenidas converge, ese punto es un punto

estacionario,generalmenteun máximo local, de la función objetivo.

Page 181: Anomalias Del Modelo Lineal General

APÉNDICEs 175

A.3. Datos de los ejemplos del Capítulo 5

Tabla4.1. Datosde Dhillon et al. (1987), tomadosdel soportemagnéticoqueacompaña

el libro de Lotí y Ray (1992). Las definicionesse encuentranen la Tabla 5.1.

ADJ El MAR YLD PTS MAT BA ES FTB GB MC SE MOB NW LA STL58383838414141384434444444574238383838383844393939445332244330252632272725243444303534556527313627313145373732413136

[3.62 í.sO 1.38 2.13 1.511

13.62 1.50 1.38 2.33 1.5013.62 1.50 1.38 2.33 1.5013.62 1.50 1.38 2.33 1.50

14.00 5.50 1.38 1.75 1.0014.00 4.75 1.38 1.75 1.0014.00 4.75 1.38 1.75 1.0013.62 ¡.50 1.38 2.33 1.5013.50 2.40 1.59 1.00 1.0013.75 2.44 1.45 2.00 0.6714.00 2.45 1.64 1.00 1.0014.00 2.45 1.64 1.00 1.0013.50 2.40 1.59 1.00 1.0014.00 0.35 1.64 1.25 0.6713.90 3.04 1.50 2.03 1.0013.75 2.33 1.45 2.50 1.0013.75 2.33 1.45 2.50 1.0013.75 2.33 1.45 2.50 1.00¡3.75 2.33 1.45 2.50 1.0013.75 2.33 1.45 2.50 1.0013.75 2.33 1.45 2.50 1.0013.50 2.40 1.59 1.00 1.0013.88 0.35 2.04 0.83 1.0013.88 0.35 2.04 0.83 1.0013.88 0.35 2.04 0.83 1.0013.50 2.40 1.59 1.00 1.0013.50 3.86 1.60 0.74 0.4212.38 2.73 1.40 1.66 0.8512.13 3.36 1.60 1.66 0.8512.25 3.36 1.60 1.66 0.8512.38 3.36 1.60 1.66 0.8512.38 3.36 1.60 1.66 0.8512.25 3.36 1.60 1.66 0.85¡2.40 3.36 1.60 1.66 0.85¡2.50 2.10 1.77 0.00 1.0013.00 3.61 1.69 1.81 1.0013.25 3.61 1.69 4.34 1.0012.25 2.60 1.59 2.55 0.9313.00 2.40 1.59 2.00 1.0012.50 2.60 1.59 ¡.27 0.9312.50 2.60 1.59 2.55 0.9312.50 2.60 1.59 1.27 0.9313.00 3.86 1.60 1.48 1.6912.50 2.60 1.59 2.55 0.9313.25 3.86 1.60 1.48 1.2712.50 2.60 1.59 1.09 0.9312.75 3.86 1.60 1.48 0.8512.13 3.36 1.60 1.66 0.8512.75 3.86 1.60 1.48 0.8512.25 2.73 1.40 1.24 0.8512.75 2.60 1.59 0.76 0.9313.25 2.08 1.50 0.97 1.4213.90 3.04 1.50 2.03 1.0012.25 2.60 1.59 0.69 0.9312.75 2.08 1.50 0.49 0.9513.90 3.04 1.50 2.03 1.0012.60 3.36 1.60 1.66 0.85¡4.00 2.45 1.64 1.00 1.00

22 1 U U22 1 0 022 1 0 022 1 0 016 1 0 016 1 0 016 1 0 022 1 0 016 1 0 119 1 0 016 1 0 116 1 0 116 1 0 117 1 1 120 1 0 122 1 0 022 1 0 022 1 0 022 1 0 022 1 0 022 1 0 016 1 0 121 1 1 121 1 1 121 1 1 116 1 0 116 1 1 118 1 0 117 0 0 016 1 0 113 0 1 116 0 0 014 1 1 112 0 1 013 1 0 117 1 0 016 1 1 116 0 1 19 01 1

12 0 0 118 0 0 024 0 1 117 1 0 114 1 0 16 01 1

18 0 0 020 1 1 116 0 0 016 0 0 012 0 1 115 1 1 114 1 0 112 0 0 114 1 0 116 0 0 018 1 1 116 0 1 125 0 0 0

U t•0 10 1o r1 41 41 40 11 111 20 20 2

1 110 280 80 10 10 10 10 10 11 11o 20 20 21 110 170 4o 10 60 10 30 5o 3•0 ¡0 40 10 10 20 9o 20 10 20 60 100 270 20 10 20 10 10 50 10 ¡0 10 20 10 1

1.56 8.91 3.697.56 8.91 3.697.56 8.91 3.697.56 8.91 3.897.82 12.50 50.938.01 17.74 50.448.01 17.74 50.447.56 8.91 3.69

17.86 17.12 31.469.10 6.18 40.482.42 5.01 28.812.42 5.01 28.81

17.86 17.12 31.465.62 16.84 22.53

12.40 0.00 0.007.56 8.91 3.697.56 8.91 3.697.56 8.91 3.697.56 8.91 3.697.56 8.91 3.697.56 8.91 3.69

17.86 ¡7.12 31.464.26 1.20 25.804.26 1.20 25.804.26 1.20 25.80

17.86 17.12 31.461.98 7.05 0.301.11 3.60 0.590.12 0.28 1.070.88 3.44 9.350.36 2.34 11.560.46 1.37 0.000.57 0.75 15.320.35 0.69 27.910.61 0.17 7.030.73 0.25 12.56

13.57 93.49 86.350.48 2.01 8.080.17 0.44 0.340.46 2.10 3.040.42 1.55 18.123.20 27.58 0.003.43 1.22 26.821.68 5.71 0.130.07 0.21 1.230.19 0.48 0.520.72 1.07 ¡1.520.37 1.08 8.620.21 0.97 9.180.42 3.03 7.311.00 0.25 2.400.79 1.32 14.940.26 0.70 1.910.75 2.33 0.800.11 0.40 9.810.88 1.22 0.000.60 2.12 3.920.44 0.71 0.20

tiO0oooOOoooOOooo0oooo

1~

II

Page 182: Anomalias Del Modelo Lineal General

APÉNDICES 1 76

ADJ FI MAR YLD PTS MAT HA BS FTB CH MC SE MOH ¡ I’JW LA STL4-338482726393’34363139333024303525312425

13.70 2.08 1.50 0.97 2.38¡3.80 3.04 1.50 2.03 1.0013.75 1.04 1.45 0.67 1.0013.62 1.50 1.38 2.33 1.50¡4.00 2.40 1.59 1.50 1.0013.00 2.40 1.59 2.00 1.00¡3.37 0.35 2.04 ¡.67 ¡.0013.50 0.35 2.04 1.67 1.50

¡ ¡4.00 0.35 2.04 1.67 1.50¡1.77 1.90 1.88 0.46 1.13

¡ 11.76 1.75 1.74 0.45 1.1114.00 1.66 1.74 0.50 1.50

¡ 12.84 0.85 2.03 0.00 1.2013.75 -0.90 1.45 1.00 1.0012.50 0.95 ¡.77 0.67 1.0012.50 -0.25 1.77 1.00 1.0013.75 1.04 1.45 0.67 1.0013.75 0.35 2.04 1.67 ¡.00¡4.50 2.10 ¡.77 0.00 ¡.001400 1.10 1.74 0.00 1.50

16 1 0 (3 016 0 0 0 017 1 1 1 014 1 0 1 011 0 1 1 012 0 0 0 0¡2 1 1 ¡ O12 0 ¡ 1 016 1 1 0 012 1 0 1 016 0 0 0 012 1 0 1 012 0 1 1 O17 0 0 0 012 0 0 1 012 0 0 1 015 1 1 1 016 0 1 1 0¡7 0 1 1 0¡5 0 1 1 0

18

17ji

26 ¡212

21

11

32

0.80 0.09 19.450.24 0.98 10.062.66 7.80 13.881.24 ¡.29 3.330.32 0.39 16.610.12 0.35 4.880.41 0.08 9.290.27 0.54 8.263.53 1.15 12.250.44 1.17 10.680.31 1.44 7.050.44 0.66 0.000.36 1.34 12.93

-0.06 0.46 23.880.18 0.49 6.660.25 0.93 4.560.71 0.20 27.230.12 0.36 19.390.34 1.98 4.600.09 0.51 14.54

oooooOoOooO

Page 183: Anomalias Del Modelo Lineal General

APÉNDIcES 1 77

Tabla 4.2. Datos de Pregibon(1981) tomadosde la Tabla 1, pag. 709, del articulo

original. Las definicionesseencuentranen la Sección5.2.

WtT LASA VOL

Ooooooo

o

ooOo

o

o

O

Oo11

oo

0.8251.0902.5001.5003.2003.5000.7501.7000.7500.4500.5702.7503.0002.3303.7501.640.600

1.4151.0601 8002.0001.3601.3501.3601.7801.5001.5001.9000.9500.4000.7500.0301.8302.2002.0003.3301.9001.9001.625

3.7’.>

3.501.25

0.75

0.800.700.601.100.900.900.800.550.601.400.752.303.20

0.851.701.80’0.400.951.351.501.60’0.601.800.951.901.602.702.351.101.101.200.800.950.751.30

Page 184: Anomalias Del Modelo Lineal General

REFERENCIAS

Altman, E. 1., R. H. Avery. R. A. Eisenbeisy J. F. Sinkey(1981).Applicationof class4ficationtechniques¡a husiness,bankingandfinances.GreenwichC.T., JAl Press.

Amemiya. T. (1974). “Re NonlinearTwo-StageLeast-SquaresEstituator.Journal of Econon¿etries, 2.105-110.

Amemiya, 1. (1978a). OnaTwo-StepEstixnationofaMulúvariateLogitModel”, Journalofficonometrics.8, 13-21.

Amemiya, T. (1978b). ‘The Estimation of a Simultaneous Equation Generalized Probit Model,Econonietrica. 46, 1193-1205.

Amemiya, 1. (1981). Qualitative ResponseModeis: A Survey,Journ.al of EconomicLiterature, XIX,1483-1536.

Amemiya, T. (1983). Non-LinearRegressionModeis,en Z. Grilichesy M. D. [utriligator,HandbookofEconomesrics.vol. 1.

Amemiya, 1. (1985). AdvancedEconometrics,Oxford, Basil Blackwell Ltd.

Aranda-Ordaz,F. J. (1981). OnTwoFan]ilies of Transformationsto Additivity forBinaryResponseDara’.Biornetriku, 68. 357-363.

Arnaiz, (3. (1978). Introduccióna la EstadísdeaTeí5rica, 3 a ecl., Valladolid, Lex Nava.

Atkinson, A. C. (1982). ‘RegressionDiagnostics, Transformations and Constructed Variables con

discusión,Journal ofthe Royal StatisticalSociety,B, 44, 1, 1.36.

Atkinson, A. C. (1985). Plots, Transformationsami Regression,New York, Oxford University Press.

Azorín, F. yJ. L. Sanchez-Crespo(1986).Métodosy AplicacionesdelMuestreo,Madrid. Alianza Editorial,S.A.

Bazaraa,M. S. y C. M. Shetty (1979).NonlinearProgrammning:TheoryandAlgorithms,NewYork, JohnWiley & Sons, Inc.

Hedrick, E. J. y J. R. Hill (19%). Outlier Tests for Logistie Regression,a Conditional Approach’,Biometrika, 77. 4, 815-827.

Belsley, D. A.. E. Kuh y R. E. Welsch (1980).RegressionDiagnosties. Identifying Influential Dato amiSourcesofCoilinearriy, New York, JohnWiley & Sons.

Een-Akiva,M. y S. R. Lennan(¡985). DiscreteChoteeAnalysis.TheoryandApplicattonto TravelDeniand,Cambridge,Mass., M.I.T. Press.

Berman,G. (1979). Lattice Approxirnarionsto ¡he Minina of Functionsof SeveralVariables,Journal oftite Associationof CompunngMachinery, 16, 286-294.

Bierman, H. y W. U. Hausman(1970>. Ibe credit grantingdecision’, ManagemnentScience,16, 13519-13532.

Page 185: Anomalias Del Modelo Lineal General

REFERENCIAS 179

fox, (3. E. P. (1980). “Sampling and Bayes’s Inference in Scientitic Modelling and Robustness”condiscusión, Journal of tite Royal Statistical Society,A. 383-430.

Box. G. E. P. y 9. R. Cox (1964). “An Analysis of Transformations con discusión,Jaurnal oftite RoyalStahsticalSocierv, B, 26, 211-252.

Box. G. E. 1’. y (3. C. Tiao (1968). “A BayesianApproachto sorneOntílerProblems’.Biometrika.55. 1.¡ 19-129.

fox, (3. E. P. y (3. C. Tiao (1973). BayesianInference¡o StatisticalAnalysis,ReadingMass,Addison-Wesley.

Boyes. W. 3., 0. L. Hoffman y A. 5. Low (1989). “An econornetricAnalysis of ¡he bank credit scoringproblem.Journal ofEconometrics,41, 3-14.

Hrendt, E. R., B. H. Hall, R. E. Hall, y J. A. Hausman(1974). “Estimation and Inferencein Non-linearStmcturalModels, Annaisof Economicami Social Measurenzent,3, 4, 653-665.

Brent, R. P.(1973).AlgorithmsforMinimizationwithoutDerivatives.EnglewoodCliffs, N.J.,Prentice-Hall.

Bunch. D. 5. (1988). A Comparisonof Algorithms for Maximum Likelibood Estimation of ChoiceModels.Journal ofEconometrics,38, 145-167.

Hurr, 1. W. (1942). “Cuniulative FrequcncyFunctions,AnnalsofMatitematical Statistics,13. 215-232.

Chambers. E. A. y 0. R. Cox (1967). Discrimination betweenAlternative Binary ResponseModeis,B¡ometrika. 54, 3 y 4. 573-578.

Cook, R. 0. (1977). “Detection of Influential ObservationinLinear Regression”,Tecitnometrics,19, 1 15-18.

Cook, R. 0. (1979). Influential Observationsin Linear Regresion’, Journal of tite AmericanStatisúcal,lssociation, 74, 365, 169-174.

Cook, R. D. (1986). “Assessmentof Local Influence”, Journ.atoftite RoyalStatistical Societ-v.8, 48, 133-169.

Cook, R. D., N. Holschuby S.Weisberg(1982). “A Noteon anAlternativeQutíjerModel .Iournal oftiteRoyal Statistical Society,13, 44, 3, 370-376.

Cook, R. 0. y 5. Weisberg(1980). “Characterizationof an Empirical Influence Funetion for DetectingIníluendal Casesin Regression”,Tecitnonietrics, 22, 4, 495-508.

Cook, R. D. y 5. Weisberg(1982).

Copas,.1. 8. (1983). ‘Regression,PredictionandShrinkage,Journaloftite RoyalStatist¡calSocietv,8, 45,3, 311-354.

Copas,.1. B. (1988). “Binary RegressionModels for ContaminatedDala”, Journaloftite Royal StañsticalSocietv. 8, 50, 2, 225-265.

Cosslett,5. R. (1981a). “Maxñnum Likelihood Estimatorfor Choice-BasedSainples’,Econometrica, 49,5, 1289-1316.

Coss¡ett, 5. R. (198114 Efficient Estimation of Discrete-ChoiceModels’. En Manski, C. E. y D. L.McFadden(eds.).StructrualAnnlysisofDiscrete¡Iota with EconometricApplications.Cambridge.Mass., M.I.T. Press.

Cossleu,5. R. (1983). “Distribution-free Maxinium Like¡ihood Esthnatorof te Binary Choice Model’.Econometrica,51, 765-782.

Page 186: Anomalias Del Modelo Lineal General

REFERENCIAS 180

Cox, D. R. y O. \J~ Hinidey (1974). Titeoretical Statiszics,London. Chapmanand Hall Inc.

Cox, D. R. y E. J. Snell (1989).AnalysisofBinnry Data, 2nd. edition, London, Chapmanand Hall Inc.

Cramer, J. S. (1990. 77w Logit Modelfor Economists,London. Chapmanand Hall Inc.

Daganzo.C. (1979).MultinondalProbit. Tite TheoryanóitsApplicariontoDemanáForecasting.NewYork,

Academie Press.

Dagenais,M. G. (1974). “Multiple RegressionAnalysis with IncompleteObservaúons,from a Bayesian\‘iewpoint, enFienberg,5. E. yA. Zeliner, eds.,StudiesinfiayesianEconometricsandStatistics,North-Holland.

Davidson. R. y J. O. MacKinnon (1984). “Convenientspecificationtests for logit and probit models.Journíil of Econometrics,25, 241-262.

Day. N. E. (1969). “Estimating the Cornponentsof a Mixture of Normal Distributions,Biornetrika, 56. 3,

463-474.

Dempster A. P., N. M. Laird y O. P. Rubin (1977). “Maxiinum Likelihood from IncompleteDala via teEM Algorithm. Journal of tite Royal StatishcalSocie¡y, 13, 39, 1-38.

Dennis,3. E. y R. 13. Schnabel(1983). NumericalMethodsforUnconstrainedOptimizationand NonlinearEquahons.EnglewoodCliffs, Prentice-Hall.

Ohillon, U. S.. 3. 0. Shilling y C. E. Sirmans (1987). ‘Choosing betweenFixed atid Adjustable RateMortgages.Journal of Money, Credit andBanking, 19, 1, 260-267

Dufour, 3. M. (1982). ‘Recursive Stability Analysis of Linear RegressionRelationships,Journal ofEconometrics,19. 31-76.

Engle, R. P. (1983). ‘Wald, Likelihood Ratio, ami Lagrange Multiplier Tests in Econometrics”,en Z.Griliches y M. D. Intriligator (Eds.),HandbookofEconometries,vol. II, 775-826.Amsterdam,Nordi Holland.

Gilí. P. E., W. Murray y M. U. Wright (1981). Practical Optimization.London, Academic PressLtd.

Godfrey L. G. (1988). MisspeczflcationTestsin Econometrics.CambridgeUniversity Press.

Goldfeld, S. M. y R. E. Quandt(1972).NonlinearMetitods iii Econometrics.Arnsterda¿rn,North-Holland.

Goldfeld, S. M., R. E. Quandt y H. E. Trotter (1966). “Maximization by Quadratic Hill-Climbíng”,Econometrica,34. 541-551.

Goídberger,A. 5. (1983). ‘Abnormal SelectionBlas”. En 5. ¡(arEn. T. Amemiyay L. A. Goodinan(edsj.Studiesin Econometrics, Time-Seriesaná Multivariate Analysis. New York, Academic Press

Gourieroux,C., A. Monfort y A. Trognon (1984). PseudoMaximum Likelihood Methods, Theory’.Econometrica,52. 3, 681-700.

Gourieroux,C., A. Monforii y A. trognon(1984). “PseudoMaximum Likelibood Methods.Applicationsto PoissonModels”, Econometrica,52, 3, 701-720.

Gourieroux. C.. A. Monfort, E. Renault y A. Trognon (1987). “Generalised Residuals.Journal ofEconom.etrics,34, 5-32.

Guerrero,y. M. y R. A. Johnson(1982). Use of te Hox-Cox TransfonnadonwEb Binary ResponseModels, &omerrika, 69, 2. 309-314.

GraciaDíez, M. y G. R. Serrano(1991). ‘Algunos AspecÉossobreel Análisis Empíricode CreditScoring,EstadísticaEspañola, 34, 130, 261-283.

Page 187: Anomalias Del Modelo Lineal General

REFERENCIAS 181

Gracia Díez, M. y G. R. Serrano(1992). ObservacionesAnómalas en Modelos de Elección Binaria’Documentode Trabajo, ¡Ipto. EconomíaCuantitativa. UCM.

Green. P. J. (1984). lteratively ReweightedLeastSquaresfor Maximum Likelihood Estimation,andsorneRobustand ResistantAlternatives” con discusión,Journal oftite Royal StatisticalSociety, B, 46,2,149-192.

Hanipel, E. R. (1974). “Re Influence Curveand its Role in RobustEstimation,Journal oftite AmencanStat.istical Association,69, 383-394.

¡-lausman,3. A. (¡978). Specif¡cationTesrs iii Econometrics”.Econometrica,46, 6, 1251-1271.

Hausman 3. A. y II. L. McFadden(1984). SpeciflcationTess for ¡he Multinornial Logit Model’Econometrica,52, 5, 1219-1240.

Hausman, 3. A. y D. A. Wise (1977). Social experimentation, truncated distributions and efficientestirnation”, Econometrica.45, 319-339.

1-lausman. .1. A. y D. A. Wise (1978). A Conditional Probit Mode) for Qualitative Choice, DiscreteDecisionsRecognizingInterdependenceandHeíerogeneousPreferences”,Econometnica,46,2,403-426.

Heckman 3. 3. (1976). “Re Common Structureof Statistical Models of Truncation,SanipleSelectionandLimited DependentVariables anda Simple Estimatorfor SuchModels. AnnalsofEconomicrndSocialMeasurement.5. 475-492.

Heclanan,3.3. (1978). ‘Duminy EndogenousVariablesinaSimultaneousEquationSystem,Econometnica,46, 6, 931-959.

Ueckrnan, 3. J. (1979). SampleSelection Bias as a SpecificationError” Econometrica 47, 153-161.

Heckman .1. J. (1982). “Slatistical Models for ¡he Analysis of Dicrete Panel Dala. En Manski, C. E. y D.L. McFadden, Eds Ssrucrrual Analysis of Discrete Data witit Econometnic Applications.Cambridge,Mass., M.I.T. Press.

lzlendry. O. E. (1984). “Monte Carlo Experimentationin Econometrics, en Z. Griliches y M. O.lntriligaíor, HandbookofEconomerrics, vol. II.

Uocking, R. R. (1983). Developementsin Linear RegressionMe¡hodology: 1959-1982” con discusión,Tecitnometrics,25. 3, 219-249.

Hooke, R. y T. A Jeeves(1961). Direct SearchSolutionof Nunierical and StatisticalProblems,Journalof tite Associationof ComputingMacitineiy, 8, 212-221.

Huber. P. 1. (1981). RobustStatistics New York. JohnWiley & Sons.

Jennings,O. E. (¡986). “Outliers ami Residual Distributions in Logistic Regression” Journal of titeAmericanStatisticalAssociation,81, 396, 987-990.

JohnsonN. L. y 5. Kotz (1970).Distributionsin Statistics:ContinuousUñivaniate Distributions, vols. 1 y2. New York, JohnWiley & Sons.

JohnsonN. L. y 5. Kotz (1972). Distributions in Statistics: ContinuousMultivariase Distnibutions.NewYork, JohnWiley & Sons.

iones, P. N. y G. J. McLachlan (1990), Maximum Likelihood Estimation from GroupedandTruncatedDala witli Finite Normal Mixture Models”, Ápplied Statistics,39, 2, 273-312.

Keane, M. P. (1992). “A Noteon Identification in ¡he Multinomial ProbitModel”, Journal of Business&EconomicStatistics, 10, 2, 193-200.

Page 188: Anomalias Del Modelo Lineal General

REFERENCIAS 1 82

Krasker, W. S., E. Kuh y R. E. Welsch(1983). “Estimation for Dirty Dataand FlawedModeis”. En Z.Griliches y M. D. Intriligator HandhookofEconometrics.vol. 1.

Lee, L. F. (1979a). “Identification and Estimation in Hinary Choice Models with Limited (Censored)DependentVariables’, Econometrica 47, 4, 977-996.

Lee. L. F. (1979b). ‘On Comparisonsof Normal and Logistic Models in the Bivariate DichotomousAna¡ysis’. EconomíaLetters, 4 243-249.

Lee. L. F. (1984). “Non-ParametricTestingof DiscretePanel Dala Models”, Journal ofEconometrics,34,

147-177.

Lesaffte. E. y A. Albert (1989). Multiple-Group Logistic RegressionDiagnostics”,AppliedStatistics,38.3. 425-440.

Lo, A. W. (1986). “Logit versusdiscriminant analysis: a specification test andapplication to corporatebankruptcies.Journal of Economezrics,31 151-178

Lo, A. W. y A. C. MacKinlay (1989). “Re Size andPowerof the Variance Ratio Testin Emite Samples.

A Monte Carlo Investigañon” Journat of Econometrics,40, 203-238.

Lott, W. E. y 5. C. Ray (1992), Applied Econometrics:Problemswith Data Set,The DrydenPress.

Luce, R. 111. y P. Suppes(1963). “Preference,Utility andSubjectiveProbabilky”. En Luce R. 11., R. R.Bush y E. Galanter(eds.), Handbookof MatitematicalPsycitology, vol. 3. New York, Wiley.

McCullagh, P. y J. A. Nelder (1983). GeneralizedLinear ModUs,London: ChapnianandHall Inc.

McFadden,D. L. (1973). Conditional Logit Analysis of QualitativeChoice Hehavior”, En P. Zarembka(cd.), Frontiers in Econometrics.New York, Academic.

McEadden, D. L. (1976). ‘A Comment on Discriminan Analysis versus Logit Anaiysis”. Annals ofEconomicansi Social Measurement.5, 5 11-523.

McFadden.D. L. (1978). ‘Modelling the Choice of Residential Location. En A. Karlquist et al. (eds.),Spatial Interaction Theory ansiResidentialLocation, 75-96. Amsterdam,North-Holland.

McEadden,O. L. (1980). “Econometric Models for Probabilistic Choice Among Products”,Journal ofBusiness,53, 3 513-529.

McFadden, 111. L. (1981). “Econometric Models of Probabilistic Choice”. En Manski, C. E. y D. L.McEadden,Eds.,StructrualAnalyvisofDiscreteData walt EconometricApplications.Canbridge.Mass.. M.I.T. Press.

McEadden.D. L. (1983). Econometric Analysis of QualitativeResponseModels”. En Z. Grilichesy M.O. Intriligator, HandbookofEconomerrics,vol. II.

McFadden,O. L. (1987). ‘Regression-BasedSpecifxcationTestsfor¡heMultinomial Logit Model,Joarnalof Economrtrics 34, 63-82.

Maddala,(3. S. (1983).LimitedDependentansiQualitative Variablesin Econometrics.Cambridge, Mass.,M.I.T. Press.

Manski, C. E. (1975). “Maximum ScoreEstimationof¡he StochasticUtility Model of Choice’, Journnl ofEconometrics 3 205-228.

Manski, C. E. (1983). ‘Closest empirical Distribution Esriniation’, Econometrica, 51, 2,

Manski, C. F. y 5. Lerman(1977). ‘The Estimationof ChoiceProbabilitiesfrom Choice-BasedSamples’,Econometrica,45. 8, 1977-1988.

Page 189: Anomalias Del Modelo Lineal General

REFERENCIAS 183

Manski, C. E. y D. L. McFadden, Eds. (1981). StructrualAnalysisofDiscrete Dato witit EconometricApplications. Cambridge,Mass., M.I.T. Press.

Manski, C. E. y D. L. McFadden(1981). “Alternative Estiniatorsami SampleDesignsfor DiscreteChoiceAnalysis”. En Manski, C. E. y O. L. McFadden.Eds.. StructruatAnalysisofDiscreteData withEcononietricApplications.Cambridge, Mass., M.I.T. Press.

Manski, C. F. y T. 5. Thompson(1986). “OperadonalCharacterisúcsof Maximum ScoreEstimation”,Journal ofEconometrics,32, 85-108.

Manski, C. E. y T. 5. Thornpson(1989). “Estimationof BestPredictorsof Binary Response’,Journal ofEconometría 40, 97-123.

Marquardí.O. W. (1963). An Aigorúhm for LeastSquaresEstiinationof NonlinearParameters,Journaloftite Socie¡yfor Industrial Applied Mathemntics,2. 431441.

Meng C L. y P. Schmidt (1985). “On ¡he Cost of Partial Observability in ¡he Bivariate Probit Model’,InternationalEcononncRe~iew.26, 7 1-85

Morimune. K. (1979). “Comparisons of Normal aud Logistic Models in the Bivariate DichotomousAnalysis”. Econonwtrica, 47, 4, 957-975.

Nelder, 3. A. y R. W. M. Wedderburn(1972). ‘GeneralizedLinear Models”, Journal of tite RoyalStatistical Society, A, ¡35. 370-384.

Nuñez,.1.3. (1990). ‘Una clasedemodeloslinealesbinariosderegresióncualitativa,EstadísticaEspañola,32, 124. 389-400.

Pagan,A. y E. Vella (1989). “Diagnostic Tests for Modeis Basedon Individual Dala: a Survey,JournalofApplied Econoi’netrics, 4, 529-559.

Peña,D. (1987). ‘ObservacionesInfluyentesen ModelosEconométricos”,InvestigacionesEconómicas,XI,1, 3-24.

Peña,0. (19%). Influenfla] ObservationsinTime Series”, Journal ofBusinessansi EconomicStatisrics,8, 2, 235-241.

Peña,D. y J Ruiz-Castillo (1982). ‘Métodos Robustosde Construcciónde Modelos de Regresión. LinaAplicación al Sectorde la Vivienda”, EstadísticaEspañola,97, 47-76.

Peña,O. y 3. Ruiz-Castillo(1984). “RobustMethodsof Building RegressionModels. An Application to ¡heHousingSector”, Journal ofBussines& EconomicStatistics, 2, 1, 10-20.

Peña, O. y V 1. Yohai (1991). The Detection of Influentia] Subsetsin Linear Regressionusing anInfluence Marrix mimeo.

Poirier,O. J. (1978). PardalObservabilityin BivariateProbitModels”.Journal ofEconometrics,12, 209-217.

Powell, M. J. 0. (1964). “An Efficient Method for Finding¡he Minimum of a Funetionof Severa]Variableswilhout Calculating Derivatives’, ComputerJournal,7, 155.162.

Pregibon,D. (1981). ‘Logisúc RegressionDiagnostics’, Tite Annals ofStatistics, 9, 4, 705-724.

Quandt,R. E. (1983). “CompurarionalProblemsandMethods”. En Handbookof Econometrics,vol. 1, Z.Griliches y M.D Intriligaror (eds.),North HolandPublishingCo.

Quandt, R. E. y J. Ramsey (1978). “Estimating Mixtures of Normal Distributions and SwitchingRegressions’con discusión,Joarnal of tite AmericanStatisticalAssociation,73, 364, 730-752.

Ralston, A. y 1’. Rabinowitz (1978). A First Coursein NumericalAnalysis,McGraw-Hill.

Page 190: Anomalias Del Modelo Lineal General

REFERENCIAS 184

Reiss, 1’. C. (1990) ‘Detecting Multiple outliers with an app¡icationto R&D Productivity’, iourn.at ofEconometrics,43, 293-315.

Rousseeuw P. J. y E. C. van Zomeren(1990). “Unmasking Multivariate Outliers andLeverage Points”con discusión.Jaurnal of de AmericanStatisticalAssociation.85, 411, 633-651.

Ruud. P. A (1991). “Extensionsof EstimationMethods Using ¡he EM Algorithm”, Journal ofEconome-

trics, 49, 305-341.

Silvey, 5. 0. (1970). Starisrical Inference. Hannondsworth,Penguin.

Smith, 13. T., .1. M. Boy¡e, .1. .1. Dongarra.B. S. Garbow, Y. lkebe, y. C. Klema y C. 13. Moler (1974>.

Mantx EigensvstemRoutines.EISPI4CK Guide, Springer-Verlag.

Snee,R. 0. (1983). Discusióndel papel de Hocking (1983).

Srinivasan, V. e Y. H. Kim (1987) “Credit Granting: A Comparative Analysis of ClassiflcationProcedures”,Journal ofFinance, 42, 665-683.

Thomas.W. y R. D. Cook (1990). “AssessingInfluenceon Predictionsfrom GeneralizedLinearModels”,Technometrics,32 1, 59-65.

Train. K. (1986) Qualitasive Citoice Annlysis. Titeoiy, Econometricsansi an Application to AutomobileDemand.Cambridge,Mass., M.I.T Press.

Vuong, Q. U. (1989). Likelihood Rallo Tests for Model Selection ami Non-Nested Hypotheses,Econometrica 57 2, 307-333.

Weisberg,5. (1983). Discusióndel papel de Hocking (1983).

White, U. (1984). AsvmptoticTiteoryfor Econometricians.Academic Press.

Williams, 0. A. (1987). “GeneralizedLinear Model Diagnostics:The DevianceaudSingleCaseDeletion’,

Applied Statistics,36, 2, 181-191.Wills, H. (1987). “A note on SpecificationTestsfor ¡he Multinomial Logit Model”, Journalof Econome-

trics 34, 263-274.

Windineijer, F. A. G. (1991). A Goodnes-of-FitTest in te Multinomia] Logit Model Basedon WeightedSquaredResiduals”,mimeo.

Page 191: Anomalias Del Modelo Lineal General

INDICE DE AUTORES

Albert 48. 131, 181Altman 177Amemiya 19-21, 24, 132. 158, 162, 177, 179Aranda-Ordaz 48, 177Amaiz 177Atkinson 76-78, 82, 177Avery 177Azorín 177

Bazaraa 166, 167, 177Bedrick 48, 87, 177Belsley 72, 76-79. 177Ben-Akiva 31, 34, 113, 127, 177Berinan 177Bierman 177Box 3, 41, 45, 46, 49, 69. 178, 179Boyes 178Brendt 178l3unch 163, 178Burr 17, 178

Chambers 178Cook 42, 43, 45, 46, 48, 76, 78-81, 83, 92,

131, 178, 183Copas 2, 40, 48, 62, 87. 178Cosslett 19, 178Cox 19, 20, 46, 57, 62, 178, 179Cramer 31, ¡79

Daganzo 31, 116, 127, 179Dagenais 179Davidson 26, 56, 179Day 179Dempster 173, 179Dennis 163, 166, 167, 179Ohi¡¡on 3, ¡42, 143, 145-147, 152, 174, 179Dufour 179

Eisenbeis 177Engle 179

Gilí 163, 167, 179Godfrey 28, 54, 179Goldberger 179Goldfeld 163, 179Gourieroux 27, 179Gracia DIez 179, 180Creen 48, 94, 95, 131, 180Guerrero 48, 179

Hall 178, 179, 181Hampel 180Hausman 177, 178, 180Heckman 180Hendry 180Hill 48, 87, 177, 179, 182Hinldey 20, 62, 167, 179Hocking 38, 180, 183Hoffman 178Holschuh 178Hooke 171, 180Huber 180

Jeeves 171, 180.lennings 2, 40, 48, 57, 87, ¡80Johnson 48, 179, 180Jones 180

Keane 180Khn 183Kotz 14, 180Krasker 45, 46 76, 181Kuh 177, 181

Laird 179Lee 181Lerman 19, 31, 34, 37, 113, 127, 177, 181Lesaifre 48, 131, 181Low 178Luce 181

MacKinlay 181MacKinnon 26, 55, 56, 179Maddala 112, 181Manski 19, 178, 180-182Marquardt 182McCullagh 181McFadden 9, 11, 15, 19, 20, 178, 180-182McLachian 180Meng 182Monfort 179Morirnune 182Murray 179

Nelder 181, 182Nufiez 20, 160, 182

Page 192: Anomalias Del Modelo Lineal General

INDICE DE AUTORES 186

Pagan 182Peña 3, 47, 49, 53 69, 76, 80, 81, 84, 100,

102, 108, 109. 142, 149, 156, 158,159, 182

Poirier ¡82Powell ¡70, 182Pregibon vii, 2, 3. 40, 48, 57. 86. 87, 94, 142,

153, 155. 156, 176. 182

Quandt 52, 60, 163, 169, 179, 182

Ramsey 52, 182Reiss 183Renault 179Rousseeuw 84, 183Rubin 179Ruiz-Castillo 3, 41, 47 49, 53, 69. 182Ruud 173, 183

Sanchez-Crespo60. 136, 177Schmidt 182Schnabel 163, 166, 167, 179Serrano 179, 180Shetty 162, 166, 167 177Shilling 179Silvey 20, 183Sinkey 177Sirmans 179Snee 38, 183Suelí 19, 57, 179Srinivasan 183Suppes 181

Thomas 183Thompson 182Tiao 2, 41, 45, 46, 48, 49, 131, 178Train 183Trognon 179Trotter 169, 179

Vella 182Vuong 183

Wedderburn 182Weisberg 45, 48, 76, 79, 80, 82, 131, 178, ¡83Welsch 177, 181White 91, 183Williams 48, 87, 131. 183Wills 183Windmeijer 183Wise 180Wright 179

Yohai 81, 84, 100, 102, 108, 109, 142, 149,156, 158, 159, 182

van Zomeren 84, 183