Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 1
ECONOMETRIA I
I. INTRODUCCION
Econometria
Dos palabras de origen griego: Economa y Medida (Koutsoyiannis, 1977:3).
Trmino introducido por Ragnar Frisch en 1926, de origen noruego, para referirse a
estudios econmicos que hacen uso de mtodos estadsticos.
Desde sus orgenes y por su propia definicin, la econometra se ha movido entre
los campos de las teoras econmica y estadstica. As, en la medida en que ha
sido empleada tanto para proponer nuevas formulaciones como para apoyar o,
en su caso, refutar planteamientos ya hechos en la propia teora econmica, la
econometra se ha nutrido de las aportaciones de economistas cuyo campo de
accin es fundamentalmente la teora econmica (algo semejante puede decirse
de quienes centran su inters en la poltica econmica). Pero, simultneamente,
en la medida en que la econometra supone la aplicacin de la teora estadstica,
diversos estadsticos han incursionado en el terreno de aquella hacindola
evolucionar.
(Fuente: Para una breve historia de la econometra, Jos Fernndez Garca*/
Claramartha Adalid Daz de
Urdanivia)
En la literatura podran darse otras definiciones como:
1. Aplicacin de la Estadstica matemtica a la informacin econmica para dar
soporte emprico a los modelos construidos por la Economa Matemtica y
obtener resultados numricos.
2. Anlisis cuantitativo de fenmenos econmicos reales, basados en el desarrollo
simultneo de la teora y la observacin, relacionados mediante mtodos
apropiados de inferencia.
Es un apoyo para disipar la imagen de la Economa, considerada como una materia
donde se hacen afirmaciones y supuestos que para diferentes economistas tienen
diferentes interpretaciones.
Una clasificacin desde el punto de vista estadstico podra ser:
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 2
Econometra Terica
Clsica
Bayesiana
Econometra Aplicada
Bayesiana
Clsica
En este curso desarrolla el enfoque clsico y aplicado
Econometra Aplicada
Utiliza herramientas de la Estadstica para estudiar modelos de algunos campos
especiales de la economa, los negocios u otros. En particular, puede estudiar temas
conocidos como:
1. Empleo
2. Desempleo
3. Crecimiento econmico
4. Consumo
5. Produccin
6. Inversin
7. Demanda y oferta
8. Inflacin
9. Importaciones
10. Portafolio, etc.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 3
II. QUE ES UN MODELO ECONOMETRICO
Modelo
Es una representacin simplificada de la realidad, estructurada de tal forma que permita
comprender el funcionamiento total o parcial de esa realidad o fenmeno.
Es una representacin formal de ideas o conocimientos acerca de un fenmeno
(teoras) que generalmente se traducen bajo la forma de un conjunto de ecuaciones
matemticas. Carneiro de Matos, Orlando; 2da Edicin;
Editora Atlas S.A., Sao Paulo - Brasil 1997
Clasificacin de los modelos
Como visto anteriormente, es una representacin simplificada de la realidad, que
involucra:
A. Por la Forma funcional
a. Lineales.- aquellos donde los parmetros son expresados en forma lineal o
pueden ser transformados a lineales.
b. No lineales.- lo contrario de lo anterior.
B. Por el nmero de ecuaciones
a. Uniecuacionales.- El modelo consta de solo una ecuacin.
cWbXaY b. Multi-ecuacionales.- El modelo consta de varias ecuaciones.
cWbXaY
fQeWdZ
tZY
C. Por la asociacin de las variables con el tiempo
a. Estaticos.- Todas las variables se refieren a un mismo periodo de tiempo.
ttt cWbXaY
b. Dinmicos.- Las variables se refieren a distintos periodos de tiempo.
ttt cWbXaY 1
D. Por la finalidad
a. Previsin.
b. Decisin.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 4
Modelo economtrico
Como visto anteriormente, es una representacin simplificada de la realidad, que
involucra:
a) Relaciones o ecuaciones.- Modelo matemtico.
b) Variables.- Caractersticas de inters observables que pueden tomar
distintos valores.
c) Parmetros.- (o coeficientes) son valores que permanecen constantes y son
desconocidos de aquella relacin matemtica.
d) Trmino aleatorio.- (perturbacin aleatoria) que representa a todas las
caractersticas que no han podido ser includas en el modelo o relacin
matemtica.
Proceso metodolgico de la Econometra
Fuente: Adaptacin de Intrilligator 1978
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 5
Proceso metodolgico de la Econometra
Fuente: Adaptacin de Maddala 1996
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 6
Teora
Econmica
Observacin
del
Mundo Real
Formulacin
de Hiptesis
Modelo
Matemtico
Modelo
Economtrico
Colecta de Datos
Apropiados
Estimacin
de los
Parmetros del
modelo
Evaluacin
de Resultados:
Hiptesis
del modelo
AceptablesNo Aceptables
Revisin
de la
Metodologa
Inferencia,
Previsin
Toma de
Decisiones
1ra ETAPA:
Especificacin oConstruccin delModelo
2da ETAPA:
Estimacin
del
Modelo
3ra ETAPA:
Evaluacin
del
Modelo
Estimado
Desistencia
de las
Hiptesis
Proceso Metodolgico de la Econometra
Fuente: Adaptacin de Carneiro de Matos, Orlando; 2da Edicin;
Editora Atlas S.A., Sao Paulo - Brasil 1997
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 7
Ejemplo: Proceso metodolgico de la econometra
1. Planteamiento de la teora o de la hiptesis.
2. Especificacin del modelo matemtico de la teora.
3. Especificacin del modelo economtrico de la teora.
4. Obtencin de datos.
5. Estimacin de parmetros del modelo economtrico.
6. Pruebas de hiptesis.
7. Pronstico o prediccin.
8. Utilizacin para fines de control o poltica.
1. Planteamiento de la teora o de la hiptesis.
Se establece un conjunto de hiptesis, leyes o conjeturas sobre el comportamiento de
un fenmeno de la vida real ya existente o contribuciones de nuevas teoras.
2. Especificacin del modelo matemtico de consumo.
Es una representacin formal de las ideas o conocimientos anteriormente mencionadas
acerca de las teoras que generalmente se traducen bajo la forma de un conjunto de
ecuaciones matemticas.
3. Especificacin del Modelo Economtrico de Consumo
Es la misma especificacin anterior pero incorporando un trmino aleatorio a la relacin
matemtica, ste trmino considerara todos los elementos que por alguna razn no
pueden ser considerados en la relacin matemtica.
El modelo matemtico dado en el paso 2, supone que existe una relacin exacta
determinstica entre las variables, lo que no es cierto en la mayora de los casos.
4. Obtencin de Informacin
Para estimar los valores desconocidos de la relacin economtrica, se necesitan datos,
generalmente se toman datos muestrales.
5. Estimacin del modelo economtrico
Los datos o informaciones obtenidas en el paso 4 permiten estimar los valores
desconocidos de la relacin matemtica para tomar decisiones.
6. Prueba de hiptesis
Para comprobar si los valores estimados concuerdan con la teora.
7. Proyeccin o prediccin
Si el modelo escogido confirma la teora, este modelo se puede utilizar para predecir
valores futuros o desconocidos.
8. Usos del modelo para fines de control o de poltica
Un modelo final estimado puede ser utilizado para fines de control o de poltica.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 8
Ejemplo 1: Teora Keynesiana del Consumo. (D. Gujarati)
a) Planteamiento de la teora o de la hiptesis.
KEYNES plantea:
La ley sicolgica fundamental. Consiste en que los hombres y mujeres como regla
general y en promedio, estn dispuestos a incrementar su consumo a medida que su
ingreso aumenta, pero no en la misma cuanta del aumento en su ingreso.
En otras palabras, Keynes postula que la propensin marginal a consumir (PMC), es
decir, la tasa de cambio del consumo generado por una unidad de cambio en el ingreso,
es mayor que cero pero menor que uno.
b) Especificacin del modelo matemtico de consumo.
Keynes postul una relacin positiva entre el consumo y el ingreso. Sin embargo, no
especific la relacin funcional entre las dos.
Por ejemplo, la forma ms simple de la funcin Keynesiana de consumo podra ser:
XY 21 10 2 (planteada por un Economista matemtico).
1 parmetro intercepto del modelo
2 parmetro pendiente del modelo, mide la PMC (Propensin Marginal a Consumir).
Y
X
PMC2
1
Intercepto1
}
}
Funcin Keynesiana de
Consumo
c) Especificacin del Modelo Economtrico de Consumo
El modelo matemtico dado en el paso 2, supone que existe una relacin exacta
determinstica entre el consumo y el ingreso. Pero las relaciones entre las variables
econmicas son en general inexactas.
Un econometrista modificara la funcin determinstica as
XY 21 10 2 = trmino de perturbacin o de error, es una variable aleatoria.
El trmino de representa todos aquellos factores que afectan el consumo pero que no son considerados en el modelo en forma explcita. Este ltimo sera
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 9
el llamado Modelo de Regresin Lineal, el cual ser estudiado a lo largo del
curso.
d) Obtencin de Informacin
Para estimar los valores desconocidos de 1 y 2 se necesitan datos, por
ejemplo:
Mes Y=Consumo X=Ingreso
Enero 2009
Febrero 2009
Diciemb 2009
.
.
.
2505.6
2870.7.
.
.
.
.
.
3248.9
3761.3
4280.8
4822.1
e) Estimacin del modelo economtrico
A travs de un anlisis de regresin se obtendrn estimadores para 1 y 2 del
modelo teorico
XY 21 10 2
por ejemplo, se puede obtener:
XY 270.05.1 (Interpretar modelo ajustado) donde
1 =-1.5 estimador de 1 y
2 = 0.70 estimador de 2
f) Prueba de hiptesis
Si el modelo ajustado es una aproximacin razonablemente buena de la realidad, se
necesitan criterios apropiados para encontrar si los valores estimados obtenidos en una
ecuacin como la anterior, concuerda con las expectativas de la teora que est siendo
probada.
Del modelo anterior, Keynes esperaba que la PMC sea menor que 1.
Se quiere responder a la pregunta es 0.70 estadsticamente menor que 1?
Si lo es, puede apoyar la teora de Keynes.
Estos criterios son conocidos como parte de la Inferencia Estadstica.
g) Proyeccin o prediccin
Si el modelo escogido confirma la teora, este modelo se puede utilizar para predecir
valores futuros o desconocidos de la variable dependiente Y, siendo que se conoce el
valor de X (variable predoctora) y se utilizan los estimadores 1 y 2 anteriormente
hallados.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 10
h) Usos del modelo para fines de control o de poltica
Un modelo estimado como XY 270.05.1 puede ser utilizado para fines de control o
de poltica.
El gobierno por ejemplo podra manejar la variable de control
X Ingreso para producir el nivel deseado de la variable objetivo.
Y Consumo.
En resumen, en esta seccin hemos visto el planteamiento de un
modelo para un fenmeno de la realidad y la estimacin de este
modelo para luego interpretarlo. Ms adelante estudiaremos algo sobre
modelos.
Ejercicio: Responda:
1. Qu es un modelo?
2. Qu diferencia hay entre un modelo matemtico y un modelo economtrico?
3. Qu es un modelo no lineal?
4. Cules son las etapas del proceso metodolgico de la econometria?
5. Cules son los pasos del proceso metodolgico de la econometra?
6. Qu cree usted que es Especificacin de un modelo?
Carneiro de Matos, Orlando; 2da Edicin;
Editora Atlas S.A., Sao Paulo - Brasil 1997
JMAEVResaltado
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 11
III. CARACTERISTICAS DE LOS DATOS EN ECONOMETRA
Se puede encontrar los siguientes trminos como caractersticas de los datos
cuantitativos que podran ser empleados en anlisis de problemas de econometra:
1. Series de Tiempo
2. Datos de Corte Transversal
3. Datos Agrupados
4. Datos de Panel
5. Datos Agregados
6. Variables Ficticias
7. Variables Aproximadas
1. Series de tiempo
Esta informacin se obtiene de la observacin de la variable en diferentes periodos de
tiempo. En usual, que las series de tiempo tengan periodicidad diaria, semanal,
mensual, trimestral y anual. Las series de tiempo suelen estar altamente
correlacionadas debido a su evolucin paralela en el tiempo.
2. Datos de corte transversal
Consiste en datos de una o ms variables recogidos en un periodo de tiempo fijo y
determinado, registrados una sola vez para cada unidad. Puede ser, un da, una
semana, un mes, un ao, un periodo determinado para registrar una sola vez los datos.
3. Datos Agrupados
Los datos agrupados contienen informacin de corte transversal y de series de tiempo
juntos. Por ejemplo: En cada mes, se tomaron 3 registros de cada una de las 4
variables o caractersticas.
4. Datos de Panel ( longitudinales)
Este es un tipo especial de datos agrupados, en la cual la misma unidad de corte
transversal es observada a travs del tiempo.
Unidad
de tiempo V1 V2 V3 V4
ENERO
FEBRERO
MARZO
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 12
5. Datos Agregados
Se dice de datos agregados cuando un economista cuenta con informacin agregada,
desconociendo el mtodo empleado para generarla.
Ejemplo: Se quiere estimar las Importaciones de un pas, (Mxico por ejemplo) se
deflacta las variables Importaciones mexicanas por el ndice de precios del productor
para bienes en los Estados Unidos.
Nota: Se produce un sesgo de sub o sobreestimacin
en el valor real de las importaciones ya que el ndice
citado difiere del ndice global de precios.
El ndice global podra calcularse, pero el costo y
dificultad en hacerlo podra no ser justificado.
6. Variables Ficticias
Son variables que toman valor 1 para una submuestra y 0 para la otra.
7. Variables Aproximadas
En ocasiones no se cuenta con informacin sobre alguna variable que interviene en el
modelo economtrico. Una posible solucin es utilizar una aproximacin a esta variable
bajo el supuesto de que su comportamiento es similar. A este tipo de datos se le llama
variable proxy y depende de la verificacin del supuesto.
Observacin:
En ocasiones, economistas con experiencia estudiando las estructuras de economa en
pases desarrollados donde se encuentra disponible gran parte de la informacin, no se
percatan de las restricciones de informacin que puedan existir en pases como el
nuestro por ejemplo. Si stos mismos profesionales desarrollan modelos para un pas
como el nuestro por ejemplo, es posible que no tenga la importancia prctica.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 13
IV. MODELO LINEAL SIMPLE
Modelo con dos variables
Un modelo linear es un intento de hacer un anlisis cuantitativo de la relacin que existe
entre la variable dependiente, con las variables explicativas para un conjunto de valores
observados de ambos tipos de variables. Un modelo lineal simple considera slo una
variable explicativa.
Otras denominaciones de la variable respuesta
Respuesta
Dependiente
Salida
Endgena
Regresiva
Explicada
Otras denominaciones de la variable explicativa
Estmulo
Independiente
Entrada
Exgena
Regresora
Explicativa
Predeterminada
Objetivo: Determinar un modelo con parmetros numricos que permita estimar o
aproximar el valor de una variable Y en base a otra variable X.
XY 21
Y variable dependiente o variable respuesta.
X variable explicativa error aleatorio
Ejemplo 3: (D. Gujarati)
Supngase un pueblo pequeo viven slo 60 familias. Se realiza un censo en este
poblado porque interesa a gobierno estudiar la relacin entre el Gasto de consumo
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 14
familiar semanal Y; y el Ingreso familiar semanal X (luego de los impuestos de
ley).
En otras palabras, se quiere predecir el nivel de la media del Gasto de consumo
semanal por familia (de la poblacin) conociendo el ingreso semanal de la familia.
xxXYE 21)/(
ingresoingresoXConsumoE 21)/(
Se dividen las familias en 10 grupos, donde cada grupo tiene ingresos aproximados y
se registran las Gastos de consumo de cada familia para cada nivel de Ingresos.
Todos los registros son semanales.
Ingresos familiares semanales
X_i X_1 X_2 X_3 X_4 X_5 X_6 X_7 X_8 X_9 X_10
Y 80 100 120 140 160 180 200 220 240 260
55 65 79 80 102 110 120 135 137 150
Gasto de 60 70 84 93 107 115 136 137 145 152
Consumo 65 74 90 95 110 120 140 140 155 165
Familiar 70 80 94 103 116 130 144 152 165 168
por 75 85 98 108 118 136 145 157 175 180
semana 88 113 125 140 160 180 185
115 162 191
173
E(Y/X=x) 65 77 89 100 113 125 137 149 161 173
60)(
60
1
Y
YE j
n
i
i
in
Y
XYE
j
1)/(
10,...,3,2,1
,...,3,2,1
j
ni j
As, tenemos: (para las familias)
La Esperanza o Promedio 65)80/( 1 XYE es el Consumo promedio semanal de
las familias que ganan 80 nuevos soles.
Similarmente,
El consumo promedio de las familias que ganan 160 es 113.
El consumo promedio de las familias que ganan 260 es 173.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 15
Funcin de regresin poblacional (FRP)
Muestra cmo el valor de Y vara en relacin a los valores de la variable X. Su forma
estocstica es la siguiente:
XY 21
1 y 2 son parmetros fijos, desconocidos (valores poblacionales) Se denominan coeficientes de regresin, intercepto, coeficiente de la pendiente de la
recta, etc.
As, el valor esperado de Y vara tambin de acuerdo a la variacin de X y se
denomina Lnea de Regresin Poblacional.
XXYE 21)/(
Interpretacin:
65)80/( XYE valor promedio de Y para 80X
La Regresin Poblacional para un valor particular de la variable dependiente es:
ii XY 21
Si en el modelo ii XY 21 reemplazamos cada uno de los valores de
consumo cuando el ingreso es 80X , nos da las siguientes expresiones:
1211 55 XY
2212 60 XY
3213 65 XY
4214 70 XY
5215 75 XY
La diferencia entre cada valor observado y cada valor promedio se debe al trmino de
perturbacin i
)()/( 21 XYXYEY iiii
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 16
Interpretacin de i
Suponga que conseguimos conocer los valores de 1 y 2 , entonces slo faltara
conoce el valor del trmino de perturbacin i que representa a toda otra variable(s)
posible(s) de las que tambin depende iY que no estn incluidas en el modelo porque
es imposible medirlas. Tambin, i representa efectos aleatorios que no dependen
de las variables, denominada perturbacin estocstica o trmino de error estocstico.
1. Grfica de la FRP.- Lnea de Regresin Poblacional o Curva de Regresin
Poblacional. Es el lugar geomtrico de las esperanzas de la variable dependiente
para los valores fijos de las variables explicativas
La FRP en dos variables (en su forma estocstica) es
ii XY 21 .
Se grafica la esperanza de la FRP en dos variables: XXYE 21)/(
Y
X
)/( iXYE
80 220
149
101
65 *
*
*
Ingreso semanal140
Gasto de
Consumo
semanal
* : Media condicional
Lnea de Regresin
Poblacional
Esperanza Poblacional de Y dado iX : Cmo vara la esperanza de Y variando X.
Otra forma de escribir la FRP ii XY 21 es
ii XYEY )/(
Los valores de iY estn agrupados alrededor del valor esperado de todos los valores
de Y para un dado iX .
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 17
Funcin de regresin muestral (FRM)
Es la que se obtiene a partir de una muestra de observaciones (no de la poblacin), y
se necesita estimar los parmetros del modelo lineal simple poblacional (o de la FRP), a
partir de la informacin proporcionada por la muestra. Su forma estocstica es la
siguiente:
ii XY 21
1 es un estimador de 1
2 es un estimador de 2
i es un estimador de i
iY aproxima (o es el ajuste de) iY
La Funcin de Regresin Muestral es:
XYi 21
iY estimador de )/( iXYE
1 estimador de 1
2 estimador de 2
i Al trmino de perturbacin obtenido de la muestra se le dice Residual.
)( 21 XYii
El i se estima a partir de los residuales i as: iii YY
Cuando no se dispone de toda la informacin poblacional, se toman muestras de Y
para valores dados de X.
Si se toman dos muestras aleatorias de Y para valores de X dados y se trazan dos
diagramas de dispersin de las muestras en el mismo grfico y se trazan las Lneas de
Regresin Muestral para cada muestra, se tiene:
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 18
Y
X
.
.
. . ..
.
. . .
. .
.
.. . . . .
.
.
. ... .
.. .
FRM1
FRM2
Caractersticas:
1.- Cada lnea se conoce como lnea de regresin muestral.
2.- Cada lnea intenta representar la Funcin de Regresin Poblacional.
3.- Muestralmente, slo se considerar como aproximaciones de la verdadera FRP.
4.- Para n muestras, habrn n FRM, posiblemente todas diferentes.
Luego de obtener la informacin de una muestra y sustituirla en los estimadores, se
obtienen valores de 1 y 2 , a los que se les denomina valores estimados o
estimativas.
3. Estimacin
Dado que el objetivo principal es estimar la FRP: ii XY 21
Hallando la FRM: ii XY 21 ,
Como la FRM es apenas una aproximacin de la FRP, se desea una regla o un mtodo
que haga que esta aproximacin sea lo ms ajustada posible.
En otras palabras, se busca construir una FRM tal que 1 y 2 estn lo ms cercano
posible a los verdaderos valores de 1 y 2 , aunque nunca se llegue a conocer los
valores de 1 y 2 .
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 19
Funcin de regresin muestral
X
FRM:
ii XXYE 21)/( FRP:
ii XY 21 .
.
.iiY
iY
iY
)/( iXYE
iX
4. Mtodo de Estimacin
El mtodo para la construccin de esta FRM es posible tanto para el caso bivariado
iii XY 21
como para el caso multivariado con k variables explicativas o independientes
iikkiii XXXY 23121
tambin visto en forma matricial para n observaciones como XY .
El mtodo ms utilizado para hallar la FRM es el Mtodo de Mnimos Cuadrados
Ordinarios (MCO).
Para utilizar el mtodo de Mnimos Cuadrados Ordinarios (MCO) en la estimacin de los
parmetros, se requiere que el modelo sea lineal en los parmetros y se les conoce
simplemente como Modelos de Regresin Lineal.
Es posible que algunos modelos no presenten linealidad en los parmetros. Sin
embargo, es posible, a travs de una transformacin adecuada obtener un modelo
lineal en todos los parmetros, entonces, al modelo antes de la transformacin se le
considera como un Modelo de Regresin Lineal.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 20
5. Linealidad
Antes de obtener el modelo que mejor se ajuste al modelo real, conviene graficar las
observaciones de tal forma que permita lograr una configuracin a priori para facilitar la
eleccin de la forma funcional apropiada.
Las funciones reconocidas con ms frecuencia son:
(1) Lineal XY 10
(2) Cuadrtica 2
210 XXY
(3) Hiperblica o recproca X
Y1
10
(4) Semilogartmico )ln(10 XY
)ln()ln( 10 XY
(5) Semilogartmico inverso XY 10)ln(
(6) Logartmico o logartmico doble )ln()ln()ln( 10 XY
(7) Logartmico recproco X
Y1
)ln( 10
En los modelos de dos variables, la forma funcional puede deducirse a partir del
diagrama de dispersin, pero en un modelo de Regresin Mltiple, no es fcil
determinar la forma funcional apropiada porque grficamente no se puede visualizar los
diagramas de dispersin.
Todos los casos anteriores son funciones de regresin lineal en los parmetros.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 21
Y
X
Y
X
xy 10 xy 10
2
210 xxy
2
210 xxy
Y
X
Y
X
xy /10
xy /10 xy 10ln
Y
X
Y
X
xy 10ln
xy lnln 10
xy lnln 10
xy lnlnln 10
xy lnlnln 10
Ejemplo:
En el ejemplo de Consumo, i podra ser otras variables de las cuales tambin dependera el modelo como por ejemplo:
(21 XY Riqueza, tamao de la familia, consumo de un periodo
anterior, Variacin de precios al consumo, tasa de inters, etc. ) .
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 22
Ejemplo:
Cules de los siguientes modelos pueden ser considerados lineales: (A, B, y son parmetros)
(1) eAXY
(2) XAY lnlnln
(3)
X
Y
(4) XY
Ejemplo:
Escriba 2 modelos no lineales con dos variables explicativas.
Laboratorio
1) Buscar una base de datos de por lo menos 5 variables explicativas (con la
variable dependiente son 6 variables).
2) Importar datos hacia R-project
JMAEVResaltado
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 23
VI. MODELO LINEAL GENERAL CLASICO
Modelo lineal general
Suponga que existe una relacin lineal entre una variable Y , )1( k variables
explicativas 1X , 2X , kX y un trmino de perturbacin .
Modelo terico:
kkXXXY 23121
Para n observaciones se tiene un sistema de n ecuaciones de la forma:
iikkiii XXXY 23121 ni ....,2,1
1112311211 kkXXXY
nkkXXXY 222321212
nnkknnn XXXY 23121
matricialmente:
nknkn
k
k
n XX
XX
XX
Y
Y
Y
2
1
1
0
1
221
111
2
1
1
1
1
En notacin matricial:
11)1()1(1 nkknn XY .
o simplemente se puede escribir:
XY
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 24
Escalarmente:
iY Variable aleatoria observable ni ....,2,1
ijX Variables no aleatorias observables fijas ni ....,2,1 , kj ....,2,1
j parmetros desconocidos kj ....,2,1
i error aleatorio no observable ni ....,2,1
Matricialmente:
Y Vector aleatorio observable
X Matriz de valores observables fijos
Vector de parmetros desconocidos Vector de errores aleatorios no observables
Supuestos del Modelo Lineal General Clsico
Escalarmente
(i) 0)( iE ni ,,2,1
(ii) 2)( iVar constante (homocedasticidad)
(iii) 0)( jiCov ji (no correlacin entre los errores)
(iv) ),0(2Ni (distribucin normal)
(v) No existe relacin lineal exacta entre los kXXX ,,, 21
(vi) los parmetros k ,,,, 210 permanecen constantes a los largo de toda la
muestra (estabilidad)
Matricialmente
(i) 0
0
0
)(
1
n
E
(ii) I2
1
1
)(
n
n
EE
nnnn
n
n
E
21
2
2
221
112
2
1
)( E
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 25
)(),(),(
),()(),(
),(),()(
21
2212
1211
nnn
n
n
VarCovCov
CovVarCov
CovCovVar
I2
2
2
2
00
00
00
(iii)
nkn
k
k
kn
XX
XX
XX
1
221
111
1
1
1
X matriz de nmeros determinsticos
(iv) 1)( kRango X ( 1k =nro columnas de knX ) ( 1 kn )
El supuesto 1)( kRango X asegura que ninguna de las columnas de la
matriz knX deben ser linealmente independientes.
(v) ),(2
1
I0
N
n
en consecuencia: ),( 2IXY N
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 26
VII. EVALUACIN DE LA NORMALIDAD
La variable respuesta del modelo clsico, deber evaluarse en la normalidad. Existen
diversos mtodos para evaluar la normalidad de las observaciones.
Fundamentalmente, se debe verificar las siguientes medidas.
Sesgadez.- Es una medida de asimetra de la distribucin de las series alrededor de
su media. La sesgadez se calcula como:
n
i
i YY
nS
1
3
1
donde
n
i
i
n
YY
1
2
La sesgadez de una distribucin simtrica es cero. Sesgadez positiva significa que la
distribucin tiene una larga cola hacia la derecha y sesgadez negativa significa que la
distribucin tiene una larga cola a la izquierda.
Kurtosis.- Mide el apuntalamiento o aplanamiento de la distribucin de la serie. La
Kurtosis se calcula como:
n
i
i YY
nK
1
4
1
donde
n
i
i
n
YY
1
2
La Kurtosis de la distribucin normal es 3. Si la Kurtosis excede a 3, la distribucin es
puntiaguda (leptocurtica) comparada con la normal. Si la Kurtosis es menor que 3, la
distribucin es aplanada (pleptocurtica) comparada con la normal.
Jarque-Bera (JB).- Es el test estadstico para probar si las series son o no distribudas
normalmente. Este test mide la diferencia de la sesgadez y kurtosis de las series con
aquellos de una distribucin normal. El estadstico es calculado como:
4
)3(
6
22 KS
knBeraJarque
Donde S es la sesgadez, K es la kurtosis y k representa el nmero de
coeficientes estimados utilizados para crear las series.
Contraste de hiptesis
:0H Las observaciones provienen de una distribucin Normal
:1H Las observaciones no provienen de una distribucin Normal
Estadstico de Prueba:
Bajo la hiptesis nula, es decir, suponiendo que la normalidad se cumple, el estadstico
de Jarque-Bera tiene una distribucin Chi-cuadrado con 2 grados de libertad.
Regla de decisin:
Rechazar 0H si 2
..2 lgBeraJarque a un nivel de significancia.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 27
Nota acerca de la normalidad:
Hay diversas pruebas de normalidad, entre las ms conocidas se tiene:
Distancia de Malahanobis
Kolmogorov-Smirnov
Cramer y Von Mises.
Kendall y Stuart.
Shapiro y Wilks
Shapiro y Francia
Qqplot=quantile-quantile plot
De todas las listadas arriba, al rechazar la prueba de normalidad, ninguna de ellas
proporciona una solucin si es que la hubiese.
Hay una prueba que ayudara a conocer qu tipo de transformacin de los datos podra
hacerlos aproximadamente normales para poder aplicarlo, como en este curso al
modelo lineal clsico. El mtodo de Box y Cox es una salida.
JMAEVResaltado
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 28
VIII. ESTIMACIN MCO - MV
I. Mtodos de Estimacin de los Parmetros
El Modelo de Regresin Lineal Clsico tiene un conjunto de parmetros desconocidos,
tales como k ,,, 10 y 2 .
Existen diversos mtodos para estimar los parmetros k ,,, 10 y 2 del
modelo lineal clsico, de los cuales mencionamos:
a). Mtodo de Mnimos Cuadrados (MCO OLS).
b). Mtodo de Mxima Verosimilitud (MV).
c). Mtodos de Mnimos Cuadrados Generalizados (MCG).
Pueden existir otros mtodos, menos conocidos, pero la mayora de los mtodos de
estimacin se basan en los residuos o errores, que se definen como la diferencia entre
el valor real de la variable dependiente y su estimador a travs del modelo.
ii YY ni ,,2,1 Entre los mtodos para estimar los parmetros del modelo utilizando los residuos,, el
ms simple y conocido es el Mtodo de Mnimos Cuadrados Ordinarios (MCO OLS).
II. Mtodo de mnimo cuadrados ordinarios
1 PARA DOS VARIABLES modelo ii XY
1.1 Estimadores para i
Dada una muestra de n observaciones de X y Y , se desea hallar la Funcin de Regresin Muestral (FRM) tal que la suma de los residuos al cuadrado sea mnima.
Dado una muestra de n observaciones:
SUMA DE RESIDUOS AL CUADRADO:
2
11
2)(
n
i
ii
n
i
i YY
Procedimiento:
Minimizar la suma de los residuos al cuadrado 2
1
10
2
11
22 )()(
n
i
i
n
i
ii
n
i
i XYYYS
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 29
Derivando con respecto a 0 y 1 :
n
i
i
n
i
i
XY
XYS
1
10
0
1
2
10
0
2
0)1)((2
)(
n
i
i
n
i
i
XXY
XYS
1
10
1
1
2
10
1
2
0))((2
)(
Resolviendo las dos ecuaciones se obtiene:
ESTIMADORES DE MCO:
n
i
i
n
i
ii
X
YX
1
2
10 y
n
i
i
n
i
ii
XnX
YX
1
22
11
VALORES ESTIMADOS O ESTIMATIVAS:
n
i
i
n
i
ii
x
yx
b
1
2
10 y
n
i
i
n
i
ii
xnx
yx
b
1
22
11
Caractersticas:
(1) Los estimadores MCO se expresan en funcin de las variables X y Y.
(2) Son estimadores puntuales (escalar)
(3) La Lnea de Regresin Muestral pasa a travs de las medias muestrales X y
Y , por tanto, puede escribirse como XY 10 .
(4) La suma de los residuos estimados es igual a cero 01
n
i
i
Pregunta:
Cmo sera para tres variables? (la variable respuesta y dos variables explicativas)
JMAEVResaltado
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 30
2.- MATRICIALMENTE modelo XY )(;( 21 IX)X'XY N
2.1 Estimador para
Hallar tal que minimice la Suma de Cuadrados de los Residuales:
)()(
)(1
2
1
2
1
1
Y(Y)'YY
n
i
ii
n
i
in
n
YY
(1) Utilizar la Suma de Cuadrados de los Residuales en su forma extensa
)()( Y(Y)'YY
)( X(Y)'XY
XX''YX''XY'YY'
XX''YX''YY' 2
(2) Derivar con respecto a e igualar a cero:
XX''YX''YY'
)2(
)'(
'XX'YX' 22
0
obteniendo el llamado Sistema de Ecuaciones Normales YX'XX'
y el Estimador de Mnimos Cuadrados Ordinarios es: YX'XX'1)(
(3) Derivar por segunda vez con respecto a para verificar que es un mnimo.
Como 02
)'(2
2
XX'
, se verifica que minimiza la Suma de Cuadrados de
los Residuos. (porque es positiva definida y simtrica).
2.2 Estimador para 2
Un estimador de , sera el residual . En consecuencia, la varianza del residual podra utilizarse como estimador de la varianza del trmino de perturbacin .
Utilizando este resultado y sabiendo que I'2)( E se puede probar que
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 31
kn
'
2 es un estimador insesgado de 2 .
3. PROPIEDADES DE LOS ESTIMADORES MCO DE
(1) YX'XX'1)( es lineal en Y .
(2) es insesgado porque )(E
XX'XX'YX'XX'YX'XX' 111 )()()())(()( EEE .
(3) 21)()( XX'Var pues
21111 )()()()())(()( XX'XX'XYX'XX'YX'XX' VarVarVar .
(4) ))(;(21 XX' N .
(5) );(2 jjjj aN kj ,...,2,1,0 y jja es el i-simo elemento
de la diagonal de la matriz 1)( XX' .
(6) 2),( ijji aCov , kml ,...,2,1,0, y ija es el ij-simo elemento
fuera de la diagonal de la matriz 1)( XX' kji ,...,2,1,0, .
(7) i y j son independientes si y solo si 0ija ji
III. Mtodo de mxima verosimilitud
1.- FUNCIN DE VERSIMILITUD
Recordamos que )(;(21IX)X'XY N
En este caso, la funcin de verosimilitud viene dada por la densidad conjunta de la
normal multivariada L .
))(
2
1exp
2
1),/,(
2
2/
2
2 X(YXYXY
n
LL
Tomando logaritmo:
))(
2
1exp
2
1loglog
2
2/
2
X(YXY
n
L
))(2
1log
22log
2 22
X(YXY
nn
derivando con respecto a los parmetros:
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 32
0)(2
2log
2
XX'YX'
L
0))(2
1
2log
422
X(YXY
nL
de las dos ltimas ecuaciones, los estimadores mximo verosmiles son:
YX'XX' 1)( mv y n
mv
'
2
donde 2
mv tambin se puede escribir asi:
nnmv
))('
2 X(YXY
Ejemplo 5: Asumiendo que la Renta de una persona puede depender de los Aos de
estudio y de la Edad. Para las observaciones dadas, hallar estimativas de los
parmetros utilizando los estimadores MCO y hallar un previsor de la variable
respuesta.
renta Y Aos de estudio Edad
i Y X_1 X_2
1 10 6 28
2 20 12 40
3 17 10 32
4 12 8 36
5 11 9 34
3491
3681
32101
40121
2861
X
58601562170
156242545
170455
3491
3681
32101
40121
2861
3436324028
9810126
11111
' XX
1001601960
1604001840
1960184050656
2880
1)'( 1XX
2430
665
70
'YX y
5
50
56
24
1
2
1
0
.
Los resultados de mostrados son las estimativas del vector de parmetros
verdadero .
Previsor de Y : 2121 2.01.23.224
5
24
50
24
56 XXXXY
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 33
Para 71 X y 302 X entonces
7.10 Y estimativa de la renta media con 7 aos de estudios y 30 aos de edad.
previsin de la renta de un individuo con 7 aos de estudios, 30 aos de
edad.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 34
IX. COEFICIENTE DE DETERMINACIN - SUMAS DE CUADRADOS
La variabilidad de los modelos de regresin lineal se mide a travs de las sumas de
cuadrados definidas como sigue:
DEFINICIONES
1.- SUMA DE CUADRADOS DEL TOTAL (SCT)
Es la varianza muestral de la variable endgena multiplicada por n. Es una medida del
tamao de las fluctuaciones de dicha variable alrededor de su valor medio. La SCT es
la suma que el modelo economtrico pretende explicar.
2.- SUMA DE CUADRADOS DE LA REGRESIN (SCR)
Es el grado de fluctuacin de la variable estimada Y alrededor del promedioY , donde
Y es la variable generada por el modelo para representar a Y . Es el nivel de
fluctuacin de la variable Y que el modelo es capaz de explicar. Llamada tambin
Suma de Cuadrados Explicada.
3.- SUMA DE CUADRADOS DEL RESIDUAL (SCE)
Es un indicador del nivel de error del modelo en su intento de explicar Y .
Ejemplo 6: En el caso biviariado, la suma explicada es el grado de fluctuaciones de la
variable iY que el modelo pretende explicar.
Y
X
Y
iY
iY
})( ii YY Regresin Muestral
} )( YYi )( YYi
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 35
(1) Sumas de Cuadrados para modelos con intercepto
Para un modelo con intercepto XY ,
nkn
k
k
XX
XX
XX
X
1
221
111
1
1
1
y
k
1
0
.
SCESCRSCT
donde
Y11IY
nYYSCT
n
i
i
''
1
2
(forma cuadrtica)
Y11X'X)X(X'Y 1
n
YYSCRn
i
i
''
1
2
(forma cuadrtica)
YX'X)X(X'IY 1
'1
2n
i
ii YYSCE (forma cuadrtica)
n
i
ii
n
i
i
n
i
i YYYYYY1
2
1
2
1
2
Interpretacin
n
i
ii
n
i
i
n
i
i YYYYYY1
2
1
2
1
2
Fi jo, no depende del
modelo. Puede verse
c o m o l a s u m a d e
cuadrados del resduo
del modelo YY
Cuanto mayor, mayor es
la diferencia entre YY y
kkXXY 110
Cuan t o m enor ,
ms motivos para
usar
kXXX ,,, 21 Reduccin en la suma decuadrados del resduo con
la introduccin de
kXXX ,,, 21 en el modelo
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 36
(2) Sumas de Cuadrados para modelos sin intercepto
Para un modelo sin intercepto XY ,
nkn
k
k
XX
XX
XX
X
1
221
111
y
k
1
SCESCRSCT ncnc
donde
YY'1
2
n
i
inc YSCT (forma cuadrtica)
YY '1
2
n
i
inc YSCR (forma cuadrtica)
YX'X)X(X'IY 1
'1
2n
i
ii YYSCE (forma cuadrtica)
consecuentemente
n
i
ii
n
i
i
n
i
i YYYY1
2
1
2
1
2
(3) Coeficiente de determinacin 2R
En el MRLC iikkii XXY 110 , en su forma matricial
XY , es deseable tener alguna medida de que tan bien el modelo de
Regresin realmente se ajusta a las observaciones.
Se quiere responder:
a) Qu tan bien el modelo propuesto, conteniendo las variables explicativas
realmente explican las variaciones en la variable dependiente.
b) Qu tan bien la lnea de regresin estimada se acerca a todas las observaciones
juntas.
Observacin:
El paso (b) no es lo mismo que decir que la lnea de
regresin estimada se acerca a la lnea de regresin
poblacional porque sta ltima nunca es conocida.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 37
Se define al estadstico de bondad de ajuste del modelo coeficiente de
determinacin como SCT
SCE
SCT
SCRR 12
Y, al coeficiente de correlacin mltiple entre Y y Y como:
SCT
SCE
SCT
SCRR 1 .
Valores de 2R cercanos a 1 indica que el modelo explica cercanamente toda la
variabilidad de la variable dependiente alrededor de su valor.
Valores de 2R cercanos a 0 indica que el modelo se ajusta a los datos pobremente.
Como ilustracin graficamos los casos extremos en el modelo divariado:
Y
X
02 RRepresentado por una
l nea est imada l lana
(pendiente igual a cero).
12 RY
X
Cuando todos los puntos de
los datos caen exactamente
en la lnea estimada
Propiedades de 2R
a) 12 R
b) Si el modelo tiene trmino independiente ( 00 ), entonces 2R se puede
escribir como:
2
2
2
22
'
''
'
''
YnYY
YnXX
YnYY
YnYXR
)(
SCT
SCR
c) Si el modelo no tiene trmino independiente ( 00 ), entonces
ncnc
nc
SCT
SCE
SCT
SCRR 12 y puede tomar valores de 11 2 R el
exponente al cuadrado es considerado simplemente rotacional).
d) Cuando 02 R , entonces no tiene sentido el trmino
2R .
e) Para 02 R se considera que un modelo se ajusta bien a las observaciones si
2R es cercano a 1.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 38
(4) Problemas al utilizar 2R como bondad de ajuste
2R es simple de calcular, intuitivo de entender y provee una amplia indicacin del
ajuste del modelo a los datos.
Sin embargo, existen algunos problemas con 2R al utilizarlo como medida de bondad
de ajuste.
a) 2R es definido en trminos de variacin acerca de la medida de Y tal que si el
modelo es reparametrizado y se cambia la variable dependiente, 2R cambia
aunque el segundo modelo slo sea un reordenamiento del primer modelo con
idntica SCR . Por eso, 2R no es sensible a comparar modelos con diferentes
variables dependientes.
b) 2R nunca decrece si se agregan ms regresores al modelo aunque aunque la
variable agregada no sea realmente relevante para el modelo. Esta
caracterstica de 2R hace imposible utilizarlo como un determinante de si es
que, dada una variable, debera o no incluirse en el modelo.
c) Para regresiones con series de tiempo, con frecuencia, 2R toma valores de por
lo menos 0.9 y por lo tanto, 2R no es bueno para discriminar entre stos
modelos, ya que la mayora de stos tendrn valores altos de 2R .
(5) Coeficiente de determinancin ajustado 2R como bondad de ajuste
Para resolver el tem b) de los 3 problemas de 2R antes mencionados, se suele
tomar en cuenta la falta de grados de libertad asociado con la adicin de variables al
modelo.
El 2R o
2R ajustado es:
)1(
11 22 R
kn
nR
Si se agrega un regresor extra al modelo, k se incrementa y 2R disminuir siempre,
excepto en casos cuando 2R crezca compensatoriamente.
Observacin: No se pueden hacer pruebas
estadsticas con 2R y
2R porque sus distribuciones de probabilidad no estn disponibles.
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 39
(6) Coeficiente de correlacin r Es una medida de asociacin entre dos variables
Poblacional Muestral
22
),(
YX
YXCovr
1
)(
1
)(
))((
1
2
1
2
1
n
YY
n
XX
YYXX
rn
i
i
n
i
i
n
i
ii
donde 2Rr 10 r
Propiedades
a) Es simtrica pues YXXY rr .
b) Si X y Y son estadsticamente independientes, el coeficiente de correlacin es
cero.
c) Si 0r , eso no implica independencia entre las variables.
d) 2Rr es una medida de asociacin lineal, es decir, mide la asociacin
lineal entre dos variables.
e) A r tambin se le denomina coeficiente de correlacin de orden cero.
(7) Coeficiente de correlacin de orden m Por orden se entiende el nmero de ndices secundarios, por ejemplo:
4.12r Coeficiente de correlacin de orden 1 ( de primer orden).
34.12r 2
345.12r 3
12r 0
As, 34.12r es el coeficiente de correlacin entre 1X y 2X manteniendo
constantes 3X y 4X .
De forma similar se interpretan los dems coeficientes de orden m .
Econometra I VERANO - 2014-III EPIES-FIECS Msc. Magen Infante
Magen Infante 40
(8) Coeficiente de correlacin parcial
Las correlaciones parciales son los coeficientes de correlacin de primer orden, por
ejemplo:
)1)(1( 2232
13
2313123.12
rr
rrrr
)1)(1( 2132
12
1312231.23
rr
rrrr
)1)(1( 2232
12
2312132.13
rr
rrrr
IX. INFERENCIA ACERCA DE LOS ESTIMADORES EN EL MRLC