Upload
tranquynh
View
224
Download
2
Embed Size (px)
Citation preview
Unidad II.‐ Modelos de regresión con series de tiempo: variables estacionarias
1.‐ El contexto dinámico y las series de tiempo
i) Modelo de rezago distribuido (DL)
(9.1)
ii) Modelo con variable dependiente rezagada (AR)
(9.2)
i) y ii) Modelo autorregresivo de rezagos distribuidos (ARDL)
(9.3)
iii) Correlación serial en el error
(9.4)
* Series de Tiempo en STATA
* Limpiar memoria
clear
* Preparar espacio para 100 observaciones
set obs 100
* Generar variable de fecha
generate date = tq(1961q1) + _n-1
* Desplegar listado primeras 5 observaciones
list date in 1/5
* Aplicar formato de fecha
format %tq date
* Desplegar listado primeras 5 observaciones
list date in 1/5
* Configurar variable etiqueta de tiempo
tsset date
* Guardar base de datos
save new.dta, replace
2.‐ Supuestos de mínimos cuadrados
En corte transversal, considerando el modelo niexy iii ,,1para
jjiiji yEyyEyEyy ,cov
jjjjiiii exEexexEexE
1( , )t t ty f y x
1 1 2( , , , )t t t t ty f y x x x
1 2( , , ,...)t t t ty f x x x
1( ) ( )t t t t ty f x e e f e
jjjjiiii eEexxeEexxE
0,cov jijijjii eeeeEeEeeEeE ji
jieeyy jiji para0,cov,cov
En series de tiempo, considerando el modelo Ttexy ttt ,,1para
ssttst yEyyEyEyy ,cov
sssstttt exEexexEexE
sssstttt eEexxeEexxE
0,cov ststsstt eeeeEeEeeEeE st
steeyy stst para0,cov,cov
El contexto dinámico de los modelos de series de tiempo (2), (3) y (4) implica correlación entre ty
y 1ty , por lo tanto, entre te y 1te : violación del supuesto de no autocorrelación.
2.1.‐ Estacionariedad
Y estacionaria X no estacionaria Z no estacionaria
3.‐ Rezagos distribuidos (caso finito)
Considerando el
i) Modelo de rezago distribuido (DL)
(9.1)
con los supuestos de una relación lineal y que después de q periodos, cambios en x no tienen
impacto sobre y
(9.5) 0 1 1 2 2t t t t q t q ty x x x x e
1 2( , , ,...)t t t ty f x x x
Usos Pronóstico
Si 1Tt
11212111101 TqTqTTTT exxxxy
(9.6)
por lo que se debe utilizar 111 ,,,, qTTTT xxxx para pronosticar 1Ty
t tx 1tx 2tx … qtx ty
1 1x 1y
2 2x 1x 2y
3 3x 2x 1x 2y
…
1q 1qx 2qx 3qx … 1qy
q qx 1qx 2qx … qy
1q 1qx qx 1qx … 1x 1qy
…
1 qT 1qTx qTx 1qTx … 12 qTx 1qTy
qT qTx 1qTx 2qTx … qTx 2 qTy
1 qT 1qTx 2qTx 3qTx … 12 qTx 1qTy
…
1T 1Tx 2Tx 3Tx … qTx 1 1Ty
T Tx 1Tx 2Tx … qTx Ty
1T 1Tx Tx 1Tx … qTx 1 1Ty
1 0 1 1 2 1 1 1T T T T q T q Ty x x x x e
Análisis de política
Tomando en (9.5) el cambio en el valor esperado de ty cuando alguna stx cambia en una unidad
qtqtttt xxxxyE 22110
sstt
st
t
x
yE
para qs ,,1,0
Adelantando (9.5) s periodos (lo que equivale a sustituir t por st ) y tomando el cambio en el
valor esperado de sty cuando tx cambia en una unidad
qstqstststst xxxxyE 22110
stst
t
st
x
yE
para qs ,,1,0
Por lo tanto (9.7)
( ) ( )t t ss
t s t
E y E y
x x
Multiplicadores
s es un ponderador de rezago distribuido o multiplicador de retardo para el periodo s
s stx s
0 tx 0
1 1tx 1
2 2tx 2
q qtx
q
Supuestos del modelo de rezagos distribuidos
TSMR1. 𝑦𝑡 =∝ +𝛽0𝑥𝑡 + 𝛽1𝑥𝑡−1 + 𝛽2𝑥𝑡−2 + ⋯ + 𝛽𝑞𝑥𝑡−𝑞 + 𝑒𝑡 para 𝑡 = 𝑞 + 1, … , 𝑇
TSMR2. 𝑦 y 𝑥 son variables aleatorias estacionarias, y 𝑒𝑡 es independiente de los valores
presentes, pasados y futuros de 𝑥.
TSMR3. 𝐸(𝑒𝑡) = 0
TSMR4. 𝑣𝑎𝑟(𝑒𝑡) = 𝜎2
TSMR5. 𝑐𝑜𝑣 (𝑒𝑡 , 𝑒𝑠) = 0 𝑡 ≠ 𝑠
TSMR6. 𝑒𝑡~𝑁(0, 𝜎2)
Aplicación: Ley de Okun
El cambio en la tasa de desempleo de un periodo al próximo, depende de la tasa de crecimiento
del producto en la economía.
𝑈𝑡 − 𝑈𝑡−1 = −𝛾(𝐺𝑡 − 𝐺𝑁) (9.8)
𝑈𝑡 : tasa de desempleo en el periodo t
𝐺𝑁 : tasa de crecimiento normal, necesaria para mantener una tasa de desempleo constante
Se espera 0 < 𝛾 < 1
Denotando el cambio en la tasa de desempleo como 𝐷𝑈𝑡 = ∆𝑈𝑡 = 𝑈𝑡 − 𝑈𝑡−1 y desarrollando el
lado derecho de (9.8)
𝐷𝑈𝑡 = 𝛾𝐺𝑁 − 𝛾𝐺𝑡
haciendo
𝛼 = 𝛾𝐺𝑁
y
𝛽0 = −𝛾
quedando la especificación econométrica de (9.8) como
𝐷𝑈𝑡 = 𝛼 + 𝛽0𝐺𝑡 + 𝑒𝑡 (9.9)
por lo que 𝛼, 𝛽0 y 𝛾 son los parámetros a estimar.
Además, conociendo �̂� y 𝛾 se puede estimar la tasa de crecimiento normal, necesaria para
mantener una tasa de desempleo constante, pues 𝐺𝑁 =�̂�
�̂�
Expandiendo (9.9) al incluir 𝑞 rezagos de 𝐺𝑡
𝐷𝑈𝑡 = 𝛼 + 𝛽0𝐺𝑡 + 𝛽1𝐺𝑡−1 + 𝛽2𝐺𝑡−2 + ⋯ + 𝛽𝑞𝐺𝑡−𝑞 + 𝑒𝑡 (9.10)
El crecimiento del producto se define como
𝐺𝑡 =𝐺𝐷𝑃𝑡−𝐺𝐷𝑃𝑡−1
𝐺𝐷𝑃𝑡−1 (9.11)
Con la base de datos okun.dta en Stata:
use "C:\poe4\okun.dta", clear
generate date = tq(1985q2) + _n-1
format %tq date
tsset date
label var u "% Unemployed"
label var g "% GDP growth"
tsline D.u, saving("C:\poe4\du.dta",replace)
tsline g, saving("C:\poe4\g.dta",replace)
graph combine "C:\poe4\du.dta" "C:\poe4\g.dta"
list date u L.u D.u g L1.g L2.g L3.g in 1/5
list date u L.u D.u g L1.g L2.g L3.g in 96/98
-.50
.51
1.5
% U
nem
ploy
ed, D
1985q1 1990q1 1995q1 2000q1 2005q1 2010q1date
-10
12
3
% G
DP
grow
th
1985q1 1990q1 1995q1 2000q1 2005q1 2010q1date
Al estimar el modelo (9.10) para 𝑞=3 y 𝑞=2 rezagos
regress D.u L(0/3).g
regress D.u L(0/2).g
Análisis de los multiplicadores de impacto 𝛽0 y de retardo 𝛽1 y 𝛽2.
Ceteris paribus, un incremento de 1% en la tasa de crecimiento conduce a:
una disminución de 0.2% en la tasa de desempleo durante el presente trimestre
(multiplicador de impacto),
una disminución de 0.16% en el siguiente trimestre (multiplicador de retardo de un
trimestre), y
una disminución de 0.07% transcurridos dos trimestres al presente (multiplicador de
retardo de dos trimestres).
Análisis del multiplicador interim 𝛽0 + 𝛽1 y del multiplicador total 𝛽0 + 𝛽1 + 𝛽2
El efecto de un incremento sostenido de 1% en la tasa de crecimiento es
una disminución de 0.367% en la tasa de desempleo para un trimestre y,
una disminución de 0.437 para dos trimestres.
A partir de que se tiene una longitud de dos rezagos, el multiplicador total es -0.437.
Estas estimaciones son de especial interés para un gobierno que busca mantener la tasa de
desempleo por debajo de un cierto nivel impulsando la tasa de crecimiento.
A partir de (9.8), el efecto total que tiene un cambio en el crecimiento del producto sobre el
desempleo, el cual se ha estimado en
𝛾 = − ∑ �̂�𝑠
2
𝑠=0
= −(�̂�0 + �̂�1 + �̂�2) = −(0.202 + .165 + 0.07) = 0.437
Por lo que el estimador de la tasa normal de crecimiento necesaria para mantener una tasa de
desempleo constante es
𝐺𝑁 =�̂�
�̂�=
0.5836
0.437= 1.3% trimestral
Correlación serial Función de autocorrelación Análisis de correlación serial en el crecimiento del producto
Las correlaciones entre una variable y sus rezagos se denominan autocorrelaciones.
Una exploración visual mediante la gráfica de dispersión de 𝐺𝑡 y 𝐺𝑡−1 sugiere que a altos valores
de 𝐺 en 𝑡 − 1 le siguen valores altos en 𝑡 y a bajos valores de 𝐺 en 𝑡 − 1 le siguen valores bajos
en 𝑡 , revelando una autocorrelación positiva entre las observaciones que distan un periodo de
tiempo, es decir, de orden uno.
summarize g
return list
scatter g L.g, xline(`r(mean)') yline(`r(mean)')
Calculando el coeficiente de correlación de 𝐺𝑡 y 𝐺𝑡−1, se verifica la relación directa entre dichas
series.
. correlate g L.g
(obs=97)
| L.
| g g
-------------+------------------
g |
--. | 1.0000
L1. | 0.4958 1.0000
-10
12
3
% G
DP
gro
wth
-1 0 1 2 3% GDP growth, L
En teoría, a partir de que la correlación poblacional entre dos variables x y y se define como
𝜌𝑥𝑦 =𝑐𝑜𝑣(𝑥, 𝑦)
√𝑣𝑎𝑟(𝑥)𝑣𝑎𝑟(𝑦)
Así, la correlación poblacional entre 𝐺𝑡 y 𝐺𝑡−1 es
𝜌1 =𝑐𝑜𝑣(𝐺𝑡,𝐺𝑡−1)
√𝑣𝑎𝑟(𝐺𝑡)𝑣𝑎𝑟(𝐺𝑡−1)=
𝑐𝑜𝑣(𝐺𝑡,𝐺𝑡−1)
𝑣𝑎𝑟(𝐺𝑡) (9.12)
notando que si la serie 𝐺𝑡 es estacionaria
𝑣𝑎𝑟(𝐺𝑡) = 𝑣𝑎𝑟(𝐺𝑡−1)
La covarianza muestral a estimar queda expresada como
𝑐𝑜𝑣(𝐺𝑡 , 𝐺𝑡−1) =̂1
𝑇 − 1∑(𝐺𝑡 − �̅�)(𝐺𝑡−1 − �̅�)
𝑇
𝑡=2
en tanto que, la varianza muestral a estimar es
𝑣𝑎𝑟(𝐺𝑡)̂ =1
𝑇 − 1∑(𝐺𝑡 − �̅�)2
𝑇
𝑡=1
donde �̅� es la media muestral
�̅� =1
𝑇∑ 𝐺𝑡
𝑇
𝑡=1
Con ello, la autocorrelación muestral de rezago uno para 𝐺𝑡 es
𝑟1 =𝑐𝑜𝑣(𝐺𝑡 , 𝐺𝑡−1)̂
𝑣𝑎𝑟(𝐺𝑡)̂=
1𝑇 − 1
∑ (𝐺𝑡 − �̅�)(𝐺𝑡−1 − �̅�)𝑇𝑡=2
1𝑇 − 1
∑ (𝐺𝑡 − �̅�)2𝑇𝑡=1
de lo que resulta
𝑟1 =∑ (𝐺𝑡−�̅�)(𝐺𝑡−1−�̅�)𝑇
𝑡=2
∑ (𝐺𝑡−�̅�)2𝑇𝑡=1
(9.13)
En general, la autocorrelación muestral de orden k para una serie y es la correlación muestral
entre las series separadas k periodos. Para las observaciones de la serie 𝑦𝑡 y las observaciones de
la serie 𝑦𝑡−𝑘, se calculará
𝑟𝐾 =∑ (𝑦𝑡−�̅�)(𝑦𝑡−𝑘−�̅�)𝑇
𝑡=𝑘+1
∑ (𝑦𝑡−�̅�)2𝑇𝑡=1
(9.14)
En estricto sentido se divide el numerador entre 𝑇 − 𝑘 observaciones y el denominador entre 𝑇
observaciones:
𝑟′𝐾 =1
𝑇−𝑘∑ (𝑦𝑡−�̅�)(𝑦𝑡−𝑘−�̅�)𝑇
𝑡=𝑘+11
𝑇∑ (𝑦𝑡−�̅�)2𝑇
𝑡=1
(9.15)
La expresión (9.14) es la que utilizan la mayoría de los paquetes, entre ellos Stata.
Aplicando (9.14) se obtienen las primeras cuatro autocorrelaciones de la serie 𝐺𝑡
clear
program drop _all
use "C:\poe4\okun.dta", clear
gen t=_n
tsset t
* Cálculo de autocovarianza de orden k=0
sum g
scalar n=_N
scalar m=r(mean)
gen dg=g-m
gen dg2=dg*dg
sum dg2
scalar c0=_N*_result(3)
* Cálculo de autocorrelación de orden k>0
program define autoc
gen dl`1'g=l`1'.g-m
gen prod`1'=dg*dl`1'g
sum prod`1'
scalar c`1'=(n-`1')*_result(3)
dis c`1'/c0
end
for num 1/4: autoc X
* Función de autocorrelación y correlograma
corrgram g, lags(4)
se obtiene
𝑟1 = 0.494 𝑟2 = 0.411 𝑟3 = 0.154 𝑟4 = 0.200 (9.16)
Ahora, ¿cómo probar si una autocorrelación es significativamente distinta de cero?
Se plantea el contraste de hipótesis 𝐻0 ∶ 𝜌𝑘 = 0 𝐻𝑎 ∶ 𝜌𝑘 ≠ 0
Bajo la hipótesis nula, la autocorrelación muestral 𝑟𝑘 sigue aproximadamente una distribución
normal con media cero y varianza 1
𝑇 , es decir
𝑟𝑘 ~ 𝑁 (0,1
𝑇)
por lo que el estadístico de prueba normal estándar es
𝑍 =𝑟𝑘 − 𝜌𝑘
𝑠𝑒(𝑟𝑘)
Bajo 𝐻0
𝑍𝑐𝑎𝑙𝑐. =𝑟𝑘−0
𝑠𝑒(𝑟𝑘)=
𝑟𝑘
√1
𝑇
= √𝑇𝑟𝑘 ~ 𝑁(0, 1) (9.17)
Al 5% de significancia, rechazamos 𝐻0 cuando el estadístico calculado sea mayor que el valor
teórico de 𝑍, es decir
En Stata, el valor teórico de 𝑍 lo obtenemos con la siguiente instrucción, dado el nivel de significancia
display invnormal(1-0.05/2)
1.959964
Para las autocorrelaciones de orden 1 a 4 calculadas
k 𝑟𝑘 𝑍𝑐𝑎𝑙𝑐. 𝑍𝑡𝑒ó𝑟𝑖𝑐𝑜 Decisión
1 𝑟1=0.494 √98 ∗0.494=4.89 1.96 Se rechaza 𝐻0: 𝜌1 = 0
2 𝑟2=0.411 √98 ∗0.411=4.07 1.96 Se rechaza 𝐻0: 𝜌2 = 0
3 𝑟3=0.154 √98 ∗0.154=1.53 1.96 No se rechaza 𝐻0: 𝜌3 = 0
4 𝑟4=0.200 √98 ∗0.200=1.98 1.96 Se rechaza 𝐻0: 𝜌4 = 0
Por lo que se concluye que la tasa de crecimiento trimestral del producto norteamericano muestra
correlación serial significativa en los primeros dos rezagos. El cuarto rezago resultó significativo en
el límite.
El correlograma
Para 12 rezagos, se obtiene la tabla de AC y la gráfica de dicha función de autocorrelación clear
program drop _all
use "C:\poe4\okun.dta", clear
gen t=_n
tsset t
* Cálculo de autocovarianza de orden k=0
sum g
scalar n=_N
scalar m=r(mean)
gen dg=g-m
gen dg2=dg*dg
sum dg2
scalar c0=_N*_result(3)
* Cálculo de autocorrelación de orden k>0
program define autoc
gen dl`1'g=l`1'.g-m
gen prod`1'=dg*dl`1'g
sum prod`1'
scalar c`1'=(n-`1')*_result(3)
dis c`1'/c0
end
for num 1/12: autoc X
* Correlograma con bandas de confianza
corrgram g, lags(12)
matrix r=r(AC)'
clear
svmat r
ren r1 r
gen t=_n
display invnormal(1-0.05/2)/sqrt(98)
graph bar r, over(t) yline(-.19798626 .19798626) ytitle("Autocorrelación")
k 𝑟𝑘 𝑍𝑐𝑎𝑙𝑐. 𝑍𝑡𝑒ó𝑟𝑖𝑐𝑜 Decisión
1 0.494 4.89 1.96 Se rechaza 𝐻0: 𝜌1 = 0
2 0.411 4.07 1.96 Se rechaza 𝐻0: 𝜌2 = 0
3 0.154 1.53 1.96 No se rechaza 𝐻0: 𝜌3 = 0
4 0.200 1.98 1.96 Se rechaza 𝐻0: 𝜌4 = 0
5 0.090 0.89 1.96 No se rechaza 𝐻0: 𝜌5 = 0
6 0.025 0.24 1.96 No se rechaza 𝐻0: 𝜌6 = 0
7 -0.030 -0.30 1.96 No se rechaza 𝐻0: 𝜌7 = 0
8 -0.082 -0.81 1.96 No se rechaza 𝐻0: 𝜌8 = 0
9 0.044 0.44 1.96 No se rechaza 𝐻0: 𝜌9 = 0
10 -0.021 -0.21 1.96 No se rechaza 𝐻0: 𝜌10 = 0
11 -0.087 -0.86 1.96 No se rechaza 𝐻0: 𝜌11 = 0
12 -0.204 -2.02 1.96 Se rechaza 𝐻0: 𝜌12 = 0
Al 5% de significancia
√𝑇𝑟𝑘 ≤ −1.96 o √𝑇𝑟𝑘 ≥ 1.96
lo que equivale a
𝑟𝑘 ≤ −1.96
√𝑇 o √𝑇𝑟𝑘 ≥
1.96
√𝑇
entonces, se rechaza 𝐻0 si la autocorrelación es mayor en valor absoluto que la banda de
significancia.
En este caso T=98 observaciones y se tiene el correlograma con las bandas de confianza.
Errores serialmente correlacionados La Curva de Phillips Relación entre inflación y desempleo
𝐼𝑁𝐹𝑡 = 𝐼𝑁𝐹𝑡𝐸 − 𝛾(𝑈𝑡 − 𝑈𝑡−1) (9.18)
La especificación econométrica del modelo asignando 𝛽1 = 𝐼𝑁𝐹𝑡𝐸 asumiendo que la expectativa
de inflación son contante en el tiempo y 𝛽2 = −𝛾 es
𝐼𝑁𝐹𝑡 = 𝛽1 + 𝛽2𝐷𝑈𝑡 + 𝑒𝑡 (9.19)
A partir del modelo estimado
𝐼𝑁𝐹�̂� = 𝑏1 + 𝑏2𝐷𝑈𝑡
los residuales de mínimos cuadrados ordinarios que se calcularán son
𝑒�̂� = 𝐼𝑁𝐹𝑡 − 𝐼𝑁𝐹�̂� = 𝐼𝑁𝐹𝑡 − (𝑏1 + 𝑏2𝐷𝑈𝑡) = 𝐼𝑁𝐹𝑡 − 𝑏1 − 𝑏2𝐷𝑈𝑡 (9.20)
Con estos residuales se pretende estimar el correlograma de los errores poblacionales para
evaluar si se viola o no el supuesto de no correlación entre los errores:
𝑐𝑜𝑣 (𝑒𝑡 , 𝑒𝑠) = 0 para 𝑡 ≠ 𝑠
Retomando conceptualmente la expresión (9.14) se construye la correspondiente a la
autocorrelación para los residuales
𝑟𝑘 =∑ (𝑒𝑡 − �̅�)(𝑒𝑡−𝑘 − �̅�)𝑇
𝑡=𝑘+1
∑ (𝑒𝑡 − �̅�)2𝑇𝑡=1
-.2
0.2
.4.6
Autocorrelación
1 2 3 4 5 6 7 8 9 10 11 12
de lo que resulta
𝑟𝑘 =∑ 𝑒𝑡𝑒𝑡−𝑘
𝑇𝑡=𝑘+1
∑ 𝑒𝑡2𝑇
𝑡=1 (9.21)
Con la base de datos phillips_aus.dta en Stata:
clear
program drop _all
use "C:\poe4\phillips_aus.dta", clear
generate date = tq(1987q1) + _n-1
format %tq date
tsset date
tsline inf, saving("C:\poe4\inf.dta",replace)
tsline D.u, saving("C:\poe4\du.dta",replace) graph combine "C:\poe4\inf.dta" "C:\poe4\du.dta", saving("C:\poe4\fig97.dta",replace)
* Estimación del modelo de la Curva de Phillips
regress inf D.u
* Serie de residuales
predict ehat, residuals
* Correlograma con bandas de confianza
corrgram ehat, lags(12)
matrix r=r(AC)'
clear
svmat r
ren r1 r
gen t=_n
display invnormal(1-0.05/2)/sqrt(90)
graph bar r, over(t) yline(-.20659834 .20659834) ytitle("Autocorrelación")
Las gráficas de las series de inflación y cambio trimestral en el desdempleo en Australia son
El modelo estimado es
𝐼𝑁�̂� = 0.7776 − 0.5279𝐷𝑈
(𝑠𝑒) (0.0658) (0.2294) (9.22)
-10
12
3
Aus
tralia
n In
flatio
n R
ate
1985q1 1990q1 1995q1 2000q1 2005q1 2010q1date
-.50
.51
Aus
tralia
n U
nem
ploy
men
t Rat
e (S
easo
nally
adj
uste
d), D
1985q1 1990q1 1995q1 2000q1 2005q1 2010q1date
El correlograma
Se visualiza autocorrelación en la serie de los residuales. Los primeros seis y el octavo rezagos son,
al 5% de significancia, distintos de cero. Hay suficiente evidencia de que los errores en el modelo
de la curva de Phillips están serialmente correlacionados. Se viola el supuesto 𝑐𝑜𝑣 (𝑒𝑡 , 𝑒𝑠) = 0.
Otras pruebas para errores serialmente correlacionados Prueba del multiplicador de Lagrange
Una segunda prueba de correlación serial en los errores se deriva del principio general de
Lagrange que consiste en comparar estadísticamente el modelo sin autocorrelación con el modelo
con autocorrelación a través de una regresión auxiliar. El contraste de hipótesis está basado en el
estadístico denominado multiplicador de Lagrange (LM).
Si 𝑒𝑡 y 𝑒𝑡−1 están correlacionados, una forma simple de modelar esta relación es
𝑒𝑡 = 𝜌𝑒𝑡−1 + 𝑣𝑡 (9.23)
Si la regresión principal es
𝑦𝑡 = 𝛽1 + 𝛽2𝑥𝑡 + 𝑒𝑡
Al sustituir (9.23) para 𝑒𝑡 se tiene
𝑦𝑡 = 𝛽1 + 𝛽2𝑥𝑡 + 𝜌𝑒𝑡−1 + 𝑣𝑡 (9.24)
donde se suponen 𝑣𝑡 y 𝑒𝑡−1 independientes.
Se plantea, así, el contraste de hipótesis
𝐻0 ∶ 𝜌 = 0 𝐻𝑎 ∶ 𝜌 ≠ 0
pero 𝑒𝑡−1 es no observable, por lo que utilizamos los residuales rezagados e inferimos sobre el
parámetro 𝜌 en la ecuación
𝑦𝑡 = 𝛽1 + 𝛽2𝑥𝑡 + 𝜌�̂�𝑡−1 + 𝑣𝑡 (9.25)
Sustituyendo del lado izquierdo el modelo principal para 𝑦𝑡 con sus residuales en lugar del error
𝑏1 + 𝑏2𝑥𝑡 + �̂�𝑡 = 𝛽1 + 𝛽2𝑥𝑡 + 𝜌�̂�𝑡−1 + 𝑣𝑡
Reordenando términos, la regresión auxiliar queda
�̂�𝑡 = (𝛽1 − 𝑏1) + (𝛽2−𝑏2)𝑥𝑡 + 𝜌�̂�𝑡−1 + 𝑣𝑡
= 𝛾1 + 𝛾2𝑥𝑡 + 𝜌�̂�𝑡−1 + 𝑣𝑡 (9.26)
donde
𝛾1 = 𝛽1 − 𝑏1
𝛾2 = 𝛽2−𝑏2
Como están centrados alrededor de cero, el poder explicativo significativo de la regresión proviene
de �̂�𝑡−1.
Si 𝐻0 ∶ 𝜌 = 0 es verdadera, el estadístico de prueba LM a calcular es
𝐿𝑀 = 𝑇 × 𝑅2 ~ 𝜒1 𝑔.𝑙.2
Para 𝑘 > 1, si 𝐻0 ∶ 𝜌𝑘 = 0 es verdadera, el estadístico de prueba LM a calcular es
𝐿𝑀 = (𝑇 − 𝑘) × 𝑅2 ~ 𝜒𝑘 𝑔.𝑙.2
En la práctica, con los datos de la curva de Phillips para Australia
* PRUEBAS DE AUTOCORRELACIÓN
* Estimando (9.25)
use "C:\poe4\phillips_aus.dta", clear
generate date = tq(1987q1) + _n-1
format %tq date
tsset date
* PRUEBAS DE SIGNIFICANCIA del coeficiente (coeficiente de autocorrelación rho)
* inciso i) alternativa 1
regress inf D.u
predict ehat, res
regress inf D.u L.ehat
test L.ehat
* inciso ii) alternativa 2. Reemplazando ehat(1) por cero y realizando la prueba
replace ehat = 0 in 1
regress inf D.u L.ehat
test L.ehat
(𝑖) 𝑡 = 6.219 𝐹 = 38.67 valor 𝑝 = 0.000 (𝑖𝑖) 𝑡 = 6.202 𝐹 = 38.47 valor 𝑝 = 0.000
* Estimando (9.26)
* PRUEBAS LM para AR(1)
use "C:\poe4\phillips_aus.dta", clear
generate date = tq(1987q1) + _n-1
format %tq date
tsset date
* Pruebas LM para error AR(1)
* inciso iii) alternativa 1
regress inf D.u
predict ehat, res
regress ehat D.u L.ehat
display "Observaciones = " e(N) " y T*R2 = " e(N)*e(r2)
* inciso iv) alternativa 2
replace ehat = 0 in 1
regress ehat D.u L.ehat
display "Observaciones = " e(N) " y T*R2 = " e(N)*e(r2)
display "Valor teórico de la Chi-cuadrada 1 g.l. al 95% = ", invchi2(1,0.95)
(𝑖𝑖𝑖) 𝐿𝑀 = (𝑇 − 1) × 𝑅2 = 89 × 0.3102 = 27.61
(𝑖𝑣) 𝐿𝑀 = 𝑇 × 𝑅2 = 90 × 0.3066 = 27.59
Los estadísticos calculados 𝐿𝑀 = 27.61 y 𝐿𝑀 = 27.59 son mayores que el valor teórico al %5 de
significancia 𝜒1 2 =3.84. Se rechaza la hipótesis nula 𝐻0 ∶ 𝜌1 = 0.
* Probando autocorrelación para más de un rezago
* PRUEBAS LM para error AR(4)
* inciso iii) alternativa 1
use "C:\poe4\phillips_aus.dta", clear
generate date = tq(1987q1) + _n-1
format %tq date
tsset date
regress inf D.u
predict ehat, res
regress ehat D.u L(1/4).ehat
display "Observaciones = " e(N) " and TR2 = " e(N)*e(r2)
* inciso iv) alternativa 2
gen ehat1=l.ehat
gen ehat2=ll.ehat
gen ehat3=lll.ehat
gen ehat4=llll.ehat
replace ehat=0 in 1
replace ehat1=0 in 1/2
replace ehat2=0 in 1/3
replace ehat3=0 in 1/4
replace ehat4=0 in 1/5
regress ehat D.u ehat1-ehat4
display "Observaciones = " e(N) " and TR2 = " e(N)*e(r2)
display "Valor teórico de la Chi-cuadrada 4 g.l. al 95% = ", invchi2(4,0.95)
(𝑖𝑖𝑖) 𝐿𝑀 = (𝑇 − 4) × 𝑅2 = 86 × 0.3882 = 33.4 (𝑖𝑣) 𝐿𝑀 = 𝑇 × 𝑅2 = 90 × 0.4075 = 36.7
Los estadísticos calculados 𝐿𝑀 = 33.4 y 𝐿𝑀 = 36.7 son mayores que el valor teórico al %5 de
significancia 𝜒4 2 =9.49. Se rechaza la hipótesis nula 𝐻0 ∶ 𝜌4 = 0.
Stata facilita la inferencia para el modelo con error AR(k) para cualquier número k de rezagos, mediante el siguiente procedimiento de Breusch-Godfrey para la prueba de autocorrelación basada en el multiplicador de Lagrange (LM):
* Prueba Breush-Godfrey
use "C:\poe4\phillips_aus.dta", clear
generate date = tq(1987q1) + _n-1
format %tq date
tsset date
regress inf D.u
* Para error autorregresivo de orden 1 : AR(1)
estat bgodfrey, lags(1)
* Para error autorregresivo de orden 4 : AR(4)
estat bgodfrey, lags(4)
El estadístico calculado 𝐿𝑀 = 27.593 es mayor que el valor teórico al %5 de significancia
𝜒1 2 =3.84. Se rechaza la hipótesis nula 𝐻0 ∶ 𝜌1 = 0.
El estadístico calculado 𝐿𝑀 = 36.672 es mayor que el valor teórico al %5 de significancia
𝜒4 2 =9.49. Se rechaza la hipótesis nula 𝐻0 ∶ 𝜌4 = 0.
Prueba Durbin-Watson
Las pruebas de correlación serial basadas en el correlograma y el estadístico LM están diseñadas
para grandes muestras. Como alternativa se encuentra la prueba Durbin-Watson, la cual no está
basada en una aproximación a muestras grandes. En la actualidad se utiliza con menos frecuencia
porque se requiere examinar una cota inferior y una cota superior y su distribución no aplica
cuando la ecuación cuando el modelo contiene un rezago de la variable dependiente. Otra
limitante es su enfoque a probar correlación serial de primer orden.
Si suponemos que 𝑣𝑡 son errores aleatorios independientes con distribución 𝑁(0, 𝜎𝑣2) y que la
hipótesis alternativa es autocorrelación positiva en el modelo 𝑒𝑡 = 𝜌𝑒𝑡−1 + 𝑣𝑡 . Es decir,
𝐻0 ∶ 𝜌 = 0 𝐻𝑎 ∶ 𝜌 > 0
El estadístico de prueba Durbin-Watson que se utiliza para este contraste de hipótesis es
𝑑 =∑ (�̂�𝑡−�̂�𝑡−1)2𝑇
𝑡=2
∑ �̂�𝑡2𝑇
𝑡=1 (9A.1)
donde 𝑒𝑡 son los residuales de mínimos cuadrados ordinarios
�̂�𝑡 = 𝑦𝑡 − 𝑏1 − 𝑏2𝑥𝑡
Para ver por qué 𝑑 es un estadístico razonable para probar autocorrelación, se expande (9A.1),
desarrollando el binomio diferencia al cuadrado de los términos del numerador, como
𝑑 =∑ �̂�𝑡
2+∑ �̂�𝑡−12 −2 ∑ �̂�𝑡�̂�𝑡−1
𝑇𝑡=2
𝑇𝑡=2
𝑇𝑡=2
∑ �̂�𝑡2𝑇
𝑡=1=
∑ �̂�𝑡2𝑇
𝑡=2
∑ �̂�𝑡2𝑇
𝑡=1+
∑ �̂�𝑡−12𝑇
𝑡=2
∑ �̂�𝑡2𝑇
𝑡=1− 2
∑ �̂�𝑡�̂�𝑡−1𝑇𝑡=2
∑ �̂�𝑡2𝑇
𝑡=1≈ 1 + 1 − 2𝑟1 (9A.2)
así,
𝑑 = 2 − 2∑ �̂�𝑡�̂�𝑡−1
𝑇𝑡=2
∑ �̂�𝑡2𝑇
𝑡=1≈ 2(1 − 𝑟1) (9A.3)
Se observa que si 𝑟1 = 0, entonces 𝑑 ≈ 2, lo que indica que los errores en el modelo no están
autocorrelacionados. Un valor bajo del estadístico Durbin-Watson implica que los errores en el
modelo están correlacionados y 𝜌 > 0.
La pregunta relevante es ¿qué tan cerca de cero debe estar el valor del estadístico de prueba para
concluir que los errores están correlacionados? Es decir, cuál es el valor crítico 𝑑𝑐 (teórico a un
nivel de significancia dado) del estadístico de Durbin-Watson.
Los valores de 𝑓(𝑑) dependen de los valores de las variables explicativas que determinan a su vez
a los residuales con los que se calcula el estadístico 𝑑. Por lo tanto, no hay una distribución única
para dicho estadístico de prueba.
Stata calcula el valor de 𝑑 y de acuerdo con la regla de decisión:
Rechazar 𝐻0 ∶ 𝜌 = 0 si 𝑑 ≤ 𝑑𝑐
No rechazar 𝐻0 ∶ 𝜌 = 0 si 𝑑 > 𝑑𝑐
al 5% de significancia, buscamos una 𝑑𝑐 tal que
𝑃(𝑑 ≤ 𝑑𝑐) = 0.05
En la práctica,
* Prueba Durbin-Watson
use "C:\poe4\phillips_aus.dta", clear
generate date = tq(1987q1) + _n-1
format %tq date
tsset date
regress inf D.u
estat dwatson
Una vez estimado el modelo de la curva de Phillips para Australia
𝐼𝑁�̂� = 0.7776 − 0.5279𝐷𝑈
(𝑠𝑒) (0.0658) (0.2294) (9.22)
se obtiene el estadístico calculado Durbin-Watson dadas 90 observaciones para 2 regresores (incluido el intercepto), a partir de los residuales de la ecuación anterior
Ahora, se requiere examinar una cota inferior y una cota superior. Los valores inferior y superior de la 𝑑𝑐 de acuerdo con la siguiente tabla de valores críticos DW al 5% son 𝑑𝐿𝑐 =1.635 y 𝑑𝑈𝑐 =1.679
http://web.stanford.edu/~clint/bench/dw05a.htm
Finalmente, se toma la decisión de
Rechazar 𝐻0 ∶ 𝜌 = 0 si 𝑑 < 𝑑𝐿𝑐
No rechazar 𝐻0 ∶ 𝜌 = 0 si 𝑑 > 𝑑𝑈𝑐
Indecisión si 𝑑𝐿𝑐 < 𝑑 < 𝑑𝐿𝑐 .
El estadístico calculado 𝑑=0.8873 es menor que la cota inferior del valor crítico 𝑑𝐿𝑐 =1.635, por lo que se concluye que 𝑑 < 𝑑𝑐 , entonces se rechaza 𝐻0 ∶ 𝜌 = 0. Hay evidencia que sugiere que los errores en el modelo de la curva de Phillips australiana están serialmente correlacionados.