Upload
lamkhanh
View
223
Download
0
Embed Size (px)
Citation preview
Tema 3. Especificación, estimación y
validación de modelos ARIMA
1. La Metodología Box-Jenkins2. Especificación inicial.
2.1 Contrastes de raíces unitarias.2.2 Análisis de correlogramas y correlogramasparciales
3. Estimación.4. Valoración de modelos
4.1 Contrastes de hipótesis sobre los coeficientes4.2 Análisis de residuos4.3 Contrastes respecto a modelos alternativos
5. Una aplicación a una serie real
1. Metodología Box-Jenkins
La metodología propuesta por Box y Jenkins para el análisis de series temporales consiste en los siguientes pasos:
1. Determinar la transformación estacionaria de la serie.
2. Analizar el correlograma y el correlograma parcial para determinar cuál es el modelo apropiado para la transformación estacionaria
3. Estimar los parámetros del modelo
4. Diagnóstico para comprobar que el modelo satisface los supuestos iniciales, fundamentalmente que las innovaciones no están relacionadas con el pasado.
5. En el caso de que las innovaciones no sean ruido blanco, proponer un modelo alternativo en función de la información contenida en el correlograma de los residuos.
2. Especificación inicial
Dada una serie temporal concreta, la primera etapa para su análisis es la especificación de un modelo inicial para ajustar a dicha variable. La propuesta de dicho modelo inicial se basará en:
i. Primero determinar cuál es la transformación estacionaria
ii. Analizar los correlogramas de la transformación estacionaria para determinar los órdenes del modelo ARMA estacional multiplicativo adecuado.
2.1 Contrastes de raíces unitarias
La determinación de la transformación estacionariapara una determinada variable puede basarse en tres instrumentos fundamentales:
i) Análisis visual del gráfico de la serie
ii) Análisis del correlograma de la serie. Cuandouna serie es estacionaria, sus correlacionestienden a cero relativamente rápido. Por lo tantocuando observamos que las correlaciones no tienden a cero suficientemente rápido, podemossospechar que la serie no es estacionaria
iii) Contrastes de raíces unitarias: Dickey-Fuller
0.8
0.9
1.0
1.1
1.2
1.3
1.4
250 500 750 1000 1250 1500
Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 2005
-.03
-.02
-.01
.00
.01
.02
.03
250 500 750 1000 1250 1500
First differences of logs of euro-dollar exchange rates: returns
13.8
14.0
14.2
14.4
14.6
14.8
15.0
80 82 84 86 88 90 92 94 96 98 00 02 04
LDESEMPLEO
-.2
-.1
.0
.1
.2
.3
80 82 84 86 88 90 92 94 96 98 00 02 04
Tasas anuales de desempleo
-.2
-.1
.0
.1
.2
.3
80 82 84 86 88 90 92 94 96 98 00 02 04
Diferencias mensuales de las tasas de desempleo anuales
Vamos a considerar ahora el contraste de Dickey-Fuller para determinar si una serie es o no estacionaria
Supongamos que la serie ha sido generada por un modelo AR(1)
ttt aycy ++= −11φ
El contraste DF está diseñado para contrastar la siguiente hipótesis:
�Bajo la nula, estamos interesados en la raízpositiva: estamos contrastando si tenemos un paseo aleatorio.
�Siempre tenemos que incluir una constante en el modelo porque estamos contrastando frente a la alternativa de estacionariedad (no de media cero).
� Es un contraste unilateral.
)(1:
)(1:
11
10
stationaryH
stationarynonH
<−=
φφ
Por razones numéricas, el contraste se basa en la estimación por MCO de la siguiente ecuación
El estadístico t se calcula de la forma habitual. Sin embargo, su distribución asintótica debe ser obtenida numéricamente porque, bajo la hipótesis nula, la serie no es estacionaria y la teoría asintótica habitual no se puede utilizar.
tt
ttt
ayc
aycy
++
=+−+=∆
−
−
1*
11 )1(
φ
φ
0:
0:
*1
*0
<
=
φ
φ
H
H
Ejemplo: Tipo de cambio
0.8
0.9
1.0
1.1
1.2
1.3
1.4
250 500 750 1000 1250 1500
Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 2005
-.03
-.02
-.01
.00
.01
.02
.03
250 500 750 1000 1250 1500
First differences of logs of euro-dollar exchange rates: returns
El contraste puede extenderse (DF Aumentado) para considerar estructurasdinámicas más complejas que un modeloAR(1).
En este caso, la distribución del estadísticono cambia.
Sin embargo, la distribución depende de loscomponentes deterministas que se incluyan en el modelo (constantes, tendencias, variables ficticias etc.)
Ejemplo: desempleo
13.8
14.0
14.2
14.4
14.6
14.8
15.0
80 82 84 86 88 90 92 94 96 98 00 02 04
LDESEMPLEO
-.2
-.1
.0
.1
.2
.3
80 82 84 86 88 90 92 94 96 98 00 02 04
Tasas anuales de desempleo
-.2
-.1
.0
.1
.2
.3
80 82 84 86 88 90 92 94 96 98 00 02 04
Diferencias mensuales de las tasas de desempleo anuales
2.2 Análisis de correlogramas y
correlogramas parciales
Una vez que la serie ha sido transformada en una serie estacionaria, debemos analizar el correlograma y el correlogramaparcial para determinar cuál es el modelo inicial apropiado para representar la dependencia dinámica de dicha transformación estacionaria
-.03
-.02
-.01
.00
.01
.02
.03
250 500 750 1000 1250 1500
First differences of logs of euro-dollar exchange rates: returns
Ejemplos
-.2
-.1
.0
.1
.2
.3
80 82 84 86 88 90 92 94 96 98 00 02 04
Diferencias mensuales de las tasas de desempleo anuales
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
.5
92 93 94 95 96 97 98 99 00 01 02 03 04 05
Tasas anuales de variación de edificios construidos
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
.5
92 93 94 95 96 97 98 99 00 01 02 03 04 05
Tasas anuales de variación de edificios construidos
-.4
-.2
.0
.2
.4
.6
.8
92 93 94 95 96 97 98 99 00 01 02 03 04 05
Variaciones mensuales de las tasas anuales de edificios construidos
-.4
-.2
.0
.2
.4
.6
.8
92 93 94 95 96 97 98 99 00 01 02 03 04 05
Variaciones mensuales de las tasas anuales de edificios construidos
2. Estimación
Los parámetros del modelo ARMA puedenestimarse por Máxima Verosimilitudasumiendo una distribución condicionalconcreta para la serie de interés.
Aunque las observaciones no son mutuamente independientes, la verosimilitud puede obtenerse mediante
)()|(
)()|()|()()|()(
12
1
221111
yfYyf
YfYyfYyfYfYyfYfLT
ttt
TTTTTTTTT
∏
====
=−
−−−−−−
)(log))|(log(log 12
1 yfYyfLT
ttt∑ +=
=−
Si es condicionalmente Normal entonces sudensidad condicional viene dada por
Si también asumimos que el proceso esestacionario y Gaussiano, de forma que la distribución marginal de las observacionesiniciales sea Gaussiana, entonces la densidadmarginal es
ty
( )( )
−−=
−
−
−− )|(2
)|(exp
)|(2
1)|(
1
21
2/11
1tt
ttt
tttt YyVar
YyEy
YyVarYyf
π
( )( )
−−=
2
21
2/121
2exp
2
1)(
σµ
πσ
yyf
El logaritmo de la verosimilitud Gaussianaes
( )2
212
2 1
21
21
12
1
2
)(log
21
)|()|(
21
)|(log21
)2log(2
)(log))|(log(log
σµσ
π
−−∑ −−−
∑−−
=∑ +=
= −
−
=−
=−
y
YyVar
YyEy
YyVarT
yfYyfL
T
t tt
ttt
T
ttt
T
ttt
En los modelos ARMA, la varianza condicional siempre es constante. Por lo tanto,
La media condicional y la distribución marginal dependen del modelo particular que se haya ajustado a la serie.
( )2
212
2
212
2
2
)(log
21
)|(2
1
2)1(
)2log(2
log
σµσ
σ
σπ
−−∑ −−
−−−−=
=−
yYyEy
TTL
T
tttt
a
a
Ejemplo: AR(1)
Por lo tanto, la log-verosimilitud Gaussianaes
φµ
−=
1c
21
22
1 φσσ−
= a 111)|( −− += ttt ycYyE φ
( )
−
−−
−∑ −−
−−+−−=
=−
2
2
2
1
2
2112
22
12
)1(
2
1
)1(21
2)2log(
2log
φσ
φφσ
φσπ
a
T
ttt
a
a
cy
ycy
TTL
Si consideramos que los valores iniciales de la serie son fijos en distintas realizaciones, entonces
El estimador de máxima verosimiltudcondicional es equivalente a MCO: sus propiedades asintóticas son las mismas que las del estimador de máxima verosimilitud.
( )∑ −−−−−−==
−T
ttt
aa ycy
TTL
2
2112
2
2
12
)1()2log(
2log φ
σσπ
Bajo el supuesto de estacionariedad, la distribución asintótica del estimador de máxima verosimilitud es la habitual, lo que nos permite realizar contraste de hipótesis sobre los parámetros del modelo de forma estándar.
Ejemplo: Masa monetaria europea
0.0E+00
1.0E+09
2.0E+09
3.0E+09
4.0E+09
5.0E+09
6.0E+09
7.0E+09
1970 1975 1980 1985 1990 1995 2000 2005
Masa monetaria europea
-.04
-.03
-.02
-.01
.00
.01
.02
.03
.04
1970 1975 1980 1985 1990 1995 2000 2005
Variaciones mensuales de las tasas anuales de la masa monetaria europea
Ejemplo: Desempleo
13.8
14.0
14.2
14.4
14.6
14.8
15.0
80 82 84 86 88 90 92 94 96 98 00 02 04
LDESEMPLEO
-.2
-.1
.0
.1
.2
.3
80 82 84 86 88 90 92 94 96 98 00 02 04
Diferencias mensuales de las tasas de desempleo anuales
Ejemplo: Tipo de cambio
0.8
0.9
1.0
1.1
1.2
1.3
1.4
250 500 750 1000 1250 1500
Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 2005
-.03
-.02
-.01
.00
.01
.02
.03
250 500 750 1000 1250 1500
First differences of logs of euro-dollar exchange rates: returns
4. Valoración de modelos
Una vez que el modelo ha sido ajustado a la seriede interés, la última etapa consiste en analizar siel modelo es apropiado.
Para ello vamos a realizar 3 tipos de análisis:
a) Contrastes sobre los coeficientes: significatividady raíces comunes.
b) Diagnóstico: Este análisis se basa habitualmenteen los residuos que no deben estarcorrelacionados con el pasado: su correlogramano debe tener ninguna correlaciónsignificativamente distinta de cero.
c) Contrastes respecto a modelos alternativos.
Comparación de modelos
La selección de los parámetros p y q mediante el análisis del correlogramapuede presentar dificultades prácticas en algunos casos. Por ello, se han propuesto criterios para decidir entre modelos alternativos para una determinada series temporal.
En la práctica se utilizan dos de estos criterios: el AIC (Akaike InformationCriteria) y el BIC (Bayes InformationCriteria).
Criterios de información
El AIC se basa en elegir aquel modelo que minimice la siguiente cantidad:
El criterio BIC elige el modelo que minimice
Estos criterios y fundamentalmente AIC tienden a sobreparametrizar los modelos.
12 )(2)ˆlog(),( −++= TqpqpAIC aσ
)log()()ˆlog(),( 12 TTqpqpAIC a−++= σ
Ejemplo: Masa monetaria europea
-.02
-.01
.00
.01
.02
.03
.04
-.04
-.02
.00
.02
.04
1975 1980 1985 1990 1995 2000
Residual Actual Fitted
Ejemplo: Desempleo
-.03
-.02
-.01
.00
.01
.02
.03-.2
-.1
.0
.1
.2
.3
82 84 86 88 90 92 94 96 98 00 02 04
Residual Actual Fitted
Ejemplo: Tipo de cambio
-.03
-.02
-.01
.00
.01
.02
.03
-.03
-.02
-.01
.00
.01
.02
.03
250 500 750 1000 1250 1500
Residual Actual Fitted
5. Una aplicación a una serie real:
Turistas extranjeros en España
0.00E+00
4.00E+06
8.00E+06
1.20E+07
1.60E+07
2.00E+07
2.40E+07
1970 1975 1980 1985 1990 1995 2000 2005
EXTRANJEROS
13.5
14.0
14.5
15.0
15.5
16.0
16.5
17.0
1970 1975 1980 1985 1990 1995 2000 2005
LEXTRANJEROS
-.5
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
1970 1975 1980 1985 1990 1995 2000 2005
DSLEXTRANJEROS
-.4
-.2
.0
.2
.4
-.6
-.4
-.2
.0
.2
.4
1970 1975 1980 1985 1990 1995 2000 2005
Residual Actual Fitted
-.3
-.2
-.1
.0
.1
.2
.3
-.6
-.4
-.2
.0
.2
.4
1970 1975 1980 1985 1990 1995 2000 2005
Residual Actual Fitted
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
1970 1975 1980 1985 1990 1995 2000 2005
DDSLEXTRANJEROS
-.3
-.2
-.1
.0
.1
.2
.3
-.4
-.2
.0
.2
.4
1970 1975 1980 1985 1990 1995 2000 2005
Residual Actual Fitted
-.3
-.2
-.1
.0
.1
.2
.3
-.4
-.2
.0
.2
.4
1970 1975 1980 1985 1990 1995 2000 2005
Residual Actual Fitted