Tema 3. Especificación, estimación y validación de modelos ... · Tema 3. Especificación,...

Preview:

Citation preview

Tema 3. Especificación, estimación y

validación de modelos ARIMA

1. La Metodología Box-Jenkins2. Especificación inicial.

2.1 Contrastes de raíces unitarias.2.2 Análisis de correlogramas y correlogramasparciales

3. Estimación.4. Valoración de modelos

4.1 Contrastes de hipótesis sobre los coeficientes4.2 Análisis de residuos4.3 Contrastes respecto a modelos alternativos

5. Una aplicación a una serie real

1. Metodología Box-Jenkins

La metodología propuesta por Box y Jenkins para el análisis de series temporales consiste en los siguientes pasos:

1. Determinar la transformación estacionaria de la serie.

2. Analizar el correlograma y el correlograma parcial para determinar cuál es el modelo apropiado para la transformación estacionaria

3. Estimar los parámetros del modelo

4. Diagnóstico para comprobar que el modelo satisface los supuestos iniciales, fundamentalmente que las innovaciones no están relacionadas con el pasado.

5. En el caso de que las innovaciones no sean ruido blanco, proponer un modelo alternativo en función de la información contenida en el correlograma de los residuos.

2. Especificación inicial

Dada una serie temporal concreta, la primera etapa para su análisis es la especificación de un modelo inicial para ajustar a dicha variable. La propuesta de dicho modelo inicial se basará en:

i. Primero determinar cuál es la transformación estacionaria

ii. Analizar los correlogramas de la transformación estacionaria para determinar los órdenes del modelo ARMA estacional multiplicativo adecuado.

2.1 Contrastes de raíces unitarias

La determinación de la transformación estacionariapara una determinada variable puede basarse en tres instrumentos fundamentales:

i) Análisis visual del gráfico de la serie

ii) Análisis del correlograma de la serie. Cuandouna serie es estacionaria, sus correlacionestienden a cero relativamente rápido. Por lo tantocuando observamos que las correlaciones no tienden a cero suficientemente rápido, podemossospechar que la serie no es estacionaria

iii) Contrastes de raíces unitarias: Dickey-Fuller

0.8

0.9

1.0

1.1

1.2

1.3

1.4

250 500 750 1000 1250 1500

Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 2005

-.03

-.02

-.01

.00

.01

.02

.03

250 500 750 1000 1250 1500

First differences of logs of euro-dollar exchange rates: returns

13.8

14.0

14.2

14.4

14.6

14.8

15.0

80 82 84 86 88 90 92 94 96 98 00 02 04

LDESEMPLEO

-.2

-.1

.0

.1

.2

.3

80 82 84 86 88 90 92 94 96 98 00 02 04

Tasas anuales de desempleo

-.2

-.1

.0

.1

.2

.3

80 82 84 86 88 90 92 94 96 98 00 02 04

Diferencias mensuales de las tasas de desempleo anuales

Vamos a considerar ahora el contraste de Dickey-Fuller para determinar si una serie es o no estacionaria

Supongamos que la serie ha sido generada por un modelo AR(1)

ttt aycy ++= −11φ

El contraste DF está diseñado para contrastar la siguiente hipótesis:

�Bajo la nula, estamos interesados en la raízpositiva: estamos contrastando si tenemos un paseo aleatorio.

�Siempre tenemos que incluir una constante en el modelo porque estamos contrastando frente a la alternativa de estacionariedad (no de media cero).

� Es un contraste unilateral.

)(1:

)(1:

11

10

stationaryH

stationarynonH

<−=

φφ

Por razones numéricas, el contraste se basa en la estimación por MCO de la siguiente ecuación

El estadístico t se calcula de la forma habitual. Sin embargo, su distribución asintótica debe ser obtenida numéricamente porque, bajo la hipótesis nula, la serie no es estacionaria y la teoría asintótica habitual no se puede utilizar.

tt

ttt

ayc

aycy

++

=+−+=∆

1*

11 )1(

φ

φ

0:

0:

*1

*0

<

=

φ

φ

H

H

Ejemplo: Tipo de cambio

0.8

0.9

1.0

1.1

1.2

1.3

1.4

250 500 750 1000 1250 1500

Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 2005

-.03

-.02

-.01

.00

.01

.02

.03

250 500 750 1000 1250 1500

First differences of logs of euro-dollar exchange rates: returns

El contraste puede extenderse (DF Aumentado) para considerar estructurasdinámicas más complejas que un modeloAR(1).

En este caso, la distribución del estadísticono cambia.

Sin embargo, la distribución depende de loscomponentes deterministas que se incluyan en el modelo (constantes, tendencias, variables ficticias etc.)

Ejemplo: desempleo

13.8

14.0

14.2

14.4

14.6

14.8

15.0

80 82 84 86 88 90 92 94 96 98 00 02 04

LDESEMPLEO

-.2

-.1

.0

.1

.2

.3

80 82 84 86 88 90 92 94 96 98 00 02 04

Tasas anuales de desempleo

-.2

-.1

.0

.1

.2

.3

80 82 84 86 88 90 92 94 96 98 00 02 04

Diferencias mensuales de las tasas de desempleo anuales

2.2 Análisis de correlogramas y

correlogramas parciales

Una vez que la serie ha sido transformada en una serie estacionaria, debemos analizar el correlograma y el correlogramaparcial para determinar cuál es el modelo inicial apropiado para representar la dependencia dinámica de dicha transformación estacionaria

-.03

-.02

-.01

.00

.01

.02

.03

250 500 750 1000 1250 1500

First differences of logs of euro-dollar exchange rates: returns

Ejemplos

-.2

-.1

.0

.1

.2

.3

80 82 84 86 88 90 92 94 96 98 00 02 04

Diferencias mensuales de las tasas de desempleo anuales

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

.5

92 93 94 95 96 97 98 99 00 01 02 03 04 05

Tasas anuales de variación de edificios construidos

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

.5

92 93 94 95 96 97 98 99 00 01 02 03 04 05

Tasas anuales de variación de edificios construidos

-.4

-.2

.0

.2

.4

.6

.8

92 93 94 95 96 97 98 99 00 01 02 03 04 05

Variaciones mensuales de las tasas anuales de edificios construidos

-.4

-.2

.0

.2

.4

.6

.8

92 93 94 95 96 97 98 99 00 01 02 03 04 05

Variaciones mensuales de las tasas anuales de edificios construidos

2. Estimación

Los parámetros del modelo ARMA puedenestimarse por Máxima Verosimilitudasumiendo una distribución condicionalconcreta para la serie de interés.

Aunque las observaciones no son mutuamente independientes, la verosimilitud puede obtenerse mediante

)()|(

)()|()|()()|()(

12

1

221111

yfYyf

YfYyfYyfYfYyfYfLT

ttt

TTTTTTTTT

====

=−

−−−−−−

)(log))|(log(log 12

1 yfYyfLT

ttt∑ +=

=−

Si es condicionalmente Normal entonces sudensidad condicional viene dada por

Si también asumimos que el proceso esestacionario y Gaussiano, de forma que la distribución marginal de las observacionesiniciales sea Gaussiana, entonces la densidadmarginal es

ty

( )( )

−−=

−− )|(2

)|(exp

)|(2

1)|(

1

21

2/11

1tt

ttt

tttt YyVar

YyEy

YyVarYyf

π

( )( )

−−=

2

21

2/121

2exp

2

1)(

σµ

πσ

yyf

El logaritmo de la verosimilitud Gaussianaes

( )2

212

2 1

21

21

12

1

2

)(log

21

)|()|(

21

)|(log21

)2log(2

)(log))|(log(log

σµσ

π

−−∑ −−−

∑−−

=∑ +=

= −

=−

=−

y

YyVar

YyEy

YyVarT

yfYyfL

T

t tt

ttt

T

ttt

T

ttt

En los modelos ARMA, la varianza condicional siempre es constante. Por lo tanto,

La media condicional y la distribución marginal dependen del modelo particular que se haya ajustado a la serie.

( )2

212

2

212

2

2

)(log

21

)|(2

1

2)1(

)2log(2

log

σµσ

σ

σπ

−−∑ −−

−−−−=

=−

yYyEy

TTL

T

tttt

a

a

Ejemplo: AR(1)

Por lo tanto, la log-verosimilitud Gaussianaes

φµ

−=

1c

21

22

1 φσσ−

= a 111)|( −− += ttt ycYyE φ

( )

−−

−∑ −−

−−+−−=

=−

2

2

2

1

2

2112

22

12

)1(

2

1

)1(21

2)2log(

2log

φσ

φφσ

φσπ

a

T

ttt

a

a

cy

ycy

TTL

Si consideramos que los valores iniciales de la serie son fijos en distintas realizaciones, entonces

El estimador de máxima verosimiltudcondicional es equivalente a MCO: sus propiedades asintóticas son las mismas que las del estimador de máxima verosimilitud.

( )∑ −−−−−−==

−T

ttt

aa ycy

TTL

2

2112

2

2

12

)1()2log(

2log φ

σσπ

Bajo el supuesto de estacionariedad, la distribución asintótica del estimador de máxima verosimilitud es la habitual, lo que nos permite realizar contraste de hipótesis sobre los parámetros del modelo de forma estándar.

Ejemplo: Masa monetaria europea

0.0E+00

1.0E+09

2.0E+09

3.0E+09

4.0E+09

5.0E+09

6.0E+09

7.0E+09

1970 1975 1980 1985 1990 1995 2000 2005

Masa monetaria europea

-.04

-.03

-.02

-.01

.00

.01

.02

.03

.04

1970 1975 1980 1985 1990 1995 2000 2005

Variaciones mensuales de las tasas anuales de la masa monetaria europea

Ejemplo: Desempleo

13.8

14.0

14.2

14.4

14.6

14.8

15.0

80 82 84 86 88 90 92 94 96 98 00 02 04

LDESEMPLEO

-.2

-.1

.0

.1

.2

.3

80 82 84 86 88 90 92 94 96 98 00 02 04

Diferencias mensuales de las tasas de desempleo anuales

Ejemplo: Tipo de cambio

0.8

0.9

1.0

1.1

1.2

1.3

1.4

250 500 750 1000 1250 1500

Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 2005

-.03

-.02

-.01

.00

.01

.02

.03

250 500 750 1000 1250 1500

First differences of logs of euro-dollar exchange rates: returns

4. Valoración de modelos

Una vez que el modelo ha sido ajustado a la seriede interés, la última etapa consiste en analizar siel modelo es apropiado.

Para ello vamos a realizar 3 tipos de análisis:

a) Contrastes sobre los coeficientes: significatividady raíces comunes.

b) Diagnóstico: Este análisis se basa habitualmenteen los residuos que no deben estarcorrelacionados con el pasado: su correlogramano debe tener ninguna correlaciónsignificativamente distinta de cero.

c) Contrastes respecto a modelos alternativos.

Comparación de modelos

La selección de los parámetros p y q mediante el análisis del correlogramapuede presentar dificultades prácticas en algunos casos. Por ello, se han propuesto criterios para decidir entre modelos alternativos para una determinada series temporal.

En la práctica se utilizan dos de estos criterios: el AIC (Akaike InformationCriteria) y el BIC (Bayes InformationCriteria).

Criterios de información

El AIC se basa en elegir aquel modelo que minimice la siguiente cantidad:

El criterio BIC elige el modelo que minimice

Estos criterios y fundamentalmente AIC tienden a sobreparametrizar los modelos.

12 )(2)ˆlog(),( −++= TqpqpAIC aσ

)log()()ˆlog(),( 12 TTqpqpAIC a−++= σ

Ejemplo: Masa monetaria europea

-.02

-.01

.00

.01

.02

.03

.04

-.04

-.02

.00

.02

.04

1975 1980 1985 1990 1995 2000

Residual Actual Fitted

Ejemplo: Desempleo

-.03

-.02

-.01

.00

.01

.02

.03-.2

-.1

.0

.1

.2

.3

82 84 86 88 90 92 94 96 98 00 02 04

Residual Actual Fitted

Ejemplo: Tipo de cambio

-.03

-.02

-.01

.00

.01

.02

.03

-.03

-.02

-.01

.00

.01

.02

.03

250 500 750 1000 1250 1500

Residual Actual Fitted

5. Una aplicación a una serie real:

Turistas extranjeros en España

0.00E+00

4.00E+06

8.00E+06

1.20E+07

1.60E+07

2.00E+07

2.40E+07

1970 1975 1980 1985 1990 1995 2000 2005

EXTRANJEROS

13.5

14.0

14.5

15.0

15.5

16.0

16.5

17.0

1970 1975 1980 1985 1990 1995 2000 2005

LEXTRANJEROS

-.5

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

1970 1975 1980 1985 1990 1995 2000 2005

DSLEXTRANJEROS

-.4

-.2

.0

.2

.4

-.6

-.4

-.2

.0

.2

.4

1970 1975 1980 1985 1990 1995 2000 2005

Residual Actual Fitted

-.3

-.2

-.1

.0

.1

.2

.3

-.6

-.4

-.2

.0

.2

.4

1970 1975 1980 1985 1990 1995 2000 2005

Residual Actual Fitted

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

1970 1975 1980 1985 1990 1995 2000 2005

DDSLEXTRANJEROS

-.3

-.2

-.1

.0

.1

.2

.3

-.4

-.2

.0

.2

.4

1970 1975 1980 1985 1990 1995 2000 2005

Residual Actual Fitted

-.3

-.2

-.1

.0

.1

.2

.3

-.4

-.2

.0

.2

.4

1970 1975 1980 1985 1990 1995 2000 2005

Residual Actual Fitted

Recommended