38
ESTADO DEL ARTE SERIES DE TIEMPO Agustín de la Cuesta W.; Juan Pablo Duarte P. I Abstract Poder hacer una proyección de los datos con una alta exactitud, es algo que cualquier analista de una empresa necesita para poder establecer sus estrategias. En este trabajo se entregan una serie de herramientas que se utilizan en series de tiempo para pronosticar. Dentro de las Herramientas que se detallan se encuentran los métodos ingenuos, suavizamiento exponencial, modelos autoregresivos y los modelos condicionales heterocedasticos. Estos modelos se utilizan dependiendo de la precisión que se este buscando, la característica de los datos, entre otras cosas. También se muestran algunas aplicaciones que utilizan estas metodologías, comparándolas y obteniendo conclusiones en base a estas. II Introducción Una serie de tiempo o serie cronológica, es una colección de datos numéricos (observaciones) al cual se asocia con un instante específico del tiempo. A través del análisis de estos, se puede construir un modelo que explique la estructura y el comportamiento de la serie de datos. Además se puede proyectar la evolución de una variable a lo largo del tiempo. Los modelos de series de tiempo suponen desconocimiento acerca de las relaciones causales que en la realidad afectan a la variable que se trata de pronosticar. Sin embargo, examina el comportamiento de una serie temporal en el pasado para inferir cual será su comportamiento futuro. Si se define X t como una variable aleatoria que describe el comportamiento de la serie en el instante t, podemos escribir un proceso estocástico ( X ) de la siguiente forma: X = { X t , t Z }

ESTADO DEL ARTE en Series de Tiempo

Embed Size (px)

Citation preview

Page 1: ESTADO DEL ARTE en Series de Tiempo

ESTADO DEL ARTE

SERIES DE TIEMPO

Agustín de la Cuesta W.; Juan Pablo Duarte P.

I Abstract

Poder hacer una proyección de los datos con una alta exactitud, es algo

que cualquier analista de una empresa necesita para poder establecer sus

estrategias. En este trabajo se entregan una serie de herramientas que se

utilizan en series de tiempo para pronosticar. Dentro de las Herramientas que se

detallan se encuentran los métodos ingenuos, suavizamiento exponencial,

modelos autoregresivos y los modelos condicionales heterocedasticos. Estos

modelos se utilizan dependiendo de la precisión que se este buscando, la

característica de los datos, entre otras cosas. También se muestran algunas

aplicaciones que utilizan estas metodologías, comparándolas y obteniendo

conclusiones en base a estas.

II Introducción Una serie de tiempo o serie cronológica, es una colección de datos numéricos (observaciones) al cual se asocia con un instante específico del tiempo. A través del análisis de estos, se puede construir un modelo que explique la estructura y el comportamiento de la serie de datos. Además se puede proyectar la evolución de una variable a lo largo del tiempo. Los modelos de series de tiempo suponen desconocimiento acerca de las relaciones causales que en la realidad afectan a la variable que se trata de pronosticar. Sin embargo, examina el comportamiento de una serie temporal en el pasado para inferir cual será su comportamiento futuro. Si se define X t como una variable aleatoria que describe el comportamiento de la serie en el instante t, podemos escribir un proceso estocástico ( X ) de la siguiente forma: X = { X t , t Z }

Page 2: ESTADO DEL ARTE en Series de Tiempo

Por otro lado, no es posible distinguir las particularidades que el comportamiento de una serie de tiempo pueda tener, incluso gráficamente. El método de una serie temporal para la obtención de una predicción, puede implicar la utilización de un modelo determinístico simple, hasta la utilización de un complejo modelo estocástico adaptivo. Los métodos existentes permiten ajustar los consumos históricos a una determinada curva, logrando extrapolarla hacia el futuro. Esto presenta características, tales como:

Es posible utilizar una mínima cantidad de datos, Permite emplear algoritmos directos y sencillos (con la ayuda de software’s). Sus resultados son bastante aceptables, de acuerdo a los datos que se

manejan. Por otra parte, estudios revelan que una serie de tiempo posee ciertos componentes de movimientos o variaciones características que pueden medirse y observarse por separado, como se muestra a continuación:

a) Tendencia o movimientos seculares o de larga duración.

Es el patrón básico de crecimiento o disminución de la serie a largo plazo. Señala que el nivel de la serie se desplaza en forma regular con movimientos suaves hacia arriba o hacia abajo a lo largo del tiempo. Se encuentra ajustando una recta o curva de regresión a la variable en cuestión.

b) Ciclo o movimientos cíclicos.

Se refiere al movimiento ondulado de la serie, a mediano plazo, que resulta de los cambios en la actividad económica y competitiva en general. Son, sin duda, oscilaciones de larga duración alrededor de la curva de tendencia, las cuales pueden o no ser periódicas, es decir, pueden o no seguir caminos análogos en intervalos de tiempo iguales. El componente cíclico es útil para los pronósticos a mediano plazo. No obstante, las fluctuaciones cíclicas son difíciles de pronosticar porque no se presentan de manera regular.

c) Estacionalidad o movimientos estacionales.

Son fluctuaciones periódicas en una serie de tiempo, cuya frecuencia es menor a un año (semestre, trimestre, mensual, diaria, etc.), repitiéndose aproximadamente en las mismas fechas y con la misma intensidad. El componente temporal puede estar relacionado con factores climatológicos, fiestas o costumbres comerciales.

d) Ruido estadístico o movimientos erráticos o irregulares.

Son movimientos esporádicos o de corto plazo que se deben a una infinidad de factores no identificables, ocasionales o imprevisibles. Cada uno de estos afecta en pequeña medida a un efecto en la variable. Estos componentes, por definición son impredecibles y se deben eliminar de los datos pasados, a efecto de encontrar el comportamiento más normal de las series.

Page 3: ESTADO DEL ARTE en Series de Tiempo

III Modelos

III.1 Modelos de Descomposición Clásicos Esta metodología consiste en descomponer la serie histórica en: tendencia (T), ciclo (C), componente estacional (S) y componente irregular (I). Estos cuatro componentes pueden ser combinados de manera aditiva o multiplicativa para producir el efecto observado. El modelo aditivo se expresa como: Xt = Tt + St + Ct + It , los valores al lado derecho corresponden a la tendencia, la variación estacional, la variación cíclica y la variación aleatoria o irregular, respectivamente para el mismo período. Sin embargo este modelo supone que los componentes son independientes uno del otro, lo que rara vez sucede en la vida real. En la mayoría de los casos, los movimientos de un componente tendrán un impacto en los otros, por lo que el modelo multiplicativo es el que se usa con más frecuencia. El modelo multiplicativo se expresa como: Xt = Tt x St x C t x It . En este modelo sólo T se expresa en las unidades originales, y S, C e I se expresan en términos de fracciones. Debido al comportamiento de las variables bajo estudio, se utilizará y explicará solamente la metodología correspondiente al modelo multiplicativo.

III.1.1 Estimación de la componente estacional El primer paso en la descomposición es la obtención un índice estacional. Teniendo en cuenta el comportamiento de las variables, se calcula un promedio móvil que abarque un ciclo de estacionalidades completo, eliminando de esta forma las variaciones estacionales, así como todo el efecto aleatorio, dejando la tendencia y el componente cíclico, es decir, PM t = T t x C t. Luego se calcula la razón por promedio móvil:

tttt

tttt

t

t xISxCT

xIxCxSTPMX

Posteriormente, para eliminar el componente aleatorio se calcula una razón media por promedio móvil para cada una de las estaciones. Esto se logra promediando la razón promedio móvil para cada estación, sin incluir el máximo ni el mínimo de cada conjunto.

III.1.2 Análisis de la tendencia Utilizando el método de mínimos cuadrados ordinarios, es posible estimar una curva de tendencia, donde la variable dependiente es la serie de tiempo que se desea pronosticar y el tiempo se utiliza como variable independiente. Dado el comportamiento de las series bajo estudio, generalmente se opta por estimar la tendencia en forma lineal.

Page 4: ESTADO DEL ARTE en Series de Tiempo

III.1.3 Estimación de la variación cíclica El componente cíclico se identifica dividiendo el promedio móvil por la tendencia. Una vez aislado el componente cíclico, es posible ajustar una curva de regresión sinusoidal, a través de la metodología de mínimos cuadrados, de la forma:

C t = a + b COS ( c t + d )

III.1.4 Pronósticos Finalmente, al determinar los componentes del modelo, estos se reúnen para obtener el pronóstico de la variable de interés, de la siguiente forma:

tttt xCxSTX

III.2 Métodos Ingenuos Antes de recurrir a los métodos más sofisticados uno debe preguntarse si el problema en cuestión realmente lo justifica, o bien, si bastaría con usar técnicas económicas computacionales y de simple interpretación. Esto dependerá esencialmente de la importancia de las decisiones que se tomarán en base al modelo y del tipo de predicción (Corto, largo; o mediano plazo). Los modelos existentes que pueden ser utilizados son:

a) x(t) = T(t)+E(t)+A(t) (aditivo) b) x(t) = T(t) E(t) A(t) (multiplicativo) c) x(t) = T(t) E(t) + A(t) (mixto)

Se puede apreciar claramente, al igual que el apartado anterior, que: T: Tendencia de la serie (representa la dirección predominante de la serie, es decir, su comportamiento promedio). E: Variación estacional (Se caracteriza por períodos o ciclos de la serie). A: variaciones accidentales (Se caracteriza cambios irregulares ya sean de tendencia variancia o ciclos de la serie).

III.2.1 Estimación de la Tendencia Es necesario estimar una curva de tendencia, donde la variable dependiente es la serie de tiempo que se desea pronosticar y el tiempo se utiliza como variable independiente. Dado el

Page 5: ESTADO DEL ARTE en Series de Tiempo

comportamiento de las series, es probable estimar la tendencia en forma lineal, mediante el uso de mínimos cuadrados. Regresión Mediante inspección gráfica se decide cual curva ajustar. a) T(t) = a + bt (recta) b) T(t) = a ebt (exponencial) c) T(t) = a + bt + ct2 (parabola) La estimación de T(t) se anotará . Por otro lado, se remueve el efecto estacional de la serie en cuestión, antes de estimar la tendencia. Para esto se usa Medias móviles. Medias Móviles:

12

)6(21)5()4()5()6(

21

)(

txtxtxtxtx

tz

La nueva serie Z(t), bajo el supuesto de que la serie es mensual con efecto estacional anual, se suele decir que es la serie original filtrada o suavizada. Ahora, se estima la tendencia aplicando regresión a la serie suavizada.

III.2.2 Estimación de la Variación Estacional Si se utilizo regresión a x(t) para estimar la tendencia, se calcula la serie residual W(t):

Aditivo) Caso ( )(ˆ)()(ˆ tTtxtW

Mixto) Caso ( )(ˆ)()(ˆ

tTtxtW

W(t) Es una serie en que sólo deberían manifestarse los efectos estacionales y accidentales. Si además se aplica medias móviles se tendrá que, la serie W(t) se puede estimar mediante

Mixto) ( )()((t)W~ ; Aditivo) ( )()()(~

tztxtztxtW

:)(~ tW También será una serie en que sólo se encontrará presente efectos estacionales y accidentales.

)(ˆ tT

Page 6: ESTADO DEL ARTE en Series de Tiempo

En cualquiera de estos casos denotaremos mediante w(t) la serie en que se han removido los efectos de la tendencia. Por lo tanto, a W(t) se le llama serie residual (luego de removida la tendencia), tal como se muestra en la figura 4.1, para ambos casos

Caso Aditivo Caso mixto Figura 3.1: Serie Residual W(t) Para estimar la variable estacional E(t) se puede comenzar por considerar e(h), como el promedio de los valores de w en el mes h.

mensual serie suponiendo )(121 12

1

h

hee

Como es razonable, se quisiera que el promedio de las estimaciones sea 0 en el caso aditivo y 1 en el caso mixto, por lo que se puede estimar E(h) mediante:

mixto Caso ; )1()()(ˆAditivo Caso ; )()(ˆ

ehehE

ehehE

La aplicación del estimador (Ê(h)) en pronóstico es directa, ya que se predice E(t) mediante la variación estacional estimada para el mes t. Para poder elegir entre ambos modelos, se suele utilizar el gráfico de la serie residual. En el caso de series de índices se sugiere usar modelos mixtos, debido a que en este caso las variaciones serán porcentuales).

III.2.3 Formulación General del Problema de Predicción La predicción correspondiente, que dependerá del modelo elegido y, en general, de n y k, se anotará de la siguiente forma:

Page 7: ESTADO DEL ARTE en Series de Tiempo

Mixto Caso )(ˆ)(ˆ)(ˆ

Aditivo Caso )(ˆ)(ˆ)(ˆ

knEknTkx

knEknTkx

n

n

donde k es el horizonte de predicción o número de pasos adelante que se está prediciendo y n el origen de la predicción. Una vez conocido x(n+k) podemos calcular el error de predicción correspondiente:

)(ˆ)()( kxknxke nn

III.3 Suavización Exponencial Los métodos de suavizamiento exponencial han sido desarrollados desde principios de los años 1950´s. Quizás la razón más importante de su popularidad es la sorprendente precisión que puede ser obtenida con un mínimo de esfuerzo en la identificación del modelo. Gardner propone un sistema para clasificar los modelos de suavizamiento exponencial de dos maneras, dependiendo de la estacionalidad y la tendencia. Los modelos pueden incorporar o no, un componente estacional que puede ser multiplicativo o aditivo. Además, pueden poseer o no una tendencia lineal, exponencial o amortiguada. La combinación de estas características entrega 12 modelos diferentes de suavizamiento exponencial, incluyendo los modelos clásicos desarrollados por Winters y Holt. A continuación se estudiaran los modelos más utilizados de suaviazamiento exponencial:

Suavizamiento exponencial Simple: sin tendencia y sin componente estacional Modelo aditivo sin tendencia Holt: tendencia lineal y sin componente estacional Winters o Suavizamiento exponencial triple: tendencia lineal y componente

estacional multiplicativo Modelos con tendencia exponencial y componente estacional multiplicativo Modelos con tendencia amortiguada y componente estacional multiplicativo

III.3.1 Suavizamiento exponencial simple Como su nombre lo indica, el suavizamiento exponencial tiene el efecto de suavizar una serie, el Suavizamiento Exponencial Simple se utiliza cuando los datos no presentan ningún patrón de tendencia, es decir, si la serie temporal fluctúa con respecto a un nivel base3. Sus ecuaciones son: Forma Recursiva

11 ttt SxS

tmt SX ˆ

Forma de corrección del error

1 ttt SeS

Page 8: ESTADO DEL ARTE en Series de Tiempo

tmt SX ˆ

Donde: Xt : es el valor observado de la serie en el período t St : es el nivel suavizado de la serie, calculado después de observar Xt : S0 = X1 tX es el pronóstico para el período t m: es una constante que representa un número no especificado de períodos et: es el error del pronóstico ttt XXe ˆ α : es una constante de suavizamiento para el nivel de la serie ( 0 < α < 1) El modelo es un promedio ponderado de los valores actuales y los pasados, ajustando los pronósticos en dirección opuesta a los errores pasados. Debido que se desea pronosticar con el menor error posible, el valor de α se escoge minimizando el error cuadrático medio (MSE). Si α es cero, todos los valores suavizados serán iguales al valor inicial. Si este parámetro es uno, cada valor suavizado será igual a la observación previa respectiva. Valores de α mayores que 0 y menores que 1 producirán un pronóstico que es un promedio ponderado de las observaciones anteriores, cuyos pesos reducirán exponencialmente los valores pasados. Valores pequeños para α hacen que los efectos pasados tarden más en desaparecer, por el contrario mientras más cercanos estén a uno, mayor será el efecto de las observaciones más recientes.

III.3.2 Modelo Aditivo sin tendencia Este modelo es parcialmente equivalente al modelo de suavizamiento exponencial simple, sin embargo, adicionalmente cada pronóstico es mejorado a través de un componente estacional aditivo, el cual es suavizado independientemente. Forma recursiva

mpttmt

ptttt

tpttt

ISX

ISXISIXS

1

1 1

Forma de corrección del error

mpttmt

pttt

ttt

ISX

IeIeSS

11

Donde: I t : es un índice o factor estacional suavizado al final del período t δ : es una constante de suavizamiento para los factores estacionales (0 < δ < 1)

III.3.3 Modelo Winter (Suavizamiento exponencial triple) Este método se usa cuando están presentes la tendencia y la variación estacional, mejora los pronósticos del modelo de suavizamiento exponencial simple a través de un

Page 9: ESTADO DEL ARTE en Series de Tiempo

componente de tendencia lineal (independientemente suavizado con el parámetro γ) y de un componente estacional multiplicativo (suavizado con el parámetro δ). Sus ecuaciones son: Forma recursiva

mptttmt

ptt

tt

tttt

ttpt

tt

ITmSX

ISXI

TSST

TSIXS

ˆ

1

1

1

11

11

Forma de corrección del error

mptttmt

t

tptt

tpt

tt

pt

tttt

ITmSX

SeII

TIeT

IeTSS

ˆ

1

1

11

Donde: T t : es la tendencia suavizada al final de l período t Γ : es una constante de suavizamiento para la tendencia (0 < γ < 1) P :es el largo del ciclo estacional; p=12 para datos mensuales; p=4 para datos trimestrales. El resto de los parámetros mantiene su definición anterior. Además, para calcular el valor suavizado (pronóstico) para la primera observación de la serie, las estimaciones del nivel (S 0) y la tendencia (T o) son necesarias. Se suele calcular estos valores a través de las siguientes fórmulas:

pk

MMT k

1

10

20

10TpMS

Donde M k es promedio del último ciclo estacional, M 1 es el promedio del primer ciclo estacional y k es el número de ciclos estacionales completos. Además, los valores iniciales de los factores estacionales se toman como los índices estacionales del modelo de descomposición clásico.

Page 10: ESTADO DEL ARTE en Series de Tiempo

III.3.4 Modelo con tendencia Exponencial y con componente estacional multiplicativa En este modelo los pronósticos del modelo de suavizamiento exponencial simple son mejorados a través de un componente de tendencia exponencial (independientemente suavizado con el parámetro γ) y de un componente estacional multiplicativo (suavizado con el parámetro δ). Sus ecuaciones son: Forma recursiva

mptm

ttmt

ptt

tt

tt

tt

ttpt

tt

ITSX

ISXI

TSST

TSIXS

ˆ

1

1

1

11

11

Forma de corrección del error

mpttm

tmt

t

tptt

tptt

tt

pt

tttt

ITSX

SeII

TISeT

IeTSS

ˆ

1

11

11

Todos los parámetros mantienen su definición anterior. Además, para calcular el valor suavizado (pronóstico) para la primera observación de la serie, las estimaciones del nivel (S 0) y la tendencia (T o) son necesarias. . Se suele calcular estos valores a través de las siguientes fórmulas:

2loglog

0

loglog

0

01

1

TpM

pMM

eS

eTk

Además, los valores iniciales de los factores estacionales se toman como los índices estacionales del modelo de descomposición clásico.

Page 11: ESTADO DEL ARTE en Series de Tiempo

III.3.5 Modelo con Tendencia Amortiguada y con componente estacional multiplicativa En este modelo los pronósticos del modelo de suavizamiento exponencial simple son mejorados a través de un componente de tendencia amortiguada (independientemente suavizado con el parámetro φ) y de un componente estacional multiplicativo (suavizado con parámetro δ); este modelo es una extensión del modelo lineal de un parámetro de Brown. En este caso no es aplicable la forma recursiva como lo ha sido en los casos anteriores. Forma de corrección de error

mpt

m

wt

wtmt

t

tptt

pt

ttt

pt

tttt

ITSX

Se

II

Ie

TT

Ie

TSS

1

1

11

ˆ

21

1

2

Donde φ : Es una constante de modificación de la tendencia (o < φ < 1) El resto de los parámetros mantiene su definición anterior. Además, para calcular el valor suavizado (pronóstico) para la primera observación de la serie, las estimaciones del nivel (S 0) y la tendencia (T o) son necesarias. Estos se calculan estos valores a través de las siguientes fórmulas:

2

11

010

10

TpMS

pkMMT k

Además, los valores iniciales de los factores estacionales se toman como los índices estacionales del modelo de descomposición clásico.

III.4 Modelos Autoregresivos

III.4.1 Modelos de Box & Jenkins (Autoregresivos- Medias Móviles) El estudio realizado por G.P.E. Box y G.M. Jenkins (1976), estableció una nueva generación en herramientas de predicción. La metodología conocida como Box & Jenkins (o

Page 12: ESTADO DEL ARTE en Series de Tiempo

técnicamente conocida como ARIMA), a diferencia de otros modelos utilizados para el mismo fin, la variable de interés puede ser explicada por valores pasados y por términos estocásticos de error. Esta metodología tiene un alcance bastante más amplio que los modelos de descomposición clásica, los métodos ingenuos o de suavizamiento, no obstante son muy complejos. Los procesos estocásticos son sucesiones de variables aleatorias, siendo su índice el tiempo {Xt}. Dichos procesos están compuestos por observaciones tomadas a intervalos iguales, con lo que las aplicaciones frecuentes corresponden a datos observados en el tiempo, como ser cada año, mes, hora, etc. El método Box & Jenkins consiste en construir un modelo en varias etapas (siguiendo el esquema del cuadro siguiente), detalladas a continuación:

Formulación de un modelo ARIMA

Identificación de un modelo para los datos observados (p,d,q,P,D,Q)

Estimación de los parametros ('s,'s,'s,'s)

Crítica y diagnosis del modelo

¿Es el modelo adecuado?

Pronósticos

1. Formulación de un modelo ARIMA: lo primero es decidir si la serie es o no un proceso

estacionario, si no lo es, se debe trasformar para que lo sea. 2. Identificación de un modelo para los datos observados: examinando los coeficientes de

las funciones de autocorrelación simple1 y autocorrelación parcial2, se escoge en forma tentativa valores p, d, q, P, D y Q para cada serie, siguiendo el principio de parsimonia (el modelo debería usar el menor número posible de parámetros).

1 Mide el grado de correlación de una variable con si misma, desfasada una cierta cantidad de

tiempo. 2 Mide autocorrelación después de eliminar los efectos de retardos intermedios

Page 13: ESTADO DEL ARTE en Series de Tiempo

3. Estimación de parámetros y contrastes: esto es determinar los parámetros para el modelo ARIMA(p, d, q)(P, D, Q) específico.

4. Critica y diagnosis del modelo: esto es, verificar si el modelo se ajusta apropiadamente,

examinando los coeficientes de las funciones de autocorrelación y autocorrelación parcial de los residuos.

La autocorrelación mide el grado de correlación de una variable con sí misma desfasada una cierta cantidad de tiempo (lag o retardo). La autocorrelación Parcial mide la autocorrelación después de eliminar el efecto de los retardos intermedios. Si el modelo parece inadecuado en alguna forma, se considerará la naturaleza de la inadecuación para ayudar a seleccionar otro modelo. Luego se procederá a estimar ese nuevo modelo y verificar su ajuste.

5. Pronósticos: Con pocas iteraciones de esta estrategia, se espera llegar al mejor modelo

posible para las series bajo estudio, una vez determinado el modelo se realizan los pronósticos. Si la serie fue diferenciada, ésta debe integrarse antes de generar los pronósticos.

Esta metodología corresponde al modelo que mejor predice en el corto plazo, debido a que no existe nada mejor que el pasado de la propia serie de datos, para saber su evolución futura. El modelo general introducido por Box y Jenkins establece una base cuantitativa para decidir si aplicar una regresión, una suavización, o ambas simultáneamente para crear el mejor pronóstico. Cualquier serie de tiempo puede ser generada por un proceso estocástico o aleatorio y un conjunto concreto de información. Las series de tiempo se utilizan para inferir sobre el proceso estocástico subyacente. Un tipo de proceso estocástico que ha recibido gran atención por parte de los analistas de series de tiempo es el proceso estocástico estacionario. En forma general, se dice que un proceso estocástico es estacionario si su media y su varianza son constantes en el tiempo y si el valor de la covarianza entre dos periodos depende solamente de la distancia o rezago entre dos periodos del tiempo y no del tiempo en el cual se ha calculado la covarianza. Para explicar lo afirmado, sea yt una serie de tiempo estocástica con estas propiedades:

Media E(yt)= Varianza Var(yt)= E(yt-)2=2

Covarianza k= E[(yt-)(yt+k-)]

III.4.1.1 Elaboración de Modelos para series de tiempo Mediante una serie de tiempo estacionaria se pueden elaborar modelos AR, MA, ARMA, VARMA y ARIMA.

Page 14: ESTADO DEL ARTE en Series de Tiempo

Cabe destacar, que los tres tipos de parámetros que participan en el modelo son: Los parámetros autorregresivos (p), el número de pasos de diferencia (d) y los parámetros de media móvil (q).

III.4.1.2 Proceso Autoregresivo - AR(p) El componente autorregresivo indica que cada observación es dependiente de valores previos del proceso. El proceso estacionario X = X(t), t Z se dirá autorregresivo de orden p si existe un ruido blanco A = a(t), t Z y constantes , 1, ...........p; p 0, (: grado de asociación) tales que: X(t)= + 1 X(t-1) + ........p X (t-p) + a(t) ó (B) X(t) = at En otras palabras, X(t) se obtiene haciendo regresión del proceso sobre su pasado y sumándole un término que se supone no correlacionado con el pasado y que corresponde al ruido blanco a(t). Además, un proceso autorregresivo de orden p, abreviado como AR(p), pondera las observaciones anteriores para determinar el valor de X(t), donde existen p parámetros autoregresivos (φ 1, φ 2, … φ p).

III.4.1.3 Proceso de Media Móvil - MA(q) El componente de media móvil implica que la serie experimenta variaciones aleatorias a lo largo del tiempo, cuyo efecto puede perdurar en el nivel de la serie. El proceso estacionario X = X(t), t Z se dirá media móvil de orden q si existe un ruido blanco A= a(t), t Z y constantes , 1, .....q; q 0, tales que la expresión: X(t) = + a(t) - 1 a(t-1) - ....... q a(t-q) ó X(t) = q (B) at Representa un proceso estocástico de medias móviles de orden q, abreviado como MA(q). Donde a(t) es una variable aleatoria que proviene de un proceso estacionario que se caracteriza por tener esperanza nula, proceso llamado también ruido blanco.

Page 15: ESTADO DEL ARTE en Series de Tiempo

III.4.1.4 Proceso Autoregresivo y de media Móvil - ARMA(p,q) Es probable que un proceso tenga características de AR y de MA a la vez. Por lo tanto tendrá una parte autorregresiva y una parte de promedio móvil. El proceso estacionario X = X(t), t Z se dirá proceso autorregresivo de medias móviles de orden (p,q) , si existe un ruido blanco A= a(t), t Z y constantes , 1, … q, 1, … p; p 0; q 0, tal que un proceso ARMA (p,q) puede escribirse como: X(t) = + 1 X(t-1) + ......+ p X (t-p) + a(t) - 1 a(t-1) - ....... q a(t-q) ó p(B)X(t)=q(B)at

III.4.1.5 Proceso Autoregresivo Integrado de media Móvil – ARIMA(p,d,q) En este proceso aparece un tercer parámetro (d), el cual corresponde al número de diferenciaciones que se le aplica a la serie de modo de hacerla una serie estacionaria, es decir, que no tenga tendencia. La diferenciación es una técnica que consiste en obtener las diferencias entre cada par de observaciones, formando una nueva serie, de modo de hacerla estacionaria y luego aplicar un modelo ARMA (p,q). Esto permite aplicar los modelos ARIMA a series no estacionarias, ya que estos funcionan bajo el supuesto de estacionariedad de la serie. El término integrado se refiere al proceso inverso, necesario para realizar los pronósticos. Un modelo es ARIMA (p,d,q) si es del tipo p (B) (1-B)d Xt = q (B) at Por lo tanto, se dice que xt sigue un modelo autorregresivo y de medias móviles. Si los polinomios y son de grado p y q respectivamente, entonces el modelo se denota ARIMA (p,d,q). Por conveniencia se introduce el operador

III.4.1.6 Proceso Autoregresivo Integrado de media Móvil estacional – ARIMA(p,d,q)x(P,D,Q)s La serie de tiempo es estacional si ella presenta un ciclo repetitivo, es decir, la observación ocurrida en Xt, tiene mucha correlación con la observación Xt-s, de s es la amplitud del periodo estacional. Así se puede tener un proceso autorregresivo estacional, representado por los parámetros 1, 2,………., P, y un proceso de medias móviles estacional, el cual es representado por los parámetros, 1,2,……,Q. E parámetro D representa el número de veces que se hace necesario diferenciar el componente estacional para que la serie sea estacionaria. En general, el componente no estacional es representado por los parámetros con letras minúsculas, mientras que el estacional con letras mayúsculas. Un modelo ARIMA (p,d,q)x(P,D,Q)s es de la forma:

Page 16: ESTADO DEL ARTE en Series de Tiempo

P(BS) p(B)dD

S X(t)= q(B)Q(BS)at donde , se define como operador de retardos, y es de la forma: =(1-B) y la composición del operador d veces consigo mismo es (1-B)d y se denota d.

III.4.1.7 Proceso Multivariados – VARMA (p,q) Los modelos y métodos de estimación antes mencionados, pueden ser extendidos a series de tiempo multivariadas. Este análisis investiga una cierta dependencia temporal e interacción entre un set de variables. En otras palabras, un procesos multivariado ocurre cuando existen varias variables dependientes entre si que influyen en el comportamiento de una variable global. Se considera una Serie de Tiempo Multivariada: (Yt, t Z) de dimensión n con componentes denotados por Y1t,...., Ynt, t Z, Cada componente (Yi,t, t Z), es un proceso univariado. El valor actual del vector Yt, depende de la serie de todos los componentes pasados. Existe una representación lineal parsimoniosa (sobria, moderada), con un número de retardos limites para cada proceso estacionario. Vector de proceso autoregresivo de orden p, VAR (p)

tptptt YYY ...11 Vector de proceso de media móvil de orden q, VMA (q)

qtqtttY ...11 Vector de proceso autoregresivo de media móvil de orden p y q, VARMA (p,q)

qtqttptptt YYY ...... 1111 o bien,

tt LYL )()(

Donde L es un operador de retardo.

Page 17: ESTADO DEL ARTE en Series de Tiempo

III.4.1.8 Modelos ARMAX Existe un conocimiento amplio sobre los modelos econométricos de una sola ecuación para estimar la relación entre variables y hacer pronósticos. Un de las tareas en el modelamiento económico es describir los posibles impactos en el tiempo de un cambio en una o más variables explicatorios del modelo. Por otra parte, existe una familiarización con los modelos ARIMA (expuestos anteriormente). Las últimas dos décadas han traído mayor integración de las técnicas de modelamiento de las series econométricas y de tiempo. Para una modelamiento de una sola ecuación, una buena alternativa es utilizar un modelo ARMAX (Autoregresivo Media Móvil con variables explicatorios).

Una especificación muy general que se ha probado en trabajos recientes es el modelo racional de Jorgenson, o en una literatura más reciente, el modelo autorregresivo de retardos distribuidos (ARD).

ttt x)L( C)L( By

donde B (L) y C (L) son polinomios en el operador de retardos. El cociente de dos polinomios en el operador de retardos puede producir, esencialmente, cualquier forma deseada de la distribución de retardos con relativamente pocos parámetros. La forma autorregresiva es:

ttt )L(Cx)L(By)L( C

En esta forma, el modelo tiene variables dependientes e independientes retardadas y un error de media móvil (MA).

Un modelo mucho más general y flexible se obtiene permitiendo que el error tenga una

estructura de retardos propia. El modelo resultante es:

ttt )L(Dx)L(By)L(C donde = C(1). Esto es conocido como un modelo ARMAX. Esto también es conocido como una función de transferencia. En este contexto, xt, representa el impulso y lo que hemos identificado como los coeficientes de los retardos distribuidos son las características de respuesta al impulso. Un caso especialmente importante es el modelo ARMA, que es el modelo ARMAX sin regresores:

qtq1t1tptp2t21t1t ...y...yyy

La notación convencional ARMA (p,q) ó ARMAX(p,q) indica el número de términos retardados en la parte AR, C(L)yt, y la parte MA, D(L)t, respectivamente. Los modelos ARMA y ARMAX son comunes en el análisis de series temporales.

El término error t se considera como una variable aleatoria serialmente incorrelacionada

y de varianza constante. Es decir, no se permite la posibilidad de perturbaciones autorregresivas. De hecho, no se ha perdido generalidad, ya que se puede suponer que si la perturbación original estaba sujeta a autorregresión, es el resultado de tomar diferencias parciales que ha solucionado esta parte del proceso de las perturbaciones. Segundo, incluso permitiendo más de una variable exógena del modelo puede escribirse como:

Page 18: ESTADO DEL ARTE en Series de Tiempo

ttii

i x'x)L(B

Para algún conjunto de coeficientes desconocidos y valores contemporáneos y

retardados xsi. Así, una formulación bastante general del modelo ARMAX es:

qtq1t1ttptp1t1t ...x'y...yy

Lo que se presenta como una modificación del modelo básico ARMA, este modelo presenta la característica de contar con regresores estocásticos. proporcionando un modelo dinámico de considerable generalidad.

III.4.1.8.1 Estimación de modelos ARMAX

Si no hay términos de media móvil en la ecuación (3.4), es un modelo de regresión lineal con regresores estocásticos. El vector de parámetros:

'k1p1 ,...,,,...,, puede estimarse de modo consistente por mínimos cuadrados ordinarios en la regresión de yt en

''tpt2t1t x,y,...,y,y,1z

(xt puede contener también valores retrasados de las variables exógenas). El estimador MCO en este contexto, estará asintóticamente distribuido con una normal con matriz de covarianza asintótica. Cuando hay perturbaciones de media móvil, el modelo se convierte en no lineal. En este caso el estimador mínimo cuadrado será consistente y distribuido asintóticamente normal. Si t se supone normalmente distribuida, entonces el mínimo cuadrado no lineal, condicionado a las observaciones iniciales, será también máximo verosímil. Así, mínimos cuadrados serán también eficientes. Generalmente, mínimos cuadrados lineales aplicados no serán siquiera consistentes. El modelo contiene ambas variables dependientes retardadas y autocorrelación. La suma de los cuadrados a minimizar es

T

qpttSS

1

2)(),,,(

Estimaciones de mínimos cuadrados no lineales de un modelos de regresión

dinámico pueden ser basados en la iteración del método de Gauss-Newton. La iteración es:

Page 19: ESTADO DEL ARTE en Series de Tiempo

ssss

ss

GGG

'1''1

Donde Gs es una matriz de derivativos de los residuales con respecto a los

parámetros. Los derivativos son calculados como:

,,...,1,...

,,...,1,...

,,...,1,...

,...1

11

11

11

11

qj

Kk

piy

j

qtq

j

tjt

j

t

k

qtq

k

ttk

k

t

i

qtq

i

tit

i

t

qtq

tt

Estas ecuaciones son ecuaciones diferenciales que pueden ser calculadas recursivamente luego de inicializar t y los derivativos con q ceros. En un formato de matriz, se tendría:

),(,...,1,

),(,...,1,

),(,...,1,

),1(,...,1,

,

,

,

,

qXqqsG

qXKqsG

qXpqsG

qXqsG

stt

stt

stt

stt

Entonces la fila r-ésima de Gs es

Page 20: ESTADO DEL ARTE en Series de Tiempo

,,,, ''')(

ttttt

s Bg

donde:

,

,

,

,1

,

,

,

,

tretardost

ttt

tretardost

tt

G

G

Gy

G

Un estimador de variables instrumental puede ser usado para obtener los valores de inicio. Se pueden usar valores de retraso de las variables exógenas t como instrumentos para [yt-1, . . . , y t – p]. Construir valores iniciales para [ 1,…, q] es más complejo. Box and Jenkins (1984) sugieren el siguiente método de procedimiento de estimación de momentos, que puede ser basado en los residuos desde el estimador de variables instrumental.

1.- Sea c1, i = 0,1,…,q, ser la covarianza muestral de et y et-1.. (Ellas son

autocovarianzas). Partir con .0

2.-Calcular

)'1(02

cs

3.- Para i = q, q – 1, ... , 1 (trabajando hacia atrás), calcular

1

112

q

jjj

i

sc

.

Page 21: ESTADO DEL ARTE en Series de Tiempo

4.- Verificar la convergencia basada en el cambio desde la última iteración. Si es así, entonces termina. En caso contrario, retornar al paso dos.

Este método podría no converger. La estimación podría diverger, en tal caso la especificación del modelo se vuelve sospechosa. Esto puede ser conducido por un “sobreajuste”, que es la especificación de muchos parámetros. Luego que los parámetros han sido estimados:

,11 2

11

2

t

T

ptqKpT

Donde:

qtqttptpttt yyy

...'... 1111 La matriz de covarianza asintótica estimada para un parámetro estimado es:

Varianza asintótica estimada ,'12

GG

Donde G es la matriz (T-p-q) x (1+K+p+q) de derivativos de los residuales con respecto a las parámetros. La matriz es la suma de cuadrados y producto cruz calculados en la última iteración.

III.4.1.8.2 Cálculo de las ponderaciones de los retardos en el modelo ARMAX Los coeficientes de los retardos de xt, xt-1, ..., del modelo son los términos individuales en el cociente de polinomios. Los denotaremos como:

0, 1, 2, .... = el coeficiente en 1,L,L2, ..., en B(L)/C(L)

Un modo conveniente de calcular estos coeficientes de los retardos es escribir la parte izquierda de la ecuación como A(L) y notar que implica que A(L) C(L) = B(L). Por lo tanto sólo tenemos que igualar coeficientes. El error cuadrático medio de la predicción es:

)...1()y(MSE 21l

21

2T/lT

Page 22: ESTADO DEL ARTE en Series de Tiempo

III.4.2 Modelos Autoregresivos Condicionales Heterosedasticos (ARCH)

Robert F. Engle (1982), profesor de la Oxford University, es el pionero en éstos modelos, publicando en Econometría su trabajo “ARCH”, sigla que representa al Modelo Autorregresivo Condicional Heteroscedástico. Desde entonces, este campo ha crecido explosivamente, donde numerosos trabajos se han escrito analizando modelos de volatilidad variable. Un trabajo de Bollerslev, Chou, y Kroner (1992) lista más de 100 trabajos en esta materia. ARCH ( Autorregresivo Condicional Heteroscedástico) y GARCH (ARCH Generalizado) son dos modelos econométricos que son usados frecuentemente para predecir volatilidad condicionada. Mientras, para muchas aplicaciones, es razonable tratar la volatilidad como constantes a través del tiempo, este modelos no lo toma así, y de hecho la volatilidad fluctúa. En algunas variables económicas, y especialmente en el comportamiento de las tasas de rentabilidad de activos financieros, la volatilidad puede ser altamente variable. Los comerciantes de opciones que tienen un factor de sensibilidad significativo usan ARCH, GARCH y otros modelos para predecir el comportamiento futuro de volatilidades condicionales basados en el comportamiento de su volatilidad reciente. Mientras ARCH y GARCH han disfrutado de un éxito significativo en aplicaciones prácticas, una limitación de este modelo es que ellos son técnicas simples de extrapolación. No pueden anticipar los eventos reales que causan a los mercados al ser estables o volátiles.

III.4.2.1 Concepto Engle (1982), define la Autoregresión Condicional Heteroscedástica, como un término usado para describir la "concentración" de volatilidad. Explícitamente, reconoce la diferencia entre la varianza condicional y la incondicional permitiendo a la condicional cambiar a través del tiempo como una función de errores pasados, dejando la varianza incondicional constante. Además introduce una nueva clase de procesos estocásticos, donde asume que la variación de los errores está autocorrelacionada (esto es, cuando los términos de error correspondientes a períodos diferentes están correlacionados) y depende directamente de la magnitud de los errores pasados. Heteroscedasticidad es un término usado para la varianza de una variable a través del tiempo, esta situación se produce cuando la varianza del término de error es distinta de unas observaciones a otras, en este caso los elementos de la diagonal principal de la matriz de covarianzas no serán iguales entre sí. Engle sugiere analizando los modelos de inflación, que los errores de predicción, ya sean grandes o pequeños, parecen ocurrir en conjunto y hacen pensar en una estructura heteroscedástica, en que la variación de los errores es notablemente predecible. Debido a esto, ha sugerido el modelo Autoregresivo Condicional Heteroscedástico, o ARCH, como una alternativa para los procesos de series de tiempo usuales. En el artículo seminal de los modelos ARCH, Engle cita tres situaciones que motivan y justifican la modelización de la heterocedasticidad condicional Autorregresiva (nombre por él mismo dado). Estas serían las siguientes:

1. La experiencia empírica nos lleva a contrastar períodos de amplia varianza de error seguidos de otros de varianza más pequeña. Es decir, el valor de la dispersión del error respecto a su media cambia en el pasado, por lo que es lógico pensar que un modelo que atienda en la predicción a los valores de dicha varianza en el pasado servirá para realizar estimaciones más precisas.

Page 23: ESTADO DEL ARTE en Series de Tiempo

2. Engle expone la validez de estos modelos para determinar los criterios de mantenimiento

o venta de activos financieros. Los agentes económicos deciden esta cuestión en función de la información proveniente del pasado respecto al valor medio de su rentabilidad y la volatilidad que ésta ha tenido. Con los modelos ARCH se tendrían en cuenta estos dos condicionantes.

3. El modelo de regresión ARCH puede ser una aproximación a un sistema más complejo

en el que no hubiera factores innovacionales con heterocedasticidad condicional. Los modelos estructurales admiten, en multitud de ocasiones, una especificación tipo ARCH infinito que determina con parámetros cambiantes, lo que hace a este tipo de modelos capaces de contrastar la hipótesis de permanencia estructural que supone una de las hipótesis de partida y condición necesaria para la validez del modelo econométrico tradicional.

En definitiva, la clave de estos modelos está en considerar la información pasada de la variable y su volatilidad observada como factor altamente explicativo de su comportamiento presente y, por extensión lógica, de su futuro predecible. Estadísticamente, esta conclusión se refleja en tener en cuenta la esperanza condicional (conocida y fija la información hasta el momento inmediatamente anterior) del cuadrado de una variable (la expresión de su varianza si su media es nula). La limitación del concepto, es que si se quiere estimar la volatilidad como una función de volatilidad histórica, se deben incorporar tanto, la volatilidad histórica, como los errores de la previsión en su estimación.

III.4.2.2 Conceptos básicos para el desarrollo de los modelos ARCH Se define un proceso estocástico estacionario como aquella sucesión ordenada de variables aleatorias cuya función de distribución es invariante ante valores igualmente separados:

),,,...,,(),,,...,,(| 1111 mtmtmtmtmttttttt yyyyyFyyyyyFY

Como en la práctica es casi imposible conocer la verdadera función de distribución de muchas funciones. Esta definición (que se conoce con el nombre de "estacionariedad en sentido fuerte") se suele confirmar sólo para el primer y los segundos órdenes; es decir, para la media y la varianza del proceso. Según esta definición de "estacionariedad en sentido amplio o débil", un proceso estocástico sería estacionario cuando se cumplieran las tres condiciones siguientes:

1. E ( Yt ) = µ, ó media constante 2. Var ( Yt ) = E ( tY )2 = σ2 , varianza constante

3. Cov ( jtt YY ; ) = Cov ( jmtmt YY ; )

Como es conocido, el "ruido blanco" es un caso particular de este tipo de proceso en el que las tres condiciones se reescribirían del siguiente modo:

Page 24: ESTADO DEL ARTE en Series de Tiempo

1. E ( t ) = 0 2. Var ( t ) = E ( 0t )2 = σ2

e

3. Cov ( jtt ; ) = 0 Sobre esta definición clásica de estacionalidad, conviene hacer algunas puntualizaciones estadíticas relativas a las segundas derivadas del proceso que estamos manejando. Sobre esta definición clásica de estacionariedad, conviene hacer algunas puntualizaciones estadísticas relativas a las segundas derivadas del proceso que estamos manejando. El hecho de que no exista autocorrelación entre observaciones del ruido blanco desplazadas en el tiempo, no significa necesariamente que no haya dependencia entre estas de un modo no lineal. Lo único que aseguramos es precisamente eso: no podemos formular ningún tipo de dependencia lineal entre et y et-j; pero nada se dice al respecto de si puede haber una relación de dependencia cuadrática, exponencial o de cualquier otro tipo. La lógica de la dependencia entre el ritmo de evolución en períodos precedentes y el valor de variación del período actual nos lleva necesariamente a hablar de probabilidades condicionadas en términos de estadística teórica o inferencial. Es a partir de los momentos de primer y segundo orden en términos marginales (no condicionales) o condicionales como se pueden descubrir relaciones de causalidad entre series temporales que responden como un proceso estocástico estacionario para el contraste lineal. Puede existir un proceso definido a partir de un "ruido blanco", en el que la media y la varianza marginales sean constantes; y, al mismo tiempo, la media condicional puede ser constante y la varianza condicional no fija. En el siguiente proceso:

2/11

2 )( ttt ywy

- donde t es un proceso de ruido blanco (entre otras, no hay correlación con su pasado, luego tampoco la hay con el pasado de yt)

- el proceso generado yt es también estacionario - en los momentos condicionales, en t, el valor de t-1 es una realización concreta

conocida (no aleatoria) Podemos calcular los valores de su esperanza y su varianza, no olvidando que, en los valores condicionales, los valores de la endógena en t-1 son realizaciones ya conocidas del proceso aleatorio, por lo que su valor esperando es el valor ya observado (no son variable aleaoria): Marginal (incondicional) Condicional Esperanza

0(

)(2/12

1

2/121

2

tt

ttt

ywEE

ywEyE

012/12

11 ttttt EywyE

Page 25: ESTADO DEL ARTE en Series de Tiempo

Varianza

22

21

2

21

22

1

;)(

wyE

ywEywEyE

t

t

ttt

22

1

21

21

21

t

ttttt

yw

EywyE

Es importante resaltar que:

- la media (esperanza) es constante en ambos casos, e igual a cero. - La varianza marginal es constante; mientras que - La varianza condicional depende de los valores que haya tomado 2

1ty , luego no es fija

Se da la circunstancia de que, en este proceso, la función de autocovarianza es nula para todos los retardos que se quieran considerar; mientras que es distinta de cero para los valores al cuadrado del mismo proceso yt generado. La autocovarianza de yt para el retardo se podría calcular como:

0)(, 2/121

2/121 tttttttt yywEEyywEyyEY

dado que el proceso lo hemos definido como estacionario y el residuo como "ruido blanco"; es decir, con correlación nula con periodos precedentes, lo que implica también correlación nula con los valores de yt desplazados en el tiempo. La función de autocovarianza para la serie al cuadrado presenta valores distintos de cero, por lo menos para el retardo uno, como se puede comprobar con:

22

24

12

1

21

21

21

21

22222

)1(

11)(,cov

wyEyE

wywywEEyEyEyEyEyy

tt

tttttttt

De esta expresión, el único valor no calculado hasta el momento es el siguiente:

222

222

124

14 )(

)31()1()1(3)(

wywEyE ttt

Para este último cálculo se suponen dos cuestiones:

1. El ruido blanco se distribuye como una normal, por lo que podemos determinar el cuadrado de la varianza.

2. Además, yt es un proceso estocástico estacionario; es decir, el parámetro es menor

que la unidad y, con ello, nos aseguramos de que 3<1, y la expresión anterior es siempre calculable.

Page 26: ESTADO DEL ARTE en Series de Tiempo

Sin pérdida de generalidad, todo el proceso se puede realizar con la hipótesis de que la perturbación aleatoria tiene desviación típica igual a uno. Aplicando este resultado a la ecuación anterior y simplificando, podemos calcular la autocovarianza de orden uno del proceso yt al cuadrado como:

0)31()1(

2)1( 2

2

2

wY

Con lo cual, el proceso yt descrito, si bien no tiene autocorrelación en forma lineal, sí la tiene su forma cuadrática (el resultado de este último cálculo es siempre distinto de cero, luego hay correlación). La clave de los modelos que vamos a estudiar está en la distinción entre los momentos condicionales y marginales. Entre ellos existe una relación que se conoce con el nombre de ley de expectativas iteradas que, según Ruíz (1994), podría definirse como: "la esperanza de la observación yt, o de una función de ella, g(yt), condicional en información disponible en el momento t- puede calcularse tomando primero la esperanza condicional en información disponible en t-1, después calculando la esperanza condicional en t-2 y, así, sucesivamente hasta t- ", es decir:

)(...)( 11 tttttt ygEEEygE Para calcular la esperanza marginal, se puede dejar que tienda al infinito.

III.4.2.3 Especificación de un Modelo ACRH (q) Los modelos ARCH tienen su origen en un artículo de ENGLE (1982), en el que se pretendía obtener una predicción adecuada para la inflación en el Reino Unido, sujeta a fuerte volatilidad y con períodos de especial calma o de especial agitación. El modelo ARCH (q) viene definido por la siguiente expresión:

q

iitit

ttt

y

y

1

22

Donde se dan las siguientes restricciones:

t es un proceso idénticamente distribuido con media cero y desviación típica igual a uno.2. Los parámetros >0 y i0 e i=1...q, y, para cumplirse la condición de estacionariedad

en media, la suma de todos los parámetros es menor que la unidad. 3. Si t es gaussiano y se distribuye según una normal, yt es condicionalmente normal y su

varianza es 2t.

El proceso utilizado en la sección anterior como ejemplo era, por tanto, un ARCH(1). Para éste, ya se demostró que:

Page 27: ESTADO DEL ARTE en Series de Tiempo

- Las esperanzas marginal y condicional son iguales a 0 - La varianza es constante - La varianza condicional depende de los valores que haya tomado y2

t-1, luego no es fija

- La distribución marginal del proceso ARCH (1) tiene una forma desconocida. De cara a la predicción con modelos ARCH, habrá que calcular los intervalos de predicción correctamente, ya que la predicción puntual no vendrá afectada por este tipo de estructura. Con este fin, podemos obtener el error cuadrático medio de predicción para cualquier momento, por ejemplo t+2, con el siguiente procedimiento:

21

221

21321

22

211

12

112

221

22

2222

...)()()1(

)(...))(()()ˆ()ˆ(

qrqqrqrT

rTqrqr

TTTTTTTTT

yyyy

yEyyyEEyEyyEyECM

III.4.2.4 Especificaciones de un Modelo GARCH (p,q) GARCH es la abreviatura de Generalized Autorregresive Conditional Heterocedasticity y da nombre a la ampliación del modelo ARCH ya comentado que realizó Bollerslev (1986) para los órdenes p,q, y Taylor (1986), para el caso específico de los órdenes 1,1. El modelo ARCH (q) que antes se presentaba, puede mostrar ciertas dificultades de estimación cuando se aplica a estructuras dinámicas en los cuadrados de las series. Por ejemplo, en las series financieras, el número de retardos a utilizar es muy elevado y ello llevaría a un engorroso número de iteraciones para alcanzar una solución al sistema planteado, pudiendo darse el caso de no encontrar nunca una solución. Por ello, el mismo ENGLE propuso ya en 1983 ciertas restricciones a los parámetros del ARCH(1) que simplificaban su estimación; pero estas no eran capaces de recoger cualquier caso, por lo que la aportación de Bollerslev es decisiva a la hora de poder dotar de utilidad al modelo presentado por ENGLE. El modelo GARCH (p,q) se podría escribir como:

q

s

p

ssttstst

ttt

y

y

1 1

222

con lo cual el modelo ARCH (q) no sería más que un caso concreto de este (aquél en el que todos los parámetros t son iguales a cero. El modelo GARCH (1,1) tiene las siguientes características:

1. t es un idénticamente distribuido con media cero y desviación típica igual a uno. 2. Los parámetros >0 y i, i 0 e i=1...q, y j=1...p. Además, para cumplirse la condición

de estacionariedad en media, la suma de todos los parámetros es menor que la unidad.

3. La función de distribución marginal no es conocida, pero se pueden calcular los primeros momentos y definir el proceso respeto a su media y a su varianza.

Page 28: ESTADO DEL ARTE en Series de Tiempo

Para el proceso GARCH (1,1), dichos momentos serán: Marginal Condicional Esperanza

0(

)(2/1

122

1

2/11

221

2

ttt

tttt

ywEE

ywEyE

0

12/12

12

1

1

tttt

tt

Eyw

yE

Varianza

1

22 wEyE tt ttt yE 221

- donde t es un proceso de "ruido blanco" (entre otras, no hay correlación con su pasado, luego tampoco la hay con el pasado de yt).

- el proceso generado yt es también estacionario

- en los momentos condicionales, en "t", el valor de "t-1" es una realización

concreta conocida (no aleatoria) De cara a la predicción, Engle y Bollerslev derivaron la siguiente fórmula para el cálculo de la varianza condicional en información disponible en el período T:

1(1 2

41

2

TS

STTE

Baillie y Bollerslev (1992) derivan la siguiente expresión del error cuadrático medio:

41

1

)1(22

2, )()1( istT

s

i

isT EkvE

En esta expresión 222

, sTTsTsT Ev y k2 es el valor del coeficiente de curtosis

(el cumulante de orden 2 de la densidad condicional de t, que, si es una normal, sería tres)

III.4.2.5 Interpretación del proceso GARCH (p,q) Dado que este proceso es una forma generalizada que recoge, como caso concrteo, el ARCH (q), se intentará definir a continuación de una forma más sencilla lo que se pretende realizar con la especificación GARCH (p,q). En el modelo GARCH (1,1) hay dos ecuaciones:

- Una primera, donde se hace depender a la variable yt del valor de su varianza multiplicada por un cierto término aleatorio que es "ruido blanco"

- En la segunda, en torno a un valor medio, representado por el término constante w, se

hace depender el valor actual de la varianza en el período "t" de los valores que esta

Page 29: ESTADO DEL ARTE en Series de Tiempo

haya tenido en el momento anterior (t-1) y de la fluctuación aleatoria que también se daba en el pasado. En definitiva,podríamos definir los tres términos como:

Media w: valor de iniciación en torno al cual se producirán ciertas

variaciones. También puede entenderse como el valor medio a largo plazo sobre el que se genera la expectativa inmediata a ser modificada por los dos sumandos que después se detallan.

Sumando 1 t , innovación sobre la volatilidad que se produjo en el período anterior (término ARCH).

Sumando 1 t : predicción de la varianza en el último período histórico conocido (término GARCH).

El modelo ARCH (1), como simplificación del aquí presentado, sería un GARCH (0,1), donde no se tendría en cuenta la información de predicción sobre la última varianza de la endógena calculable; es decir, la varianza del período anterior. Matemáticamente, podríamos volver a escribir la especificación del modelo GARCH en dos formas distintas que nos permitirían dar un nuevo enfoque al desarrollo que estamos realizando:

1. En primer lugar, si hacemos una serie de sustituciones recursivas en la fórmula del modelo GARCH planteada, podríamos rescribir la varianza condicional como una media ponderada de todos los residuos al cuadrado del modelo de la siguiente forma:

212

22

22

21

2

22

22

21

21

21

2

11

........

jtj

t

tttt

ttt

ttt

yy

y

y

Con lo cual tendríamos que la varianza condicional es el resultado de un valor medio constante sumado a una media ponderada decreciente de los valores de la varianza muestral en los períodos precedentes.

2. Si presentamos el error en el valor esperado de la variable al cuadrado como tttv 22 , podríamos reescribir nuevamente el modelo GARCH(1,1) del siguiente

modo:

12

12 )( tttt vv

Según esta nueva formulación, con el modelo GARCH (1,1) estamos representando un proceso ARMA(1,1) heterocedástico para la serie de los errores al cuadrado. Algunos autores expresan que el proceso ARCH (q) no sería más que un proceso de medias móviles con parámetros cambiantes o variables (por ejemplo, Tsay (1987) o Bera (1992)).

Page 30: ESTADO DEL ARTE en Series de Tiempo

III.4.2.6 Variantes Sobre el modelo general Dado que en muchas ocasiones la suma de los parámetros a y b propuestos es muy próxima a uno, la estimación de los modelos GARCH (p,q) entrañan grandes dificultades. Engle y Bollerslev (1986)viii propusieron un modelo GARCH Integrado (IGARCH) con las siguiente especificación:

)( 21

21

21

2

tttt

ttt

y

y

en el que, obviamente, los parámetros suman uno ya que 1 en el modelo GARCH (1,1). Aunque este proceso es no estacionario (la varianza marginal es infinita), bajo normalidad condicional, yt es estrictamente estacionario y ergódico, como lo demuestra Nelson (1990). Ciertas disquisiciones sobre ello se pueden encontrar en Keibergen y Van Dijk (1993). El proceso muestra, como el resto, valores de predicción nulos, y un error cuadrático medio calculable a partir de la expresión de Engle y Bollerslev (1986) como:

22 )1( ttht yhyECM

Para que la predicción de la varianza tenga sentido, es fundamental que el valor de w sea estrictamente positivo. Con ello, las predicciones del ECM crecen linealmente en el horizonte de predicción. Existen tres problemas en los modelos GARCH:

1. Las restricciones de no negatividad de los parámetros son difíciles de lograr en muchas ocasiones.

2. Los modelos GARCH no permiten estimar convenientemente el efecto de

apalancamiento financiero que aparece en la realidad.

Existen distintas variables que se utilizan según a la aplicación que se le quiera dar, por ejemplo existen los modelos que incorporan el factor exponencial, modelos asimétricos en el caso bursátil. A continuación sale una serie de modelos derivados del GARCH.

Año Nombre Autor-es Especificaciones de la Varianza Aportación Principal 1982 ARCH Ingle 2

11 toth Primera especificación y desarrollo

1983 ARCH multivariado

Kraft y Engel

bxyHH

tt

ttt

12

2110

Incorporación de más variables explicativas y desarrollo de los modelos aplicando la matriz de varianza y convarianza(Ht)

1986 ARCH-M Engel, Lilieny Robins

211 toth Modelo Arch incorporando

la desviación tipica heterocedastica modelizada como explicativa

Page 31: ESTADO DEL ARTE en Series de Tiempo

1986 GARCH Bollerslev 12

211 ttot hh Método generalizado sin

restricciones para la estimación de los parámetros ARCH con infinitos retardos

1986 LGARCH Bollerslev y Taylor

211211 tttot hhh Linealización del modelo

GARCH-M 1986 MGARCH Geweke y

Pantula )ln()ln()ln( 12

211 ttot hh Especificaciones de la

varianza multiplicativa (linealizada con logaritmos)

1986 IGARCH Engel y Bollerslev 1

21 )1( ttt hh Persistencia en varianza

condicional heterocedástica.

1989 EGARCH Nelson

2

)log()log(

1

1

1

1

110

t

t

t

t

tt

hh

hh

Modelos ARCH para procesos no normales (funciones de densidad exponenciales) Respuesta asimétrica

1989 TS-GARCH Schwert || 2122110 tttt hhh Corrección de efectos

asimétricos en las variaciones al alza o la baja

1990 AGARCH NGARCH

Engel y Ng 2112110 )( chhh tttt Contraste y solución de

auto correlación entre la perturbación aleatoria y su varianza

1990 FACTOR ARCH

Engel, Ng y Rothschild

K

ktkkktH

1,

Empleo de la covarianza entre varias series temporales

1992 T-GARCH Gourieroux y Zakonian

211

2122110

),0max(

||

tt

tttt

h

hhh

Modelos dinámicos donde media y varinza condicionales son funciónes stepwise endógenas

1993 GJR-GARCH

Golsten

211

211211

),0max(

tt

tttot

h

hhh

Diferenciación del parámetro en subida y bajada

1993 V-GARCH Engel y Ng 2

1

1211

c

hhh

t

ttot

Similar al NGARCH, con una variación mayor en los parámetros asimétricos

1993 A-PARCH Ding

jt

q

jt

p

ststtt

h

h

1

10 )1(||

Se propone modelizar un valor potencial de la desviación típica que atiende al máximo de la función de autocorrelación del valor absoluto del proceso

Page 32: ESTADO DEL ARTE en Series de Tiempo

1994 ARCH de régimen cambiante

Hamilton y Susmel

0.10

~~

~

1

1

21

11

20

,

t

tt

t

q

jtjtjt

ts

tt

detocdsi

dh

g

Introducción de funciones de densidad que cambian de normal a t-studenta partir de cadenas de Markov

1997 VAR-GARCH

VARdeliablesnihbxh itiitiit

....var,...,2,1' ,1

2,1,

Empleo de una VAR con residuos con heterocedasticidad condicional

Tabla 3.1: Modelos ARCH

IV Aplicaciones

El empleo de series de tiempo, traspasa diferentes industrias y áreas. Es por esta razón que el objetivo de este capítulo será mostrar algunos ejemplos donde se han aplicado modelos de series de tiempo. Las áreas se centran en el análisis de demanda, esto se debe a que estos índices poseen un componente que es posible de analizar a través del tiempo, por lo que su estimación se va facilitada por un análisis de la serie de tiempo.

IV.1 Pronóstico de Demanda de Carga Esta aplicación fue desarrollada por Francisco Barros para optar al título de Ingeniero Civil Industrial de la Universidad Adolfo Ibáñez. El objeto de esta memoria fue estimar la demanda de transporte de carga aérea para el aeropuerto Arturo Merino Benítez (AMB), de modo de apoyar el sistema de toma de decisiones de una empresa concesionaria. Pudiéndose planificar el desarrollo que las instalaciones de transporte de carga deben tener en el mediano y largo plazo. Los modelos utilizados, fueron tres: Modelos de Descomposición Clásicos, Modelos de Suavizamiento Exponencial y la Metodología de Box-Jenkins. Según el Modelo de descomposición clásico, se estimó la componente adicional, se realizó un análisis de tendencia y la estimación de la variación cíclica. Luego para el caso de suavizamiento exponencial, dentro de este se aplicó el Modelo de Winters con tendencia lineal, con tendencia exponencial y con tendencia amortiguada. Para posteriormente utilizar la Metodología Box-Jenkins.

Page 33: ESTADO DEL ARTE en Series de Tiempo

Figura 4.1: Suavizamiento Exponencial para las salidas nacionales en el AMB.

Considerando el MAPE o error porcentual absoluto medio para el análisis de las salidas nacionales (adicionalmente se analizó las: llegadas nacionales, llegadas y salidas internacionales), los resultados fueron los siguientes considerando el período de análisis desde el año 1989 hasta 1999, y realizando una proyección para el año 2000. Suavizamiento Exponencial con tendencia

D. Clásica Líneal Exponencial Amortiguada Box-

Jenkins MAPE 7.1% 16.8% 18.9% 17.0% 17.1%

Tabla 4.1: Tabla de MAPE para las salidas nacionales en el AMB. La tabla x, muestra claramente que el método de Descomposición Clásica obtuvo un desempeño superior al resto de los modelos aplicados. Esta situación, es sólo válida para el caso analizado, y no se manifiesta en las demás demandas analizadas. Esto se debe a las características propias de la serie, las que debidamente analizadas se ajustarán con un menor error a un determinado modelo de Serie de Tiempo.

IV.2 Pronóstico de Demanda para Gas Licuado Esta aplicación fue desarrollada por Macarena López para optar al título de Ingeniero Civil Industrial de la Universidad Adolfo Ibáñez. El objetivo de esta memoria fue estimar la

Page 34: ESTADO DEL ARTE en Series de Tiempo

demanda total de gas licuado a nivel regional estratificado según el tipo de gas, ya sea envasado o granel, con un horizonte de tiempo de cinco años. La metodología empleada consistió en emplear la metodología Box-Jenkins, para la estimación de la demanda. Esta demanda se pronosticó para las regiones de Chile, tanto para el consumo de gas licuado como de gas a granel.

Consumo de gas licuado envasado, Reg Metrop

Mes

Ton

5000

10000

15000

20000

25000

30000

35000

40000

45000

50000

5000

10000

15000

20000

25000

30000

35000

40000

45000

50000

Ene-

87 Jul

Ene-

88 Jul

Ene-

89 Jul

Ene-

90 Jul

Ene-

91 Jul

Ene-

92 Jul

Ene-

93 Jul

Ene-

94 Jul

Ene-

95 Jul

Ene-

96 Jul

Ene-

97 Jul

Ene-

98 Jul

Ene-

99 Jul

Ene-

00 Jul

Figura 4.2: Consumo Gas Licuado en la R.Metropólitana 1987-2000.

En base a la función de autocorrelación simple y la función de autocorrelación parcial y el test estadístico de Box-Pierce. Se ajustó a un modelo Arima multiplicativo estacional (0,1,1) x (0,1,1)12. Los resultados del modelo se presentan en la siguiente figura:

Pronóstico del consumo de gas licuado envasado, RM

Mes

Ton

5000

10000

15000

20000

25000

30000

35000

40000

45000

50000

5000

10000

15000

20000

25000

30000

35000

40000

45000

50000

Ene

-87

Jul

Ene

-88

Jul

Ene

-89

Jul

Ene

-90

Jul

Ene

-91

Jul

Ene

-92

Jul

Ene

-93

Jul

Ene

-94

Jul

Ene

-95

Jul

Ene

-96

Jul

Ene

-97

Jul

Ene

-98

Jul

Ene

-99

Jul

Ene

-00

Jul

Ene

-01

Jul

Ene

-02

Jul

Ene

-03

Jul

Ene

-04

Jul

Ene

-05

Jul

Ene

-06

Jul

Figura 4.3: Pronóstico de Gas Licuado en la R.Metropolitana.

Page 35: ESTADO DEL ARTE en Series de Tiempo

El modelo ajustado por la metodología Box-Jenkins, observa un comportamiento que se ajusta al comportamiento histórico de la demanda de gas licuado. A través de este ajuste es posible elaborar un pronóstico para lo que será la demanda de años futuros.

IV.3 Análisis de demanda de lubricantes.

Esta aplicación fue desarrollada por Claudio Cortes, para optar al titulo de Ingeniero Civil Industrial de la Universidad Adolfo Ibáñez. El objeto de ésta, es obtener una modelo que logre pronosticar la demanda mensual futura de los lubricantes Movil, en el corto plazo, en sus distintas categorías, para apoyar la toma de decisiones que tiene que realizar la empresa en base a la cantidad de ingresos que percibirá, los cuales son funciones de las ventas, además de apoyar a la planificación de la producción.

Con este objetivo se estudiaron distintos modelos de pronóstico como métodos de

descomposición clásica, métodos ingenuos, suavización exponencial, modelos ARIMA, modelos ARMAX, teniendo los mejores resultados con estos dos últimos y particularmente con los modelos ARIMA.

Los datos que se tenían corresponden a las demandas mensuales que han tenido los

lubricantes Movil en sus 25 productos divididos en 8 categorías, trabajando a nivel agregado como grupo, durante los últimos 4 años, lo que se puede considerar que son escasos para obtener buenos resultados en general, pero en este trabajo se obtuvo pronósticos con bajo error finalmente para la cantidad de datos utilizados.

V ent a To t al

2500000

3000000

3500000

4000000

4500000

5000000

5500000

Ener o Febr er o Mar zo Abr i l Mayo Junio Jul io Agosto Septiembr e Octubr e Noviembr e Diciembr e

98

99

0

1

Figura 4.4: ventas mensuales del total de lubricantes Si vemos el caso de la demanda de Lubricantes automotriz podemos notar que el mejor

modelo encontrado dentro de todos los revisados es el modelo ARIMA (2,1,3)x(2,0,2)3

Page 36: ESTADO DEL ARTE en Series de Tiempo

métodos ingenuos

ARIMA (2,1,0)x(2,0,1)3 ARMAX

MPE 1,27% 0,10% Grupo Transmisión MAPE 9,75% 9,08% 9,14% coef. Correlación 0,8212 0,838 0,6787

Tabla 4.2 muestra los errores de los distintos métodos utilizados para pronosticar

En general los modelos ARIMAs se comportaron mejor que los otros modelos gracias a sus características específicas que le permiten poder obtener mejores pronósticos en base a una menor cantidad de datos. El MAPE promedio de los modelos ARIMA que se obtuvo fue de un 8,79%, siendo este bastante aceptable por la característica de los datos. Los modelos ARMAX tuvieron también un gran desempeño en los pronósticos en los que se pudo realizar, esto se debe porque además de basarse en los datos anteriores incorporan variables exógenas que permiten mayor exactitud.

IV.4 Pronóstico para la volatilidad de los ADR’s

Esta aplicación fue desarrollada por Mariana Minoletti, para optar al titulo de Ingeniero Civil Industrial, en la Universidad Adolfo Ibáñez. El objetivo de este proyecto será estimar el precio de las acciones emitidas como ADR y su volatilidad, mediante la clase de modelos Autoregressivos Condicional Hetereosedástico Generalizados (GARCH).

Lo que se hace aquí es realizar un estudio de los modelos GARCH, y explicar porque

estos son tan utilizados para los pronósticos de la concentración de la volatilidad. Este trabajo se enfoca en un aspecto de los modelos GARCH, el cual se nombrará como su habilidad de entregar un pronóstico de la volatilidad.

Figura 4.5: Muestra la serie de tiempo para el valor de Concha y Toro

Page 37: ESTADO DEL ARTE en Series de Tiempo

El estudio se realiza en base a datos históricos semanales de 13 ADR’s que se han tranzado durante mucho tiempo permitiendo que exista cierta estabilidad en ellos. La cantidad de datos que se tienen de cada uno depende de la fecha en que se lanzaron al mercado alcanzando alguno de estos a tener más de 7 años de datos históricos.

Los resultados que se obtuvieron en general no representan más de un tres % de error,

por lo que son potentes herramientas de predicción. En general la mayoría de los ADR’s estudiados tuvieron como modelo con menor error al GARCH (1,1).

V Conclusiones

En esta monografía se estudiaron los modelos más conocidos sobre Series de Tiempo, yendo desde los modelos más clásicos hasta modelos de data más reciente. Los modelos de pronósticos presentados difieren en precisión, complejidad, tanto como en el tipo y cantidad de datos que pueden manejar. Quien pronostique podrá seleccionar el que mejor se ajuste a los requerimientos de precisión a un apropiado costo. Sin embargo, la elección no es sencilla y obvia, ya que dependerá de factores como el tipo de patrones en los datos, el horizonte de tiempo, el costo de emplear un determinado método y el nivel de precisión. En ciertos casos, será más valioso tomar en consideración pronósticos producidos por diferentes métodos, para posteriormente elaborar el pronóstico definitivo ponderando cada uno. En las aplicaciones se pudo observar que los modelos analizados obtuvieron resultados razonablemente satisfactorios. Considerando la simplicidad de algunos de éstos, y lo relativamente sencillo que resulta su aprendizaje, estos modelos pueden ser usados en una amplia gama de pronósticos, ya sea de demanda, carga, desarrollo poblacional, análisis de recursos, etc.

En los últimos años, críticas considerables se han sentido con respecto a la incapacidad de pronosticar los eventos futuros y cambias. Más aun, los pronosticadores han sido censurados debido a grandes errores de pronóstico que han causado que la toma de decisiones y planificación no respondiesen adecuadamente. Esto es una concepción errónea de pronosticar, que usada correctamente, otorga una ventaja o un menor error y que finalmente puede ser usado para guiar el proceso de toma de decisiones.

Para terminar, cabe mencionar que la investigación en series de tiempo está activa,

agregándose herramientas que no fueron mencionadas en esta monografía, tales como el empleo de redes neuronales, que presentan la característica de reconocimientos de patrones, y que ya están siendo fuertemente utilizadas en algunas industrias.

VI Bibliografía

Box, G. Y Jenkins, G. (1976). Time series, forecasting and control.

Cryer, Jonathan D. (1986). Time series analysis. Duxbury Press, Boston.

Gardner, Everette S. Jr. (1985). Exponential smoothing: the state of the art. Journal of Forecasting, 4, 1-28. Www.interscience.wiley.com.

Page 38: ESTADO DEL ARTE en Series de Tiempo

Makridakis, Spyros, y Wheelwright, Steven (1978). Interactive forecasting. Segunda edición, Editorial Holden Day.

Peña, Daniel (1987). Modelos y métodos, Modelos y series temporales. Allende, Héctor. Apuntes de Econometría y series cronológicas.

Acevedo Garrido, Juan A. Modelo de proyección de demanda para una empresa de

distribución eléctrica, Viña del Mar, UAI 2000.

Barros, Francisco. Pronóstico de demanda de carga para el aeropuerto Arturo Merino

Benítez de Santiago, Viña del Mar, UAI, 2001.

Herl, Carlos V. Venegas, Raúl. La demanda por combustibles derivados del petróleo en

Chile, Santiago, PUC 1986.

López Villa, Macarena S., Modelo de Pronóstico de Demanda para una empresa

distribuidora de Gas Licuado, Viña del Mar, UAI 2002

Aravena, Francisco. Modelos para la estimación de la demanda de energía eléctrica,

Santiago, PUC 1984.

Fuenzalida, Darcy. Demanda de electricidad en Chile, Santiago, PUC,1983.