Upload
marita-tabares
View
223
Download
5
Embed Size (px)
Citation preview
UNIVERSIDADSIMON BOLIVAR
Análisis de series de tiempo
Cuarta semana
Abril Julio 2009
UNIVERSIDADSIMON BOLIVAR
Modelos ARMA
• Son combinaciones de lo anterior; para un proceso estacionario con media cero
0
0
)()(
q
p
tt wBxB
)1( 1
11111
p
qtqtttptt wwwxxx
distinta de cero
UNIVERSIDADSIMON BOLIVAR
Identificación de modelos
UNIVERSIDADSIMON BOLIVAR
Trabajo con series en R
• Serie “recruit” (ejemplo 3.16)• Serie en www.cesma.usb.ve/~llatas/Series/eggs.dat
UNIVERSIDADSIMON BOLIVAR
ARIMA y SARIMA
• Series integradas: – Se llaman asi por qué son las derivadas las que se comportan como
serie estacionaria
– No trabajar con la serie original sino con la serie de los incrementos de algún orden:
– Ejemplo con la serie de glacial (varve.dat) (ir a R)
11 ln)ln()ln()ln(
t
tttt x
xxxx
UNIVERSIDADSIMON BOLIVAR
ARIMA y SARIMA
• SARIMA– Season = (estación)
Primero se aplican los operadores diferenciales, y luego se busca un modelo para la parte “estacionaria”
tt
tqs
QtdD
ss
P
wBBxBB
wBBxBB
)1)(1()1)(1(
(0,1,1)1)ARIMA(0,1,
)()()()(
12
12
ts
Qts
P wBxB )()(
UNIVERSIDADSIMON BOLIVAR
Predicción (Conceptos Básicos)
• Se busca pronosticar los valores de la serie {xt} (ojo, puede ser multivariada) para los tiempos T+1, ..., T+H conociendo la historia del proceso hasta el tiempo T.
• H es el horizonte de predicción
es el pronóstico.
• Teorema: La esperanza condicional de xT+h dado el pasado es un estimador insesgado de xT+h , y no hay otro predictor que condicional en el pasado tenga variancia mas pequeña. Esta variancia es el MSFE (mean-square forecast error)
• Obsérvese que el MSFE es UN criterio para escoger un pronóstico, no es el único!.
) hastan Informació(~ Tfx HHT
UNIVERSIDADSIMON BOLIVAR
Predicción (Conceptos Básicos)
• No predecible: Si la distribución condicional de xT+h dado el pasado es igual a la distribución no condicional.
• No informativo: “concepto difuso, pues depende del contexto”• Limite de Pronosticabilidad:
esto es, cuando la variancia del pronostico es mayor a un porcentaje de la variancia incondicional
)()1()|( HTTHT xVxV
UNIVERSIDADSIMON BOLIVAR
Predicción
• Estamos usando filtros lineales, asi que parace natural buscar la predicción basada en combinaciones lineales
• Caso AR es facil: ARMA no tanto!
1;
),,|(
predicción deia la variancMinimizar
00
1
xxx
xxxExn
kkk
nmn
nmnn
mn
UNIVERSIDADSIMON BOLIVAR
Error de predicción
m
jjwmnmn
nmn
mjjmnjmn
xxEP
wx
0
222)~(
~
En R se puede usar la función genérica “predict” para hacer las prediccionesy los errores de predicción
Predicción a largo plazo: va a la media ! con error constante
Ver ejemplo del GNP en R
UNIVERSIDADSIMON BOLIVAR
Estimación
• Suposición:– El proceso es ARMA(p,q) gaussiano
• Métodos fáciles, modelos fáciles:– Método de los momentos para AR (Ecuaciones de Yule –
Walker)
2212
12
1
);,0()(
)()1()0(
,,2,1);()1()(
wwpw
d
pp
pw
p
Nn
p
phphhh
UNIVERSIDADSIMON BOLIVAR
Estimación
• Máxima verosimilitud
• Para modelos ARMA general
)|()|()(),,(
)(
11212
1
nnw
ttt
xxfxxfxfL
wxx
n
tttw xxxfL
111
2 ),|(),,(
UNIVERSIDADSIMON BOLIVAR
Estimación
• Optimización numérica– Newton Raphson
Hessianamatrix la es score, de vector el llamado es ,
derivadas
segundas de matriz la es y gradiente el denota donde
)()(
)2()1(
)2()1(
)0()1(1
)0()2(
)0()1(
ll
ll
ll
UNIVERSIDADSIMON BOLIVAR
Análisis de series de tiempo
Sexta semana
Abril Julio 2009
UNIVERSIDADSIMON BOLIVAR
Análisis espectral
Time
c
0 100 200 300 400 500
-20
12
Time
c +
w
0 100 200 300 400 500
-40
24
Time
c +
5 *
w
0 100 200 300 400 500
-10
010
• Las series presentan ‘regularidades’ que pueden interpretarse como solapamiento de ‘ondas’ periodicas.
• La idea del análisis espectral es transformar la serie al dominio de la frecuencia
• Ciclo: Un período completo de una onda sinusoidal
• Ciclos por observación es la convención que usa el libro
UNIVERSIDADSIMON BOLIVAR
Análisis espectral
)2sin()2cos( 21 tUtUx kkkkt
• Suponiendo las variables independientes
)2cos()(
1.9 Ejercicio
)2sin()2cos(
)2cos(
2
21
hh
tUtU
tAxt
Ui ~ N(0,) A2 ~ 2
medida en ciclos por unidad de tiempo o en ciclos por punto temporal en el caso discreto.
o Para series medidas en tiempos discretosse requiere de al menos dos puntos para obtener un ciclo, por lo que la frecuencia
másalta será 0.5 ciclos por punto.
q
kk
kk hh
1
2
2
)0(
)2cos()(
UNIVERSIDADSIMON BOLIVAR
Superposición de sinusoidales con diferente frecuencias. ... agréguese ruido ...
freq=6/100, amp^2=13
Time
x1
0 20 40 60 80 100
-15
-55
15
freq=10/100, amp^2=41
Time
x2
0 20 40 60 80 100
-15
-55
15
freq=40/100, amp^2=85
Time
x3
0 20 40 60 80 100
-15
-55
15
sum
Time
x
0 20 40 60 80 100
-15
-55
15
UNIVERSIDADSIMON BOLIVAR
Periodograma
)/(ˆ)/(ˆ)/(
Energia""
)/2sin(2
)/(ˆ
)/2cos(2
)/(ˆ
donde
)/2sin()/(ˆ)/2cos()/(ˆ
22
21
12
11
2
2/
01
njnjnjP
ntjxn
nj
ntjxn
nj
ntjnjntjnjx
n
tt
n
tt
n
jt
Regresión de x sobre todas las sinusoidales con ciclos por punto, menores que 0.5
El periodograma puede ser visto como una medida de la correlación de los datos con sinusoidales oscilando a frecuencias j/n.
UNIVERSIDADSIMON BOLIVAR
Señal vs Señal y ruido
0.0 0.1 0.2 0.3 0.4 0.5
020
4060
80
frequency
perio
dogr
am
0.0 0.1 0.2 0.3 0.4 0.50
2040
6080
frequency
perio
dogr
am
UNIVERSIDADSIMON BOLIVAR
Densidad espectral
)2sin()2cos(
)2cos(
21 tUtU
tAxt
0
02
0
20
2/1
2/1
2
22
02
2
0
)(
)(
)(2
)2cos()(
0
U
U
hi
hiU
U
F
dFe
e
hh
Para cualquier proceso estacionariose tiene una representación de lafunción de autocovariancia
2/1
2/1
2 )()( dFeh hi
F Función de distribución espectral
UNIVERSIDADSIMON BOLIVAR
Densidad espectral
hi
hi
ehf
dfeh
f
h
2
2/1
2/1
2
)()(
:aún Más
)()(
función una existe
sumable nteabsolutame es )( general
términode serie la Si
f se le llama densidad espectral ; Ojo: Ver variancia del proceso como la integral de la densidad espectral sobre todas las frecuencias
UNIVERSIDADSIMON BOLIVAR
Ejemplos
• Ruido blanco– Potencia uniforme sobre todas las frecuencias
• Promedio móvil de ruido
• ARMA
UNIVERSIDADSIMON BOLIVAR
Funcion generadora de la autocovariancia
• Para un ARMA
)2()(
)1()()(
)(
2
1
2
)(
)(
ief
BBB
B
w
h
hjj
jw
Bh
h
UNIVERSIDADSIMON BOLIVAR
Estimación del periodograma
• Periodograma y la transformada de Fourier discreta
22
:
2
1
22/1
)()(2
con
)()()(
/;)(
ónDistribuci
j
nj
j
jj
j
n
t
titj
fI
fdI
njexnd j
En R esta implementada la función spec.pgram
El periodograma crudo noes un estimador consistente
Usualmente se suaviza (se promedia sobre valores adyacentes) y en ese caso ladistribucion asintótica eschi-cuadrado con más gradosde libertad...(menos incertidumbre)
UNIVERSIDADSIMON BOLIVAR
Suavización del periodograma
• La idea es que el estimador de la densidad espectral definido con el periodograma I (j), j j/n no es consistente, pero podemos considerar el promedio de los valores en frecuencias adjacentes.
• Se define una banda de frecuencias de tamaño L=2m+1 escogida de manera que los valores del espectro
f(j+k/n), k=-m,-m+1, . . . , 0, . . . ,m-1,m
sean aproximadamente iguales a f().
• Para n grande22)(
)(2L
d
f
fL
UNIVERSIDADSIMON BOLIVAR
Suavización del periodograma
• Ancho de banda es igual a L/n
• Intervalo de confianza para el valor de la densidad espectral
• Si se toma un ancho de banda muy grande se corre el riesgo de achatar picos importantes, pero con un ancho de banda muy pequeño los intervalos de confianza son tan grandes que los picos no parecen estadísticamente significativos
)2/(
)(2)(
)2/1(
)(222
22
LL
fLf
fL