DEFINICION. Una serie de tiempo es un conjunto de datos numéricos
que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede ser: Hora, día, mes, trimestre, año o cualquier periodo que se pueda considerar de interés.
OBJETIVO.Identificar y aislar los factores de influencia con propósitos de hacer predicciones (pronósticos), y prevenir “brotes” o “epidemias”.
Material preparado por:
Profesor León Darío Bello Parias
Estudio Secretaría Distrital de Santa Fé de Bogotá año 2002[1] [1] Realizado por Grisales R, Hugo. Bello P, León Darío., Hincapié Doraceli.
Con el análisis de series temporales se pretende extraer
el patrón de comportamiento sistemático contenido en
una sucesión de observaciones que se recoge de forma
regular y homogénea a lo largo del tiempo. Con este
patrón es posible: a) caracterizar el comportamiento del
fenómeno estudiado; b) predecir su evolución futura; y c)
extraer componentes no observables (señales) que
reflejan más fielmente la evolución subyacente de la
variable de interés. Preparado por: León Dario Bello
Número de Casos Acumulados de Tosferina Periodo 13 (Antioquia 1994-2001)
0
100
200
300
400
500
600
1994 1995 1996 1997 1998 1999 2000 2001
Año
Nº
Cas
os
Tasas Acumulada por 100.000 habitantes de Tosferina Perioido 13 (Antioquia 1994-2001)
0.0
2.0
4.0
6.0
8.0
10.0
12.0
1994 1995 1996 1997 1998 1999 2000 2001
Años
Tasa
s * 1
00.0
00
http://www.col.ops-oms.org/iah/lisnalsds.htm
Número de Casos Acumulados de Rubeola Periodo 13 (Antioquia 1994-2001)
0
1000
2000
3000
4000
5000
6000
1994 1995 1996 1997 1998 1999 2000 2001
Años
Nº
Cas
os
Tasas Acumuladas por 100.000 habitantes de Rubeola Periodo 13 (Antioquia 1994-2001)
0.0
20.0
40.0
60.0
80.0
100.0
120.0
1994 1995 1996 1997 1998 1999 2000 2001
Años
Tasa
s *
100.
000
Número de Casos Acumulados de HIV/Sida Periodo 13 (Antioquia 1992-2001)
0
100
200
300
400
500
600
700
800
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Tasas Acumuladas por 100.000 habitantes de VIH/Sida Periodo 13 (Antioquia 1992-2001)
0.0
2.0
4.0
6.0
8.0
10.0
12.0
14.0
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
AñosTa
sas
* 10
0.00
0
FUENTE: SIS 12 , REGISTROS DE PROGRAMA, Y SIVIGILA * CERTIFICADOS DE DEFUNCIÓN DANE( SISTEMAS)http://www.dssa.gov.co/infecc/infecciosas.htm
Consideraciones Previas
Consistencia: Mecanismos de notificación, los cuales pueden cambiar la forma de captura de la información.
Comparabilidad: cambios que se originan a través del tiempo.
Preparado por: León Dario Bello
COMPONENTES DE UNA SERIE Tendencia: Movimientos percistentes
ascendentes o descendentes a través del tiempo. Variaciones estacionales. Fluctuaciones
periódicas en periodos de tiempo cuya frecuencia es menor a un año, aproximadamente en las mismas fechas y casi con la misma intensidad.
Movimientos o variaciones cíclicas.
Los movimientos se consideran cíclicos, solo si se producen en un intervalo de tiempo superior al año.
Movimientos irregulares o al azar. movimientos esporádicos o de corto plazo.Material preparado por:
Profesor León Darío Bello Parias
PASOS EN EL ANALISIS CLASICO DE UNA SERIE DE TIEMPO.
1. DETERMINAR SI LA SECUENCIA DE DATOS
FORMAN UNA SERIE NO ALEATORIA.2. ANALISIS EXPLORATORIO DE DATOS. 3.SUAVIZAR LA SERIE para identificar el
comportamiento subyacente de la misma.4. DESCOMPONER LA SERIE en sus respectivas
componentes.5. AJUSTE DE MODELOS MATEMATICOS.6. ANALISIS DE RESIDUALES7. REALIZAR ESTIMACIONES Y PRONOSTICOS.8. VALIDAR EL MODELO Material preparado por:
Profesor León Darío Bello Parias
Desarrollo de los Pasos
1. Realmente es una serie no aleatoria: Rachas
2. Análisis exploratorio de datos: -Gráfico de secuencias. Gráfico de Caja y Sesgo. - Cálculo de estadísticas descriptivas.3. Identificación de las componentes de la serie:
YEAR, not periodic
1999
1998
1998
1997
1996
1996
1995
1994
1994
1993
1992
1992
1991
1990
1990
1989
1988
1988
Nú
me
ro
d
e C
aso
s
140
120
100
80
60
40
20
Serie IRA la cual contiene número de casos reportados en Santa Fé de Bogotá desde enero de 1988 hasta diciembre de 1999
Preparado por: León Dario Bello
Desarrollo de los Pasos
4. Descomponer la serie.
Preparado por: León Dario Bello
Prueba de homogeneidad de varianzas
Número de Casos
1.009 11 132 .442
Estadísticode Levene gl1 gl2 Sig.
ANOVA
Número de Casos
11507.243 11 1046.113 5.408 .000
25532.083 132 193.425
37039.326 143
Inter-grupos
Intra-grupos
Total
Suma decuadrados gl
Mediacuadrática F Sig.
Prueba de homogeneidad de varianzas
Número de Casos
1.242 11 132 .266
Estadísticode Levene gl1 gl2 Sig.
ANOVA
Número de Casos
8462.910 11 769.355 3.554 .000
28576.417 132 216.488
37039.326 143
Inter-grupos
Intra-grupos
Total
Suma decuadrados gl
Mediacuadrática F Sig.
Diferencia de Medias por año. Diferencia de Medias por mes.Hay Tendencia Hay Estacionalidad
MONTH, period 12
121110987654321
Me
dia
de
Nú
me
ro d
e C
aso
s
100
90
80
70
60
50
YEAR, not periodic
199919981997199619951994199319921991199019891988
Me
dia
de
Nú
me
ro d
e C
aso
s
100
90
80
70
60
Desarrollo de los Pasos
Modelo de Winter, se realizó el análisis de residuos.Prueba de rachas
-.3225664
72
72
144
62
-1.840
.066
Valor de pruebaa
Casos < Valor de prueba
Casos >= Valor deprueba
Casos en total
Número de rachas
Z
Sig. asintót. (bilateral)
Error forCASOS fromEXSMOOTH,MOD_6 WI A.20 G .00 D
.00
Medianaa.
Prueba de Kolmogorov-Smirnov para una muestra
144
-.1041087
11.7830248
.035
.035
-.033
.425
.994
N
Media
Desviación típica
Parámetros normales a,b
Absoluta
Positiva
Negativa
Diferencias másextremas
Z de Kolmogorov-Smirnov
Sig. asintót. (bilateral)
Error forCASOS fromEXSMOOTH,MOD_6 WI A.20 G .00 D
.00
La distribución de contraste es la Normal.a.
Se han calculado a partir de los datos.b.
YEAR, not periodic
140
120
100
80
60
40
20
Número de Casos
Fit for CASOS from E
XSMOOTH, MOD_6 WI A
Preparado por: León Dario Bello
Gráfico de Pronosticos
YEAR, not periodic
2000
2000
1999
1998
1998
1997
1996
1996
1995
1994
1994
1993
1992
1992
1991
1990
1990
1989
1988
1988
140
120
100
80
60
40
20
Número de Casos
Fit for CASOS from A
RIMA, MOD_16 NOCON
El conocimiento del área específica será de gran ayuda para seleccionar modelo adecuado. el participante puede comparando los errores absolutos de otros modelos y realizando las pruebas de residuales, encontrar otros modelos validos.
Preparado por: León Dario Bello
Fecha
JUN 1999
JUL 1998
AUG 1997
SEP 1996
OCT 1995
NOV 1994
DEC 1993
JAN 1993
FEB 1992
MAR 1991
APR 1990
MAY 1989
JUN 1988
JUL 1987
AUG 1986
SEP 1985
OCT 1984
NOV 1983
DEC 1982
JAN 1982
120
100
80
60
40
20
0
HOMBRE
LINT(HOMBRE)
Fecha
140
120
100
80
60
40
20
0
HOMBRE
MUJER
TOTAL
MORTALIDAD POR ACCIDENTE EN BOGOTÁ ENERO 1995 – OCTUBRE
1999
Estimar valores perdidos.Identificar componentes de la serieNo existencia de tendencia ni estacionalidad, ajustar suavización simpleExiste tendencia sin estacionalidad, ajustar HoltExiste tendencia y estacionalidad, ajustar WinterAjustar modelos mínimo cuadrátricos y comparar SCEValidar supuestos de los residualesCalcular los pronósticos.
Preparado por: León Dario Bello
MODELOS AUTORREGRESIVOS Y DE PROMEDIOS MOVILES
Box y Jenkins Conceptos básicos
Proceso estocástico: llamamos proceso estocástico a una sucesión de variables aleatorias {Yt} donde t= -.....-1, 0 , 1, 2 , .......
Estacionariedad:Puede ser estacionario en medias y/o en varianzas (no cambios)
Ruido Blando (White noice):se llama ruido blanco a una sucesión de variables aleatorias con esperanza cero, igual varianza e independientes en el tiempo
Paseo aleatorio: llamamos paseo aleatorio a un proceso estocástico {Yt} cuyas primeras diferencias forman un proceso ruido blanco
Preparado por: León Dario Bello
MODELOS AUTORREGRESIVOS Y DE PROMEDIOS MOVILES
Estacionariedad en medias hace referencia a que no tenga tendencia, estacionariedad en varianzas a que se tenga varianzas iguales, supuestos que se validaron anteriormente funciones de Autocorrelación y Autocorrelación Parcial son claves para éste análisis.
Número de Casos
Nº de retardos
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
AC
F
1.0
.5
0.0
-.5
-1.0
Límites confidencial
es
Coeficiente
Número de Casos
Nº de retardos
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
AC
F p
arci
al
1.0
.5
0.0
-.5
-1.0
Límites confidencial
es
Coeficiente
Preparado por: León Dario Bello
MODELOS AUTORREGRESIVOS Y DE PROMEDIOS MOVILES
Se utilizan cuando en algunos puntos de la serie estos están relacionados con otros que le anteceden y que les siguen.
Son aquellos que reúnen en una sola expresión las componentes autoregresiva y de media móvil de la serie de tiempo, si la tienen. La componente Autoregresiva se encarga de determinar cada observación como una combinación lineal de las observaciones anteriores; la componente de Media Móvil incluye una parte aleatoria
Preparado por: León Dario Bello
Los modelos deben ser construidos sobre una serie Xt estacionaria con respecto a la media, varianza y autocorrelaciones. Si la serie Xt no es estacionaria con respecto a la media, para volverla estacionaria hay que aplicar una diferenciación de orden d: d Xt; si no lo es con respecto a las autocorrelaciones deben emplearse una diferenciación de orden D; si no lo es con respecto a la varianza debe utilizarse la transformación de Box-Cox.
DESCRIPCIÓN DE LOS MODELOSDESCRIPCIÓN DE LOS MODELOS
Preparado por: León Dario Bello
Metodología ARIMA
Número de Casos
Nº de retardos
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
AC
F
1.0
.5
0.0
-.5
-1.0
Límites confidencial
es
Coeficiente
Número de Casos
Nº de retardos
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
AC
F p
arc
ial
1.0
.5
0.0
-.5
-1.0
Límites confidencial
es
Coeficiente
Estacionariedad en medias hace referencia a que no tenga tendencia, estacionariedad en varianzas a que se tenga varianzas iguales, supuestos que se validaron anteriormente.
Preparado por: León Dario Bello
El modelo corrido con el SPSS fue el ARIMA (1,1,0)(1,1,0)12
Metodología ARIMA
Número de Casos
Nº de retardos
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
AC
F
1.0
.5
0.0
-.5
-1.0
Límites confidencial
es
Coeficiente
Número de Casos
Nº de retardos
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
AC
F p
arc
ial
1.0
.5
0.0
-.5
-1.0
Límites confidencial
es
Coeficiente
Estacionariedad en medias hace referencia a que no tenga tendencia, estacionariedad en varianzas a que se tenga varianzas iguales, supuestos que se validaron anteriormente.
Preparado por: León Dario Bello
El modelo corrido con el SPSS fue el ARIMA (1,1,0)(1,1,0)12