16
Departament Facultad de C Universidad d Estimación de un mod CI6110 – Análi to de Ingeniería Civil Ciencias Físicas y Matemáticas de Chile delo ARIMA en la cuenca del estero en Boquerón isis Hidrológico y Evaluación de Recursos Hídricos Alumno: Feli Profesores: Jam Xim Auxiliar: Yu Fecha: 03 o Puangue ipe Uribe mes Mc Phee. mena Vargas uri Castillo /06/2014

modelo arima

Embed Size (px)

DESCRIPTION

modelo arima cuenca del maipo

Citation preview

Departamento de Ingeniera CivilFacultad de Ciencias Fsicas y MatemticasUniversidad de ChileEstimacin de un modelo ARIMA CI6110 Anlisis Hidrolgico y Evaluacin de Recursos Hdricos

Departamento de Ingeniera CivilFacultad de Ciencias Fsicas y MatemticasUniversidad de Chileodelo ARIMA en la cuenca del estero Puangueen BoquernAnlisis Hidrolgico y Evaluacin de Recursos HdricosAlumno: Felipe Uribe Profesores: James Mc Phee Ximena VargasAuxiliar:Yuri Castillo Fecha:03/06cuenca del estero PuangueFelipe Uribees: James Mc Phee.Ximena VargasYuri Castillo03/06/20142Contenido1- Introduccin................................................................................................................................ 32- Objetivos ..................................................................................................................................... 42.1- Objetivo General ...................................................................................................................... 42.2- Objetivos Especficos................................................................................................................ 43- Metodologa................................................................................................................................ 54- Resultados................................................................................................................................... 64.1- Caracterizacin de la cuenca.................................................................................................... 64.2- Identificacin de perodos Pluvial y Nival ................................................................................ 74.3- Normalizacin .......................................................................................................................... 84.4.- Estandarizacin....................................................................................................................... 94.5. Intercalacin............................................................................................................................. 94.6- Estacionalidad........................................................................................................................ 104.7- Identificacin de los posibles modelos ARIMA...................................................................... 114.8- Generacin de los posibles modelos ARIMA ......................................................................... 124.9- Seleccin del modelo ARIMA................................................................................................. 134.10- Generacin de 30 series sintticas ...................................................................................... 144.11- Curvas de duracin .............................................................................................................. 145- Conclusiones.............................................................................................................................. 156- Anexos....................................................................................................................................... 1631- IntroduccinHacemsde50aos,losmodelosauto-regressiveintegratedmovingaverage(ARIMA)sehan utilizado para pronosticar variables, ya sea en economa, hidrologa u otras disciplinas. El supuesto detrs de esto es que la variable de pronstico est ligada mediante una funcin lineal con varias observacionespasadasyerroresaleatorios.Estoimplicanecesariamentequeelproceso subyacente que genera la serie de tiempo con media tiene la formaDonde ytes la variable de pronstico, atson los errores aleatorios correspondientes al instante t.Los polinomios anteriores corresponden a los parmetros del modelo, y tienen orden p y q respectivamente. Finalmentees el operador de retroceso, Los errores aleatorios tienen el supuesto que distribuyen con media 0 y varianza 2. 42- Objetivos2.1- Objetivo General - Estimar el modelo ARIMA ms adecuado para representar la serie de caudales estacionalesde los ltimos 32 aos de Puangue en Boquern.2.2- Objetivos Especficos- Caracterizar la cuenca en estudio- Identificar la estacin fluviomtrica representativa de la zona con informacin mensual- Generar 30 series alternativas que mantengan sus estadsticos constantes- Determinar las curvas de duracin de las series y obtener el promedio asociado al 85% de caudal53- MetodologaA) Rellenar los datos restantes de Puangue en Boquern, con la estacin vecina Colliguay como parmetro.B) Sacar por separado los caudales promedios pluvial y nivalC) Verificar si cumplen la prueba de normalidad, en caso de que no cumplan se aplicar el cambio de variable Zt=ln(Q) y se verificar normalidad nuevamenteD) Se chequear estacionalidad, verificando que los estadsticos de 2 rangos pluviales y 2 rangos nivales sean iguales entre si.E) Intercalar los datos pluviales y nivalesF) Verificar si tienen tendencia con el test de Mann-Kendall, en caso de que la respuesta sea afirmativa, se le sacar la tendencia.G) Con los datos sin tendencia, se aplicar un test de anlisis descriptivo para ver cmo andan los grficos de autocorrelograma y autocorrelograma parcialH) Se elegir posibles modelos ARIMA.I) Se le harn test de normalidad a los residuos, junto con el criterio de Parsimonia e ndice de AIC en caso de determinar cual modelo es mejorJ) Se generarn 30 series a partir de un modelo ARIMA genrico, con errores aleatorios que distribuyen con media 0 y desviacin estndar 1K) Se agregar tendencia a los datos en caso de que existiera, y se aplicar exponencial a estos datos en caso de que no hayan sido normales en la parte c)L) Finalmente se construirn las curvas de duracin mediante Weibull, identificando los caudales con 85% de excedencia.64- Resultados4.1- Caracterizacin de la cuencaPuangueenBoquernesunacuencaqueselocalizaalnortedeCuracav,enlasextareginde Valparaso.Engeneralesunacuencabastantepequeacontansolo142 km2,yunapendiente mediade0.412m/m.Dadolopequeaqueeslacuenca,estsometidaacambiosbruscosde escorrentaenelperiodopluvial,yaquetienepocopoderderegulacin.Sucotadedesagees aproximadamente 500 m.s.n.m, y su cota mxima es aproximadamente 2000 m.s.n.m.EstacuencacaracterizaalsectoraltodelesteroPuangue,elcualterminaenlacomunade Melipilla.Figura 1. Puangue en Boquern en WMS74.2- Identificacin de perodos Pluvial y NivalLosdatos de Puangue en Boquern tenan en su minora datos faltantes, los cuales serellenaron con la ayuda de la estacin cercana Colliguay. El perodo de estudio se sita entre los aos 1981 y 2012. Una vez rellenada la informacin restante, se promedi cada mes y se obtuvo la figura 2.Figura 2. Variacin mensual promedio de caudales en Puangue en BoquernFinalmente, se escogi grficamente como perodo Pluvial entre Abril y Septiembre, mientras que el perodo nival corresponde entre Octubre y Marzo.0.000.501.001.502.002.503.000 2 4 6 8 10 12 14Caudal [l/s]Nmero del mesPuangue en BoquernPuangue en Boquern84.3- NormalizacinAlobtenerlas2seriesdetiempopromedionivalypluvial,sehizounapruebadenormalidad a cada una en XLSTAT, la cual arroj que ninguna serie era normal ya que los p-values en los 4 test obtuvieron valores menores al 0.001, lo que implica rechazar la hiptesis de normalidad.Paranormalizarlasseries,setomlogaritmonaturalacadaunadeesasseriesyselesaplic nuevamente el test. Esta vez ambas sacaron valores mayores al 0.05 en todos sus p-values, lo que provoca que las series fueron transformadas a normal. A continuacin se muestran los p-valor con sus respectivas pruebas, tanto para rgimen pluvial y nival.Prueba p-valorShapiro- Wilk 0.946Anderson Darling 0.894Lilliefors 0.715Jarque-Bara 0.724Tabla 1. Prueba de normalidad para rgimen pluvialPrueba p-valorShapiro- Wilk 0.646Anderson Darling 0.841Lilliefors 0.921Jarque-Bara 0.654Tabla 2. Pruebas de normalidad para rgimen nival94.4.- EstandarizacinLa estandarizacin consiste en pasar cada serie de los regmenes por separado a otros trminos, representados por la siguiente ecuacin:4.5.IntercalacinUna vez estandarizadas las 2 series por separado, se intercalaron para formar una sola serie. Luegose aplic el test de Mann-Kendall en XLSTAT, obteniendo que matemticamente hay una tendencia, tal como se muestra en la figura 3.Figura 3. Serie intercalada con tendenciaPara remover esta tendencia, a cada ytse le rest la ecuacin presentada en la figura 3, quedando la muestra sin tendencia como se muestra en la figura 4.y = -0.0096x + 0.3133-2.5-2-1.5-1-0.500.511.522.50 20 40 60 80Con tendenciaSeries1Linear (Series1)Linear (Series1)10Figura 4. Serie intercalada sin tendenciaAl graficar la media mvil en la figura 4, se puede inferir que la serie no es cclica.4.6- EstacionalidadLa serie sin tendencia se dividi en 2 partes iguales, que son los primeros 32 trminos y los ltimos 32trminos.Acadaunose lesaclamediayladesviacinestndar,obtenindosequeson estadsticamenteiguales(andandelmismoorden).Porsupuestosilaserietuvieramsdatos, entonces la convergencia a que los estadsticos sean iguales es mayor.Media 32prim Media 32ult Desv 32prim Desv 32ult-0.186 0.145 0.939 0.998Tabla 3. Estadsticos de la serie sin tendencia-3-2.5-2-1.5-1-0.500.511.522.50 20 40 60 80Sin tendenciaSeries1Linear (Series1)5 per. Mov. Avg. (Series1)114.7- Identificacin de los posibles modelos ARIMASegn la figura 5, al no decrecer y truncar en uno, el posible modelo es MA(1).Figura 5. AutocorrelogramaPara la autocorrelacin parcial es prcticamente el mismo caso, no decrece pero trunca en uno, por lo que el posible modelo es un AR(1).Figura 6. Autocorrelograma parcialFinalmente, se propone un modelo ARIMA(1,0,1).-1-0.8-0.6-0.4-0.200.20.40.60.810 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18AutocorrelacioneDesplazamientoAutocorrelograma (-0.793991056084206)-1-0.8-0.6-0.4-0.200.20.40.60.810 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18Autocorrelacin parcialDesplazamientoAutocorrelograma parcial (-0.793991056084206)124.8- Generacin de los posibles modelos ARIMAMediante XLSTAT se aplica ARIMA(1,0,1), obtenindose la siguientes figurasFigura 7. Serie generada con ARIMA(1,0,1)-3-2-101230 10 20 30 40 50 60 70-0.793991056084206Paso de tiempoARIMA (-0.793991056084206)-0.793991056084206 ARIMA (-0.793991056084206)13Figura 8. Residuos generados con ARIMA(1,0,1)Engeneralsevetentadorconfirmarelmodelo,perodesafortunadamentealaplicareltestde normalidad a los residuos estos no cumplen con los p-valor mnimo de 0.05 (salvo en Jarque-Bara), por lo que se rechaza la hiptesis de que sea un ARIMA(1,0,1). Este motivo es suficiente como para no seguir haciendo otros test, como el criterio de Parsimonia o el ndice AIC.Prueba p-valorShapiro- Wilk 0.449Anderson Darling 0.382Lilliefors 0.358Jarque-Bara 0.987Tabla 4. Pruebas de normalidad para ResiduosTambin se hizo una diferenciacin para ver cmo andaba ese modelo, pero los residuos eran mayores que 3, lo que provocaba que el modelo fuera peor.4.9- Seleccin del modelo ARIMAPor descarte, el modelo ARIMA se adoptar a ARIMA(0,0,0).-2.5-2-1.5-1-0.500.511.522.531 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63ResiduoPaso de tiempoResiduos144.10- Generacin de 30series sintticasUnARIMA(0,0,0) implica quelosyt=at,loquesetraduce engenerar 64aleatorios entre0y1por serie,sacarlosvaloresdeladistribucinnormalasociadoaestosaleatoriosconmedia0y desviacinestndar1.Luegodeesoseagregarlatendenciaalosdatos,parafinalmentesacar exponencial de los ltimos datos para tener los caudales a simular.Para ms detalle ver el anexo de Excel.4.11- Curvas de duracinAl tener cada serie de caudales ordenados de mayor a menor, el siguiente paso es obtener su probabilidad de excedencia mediante Weibull. De esta forma se puede llegar los valores de 85% de excedencia de cada serie, presentados en la tabla0.287 0.262 0.266 0.229 0.261 0.324 0.344 0.386 0.327 0.3650.335 0.436 0.440 0.429 0.411 0.369 0.297 0.291 0.217 0.4090.339 0.434 0.312 0.408 0.448 0.308 0.497 0.241 0.363 0.365Tabla 5. 30 Caudales en l/s asociados a la probabilidad de excedencia del 85%Figura 9. Curva de duracin en Puangue en Boquern0246810121416180 0.2 0.4 0.6 0.8 1 1.2Caudal [l/s]Probabilidad de excedenciaCurva de duracinSeries1155- ConclusionesUn modelo ARIMA(0,0,0) en realidad no es un modelo ARIMA como tal, ya que este asume que el pronsticoesunafuncinlinealdelasobservacionespasadasyerroresaleatorios.Peroeneste caso no hay una funcin lineal que conecte el pronstico, lo que da a entender que todos los datos son independientes entre s, lo cual es muy difcil que se d.Un problema directo que influye en este problema son el nmero de datos de la muestra, ya que mientras menor sean los datospeor serel pronstico,yaque pueden haber ciclicidadesque no se hayan presentado en los datos conocidos, o tendencias ms generales y no tan especficas de la seriehistrica.Posiblementeunespectrode32aosnoessuficienteparaarrojarunbuen pronstico mediante un modelo ARIMA.Comosevioenlatabla5,sibienandandelordenloscaudalesasociadosal85%deexcedencia, igual se notan diferencias de hasta un 100% de diferencia, lo que provoca que estos resultados no sean tan confiables con el mtodo utilizado.Una ventaja significativa de estos modelos espoder predecir datos con tendencia, ciclicidad yno normales.Porsupuestoestodebeidentificarse,procesarseysacarlasaprioriparaescogerel modelo ARIMA adecuado. Pero finalmente el pronstico debe ser consistente, una vez escogido el modelocorrespondientehayquedevolversealasvariablesoriginales,loquegeneraunmucho mejor pronstico con respecto a los mtodos de hidrologa convencional.166- AnexosExcel Adjunto ARIMA1.xlsx