15
IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jo se [win Cardenas Montoya * COlllilll/acioll del arlicl/lo illieiado sohre esle lema ell el No. J de la Revisla. 1.:-"11 esla parle se de.lcr;bell 10.1' metodo.\" de r"gresi611 lilleal (simple y nllilliple), nllIllil'ariada y eI melodo de la "limlli!llia Silllilar". Dichos metodos no consideran las caracteristicas fisicas y geolllorfologicas de las cuencas hidrograficas y sus implicaciones sobre los resultados obtenidos, cO lls iderando mas el aspecto matematico-estadistico. Mas bien, se analizan detenidamente los efectos de la reconstruccion 0 de la extension de 10 registros sobre los parametros estadisticos de las series de tiempo bjdrol6gicas. Fundamentalmente los metodos que se describ\;11 SOil: Metodos de regTesion lineal (Simple y multiple) a traves de enfoques analitico y grafico, metodos de regre ion mllitivariadas, y el metodo de la "To nnenta Similar". Los metodos de regresion son los que han reclbido la mayor atenci6n, par ser los ma s utilizados para estos propOsitos y ademas, por tener ll1uchas implic nci ones de tipo Matematico-Estadistico. Ingenicro Cil·it de la Ullilicrsidad Mililar "N ueva Gra nada" Ingen iero de Man temm ienlo en cOilluni caci6n de dat os . en la Division InfomHilica Banco del ESlado. 50 Revisla de In ge nieria (' ,vil

IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

Embed Size (px)

Citation preview

Page 1: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION

DE ESTRUCTURAS HIDRAULICAS

LOS METODOS DE REGRESION (Segunda Parte)

Jose [win Cardenas Montoya

COlllilllacioll del arlicllo illieiado sohre esle lema ell el No J de la Revisla 1-11 esla parle se delcrbell 101

metodo de rgresi611 lilleal (simple y nllilliple) nllIllilariada y eI melodo de la limllillia Silllilar

Dichos metodos no consideran las caracteristicas fisica s y geolllorfologicas de las cuencas hidrograficas y sus implicaciones sobre los resultados obtenidos cOllsiderando mas el aspecto matematico-estadistico Mas bien se analizan detenidamente los efectos de la reconstruccion 0

de la extension de 10 registros sobre los parametros estadisticos de las series de tiempo bjdrol6gicas

Fundamentalmente los metodos que se describ11 SOil Metodos de regTesion lineal (Simple y multiple) a traves de enfoques analitico y grafico metodos de regre ion mllitivariadas y el metodo de la Tonnenta Similar

Los metodos de regresion son los que han reclbido la mayor atenci6n par ser los mas utilizados para estos propOsitos y ademas por tener ll1uchas implicnciones de tipo Matematico-Estadistico

Ingenicro Cilmiddotit de la Ullilicrsidad Mililar Nueva Granada Ingeniero de Mantemmienlo en cOillunicaci6n de datos en la Division InfomHilica Banco del ESlado

50 Revisla de Ingenieria ( vil

l

I I

Obviarnente este modelo debe estar de aCl1ershydo con las leyes fisicas que gobiernan los fen6menos pero sus resultados dependen de los datos utilizados

Limitandose al caso de los metod os de regreshysi6n con tres variables es decir dos indepenshydientes y lIna dependiente se pueden obtener entre otras las configuraciones que se obsershyvan en la figura 1 con sus ecuaciones analitishycas correspondientes

Tambien se pueden utilizar combinaciones de la ecuaciones mencionadas para describir relaciones complejas entre las variables y adeshyI1U las ecuaciones se puedeuron extender para IOciuir un mayor nillnero de variables indepenshydientes

Tal vez cl de mayor utiJizacion en el campo de los fen6menos hidrol6gicos es el 11l0delo y= a + bx pero su aplicaci6n debe ser debidamente control ada ya que no siempre es

el apropiado para describir lin detenninado fen6meno

EI metodo gratico de correlaci6n entre dos variables el cual se anaJizara adelante puede dar importantes pautas sobre el tipo de regreshysi6n que se debe emplear

Una vez seleccionado el modelo apropiado se pueden de-temlinar los coeficientes de la regresi6n (abcdetc) por cllalquiera de los metodos existentes siendo el de los minilllOS cuadrados eJ de mayor lItilizaci6n ell los problemas de regresi6n lineal

2121 Transformacion de variables

Muchas veces los datos oririnales de las variashybles involucradas en una ecuaci6n de regreshysion se transfonnan mediante artificios mateshymaticos Existen tres razones principales para hacer esta transfOflnacion

- A van ma

- I lim

- 0 lim apl

AI pi te

1i

II

V=O Io

x x

y y

I

I cr1+cjl

x x

FIGURA 1 Representaci6n de funcion es de regresi6n

52 Revisa de ingel1leria Civil

-- --- ---

o para describir lin delenninado

grMico de correlaci6n entre dos cual se analizara adelante puede tes pautas sobre el tipo de regreshy

debe emplear

eccionado el modele apropiado ktenninar los coeficientcs de la bcdetc) por cualquiera de los stentes siendo el de los minimos el de mayor lItilizacion ell los e regresion lineal

formacion de valiables

los dalos originales de las variashydas en una eCliacion de regreshy

onnan mediante arti ficios Illateshyten Ires razones principales para nsfonllacion

x

v~bxla

lC

es de regresi6n

Relisla de Ingenieria (I)il

- Aproximar la dislribucion marginal de las variables transfonnada a la di tribllcioll norshymal

- La variacion de los PlUltO a 10 largo de la linea de re Tesion C ilia homogenea

- Obt ener una va rianz igual alrededor de la linea de regresion a Irave de lodo el range de aplicacion

Algunas Iransfonllaciones a manera de ejemshyplo para linealizar fllnciones son las siguienshyles

Tipo de funcion Eeuacion en forma lineal

y= a + bx y = a + bx (I) y= ben log Y= log b + a (Ioge)x (2) y= ax log y = log a + b log x (3)

Sobre este lil limo ti po de transfo rmacion Hirsch (1979 p 1783) hizo ulla compa racioll con elm todo c1asico d regresion linea l COil respecto a est se hablara en la pal1e ded icada a la reTesion en el espacio logarilmico

En el I xto d how ( I 964 p8-49 Tabla 8shy11-2) se puede enconlrar lIna lisla de tales trail sfolll1aciones

2122 Regresion linenl imple (AJlIsle anal itico)

Posibl mellte el modele COmtllllllenle lItilizado en hidrologia se basa en la slIposicion de una relaci6n li neal ent re do va riab les y Sll objelishyvo principal radica en e limar Li ll a variable (dependiente) a paJ1 ir del conocimiento de otra ariable (independicllte)

El resultado fin al de la regreslonlineal de LI lla variable Y conlra otra variable X es una linea recta que da el mejor estllnado de Y para UIl

valor dado de X Talllbien se puede determi-

Revislu de Ingenieriu (ili

nar la linea recla que da el mejor eslllllado de X para Ill valor dado de Y esas dos rectas no necesari1mente son iguales

1 hictrologia generalmente solo se utiliza la primera de estas regresiones dada por la ecuacion (4)

y (i) a hx (i) (4 )

ell donde

y (i) Valor eslimado de la variable dependienle y

a y b Intercepto y pendiellte de la linea de regresion

x(i) Valor de la varia Ie dependiente x

Las premisas en que basa eJ metodo de regreshysian lineal desde el punto de vista estadi lICO son las sigllientes

- La variable illJepellJiellle e( exellll de errore lIIielllros ile eslas solamellie OCIIshy

rrell ell 10 Wrrtohe Jepelldiellie

- Ia oriallzu de 10 anable depelidiellie 110 depende de los val ores de la variable ilidepelidielile

- I os alores regislrlldos de la (riahle depelldiellie SOli variables alealorias 111

coneucicill ShUll) el al (J9W p f 28)

Para la aplicacJan de las pruebas de signifishycancia estadistica de la regresion se supone que la poblaci6n de la variable dependienle se di Iri bllye nonnalmente alrededor de la linea de reTesion para clialquier valor consshylanle de la variable independienle

M s adelante dentro de l analisis de regresion linea Illlli lip le se miraran eslas suposiciones a la luz de los fcnomcnos hidrologic s y se vera en que med ida se ajustan a la realidad fislca

53

La aplicacion de la ectlacion (1) al tema del presente trabajo resuJta directa Para el caso de caudales medjos mensuales y niveles de agregacion mayores se extiende el registro de la estacion que presenta un registro corto (estaci6n satelite) a la que se asocia la variashyble Ymediante el registro extenso de otra estashyci6n que se escoja dentro de un grupo de estashyciones vecinas y a la que se asocia La variable X (estacion base 0 pivote)

HI criterio de seleccion de la estacion base que parece razonable y que es el utilizado en la uteratura sobre el tema es el de la estacion que tenga el alto coeficieute de cOlTeiacion muestral can la eslacion sateute Tambien se puede lIenar el vacio de un dato fait ante simshyplemente entrando a la ecuacion (4) de regresion con el valor de X Cuando a1gunas observaciones estru] perdidas (es decir que son vacios en el registro) el ajuste de lUl modeshy10lineaJ basado en el principio de los minimos cuadrados es el procedimiento desarrollado para estimar los vaJores de las observaciones perdidas (Wilkinson1958 p 257)

Hay que anotar que el mismo procedimiento puede aplicarse para registros incompletos de precipitacion con las mismas suposiciones y con el mjsmo anw sis de resultados Este proshycedimiento se conoce con el nombre de transshyferencia de infonnacion hidrologica de ulla estacion a otra

Muchos autores abordan este tema sobre todo en el sentido de mejorar los estimadores de los panunetros estadisticos de las series de registros reconstruidos

En el caso especifico de las series de caudales medios la base de las hipotesis sobre los que se apoya todo el ellfoque de la transferellcia de la infonl1aci6n segull Fiering (1 963 p 2) es la siguiente

-Se supale 1111 reglmel hidral6gico esabe o sea que se plede esperar 110 correlacioll igllijiealila elltre las series para diferellles

silios Bavieamellle se espera que IO oellshyrran cambios ell los regimelles hidrol6gicos COli los middotlIoles eSIQI1 asociadas las series

-Los eaudales allllaies 0 algllllo Irollsjorshymaeitjll de estos se slIpoel1 narmamenll dislribllidos Los ellentos cOlcurrelfes para el coso de dbs s(ries sigleJ dislribllcian lIomlOl cOlljllllla

-Los ellelllOS se dislribllyel illdependiellleshymente en el liempo de taljormaqlle el coefishycielle de allacorreaeian Sl eOlsldela 111110

De no hacerse esta Ultima suposicion el anashylisis seria muy complicado ya que debido a1 fen6meno Hamado persistencia hidrologjca (definido como la tendencia que existe en la naturaleza que a caudales altos anuales tienshyden a seguir caudaJes altos) disminuye eL cooshytenido de informacion que tenga sobre un evento hidroJogico (Matalas y Langbein 1962 p 3442)

Estas suposiciones Iimjtan la aplicabilidad de los resultados obterudos mediante la transfeshyrencia de infonnacion y taJ vez la ultima menshyciollada sea la que present a los mayores inconshyvenientes en las senes de caudales debido a la autoregresi6n existente dentro de elias

Muchos autores han tratado este tema ya que intuitivamente los procesos hidrologicos poseen UD caracter autoregresivo (10 que si gnifica que el valor de Wla variable hidroshymetecrol6gica en el momento presente depenshyde de los valores precedentes) MllJ1era (1 983 p26) Ademas de los resultados de las investigaciones sabre los caudales de divershysos rios han demostrado esta apreciaciou Yevjevich (1964 p12) haciendo w] analisis de los correlogramas (el cOlTelograma es un gnlfico del coeficiente de correlacion Vs diferentes rezagos de la sene) de los caudales

Revisia de ingenieria Civil 54

UN 111 regimen hidrgico eSlable II 51 plede e~pera IIIa correlacion alha elllre las series para dijellllleS ~ilsicamelle se espera ql(l 110 OCIlshy

blOs ell los regimenls hidrgcos middotlalc esejl asociadas fa r series-

dales aliIales 0 algllla trallsorshyde e$105 se l11polel lormalmeme ItliS Los eVln(os conclirrellles para

de dos saies sigllell ds(ribIlCioll cOUulla

7105 51 dislribllyell illdependiellleshyI fiempo de lalormaqtle eI coejishyGlllocorrdaci6 SI cOlsidera 111110

e esta ultima suposici6n el amishyuy complicado ya que debido aJ

lamado persistencia hidro16gica ~mo fa tendencia que existe en la ue a caudaJes altos anuaJes tienshycaudales altos) disrninuye el conshyfonnacion que tenga sobre un logico (Matalas y Langbein 2)

iones limitan la apbcabilidad de S obtenidos mediante la transfeshynnacion y tal vez la Ultima menshyque presenta los mayores inconshylas series de caudaJes debido a on existente dentro de ellas

es hantratado este tema ya que te los procesos hidrologicos racter autoregresivo (10 que

el valor de una variable hidroshyen el momento presente depenshyores precedentes) Munera demas de los resultados de las

s sobre los caudales de divershyemostrado est a aprecjaci6n 4 p1 2) haciendo w amilisis amas (el correiograrna es un

eficien te de correlacion V s os de la serie) de los caudales

anuaIes en una muestra de 140 estaciones de medici6n encontro que 124 tenian un coeflshyciente de correlacion de primer orden posishytivo

Para valores de caudaJes medios diarios se analizaron re-gistros de 17 rios (Quimpo 1967 p18) y se encontraron correlaciones seriales que variaban entre 056 y 097

Otros aspectos de la autocorrelacion de Jos caudales sobre Jos aruilisis hidrologicos han sido anaJizados en distintas investigaciones entre las que se pueden mencionar los trashybajos de Leopold (1959) MataJas y Langbein (1962) y Lloyd (1963) que han demos~ado que la autocorrelacion reduce Ja confiablhdad de los otros parametros estadisticos de las series de caudales e incrementa los requerishymientos de almacenamiento para objetos de regulaci6n de los caudales de Wl rio

Ademas de los trabajos anteriores Fiering (1967 p 29) desarrollo un estimador de la funcion de aulorrelacion de los caudales anuashyles bas ado en la suposici6n de estacionarieshydad de las series de caudaJes Tarnbien se desashyrrollo un modele para estimar la estructura de correlacion de los caudales menslla1es suposhyniendo la no estacionariedad en el proceso

EI resumen anterior sobre las investigaciones realizadas a cerca de la autocorrelacion se ha hecho con el prop6sito de indicar hasta que punto son vaJidas las suposicioI1s que se acepshytan para efectuar la transferencla de Infonnashycion sin 1a cual seria muy dispendioso el calculo maternalico de los modelos

Estimacion de los panunetros de la regresion Retomalldo la ecuaci6n (4)

Y (i) = a + bx(i) (4)

Revisla de ingenieria Chil

y aplicando el metodo de estimaci6n ~e mishynjmos Cl adrados se tiene que los coeficlentes a y b son aquellos valores que minimizan la suma de los cuadrados de las desviaciones (0 residuales) 10 que se expresa matematlcamenshyte como

N

minZ = [g () -y (i)l (5) i-I

o = [g (i) - a - bx (i) (6)

i-I

en donde

y3 (i) Valor estimado por la regresi6n y (i) Valor muestraI i de la serie y x (i) Valor muestral i de la sene x

N NLimero de h~nninos de la regrest6n

Es decir que Z es Wla funci6n de a y b P~a que esta funcion tenga lUl minimo es necesano que se cwnplan las igualdades

(7)

D

Resolviendo el sistema anterior se obtiene

a=y-b x (8)

u

L X( I) Y (I) - Nxy i-I

b = ------ (9) a

L x2 - Nx2

(I)

i-I

RevlSla de Ingenieria Civil 55

en donde x e Y son los valores medios de las series x e Ypara la muestra de lamru10 N

De acuerdo con esto si se desea extender el registro en una estacion y cuenta con ~ datos de caudal 0 precipitacion medios mensuales trimestrales anuales etc a partir de un regisshytro mas extenso en una estaci6n x que cuenta con ~+01 datos de la misma variable se aplica la regresion lineal al siguiente arreglo de datos

x(l) x(2)x(3) x(nl) x(01+02)

y(l) y(2)y(3) Y(Dl)

No es necesario que las dos series comiencen a terrnioen en fonna simultanea ni tampoco que lodos los registros sean consecUllvos

La fonna 6ptima de la ecuaci6n (l ) esta dada como

S (y(D) Yo = y(nl ) + i (x (n) - x(nraquo)

S (X(D1)] (10)

En donde

y (1) Valor estimado i de la serie y a partir de la regresi6n Medias muestrales de los III

valores de y y x respeetivashymente

S(Y(D)I S(x(nraquo) Desviaciones estandar muesshy

trales de los 0 valores de y y x respectivamente

r Valor estimado del coeficiente de correiacion entre x e y para los 0 valores

56

De esla matlera para Wl valor faltante Y(I) se entra en la ecuaeion con el valor de x(I) de intervalo de tiempo de interes y se hana el valor estimado Y (I)

La teeDica de regresion lineal ha sido ampliashymente estudiada por muchos autores como instrumento eficaz en la extension de series con pocos registros

Los faetores de los cuales depende el mejorashymiento de los parametros son la longitud del registro original y el coeficiente de correlaeion entre las series

Existe un parametro conocido como Inforshymacion relativa I definido como la relad6n entre la varianza de un pariunetro estadistico estimado con el registro original y la varianza estimada a partir del registro exteudido (comshybinado) (Fiering1962 p 21 ) Este parametro se da en tenninos de las varianzas debido a que es Wla medida de confiabilidad de un estishymador que esta dada por su varianza

En otros termmos Informacioo Relativa I

1= (Va rianza(serie origioal)]rVarianshyza(serie extendida)1

Cuando I gt 1 se concJuye que es mas preciso el estimador de la serie extendida ya que 1a varianza de parametro de esta es meuor que la varianza de la serie original

Por otro lade cuando la varianza del parametro de la serie extendida es mayor que la varianza del panlmetro el valor de I (lnfonnaci6n relativa) se haee menor que uno esto da a entender que es menos preciso y por Jo anterior el pro-cedimiento de regresion entendido como la aplicacion de la ecuacion (4 ) no debe ser uti lizado

Revisla de ingenieriaivil

a para un valor faltante y se (I)

uaclon con el valor de x de (I) empo de Ulteres y se haUa el

o

Y(I)

egresi6n lineal ha side amptiashya por muchos autores como caz en la extensi6n de series tros

los cuales depende el mejorashyarimetros son la longitud del yel coeficiente de correlaci6n

eLro conocido como InforshyI definido como ta relaci6n de un parametro estadistico

registro original y la varianza r del registro extendido (comshyg1962 p 2) Este parametro

de las varianzas debido a da de confiabilidad de un estishydada por su varianza

s Informacion Relativa I

(serie originaJ)JlI Varianshyida)1

concluye que es mas preciso la serie extendida ya que la

etro de esta es menor que sene original

do la varianza del parametro Ida es mayor que la varianza I valor de I (lnfonnaci6n menor que uno esto da a menos preciso y por 10

cedJmiento de regresion a aplicacion de la ecuacion tilizado

Revisfa de ingentelia Civil

Otro cri terio para 1a eval l3cion de 1a aplicashycion de los metodos anteriores se dispone del Error Medio Cuadratico (EMe) de cual shyquier parametro estadistico 91 definido como el valor esperado de la desviaci6n del esti mado sesgado y el es timado r insesgado de panmetro

Es deseable desde el punto de vista flSico que el EMC se aproxime aCERO cuando T (EI intervalo de tiempo mue tral ) aUln nte

Entonc 5 para Ull T gra nde cualquier estim dor neeesariamente lenderia a Ull

valor muy cereano al de Ull estimador vcrshydadero 0 Los estimadores que tienen sla

1

propiedad se deno l inan es ti madores eonsislentes Puede verse que el EMC se reduce a

EI(r8)31- pound 1lt -pound1 + pound11 - 81 21

- pound1(4) - pound[qJ)JI + 2pound1(41 - poundlqJ) (pound14gt1shy

4gt)1 + poundf(poundlq1 - qYI

EI segundo termino se all ula ya que

pound141 - pound14gt1- pound[4gt1- pound14gt1 - 0

pound1(41 - 8)2== pound1(4) - pound14gt ])21 + poundI(Eiq 1 shy

(12)

La eClIaeion (12) indica que el EMC es la suma de dos partes la primera es la vari anza del estimado que se expresa como

Varlq1 = 02 = pound1(4) -EI4gt1)11= EW 1 shyE214gt11

( 13)

y la segunda es el cuadrante del sesgo del estimador

Es decir que en tenninos de varianza y el cuadrado del sesgo el EMC es

Esta presentacion breve de la teoria sobre EMC se justifica debido a que es uno de los criterio ut ilizados on mas frecllencia en la mayoria de las tecnicas de reconstrucei6n de registros para comparar la ealidad de los parametros observados COil 10 panimetros est imados

Otros a pectos del analisis de regrcsion simple La eonfiabilidad de la regresion esta medida por el elTor estandar 0 error tapico que se define como la desviacion estandar de la distribllci6n (nonnal) de los residuales al Tededor de la linea de regresion tal c mo 10 mue tra la Figura 2

y

--__-_________ x

FIGURA 2 Di Iribucion NORMAL de los puntos alrededor de la li nea de regresion

Revisa de ngenieria Civil 57

Por definicion eI error estandar es el mismo a travez de todo el rango de x Tambien se conoce como error estandar del estimado error estandar de la regresion 0 desviacion eslandar de fa regresion

El error estandar del dato calculado mediante la tecnica de relYfesion se compone de tres partes el error de la media el error de 1a pel1shydiente de la linea y el error cstandar del estimado De esta [onna el error eSlandar de la prediccion es

(x - xV 1+-+(----)SEP= SEE (y)

N I (X - X)2

( 16)

en donde

SEP Error estandar de la precipitacion SEE(y) Error esl andar del estimado N Niunero de datos de 1a regresion

El SEE(y) se define mediante la ecuacion

N

L Iy - a - blx(i) - iW i-I

SEE (y)

N-K ( 17)

n

i-I (18) N-K

en donde

58

SEE(y) Error estandar del estimado k Grados de libertad en este caso el

I1lllnero de coeficientes de la Hllea de regresion (k=2)

EI SEE(y) mediante la ecuaciones 17 y 18 se mide el porcentaje de la varianza de la variab le dependienle no explicada por la regresion EI error estandar del estimado de la regresion puede util izarse como un estimashydor razonable del error estandar de la predicshycion ya que la inexactitlld de fa ecuacion de regresion general mente es peqllefia en compashyracion con la di spersion de los datos alrededor de la linea de regresiolL

En otros tenninos el error total de cstimacion es

Error total = Erro r no explicado + Error cxplicado

Graficamente esla re lacion se pliede ver en la fig ura 3

Olra de las caracteristicas importanles que se pueden oblener de la regresion es el coetishycienle de delerminacicl11 R2 y se define pOl

la relacion entre el error explicado y el error lotal

V-y

y- + bx

x

FIGURA 3 Composicion del error total

Relista de fngenieria Civil

frror estandar del estimado lrados de Iibertad en este caso el unero de coeficientes de la linea

regresion (k=2)

mediante la eCllaciolles 17 y 18 porcentaje de la varianza de la pendiente no expli cada por la I error cst3Jldar del estimado de puede utilizarse como un estimashy

tIe del error estandar de la predicshy=la inexact it lid de la ecuacion de neralmente es pequella en compashy1dispersion de los datos alrededor Ie rehTesion

Iinos el elTor total de cstimaci6n

= Erro r no explicado + Error

e esta relaci6n se puede ver ell

caractcristlcas importantes que tener de la regresi6n es el coefishyenninaci6n R2 y se define por lire el error expJicado y

y- + bx

x

3 Composicion del error tOlal

Revisfa de ingemeria Civil

Rl = Error Explicado I (Error totnl en donde R es el coe1iciente de con-elaci6n

Con el fin de poder detenninar la confiabi lidad de In aplicacion de este metodo se pueden analizar alb1l1laS caracteristicas impol1antes Con el amllisis de eslas se detenninan pautas importantes a seguir para detenninar la con 11 ashybilidad de los resultados al ser apicados en las series de datos lales como

Coeficiente de determinacion Este coefishyciente se pucde eswdiar de dos maneras

- Medida de mejoramiento en la estimacion de y lIt ilizando la linea de regresi6n

Este mejoramiento se mide resp cto al error total el valor de R2 = I indica que In reduccion del error total es completa al ser estimado y mediante esle metodo

- Si R2 = 07 la reducci6n del error total debido a la determinaci6n de la linea de regresion es del 70

- Calidad del aj uste y medida de Iinealidad EI valor de R2 tiende a I cuando 10 pun tos se acercan a la linea de rebTesion Y se acercan a lIna linea rect a

Se puede 1I1i lizar otro crit rio dado por la relaci6n ent re R2 y SEE2(y) dad por

SfP (y) = (I - In )1 (y) (20)

de donde S2(y) es el estimado de la varianza d y_

De la anterior relacion se deduce que estos cntenos son complementarios debido a que p~r medio de ell os se puede obtencr el porcenshytaJe de varianza de y no explicado por la

Revista de il7genieria Civil

rehTesi6n indicando una medida de Ja caJidad del ajusk de elIas

Allalizando los resultados de la aplicacion de este criterio se deduce 10 siguiellte

Ell la medida en qlle aumente el vaJor de R es mas confiable la regresion y en compleshymento el valor de SEE(y) al ser mas pequeno

No necesariamente los val ores de estos dos parametros R y SEE son buenos illdicadores de la calidad de la eClIaci6n de estimaci6n para val ores muy alejados de los valores medios

Otra manera de obtener una idea de la bondad del ajuste 10-hTado ell la regresion es mediante el analisi grafico de los residuos

Sc efectlla ulla gnitica de los val orcs de y(i) contra los valores estimados Para Ull aju te perfecto se debe obtener una linea recta de 45 que pasa por el origen sobre la que se disshypersaJllos puntos a lado y lado ClIalqllier vashyriacion de esta linea puede atribuir e a que las sllposiciones hechas sobre los errore (meshydia cero varianza COLlstante y distribuci6n nonnal) no se ha cwnplido 10 cllal debe ser corregido efectllando alglll1 tipo de transforshymacion sobre los datos originales 0 mediante otros artificios

Otro hTafico de interes en el anaJisis es el de residuos contra tiempo colocando los errores en ULl grafico en su orden cronol6gico para detectar posibles ciclos 0 estacionalidades ell los registros

Ell seguida se presentan temas concemienleS a la teoria de decisiones y a las pruebas de hi p6tesis

59

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 2: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

l

I I

Obviarnente este modelo debe estar de aCl1ershydo con las leyes fisicas que gobiernan los fen6menos pero sus resultados dependen de los datos utilizados

Limitandose al caso de los metod os de regreshysi6n con tres variables es decir dos indepenshydientes y lIna dependiente se pueden obtener entre otras las configuraciones que se obsershyvan en la figura 1 con sus ecuaciones analitishycas correspondientes

Tambien se pueden utilizar combinaciones de la ecuaciones mencionadas para describir relaciones complejas entre las variables y adeshyI1U las ecuaciones se puedeuron extender para IOciuir un mayor nillnero de variables indepenshydientes

Tal vez cl de mayor utiJizacion en el campo de los fen6menos hidrol6gicos es el 11l0delo y= a + bx pero su aplicaci6n debe ser debidamente control ada ya que no siempre es

el apropiado para describir lin detenninado fen6meno

EI metodo gratico de correlaci6n entre dos variables el cual se anaJizara adelante puede dar importantes pautas sobre el tipo de regreshysi6n que se debe emplear

Una vez seleccionado el modelo apropiado se pueden de-temlinar los coeficientes de la regresi6n (abcdetc) por cllalquiera de los metodos existentes siendo el de los minilllOS cuadrados eJ de mayor lItilizaci6n ell los problemas de regresi6n lineal

2121 Transformacion de variables

Muchas veces los datos oririnales de las variashybles involucradas en una ecuaci6n de regreshysion se transfonnan mediante artificios mateshymaticos Existen tres razones principales para hacer esta transfOflnacion

- A van ma

- I lim

- 0 lim apl

AI pi te

1i

II

V=O Io

x x

y y

I

I cr1+cjl

x x

FIGURA 1 Representaci6n de funcion es de regresi6n

52 Revisa de ingel1leria Civil

-- --- ---

o para describir lin delenninado

grMico de correlaci6n entre dos cual se analizara adelante puede tes pautas sobre el tipo de regreshy

debe emplear

eccionado el modele apropiado ktenninar los coeficientcs de la bcdetc) por cualquiera de los stentes siendo el de los minimos el de mayor lItilizacion ell los e regresion lineal

formacion de valiables

los dalos originales de las variashydas en una eCliacion de regreshy

onnan mediante arti ficios Illateshyten Ires razones principales para nsfonllacion

x

v~bxla

lC

es de regresi6n

Relisla de Ingenieria (I)il

- Aproximar la dislribucion marginal de las variables transfonnada a la di tribllcioll norshymal

- La variacion de los PlUltO a 10 largo de la linea de re Tesion C ilia homogenea

- Obt ener una va rianz igual alrededor de la linea de regresion a Irave de lodo el range de aplicacion

Algunas Iransfonllaciones a manera de ejemshyplo para linealizar fllnciones son las siguienshyles

Tipo de funcion Eeuacion en forma lineal

y= a + bx y = a + bx (I) y= ben log Y= log b + a (Ioge)x (2) y= ax log y = log a + b log x (3)

Sobre este lil limo ti po de transfo rmacion Hirsch (1979 p 1783) hizo ulla compa racioll con elm todo c1asico d regresion linea l COil respecto a est se hablara en la pal1e ded icada a la reTesion en el espacio logarilmico

En el I xto d how ( I 964 p8-49 Tabla 8shy11-2) se puede enconlrar lIna lisla de tales trail sfolll1aciones

2122 Regresion linenl imple (AJlIsle anal itico)

Posibl mellte el modele COmtllllllenle lItilizado en hidrologia se basa en la slIposicion de una relaci6n li neal ent re do va riab les y Sll objelishyvo principal radica en e limar Li ll a variable (dependiente) a paJ1 ir del conocimiento de otra ariable (independicllte)

El resultado fin al de la regreslonlineal de LI lla variable Y conlra otra variable X es una linea recta que da el mejor estllnado de Y para UIl

valor dado de X Talllbien se puede determi-

Revislu de Ingenieriu (ili

nar la linea recla que da el mejor eslllllado de X para Ill valor dado de Y esas dos rectas no necesari1mente son iguales

1 hictrologia generalmente solo se utiliza la primera de estas regresiones dada por la ecuacion (4)

y (i) a hx (i) (4 )

ell donde

y (i) Valor eslimado de la variable dependienle y

a y b Intercepto y pendiellte de la linea de regresion

x(i) Valor de la varia Ie dependiente x

Las premisas en que basa eJ metodo de regreshysian lineal desde el punto de vista estadi lICO son las sigllientes

- La variable illJepellJiellle e( exellll de errore lIIielllros ile eslas solamellie OCIIshy

rrell ell 10 Wrrtohe Jepelldiellie

- Ia oriallzu de 10 anable depelidiellie 110 depende de los val ores de la variable ilidepelidielile

- I os alores regislrlldos de la (riahle depelldiellie SOli variables alealorias 111

coneucicill ShUll) el al (J9W p f 28)

Para la aplicacJan de las pruebas de signifishycancia estadistica de la regresion se supone que la poblaci6n de la variable dependienle se di Iri bllye nonnalmente alrededor de la linea de reTesion para clialquier valor consshylanle de la variable independienle

M s adelante dentro de l analisis de regresion linea Illlli lip le se miraran eslas suposiciones a la luz de los fcnomcnos hidrologic s y se vera en que med ida se ajustan a la realidad fislca

53

La aplicacion de la ectlacion (1) al tema del presente trabajo resuJta directa Para el caso de caudales medjos mensuales y niveles de agregacion mayores se extiende el registro de la estacion que presenta un registro corto (estaci6n satelite) a la que se asocia la variashyble Ymediante el registro extenso de otra estashyci6n que se escoja dentro de un grupo de estashyciones vecinas y a la que se asocia La variable X (estacion base 0 pivote)

HI criterio de seleccion de la estacion base que parece razonable y que es el utilizado en la uteratura sobre el tema es el de la estacion que tenga el alto coeficieute de cOlTeiacion muestral can la eslacion sateute Tambien se puede lIenar el vacio de un dato fait ante simshyplemente entrando a la ecuacion (4) de regresion con el valor de X Cuando a1gunas observaciones estru] perdidas (es decir que son vacios en el registro) el ajuste de lUl modeshy10lineaJ basado en el principio de los minimos cuadrados es el procedimiento desarrollado para estimar los vaJores de las observaciones perdidas (Wilkinson1958 p 257)

Hay que anotar que el mismo procedimiento puede aplicarse para registros incompletos de precipitacion con las mismas suposiciones y con el mjsmo anw sis de resultados Este proshycedimiento se conoce con el nombre de transshyferencia de infonnacion hidrologica de ulla estacion a otra

Muchos autores abordan este tema sobre todo en el sentido de mejorar los estimadores de los panunetros estadisticos de las series de registros reconstruidos

En el caso especifico de las series de caudales medios la base de las hipotesis sobre los que se apoya todo el ellfoque de la transferellcia de la infonl1aci6n segull Fiering (1 963 p 2) es la siguiente

-Se supale 1111 reglmel hidral6gico esabe o sea que se plede esperar 110 correlacioll igllijiealila elltre las series para diferellles

silios Bavieamellle se espera que IO oellshyrran cambios ell los regimelles hidrol6gicos COli los middotlIoles eSIQI1 asociadas las series

-Los eaudales allllaies 0 algllllo Irollsjorshymaeitjll de estos se slIpoel1 narmamenll dislribllidos Los ellentos cOlcurrelfes para el coso de dbs s(ries sigleJ dislribllcian lIomlOl cOlljllllla

-Los ellelllOS se dislribllyel illdependiellleshymente en el liempo de taljormaqlle el coefishycielle de allacorreaeian Sl eOlsldela 111110

De no hacerse esta Ultima suposicion el anashylisis seria muy complicado ya que debido a1 fen6meno Hamado persistencia hidrologjca (definido como la tendencia que existe en la naturaleza que a caudales altos anuales tienshyden a seguir caudaJes altos) disminuye eL cooshytenido de informacion que tenga sobre un evento hidroJogico (Matalas y Langbein 1962 p 3442)

Estas suposiciones Iimjtan la aplicabilidad de los resultados obterudos mediante la transfeshyrencia de infonnacion y taJ vez la ultima menshyciollada sea la que present a los mayores inconshyvenientes en las senes de caudales debido a la autoregresi6n existente dentro de elias

Muchos autores han tratado este tema ya que intuitivamente los procesos hidrologicos poseen UD caracter autoregresivo (10 que si gnifica que el valor de Wla variable hidroshymetecrol6gica en el momento presente depenshyde de los valores precedentes) MllJ1era (1 983 p26) Ademas de los resultados de las investigaciones sabre los caudales de divershysos rios han demostrado esta apreciaciou Yevjevich (1964 p12) haciendo w] analisis de los correlogramas (el cOlTelograma es un gnlfico del coeficiente de correlacion Vs diferentes rezagos de la sene) de los caudales

Revisia de ingenieria Civil 54

UN 111 regimen hidrgico eSlable II 51 plede e~pera IIIa correlacion alha elllre las series para dijellllleS ~ilsicamelle se espera ql(l 110 OCIlshy

blOs ell los regimenls hidrgcos middotlalc esejl asociadas fa r series-

dales aliIales 0 algllla trallsorshyde e$105 se l11polel lormalmeme ItliS Los eVln(os conclirrellles para

de dos saies sigllell ds(ribIlCioll cOUulla

7105 51 dislribllyell illdependiellleshyI fiempo de lalormaqtle eI coejishyGlllocorrdaci6 SI cOlsidera 111110

e esta ultima suposici6n el amishyuy complicado ya que debido aJ

lamado persistencia hidro16gica ~mo fa tendencia que existe en la ue a caudaJes altos anuaJes tienshycaudales altos) disrninuye el conshyfonnacion que tenga sobre un logico (Matalas y Langbein 2)

iones limitan la apbcabilidad de S obtenidos mediante la transfeshynnacion y tal vez la Ultima menshyque presenta los mayores inconshylas series de caudaJes debido a on existente dentro de ellas

es hantratado este tema ya que te los procesos hidrologicos racter autoregresivo (10 que

el valor de una variable hidroshyen el momento presente depenshyores precedentes) Munera demas de los resultados de las

s sobre los caudales de divershyemostrado est a aprecjaci6n 4 p1 2) haciendo w amilisis amas (el correiograrna es un

eficien te de correlacion V s os de la serie) de los caudales

anuaIes en una muestra de 140 estaciones de medici6n encontro que 124 tenian un coeflshyciente de correlacion de primer orden posishytivo

Para valores de caudaJes medios diarios se analizaron re-gistros de 17 rios (Quimpo 1967 p18) y se encontraron correlaciones seriales que variaban entre 056 y 097

Otros aspectos de la autocorrelacion de Jos caudales sobre Jos aruilisis hidrologicos han sido anaJizados en distintas investigaciones entre las que se pueden mencionar los trashybajos de Leopold (1959) MataJas y Langbein (1962) y Lloyd (1963) que han demos~ado que la autocorrelacion reduce Ja confiablhdad de los otros parametros estadisticos de las series de caudales e incrementa los requerishymientos de almacenamiento para objetos de regulaci6n de los caudales de Wl rio

Ademas de los trabajos anteriores Fiering (1967 p 29) desarrollo un estimador de la funcion de aulorrelacion de los caudales anuashyles bas ado en la suposici6n de estacionarieshydad de las series de caudaJes Tarnbien se desashyrrollo un modele para estimar la estructura de correlacion de los caudales menslla1es suposhyniendo la no estacionariedad en el proceso

EI resumen anterior sobre las investigaciones realizadas a cerca de la autocorrelacion se ha hecho con el prop6sito de indicar hasta que punto son vaJidas las suposicioI1s que se acepshytan para efectuar la transferencla de Infonnashycion sin 1a cual seria muy dispendioso el calculo maternalico de los modelos

Estimacion de los panunetros de la regresion Retomalldo la ecuaci6n (4)

Y (i) = a + bx(i) (4)

Revisla de ingenieria Chil

y aplicando el metodo de estimaci6n ~e mishynjmos Cl adrados se tiene que los coeficlentes a y b son aquellos valores que minimizan la suma de los cuadrados de las desviaciones (0 residuales) 10 que se expresa matematlcamenshyte como

N

minZ = [g () -y (i)l (5) i-I

o = [g (i) - a - bx (i) (6)

i-I

en donde

y3 (i) Valor estimado por la regresi6n y (i) Valor muestraI i de la serie y x (i) Valor muestral i de la sene x

N NLimero de h~nninos de la regrest6n

Es decir que Z es Wla funci6n de a y b P~a que esta funcion tenga lUl minimo es necesano que se cwnplan las igualdades

(7)

D

Resolviendo el sistema anterior se obtiene

a=y-b x (8)

u

L X( I) Y (I) - Nxy i-I

b = ------ (9) a

L x2 - Nx2

(I)

i-I

RevlSla de Ingenieria Civil 55

en donde x e Y son los valores medios de las series x e Ypara la muestra de lamru10 N

De acuerdo con esto si se desea extender el registro en una estacion y cuenta con ~ datos de caudal 0 precipitacion medios mensuales trimestrales anuales etc a partir de un regisshytro mas extenso en una estaci6n x que cuenta con ~+01 datos de la misma variable se aplica la regresion lineal al siguiente arreglo de datos

x(l) x(2)x(3) x(nl) x(01+02)

y(l) y(2)y(3) Y(Dl)

No es necesario que las dos series comiencen a terrnioen en fonna simultanea ni tampoco que lodos los registros sean consecUllvos

La fonna 6ptima de la ecuaci6n (l ) esta dada como

S (y(D) Yo = y(nl ) + i (x (n) - x(nraquo)

S (X(D1)] (10)

En donde

y (1) Valor estimado i de la serie y a partir de la regresi6n Medias muestrales de los III

valores de y y x respeetivashymente

S(Y(D)I S(x(nraquo) Desviaciones estandar muesshy

trales de los 0 valores de y y x respectivamente

r Valor estimado del coeficiente de correiacion entre x e y para los 0 valores

56

De esla matlera para Wl valor faltante Y(I) se entra en la ecuaeion con el valor de x(I) de intervalo de tiempo de interes y se hana el valor estimado Y (I)

La teeDica de regresion lineal ha sido ampliashymente estudiada por muchos autores como instrumento eficaz en la extension de series con pocos registros

Los faetores de los cuales depende el mejorashymiento de los parametros son la longitud del registro original y el coeficiente de correlaeion entre las series

Existe un parametro conocido como Inforshymacion relativa I definido como la relad6n entre la varianza de un pariunetro estadistico estimado con el registro original y la varianza estimada a partir del registro exteudido (comshybinado) (Fiering1962 p 21 ) Este parametro se da en tenninos de las varianzas debido a que es Wla medida de confiabilidad de un estishymador que esta dada por su varianza

En otros termmos Informacioo Relativa I

1= (Va rianza(serie origioal)]rVarianshyza(serie extendida)1

Cuando I gt 1 se concJuye que es mas preciso el estimador de la serie extendida ya que 1a varianza de parametro de esta es meuor que la varianza de la serie original

Por otro lade cuando la varianza del parametro de la serie extendida es mayor que la varianza del panlmetro el valor de I (lnfonnaci6n relativa) se haee menor que uno esto da a entender que es menos preciso y por Jo anterior el pro-cedimiento de regresion entendido como la aplicacion de la ecuacion (4 ) no debe ser uti lizado

Revisla de ingenieriaivil

a para un valor faltante y se (I)

uaclon con el valor de x de (I) empo de Ulteres y se haUa el

o

Y(I)

egresi6n lineal ha side amptiashya por muchos autores como caz en la extensi6n de series tros

los cuales depende el mejorashyarimetros son la longitud del yel coeficiente de correlaci6n

eLro conocido como InforshyI definido como ta relaci6n de un parametro estadistico

registro original y la varianza r del registro extendido (comshyg1962 p 2) Este parametro

de las varianzas debido a da de confiabilidad de un estishydada por su varianza

s Informacion Relativa I

(serie originaJ)JlI Varianshyida)1

concluye que es mas preciso la serie extendida ya que la

etro de esta es menor que sene original

do la varianza del parametro Ida es mayor que la varianza I valor de I (lnfonnaci6n menor que uno esto da a menos preciso y por 10

cedJmiento de regresion a aplicacion de la ecuacion tilizado

Revisfa de ingentelia Civil

Otro cri terio para 1a eval l3cion de 1a aplicashycion de los metodos anteriores se dispone del Error Medio Cuadratico (EMe) de cual shyquier parametro estadistico 91 definido como el valor esperado de la desviaci6n del esti mado sesgado y el es timado r insesgado de panmetro

Es deseable desde el punto de vista flSico que el EMC se aproxime aCERO cuando T (EI intervalo de tiempo mue tral ) aUln nte

Entonc 5 para Ull T gra nde cualquier estim dor neeesariamente lenderia a Ull

valor muy cereano al de Ull estimador vcrshydadero 0 Los estimadores que tienen sla

1

propiedad se deno l inan es ti madores eonsislentes Puede verse que el EMC se reduce a

EI(r8)31- pound 1lt -pound1 + pound11 - 81 21

- pound1(4) - pound[qJ)JI + 2pound1(41 - poundlqJ) (pound14gt1shy

4gt)1 + poundf(poundlq1 - qYI

EI segundo termino se all ula ya que

pound141 - pound14gt1- pound[4gt1- pound14gt1 - 0

pound1(41 - 8)2== pound1(4) - pound14gt ])21 + poundI(Eiq 1 shy

(12)

La eClIaeion (12) indica que el EMC es la suma de dos partes la primera es la vari anza del estimado que se expresa como

Varlq1 = 02 = pound1(4) -EI4gt1)11= EW 1 shyE214gt11

( 13)

y la segunda es el cuadrante del sesgo del estimador

Es decir que en tenninos de varianza y el cuadrado del sesgo el EMC es

Esta presentacion breve de la teoria sobre EMC se justifica debido a que es uno de los criterio ut ilizados on mas frecllencia en la mayoria de las tecnicas de reconstrucei6n de registros para comparar la ealidad de los parametros observados COil 10 panimetros est imados

Otros a pectos del analisis de regrcsion simple La eonfiabilidad de la regresion esta medida por el elTor estandar 0 error tapico que se define como la desviacion estandar de la distribllci6n (nonnal) de los residuales al Tededor de la linea de regresion tal c mo 10 mue tra la Figura 2

y

--__-_________ x

FIGURA 2 Di Iribucion NORMAL de los puntos alrededor de la li nea de regresion

Revisa de ngenieria Civil 57

Por definicion eI error estandar es el mismo a travez de todo el rango de x Tambien se conoce como error estandar del estimado error estandar de la regresion 0 desviacion eslandar de fa regresion

El error estandar del dato calculado mediante la tecnica de relYfesion se compone de tres partes el error de la media el error de 1a pel1shydiente de la linea y el error cstandar del estimado De esta [onna el error eSlandar de la prediccion es

(x - xV 1+-+(----)SEP= SEE (y)

N I (X - X)2

( 16)

en donde

SEP Error estandar de la precipitacion SEE(y) Error esl andar del estimado N Niunero de datos de 1a regresion

El SEE(y) se define mediante la ecuacion

N

L Iy - a - blx(i) - iW i-I

SEE (y)

N-K ( 17)

n

i-I (18) N-K

en donde

58

SEE(y) Error estandar del estimado k Grados de libertad en este caso el

I1lllnero de coeficientes de la Hllea de regresion (k=2)

EI SEE(y) mediante la ecuaciones 17 y 18 se mide el porcentaje de la varianza de la variab le dependienle no explicada por la regresion EI error estandar del estimado de la regresion puede util izarse como un estimashydor razonable del error estandar de la predicshycion ya que la inexactitlld de fa ecuacion de regresion general mente es peqllefia en compashyracion con la di spersion de los datos alrededor de la linea de regresiolL

En otros tenninos el error total de cstimacion es

Error total = Erro r no explicado + Error cxplicado

Graficamente esla re lacion se pliede ver en la fig ura 3

Olra de las caracteristicas importanles que se pueden oblener de la regresion es el coetishycienle de delerminacicl11 R2 y se define pOl

la relacion entre el error explicado y el error lotal

V-y

y- + bx

x

FIGURA 3 Composicion del error total

Relista de fngenieria Civil

frror estandar del estimado lrados de Iibertad en este caso el unero de coeficientes de la linea

regresion (k=2)

mediante la eCllaciolles 17 y 18 porcentaje de la varianza de la pendiente no expli cada por la I error cst3Jldar del estimado de puede utilizarse como un estimashy

tIe del error estandar de la predicshy=la inexact it lid de la ecuacion de neralmente es pequella en compashy1dispersion de los datos alrededor Ie rehTesion

Iinos el elTor total de cstimaci6n

= Erro r no explicado + Error

e esta relaci6n se puede ver ell

caractcristlcas importantes que tener de la regresi6n es el coefishyenninaci6n R2 y se define por lire el error expJicado y

y- + bx

x

3 Composicion del error tOlal

Revisfa de ingemeria Civil

Rl = Error Explicado I (Error totnl en donde R es el coe1iciente de con-elaci6n

Con el fin de poder detenninar la confiabi lidad de In aplicacion de este metodo se pueden analizar alb1l1laS caracteristicas impol1antes Con el amllisis de eslas se detenninan pautas importantes a seguir para detenninar la con 11 ashybilidad de los resultados al ser apicados en las series de datos lales como

Coeficiente de determinacion Este coefishyciente se pucde eswdiar de dos maneras

- Medida de mejoramiento en la estimacion de y lIt ilizando la linea de regresi6n

Este mejoramiento se mide resp cto al error total el valor de R2 = I indica que In reduccion del error total es completa al ser estimado y mediante esle metodo

- Si R2 = 07 la reducci6n del error total debido a la determinaci6n de la linea de regresion es del 70

- Calidad del aj uste y medida de Iinealidad EI valor de R2 tiende a I cuando 10 pun tos se acercan a la linea de rebTesion Y se acercan a lIna linea rect a

Se puede 1I1i lizar otro crit rio dado por la relaci6n ent re R2 y SEE2(y) dad por

SfP (y) = (I - In )1 (y) (20)

de donde S2(y) es el estimado de la varianza d y_

De la anterior relacion se deduce que estos cntenos son complementarios debido a que p~r medio de ell os se puede obtencr el porcenshytaJe de varianza de y no explicado por la

Revista de il7genieria Civil

rehTesi6n indicando una medida de Ja caJidad del ajusk de elIas

Allalizando los resultados de la aplicacion de este criterio se deduce 10 siguiellte

Ell la medida en qlle aumente el vaJor de R es mas confiable la regresion y en compleshymento el valor de SEE(y) al ser mas pequeno

No necesariamente los val ores de estos dos parametros R y SEE son buenos illdicadores de la calidad de la eClIaci6n de estimaci6n para val ores muy alejados de los valores medios

Otra manera de obtener una idea de la bondad del ajuste 10-hTado ell la regresion es mediante el analisi grafico de los residuos

Sc efectlla ulla gnitica de los val orcs de y(i) contra los valores estimados Para Ull aju te perfecto se debe obtener una linea recta de 45 que pasa por el origen sobre la que se disshypersaJllos puntos a lado y lado ClIalqllier vashyriacion de esta linea puede atribuir e a que las sllposiciones hechas sobre los errore (meshydia cero varianza COLlstante y distribuci6n nonnal) no se ha cwnplido 10 cllal debe ser corregido efectllando alglll1 tipo de transforshymacion sobre los datos originales 0 mediante otros artificios

Otro hTafico de interes en el anaJisis es el de residuos contra tiempo colocando los errores en ULl grafico en su orden cronol6gico para detectar posibles ciclos 0 estacionalidades ell los registros

Ell seguida se presentan temas concemienleS a la teoria de decisiones y a las pruebas de hi p6tesis

59

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 3: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

-- --- ---

o para describir lin delenninado

grMico de correlaci6n entre dos cual se analizara adelante puede tes pautas sobre el tipo de regreshy

debe emplear

eccionado el modele apropiado ktenninar los coeficientcs de la bcdetc) por cualquiera de los stentes siendo el de los minimos el de mayor lItilizacion ell los e regresion lineal

formacion de valiables

los dalos originales de las variashydas en una eCliacion de regreshy

onnan mediante arti ficios Illateshyten Ires razones principales para nsfonllacion

x

v~bxla

lC

es de regresi6n

Relisla de Ingenieria (I)il

- Aproximar la dislribucion marginal de las variables transfonnada a la di tribllcioll norshymal

- La variacion de los PlUltO a 10 largo de la linea de re Tesion C ilia homogenea

- Obt ener una va rianz igual alrededor de la linea de regresion a Irave de lodo el range de aplicacion

Algunas Iransfonllaciones a manera de ejemshyplo para linealizar fllnciones son las siguienshyles

Tipo de funcion Eeuacion en forma lineal

y= a + bx y = a + bx (I) y= ben log Y= log b + a (Ioge)x (2) y= ax log y = log a + b log x (3)

Sobre este lil limo ti po de transfo rmacion Hirsch (1979 p 1783) hizo ulla compa racioll con elm todo c1asico d regresion linea l COil respecto a est se hablara en la pal1e ded icada a la reTesion en el espacio logarilmico

En el I xto d how ( I 964 p8-49 Tabla 8shy11-2) se puede enconlrar lIna lisla de tales trail sfolll1aciones

2122 Regresion linenl imple (AJlIsle anal itico)

Posibl mellte el modele COmtllllllenle lItilizado en hidrologia se basa en la slIposicion de una relaci6n li neal ent re do va riab les y Sll objelishyvo principal radica en e limar Li ll a variable (dependiente) a paJ1 ir del conocimiento de otra ariable (independicllte)

El resultado fin al de la regreslonlineal de LI lla variable Y conlra otra variable X es una linea recta que da el mejor estllnado de Y para UIl

valor dado de X Talllbien se puede determi-

Revislu de Ingenieriu (ili

nar la linea recla que da el mejor eslllllado de X para Ill valor dado de Y esas dos rectas no necesari1mente son iguales

1 hictrologia generalmente solo se utiliza la primera de estas regresiones dada por la ecuacion (4)

y (i) a hx (i) (4 )

ell donde

y (i) Valor eslimado de la variable dependienle y

a y b Intercepto y pendiellte de la linea de regresion

x(i) Valor de la varia Ie dependiente x

Las premisas en que basa eJ metodo de regreshysian lineal desde el punto de vista estadi lICO son las sigllientes

- La variable illJepellJiellle e( exellll de errore lIIielllros ile eslas solamellie OCIIshy

rrell ell 10 Wrrtohe Jepelldiellie

- Ia oriallzu de 10 anable depelidiellie 110 depende de los val ores de la variable ilidepelidielile

- I os alores regislrlldos de la (riahle depelldiellie SOli variables alealorias 111

coneucicill ShUll) el al (J9W p f 28)

Para la aplicacJan de las pruebas de signifishycancia estadistica de la regresion se supone que la poblaci6n de la variable dependienle se di Iri bllye nonnalmente alrededor de la linea de reTesion para clialquier valor consshylanle de la variable independienle

M s adelante dentro de l analisis de regresion linea Illlli lip le se miraran eslas suposiciones a la luz de los fcnomcnos hidrologic s y se vera en que med ida se ajustan a la realidad fislca

53

La aplicacion de la ectlacion (1) al tema del presente trabajo resuJta directa Para el caso de caudales medjos mensuales y niveles de agregacion mayores se extiende el registro de la estacion que presenta un registro corto (estaci6n satelite) a la que se asocia la variashyble Ymediante el registro extenso de otra estashyci6n que se escoja dentro de un grupo de estashyciones vecinas y a la que se asocia La variable X (estacion base 0 pivote)

HI criterio de seleccion de la estacion base que parece razonable y que es el utilizado en la uteratura sobre el tema es el de la estacion que tenga el alto coeficieute de cOlTeiacion muestral can la eslacion sateute Tambien se puede lIenar el vacio de un dato fait ante simshyplemente entrando a la ecuacion (4) de regresion con el valor de X Cuando a1gunas observaciones estru] perdidas (es decir que son vacios en el registro) el ajuste de lUl modeshy10lineaJ basado en el principio de los minimos cuadrados es el procedimiento desarrollado para estimar los vaJores de las observaciones perdidas (Wilkinson1958 p 257)

Hay que anotar que el mismo procedimiento puede aplicarse para registros incompletos de precipitacion con las mismas suposiciones y con el mjsmo anw sis de resultados Este proshycedimiento se conoce con el nombre de transshyferencia de infonnacion hidrologica de ulla estacion a otra

Muchos autores abordan este tema sobre todo en el sentido de mejorar los estimadores de los panunetros estadisticos de las series de registros reconstruidos

En el caso especifico de las series de caudales medios la base de las hipotesis sobre los que se apoya todo el ellfoque de la transferellcia de la infonl1aci6n segull Fiering (1 963 p 2) es la siguiente

-Se supale 1111 reglmel hidral6gico esabe o sea que se plede esperar 110 correlacioll igllijiealila elltre las series para diferellles

silios Bavieamellle se espera que IO oellshyrran cambios ell los regimelles hidrol6gicos COli los middotlIoles eSIQI1 asociadas las series

-Los eaudales allllaies 0 algllllo Irollsjorshymaeitjll de estos se slIpoel1 narmamenll dislribllidos Los ellentos cOlcurrelfes para el coso de dbs s(ries sigleJ dislribllcian lIomlOl cOlljllllla

-Los ellelllOS se dislribllyel illdependiellleshymente en el liempo de taljormaqlle el coefishycielle de allacorreaeian Sl eOlsldela 111110

De no hacerse esta Ultima suposicion el anashylisis seria muy complicado ya que debido a1 fen6meno Hamado persistencia hidrologjca (definido como la tendencia que existe en la naturaleza que a caudales altos anuales tienshyden a seguir caudaJes altos) disminuye eL cooshytenido de informacion que tenga sobre un evento hidroJogico (Matalas y Langbein 1962 p 3442)

Estas suposiciones Iimjtan la aplicabilidad de los resultados obterudos mediante la transfeshyrencia de infonnacion y taJ vez la ultima menshyciollada sea la que present a los mayores inconshyvenientes en las senes de caudales debido a la autoregresi6n existente dentro de elias

Muchos autores han tratado este tema ya que intuitivamente los procesos hidrologicos poseen UD caracter autoregresivo (10 que si gnifica que el valor de Wla variable hidroshymetecrol6gica en el momento presente depenshyde de los valores precedentes) MllJ1era (1 983 p26) Ademas de los resultados de las investigaciones sabre los caudales de divershysos rios han demostrado esta apreciaciou Yevjevich (1964 p12) haciendo w] analisis de los correlogramas (el cOlTelograma es un gnlfico del coeficiente de correlacion Vs diferentes rezagos de la sene) de los caudales

Revisia de ingenieria Civil 54

UN 111 regimen hidrgico eSlable II 51 plede e~pera IIIa correlacion alha elllre las series para dijellllleS ~ilsicamelle se espera ql(l 110 OCIlshy

blOs ell los regimenls hidrgcos middotlalc esejl asociadas fa r series-

dales aliIales 0 algllla trallsorshyde e$105 se l11polel lormalmeme ItliS Los eVln(os conclirrellles para

de dos saies sigllell ds(ribIlCioll cOUulla

7105 51 dislribllyell illdependiellleshyI fiempo de lalormaqtle eI coejishyGlllocorrdaci6 SI cOlsidera 111110

e esta ultima suposici6n el amishyuy complicado ya que debido aJ

lamado persistencia hidro16gica ~mo fa tendencia que existe en la ue a caudaJes altos anuaJes tienshycaudales altos) disrninuye el conshyfonnacion que tenga sobre un logico (Matalas y Langbein 2)

iones limitan la apbcabilidad de S obtenidos mediante la transfeshynnacion y tal vez la Ultima menshyque presenta los mayores inconshylas series de caudaJes debido a on existente dentro de ellas

es hantratado este tema ya que te los procesos hidrologicos racter autoregresivo (10 que

el valor de una variable hidroshyen el momento presente depenshyores precedentes) Munera demas de los resultados de las

s sobre los caudales de divershyemostrado est a aprecjaci6n 4 p1 2) haciendo w amilisis amas (el correiograrna es un

eficien te de correlacion V s os de la serie) de los caudales

anuaIes en una muestra de 140 estaciones de medici6n encontro que 124 tenian un coeflshyciente de correlacion de primer orden posishytivo

Para valores de caudaJes medios diarios se analizaron re-gistros de 17 rios (Quimpo 1967 p18) y se encontraron correlaciones seriales que variaban entre 056 y 097

Otros aspectos de la autocorrelacion de Jos caudales sobre Jos aruilisis hidrologicos han sido anaJizados en distintas investigaciones entre las que se pueden mencionar los trashybajos de Leopold (1959) MataJas y Langbein (1962) y Lloyd (1963) que han demos~ado que la autocorrelacion reduce Ja confiablhdad de los otros parametros estadisticos de las series de caudales e incrementa los requerishymientos de almacenamiento para objetos de regulaci6n de los caudales de Wl rio

Ademas de los trabajos anteriores Fiering (1967 p 29) desarrollo un estimador de la funcion de aulorrelacion de los caudales anuashyles bas ado en la suposici6n de estacionarieshydad de las series de caudaJes Tarnbien se desashyrrollo un modele para estimar la estructura de correlacion de los caudales menslla1es suposhyniendo la no estacionariedad en el proceso

EI resumen anterior sobre las investigaciones realizadas a cerca de la autocorrelacion se ha hecho con el prop6sito de indicar hasta que punto son vaJidas las suposicioI1s que se acepshytan para efectuar la transferencla de Infonnashycion sin 1a cual seria muy dispendioso el calculo maternalico de los modelos

Estimacion de los panunetros de la regresion Retomalldo la ecuaci6n (4)

Y (i) = a + bx(i) (4)

Revisla de ingenieria Chil

y aplicando el metodo de estimaci6n ~e mishynjmos Cl adrados se tiene que los coeficlentes a y b son aquellos valores que minimizan la suma de los cuadrados de las desviaciones (0 residuales) 10 que se expresa matematlcamenshyte como

N

minZ = [g () -y (i)l (5) i-I

o = [g (i) - a - bx (i) (6)

i-I

en donde

y3 (i) Valor estimado por la regresi6n y (i) Valor muestraI i de la serie y x (i) Valor muestral i de la sene x

N NLimero de h~nninos de la regrest6n

Es decir que Z es Wla funci6n de a y b P~a que esta funcion tenga lUl minimo es necesano que se cwnplan las igualdades

(7)

D

Resolviendo el sistema anterior se obtiene

a=y-b x (8)

u

L X( I) Y (I) - Nxy i-I

b = ------ (9) a

L x2 - Nx2

(I)

i-I

RevlSla de Ingenieria Civil 55

en donde x e Y son los valores medios de las series x e Ypara la muestra de lamru10 N

De acuerdo con esto si se desea extender el registro en una estacion y cuenta con ~ datos de caudal 0 precipitacion medios mensuales trimestrales anuales etc a partir de un regisshytro mas extenso en una estaci6n x que cuenta con ~+01 datos de la misma variable se aplica la regresion lineal al siguiente arreglo de datos

x(l) x(2)x(3) x(nl) x(01+02)

y(l) y(2)y(3) Y(Dl)

No es necesario que las dos series comiencen a terrnioen en fonna simultanea ni tampoco que lodos los registros sean consecUllvos

La fonna 6ptima de la ecuaci6n (l ) esta dada como

S (y(D) Yo = y(nl ) + i (x (n) - x(nraquo)

S (X(D1)] (10)

En donde

y (1) Valor estimado i de la serie y a partir de la regresi6n Medias muestrales de los III

valores de y y x respeetivashymente

S(Y(D)I S(x(nraquo) Desviaciones estandar muesshy

trales de los 0 valores de y y x respectivamente

r Valor estimado del coeficiente de correiacion entre x e y para los 0 valores

56

De esla matlera para Wl valor faltante Y(I) se entra en la ecuaeion con el valor de x(I) de intervalo de tiempo de interes y se hana el valor estimado Y (I)

La teeDica de regresion lineal ha sido ampliashymente estudiada por muchos autores como instrumento eficaz en la extension de series con pocos registros

Los faetores de los cuales depende el mejorashymiento de los parametros son la longitud del registro original y el coeficiente de correlaeion entre las series

Existe un parametro conocido como Inforshymacion relativa I definido como la relad6n entre la varianza de un pariunetro estadistico estimado con el registro original y la varianza estimada a partir del registro exteudido (comshybinado) (Fiering1962 p 21 ) Este parametro se da en tenninos de las varianzas debido a que es Wla medida de confiabilidad de un estishymador que esta dada por su varianza

En otros termmos Informacioo Relativa I

1= (Va rianza(serie origioal)]rVarianshyza(serie extendida)1

Cuando I gt 1 se concJuye que es mas preciso el estimador de la serie extendida ya que 1a varianza de parametro de esta es meuor que la varianza de la serie original

Por otro lade cuando la varianza del parametro de la serie extendida es mayor que la varianza del panlmetro el valor de I (lnfonnaci6n relativa) se haee menor que uno esto da a entender que es menos preciso y por Jo anterior el pro-cedimiento de regresion entendido como la aplicacion de la ecuacion (4 ) no debe ser uti lizado

Revisla de ingenieriaivil

a para un valor faltante y se (I)

uaclon con el valor de x de (I) empo de Ulteres y se haUa el

o

Y(I)

egresi6n lineal ha side amptiashya por muchos autores como caz en la extensi6n de series tros

los cuales depende el mejorashyarimetros son la longitud del yel coeficiente de correlaci6n

eLro conocido como InforshyI definido como ta relaci6n de un parametro estadistico

registro original y la varianza r del registro extendido (comshyg1962 p 2) Este parametro

de las varianzas debido a da de confiabilidad de un estishydada por su varianza

s Informacion Relativa I

(serie originaJ)JlI Varianshyida)1

concluye que es mas preciso la serie extendida ya que la

etro de esta es menor que sene original

do la varianza del parametro Ida es mayor que la varianza I valor de I (lnfonnaci6n menor que uno esto da a menos preciso y por 10

cedJmiento de regresion a aplicacion de la ecuacion tilizado

Revisfa de ingentelia Civil

Otro cri terio para 1a eval l3cion de 1a aplicashycion de los metodos anteriores se dispone del Error Medio Cuadratico (EMe) de cual shyquier parametro estadistico 91 definido como el valor esperado de la desviaci6n del esti mado sesgado y el es timado r insesgado de panmetro

Es deseable desde el punto de vista flSico que el EMC se aproxime aCERO cuando T (EI intervalo de tiempo mue tral ) aUln nte

Entonc 5 para Ull T gra nde cualquier estim dor neeesariamente lenderia a Ull

valor muy cereano al de Ull estimador vcrshydadero 0 Los estimadores que tienen sla

1

propiedad se deno l inan es ti madores eonsislentes Puede verse que el EMC se reduce a

EI(r8)31- pound 1lt -pound1 + pound11 - 81 21

- pound1(4) - pound[qJ)JI + 2pound1(41 - poundlqJ) (pound14gt1shy

4gt)1 + poundf(poundlq1 - qYI

EI segundo termino se all ula ya que

pound141 - pound14gt1- pound[4gt1- pound14gt1 - 0

pound1(41 - 8)2== pound1(4) - pound14gt ])21 + poundI(Eiq 1 shy

(12)

La eClIaeion (12) indica que el EMC es la suma de dos partes la primera es la vari anza del estimado que se expresa como

Varlq1 = 02 = pound1(4) -EI4gt1)11= EW 1 shyE214gt11

( 13)

y la segunda es el cuadrante del sesgo del estimador

Es decir que en tenninos de varianza y el cuadrado del sesgo el EMC es

Esta presentacion breve de la teoria sobre EMC se justifica debido a que es uno de los criterio ut ilizados on mas frecllencia en la mayoria de las tecnicas de reconstrucei6n de registros para comparar la ealidad de los parametros observados COil 10 panimetros est imados

Otros a pectos del analisis de regrcsion simple La eonfiabilidad de la regresion esta medida por el elTor estandar 0 error tapico que se define como la desviacion estandar de la distribllci6n (nonnal) de los residuales al Tededor de la linea de regresion tal c mo 10 mue tra la Figura 2

y

--__-_________ x

FIGURA 2 Di Iribucion NORMAL de los puntos alrededor de la li nea de regresion

Revisa de ngenieria Civil 57

Por definicion eI error estandar es el mismo a travez de todo el rango de x Tambien se conoce como error estandar del estimado error estandar de la regresion 0 desviacion eslandar de fa regresion

El error estandar del dato calculado mediante la tecnica de relYfesion se compone de tres partes el error de la media el error de 1a pel1shydiente de la linea y el error cstandar del estimado De esta [onna el error eSlandar de la prediccion es

(x - xV 1+-+(----)SEP= SEE (y)

N I (X - X)2

( 16)

en donde

SEP Error estandar de la precipitacion SEE(y) Error esl andar del estimado N Niunero de datos de 1a regresion

El SEE(y) se define mediante la ecuacion

N

L Iy - a - blx(i) - iW i-I

SEE (y)

N-K ( 17)

n

i-I (18) N-K

en donde

58

SEE(y) Error estandar del estimado k Grados de libertad en este caso el

I1lllnero de coeficientes de la Hllea de regresion (k=2)

EI SEE(y) mediante la ecuaciones 17 y 18 se mide el porcentaje de la varianza de la variab le dependienle no explicada por la regresion EI error estandar del estimado de la regresion puede util izarse como un estimashydor razonable del error estandar de la predicshycion ya que la inexactitlld de fa ecuacion de regresion general mente es peqllefia en compashyracion con la di spersion de los datos alrededor de la linea de regresiolL

En otros tenninos el error total de cstimacion es

Error total = Erro r no explicado + Error cxplicado

Graficamente esla re lacion se pliede ver en la fig ura 3

Olra de las caracteristicas importanles que se pueden oblener de la regresion es el coetishycienle de delerminacicl11 R2 y se define pOl

la relacion entre el error explicado y el error lotal

V-y

y- + bx

x

FIGURA 3 Composicion del error total

Relista de fngenieria Civil

frror estandar del estimado lrados de Iibertad en este caso el unero de coeficientes de la linea

regresion (k=2)

mediante la eCllaciolles 17 y 18 porcentaje de la varianza de la pendiente no expli cada por la I error cst3Jldar del estimado de puede utilizarse como un estimashy

tIe del error estandar de la predicshy=la inexact it lid de la ecuacion de neralmente es pequella en compashy1dispersion de los datos alrededor Ie rehTesion

Iinos el elTor total de cstimaci6n

= Erro r no explicado + Error

e esta relaci6n se puede ver ell

caractcristlcas importantes que tener de la regresi6n es el coefishyenninaci6n R2 y se define por lire el error expJicado y

y- + bx

x

3 Composicion del error tOlal

Revisfa de ingemeria Civil

Rl = Error Explicado I (Error totnl en donde R es el coe1iciente de con-elaci6n

Con el fin de poder detenninar la confiabi lidad de In aplicacion de este metodo se pueden analizar alb1l1laS caracteristicas impol1antes Con el amllisis de eslas se detenninan pautas importantes a seguir para detenninar la con 11 ashybilidad de los resultados al ser apicados en las series de datos lales como

Coeficiente de determinacion Este coefishyciente se pucde eswdiar de dos maneras

- Medida de mejoramiento en la estimacion de y lIt ilizando la linea de regresi6n

Este mejoramiento se mide resp cto al error total el valor de R2 = I indica que In reduccion del error total es completa al ser estimado y mediante esle metodo

- Si R2 = 07 la reducci6n del error total debido a la determinaci6n de la linea de regresion es del 70

- Calidad del aj uste y medida de Iinealidad EI valor de R2 tiende a I cuando 10 pun tos se acercan a la linea de rebTesion Y se acercan a lIna linea rect a

Se puede 1I1i lizar otro crit rio dado por la relaci6n ent re R2 y SEE2(y) dad por

SfP (y) = (I - In )1 (y) (20)

de donde S2(y) es el estimado de la varianza d y_

De la anterior relacion se deduce que estos cntenos son complementarios debido a que p~r medio de ell os se puede obtencr el porcenshytaJe de varianza de y no explicado por la

Revista de il7genieria Civil

rehTesi6n indicando una medida de Ja caJidad del ajusk de elIas

Allalizando los resultados de la aplicacion de este criterio se deduce 10 siguiellte

Ell la medida en qlle aumente el vaJor de R es mas confiable la regresion y en compleshymento el valor de SEE(y) al ser mas pequeno

No necesariamente los val ores de estos dos parametros R y SEE son buenos illdicadores de la calidad de la eClIaci6n de estimaci6n para val ores muy alejados de los valores medios

Otra manera de obtener una idea de la bondad del ajuste 10-hTado ell la regresion es mediante el analisi grafico de los residuos

Sc efectlla ulla gnitica de los val orcs de y(i) contra los valores estimados Para Ull aju te perfecto se debe obtener una linea recta de 45 que pasa por el origen sobre la que se disshypersaJllos puntos a lado y lado ClIalqllier vashyriacion de esta linea puede atribuir e a que las sllposiciones hechas sobre los errore (meshydia cero varianza COLlstante y distribuci6n nonnal) no se ha cwnplido 10 cllal debe ser corregido efectllando alglll1 tipo de transforshymacion sobre los datos originales 0 mediante otros artificios

Otro hTafico de interes en el anaJisis es el de residuos contra tiempo colocando los errores en ULl grafico en su orden cronol6gico para detectar posibles ciclos 0 estacionalidades ell los registros

Ell seguida se presentan temas concemienleS a la teoria de decisiones y a las pruebas de hi p6tesis

59

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 4: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

La aplicacion de la ectlacion (1) al tema del presente trabajo resuJta directa Para el caso de caudales medjos mensuales y niveles de agregacion mayores se extiende el registro de la estacion que presenta un registro corto (estaci6n satelite) a la que se asocia la variashyble Ymediante el registro extenso de otra estashyci6n que se escoja dentro de un grupo de estashyciones vecinas y a la que se asocia La variable X (estacion base 0 pivote)

HI criterio de seleccion de la estacion base que parece razonable y que es el utilizado en la uteratura sobre el tema es el de la estacion que tenga el alto coeficieute de cOlTeiacion muestral can la eslacion sateute Tambien se puede lIenar el vacio de un dato fait ante simshyplemente entrando a la ecuacion (4) de regresion con el valor de X Cuando a1gunas observaciones estru] perdidas (es decir que son vacios en el registro) el ajuste de lUl modeshy10lineaJ basado en el principio de los minimos cuadrados es el procedimiento desarrollado para estimar los vaJores de las observaciones perdidas (Wilkinson1958 p 257)

Hay que anotar que el mismo procedimiento puede aplicarse para registros incompletos de precipitacion con las mismas suposiciones y con el mjsmo anw sis de resultados Este proshycedimiento se conoce con el nombre de transshyferencia de infonnacion hidrologica de ulla estacion a otra

Muchos autores abordan este tema sobre todo en el sentido de mejorar los estimadores de los panunetros estadisticos de las series de registros reconstruidos

En el caso especifico de las series de caudales medios la base de las hipotesis sobre los que se apoya todo el ellfoque de la transferellcia de la infonl1aci6n segull Fiering (1 963 p 2) es la siguiente

-Se supale 1111 reglmel hidral6gico esabe o sea que se plede esperar 110 correlacioll igllijiealila elltre las series para diferellles

silios Bavieamellle se espera que IO oellshyrran cambios ell los regimelles hidrol6gicos COli los middotlIoles eSIQI1 asociadas las series

-Los eaudales allllaies 0 algllllo Irollsjorshymaeitjll de estos se slIpoel1 narmamenll dislribllidos Los ellentos cOlcurrelfes para el coso de dbs s(ries sigleJ dislribllcian lIomlOl cOlljllllla

-Los ellelllOS se dislribllyel illdependiellleshymente en el liempo de taljormaqlle el coefishycielle de allacorreaeian Sl eOlsldela 111110

De no hacerse esta Ultima suposicion el anashylisis seria muy complicado ya que debido a1 fen6meno Hamado persistencia hidrologjca (definido como la tendencia que existe en la naturaleza que a caudales altos anuales tienshyden a seguir caudaJes altos) disminuye eL cooshytenido de informacion que tenga sobre un evento hidroJogico (Matalas y Langbein 1962 p 3442)

Estas suposiciones Iimjtan la aplicabilidad de los resultados obterudos mediante la transfeshyrencia de infonnacion y taJ vez la ultima menshyciollada sea la que present a los mayores inconshyvenientes en las senes de caudales debido a la autoregresi6n existente dentro de elias

Muchos autores han tratado este tema ya que intuitivamente los procesos hidrologicos poseen UD caracter autoregresivo (10 que si gnifica que el valor de Wla variable hidroshymetecrol6gica en el momento presente depenshyde de los valores precedentes) MllJ1era (1 983 p26) Ademas de los resultados de las investigaciones sabre los caudales de divershysos rios han demostrado esta apreciaciou Yevjevich (1964 p12) haciendo w] analisis de los correlogramas (el cOlTelograma es un gnlfico del coeficiente de correlacion Vs diferentes rezagos de la sene) de los caudales

Revisia de ingenieria Civil 54

UN 111 regimen hidrgico eSlable II 51 plede e~pera IIIa correlacion alha elllre las series para dijellllleS ~ilsicamelle se espera ql(l 110 OCIlshy

blOs ell los regimenls hidrgcos middotlalc esejl asociadas fa r series-

dales aliIales 0 algllla trallsorshyde e$105 se l11polel lormalmeme ItliS Los eVln(os conclirrellles para

de dos saies sigllell ds(ribIlCioll cOUulla

7105 51 dislribllyell illdependiellleshyI fiempo de lalormaqtle eI coejishyGlllocorrdaci6 SI cOlsidera 111110

e esta ultima suposici6n el amishyuy complicado ya que debido aJ

lamado persistencia hidro16gica ~mo fa tendencia que existe en la ue a caudaJes altos anuaJes tienshycaudales altos) disrninuye el conshyfonnacion que tenga sobre un logico (Matalas y Langbein 2)

iones limitan la apbcabilidad de S obtenidos mediante la transfeshynnacion y tal vez la Ultima menshyque presenta los mayores inconshylas series de caudaJes debido a on existente dentro de ellas

es hantratado este tema ya que te los procesos hidrologicos racter autoregresivo (10 que

el valor de una variable hidroshyen el momento presente depenshyores precedentes) Munera demas de los resultados de las

s sobre los caudales de divershyemostrado est a aprecjaci6n 4 p1 2) haciendo w amilisis amas (el correiograrna es un

eficien te de correlacion V s os de la serie) de los caudales

anuaIes en una muestra de 140 estaciones de medici6n encontro que 124 tenian un coeflshyciente de correlacion de primer orden posishytivo

Para valores de caudaJes medios diarios se analizaron re-gistros de 17 rios (Quimpo 1967 p18) y se encontraron correlaciones seriales que variaban entre 056 y 097

Otros aspectos de la autocorrelacion de Jos caudales sobre Jos aruilisis hidrologicos han sido anaJizados en distintas investigaciones entre las que se pueden mencionar los trashybajos de Leopold (1959) MataJas y Langbein (1962) y Lloyd (1963) que han demos~ado que la autocorrelacion reduce Ja confiablhdad de los otros parametros estadisticos de las series de caudales e incrementa los requerishymientos de almacenamiento para objetos de regulaci6n de los caudales de Wl rio

Ademas de los trabajos anteriores Fiering (1967 p 29) desarrollo un estimador de la funcion de aulorrelacion de los caudales anuashyles bas ado en la suposici6n de estacionarieshydad de las series de caudaJes Tarnbien se desashyrrollo un modele para estimar la estructura de correlacion de los caudales menslla1es suposhyniendo la no estacionariedad en el proceso

EI resumen anterior sobre las investigaciones realizadas a cerca de la autocorrelacion se ha hecho con el prop6sito de indicar hasta que punto son vaJidas las suposicioI1s que se acepshytan para efectuar la transferencla de Infonnashycion sin 1a cual seria muy dispendioso el calculo maternalico de los modelos

Estimacion de los panunetros de la regresion Retomalldo la ecuaci6n (4)

Y (i) = a + bx(i) (4)

Revisla de ingenieria Chil

y aplicando el metodo de estimaci6n ~e mishynjmos Cl adrados se tiene que los coeficlentes a y b son aquellos valores que minimizan la suma de los cuadrados de las desviaciones (0 residuales) 10 que se expresa matematlcamenshyte como

N

minZ = [g () -y (i)l (5) i-I

o = [g (i) - a - bx (i) (6)

i-I

en donde

y3 (i) Valor estimado por la regresi6n y (i) Valor muestraI i de la serie y x (i) Valor muestral i de la sene x

N NLimero de h~nninos de la regrest6n

Es decir que Z es Wla funci6n de a y b P~a que esta funcion tenga lUl minimo es necesano que se cwnplan las igualdades

(7)

D

Resolviendo el sistema anterior se obtiene

a=y-b x (8)

u

L X( I) Y (I) - Nxy i-I

b = ------ (9) a

L x2 - Nx2

(I)

i-I

RevlSla de Ingenieria Civil 55

en donde x e Y son los valores medios de las series x e Ypara la muestra de lamru10 N

De acuerdo con esto si se desea extender el registro en una estacion y cuenta con ~ datos de caudal 0 precipitacion medios mensuales trimestrales anuales etc a partir de un regisshytro mas extenso en una estaci6n x que cuenta con ~+01 datos de la misma variable se aplica la regresion lineal al siguiente arreglo de datos

x(l) x(2)x(3) x(nl) x(01+02)

y(l) y(2)y(3) Y(Dl)

No es necesario que las dos series comiencen a terrnioen en fonna simultanea ni tampoco que lodos los registros sean consecUllvos

La fonna 6ptima de la ecuaci6n (l ) esta dada como

S (y(D) Yo = y(nl ) + i (x (n) - x(nraquo)

S (X(D1)] (10)

En donde

y (1) Valor estimado i de la serie y a partir de la regresi6n Medias muestrales de los III

valores de y y x respeetivashymente

S(Y(D)I S(x(nraquo) Desviaciones estandar muesshy

trales de los 0 valores de y y x respectivamente

r Valor estimado del coeficiente de correiacion entre x e y para los 0 valores

56

De esla matlera para Wl valor faltante Y(I) se entra en la ecuaeion con el valor de x(I) de intervalo de tiempo de interes y se hana el valor estimado Y (I)

La teeDica de regresion lineal ha sido ampliashymente estudiada por muchos autores como instrumento eficaz en la extension de series con pocos registros

Los faetores de los cuales depende el mejorashymiento de los parametros son la longitud del registro original y el coeficiente de correlaeion entre las series

Existe un parametro conocido como Inforshymacion relativa I definido como la relad6n entre la varianza de un pariunetro estadistico estimado con el registro original y la varianza estimada a partir del registro exteudido (comshybinado) (Fiering1962 p 21 ) Este parametro se da en tenninos de las varianzas debido a que es Wla medida de confiabilidad de un estishymador que esta dada por su varianza

En otros termmos Informacioo Relativa I

1= (Va rianza(serie origioal)]rVarianshyza(serie extendida)1

Cuando I gt 1 se concJuye que es mas preciso el estimador de la serie extendida ya que 1a varianza de parametro de esta es meuor que la varianza de la serie original

Por otro lade cuando la varianza del parametro de la serie extendida es mayor que la varianza del panlmetro el valor de I (lnfonnaci6n relativa) se haee menor que uno esto da a entender que es menos preciso y por Jo anterior el pro-cedimiento de regresion entendido como la aplicacion de la ecuacion (4 ) no debe ser uti lizado

Revisla de ingenieriaivil

a para un valor faltante y se (I)

uaclon con el valor de x de (I) empo de Ulteres y se haUa el

o

Y(I)

egresi6n lineal ha side amptiashya por muchos autores como caz en la extensi6n de series tros

los cuales depende el mejorashyarimetros son la longitud del yel coeficiente de correlaci6n

eLro conocido como InforshyI definido como ta relaci6n de un parametro estadistico

registro original y la varianza r del registro extendido (comshyg1962 p 2) Este parametro

de las varianzas debido a da de confiabilidad de un estishydada por su varianza

s Informacion Relativa I

(serie originaJ)JlI Varianshyida)1

concluye que es mas preciso la serie extendida ya que la

etro de esta es menor que sene original

do la varianza del parametro Ida es mayor que la varianza I valor de I (lnfonnaci6n menor que uno esto da a menos preciso y por 10

cedJmiento de regresion a aplicacion de la ecuacion tilizado

Revisfa de ingentelia Civil

Otro cri terio para 1a eval l3cion de 1a aplicashycion de los metodos anteriores se dispone del Error Medio Cuadratico (EMe) de cual shyquier parametro estadistico 91 definido como el valor esperado de la desviaci6n del esti mado sesgado y el es timado r insesgado de panmetro

Es deseable desde el punto de vista flSico que el EMC se aproxime aCERO cuando T (EI intervalo de tiempo mue tral ) aUln nte

Entonc 5 para Ull T gra nde cualquier estim dor neeesariamente lenderia a Ull

valor muy cereano al de Ull estimador vcrshydadero 0 Los estimadores que tienen sla

1

propiedad se deno l inan es ti madores eonsislentes Puede verse que el EMC se reduce a

EI(r8)31- pound 1lt -pound1 + pound11 - 81 21

- pound1(4) - pound[qJ)JI + 2pound1(41 - poundlqJ) (pound14gt1shy

4gt)1 + poundf(poundlq1 - qYI

EI segundo termino se all ula ya que

pound141 - pound14gt1- pound[4gt1- pound14gt1 - 0

pound1(41 - 8)2== pound1(4) - pound14gt ])21 + poundI(Eiq 1 shy

(12)

La eClIaeion (12) indica que el EMC es la suma de dos partes la primera es la vari anza del estimado que se expresa como

Varlq1 = 02 = pound1(4) -EI4gt1)11= EW 1 shyE214gt11

( 13)

y la segunda es el cuadrante del sesgo del estimador

Es decir que en tenninos de varianza y el cuadrado del sesgo el EMC es

Esta presentacion breve de la teoria sobre EMC se justifica debido a que es uno de los criterio ut ilizados on mas frecllencia en la mayoria de las tecnicas de reconstrucei6n de registros para comparar la ealidad de los parametros observados COil 10 panimetros est imados

Otros a pectos del analisis de regrcsion simple La eonfiabilidad de la regresion esta medida por el elTor estandar 0 error tapico que se define como la desviacion estandar de la distribllci6n (nonnal) de los residuales al Tededor de la linea de regresion tal c mo 10 mue tra la Figura 2

y

--__-_________ x

FIGURA 2 Di Iribucion NORMAL de los puntos alrededor de la li nea de regresion

Revisa de ngenieria Civil 57

Por definicion eI error estandar es el mismo a travez de todo el rango de x Tambien se conoce como error estandar del estimado error estandar de la regresion 0 desviacion eslandar de fa regresion

El error estandar del dato calculado mediante la tecnica de relYfesion se compone de tres partes el error de la media el error de 1a pel1shydiente de la linea y el error cstandar del estimado De esta [onna el error eSlandar de la prediccion es

(x - xV 1+-+(----)SEP= SEE (y)

N I (X - X)2

( 16)

en donde

SEP Error estandar de la precipitacion SEE(y) Error esl andar del estimado N Niunero de datos de 1a regresion

El SEE(y) se define mediante la ecuacion

N

L Iy - a - blx(i) - iW i-I

SEE (y)

N-K ( 17)

n

i-I (18) N-K

en donde

58

SEE(y) Error estandar del estimado k Grados de libertad en este caso el

I1lllnero de coeficientes de la Hllea de regresion (k=2)

EI SEE(y) mediante la ecuaciones 17 y 18 se mide el porcentaje de la varianza de la variab le dependienle no explicada por la regresion EI error estandar del estimado de la regresion puede util izarse como un estimashydor razonable del error estandar de la predicshycion ya que la inexactitlld de fa ecuacion de regresion general mente es peqllefia en compashyracion con la di spersion de los datos alrededor de la linea de regresiolL

En otros tenninos el error total de cstimacion es

Error total = Erro r no explicado + Error cxplicado

Graficamente esla re lacion se pliede ver en la fig ura 3

Olra de las caracteristicas importanles que se pueden oblener de la regresion es el coetishycienle de delerminacicl11 R2 y se define pOl

la relacion entre el error explicado y el error lotal

V-y

y- + bx

x

FIGURA 3 Composicion del error total

Relista de fngenieria Civil

frror estandar del estimado lrados de Iibertad en este caso el unero de coeficientes de la linea

regresion (k=2)

mediante la eCllaciolles 17 y 18 porcentaje de la varianza de la pendiente no expli cada por la I error cst3Jldar del estimado de puede utilizarse como un estimashy

tIe del error estandar de la predicshy=la inexact it lid de la ecuacion de neralmente es pequella en compashy1dispersion de los datos alrededor Ie rehTesion

Iinos el elTor total de cstimaci6n

= Erro r no explicado + Error

e esta relaci6n se puede ver ell

caractcristlcas importantes que tener de la regresi6n es el coefishyenninaci6n R2 y se define por lire el error expJicado y

y- + bx

x

3 Composicion del error tOlal

Revisfa de ingemeria Civil

Rl = Error Explicado I (Error totnl en donde R es el coe1iciente de con-elaci6n

Con el fin de poder detenninar la confiabi lidad de In aplicacion de este metodo se pueden analizar alb1l1laS caracteristicas impol1antes Con el amllisis de eslas se detenninan pautas importantes a seguir para detenninar la con 11 ashybilidad de los resultados al ser apicados en las series de datos lales como

Coeficiente de determinacion Este coefishyciente se pucde eswdiar de dos maneras

- Medida de mejoramiento en la estimacion de y lIt ilizando la linea de regresi6n

Este mejoramiento se mide resp cto al error total el valor de R2 = I indica que In reduccion del error total es completa al ser estimado y mediante esle metodo

- Si R2 = 07 la reducci6n del error total debido a la determinaci6n de la linea de regresion es del 70

- Calidad del aj uste y medida de Iinealidad EI valor de R2 tiende a I cuando 10 pun tos se acercan a la linea de rebTesion Y se acercan a lIna linea rect a

Se puede 1I1i lizar otro crit rio dado por la relaci6n ent re R2 y SEE2(y) dad por

SfP (y) = (I - In )1 (y) (20)

de donde S2(y) es el estimado de la varianza d y_

De la anterior relacion se deduce que estos cntenos son complementarios debido a que p~r medio de ell os se puede obtencr el porcenshytaJe de varianza de y no explicado por la

Revista de il7genieria Civil

rehTesi6n indicando una medida de Ja caJidad del ajusk de elIas

Allalizando los resultados de la aplicacion de este criterio se deduce 10 siguiellte

Ell la medida en qlle aumente el vaJor de R es mas confiable la regresion y en compleshymento el valor de SEE(y) al ser mas pequeno

No necesariamente los val ores de estos dos parametros R y SEE son buenos illdicadores de la calidad de la eClIaci6n de estimaci6n para val ores muy alejados de los valores medios

Otra manera de obtener una idea de la bondad del ajuste 10-hTado ell la regresion es mediante el analisi grafico de los residuos

Sc efectlla ulla gnitica de los val orcs de y(i) contra los valores estimados Para Ull aju te perfecto se debe obtener una linea recta de 45 que pasa por el origen sobre la que se disshypersaJllos puntos a lado y lado ClIalqllier vashyriacion de esta linea puede atribuir e a que las sllposiciones hechas sobre los errore (meshydia cero varianza COLlstante y distribuci6n nonnal) no se ha cwnplido 10 cllal debe ser corregido efectllando alglll1 tipo de transforshymacion sobre los datos originales 0 mediante otros artificios

Otro hTafico de interes en el anaJisis es el de residuos contra tiempo colocando los errores en ULl grafico en su orden cronol6gico para detectar posibles ciclos 0 estacionalidades ell los registros

Ell seguida se presentan temas concemienleS a la teoria de decisiones y a las pruebas de hi p6tesis

59

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 5: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

UN 111 regimen hidrgico eSlable II 51 plede e~pera IIIa correlacion alha elllre las series para dijellllleS ~ilsicamelle se espera ql(l 110 OCIlshy

blOs ell los regimenls hidrgcos middotlalc esejl asociadas fa r series-

dales aliIales 0 algllla trallsorshyde e$105 se l11polel lormalmeme ItliS Los eVln(os conclirrellles para

de dos saies sigllell ds(ribIlCioll cOUulla

7105 51 dislribllyell illdependiellleshyI fiempo de lalormaqtle eI coejishyGlllocorrdaci6 SI cOlsidera 111110

e esta ultima suposici6n el amishyuy complicado ya que debido aJ

lamado persistencia hidro16gica ~mo fa tendencia que existe en la ue a caudaJes altos anuaJes tienshycaudales altos) disrninuye el conshyfonnacion que tenga sobre un logico (Matalas y Langbein 2)

iones limitan la apbcabilidad de S obtenidos mediante la transfeshynnacion y tal vez la Ultima menshyque presenta los mayores inconshylas series de caudaJes debido a on existente dentro de ellas

es hantratado este tema ya que te los procesos hidrologicos racter autoregresivo (10 que

el valor de una variable hidroshyen el momento presente depenshyores precedentes) Munera demas de los resultados de las

s sobre los caudales de divershyemostrado est a aprecjaci6n 4 p1 2) haciendo w amilisis amas (el correiograrna es un

eficien te de correlacion V s os de la serie) de los caudales

anuaIes en una muestra de 140 estaciones de medici6n encontro que 124 tenian un coeflshyciente de correlacion de primer orden posishytivo

Para valores de caudaJes medios diarios se analizaron re-gistros de 17 rios (Quimpo 1967 p18) y se encontraron correlaciones seriales que variaban entre 056 y 097

Otros aspectos de la autocorrelacion de Jos caudales sobre Jos aruilisis hidrologicos han sido anaJizados en distintas investigaciones entre las que se pueden mencionar los trashybajos de Leopold (1959) MataJas y Langbein (1962) y Lloyd (1963) que han demos~ado que la autocorrelacion reduce Ja confiablhdad de los otros parametros estadisticos de las series de caudales e incrementa los requerishymientos de almacenamiento para objetos de regulaci6n de los caudales de Wl rio

Ademas de los trabajos anteriores Fiering (1967 p 29) desarrollo un estimador de la funcion de aulorrelacion de los caudales anuashyles bas ado en la suposici6n de estacionarieshydad de las series de caudaJes Tarnbien se desashyrrollo un modele para estimar la estructura de correlacion de los caudales menslla1es suposhyniendo la no estacionariedad en el proceso

EI resumen anterior sobre las investigaciones realizadas a cerca de la autocorrelacion se ha hecho con el prop6sito de indicar hasta que punto son vaJidas las suposicioI1s que se acepshytan para efectuar la transferencla de Infonnashycion sin 1a cual seria muy dispendioso el calculo maternalico de los modelos

Estimacion de los panunetros de la regresion Retomalldo la ecuaci6n (4)

Y (i) = a + bx(i) (4)

Revisla de ingenieria Chil

y aplicando el metodo de estimaci6n ~e mishynjmos Cl adrados se tiene que los coeficlentes a y b son aquellos valores que minimizan la suma de los cuadrados de las desviaciones (0 residuales) 10 que se expresa matematlcamenshyte como

N

minZ = [g () -y (i)l (5) i-I

o = [g (i) - a - bx (i) (6)

i-I

en donde

y3 (i) Valor estimado por la regresi6n y (i) Valor muestraI i de la serie y x (i) Valor muestral i de la sene x

N NLimero de h~nninos de la regrest6n

Es decir que Z es Wla funci6n de a y b P~a que esta funcion tenga lUl minimo es necesano que se cwnplan las igualdades

(7)

D

Resolviendo el sistema anterior se obtiene

a=y-b x (8)

u

L X( I) Y (I) - Nxy i-I

b = ------ (9) a

L x2 - Nx2

(I)

i-I

RevlSla de Ingenieria Civil 55

en donde x e Y son los valores medios de las series x e Ypara la muestra de lamru10 N

De acuerdo con esto si se desea extender el registro en una estacion y cuenta con ~ datos de caudal 0 precipitacion medios mensuales trimestrales anuales etc a partir de un regisshytro mas extenso en una estaci6n x que cuenta con ~+01 datos de la misma variable se aplica la regresion lineal al siguiente arreglo de datos

x(l) x(2)x(3) x(nl) x(01+02)

y(l) y(2)y(3) Y(Dl)

No es necesario que las dos series comiencen a terrnioen en fonna simultanea ni tampoco que lodos los registros sean consecUllvos

La fonna 6ptima de la ecuaci6n (l ) esta dada como

S (y(D) Yo = y(nl ) + i (x (n) - x(nraquo)

S (X(D1)] (10)

En donde

y (1) Valor estimado i de la serie y a partir de la regresi6n Medias muestrales de los III

valores de y y x respeetivashymente

S(Y(D)I S(x(nraquo) Desviaciones estandar muesshy

trales de los 0 valores de y y x respectivamente

r Valor estimado del coeficiente de correiacion entre x e y para los 0 valores

56

De esla matlera para Wl valor faltante Y(I) se entra en la ecuaeion con el valor de x(I) de intervalo de tiempo de interes y se hana el valor estimado Y (I)

La teeDica de regresion lineal ha sido ampliashymente estudiada por muchos autores como instrumento eficaz en la extension de series con pocos registros

Los faetores de los cuales depende el mejorashymiento de los parametros son la longitud del registro original y el coeficiente de correlaeion entre las series

Existe un parametro conocido como Inforshymacion relativa I definido como la relad6n entre la varianza de un pariunetro estadistico estimado con el registro original y la varianza estimada a partir del registro exteudido (comshybinado) (Fiering1962 p 21 ) Este parametro se da en tenninos de las varianzas debido a que es Wla medida de confiabilidad de un estishymador que esta dada por su varianza

En otros termmos Informacioo Relativa I

1= (Va rianza(serie origioal)]rVarianshyza(serie extendida)1

Cuando I gt 1 se concJuye que es mas preciso el estimador de la serie extendida ya que 1a varianza de parametro de esta es meuor que la varianza de la serie original

Por otro lade cuando la varianza del parametro de la serie extendida es mayor que la varianza del panlmetro el valor de I (lnfonnaci6n relativa) se haee menor que uno esto da a entender que es menos preciso y por Jo anterior el pro-cedimiento de regresion entendido como la aplicacion de la ecuacion (4 ) no debe ser uti lizado

Revisla de ingenieriaivil

a para un valor faltante y se (I)

uaclon con el valor de x de (I) empo de Ulteres y se haUa el

o

Y(I)

egresi6n lineal ha side amptiashya por muchos autores como caz en la extensi6n de series tros

los cuales depende el mejorashyarimetros son la longitud del yel coeficiente de correlaci6n

eLro conocido como InforshyI definido como ta relaci6n de un parametro estadistico

registro original y la varianza r del registro extendido (comshyg1962 p 2) Este parametro

de las varianzas debido a da de confiabilidad de un estishydada por su varianza

s Informacion Relativa I

(serie originaJ)JlI Varianshyida)1

concluye que es mas preciso la serie extendida ya que la

etro de esta es menor que sene original

do la varianza del parametro Ida es mayor que la varianza I valor de I (lnfonnaci6n menor que uno esto da a menos preciso y por 10

cedJmiento de regresion a aplicacion de la ecuacion tilizado

Revisfa de ingentelia Civil

Otro cri terio para 1a eval l3cion de 1a aplicashycion de los metodos anteriores se dispone del Error Medio Cuadratico (EMe) de cual shyquier parametro estadistico 91 definido como el valor esperado de la desviaci6n del esti mado sesgado y el es timado r insesgado de panmetro

Es deseable desde el punto de vista flSico que el EMC se aproxime aCERO cuando T (EI intervalo de tiempo mue tral ) aUln nte

Entonc 5 para Ull T gra nde cualquier estim dor neeesariamente lenderia a Ull

valor muy cereano al de Ull estimador vcrshydadero 0 Los estimadores que tienen sla

1

propiedad se deno l inan es ti madores eonsislentes Puede verse que el EMC se reduce a

EI(r8)31- pound 1lt -pound1 + pound11 - 81 21

- pound1(4) - pound[qJ)JI + 2pound1(41 - poundlqJ) (pound14gt1shy

4gt)1 + poundf(poundlq1 - qYI

EI segundo termino se all ula ya que

pound141 - pound14gt1- pound[4gt1- pound14gt1 - 0

pound1(41 - 8)2== pound1(4) - pound14gt ])21 + poundI(Eiq 1 shy

(12)

La eClIaeion (12) indica que el EMC es la suma de dos partes la primera es la vari anza del estimado que se expresa como

Varlq1 = 02 = pound1(4) -EI4gt1)11= EW 1 shyE214gt11

( 13)

y la segunda es el cuadrante del sesgo del estimador

Es decir que en tenninos de varianza y el cuadrado del sesgo el EMC es

Esta presentacion breve de la teoria sobre EMC se justifica debido a que es uno de los criterio ut ilizados on mas frecllencia en la mayoria de las tecnicas de reconstrucei6n de registros para comparar la ealidad de los parametros observados COil 10 panimetros est imados

Otros a pectos del analisis de regrcsion simple La eonfiabilidad de la regresion esta medida por el elTor estandar 0 error tapico que se define como la desviacion estandar de la distribllci6n (nonnal) de los residuales al Tededor de la linea de regresion tal c mo 10 mue tra la Figura 2

y

--__-_________ x

FIGURA 2 Di Iribucion NORMAL de los puntos alrededor de la li nea de regresion

Revisa de ngenieria Civil 57

Por definicion eI error estandar es el mismo a travez de todo el rango de x Tambien se conoce como error estandar del estimado error estandar de la regresion 0 desviacion eslandar de fa regresion

El error estandar del dato calculado mediante la tecnica de relYfesion se compone de tres partes el error de la media el error de 1a pel1shydiente de la linea y el error cstandar del estimado De esta [onna el error eSlandar de la prediccion es

(x - xV 1+-+(----)SEP= SEE (y)

N I (X - X)2

( 16)

en donde

SEP Error estandar de la precipitacion SEE(y) Error esl andar del estimado N Niunero de datos de 1a regresion

El SEE(y) se define mediante la ecuacion

N

L Iy - a - blx(i) - iW i-I

SEE (y)

N-K ( 17)

n

i-I (18) N-K

en donde

58

SEE(y) Error estandar del estimado k Grados de libertad en este caso el

I1lllnero de coeficientes de la Hllea de regresion (k=2)

EI SEE(y) mediante la ecuaciones 17 y 18 se mide el porcentaje de la varianza de la variab le dependienle no explicada por la regresion EI error estandar del estimado de la regresion puede util izarse como un estimashydor razonable del error estandar de la predicshycion ya que la inexactitlld de fa ecuacion de regresion general mente es peqllefia en compashyracion con la di spersion de los datos alrededor de la linea de regresiolL

En otros tenninos el error total de cstimacion es

Error total = Erro r no explicado + Error cxplicado

Graficamente esla re lacion se pliede ver en la fig ura 3

Olra de las caracteristicas importanles que se pueden oblener de la regresion es el coetishycienle de delerminacicl11 R2 y se define pOl

la relacion entre el error explicado y el error lotal

V-y

y- + bx

x

FIGURA 3 Composicion del error total

Relista de fngenieria Civil

frror estandar del estimado lrados de Iibertad en este caso el unero de coeficientes de la linea

regresion (k=2)

mediante la eCllaciolles 17 y 18 porcentaje de la varianza de la pendiente no expli cada por la I error cst3Jldar del estimado de puede utilizarse como un estimashy

tIe del error estandar de la predicshy=la inexact it lid de la ecuacion de neralmente es pequella en compashy1dispersion de los datos alrededor Ie rehTesion

Iinos el elTor total de cstimaci6n

= Erro r no explicado + Error

e esta relaci6n se puede ver ell

caractcristlcas importantes que tener de la regresi6n es el coefishyenninaci6n R2 y se define por lire el error expJicado y

y- + bx

x

3 Composicion del error tOlal

Revisfa de ingemeria Civil

Rl = Error Explicado I (Error totnl en donde R es el coe1iciente de con-elaci6n

Con el fin de poder detenninar la confiabi lidad de In aplicacion de este metodo se pueden analizar alb1l1laS caracteristicas impol1antes Con el amllisis de eslas se detenninan pautas importantes a seguir para detenninar la con 11 ashybilidad de los resultados al ser apicados en las series de datos lales como

Coeficiente de determinacion Este coefishyciente se pucde eswdiar de dos maneras

- Medida de mejoramiento en la estimacion de y lIt ilizando la linea de regresi6n

Este mejoramiento se mide resp cto al error total el valor de R2 = I indica que In reduccion del error total es completa al ser estimado y mediante esle metodo

- Si R2 = 07 la reducci6n del error total debido a la determinaci6n de la linea de regresion es del 70

- Calidad del aj uste y medida de Iinealidad EI valor de R2 tiende a I cuando 10 pun tos se acercan a la linea de rebTesion Y se acercan a lIna linea rect a

Se puede 1I1i lizar otro crit rio dado por la relaci6n ent re R2 y SEE2(y) dad por

SfP (y) = (I - In )1 (y) (20)

de donde S2(y) es el estimado de la varianza d y_

De la anterior relacion se deduce que estos cntenos son complementarios debido a que p~r medio de ell os se puede obtencr el porcenshytaJe de varianza de y no explicado por la

Revista de il7genieria Civil

rehTesi6n indicando una medida de Ja caJidad del ajusk de elIas

Allalizando los resultados de la aplicacion de este criterio se deduce 10 siguiellte

Ell la medida en qlle aumente el vaJor de R es mas confiable la regresion y en compleshymento el valor de SEE(y) al ser mas pequeno

No necesariamente los val ores de estos dos parametros R y SEE son buenos illdicadores de la calidad de la eClIaci6n de estimaci6n para val ores muy alejados de los valores medios

Otra manera de obtener una idea de la bondad del ajuste 10-hTado ell la regresion es mediante el analisi grafico de los residuos

Sc efectlla ulla gnitica de los val orcs de y(i) contra los valores estimados Para Ull aju te perfecto se debe obtener una linea recta de 45 que pasa por el origen sobre la que se disshypersaJllos puntos a lado y lado ClIalqllier vashyriacion de esta linea puede atribuir e a que las sllposiciones hechas sobre los errore (meshydia cero varianza COLlstante y distribuci6n nonnal) no se ha cwnplido 10 cllal debe ser corregido efectllando alglll1 tipo de transforshymacion sobre los datos originales 0 mediante otros artificios

Otro hTafico de interes en el anaJisis es el de residuos contra tiempo colocando los errores en ULl grafico en su orden cronol6gico para detectar posibles ciclos 0 estacionalidades ell los registros

Ell seguida se presentan temas concemienleS a la teoria de decisiones y a las pruebas de hi p6tesis

59

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 6: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

en donde x e Y son los valores medios de las series x e Ypara la muestra de lamru10 N

De acuerdo con esto si se desea extender el registro en una estacion y cuenta con ~ datos de caudal 0 precipitacion medios mensuales trimestrales anuales etc a partir de un regisshytro mas extenso en una estaci6n x que cuenta con ~+01 datos de la misma variable se aplica la regresion lineal al siguiente arreglo de datos

x(l) x(2)x(3) x(nl) x(01+02)

y(l) y(2)y(3) Y(Dl)

No es necesario que las dos series comiencen a terrnioen en fonna simultanea ni tampoco que lodos los registros sean consecUllvos

La fonna 6ptima de la ecuaci6n (l ) esta dada como

S (y(D) Yo = y(nl ) + i (x (n) - x(nraquo)

S (X(D1)] (10)

En donde

y (1) Valor estimado i de la serie y a partir de la regresi6n Medias muestrales de los III

valores de y y x respeetivashymente

S(Y(D)I S(x(nraquo) Desviaciones estandar muesshy

trales de los 0 valores de y y x respectivamente

r Valor estimado del coeficiente de correiacion entre x e y para los 0 valores

56

De esla matlera para Wl valor faltante Y(I) se entra en la ecuaeion con el valor de x(I) de intervalo de tiempo de interes y se hana el valor estimado Y (I)

La teeDica de regresion lineal ha sido ampliashymente estudiada por muchos autores como instrumento eficaz en la extension de series con pocos registros

Los faetores de los cuales depende el mejorashymiento de los parametros son la longitud del registro original y el coeficiente de correlaeion entre las series

Existe un parametro conocido como Inforshymacion relativa I definido como la relad6n entre la varianza de un pariunetro estadistico estimado con el registro original y la varianza estimada a partir del registro exteudido (comshybinado) (Fiering1962 p 21 ) Este parametro se da en tenninos de las varianzas debido a que es Wla medida de confiabilidad de un estishymador que esta dada por su varianza

En otros termmos Informacioo Relativa I

1= (Va rianza(serie origioal)]rVarianshyza(serie extendida)1

Cuando I gt 1 se concJuye que es mas preciso el estimador de la serie extendida ya que 1a varianza de parametro de esta es meuor que la varianza de la serie original

Por otro lade cuando la varianza del parametro de la serie extendida es mayor que la varianza del panlmetro el valor de I (lnfonnaci6n relativa) se haee menor que uno esto da a entender que es menos preciso y por Jo anterior el pro-cedimiento de regresion entendido como la aplicacion de la ecuacion (4 ) no debe ser uti lizado

Revisla de ingenieriaivil

a para un valor faltante y se (I)

uaclon con el valor de x de (I) empo de Ulteres y se haUa el

o

Y(I)

egresi6n lineal ha side amptiashya por muchos autores como caz en la extensi6n de series tros

los cuales depende el mejorashyarimetros son la longitud del yel coeficiente de correlaci6n

eLro conocido como InforshyI definido como ta relaci6n de un parametro estadistico

registro original y la varianza r del registro extendido (comshyg1962 p 2) Este parametro

de las varianzas debido a da de confiabilidad de un estishydada por su varianza

s Informacion Relativa I

(serie originaJ)JlI Varianshyida)1

concluye que es mas preciso la serie extendida ya que la

etro de esta es menor que sene original

do la varianza del parametro Ida es mayor que la varianza I valor de I (lnfonnaci6n menor que uno esto da a menos preciso y por 10

cedJmiento de regresion a aplicacion de la ecuacion tilizado

Revisfa de ingentelia Civil

Otro cri terio para 1a eval l3cion de 1a aplicashycion de los metodos anteriores se dispone del Error Medio Cuadratico (EMe) de cual shyquier parametro estadistico 91 definido como el valor esperado de la desviaci6n del esti mado sesgado y el es timado r insesgado de panmetro

Es deseable desde el punto de vista flSico que el EMC se aproxime aCERO cuando T (EI intervalo de tiempo mue tral ) aUln nte

Entonc 5 para Ull T gra nde cualquier estim dor neeesariamente lenderia a Ull

valor muy cereano al de Ull estimador vcrshydadero 0 Los estimadores que tienen sla

1

propiedad se deno l inan es ti madores eonsislentes Puede verse que el EMC se reduce a

EI(r8)31- pound 1lt -pound1 + pound11 - 81 21

- pound1(4) - pound[qJ)JI + 2pound1(41 - poundlqJ) (pound14gt1shy

4gt)1 + poundf(poundlq1 - qYI

EI segundo termino se all ula ya que

pound141 - pound14gt1- pound[4gt1- pound14gt1 - 0

pound1(41 - 8)2== pound1(4) - pound14gt ])21 + poundI(Eiq 1 shy

(12)

La eClIaeion (12) indica que el EMC es la suma de dos partes la primera es la vari anza del estimado que se expresa como

Varlq1 = 02 = pound1(4) -EI4gt1)11= EW 1 shyE214gt11

( 13)

y la segunda es el cuadrante del sesgo del estimador

Es decir que en tenninos de varianza y el cuadrado del sesgo el EMC es

Esta presentacion breve de la teoria sobre EMC se justifica debido a que es uno de los criterio ut ilizados on mas frecllencia en la mayoria de las tecnicas de reconstrucei6n de registros para comparar la ealidad de los parametros observados COil 10 panimetros est imados

Otros a pectos del analisis de regrcsion simple La eonfiabilidad de la regresion esta medida por el elTor estandar 0 error tapico que se define como la desviacion estandar de la distribllci6n (nonnal) de los residuales al Tededor de la linea de regresion tal c mo 10 mue tra la Figura 2

y

--__-_________ x

FIGURA 2 Di Iribucion NORMAL de los puntos alrededor de la li nea de regresion

Revisa de ngenieria Civil 57

Por definicion eI error estandar es el mismo a travez de todo el rango de x Tambien se conoce como error estandar del estimado error estandar de la regresion 0 desviacion eslandar de fa regresion

El error estandar del dato calculado mediante la tecnica de relYfesion se compone de tres partes el error de la media el error de 1a pel1shydiente de la linea y el error cstandar del estimado De esta [onna el error eSlandar de la prediccion es

(x - xV 1+-+(----)SEP= SEE (y)

N I (X - X)2

( 16)

en donde

SEP Error estandar de la precipitacion SEE(y) Error esl andar del estimado N Niunero de datos de 1a regresion

El SEE(y) se define mediante la ecuacion

N

L Iy - a - blx(i) - iW i-I

SEE (y)

N-K ( 17)

n

i-I (18) N-K

en donde

58

SEE(y) Error estandar del estimado k Grados de libertad en este caso el

I1lllnero de coeficientes de la Hllea de regresion (k=2)

EI SEE(y) mediante la ecuaciones 17 y 18 se mide el porcentaje de la varianza de la variab le dependienle no explicada por la regresion EI error estandar del estimado de la regresion puede util izarse como un estimashydor razonable del error estandar de la predicshycion ya que la inexactitlld de fa ecuacion de regresion general mente es peqllefia en compashyracion con la di spersion de los datos alrededor de la linea de regresiolL

En otros tenninos el error total de cstimacion es

Error total = Erro r no explicado + Error cxplicado

Graficamente esla re lacion se pliede ver en la fig ura 3

Olra de las caracteristicas importanles que se pueden oblener de la regresion es el coetishycienle de delerminacicl11 R2 y se define pOl

la relacion entre el error explicado y el error lotal

V-y

y- + bx

x

FIGURA 3 Composicion del error total

Relista de fngenieria Civil

frror estandar del estimado lrados de Iibertad en este caso el unero de coeficientes de la linea

regresion (k=2)

mediante la eCllaciolles 17 y 18 porcentaje de la varianza de la pendiente no expli cada por la I error cst3Jldar del estimado de puede utilizarse como un estimashy

tIe del error estandar de la predicshy=la inexact it lid de la ecuacion de neralmente es pequella en compashy1dispersion de los datos alrededor Ie rehTesion

Iinos el elTor total de cstimaci6n

= Erro r no explicado + Error

e esta relaci6n se puede ver ell

caractcristlcas importantes que tener de la regresi6n es el coefishyenninaci6n R2 y se define por lire el error expJicado y

y- + bx

x

3 Composicion del error tOlal

Revisfa de ingemeria Civil

Rl = Error Explicado I (Error totnl en donde R es el coe1iciente de con-elaci6n

Con el fin de poder detenninar la confiabi lidad de In aplicacion de este metodo se pueden analizar alb1l1laS caracteristicas impol1antes Con el amllisis de eslas se detenninan pautas importantes a seguir para detenninar la con 11 ashybilidad de los resultados al ser apicados en las series de datos lales como

Coeficiente de determinacion Este coefishyciente se pucde eswdiar de dos maneras

- Medida de mejoramiento en la estimacion de y lIt ilizando la linea de regresi6n

Este mejoramiento se mide resp cto al error total el valor de R2 = I indica que In reduccion del error total es completa al ser estimado y mediante esle metodo

- Si R2 = 07 la reducci6n del error total debido a la determinaci6n de la linea de regresion es del 70

- Calidad del aj uste y medida de Iinealidad EI valor de R2 tiende a I cuando 10 pun tos se acercan a la linea de rebTesion Y se acercan a lIna linea rect a

Se puede 1I1i lizar otro crit rio dado por la relaci6n ent re R2 y SEE2(y) dad por

SfP (y) = (I - In )1 (y) (20)

de donde S2(y) es el estimado de la varianza d y_

De la anterior relacion se deduce que estos cntenos son complementarios debido a que p~r medio de ell os se puede obtencr el porcenshytaJe de varianza de y no explicado por la

Revista de il7genieria Civil

rehTesi6n indicando una medida de Ja caJidad del ajusk de elIas

Allalizando los resultados de la aplicacion de este criterio se deduce 10 siguiellte

Ell la medida en qlle aumente el vaJor de R es mas confiable la regresion y en compleshymento el valor de SEE(y) al ser mas pequeno

No necesariamente los val ores de estos dos parametros R y SEE son buenos illdicadores de la calidad de la eClIaci6n de estimaci6n para val ores muy alejados de los valores medios

Otra manera de obtener una idea de la bondad del ajuste 10-hTado ell la regresion es mediante el analisi grafico de los residuos

Sc efectlla ulla gnitica de los val orcs de y(i) contra los valores estimados Para Ull aju te perfecto se debe obtener una linea recta de 45 que pasa por el origen sobre la que se disshypersaJllos puntos a lado y lado ClIalqllier vashyriacion de esta linea puede atribuir e a que las sllposiciones hechas sobre los errore (meshydia cero varianza COLlstante y distribuci6n nonnal) no se ha cwnplido 10 cllal debe ser corregido efectllando alglll1 tipo de transforshymacion sobre los datos originales 0 mediante otros artificios

Otro hTafico de interes en el anaJisis es el de residuos contra tiempo colocando los errores en ULl grafico en su orden cronol6gico para detectar posibles ciclos 0 estacionalidades ell los registros

Ell seguida se presentan temas concemienleS a la teoria de decisiones y a las pruebas de hi p6tesis

59

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 7: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

a para un valor faltante y se (I)

uaclon con el valor de x de (I) empo de Ulteres y se haUa el

o

Y(I)

egresi6n lineal ha side amptiashya por muchos autores como caz en la extensi6n de series tros

los cuales depende el mejorashyarimetros son la longitud del yel coeficiente de correlaci6n

eLro conocido como InforshyI definido como ta relaci6n de un parametro estadistico

registro original y la varianza r del registro extendido (comshyg1962 p 2) Este parametro

de las varianzas debido a da de confiabilidad de un estishydada por su varianza

s Informacion Relativa I

(serie originaJ)JlI Varianshyida)1

concluye que es mas preciso la serie extendida ya que la

etro de esta es menor que sene original

do la varianza del parametro Ida es mayor que la varianza I valor de I (lnfonnaci6n menor que uno esto da a menos preciso y por 10

cedJmiento de regresion a aplicacion de la ecuacion tilizado

Revisfa de ingentelia Civil

Otro cri terio para 1a eval l3cion de 1a aplicashycion de los metodos anteriores se dispone del Error Medio Cuadratico (EMe) de cual shyquier parametro estadistico 91 definido como el valor esperado de la desviaci6n del esti mado sesgado y el es timado r insesgado de panmetro

Es deseable desde el punto de vista flSico que el EMC se aproxime aCERO cuando T (EI intervalo de tiempo mue tral ) aUln nte

Entonc 5 para Ull T gra nde cualquier estim dor neeesariamente lenderia a Ull

valor muy cereano al de Ull estimador vcrshydadero 0 Los estimadores que tienen sla

1

propiedad se deno l inan es ti madores eonsislentes Puede verse que el EMC se reduce a

EI(r8)31- pound 1lt -pound1 + pound11 - 81 21

- pound1(4) - pound[qJ)JI + 2pound1(41 - poundlqJ) (pound14gt1shy

4gt)1 + poundf(poundlq1 - qYI

EI segundo termino se all ula ya que

pound141 - pound14gt1- pound[4gt1- pound14gt1 - 0

pound1(41 - 8)2== pound1(4) - pound14gt ])21 + poundI(Eiq 1 shy

(12)

La eClIaeion (12) indica que el EMC es la suma de dos partes la primera es la vari anza del estimado que se expresa como

Varlq1 = 02 = pound1(4) -EI4gt1)11= EW 1 shyE214gt11

( 13)

y la segunda es el cuadrante del sesgo del estimador

Es decir que en tenninos de varianza y el cuadrado del sesgo el EMC es

Esta presentacion breve de la teoria sobre EMC se justifica debido a que es uno de los criterio ut ilizados on mas frecllencia en la mayoria de las tecnicas de reconstrucei6n de registros para comparar la ealidad de los parametros observados COil 10 panimetros est imados

Otros a pectos del analisis de regrcsion simple La eonfiabilidad de la regresion esta medida por el elTor estandar 0 error tapico que se define como la desviacion estandar de la distribllci6n (nonnal) de los residuales al Tededor de la linea de regresion tal c mo 10 mue tra la Figura 2

y

--__-_________ x

FIGURA 2 Di Iribucion NORMAL de los puntos alrededor de la li nea de regresion

Revisa de ngenieria Civil 57

Por definicion eI error estandar es el mismo a travez de todo el rango de x Tambien se conoce como error estandar del estimado error estandar de la regresion 0 desviacion eslandar de fa regresion

El error estandar del dato calculado mediante la tecnica de relYfesion se compone de tres partes el error de la media el error de 1a pel1shydiente de la linea y el error cstandar del estimado De esta [onna el error eSlandar de la prediccion es

(x - xV 1+-+(----)SEP= SEE (y)

N I (X - X)2

( 16)

en donde

SEP Error estandar de la precipitacion SEE(y) Error esl andar del estimado N Niunero de datos de 1a regresion

El SEE(y) se define mediante la ecuacion

N

L Iy - a - blx(i) - iW i-I

SEE (y)

N-K ( 17)

n

i-I (18) N-K

en donde

58

SEE(y) Error estandar del estimado k Grados de libertad en este caso el

I1lllnero de coeficientes de la Hllea de regresion (k=2)

EI SEE(y) mediante la ecuaciones 17 y 18 se mide el porcentaje de la varianza de la variab le dependienle no explicada por la regresion EI error estandar del estimado de la regresion puede util izarse como un estimashydor razonable del error estandar de la predicshycion ya que la inexactitlld de fa ecuacion de regresion general mente es peqllefia en compashyracion con la di spersion de los datos alrededor de la linea de regresiolL

En otros tenninos el error total de cstimacion es

Error total = Erro r no explicado + Error cxplicado

Graficamente esla re lacion se pliede ver en la fig ura 3

Olra de las caracteristicas importanles que se pueden oblener de la regresion es el coetishycienle de delerminacicl11 R2 y se define pOl

la relacion entre el error explicado y el error lotal

V-y

y- + bx

x

FIGURA 3 Composicion del error total

Relista de fngenieria Civil

frror estandar del estimado lrados de Iibertad en este caso el unero de coeficientes de la linea

regresion (k=2)

mediante la eCllaciolles 17 y 18 porcentaje de la varianza de la pendiente no expli cada por la I error cst3Jldar del estimado de puede utilizarse como un estimashy

tIe del error estandar de la predicshy=la inexact it lid de la ecuacion de neralmente es pequella en compashy1dispersion de los datos alrededor Ie rehTesion

Iinos el elTor total de cstimaci6n

= Erro r no explicado + Error

e esta relaci6n se puede ver ell

caractcristlcas importantes que tener de la regresi6n es el coefishyenninaci6n R2 y se define por lire el error expJicado y

y- + bx

x

3 Composicion del error tOlal

Revisfa de ingemeria Civil

Rl = Error Explicado I (Error totnl en donde R es el coe1iciente de con-elaci6n

Con el fin de poder detenninar la confiabi lidad de In aplicacion de este metodo se pueden analizar alb1l1laS caracteristicas impol1antes Con el amllisis de eslas se detenninan pautas importantes a seguir para detenninar la con 11 ashybilidad de los resultados al ser apicados en las series de datos lales como

Coeficiente de determinacion Este coefishyciente se pucde eswdiar de dos maneras

- Medida de mejoramiento en la estimacion de y lIt ilizando la linea de regresi6n

Este mejoramiento se mide resp cto al error total el valor de R2 = I indica que In reduccion del error total es completa al ser estimado y mediante esle metodo

- Si R2 = 07 la reducci6n del error total debido a la determinaci6n de la linea de regresion es del 70

- Calidad del aj uste y medida de Iinealidad EI valor de R2 tiende a I cuando 10 pun tos se acercan a la linea de rebTesion Y se acercan a lIna linea rect a

Se puede 1I1i lizar otro crit rio dado por la relaci6n ent re R2 y SEE2(y) dad por

SfP (y) = (I - In )1 (y) (20)

de donde S2(y) es el estimado de la varianza d y_

De la anterior relacion se deduce que estos cntenos son complementarios debido a que p~r medio de ell os se puede obtencr el porcenshytaJe de varianza de y no explicado por la

Revista de il7genieria Civil

rehTesi6n indicando una medida de Ja caJidad del ajusk de elIas

Allalizando los resultados de la aplicacion de este criterio se deduce 10 siguiellte

Ell la medida en qlle aumente el vaJor de R es mas confiable la regresion y en compleshymento el valor de SEE(y) al ser mas pequeno

No necesariamente los val ores de estos dos parametros R y SEE son buenos illdicadores de la calidad de la eClIaci6n de estimaci6n para val ores muy alejados de los valores medios

Otra manera de obtener una idea de la bondad del ajuste 10-hTado ell la regresion es mediante el analisi grafico de los residuos

Sc efectlla ulla gnitica de los val orcs de y(i) contra los valores estimados Para Ull aju te perfecto se debe obtener una linea recta de 45 que pasa por el origen sobre la que se disshypersaJllos puntos a lado y lado ClIalqllier vashyriacion de esta linea puede atribuir e a que las sllposiciones hechas sobre los errore (meshydia cero varianza COLlstante y distribuci6n nonnal) no se ha cwnplido 10 cllal debe ser corregido efectllando alglll1 tipo de transforshymacion sobre los datos originales 0 mediante otros artificios

Otro hTafico de interes en el anaJisis es el de residuos contra tiempo colocando los errores en ULl grafico en su orden cronol6gico para detectar posibles ciclos 0 estacionalidades ell los registros

Ell seguida se presentan temas concemienleS a la teoria de decisiones y a las pruebas de hi p6tesis

59

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 8: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

Por definicion eI error estandar es el mismo a travez de todo el rango de x Tambien se conoce como error estandar del estimado error estandar de la regresion 0 desviacion eslandar de fa regresion

El error estandar del dato calculado mediante la tecnica de relYfesion se compone de tres partes el error de la media el error de 1a pel1shydiente de la linea y el error cstandar del estimado De esta [onna el error eSlandar de la prediccion es

(x - xV 1+-+(----)SEP= SEE (y)

N I (X - X)2

( 16)

en donde

SEP Error estandar de la precipitacion SEE(y) Error esl andar del estimado N Niunero de datos de 1a regresion

El SEE(y) se define mediante la ecuacion

N

L Iy - a - blx(i) - iW i-I

SEE (y)

N-K ( 17)

n

i-I (18) N-K

en donde

58

SEE(y) Error estandar del estimado k Grados de libertad en este caso el

I1lllnero de coeficientes de la Hllea de regresion (k=2)

EI SEE(y) mediante la ecuaciones 17 y 18 se mide el porcentaje de la varianza de la variab le dependienle no explicada por la regresion EI error estandar del estimado de la regresion puede util izarse como un estimashydor razonable del error estandar de la predicshycion ya que la inexactitlld de fa ecuacion de regresion general mente es peqllefia en compashyracion con la di spersion de los datos alrededor de la linea de regresiolL

En otros tenninos el error total de cstimacion es

Error total = Erro r no explicado + Error cxplicado

Graficamente esla re lacion se pliede ver en la fig ura 3

Olra de las caracteristicas importanles que se pueden oblener de la regresion es el coetishycienle de delerminacicl11 R2 y se define pOl

la relacion entre el error explicado y el error lotal

V-y

y- + bx

x

FIGURA 3 Composicion del error total

Relista de fngenieria Civil

frror estandar del estimado lrados de Iibertad en este caso el unero de coeficientes de la linea

regresion (k=2)

mediante la eCllaciolles 17 y 18 porcentaje de la varianza de la pendiente no expli cada por la I error cst3Jldar del estimado de puede utilizarse como un estimashy

tIe del error estandar de la predicshy=la inexact it lid de la ecuacion de neralmente es pequella en compashy1dispersion de los datos alrededor Ie rehTesion

Iinos el elTor total de cstimaci6n

= Erro r no explicado + Error

e esta relaci6n se puede ver ell

caractcristlcas importantes que tener de la regresi6n es el coefishyenninaci6n R2 y se define por lire el error expJicado y

y- + bx

x

3 Composicion del error tOlal

Revisfa de ingemeria Civil

Rl = Error Explicado I (Error totnl en donde R es el coe1iciente de con-elaci6n

Con el fin de poder detenninar la confiabi lidad de In aplicacion de este metodo se pueden analizar alb1l1laS caracteristicas impol1antes Con el amllisis de eslas se detenninan pautas importantes a seguir para detenninar la con 11 ashybilidad de los resultados al ser apicados en las series de datos lales como

Coeficiente de determinacion Este coefishyciente se pucde eswdiar de dos maneras

- Medida de mejoramiento en la estimacion de y lIt ilizando la linea de regresi6n

Este mejoramiento se mide resp cto al error total el valor de R2 = I indica que In reduccion del error total es completa al ser estimado y mediante esle metodo

- Si R2 = 07 la reducci6n del error total debido a la determinaci6n de la linea de regresion es del 70

- Calidad del aj uste y medida de Iinealidad EI valor de R2 tiende a I cuando 10 pun tos se acercan a la linea de rebTesion Y se acercan a lIna linea rect a

Se puede 1I1i lizar otro crit rio dado por la relaci6n ent re R2 y SEE2(y) dad por

SfP (y) = (I - In )1 (y) (20)

de donde S2(y) es el estimado de la varianza d y_

De la anterior relacion se deduce que estos cntenos son complementarios debido a que p~r medio de ell os se puede obtencr el porcenshytaJe de varianza de y no explicado por la

Revista de il7genieria Civil

rehTesi6n indicando una medida de Ja caJidad del ajusk de elIas

Allalizando los resultados de la aplicacion de este criterio se deduce 10 siguiellte

Ell la medida en qlle aumente el vaJor de R es mas confiable la regresion y en compleshymento el valor de SEE(y) al ser mas pequeno

No necesariamente los val ores de estos dos parametros R y SEE son buenos illdicadores de la calidad de la eClIaci6n de estimaci6n para val ores muy alejados de los valores medios

Otra manera de obtener una idea de la bondad del ajuste 10-hTado ell la regresion es mediante el analisi grafico de los residuos

Sc efectlla ulla gnitica de los val orcs de y(i) contra los valores estimados Para Ull aju te perfecto se debe obtener una linea recta de 45 que pasa por el origen sobre la que se disshypersaJllos puntos a lado y lado ClIalqllier vashyriacion de esta linea puede atribuir e a que las sllposiciones hechas sobre los errore (meshydia cero varianza COLlstante y distribuci6n nonnal) no se ha cwnplido 10 cllal debe ser corregido efectllando alglll1 tipo de transforshymacion sobre los datos originales 0 mediante otros artificios

Otro hTafico de interes en el anaJisis es el de residuos contra tiempo colocando los errores en ULl grafico en su orden cronol6gico para detectar posibles ciclos 0 estacionalidades ell los registros

Ell seguida se presentan temas concemienleS a la teoria de decisiones y a las pruebas de hi p6tesis

59

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 9: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

frror estandar del estimado lrados de Iibertad en este caso el unero de coeficientes de la linea

regresion (k=2)

mediante la eCllaciolles 17 y 18 porcentaje de la varianza de la pendiente no expli cada por la I error cst3Jldar del estimado de puede utilizarse como un estimashy

tIe del error estandar de la predicshy=la inexact it lid de la ecuacion de neralmente es pequella en compashy1dispersion de los datos alrededor Ie rehTesion

Iinos el elTor total de cstimaci6n

= Erro r no explicado + Error

e esta relaci6n se puede ver ell

caractcristlcas importantes que tener de la regresi6n es el coefishyenninaci6n R2 y se define por lire el error expJicado y

y- + bx

x

3 Composicion del error tOlal

Revisfa de ingemeria Civil

Rl = Error Explicado I (Error totnl en donde R es el coe1iciente de con-elaci6n

Con el fin de poder detenninar la confiabi lidad de In aplicacion de este metodo se pueden analizar alb1l1laS caracteristicas impol1antes Con el amllisis de eslas se detenninan pautas importantes a seguir para detenninar la con 11 ashybilidad de los resultados al ser apicados en las series de datos lales como

Coeficiente de determinacion Este coefishyciente se pucde eswdiar de dos maneras

- Medida de mejoramiento en la estimacion de y lIt ilizando la linea de regresi6n

Este mejoramiento se mide resp cto al error total el valor de R2 = I indica que In reduccion del error total es completa al ser estimado y mediante esle metodo

- Si R2 = 07 la reducci6n del error total debido a la determinaci6n de la linea de regresion es del 70

- Calidad del aj uste y medida de Iinealidad EI valor de R2 tiende a I cuando 10 pun tos se acercan a la linea de rebTesion Y se acercan a lIna linea rect a

Se puede 1I1i lizar otro crit rio dado por la relaci6n ent re R2 y SEE2(y) dad por

SfP (y) = (I - In )1 (y) (20)

de donde S2(y) es el estimado de la varianza d y_

De la anterior relacion se deduce que estos cntenos son complementarios debido a que p~r medio de ell os se puede obtencr el porcenshytaJe de varianza de y no explicado por la

Revista de il7genieria Civil

rehTesi6n indicando una medida de Ja caJidad del ajusk de elIas

Allalizando los resultados de la aplicacion de este criterio se deduce 10 siguiellte

Ell la medida en qlle aumente el vaJor de R es mas confiable la regresion y en compleshymento el valor de SEE(y) al ser mas pequeno

No necesariamente los val ores de estos dos parametros R y SEE son buenos illdicadores de la calidad de la eClIaci6n de estimaci6n para val ores muy alejados de los valores medios

Otra manera de obtener una idea de la bondad del ajuste 10-hTado ell la regresion es mediante el analisi grafico de los residuos

Sc efectlla ulla gnitica de los val orcs de y(i) contra los valores estimados Para Ull aju te perfecto se debe obtener una linea recta de 45 que pasa por el origen sobre la que se disshypersaJllos puntos a lado y lado ClIalqllier vashyriacion de esta linea puede atribuir e a que las sllposiciones hechas sobre los errore (meshydia cero varianza COLlstante y distribuci6n nonnal) no se ha cwnplido 10 cllal debe ser corregido efectllando alglll1 tipo de transforshymacion sobre los datos originales 0 mediante otros artificios

Otro hTafico de interes en el anaJisis es el de residuos contra tiempo colocando los errores en ULl grafico en su orden cronol6gico para detectar posibles ciclos 0 estacionalidades ell los registros

Ell seguida se presentan temas concemienleS a la teoria de decisiones y a las pruebas de hi p6tesis

59

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 10: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

Una hipotesis estadistica es lUl juicio 0 Suposhysicion que puede ser 0 no cierta aeerca de dos 0 mas poblaciones

En este tipo de estlldios se proponen di ferelltes hipotesis Ho y HI esto a fin de probar la ll ulishydad de la primera cOlloeida como Hipott i de Nulidad EI rechazo de Hu conduce a aceptar su hip6tesis altemativa H I

A fin de probar 18 validez de ulla regresi611 se debe demostrar que el coefic iellte b de la ecuashycion ( I ) difi re Silll ifica tivamente de cera

Es decir

AI IB-1)

En donde la hil)otesis Illiia esenclalll1ente dice que Ja variaeion en Y n estaexplicada por la linea recta sino que oeulTe en fonna aleashytoria

En e tadistica exi te lIlla prueba dcnomillada como Prueba F que seitala en una fOl111a relashytivamente indirecla la existencia 0 11 0 de Ulla relacion entre la variable indepcndi el1le(0

independientes en el caso de una rebTesion mliitiple) y la variab le dependientc

Se define como

s rcg~I I

Variallza dcbida a la regresi on r=

IS I nlllllg -Vari allza re idllal

en donde

SS SlIllla de clladrados de la Reglesioll11

SS Sum a de cuadrados residllales gil Grados de li bel1ad 1F t gi l Grados de libertad N-k-l

60

Este factor F tiene lUla distribucion de probashybilidades conocida como distribucion F con gi l = I Y gl2 = N-2 para el caso de la relTesion lineal simple

Por 10 tan to

f = (22)

Se rechaza HUI sign ificativo al nivel de confianza a cliando

F gt J (I 11-2 )

EI valor de Fa (I 0-2) se lee de la tabla de la distribucioll F para lIll l ivel de significancia de a con I y 0-2 grados de li bertad

En este caso la regresion es estadisticamente ibllifieativa y en caso contrario NO

La prucba t ( de Student) para el valor b COil

base n Sli desviaci6n e randar cOllsiste en calcular los limites de confianza de by detershymiJl3r si el valor de cero queda denIm de estos Ii l1lites

En eI caso de la regres ion li neal simplelas pruebas t y F dan el l1li smo resliitado Para la regresion mliitiple la prueba F se aplica a 13 signi ficancia de la regre iOIl total en tanto que la prueba t e una veri ficacion de los coefishycientes

Est tema de la calidad del aj llste se puede proflilldizar en los libros de estadistica espeshycia lmen te de Wal pole y Myers (1978) Kreyszig(1973)I-Iaan (1977) y Draper y

Smith (1966)

Revis( de Ingenierfu (IIi

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 11: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

F liene Li lla dislri bucion de probashyOllocida como distribucion F con = N-2 para el caso de la regresion e

SS r~ I

F (22)

H I) si gni fi calivo al nivel de bull cliando

F )o FIJ ( I n-2)

c (I n-2) se lee de la labia de la F para un nivel de significallcia 0middot2 grados de libertad

Ii regresi6n es estadisticalllente V en caso contrano NO

de Student) para el valor b COIl

sviacil)n estandar consiste en ~T11tes de confianza de b y detershylor de oero queda denIm de estos

e la regresi6n lineal simplelas dan el l1li 1110 resu llado Para la

It iple la prueba F se aplica a la je la rebfeSIOn total en tanto que S LIlla verificaci6n de los coefi-

In calidad del aj uste se puede n los libros de estadist tca espeshye Walpole y Myers (197 8) 7J)liaan (1977) y Draper y

Revsla de Ingenieriu Civl

2123 Ajuste Grafico de 18 Jinea de reshygresi6n La linea de regresi6n que eslablece el tipo de correlac ion entre los val ores del caudal 0 de la precipitacion en una estaci6n con los valores en otra estaci6n tambien puede ajustarse por medio de un procedi mienlo b1fashyfico muy diferente aI que utiliza la regresi6n analitica (minimo-cuadratico) Sobre este itl tishymo ya se ha hecho amplia referencia y ahora se tratara el del analisis grafico de la regresi6n Este metodo tambien puede uti li zarse para efeci llar la regresi6n lineal entre dos variables (simple) como tambien entre Ires 0 lTlas variashybles (mli lt iple) Esto ltltimo se rea liza a traves de una serie de abacos que relaciollall las vashyriables involucradas

(a)

x

x

Fundamentalmente la referencia bibliografishyca consultada en esta parte del rabajo son Lan gbein y Handison ( 1955) Searcy ( J960)Riggs (1968) y Beoson(l 965)

Estos melodos analiticos y graficos se difeshyrencian fundamentaJmente en cuanto a como se ajusta la grafica a los PlUlIOS del diagrashyma

Cuando es imposible establecer la seleccion de un modelo ana li lico sobre una base fisica que describa la correlacion entre dos eslaClOshynes es cOllveniente cstablecer Ull tipo de regreshysi6n grMica a priori que pueda indicar el moshyde lo apropiado

y

x

~ ~

I bullbull

bull bull (0)

FIG URA 4 Diagraillas de dispersion de los datos

En la figura 4 se puedell estabJecer criterios gratk os para ajustar l111 detenninado tiro de ecuaci6n particular a la nube de puntos de cada grafico La figura 43 indica que se debe ttlilizar Ull modelo lineal de la forma

Revisa de ingenieria (ivil

y = a + bx (23)

La figura 4b de un 1110delo

y = a + bx + cx2 (24)

61

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 12: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

en el que el sentido de la curvatura viene dado por el signo de c

Las figllras 4(c) y 4(d) mueslran un diagrama de pllntos muy disperso por 10 tanto requieren de lUla Iransfonnacion d variables ya que parece que no exisliera ningtin tipo de correshylacion entre las variables originaies Lntrodushyciendo una tercera variable y en algunos casos mas variables entre la variable que e consishydera indepelldiente y la que se consid ra variashyble dependiente se pueden obtener alias correshylaciones entre las variables trallSfOnlladas y ajustar el modelo analitico apropiado a esos PWltoS

Ell el procedimiento gralico de la linea de regresion la fonna de la grMica (lineal 0 curshyviLinea) ajllstada depende en una gran pal1e del tipo de papel empleado Tal vez el papel logaritmico resll ita mas lltil debido a que la Irallsfonnaci6n logaritmica como ya se vio tiellde a convertir los valores de los cauda les en variables aleatorias con distribuci 6n norshymal (Normalizar los calldales) y adem as tiende a convert ir una posible correlacion de tipo cllfvilineo en una de tipo lineal

En general la relacion entre los registros de dos estaciolles puede expresarse mediante dos Iineas Una para los caudales bajos y otra para los caudales al tos Si el ltlngulo can que se interceptan es grande se puede cOllstruir una cllrva de transicion para suavizar el quiebre a menos que dicho anglilo sea suave 110 hay necesidad de hacerla

- Procedimiento EI proceso grafico de ajuste de la linea de regresion para el caso de dos estaciones (dos variables) es el siguicnte

Primer paso Se grafican los valores de los caudales generalmente caudales l1lensllales en mJseg de las estaciones en un papel

62

Logaritmico (Log-Log) colocando la variashyble independiente en el eje de las X y la variable dependiente en Y

Segundo paso Se divide el rango de distrishybuci6n a 10 largo del eje x de los caudales lltilizando lineas verticales en un grupo de cinco a diez intervalos Lo mislllo que a 10 largo del eje y

Tercer paso Se detennina grltificamellle el punto medio de cada intervalo en amba direcciones Si el nlllnero de puntos en L1na banda es par se promedian gnlficamente los dos punt os medios si es impar se promedian los Ires puntas del medio ponderado do veces el punto del medio Si una banda contiene menos de tres pWltos no se detennina eI PlUltO

medio para esa cuadricula

Lo misl1lo se hace a 10 largo del eje y recomenshydandose utilizar colores diferentes para los dos sent idos

Cuarto paso Se traza la linea de iguaJ rendishymiell to Esta llnea se define como la li nea que represent a la relacion (45deg en el papel logashyritmico) entre los caudales de dos estaciones basada en la sllposicion de que el caudal en cada estacion es proporcional a su respectiva area de drenaje

Es decir se traza la linea que eSlablec la relashycion constante de areas de drenaje

Quinto paso Sc dibujan lilleas reclas a traves del promedio de los puntos medios trazados en los intervalos (li nea de re laclon) dando poco peso a los val ores extremos EI extreshy1110 superior de esta(s) li nea(s) casi sjelllpre re lI lta paralelo a la linea de igllal rendimiento EI extremo inferior g n ralmente es olra linea recta que puede conectarse c n la linea supeshyrior mediante lUla cllrva de transici6n suave

ReviSIiJ de Ingel1leria Civil

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 13: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

(Log-Log) coloeando la variashye en cl eje d la s X y la

en Y

Se divide eI rango de di trishydel eje x de los caudales vert icales en un gropo de

tervalos Lo mislllo que a 10

Sc detennina gnlficamente el de cad a interval en am bas el nlilnero de puntos en una

promedian graficamente los ios si es impar e promedian

medio ponderado dos veces 0 Si una banda cont iene

no se detennina el punto cuadric ul a

a10 largo del eje y recomenshycolores diferentes para los dos

traza la li nea de iguaJ rendishyse define como la linea que

(45 ell el papel logashycaudales de dos estaeiones

on de que el caudal en proporcional a su respect iva

la linea que establece la relashyareas d drenaje

di bujan Jineas reelas a traves los puntas medios trazados (linea de relac ioll) dando

valores extremos EI extreshyesta(s) li nea(s) casi sielllpre la linea de igllal rendimiento

general mente es otm linea oncctarse con la linea sllpeshyclirva de trallsicion Sllave

Sex to paso Se dibujan dos linea cada lUla de elias equi di (ante (paralelas) a la curva de relacion de tal fomla que Llna sexta pane de los PWltos qued n por encima de la cllrva supeshyrior y otra sexta pane quede por debajo de la inferior Rara vez quedan a la misma distancia de la linea de relaciOn

Septimo (gtaso Ob iament el area comprenshydida entre estas des lineas dibujadas conti n las dos terceras partes restante de los puntos POf definici6n el ancilo vertical de esta banda es de dos veces e error estandar estimado

Este se aleula obteniendo e logaritmo d eociente entre 1I1l caudal que caiga sobre la linea superior y 111 caudal que cai a sobre la linea inferior EI error estandar puede escrishybirse n unidades 10garHmicas pere con mayor frecuencia se expresa en tenninos porcenshytllale

La corrfiabilidad del valor estandar estimado grMicamente esta influenciada pOl dos [actoshyres que lienen efectos contrarios Si la linea de regresion gcifica tiene lIna mayor pendiente que la linea obtenida por el metoda de los mishynimos cuadrados el error estandar que se obtiene por el primer metodo sera mayor que el caJculado mediant el segundo Si se SLlpone que la linea de regresion grafica es La misma que la linea de regresi6n minimo cuadnltica el error standar obtenido graficamente sube shytimara al error e tfll1dar analitico cuando algushynos ptmtos estan ejos de la linea pero la mayoshyria estan cerca de ella

En cllalquier easo el error estandar detennishylado graficamente es solamente un valor aproshyximado pero s adecuado para rnuchos probleshyma (Riggs 1968p20)

Octavo paso Se dibujan las Iineas horizonshytales que excluyan una sexta parte de los

plll1tOS (en la di reccion y) por encima y otra sexta par ~ por debajo La mitad de la distancia entre estas Iineas se I11 l1 ltiplica por el factor

N (N - 1)

para obtener la desviacion estandar de y EI termino N es el ntlmero de obser aciones concLlrrentes

Noveno paso Se puede estirnar el coeficiente de correlaci6n de la linea de rehrre ion grMica mediante la expresion

Se r = 1 _ ( )2 (25)

Sy en donde

r Coeficiente de correlacion Se Error estandar detenninado nuicamente Sy Desviacion estandar de la ariable Y

- Regresion multiple gnifica Cuando el enor estandar estimado mediante la regresion simple por el metodo grafico es grand se deben utilizar mas estaciones en la cOITelacion (regresion mUltiple) con el fin de reduci r el error estandar estimado

A veces tambien se pueden agregar otro tipo de datos en el analis is de correlacion como plieden ser los registros de precipitacion de una e tacion cercana

EI metodo grafico tambien puede rectuar este procedimiento med iante la utilizaci6n de abacos pero n se illcluye en este trabajo ya que el metodo analitico de regresion mllltishypie puede resuitar 6ptimo en el senti do de obtener mejores coeficientes de correlacion multiple utilizado por ejemplo el metoda de

Revisla de Ingenieria Civil RevlSlu de ingenieria ( Ivil

63

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 14: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

regresion por pasos 0 metodo de regresioll esshycaJonada

EI metoda grafico de correlacion mldtiple se encuentra analizado ampliament e ell los trabajos anterionnente mcncionados de Riggs

(1955) y Searcy (1960) como tambien cn el texto de Linsl ey Kohler y Paulus (1977 p359)

2124 Compa racion entre los metodo gni ficos y analilico de regresion lineal

METOOO GRAFICO

VENTAJAS

Es de rapida ejectlc ion

Es de mllcha lIt ilidad en el proceso de defi shynicion del modelo de ajuste apropiado

Es un metodo que sefiala la neccsidad de hacer transfonllaciones sobre los datos originales si es necesario

Es lI ll metoda que considera la existencia de puntos fa lso dentro de la regresion y llama la atenci6n sobre el1os Mas adelante se hara referencia con detalle sobre la presencia de esa clase de puntos dentro de un registro hidrologico

OESVENTAJAS

No se pueden iden tificar los efectos de los cambios pequeiios en la variable indepenshydientes sobre la variable dependiente

EJ nlllnero de variables independientes debe restringirse a tres ya que los ellores aCllJ1l ulados durante eI tratamiento manllal del grafico Ie disminuye Sll exactitud

La relacion resultante que incillya tres 0

mas variables es confllsa a menos de que se exprese matematicalllente 0 se establezshyca otra relacion de tipo grMico

64 lelisiJ de Ingenieria ( vll

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65

Page 15: IMPORTANCIA DE LOS REGISTROS … · IMPORTANCIA DE LOS REGISTROS HIDROLOGICOS EN EL DISENO Y PROYECCION DE ESTRUCTURAS HIDRAULICAS LOS METODOS DE REGRESION (Segunda Parte) Jose [win

Searcy (1960) como tambien en el Linsley Kohler y Paulus ( 1977

omparacion entre los metodos vanalilico de regresion lineal

OFSVENTAJAS

ueden idellti ficar los efectos de los pequellos en la vruiables indepenshy

sobre la variable dependiellte

o de variables independientes tringirse Cl Ires ya que los errores os duranle el tratamiento manual o le dislllilluyc su exactitud

n resuitante que incluya Ires 0

bles es confusa a menos de que matclnaticamente 0 se estabIezshyacion de tipo Tafico

METODO ANALITICO

VENTAJAS

- Proporciona los mejores estimados de los coeficientes de regresi6n y del error estanshydar de estimaci6n del modelo utilizado

- Permite efectuar pruebas sabre la signifishycancia estadistica de los coeficientes de la regresion

- Los resultados se presentan en fonna clara y concisa de manera que son faciles de interpretar

- Para la muestra de datos y el modelo utilishyzados los resultados son los mismos y 00

dependen de quien haga el procedimiento

DESVENTAJAS

- Para modelos con muchas variables indeshypendientes se requiere bastante tiempo de computador si no en el cllculo de los resulshytados entonces en la preparacion de los datos

No se detiene a reflexionar sabre la preshysencia de puntos espurios en los datos de regresi6n y sobre el posible efeoto que estos tienen sobre la linea (plano 0 Hipershyplano) de ajuste final

- Se corre la incertidumbre que el modelo de regresi6n escogido 0 la transformacion sobre los datos no sean apropiados

En general deberia pnmero efectuarse lID trabajo grafico para explorar cual tipo de modelo emplear y luego desarrollar el metoda analitico para obtener la conc1usiones finales

STRUTEC LIM IT AOA

PEDRO JOSE HERRERA ROCA

Carrera sa No 8amp-20 Tels 21S 722 middot 218 7227 middot Fax 6 10 0267 Santale de BogOta DC ColOrrbIa

D

industriAl e jecivij ingenleros lie ltda

II CESAR ASHLEY MORA BARNEY

Can 9a No S3middot58 Of 3 Tels 24g 8027middot 220709 224 11525 Sant de BOQOI~ D C

lesIU de Ingel1leria Civt Revisla de ingenieria Civil 65