70
73 Capítulo 5 REVISIÓN DE CONCEPTOS DE ESTADÍSTICA Y PROBABILIDAD

5.Estadística

Embed Size (px)

DESCRIPTION

5 capitulo libro hidrologia

Citation preview

  • 73

    Captulo 5 REVISIN DE CONCEPTOS DE ESTADSTICA Y

    PROBABILIDAD

  • 74

    La planeacin y el diseo de proyectos relacionados con el agua necesitan informacin de diferentes eventos hidrolgicos que no son gobernados por leyes fsicas y qumicas conocidas, sino por las leyes de azar. Por ejemplo, el caudal de un ro vara da a da y ao tras ao, y no puede predecirse exactamente cual ser su valor en un perodo de tiempo cualquiera. En el caso del diseo de un puente, el estudio hidrolgico determinara la creciente asociada con una probabilidad crtica(se busca determinar el caso crtico), la cual se supone representa el riesgo para el puente. Esto solo puede determinarse a travs del anlisis probabilstico y estadstico basado en los registros hidrolgicos del pasado.

    Es dable afirmar que la hidrologa, en algunos casos, trata con variables aleatorias cuyo comportamiento no puede predecirse con certidumbre. El comportamiento de una variable aleatoria est descrito por una ley de probabilidades, la cual asigna medidas de probabilidad a posibles valores o rangos de ocurrencia de la variable aleatoria. Las variables aleatorias pueden ser discretas o continuas.

    Se dice que una variable aleatoria es UdiscretaU si ella slo puede tomar valores especficos. Por ejemplo, si N denota el nmero de das lluviosos en el mes de diciembre, entonces N es una variable aleatoria discreta. En este caso, la ley de probabilidades asocia medidas de probabilidad a cada posible ocurrencia de la variable aleatoria.

    Una variable aleatoria es Ucontinua U si puede tomar todos los valores en un rango de ocurrencia. Por ejemplo, si Q es una variable aleatoria que denota el valor de los caudales promedios diarios del ro Magdalena, entonces Q

  • 75

    puede asumir cualquier valor y es entonces una variable aleatoria continua En este caso la ley de probabilidades asigna medidas de probabilidad a rangos de ocurrencia de la variable aleatoria.

    En el anlisis probabilstico y estadstico en hidrologa, se asume que la informacin histrica disponible de una variable hidrolgica representa una muestra tomada de una poblacin cuyas caractersticas se desconocen. En el anlisis probabilstico se analizan posibles leyes de probabilidad que pueden describir el comportamiento de las variables de la poblacin. En el anlisis

    estadstico, se hacen inferencias sobre la variable (la poblacin), usando la muestra. Por ejemplo, cuando se calcula una media con observaciones disponibles, se est infiriendo que la media calculada es la media de la poblacin, lo cual no necesariamente es verdad, pues esto depender de la calidad de la informacin, del nmero de observaciones y otros aspectos.

    El hecho es que muchos fenmenos hidrolgicos son errticos, complejos y de naturaleza aleatoria, y solo pueden ser interpretados en un sentido probabilstico. Uno de los problemas ms importantes en hidrologa es la interpretacin de registros de eventos pasados para inferir la ley de probabilidades de la variable hidrolgica (poblacin) de inters, procedimiento que en hidrologa se conoce con el nombre de anlisis de frecuencia.

    Por ejemplo supngase que se tienen registros del caudal del ro Magdalena durante un perodo de 50 aos. Son factibles dos tipos de anlisis: descriptivo y de inferencia. El primero se realiza sin ninguna referencia a su poblacin, de la cual se tiene una muestra de 50 aos. Consiste, bsicamente, en calcular propiedades estadsticas, como media, varianza y otras. En el segundo, la muestra se analiza para inferir las propiedades de su poblacin, lo cual ayudar a derivar las caractersticas probabilsticas del caudal. El primero es una aplicacin de los mtodos estadsticos que

  • 76

    requieren poca decisin y poco riesgo. El segundo involucra riesgos y requiere una total comprensin de los mtodos empleados y el peligro involucrado en la prediccin y estimacin de las variables.

    Los objetivos bsicos de la estadstica en la hidrologa son entre otros:

    1) Interpretacin de las observaciones 2) Anlisis de la calidad de la informacin 3) Inferencia sobre el comportamiento de la variable 4) Extraccin del mximo de informacin de los registros 5) Presentacin de la informacin en grficas, tablas, ecuaciones, que

    bsicamente ayudan a la toma de decisiones en el planeamiento de los recursos hdricos.

    En resumen, el objetivo principal de la estadstica en hidrologa es obtener informacin de los fenmenos hidrolgicos pasados y hacer inferencias acerca de su comportamiento en el futuro.

    5.1 CONCEPTOS BSICOS 5.1.1 Concepto de probabilidad. La probabilidad de ocurrencia de un evento dado es igual a la relacin entre el nmero de sucesos favorables m y el nmero de sucesos totales, n:

    nmxXP =)=( (5.1)

    La teora de la probabilidad se basa en los siguientes axiomas:

  • 77

    1) La probabilidad de ocurrencia de un evento, PBi B, siempre tiene un valor entre 0 y 1, as:

    1P0 i (5.2)

    . La probabilidad de un evento cierto es 1:

    1P1i

    i ==

    (5.3)

    2) Si XB1 B y XB2 B son eventos independientes y mutuamente excluyentes,

    entonces:

    )(+)(=)( 2121 XPXPXXP (5.4) Dos eventos son independientes si la probabilidad de ocurrencia de uno no se ve afectada por la ocurrencia del otro,. y se dice que son mutuamente excluyentes cuando la ocurrencia de uno imposibilita la ocurrencia del otro.

    Los axiomas anteriores permiten la definicin de conceptos importantes. Por ejemplo, si dos eventos XB1 B y XB2 Bno son mutuamente excluyentes, la probablidad de que ocurra XB1 B u ocurra XB2 B est dada as:

    )()(+)(=)( 212121 XXPXPXPXXP (5.5)

    La )( 21 XXP es llamada unin de probabilidades y se lee la probabilidad de XB1 Bo XB2.

  • 78

    La probabilidad de que dos eventos independientes ocurran de manera simultnea es el producto de las probabilidades individuales as:

    )()(=)( 2121 XPXPXXP (5.6) La )( 21 XXP es llamada la probabilidad de interseccin y se lee la probabilidad de XB1 By XB2 B.

    La probabilidad de que ocurra un evento XB1 B dado que ha ocurrido XB2 B se llama probabilidad condicional y se denota as:

    ))((=)(

    2

    21

    2

    1

    XPXXPX

    XP (5.7)

    Ejemplo 5.1

    Supngase que el ro Cauca alcanza cada invierno un nivel de creciente con una frecuencia relativa de 0.2. En el Cauca hay un puente cuya probabilidad de falla en los estribos es 0,3 y la experiencia muestra que cuando hay creciente, las probabilidades de esta falla suben a 0,5. Las probabilidades son:

    P(creciente) = P(C) = 0,2 P(no creciente) = P(C) = 0,8 P(falla) = P(F) = 0,3 P(no falla) = P(F) = 0,7 P (falla dada creciente) = P(F/C)= 0,5 Se desea conocer la probabilidad de falla del puente.

    Solucin: El puente falla (queda inutilizado) cuando falla en los estribos o cuando hay creciente; esto se puede denotar as:

  • 79

    )()(+)(=)( FCPFPCPFCP Aplicando la ecuacin 5.7 de probabilidad condicional:

    )()(=)( CFPCPFCP

    Reemplazando valores, se obtiene: 105020FCP .=...=)(

    Al reemplazar este valor en la expresin de unin de probabilidades, se concluye finalmente que P(CF)=0.4 5.1.2 Perodo de retorno: Se define el perodo de retorno, TBr,B de un evento de cierta magnitud como el tiempo promedio que transcurre entre la ocurrencia de ese evento y la prxima ocurrencia de ese evento con la misma magnitud. Se define tambin como el tiempo que transcurre para que un evento sea excedido o igualado, al menos una vez en promedio. Si P es la probabilidad de excedencia, se puede demostrar matemticamente que:

    P1 = Tr

    (5.8)

    Por ejemplo, si un caudal de 8098 mP3 P/s es excedido en promedio una vez cada 10000 aos, entonces su perodo de retorno, TBr,B es de 10000 aos.

    5.1.3 Concepto de riesgo. En el diseo de obras hidrulicas expuestas a grandes avenidas, es necesario considerar el riesgo asociado con el valor seleccionado para el diseo. Por lo comn, el ingeniero disea una obra para resistir una avenida de cierta magnitud. Se define el riesgo R de un diseo como la probabilidad de que la avenida para la cual se disea la obra sea excedida. Se entiende que sta es

  • 80

    una situacin de riesgo, pues la obra se disea para soportar cierta avenida mxima , y crecientes mayores le podran hacer dao o incluso destruirla. El riego R puede entonces escribirse como:

    )T1 - (1 - 1 =R n

    r (5.9)

    La confiabilidad se define como el complemento del riesgo (Confiabilidad = 1-R). Se quiere que la obra tenga un riesgo pequeo de daarse o, lo que es lo mismo, una alta confiabilidad.

    Ejemplo 5.2

    Qu perodo de retorno debe escoger un ingeniero en el diseo de un box-culvert, si se acepta solo el 10% de riesgo de avenida en una vida til, n, de 25 aos?

    Solucin: Aplicando la ecuacin 5.9 se tiene:

    Reemplazando los valores de TBrB y n se obtiene:

    TBRB = 238 aos

    Ejemplo 5.3

    Una presa por gravedad puede fallar por deslizamiento (A), por crecientes (B), o por ambas. Asumir que :

    1) La probabilidad de falla por deslizamiento es dos veces la probabilidad de falla por creciente: P(A)=2 P(B)

    )T1 - (1 - 1 = 0.1 =R 25

    rT

  • 81

    2) La probabilidad de falla por deslizamiento, dado que ha habido creciente, es 0.8

    3) La probabilidad de falla de la presa es de 1*10 P-3

    Determinar la probabilidad de que ocurra un deslizamiento, P(A).

    Solucin: La presa queda inutilizada cuando se presenta una falla por deslizamiento o cuando hay una creciente, lo que puede expresarse como:

    )()(+)(=.=)( BAPBPAP0010BAP (1)

    Se tiene adems que:

    P(A) = 2 P(B) (2)

    Reemplazando la (2) en la (1): )()(=. BAPBP30010 (3)

    Se sabe que:

    ))((=.=)(BP

    BAP80BAP (4)

    Resolviendo simultneamente la (3) y la (4), se obtiene:

    P(A) = 9.1 * 10P-4

  • 82

    Ejemplo 5.4

    De 1000 circuitos de tubera de acueducto en una ciudad, se reportan 15 contaminados con materias fecales; 5 tienen excesivas concentraciones de plomo (PBb B) y entre stos dos de ellos contaminados tambin por materias fecales. Se pregunta:

    a) Cul es la probabilidad de que un sistema seleccionado al azar resulte con contaminacin fecal?

    b) Suponiendo que un sistema se encuentre contaminado con materias fecales, cul es la probabilidad de que tambin est contaminado con plomo?

    c) Cul es la probabilidad de que un sistema seleccionado al azar est contaminado?

    d) Suponiendo que la probabilidad de contaminacin hallada en el numeral anterior no es satisfactoria, y que se desea que no exceda de 0.01, cul es el valor permisible para la probabilidad de contaminacin por materias fecales, asumiendo que el valor de la

    probabilidad condicional hallada en el numeral b an se puede aplicar?

    Solucin: Llamemos P(F) a la probabilidad de contaminacin por materia fecal, P(PBb B) a la probabilidad de contaminacin por plomo y P(C) a la probabilidad de contaminacin por plomo o por materia fecal. Se tiene entonces:

    a) P(F) = 17/1000 b) La probabilidad condicional P(PBb B/F) puede expresarse como:

    P(F)F)P(PbFPbP =)/(

  • 83

    y P(PBb B) = 5/1000. Reemplazando, se obtiene que: P(PBI/F) = 2/17 c)Se pregunta en este numeral el valor de P(C); este valor establece la probabilidad de que un circuito est contaminado con plomo o con materias fecales. Como hay 15 circuitos contaminados con materias fecales y 5 contaminados con plomo, se tiene entonces que:

    P(C) = 20/1000= 0.002 d) La probabilidad de contaminacin C se puede expresar como:

    )()(+)()(=)( bb PFPBPFPPFPCP (1) y se conoce el valor de la probabilidad condicional:

    )()(=/=)/( FPFPbP172FPbP (2)

    Resolviendo la (1) y la (2) simultneamente se halla que:

    P(F) = 0.00567 5.2 DISTRIBUCIONES DE FUNCIONES DE PROBABILIDADES EN HIDROLOGIA Tal como se haba mencionado anteriormente, el comportamiento de las variables aleatorias discretas o continuas se describe con la ley de probabilidades asociada, que asigna medidas de probabilidad a ocurrencias o a rangos de ocurrencia de la variable. Estas leyes de probabilidad reciben el nombre de Ufunciones de distribuciones U Ude U UprobabilidadU. Como notacin, se representa por una letra mayscula la variable aleatoria, y por una letra minscula, un valor especfico, una relacin o una muestra de la variable.

    P(X = a) indica la probabilidad de que la variable aleatoria X tenga un valor de a; similarmente, P(a

  • 84

    aleatoria X est en el intervalo [a, b] .Si se conoce la probabilidad P(a

  • 85

    nn = )x(f iis (5.10)

    la cual es un estimado de P( xBi B-x

  • 86

    cuya derivada es la funcin de densidad de probabilidad:

    dx(x)dF = (x)f XX (5.14)

    Para un valor dado de la variable aleatoria X, FBx B(x) es la probabilidad acumulada P(X x), y puede expresarse como la integral de la funcin de densidad para el rango X x.

    (u)duf = (x)F = x) P(X Xx

    X

    (5.15)

    en donde u es una variable de integracin. Si se tiene la funcin de distribucin acumulada para una variable X y se tiene un valor x BAB de esa variable, (ver Figura 5.2) se cumple que:

    ( ) ( )AAX xX P = x F (5.16)

    Una forma bastante usada en hidrologa para escribir el valor de una variable hidrolgica asociada a cierto perodo de retorno es la de utilizar lo que se conoce como factor de frecuencia, K. En este caso, el valor de la variable se puede escribir como:

    K+ = XA (5.17)

  • 87

    Donde representa la media y es la desviacin tpica de la variable hidrolgica. XBT Bes el valor de la variable aleatoria asociada a un perodo de retorno T. Como se sabe:

    ( )( )

    X X P - 1 X X P)(XF

    T

    TTX

    >==

    P(XXBTB ) representa la probabilidad de excedencia, la cual est relacionada con el perodo de retorno como:

    T1XXP T =)( (5.18)

    00.10.20.30.40.50.60.70.80.9

    1

    1 2 3 4 5 6 7 8 9 10

    x

    F X(x

    )

    FIGURA 5.2 Distribucin acumulada

    De donde:

    T11XF TX =)(

  • 88

    O:

    T11KFX =)+(

    Y se obtiene finalmente:

    T11F

    1K 1X

    =

    FBXPB-1 P ( ) representa el inverso de la distribucin acumulada de probabilidades. Por ejemplo, para obtener FBXPB-1 P (1 - 1/T), se entra al grfico 5.2 con el valor de 1-1/T al eje de probabilidades, y se lee en el otro eje el valor del inverso de la distribucin acumulada de probabilidades. Lo que significa que el factor de frecuencia es funcin de la distribucin de probabilidades y del perodo de retorno que se escoja.

    La funcin de densidad de probabilidades tiene las siguientes caractersticas cuando la variable aleatoria es continua:

    1)

    1 =(x)dx fX-

    (5.19)

    2)

    (x)dxf = b) X P(a Xb

    a (5.20)

    3)

    0=(x)dxfXb

    b (5.21)

    Cuando la variable aleatoria es discreta las anteriores propiedades se pueden denotar as:

  • 89

    1)

    =)(i

    i 1xf (5.22)

    2)

    )(=)(

    bx

    axi

    i

    i

    xfbXaP (5.23)

    3)

    )(=)( ==

    ji

    1iij xfxXP (5.24)

    Lo que implica que las probabilidades se definen solo como reas bajo la funcin de densidad de probabilidades, FDP, entre lmites finitos.

    Ejemplo 5.5 Hallar la funcin de distribucin acumulada para una variable aleatoria que se define como el nmero de veces que se lanza una moneda, hasta que aparece cara.

    Solucin: La probabilidad de que caiga cara en cualquier ensayo es y es independiente de la probabilidad de que caiga sello.

    Si A es el evento de que caiga sello en el primer ensayo y B (es el evento) de que caiga sello en el segundo ensayo, la probabilidad que suceda A y B es:

  • 90

    P(AB) = P(A) + P(B) = (1/2) P2 P

    Si hay x-1 ensayos, la probabilidad de que caiga sello en el ensayo (x-1) es (1/2) Px-1 P y la probabilidad de cara en el x-avo ensayo es:

    (1/2) Px-1 P = (1/2) Px P se tiene entonces que:

    x P(X=x) FBxB(x) 1 2 3 1/8 7/8

    en donde x es el nmero de ensayos, P(X=x) es la probabilidad de ocurrencia de sello en todos los ensayos y FBXB(x) es la funcin de probabilidades acumulada.

    5.3 MOMENTOS DE LAS DISTRIBUCIONES Las propiedades matemticas de las distribuciones estadsticas pueden ser definidas en trminos de los momentos de la distribucin.

    Los momentos representan parmetros que tienen significado fsico o geomtrico. Se reconocer fcilmente la analoga entre los momentos estadsticos y los momentos de rea estudiados en mecnica de slidos.

    El r-avo momento con relacin al origen se define como:

    (x)dxfx = Xr-

    r

    (5.25)

  • 91

    o en el caso discreto:

    )xi(fx = Xrin

    1=ir (5.26)

    El subndice se usa para momentos respecto al origen. El primer momento con respecto al origen representa la media de la distribucin.

    Los momentos pueden definirse con respecto a otro punto distinto al origen. Por ejemplo, el r-avo momento con respecto a la media se puede escribir como:

    (x)dxf ) -(x = Xr

    -r

    (5.27)

    ri

    n

    1iXr xxf ))((=

    = (5.28)

    La primera de estas ecuaciones para el caso de una variable aleatoria continua y la segunda si la variable es discreta. Rara vez se necesita calcular ms de tres momentos. Estos son usados para estimar los parmetros y describir las caractersticas de la distribucin.

    5.4 CARACTERISTICAS ESTADISTICAS BASICAS Uno de los usos de la estadstica es extraer la informacin esencial de una muestra de datos, para determinar las caractersticas y el comportamiento de la poblacin. Hay algunas caractersticas bsicas, como la media, la varianza y otras que se pueden calcular o estimar utilizando la muestra de datos disponibles, para tratar de entender el comportamiento general de la poblacin.

  • 92

    En general, las caractersticas estadsticas bsicas se calculan como Uel U Uvalor U Uesperado U UEU de alguna funcin de una variable aleatoria. El valor esperado de una funcin g(X) de una variable aleatoria X se define como:

    [ ]

    )()(=)( duufugXgE X (5.29) En donde fBXB (u) representa la funcin de distribucin de probabilidades (FDP) de la variable X

    Las principales caractersticas son:

    - La media : representa el valor esperado de la variable misma. Para una variable aleatoria X, la media E(X) es el primer momento con respecto al origen; es una medida de la tendencia central de la distribucin:

    (x)dxfx = = E(X) X-

    (5.30)

    El estimador de la media a partir de una muestra se puede escribir como:

    x N1 = i

    N

    1=ix (5.31)

    - La varianza P2 P: mide la variabilidad de los datos, la dispersin de

    los mismos alrededor de la media. Es el segundo momento respecto a la media:

  • 93

    (x)dxf )-(x = = ])-E[(X X2

    -

    22

    (5.32)

    El estimador de la varianza a partir de una muestra est dado por:

    )x( 1-N1 = 2xi

    N

    1=ix

    2 (5.33)

    - La desviacin estndar : es una medida de la variabilidad con las

    mismas dimensiones que X; es la raz cuadrada de la varianza y su valor estimado se denota por

    . Mientras mayor sea la desviacin estndar, mayor es la dispersin de los datos. ( ver Figura 5.3).

    - El coeficiente de variacin CV: est definido por la relacin de la

    desviacin estndar y la media, y se puede escribir como:

    =CV (5.34)

    cuyo estimado es x

    x

    ; es una medida adimensional de la

    variabilidad. alrededor de la media.

    - Asimetra: la distribucin de los valores de una distribucin alrededor de la media se mide por la asimetra, la cual est dada por el tercer momento alrededor de la media:

    (x)dxf )-(x = ])-E[(X X3

    -

    3

    (5.35)

  • 94

    FIGURA 5.3 Distribucin de probabilidades con diferente desviacin

    estndar. La asimetra se hace adimensional dividiendo la anterior ecuacin por P3 P y se obtiene as, el coeficiente de asimetra :

    ])-E[(x 1 = 33 (5.36)

    El estimador de est dado por:

    x3

    3xi

    N

    1=i

    x 2)-1)(N-(N

    )-x( N =

    (5.37)

    Como se muestra en la Figura 5..4, para >0, asimetra positiva, los datos se concentran a la derecha y para

  • 95

    fX (x)

    < 0 > 0

    x

    FIGURA 5.4. Distribucin de Probabilidades con Diferentes Coeficientes

    Ejemplo 5.6 En una estacin pluviomtrica se tienen precipitaciones promedias mensuales multianuales de un determinado mes, cuyas frecuencias absolutas se muestran en la tabla siguiente. Encontrar la precipitacin promedia mensual.

    Frecuencia

    Intervalo en mm Absoluta 100-110 10 110-112 16 120-130 9 130-140 10 140-150 20 150-160 15 160-170 20 Solucin:

  • 96

    En total se tiene 100 valores, para cada intervalo se halla el valor medio o marca de clase y se le asigna una frecuencia relativa, la cual es la frecuencia absoluta sobre el nmero total de valores (100). El valor medio de cada intervalo es x Bi B y la frecuencia relativa es fBx B(x Bi B). Se elabora entonces la tabla siguiente.

    Intervalo clase (mm)

    Valor medio xBiB

    (mm)

    F. absoluta F. relativa

    fBxB(xBiB)

    xBiB fBxB(xBiB)

    100-110 105 10 0.1 10.5

    110-120 115 16 0.16 18.4

    120-130 125 9 0.09 11.25

    130-140 135 10 0.1 13.5

    140-150 145 20 0.2 29

    150-160 155 15 0.15 23.25

    160-170 165 20 0.2 33

    =100 =138.90 Aplicando la ecuacin 5.29 la media se puede expresar como:

    x = xBi Bf Bx B(xBi B)=138.9 mm. 5.5 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES

    ALEATORIAS DISCRETAS El uso de estas distribuciones se restringe a aquellos eventos aleatorios en los cuales el resultado puede ser descrito solamente como un xito o como

  • 97

    un fracaso, esto es, solo hay dos eventos mutuamente excluyentes para un experimento. Adems, los experimentos sucesivos son independientes y la probabilidad permanece constante de ensayo a ensayo. Un ejemplo en hidrologa sera la probabilidad de que un da sea lluvioso o seco. La distribuciones de este tipo ms usadas en hidrologa son la distribucin binomial y la geomtrica. 5.5.1 Distribucin binomial. Consideramos como p la probabilidad de que el caudal mximo en un ao en un ro exceda un valor de 1800 mP3 P/s .La probabilidad de no excederlo, q, es 1-p .Supngase que se est considerando un perodo de 3 aos. La probabilidad de excedencia en el ao 3 y no en los aos 1 y 2 es qqp, dado que los eventos son independientes ao a ao. La probabilidad de excedencia en cualquiera de los 3 aos es pqq +qpq + qqp debido a que la excedencia pudo ocurrir en el 1o., 2o o en el 3o. ao. La probabilidad de excedencia en 3 aos est dada como 3qP2 Pp. La probabilidad de dos excedencias en 5 aos es ppqqq, pqpqq1....qqqpp. Se puede ver que cada uno de estos trminos es qP3 PpP2 P; el nmero de trminos es igual al nmero de formas de arreglar dos items dentro de 5 items. Esto es (5/2) = 5x4/2 = 10 y la probabilidad de tener dos excedencias en 5 aos es (5/2)q P3 PpP2 P

    Puede generalizarse de tal manera que la probabilidad de x excedencias es n aos est dada por (n/x)p Px PqPn-x P, lo que tambin puede expresarse as:

    xnx )p1(p)!xn(!x

    !n)xX(P == (5.38) expresin conocida como distribucin binomial. Los parmetros de esta distribucin son:

  • 98

    npq)pq(

    )p1(npnp

    2

    ==

    =

    (5.39)

    Ejemplo 5.7 Como se dijo anteriormente, una creciente de TBrB aos de perodo de retorno se define como aqulla que tiene una probabilidad de excedencia de 1/TBrB en cualquier ao. Asumiendo que las mximas crecientes anuales son independientes, la distribucin binomial permite resolver varios problemas prcticos en hidrologa, as:

    a) Cul es la probabilidad de que una creciente con un perodo de retorno de 50 aos ocurra exactamente en ese perodo?

    Aplicando la ecuacin 5.38 se tiene:

    37.0)50/11()501(

    50

    3)1X(P 491 ===

    b) Cul es la probabilidad de que en 50 aos se presenten 3 crecientes que igualen o excedan la de T BrB =50 aos?

    Con la misma ecuacin anterior se tiene:

    06.0)50/11()50/1(50

    3)3X(P 473 ===

    c) Cul es la probabilidad de que una o ms crecientes excedan el caudal con 50 aos de perodo de retorno en ese mismo tiempo?

    La clave para contestar esta pregunta est en las palabras una o ms. Como los eventos son independientes y mutuamente excluyentes, se puede escribir:

  • 99

    P[una o ms crecientes en 50 aos] = 1 - P[no crecientes en 50 aos] o lo que es lo mismo:

    P[una o ms crecientes en 50 aos]= 64050115010

    501 500 .)/()/( =

    5.5.2 Distribucin Geomtrica.

    Cuando se construye una obra con un caudal de diseo determinado, es de inters para los diseadores conocer cuntos aos pasarn antes que este caudal de diseo sea igualado o excedido. Si p es la probabilidad de excedencia del caudal de diseo (1/TBrB) , la probabilidad de falla en el n-avo ao,P, es:

    p)p1(P 1n= (5.40)

    Esta es la llamada distribucin geomtrica. La media y la varianza de la distribucin geomtrica son:

    22

    P)P1(

    P1

    =

    =

    (5.41)

    Ejemplo 5.9 El mximo nivel de la creciente anual de un ro se denota por H (metros): Asumiendo que la funcin de densidad de probabilidad se describe como se muestra en la grfica, determinar:

    a) La altura de inundacin para un perodo de 20 aos.

  • 100

    b) Cul es la probabilidad de que durante los prximos 20 aos la altura hallada en el numeral anterior sea excedida al menos una vez?.

    c) Cul es la probabilidad de que durante los prximos 5 aos este valor sea excedido exactamente una vez?

    H(m)

    F(H)

    5 6 7

    Solucin: a) El rea bajo la funcin de densidad es 1, que equivale a P(5[H[7) =1.

    Para un caudal con un TBrB de 20 aos se cumple que:

    05.020/1)HH(P20rT

    == = lo que significa que 0.05 es un rea bajo la funcin de densidad y:

    95.005.01)HH(P20rT

    == = y se plantea la siguiente relacin:

  • 101

    2)95.0)(H7(

    05.0 20rT ==

    Despejando el valor de H, se obtiene finalmente:

    9.6H20rT

    == m b) Se puede escribir la siguiente ecuacin:

    P(HBTr=20 B sea excedida al menos una vez) =1 - P(HBTr=20 B no sea excedida)

    Aplicando la ecuacin 5.38 (binomial ) se puede escribir entonces:

    P(HBTr=20 B sea excedida al menos una vez) =

    6420950050020

    1 200 .).().( =

    O sea que P(HBTr=20 B sea excedida al menos una vez) = 0.642

    b) Aplicando tambin la ecuacin 5.38, se tiene:

    024.0)95.0()05.0(15

    )1H(P 4.0120Tr ==== Ejemplo 5.9 Tres diques de control de inundaciones se construyen en una planicie por la cual corren dos ros, tal como se muestra en la figura. Los diques se disean as:

    El dique I tiene un caudal de diseo con un perodo de retorno de 20 aos.

    El dique II tiene un caudal de diseo con un perodo de retorno de 10 aos

    El dique III tiene un caudal de diseo con un perodo de retorno de 25 aos.

    Asumir que las crecientes en los ros A y B son estadsticamente independientes y que las fallas de los diques I y III tambin lo son.

  • 102

    a) Cul es la probabilidad de inundacin en un ao cualquiera producida solamente por el ro A.

    b) Cul es la probabilidad de inundacin de la planicie en un ao? c) Cul es la probabilidad de que no haya inundacin en los prximos 4

    aos?

    Solucin: a)El ro A puede producir inundacin en la planicie si falla el dique I o si falla el dique II, lo que se puede expresar como:

    145.005.01.01.005.0)III(P)III(P)II(P)I(P)III(P

    =+=+=

    b) La probabilidad de inundacin se da por el ro A o por el ro B, lo que puede expresarse como:

    )BA(P)B(P)A(P)BA(P += P(A)=0.145, hallado en el numeral anterior y P(B) =1/25=0.04, lo que implica que:

  • 103

    179.004.0145.004.0145.0)BA(P =+= c) La probabilidad de inundacin, P, en cualquier ao, es 0.179, como se

    explic en el numeral anterior, y la probabilidad ,q, de no inundacin ser entonces:

    q =1 -P =1 - 0.179 =0.821 y la probabilidad de no inundacin en 4 aos ser entonces:

    P(no inundacin en 4 aos) =(0.821)P4 P =0.454

    Ejemplo 5.10

    Un proyecto se disea con un caudal que tiene un perodo de retorno de 10 aos. Cul es la probabilidad de que este caudal se presente por primera vez al quinto ao de acabado el proyecto?

    Solucin:

    Este es un ejemplo donde puede aplicarse la distribucin geomtrica, as:

    La probabilidad de excedencia, p, para este caso es :

    p =1/Tr=1/10=0.1 Entonces:

    P(probabilidad de inundacin 5 ao)=(0.1)(1-0.1) =0.06561

    5.6. DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS

  • 104

    La mayora de las variables hidrolgicas son variables aleatorias continuas. Enseguida se describen brevemente las distribuciones de probabilidades ms usadas en anlisis de frecuencia de estas variables. 5.6.1 La distribucin Normal La distribucin Normal es una distribucin simtrica en forma de campana, conocida tambin como Campana de Gauss. Es fundamental en el dominio de la estadstica y la probabilidad. Una razn es que el teorema del lmite central establece que para varias condiciones muy generales, la distribucin de la suma de un gran nmero de variables aleatorias puede aproximarse a la Normal, sin importar a qu distribucin pertenezcan ellas mismas. Muchos procesos fsicos pueden conceptualizarse como la suma de procesos individuales. Por otra parte, muchos procesos de inferencia estadstica se basan en suposiciones de que la variable aleatoria se distribuye normalmente. Es por ello que la Normal encuentre tantas aplicaciones en hidrologa: en pruebas de hiptesis, intervalos de confianza, etc. Una variable aleatoria X se distribuye de acuerdo con una distribucin de probabilidades Normal si su FDP est dada como:

    x2

    2x

    2)x(

    xX e2

    1)x(f

    = (5.42) Los parmetros de la distribucin son dos: la media,BxB, y la desviacin estndar BxB. La asimetra de la distribucin es cero. Esta distribucin tiene una forma de campana simtrica, como se muestra en la Figura 5.5, por lo tanto la media, la moda y la mediana son iguales. Si se hace la siguiente transformacin:

  • 105

    xx /)x( = se obtiene como FDP y como funcin acumulada de la variable :

    de21 = (u)F

    e 21 = u)(f

    2w-

    -u

    2u-

    u

    2

    2

    (5.43)

    FIGURA 5.5 Distribucin normal.

    La variable u es llamada variable estandarizada, tiene media cero y desviacin estndar uno. Debido a que la variable normal estandarizada tiene todos sus parmetros conocidos, existen tablas para encontrar la funcin acumulada de esa variable. La tabla 5.1 es una de ellas. Aunque la simetra de la distribucin la hace inaplicable para valores extremos, la distribucin Normal describe el comportamiento probabilstico de los valores medios bastante bien. La distribucin normal se usa para:

  • 106

    - Aproximar la distribucin de probabilidades de errores aleatorios . - Comparar distribuciones: las propiedades de una muestra de variables no

    normales pueden compararse con las de variables normales. - Muchos estadsticos pueden ser normalmente distribuidos, como, por

    ejemplo, la media de la mayora de las variables hidrolgicas.

  • 107

    5.6.1.1 Estimacin de parmetros Solo se presentar en estas notas la estimacin de parmetros por el mtodo de los momentos, que fue desarrollado en 1902 por Karl Pearson. El consider que un buen estimativo de los parmetros de una distribucin de probabilidades es aqul para el cual los momentos de la funcin de densidad de probabilidades son iguales a los momentos correspondientes de la muestra. Los estimadores de los parmetros de la distribucin normal por el mtodo de los momentos son:

    =

    =N

    1iixN

    1 (5.44)

    2/1N

    i )x(N1 == (5.45)

    5.6.1.2 Factor de frecuencia Para la distribucin normal, el factor de frecuencia est dado como:

    -x=K (5.46)

    que es la misma variable reducida, definida por la ecuacin (5.41). La magnitud de la variable XBTB para un perodo de retorno dado T puede encontrarse, utilizando el factor de frecuencia, con el siguiente procedimiento:

    1. )T11(FK

    T11)K(F 1uu ==

  • 108

    2. Usando el valor calculado de P P

    T11 en la tabla 5.1, se lee el valor

    de x en la primera columna, que corresponde a K o FP-1P BB (1- 1/T) 3. Se calcula el valor buscado como:

    += X KT Ejemplo 5.11 Se tiene una estacin con 30 aos de datos de caudales medios anuales con media de 117 mP3P/s y desviacin estndar de 94 mP3P/s. Si los datos se ajustan a una distribucin Normal, cul es el caudal correspondiente a un perodo de retorno, TBrB, de 100 aos?. Solucin: En este caso se puede escribir: FBuB(K) = 1 - 1/TBrB = 0.99

    K = FBuPB-1 P(0.99) Con el valor de 0.99 en la tabla 5.1, se obtiene: K = 2.326 El valor asociado a Tr=100 se calcula como: QB100B = KQ Q + = 117 + 94 x 2.326 = 335.6 mP3P/s 5.6.1.3 Intervalos de confianza Cuando se desea hallar cualquier estadstico, por ejemplo la media, generalmente se dispone de una muestra de tamao limitado. Se quiere saber qu tan cercano puede estar ese estimado al verdadero valor desconocido de la poblacin. En otras palabras, se quisiera conocer con una cierta certeza (probabilidad) la franja de valores entre los cuales se encontrara el verdadero valor de la poblacin. Si esa franja es grande, habr mucha incertidumbre en el

  • 109

    valor estimado de la media, y si es pequea, habr, por el contrario, mucha confianza en ese valor estimado. Con ese fin se utilizan los llamados intervalos de confianza. Supngase, por ejemplo, que se desea estimar la media de la poblacin, . Asmase que 1 y 2 son dos estadsticos (funciones de la muestra aleatoria) tales que: 1 < 2 y P(1< < 2) =;. Entonces [1 , 2] es llamado el intervalo de confianza para la media ., ; es llamado el nivel de confianza (nivel de probabilidad) y 1 y 2 son llamados los lmites de confianza inferior y superior, respectivamente. Esta definicin puede extenderse al intervalo de estimacin de un parmetro cualquiera o a una funcin del parmetro. Se debe tener en cuenta que los intervalos de confianza y los lmites de confianza son realmente variables aleatorias, ya que son funciones del tamao de la muestra y de estimadores a su vez, funcin de muestras aleatorias. Como los tamaos de la muestra varan, los intervalos de confianza cambian de una muestra a otra. Mientras ms estrecho es el intervalo de confianza, mejor es el procedimiento de estimacin. Para el valor estimado asociado a un perodo de retorno cualquiera, los intervalos de confianza se calculan usando el error estndar, SBTB, el cual es una medida de la desviacin estndar de la magnitud de un evento calculado a partir de una muestra respecto a la verdadera magnitud del evento. Se presentarn para todas las distribuciones, los intervalos de confianza para los diferentes cuantiles de la poblacin. Para la distribucin Normal, los lmites de confianza para el verdadero valor de un cuantil asociado con un periodo de retorno T son:

    SuX T-1T (5.47)

  • 110

    en donde ; es el nivel de probabilidad, uB1- B es el cuantil de la distribucin Normal estandarizada para una probabilidad acumulada de 1- y SBTB es el error estndar. Cada distribucin tiene expresiones para hallar el error estndar, por ejemplo, el de la distribucin Normal es:

    ( )2/K + 1N

    = S 2xT 21 (5.48)

    Ejemplo 5.12 Los caudales medios anuales de un ro con media 1.5 mP3P/s y desviacin estandar de 0.6 mP3P/s se distribuyen normalmente. Cul es la probabilidad de que se produzca un caudal medio igual o menor a 1 mP3P/s, en cualquier ao?. Solucin: Se tiene entonces que:

    )

    1(P)1X(P =

    Reemplazando los valores:

    )83.0(P)6.0

    5.11(P = En la tabla 5.1, se encuentra P(-0.83). Considerando la simetra de la distribucin normal (ver Figura 5.6 en donde A = B), se tiene: P( -0.83) = 1 - P( 0.83) = 1 - 0.797 = 0.203

  • 111

    FIGURA 5.6 Simetra de la distribucin normal. Ejemplo 5.13 La escorrenta anual de una pequea cuenca se distribuye normalmente con media de 356 mm y desviacin estndar de 76.2 mm. Determinar la probabilidad de que la escorrenta anual sea menor que 280 mm en todos los tres siguientes aos. Solucin:

    )997.0(P)2.76356280(P)280P ==

    y:

    1587.08413.01)997.0(P == La probabilidad de que sea menor en tres aos consecutivos es: 0,1587 x 0,1587 x 0,1587 = 0,00399 5.6.2 Distribucin Log Normal Consideremos un clculo hipottico de la escorrenta en una cuenca. La escorrenta es el producto de varios factores aleatorios, como lluvia, rea

  • 112

    contribuyente, prdidas, coeficiente de evaporacin, etc. En general, cuando la variable aleatoria X es el producto de un gran nmero de otras variables aleatorias, la distribucin de los logaritmos de X puede aproximarse a la Normal, ya que los logaritmos de X son la suma de los logaritmos de los factores contribuyentes. Si se tiene una variable aleatoria X y ln X = Y se ajusta a una distribucin Normal, se dice que la variable aleatoria X es lognormalmente distribuida. La funcin de densidad de esta distribucin, si se asume que Y=logBaB(X), donde a es la base del logaritmo, es: ( )

    -y

    21- exp

    2x1 = (x)f 2

    y

    y2

    yX (5.49)

    ByB es el parmetro de escala y ByB es el parmetro de forma. La forma de la distribucin lognormal se muestra en la Figura 5.7.

    FIGURA 5.7 Distribucin lognormal.

  • 113

    Se ha demostrado que la distribucin lognormal puede aplicarse en un amplio nmero de eventos hidrolgicos, especialmente a aquellos casos en los cuales la variable tiene un lmite inferior, la distribucin emprica no es simtrica y los factores que causan los eventos son independientes y multiplicativos. Si la variable aleatoria X tiene un lmite inferior xBoB diferente de cero, y la variable Z = X -xBoB sigue una distribucin lognormal con dos parmetros, entonces X se ajusta a una distribucin lognormal con tres parmetros. La funcin de densidad de esta distribucin es:

    ( )( )[ ]

    -x-X ln

    21- exp

    x-X21 = (x)f

    y

    yo2

    yoX (5.50)

    donde los parmetros ByB, ByB y xBoB son llamados los parmetros de escala, forma y localizacin respectivamente. La distribucin lognormal con tres parmetros puede aplicarse a eventos con valores positivos o negativos, siempre que x xB0B; mientras que la lognormal con dos parmetros solo puede aplicarse a eventos con valores positivos. 5.6.2.1 Estimacin de parmetros Para la distribucin lognormal de dos parmetros, usando el mtodo de momentos, los parmetros se pueden estimar como:

    =

    =N

    1iiaY )X(logN

    1 (5.51)

    [ ] 21N1i

    2YiaY )X(logN

    1

    =

    = (5.52)

    Para la distribucin lognormal de tres parmetros, xBoB debe tambin estimarse. Una manera de estimar xBoB requiere que el coeficiente de asimetra sea

  • 114

    positivo. En este mtodo, el segundo momento de Z = X - xBoB no depende de xB0B, esto es, BzB = BxB y BzB = BxB - xB0B, entonces el lmite inferior xBoB se puede expresar como:

    CvCv-1 = x

    z

    xx0 (5.53)

    Donde:

    z

    zz

    x

    xx

    Cv

    Cv

    ==

    (5.54)

    Donde: ( )( )[ ] 0 ; 4 + + -

    21 = w

    ww-1 = Cv

    x2x

    1/2x

    1/3

    2/3

    z

    > (5.55)

    en donde Bx Bes el coeficiente de asimetra de x. Los parmetros de la distribucin lognormal de dos parmetros tambin pueden estimarse con base en las relaciones entre los parmetros de la variable transformada BYB y BY By los parmetros de la variable original BX By BXB, dadas como:

    ( ) 2YXaY 21log = (5.56)

    21

    2X

    2X

    aY 1log

    += (5.57)

  • 115

    En este caso, se estiman BX B y BX Bcon los datos originales, y con las ecuaciones anteriores se estiman BY By BYB los parmetros de la distribucin lognormal. Ejemplo 5.14 Los caudales medios de un ro en una estacin hidromtrica han sido modelados con las siguientes distribuciones: a) Normal con parmetros = 256.7 mP3P/s y = 191 mP3P/s b) Lognormal con parmetros ByB = 5.228 y ByB = 0.84 Calcular la probabilidad de que el caudal medio est entre 300 y 400 mP3P/s Solucin: a) Si se usa la Normal se tiene: P(300[Q[400)= FBXB(400)-FBXB(300) Si se usa la variable estandarizada , se tiene entonces que:

    P(300Q400)= FBB

    x

    xu

    x

    x

    300F

    -400

    = FBu B(uB400B) - FBu B(uB300B) donde: uB300B = (300 - 256.7)/191 = 0.2267 con este valor, se va a la tabla 5.1 y se encuentra que FBx B(0.2267) = 0.5871 y uB400B = (400 - 256.7)/191 = 0.75 de la tabla 5.1, se tiene: FBx B(0.75) = 0.7734

  • 116

    lo que implica que: P(300Q400)=0.7734 - 0.5871=0.1863 b) Si se usa la distribucin lognormal: P(300Q400)=FBYB(ln(400))-FBYB(ln(300)) = ( ) ( )

    Y

    Yu

    Y

    Yu

    300lnF400lnF

    y: ln(300) = 5.704 ln(400) = 5.99 se tiene entonces que: FBB(B5.99 B) = (5.99 - 5.228)/0.84 = 0.91 de la tabla 5.1 se tiene que FBB(0.91) = 0.8186 FBB(B5.704B )= (5.704 - 5.228)/0.84 = 0.564 de la tabla 5.1 se obtiene F(0.564) = 0.7123 se encuentra finalmente: P(300 Q 400) = 0.8186 - 0.7123 = 0.106 Este ejemplo se puede resolver tambin calculando BYB y BYB a partir de Bx B y Bx Bcon las ecuaciones 5.56 y 5.57. B 5.6.2.2 Factor de frecuencia Se utiliza el mismo factor de frecuencia que en la distribucin Normal, excepto que este se aplica a los logaritmos de la variable y la ecuacin, para un cuantil cualquiera XBTB queda: ( ) yyT K+=Xln (5.58)

  • 117

    en donde K FTu

    =

    1 1 1

    Si se quiere trabajar con la variable no transformada al campo logartmico se tiene que:

    ( )( ) ( )Cv

    1-2

    Cv+1ln-Cv+1lnKexp = K

    22 1/2

    T

    (5.59)

    donde:

    T1-1F=K

    ru

    -1T (5.60)

    FTu

    1 1 1 es el inverso de la funcin de distribucin Normal estandarizada

    acumulada y CBv B es el coeficiente de variacin 5.6.2.3 Intervalos de confianza En el campo transformado, los lmites estn dados por los de la distribucin Normal como: ( ) SXln T2-1T u (5.61) en donde:

    N=S YT

    (5.62) y

  • 118

    2

    K+1=2T

    1/2

    (5.63)

    Ejemplo 5.15 Se tiene un ro con caudales mximos anuales lognormalmente distribuidos, con x =15 mP3P/s y x =5 mP3P/s; se da tambin Y =2.6554 y Y =0.3246. Encontrar el caudal para un perodo de retorno de 100 aos. Si se tiene un perodo de retorno de 30 aos de registro, cules son los lmites de confianza para un ; de 10%?. Solucin: El coeficiente de variacin se calcula como:

    0.33=155=

    =vCx

    x

    Para hallar KBTB, se procede as:

    0.99=100

    1-1=T1-1=)(KF

    ITu

    De la tabla 5.1:

    33.2)99.0(FK 1T == El valor de K se puede calcular usando la ecuacin (5.59) como:

    ( )( ) ( )0.333

    1-2

    330.+1ln-330.+1ln2.33exp = K

    22 1/2

  • 119

    K= 3.028 El valor asociado a un perodo de retorno de 100 aos ser: XBTB = 15 + 5 x 3.028 = 30.14 mP3P/s Los lmites de confianza se hallan as en el campo transformado: ( ) SuXln T2-1T Se calcula primero con la ecuacin (5.63) y luego SBTB con la ecuacin (5.60), el resultado es:

    1.93=2

    2.33+1=2 1/2

    0.11=30

    0.3246*1.93=ST

    De la tabla 5.1, se lee: B1-;B=B0.95B=1.64 Por lo tanto: ln (30.28) 1.64 * 0.11 = 3.41 0.1875 = [3.2225, 3.5975] = [eP3.2225P, eP3.5975P] = [25.091, 36.5] 5.6.3 Distribucin Gumbel Una familia importante de distribuciones usadas en el anlisis de frecuencia hidrolgico es la distribucin general de valores extremos, la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y sequas. A partir de la distribucin general de valores extremos, se pueden derivar tres tipos de distribuciones: la tipo I, comnmente conocida como Gumbel, la tipo II y la tipo III, llamada tambin Weibull.

  • 120

    Ellas difieren entre s por el valor del parmetro de forma. La expresin general de la funcin de densidad de probabilidades para la distribucin extrema tipo I o Gumbel es:

    -x-exp--x-exp1=(x)fX (5.64)

    En donde y son los parmetros de la distribucin. La distribucin Gumbel tiene la forma mostrada en la figura 5.8. 5.6.3.1 Estimacin de parmetros Por el mtodo de momentos, los estimadores de los parmetros son:

    6= (5.65)

    57720.-= (5.66)

    donde y son la media y la desviacin estndar estimadas con la muestra. 5.6.3.2 Factor de frecuencia El factor de frecuencia para la distribucin Gumbel es:

    ( )[ ]{ }1-Tln-Tlnln+0.5776-=K rr (5.67) donde TBIB es el perodo de retorno. 5.6.3.3 Intervalos de confianza

  • 121

    Los lmites de confianza por el mtodo de momentos para un nivel de probabilidad ; son:

    SuX T2-1T (5.68)

    FIGURA 5.8 Distribucin Gumbel

    N=ST

    (5.69) [ ]K1.1+1.1396K+1= 2 1/2 (5.70) K es el factor de frecuencia de la distribucin, dado por la ecuacin 5.67. 5.6.4 Distribucin Gamma Esta distribucin ha sido una de las ms usadas en hidrologa. Como la mayora de las variables hidrolgicas son sesgadas, la funcin Gamma se utiliza para ajustar la distribucin de frecuencia de variables tales como crecientes mximas anuales, caudales mnimos, volmenes de flujo anuales y estacionales, valores de precipitaciones extremas y volmenes de lluvia de corta duracin. La funcin de distribucin Gamma tiene dos o tres

  • 122

    parmetros. La ltima funcin es llamada tambin Distribucin Pearson tipo III. La distribucin Gamma est relacionada con otras distribuciones muy conocidas como las distribuciones Chi-cuadrado y la exponencial negativa, que son casos particulares de la distribucin Gamma. La distribucin Gamma de dos parmetros tiene una funcin de densidad de probabilidades de la forma:

    ex

    )(||1=(x)f

    x-

    -1

    X

    (5.71)

    Donde: 0 x < para ; > 0 -: < x ; para ; < 0 ; y son los parmetros de escala y forma, respectivamente, y () es la funcin Gamma completa. El parmetro siempre es mayor que cero, mientras que ; puede ser positivo o negativo. La funcin Gamma completa est dada por:

    dzez=)( z--10

    (5.72)

    La distribucin Gamma de tres parmetros tiene la siguiente funcin de densidad de probabilidades:

    x-x-expx-x)(||

    1=(x)f oo-1

    X (5.73)

    Donde: xBoB x < ; para ; > 0

  • 123

    -: < x xBoB para ; < 0 ; y son los parmetros de escala y forma, respectivamente, y xBoB es el parmetro de localizacin. La Figura 5.9 muestra formas de la funcin de densidad de probabilidades Gamma para ; > 0. 5.6.4.1 Estimacin de parmetros Para la distribucin Gamma de dos parmetros, usando el mtodo de los momentos, se tienen las siguientes expresiones (para sus parmetros).

    = (5.74)

    22 = (5.75)

    FIGURA 5.9 Distribucin Gamma.( Varas, Bois, 1998) Los estimadores de los parmetros, por el mtodo de momentos, son los siguientes:

  • 124

    =

    C1= 2v

    (5.76)

    $ $ $ , y Cv son la media, desviacin estndar y coeficiente de variacin

    calculados con la muestra, respectivamente.

    Para la distribucin Gamma con tres parmetros o Pearson tipo III, los parmetros, por el mtodo de momentos, pueden estimarse por:

    2

    2=

    (5.77)

    2= (5.78)

    =X0 (5.79) $ es el coeficiente de asimetra calculado usando la muestra. 5.6.4.2 Factor de frecuencia Si se define:

    T1-1F=K

    ruT (5.80)

    el factor de frecuencia K tiene la siguiente forma:

  • 125

    6

    K+6

    1)(K6

    )6KK(31+

    6

    1)(K+KK4

    T

    32

    T

    2

    TT32

    tT

    (5.81)

    Para la distribucin Pearson tipo III o Gamma de 3 parmetros, existen tablas, como la 5.2, que dan el factor de frecuencia en funcin del coeficiente de asimetra calculado con la muestra. 5.6.4.3 Intervalos de confianza Si se tiene que:

    SuX T21T

    NST

    = (5.82)

    =(,TBrB) y est tabulado para la Gamma de dos parmetros y para la Pearson tipo III. La tabla 5.3 da valores de , para hallar el intervalo de confianza de la distribucin Pearson tipo III. 5.6.5 Distribucin log Pearson Tipo III Si los logaritmos de la variable aleatoria X se ajustan a una distribucin Pearson Tipo III, se dice que la variable aleatoria X se ajusta a una distribucin Log Pearson Tipo III. Esta distribucin es ampliamente usada en el mundo para el anlisis de frecuencia de caudales mximos. Su funcin de densidad est dada por:

    e y-(x)ln

    )( x 1=(x) o

    y -(x)ln -o-1

    xf (5.83)

    donde ; es el parmetro de escala, es el parmetro de forma y yBoB el parmetro de localizacin.

  • 126

  • 127

    TABLA 5.2. VALORES DE KBTB PARA LA DISTRIBUCIN PEARSON III (ASIMETRA POSITIVA)

    Coeficiente Probabilidad de Excedencia

    de Asimetra 0.500 0.200 0.100 0.040 0.020 0.010 0.005

    3.0 -0.396 0.420 1.180 2.278 3.152 4.051 4.970 2.9 -0.390 0.440 1.195 2.277 3.134 4.013 4.909 2.8 -0.384 0.460 1.210 2.275 3.114 3.973 4.847 2.7 -0.376 0.479 1.224 2.272 3.093 3.932 4.783 2.6 -0.368 0.499 1.238 2.267 3.071 3.889 4.718 2.5 -0.360 0.518 1.250 2.262 3.048 3.845 4.652 2.4 -0.351 0.537 1.262 2.256 3.023 3.800 4.584 2.3 -0.341 0.555 1.274 2.248 2.997 3.753 4.515 2.2 -0.330 0.574 1.284 2.240 2.970 3.705 4.444 2.1 -0.319 0.592 1.294 2.230 2.942 3.656 4.372 2.0 -0.307 0.609 1.302 2.219 2.912 3.605 4.298 1.9 -0.294 0.627 1.310 2.207 2.881 3.553 4.223 1.8 -0.282 0.643 1.318 2.193 2.848 3.499 4.147 1.7 -0.268 0.660 1.324 2.179 2.815 3.444 4.069 1.6 -0.254 0.675 1.329 2.163 2.780 3.388 3.990 1.5 -0.240 0.690 1.333 2.146 2.743 3.330 3.910 1.4 -0.225 0.705 1.337 2.128 2.706 3.271 3.828 1.3 -0.210 0.719 1.339 2.108 2.666 3.211 3.745 1.2 -0.195 0.732 1.340 2.087 2.626 3.149 3.661 1.1 -0.180 0.745 1.341 2.066 2.585 3.087 3.575 1.0 -0.164 0.758 1.340 2.043 2.542 3.022 3.489 0.9 -0.148 0.769 1.339 2.018 2.498 2.957 3.401 0.8 -0.132 0.780 1.336 1.993 2.453 2.891 3.312 0.7 -0.116 0.790 1.333 1.967 2.407 2.824 3.223 0.6 -0.099 0.800 1.328 1.939 2.359 2.755 3.132 0.5 -0.083 0.808 1.323 1.910 2.311 2.686 3.041 0.4 -0.066 0.816 1.317 1.880 2.261 2.615 2.949 0.3 -0.050 0.824 1.309 1.849 2.211 2.544 2.856 0.2 -0.033 0.830 1.301 1.818 2.159 2.472 2.763 0.1 -0.017 0.836 1.292 1.785 2.107 2.400 2.670 0.0 0.000 0.842 1.282 1.751 2.054 2.326 2.576

  • 128

    FIGURA 5.10 Distribucin Log-Pearson Tipo III. (Salas, 1992). 5.6.5.1 Estimacin de Parmetros Los estimadores de los parmetros por el mtodo de los momentos son:

    2

    y2

    =

    2

    = yy

    = y y0

    (5.84)

    Donde yy , y son la media, desviacin estndar y coeficiente de asimetra calculados usando los logaritmos de los datos, respectivamente. 5.6.5.2 Factor de frecuencia Si se cumple que Y= ln X, se tiene que:

  • 129

    K+=Xln=Y yyTT (5.85)

    En donde BY By By B son la media y desviacin estndar de los logaritmos de X, y K se obtiene de la tabla 5.2. TABLA 5.3 VALORES DE PARA LA DISTRIBUCION PEARSON

    TIPO III

    TBrB=2 TBrB=5 TBrB=10 TBrB=20 TBrB=50 TBrB=100 0.0 1.0801 1.1698 1.3748 1.6845 2.1988 2.6363 0.1 1.0808 1.2006 1.4367 1.7810 2.3425 2.8168 0.2 1.0830 1.2309 1.4989 1.8815 2.4986 3.0175 0.3 1.0866 1.2609 1.5610 1.9852 2.6656 3.2365 0.4 1.0913 1.2905 1.6227 2.0915 2.8423 3.4724 0.5 1.0987 1.3199 1.6838 2.1998 3.0277 3.7238 0.6 1.1073 1.3492 1.7441 2.3094 3.2209 3.9895 0.7 1.1179 1.3785 1.8032 2.4198 3.1208 4.2684 0.8 1.1304 1.4082 1.8609 2.5303 3.6266 4.5595 0.9 1.1449 1.4385 1.9170 2.6403 3.8374 4.8618 1.0 1.1614 1.4699 1.9714 2.7492 4.0522 5.1741 1.1 1.1799 1.5030 2.0240 2.8564 4.2699 5.4952 1.2 1.2003 1.5382 2.0747 2.9613 4.4996 5.8240 1.3 1.2223 1.5764 2.1237 3.0631 4.7100 6.1592 1.4 1.2157 1.6181 2.1711 3.1615 4.9301 6.4992 1.5 1.2701 1.6643 2.2173 3.2557 5.1486 6.8427 1.6 1.2952 1.7157 2.2627 3.3455 5.3644 7.1881 1.7 1.3204 1.7732 2.3081 3.4303 5.5761 7.5339 1.8 1.3452 1.8374 2.3541 3.5100 5.7827 7.8783 1.9 1.3690 1.9091 2.4018 3.5844 5.9829 8.2196 2.0 1.3913 1.9888 2.4525 3.6536 6.1755 8.5562

    5.6.5.3 Intervalos de confianza

    Se utiliza la tabla 5.3 para hallar valores del parmetro y se cumple que:

  • 130

    N=S yT (5.86)

    Los lmite de confianza se pueden expresar como:

    T2/1T SXln (5.87)

    5.7 ANLISIS DE FRECUENCIA El anlisis de frecuencia puede hacerse de dos maneras: usando los llamados factores de frecuencia o hallando la distribucin emprica de los datos muestrales, por el mtodo de "Plotting position" o posicin de graficacin. Como regla general, el anlisis de frecuencia no debe realizarse para perodos cortos, menores de 10 aos de registros. A continuacin se describe brevemente los dos procedimientos propuestos para realizar el anlisis de frecuencia. 5.7.1 Posicin de graficacin o"Plotting Position" La posicin de graficacin o plotting posittion" trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. Para determinar sta, se han propuesto numerosos mtodos empricos. Si n es el nmero total de valores y m es el rango de un valor en una lista ordenada de mayor a menor (m = 1 para el valor mximo y m=n para el menor valor), la probabilidad de excedencia se puede obtener por medio de las siguientes expresiones: California:

    nm = P (5.88)

  • 131

    Weibull:

    1nmP += (5.89)

    Hazen:

    n 21 - m 2 = P (5.90)

    La expresin acumulada de probabilidades ms usada es la de Weibull. Con las anteriores ecuaciones, se halla la que se conoce como distribucin emprica de una muestra. Luego se puede hacer un anlisis para ajustar a la distribucin emprica una de las distribuciones tericas vistas anteriormente. La distribucin acumulada de una variable puede ser representada grficamente en un papel de probabilidad diseado para la distribucin. En este papel, las ordenadas representan el valor de x en una cierta escala y las abscisas representan la probabilidad de P(X >x) o P(X< x), el perodo de retorno o la variable reducida. Las escalas de las ordenadas y las abcisas son diseadas de tal manera que cuando una muestra es de una poblacin con esa distribucin, la grfica debe ajustarse a una lnea recta. El propsito de este papel es "linealizar" las relaciones de probabilidad para que los datos puedan ser fcilmente dibujados y usados en extrapolacin o propsitos de comparacin. Se puede observar en las pginas siguientes los papeles de probabilidad correspondientes a las distribuciones Gumbel y Log-Normal. 5.7.2 Factores de frecuencia Ven te Chow propuso que toda muestra se puede ajustar a una expresin como la siguiente:

    K+ = X (5.91) til para el anlisis de frecuencia hidrolgico, donde K es el factor de frecuencia, $ es la media estimada y $ es la desviacin estndar estimada. Cada distribucin tiene su factor de frecuencia como se vio anteriormente.

  • 132

  • 133

  • 134

    5.8 BONDAD DE AJUSTE DE UNA DISTRIBUCION DE PROBABILIDADES En los numerales anteriores, se ha descrito el uso de varias distribuciones de probabilidad para estimar eventos con perodos de retorno mayores que los de los eventos histricos. Surge entonces el interrogante de cul de estas distribuciones se debe utilizar para una muestra particular. No hay un acuerdo entre los hidrlogos acerca de cul de las distribuciones debe usarse. Las pruebas para comprobar la bondad del ajuste son necesarias, pero no son suficientes para aceptar una distribucin. Tal vez las dos pruebas de bondad de ajuste ms utilizadas en hidrologa son la Chi - Cuadrada y la Smirnov - Kolmogorov.Con estas pruebas se escogera con la muestra, la distribucin de probabilidades que representa el comportamiento probabilstico de la poblacin. Una prueba adicional puede hacerse calculando la suma de los cuadrados de las diferencias entre los valores observados y los calculados. Aunque los procedimientos estadsticos no pueden por s solos determinar la mejor distribucin de frecuencia, si pueden suministrar argumentos para escoger la distribucin ms adecuada. Por ejemplo, las distribuciones Pearson tipo III y Log-Pearson tipo III requieren la estimacin del coeficiente de asimetra de datos muestrales. Esto puede ser una razn suficiente para preferir cualquier otra distribucin, ya que este parmetro tiene un comportamiento muy sesgado, por lo cual se necesitara una gran cantidad de registros para tener un estimado ms o menos confiable, y dichos registros no se consiguen fcilmente en nuestro medio. Por otra parte, las distribuciones de dos parmetros tienen un valor fijo o ignoran la asimetra de la poblacin, lo cual tampoco es conveniente. En resumen, no hay un procedimiento nico para escoger la mejor distribucin. Las pruebas estadsticas ayudan; el ajuste grfico tambin puede contribuir; en definitiva, prima el juicio de quien est haciendo el anlisis. 5.8.1 Prueba Smirnov - Kolmogorov

  • 135

    El estadstico Smirnov - Kolmogorov, D, considera la mxima desviacin de la funcin de distribucin de probabilidades emprica de la muestra, FE(x), de la funcin de distribucin de probabilidades terica, escogida , FBxB (x), tal que:

    |(x)F-FE(x)|Max=D xn (5.92) La prueba requiere que el valor DBnB calculado con la expresin anterior sea menor que el valor tabulado DBnB para el nivel de probabilidad requerido. Esta prueba es fcil de realizar y comprende las siguientes etapas: - El estadstico DBnB es la mxima diferencia entre la funcin de

    distribucin acumulada emprica de la muestra y la funcin de distribucin acumulada terica escogida.Se fija el nivel de probabilidad. Valores como 0.05 y 0.01 son los ms usuales.

    - El valor crtico DBaB de la prueba debe ser obtenido de tablas como la tabla 5.4. Este estadstico es funcin de y n.

    - Si el valor calculado DBnB es mayor que DBaB, la hiptesis de que la distribucin terica escogida se ajusta adecuadamente al comportamiento probabilstico de la poblacin debe rechazarse, de otra manera, se acepta esta hiptesis.

    5.8.2 Prueba Chi Cuadrado La prueba Chi-cauadrado se usa tambin para determinar el grado de ajuste de una distribucin de probabilidades terica a una distribucin emprica. Supongase que en una muestra se tengan una serie de posibles eventos EB1B, EB2B, ....EBkB que ocurren con frecuencias observadas de OB1B, OB2B, .....OBkB. Si se tiene una distribucin terica de probabilidades se espera que esos eventos ocurran con frecuencias eB1B, eB2B,....eBkB B TABLA 5.4 VALORES DE DnB

  • 136

    N ;=0.20 ;=0.10 ;=0.05 ;=0.01 5 0.45 0.51 0.56 0.67 10 0.32 0.37 0.41 0.49 15 0.27 0.30 0.34 0.40 20 0.23 0.26 0.29 0.36 25 0.21 0.24 0.27 0.32 30 0.19 0.22 0.24 0.29 35 0.18 0.20 0.23 0.27 40 0.17 0.19 0.21 0.25 45 0.16 0.18 0.20 0.24 50 0.15 0.17 0.19 0.23

    N50 N071.

    N221.

    N361.

    N631.

    Se est interesado en conocer como difieren las frecuencias observadas de las frecuencias esperadas (halladas con una distribucin terica de probabilidades). Una medida de la discrepancia entre frecuencias observadas y calculadas est dada por el estadstico P2P as:

    =

    =k

    1i i

    2ii2

    e)eO( (5.93)

    donde:

    = ii eO Si P2P =0, significa que las distribucion terica y emprica ajustan exactamente, mientras que si P2P0, ellas difieren. La distribucin de la variable P2P se puede asimilar a una distribucin Chi-cuadrado con (k-n-1) grados de libertad, donde k es el nmero de intervalos y n es el nmero de parmetros de la distribucin terica. La funcin P2P est tabulada en muchos textos de estadstica.Supngase que la hiptesis HBoB es aceptar que una distribucin emprica se ajusta a una distribucin Normal. Si el valor calculado de P2P por la ecuacin 5.89 es mayor que algn valor crtico de P2P ,con niveles de significancia ;de 0.05 o 0.01 ( el nivel de confianza se define como 1-;, siendo

  • 137

    frecuentemente utilizados niveles de confianza del 95%), se puede decir que las frecuencias observadas difieren significativamente de las frecuencias esperadas y entonces la hiptesis HBoB se rechaza (para esos niveles de significancia). Si ocurre lo contrario, entonces se acepta. Este procedimiento es llamado la prueba de hiptesis Chi- cuadrado. Ejemplo 5.16 Se tienen los valores de temperatura mensual de una ciudad, mostrados en la tabla 5.5 . Se supone que estas temperaturas se ajustan a una distribucin Normal. Usando la prueba Smirnov-Kolmogorov, verificar la validez de esta hiptesis. Solucin: La media de la muestra es 76.4F y la desviacin estndar es 3.1 F. Se fijan dos hiptesis: una hiptesis HBoB estipula que la variable X es normalmente distribuida con los valores de la media y desviacin estndar calculados anteriormente y la otra hiptesis alternativa, HBa,B es lo contrario de sta. Se puede fijar un intervalo de 1 F y se hace la tabla 5.6 donde FE(T) es la frecuencia acumulada de la muestra, fBT B(t) es la frecuencia, FE(t)N es la distribucin de probabilidades acumulada emprica y FBTB(t) es la distribucin de probabilidades acumulada Normal (se halla utilizando el concepto de variable reducida u y usando la tabla 5.1) El mayor valor DBnB es 0.0758. El valor DBa Bobtenido de la tabla 5.5 para un ; del 90% es igual a 0.1963, lo cual significa que la hiptesis HBoB puede aceptarse.

    TABLA 5.5 Temperaturas en FP8P

  • 138

    Ao Junio Julio Agosto

    1944 77 77 77

    1945 72 76 76

    1946 76 78 74

    1947 74 74 83

    1948 78 80 76

    1949 75 79 74

    1950 75 73 70

    1951 73 78 78

    1952 82 81 77

    1953 79 80 78

    1954 78 83 80

    1955 69 80 79

    1956 74 77 77

    1957 75 76 74

    1958 72 76 74

    1959 72 75 76

    TABLA 5.6 Distribuciones de probabilidades emprica y Normal para la temperatura.

  • 139

    T fBTB(t) FE(t) FE(t)N FBTB(t) FE(t)N -FBTB(t)

    68 0 0 0 0.0035 0.0045

    69 1 1 0.0208 0.0084 0.0124

    70 1 2 0.0417 0.0197 0.022

    71 0 2 0.0417 0.0409 0.0008

    72 3 5 0.1042 0.0778 0.0264

    73 2 7 0.1458 0.1357 0.0101

    74 7 14 0.2917 0.2206 0.0711

    75 4 18 0.3750 0.3264 0.0486

    76 7 25 0.5208 0.488 0.0328

    77 6 31 0.6458 0.5753 0.0705

    78 6 37 0.7708 0.6950 0.0758

    79 3 40 0.83333 0.7995 0.0338

    80 4 44 0.9167 0.8770 0.0397

    81 1 45 0.9375 0.9306 0.0069 Ejemplo 5.17

  • 140

    Se tienen los caudales mximos instantneos de la estacin RP-3 en el Ro Murr, en el departamento de Antioquia. Se desea encontrar el caudal de un perodo de retorno de 50 aos hallado con las distribuciones Gumbel, Lognormal de dos parmetros y Log Pearson tipo III.

    Ao Q mP3P/s

    1978 3239.0 1979 3431.7 1980 4577.9 1981 3612.0 1982 4151.8 1983 1949.0 1984 2342.9 1985 1345.0 1986 1862.2 1987 1652.8 1988 4220.0 1989 4958.4 1990 2664.9 1991 1392.7

    Solucin Distribucin Gumbel Aplicando la ecuacin de Ven Te Chow se tiene que:

    +== KQ 50Tr y: 2.2957 = mP3P/s 58.1234 = mP3P/s

  • 141

    De la ecuacin 5.67 se halla el factor de frecuencia K=2.5924 Se tiene entonces que: QBTr=50B=6158 mP3P/s Aplicando la ecuacin 5.68 y 5.69 para hallar el error estandar, SBTB se obtiene que: SBTB=1111.458 mP3P/s Para ;=0.05 se obtiene de la tabla 5.1 que TB0.95B=1.645 y aplicando la ecuacin 5.70 para los intervalos de confianza se obtiene finalmente que: (4329.37 QBTr=50B=61587986.07) Distribucin Log-Normal Con los logaritmos de los valores de caudales mximos instantneos se obtiene que:

    4504.0903.7

    y

    y

    ==

    Aplicando la ecuacin 5.59 para hallar el factor de frecuencia K y utilizando la tabla 5.1 se halla: K=2.055 De la ecuacin 5.58:

    ln QBTr=50B=8.8286 y sacando el antilogaritmo : QBTr=50B=6827 mP3P/s Con las ecuaciones 5.62 y 5.63 se obtiene un error estandar SBTB=0.2123

  • 142

    Para un ;=0.05 se obtiene de la tabla 5.1 TB0.95B=1.64. Finalmente : (4814.4QBTr=50B=68279679.84) Distribucin Pearson Tipo III Se tiene que:

    1702.06.12342.2957

    ===

    De la tabla 5.2 se obtiene el valor del factor de frecuencia K: K=2.144 y aplicando la ecuacin de Ven TE Chow: QBTr=50B=5604 mP3P/s Con la ecuacin 5.82 y con la tabla 5.3 se obtiene un error estandar SBTB=809.05 y los intervalos de confianza para ;=0.05 son entonces: (4273QBTr=50B=56046934.9)

    Ejemplo 5.1Ejemplo 5.2TR = 238 aos

    Ejemplo 5.3Solucin:y P(Pb) = 5/1000. Reemplazando, se obtiene que:P(F) = 0.00567P(AB) = P(A) + P(B) = (1/2)2K = 2.326P(300 ( Q ( 400) = 0.8186 - 0.7123 = 0.106K=2.055K=2.144