Dist Gumbel

10

Click here to load reader

Transcript of Dist Gumbel

Page 1: Dist Gumbel

ANÁLISIS DE FRECUENCIAS DE GASTOS MÁXIMOS ANUALES, USANDO LA DISTRIBUCIÓN DE VALORES EXTREMOS TIPO I, EMPLEANDO DISTINTAS TÉCNICAS DE ESTIMACIÓN DE

PARÁMETROS

Torres Cadena, Jorge Luis1

1Coordinación de Hidráulica, Universidad Nacional Autónoma de MéxicoCorreo electrónico: 1 [email protected]

1Arquitectura #34, Col. Copilco Universidad, C. P. 04360, Coyoacán, México, D. F.Tel. 5524964500

Resumen

En este trabajo se presenta la función de distribución de probabilidad de valores extremos tipo I empleando distintas técnicas de estimación de parámetros como las siguientes: estimadores por momentos, estimadores por máxima verosimilitud, estimadores por momentos – L y estimadores por máxima entropía. Los métodos se desarrollan con algoritmos muy particulares que generan distintos parámetros de posición y escala, y en consecuencia, modifica los eventos de diseño calculados para cada técnica de estimación. La complejidad de cada técnica radica en los procesos iterativos en que se sustente cada método y en los criterios de convergencia adoptados para cada caso. Se concluye que para cada distribución de probabilidad se deben aplicar el mayor número de técnicas de estimación de parámetros y finalmente elegir aquella que genere el menor error aplicando criterios de bondad de ajuste.

Palabras clave: análisis de frecuencia, distribución Gumbel, estimación de parámetros.

Introducción

El análisis y diseño de una estructura hidráulica depende fundamentalmente de la variable de impulso que genera el evento que se desea controlar. Sin embargo existe una gran incertidumbre en la determinación de la magnitud de un evento de diseño para el cual se diseñará la estructura. En el caso de variables hidrológicas deben de emplearse técnicas de probabilidad y estadística que ayudan enormemente a analizar el comportamiento aleatorio de la naturaleza, en especial con el estudio de variables meteorológicas como temperatura y precipitación o gastos en cauces naturales

Existen varias técnicas de distribución de probabilidad para variables aleatorias, sin embargo, no todas pueden aplicarse a variables hidrológicas. Además debe de añadirse el comportamiento no homogéneo que puede presentar cada muestra de datos en estudio, en donde quizás se encuentren dos o más poblaciones en un mismo registro, comportamiento solo determinable mediantes pruebas de homogeneidad.

Entre las distribuciones de probabilidad, para una población, más comunes aplicables en hidrología se encuentran (Escalante y Reyes, 2005 Técnicas estadísticas en hidrología): Distribución Normal; LogNormal 2 y 3 parámetros; Gamma 2 y 3 parámetros; Log Pearson tipo III, y General de Valores Extremos tipo I (Gumbel), tipo II (Fréchet) y tipo III (Weibull). Cada distribución emplea distintas técnicas de estimación de parámetros como: técnica de mínimos cuadrados, momentos, máxima verosimilitud, momentos – L o máxima entropía. Dichas técnicas dependen de la función de distribución y la función de densidad asociada a cada tipo de distribución, de tal forma que para una distribución de probabilidad sólo pueden aplicarse un cierto número de técnicas de estimación de parámetros.

Page 2: Dist Gumbel

Debido a la incertidumbre mencionada anteriormente y a la aleatoriedad de variables meteorológicas, deben emplearse al menos todas las distribuciones, indicadas en el párrafo anterior, con cada una de las técnicas de estimación de parámetros; este tipo de análisis deriva en realizar alrededor de 20 procedimientos para determinar aquella distribución de mejor ajuste que refleje el mejor comportamiento de los registros de datos analizados.

El objetivo de este trabajo es mostrar la variabilidad que puede existir en el evento de diseño calculado para registros de gastos, aplicando únicamente la distribución de valores extremos tipo I (Gumbel), empleando las siguientes técnicas de estimación de parámetros: estimadores por momentos, por máxima verosimilitud, momentos – L y máxima entropía.

Desarrollo

La distribución de la función de valores extremos tipo I (Gumbel) para una población y para máximos es:

F ( x )=e−e−¿¿¿ [1]La función de densidad asociada es:

f ( x )= 1α

e−¿ ¿ [2]

-∞ < x < ∞, > 0

Donde:: Parámetro de ubicación: Parámetro de escala

Media = E ( x )=❑̂+0.5772 α̂ [3]

Varianza = σ 2=π2 α̂ 2

6 [4]

Coeficiente asimetría = γ=1.1396 [5]Coeficiente de Curtosis = ¿5.4002 [6]

La variable reducida, o variable estandarizada, Gumbel es:

y i=x i−¿α

¿ [7]

Técnicas de estimación de parámetros para la distribución Gumbel.

Estimadores por momentos

❑̂=x−0.45 S [8]

α̂=√6π

S=0.78S [9]

Estimadores por máxima verosimilitudConsiderando la variable reducida y el siguiente proceso iterativo

P=n−∑i=1

n

e− yi [10]

R=n−∑i=1

n

y i+∑i=1

n

y ie− y i [11]

El criterio de convergencia es:

Page 3: Dist Gumbel

Pα̂

≈ 0 yRα̂

≈ 0 [12]

Incrementos

δ❑ j=(1.11 P j−0.26 R j )

α j

n [13]

δ α j=(0.26 P j−0.61 R j )

α j

n

Nuevos valores

❑̂j+1=❑̂ j+δ❑j [14]

α̂ j+1=α̂ j+δ α j

Estimadores por momentos – L

❑̂=❑1−0.577216 α̂ [15]

α̂=❑2

¿2[16]

Estimadores por máxima entropíaConsiderando la variable reducida se tiene el siguiente proceso iterativo

P=1n∑i=1

n

y i [17]

R=1n∑i=1

n

e− y i [18]

El criterio de convergencia es:|0.577216 – P| 0 y |1 – R| 0 [19]

Incrementosδ❑ j

=P j−0.577216 δ α j [20]

δ α j=0.4228+P j+ ln R j

Nuevos valores

❑̂ j+1=❑̂ j+δ❑ j [21]

α̂ j+1=α̂ j+δ α j

Estimación de eventos

x̂ t=❑̂−α̂ ln [−ln (1−1/T ) ] [22]

Error Estándar de AjusteEE=¿¿ [23]Donde:n: tamaño de la muestra

Q̂ :ij

eventos estimados por determinada distribución de probabilidad

Qij : evento registrado ordenado de mayor a menor que se le asigna un período de retorno

T=n+1m

y p=1− 1T

Page 4: Dist Gumbel

mp: número de parámetros de la distribución de probabilidad

Registros de gastos de estación Corona.

La estación Corona se encuentra en las coordenadas geográficas 98°57'8.15"O – 23°56'31.57"N. Se ubica en la región Hidrológica No. 25, San Fernando – Soto la Marina, en el estado de Tamaulipas.

Los registros hidrométricos fueron obtenidos del programa BANDAS (Banco Nacional de Datos de Aguas Superficiales) elaborado por el Instituto Mexicano de Tecnología del Agua (IMTA). A los registros de la estación Corona se aplicaron previamente los análisis de verificación de cantidad y calidad de la información, pruebas de independencia y pruebas de homogeneidad.

Se obtienen los estadísticos muestrales de la serie Qij: xU , S2, S, g, k, Cv, prefiriendo los no sesgados dado que

los registros de las estaciones se consideran de poca extensión. Además se obtienen los estadísticos por probabilidad pesada y momentos – L, necesarios para calcular los estimadores de determinadas técnicas de distribución de probabilidad.

El cálculo de los estadísticos fue realizado en el programa AFDE 2010, desarrollado en plataforma Visual Basic.

xU = 372.9958S2 = 79313.2341

S = 281.6261g = 1.2361

k = 1.3213Cv = 0.7550

Resultados y discusión

Estimadores por momentos. QT(1)Aplicando las ecuaciones [8] y [9] en [22]

❑̂=372.9958−0.45 (281.6261 )=246.2641

α̂=√6π

281.6261=219.5830

Q̂T (1 )=246.2641−219.5830 Ln [−ln (1−1/T ) ]

Estimadores por máxima verosimilitud. QT(2) Aplicando las ecuaciones [10] a [14] en [22]

Q̂T (2 )=251.6093−189.3856 ln [−ln (1−1/T ) ]

Estimadores por momentos – L. QT(3)Aplicando las ecuaciones [15] a [16] en [22]

❑̂=372.9958−0.577216(218.2271) = 247.0316

α̂=151.2635ln2

=218.2271

Q̂T (3 )=247.0316−218.2271 ln [−ln (1−1/T ) ]

Estimadores por máxima entropía. QT(4)Aplicando las ecuaciones [17] a [21] en [22]

Q̂T ( 4 )=247.6014−262.6324 ln [−ln (1−1/T ) ]

En la Tabla 1 se muestra la variación que existe para cada gasto calculado con las distintas técnicas de estimación de parámetros. Puede notarse, en la Figura 1, que a partir del décimo año calculado, los resultados comienzan a divergir respecto a los datos registrados en la estación Corona.

Page 5: Dist Gumbel

Tabla 1. Eventos QT (m3/s) calculados por distintas técnicas de estimación de parámetrosOrden Q (m3/s) T (años) P(1-1/T) QT(1) QT(2) QT(3) QT(4)

1 1260 38.0000 0.9737 1042.095 1037.948 937.9959 1199.4552 936.2 19.0000 0.9474 886.9034 883.7151 804.1468 1013.8383 834.722 12.6667 0.9211 794.813 792.1933 724.7208 903.69364 819 9.5000 0.8947 728.511 726.3007 667.5368 824.39315 659 7.6000 0.8684 676.3038 674.4159 622.5092 761.95066 652.8 6.3333 0.8421 632.9774 631.357 585.1412 710.13017 618.111 5.4286 0.8158 595.7543 594.3638 553.0371 665.60948 584.519 4.7500 0.7895 562.9637 561.7757 524.7558 626.39019 576.04 4.2222 0.7632 533.5341 532.5278 499.3735 591.1908

10 537.464 3.8000 0.7368 506.7319 505.8911 476.2571 559.13411 527.1 3.4545 0.7105 1042.0947 1037.9481 937.9959 1199.455012 525.2 3.1667 0.6842 886.9034 883.7151 804.1468 1013.838413 507 2.9231 0.6579 794.8130 792.1933 724.7208 903.693614 458 2.7143 0.6316 728.5110 726.3007 667.5368 824.393115 411.508 2.5333 0.6053 676.3038 674.4159 622.5092 761.950616 292.9 2.3750 0.5789 632.9774 631.3570 585.1412 710.130117 290 2.2353 0.5526 595.7543 594.3638 553.0371 665.609418 254.88 2.1111 0.5263 562.9637 561.7757 524.7558 626.390119 249.5 2.0000 0.5 533.5341 532.5278 499.3735 591.190820 245.2 1.9000 0.4737 506.7319 505.8911 476.2571 559.134021 209 1.8095 0.4474 482.0220 481.3338 454.9454 529.579822 202.68 1.7273 0.4211 459.0270 458.4808 435.1127 502.076623 202.2 1.6522 0.3947 437.4299 437.0170 416.4857 476.245424 194.9 1.5833 0.3684 417.0014 416.7147 398.8666 451.811925 194 1.5200 0.3421 397.5469 397.3803 382.0874 428.543226 191.182 1.4615 0.3158 378.9232 378.8716 366.0249 406.268427 188.08 1.4074 0.2895 360.9868 361.0459 350.5551 384.815528 167.986 1.3571 0.2632 343.6244 343.7907 335.5805 364.049229 153 1.3103 0.2368 326.7441 327.0147 321.0216 343.859530 132.969 1.2667 0.2105 310.2513 310.6237 306.7969 324.133331 125.66 1.2258 0.1842 294.0612 294.5336 292.8333 304.769132 123.533 1.1875 0.1579 278.1154 278.6863 279.0804 285.697233 112.067 1.1515 0.1316 262.3147 262.9831 265.4526 266.798734 99.382 1.1176 0.1053 246.5794 247.3450 251.8813 247.978535 92.56 1.0857 0.0789 230.8669 231.7296 238.3296 229.185636 89.202 1.0556 0.0526 215.0528 216.0131 224.6903 210.271237 83.3 1.0270 0.0263 199.0817 200.1407 210.9156 191.1689

Se observa que para un período de retorno de 38 años, existe una variación de 261.4591 m 3/s, valor realmente significativo para el diseño de una estructura de control; por tal motivo deben emplearse técnicas de bondad de ajuste que ayuden a determinar la mejor técnica de estimación de parámetros. Aplicando le expresión (23), se obtiene el error estándar de ajuste para cada técnica de estimación de parámetros.

Por momentos EEA = 66.5027 m3/s

Por máxima verosimilitudEEA = 87.0493 m3/s

Por momentos – L EEA = 67.0572 m3/s

Por máxima entropía EEA = 69.9242 m3/s

Se concluye que la técnica de estimación de parámetros que proporciona el mejor ajuste para una distribución Gumbel, es el de momentos. En la figura 1 se aprecian dos poblaciones de eventos, por lo que además debe de aplicarse técnicas de distribución mezcladas o multivariadas, que quedan fuera del alcance de este trabajo.

Page 6: Dist Gumbel

0 5 10 15 20 25 30 35 400

200

400

600

800

1000

1200

1400

Distribución GumbelPeríodos de retorno asociados a la muestra

Momentos Máxima Verosimilitud Momentos-LMáxima entropía Q real

Período de retorno (años)

Q (m

3/s)

Figura 1. Gastos calculados por las distintas técnicas de estimación de parámetros de la distribución Gumbel.

En la Tabla 2 se indican finalmente los gastos de diseño para diferentes períodos de retorno. Ejemplificando para estructuras diseñadas con períodos de retorno de 50 años, se observa que existe una variación, de más de 280m3/s, entre el gasto del menor valor calculado con la técnica de máxima verosimilitud y la técnica de máxima entropía.

Tabla 2. Eventos de diseño QT (m3/s) de la distribución Gumbel para diferentes períodos de retorno.

T(años) 1/Tr P(1-1/T)Q(m3/s)

MomentosQ(m3/s)Mom-L

Q(m3/s)Max ver

Q(m3/s)Max ent

2 0.5 0.5 326.7441 327.0147 321.0216 343.85955 0.2 0.8 575.6254 574.3592 535.6763 641.5342

10 0.1 0.9 740.4064 738.1227 677.7964 838.620720 0.05 0.95 898.4684 895.2087 814.1214 1027.670850 0.02 0.98 1103.0634 1098.5403 990.5802 1272.3767

100 0.01 0.99 1256.3786 1250.9088 1122.8112 1455.7494500 0.002 0.998 1610.6665 1603.0090 1428.3768 1879.4957

1000 0.001 0.999 1762.9797 1754.3818 1559.7437 2061.67015000 0.0002 0.9998 2116.4728 2105.6921 1864.6238 2484.4657

10000 0.0001 0.9999 2268.6871 2256.9665 1995.9053 2666.5217

En el proceso de cálculo se puede corroborar la complejidad que conlleva realizar los procesos iterativos para determinadas técnicas de estimación de parámetros. Sin embargo, los avances en la tecnología implementada en equipos de cómputo, permiten desarrollar nuevas técnicas que requieren una gran cantidad de procesos numéricos a realizar.

Algunas técnicas sólo dependen de los estadísticos muestrales para obtener los parámetros de alguna distribución, sin embargo, otras técnicas requieren complejos algoritmos, en donde los equipos de cómputo resultan verdaderamente indispensables, para su solución. Dado que en las técnicas de máxima verosimilitud y máxima entropía, es inherente una serie de iteraciones por métodos numéricos para encontrar alguna solución, se optó por implementar una serie de algoritmos asentados en plataforma Visual Basic para obtener de forma más precisa los parámetros requeridos.

Page 7: Dist Gumbel

Conclusiones

La variación en los resultados obtenidos por las diferentes técnicas podría conducir a sub-dimensionar o sobre-dimensionar futuras obras hidráulicas; es decir, se arriesgaría notablemente la seguridad de la obra en donde realmente existirá una mayor probabilidad de que eventos extremos excedan las condiciones para la cual fue diseñada, o caso contrario, la obra tendría un costo de construcción muy elevado, cuando la probabilidad de que suceda un evento mayor al calculado es sumamente bajo.

Existen varias técnicas para estimar los parámetros de alguna distribución de probabilidad. Algunas técnicas requieren procesos más elaborados que otras, sin embargo, el implemento de computadoras permiten desarrollar eficientemente los algoritmos necesarios para la convergencia de alguna solución. Dada la incertidumbre de los fenómenos meteorológicos, es necesario implementar el mayor número de técnicas de estimación de parámetros y elegir, mediante criterios bondad de ajuste, aquella técnica que refleje el mejor ajuste respecto a los registros originales de la muestra.

Referencias

Escalante, C., y Reyes, L., (2005), Técnicas estadísticas en hidrología, Facultad de Ingeniería, Universidad Nacional Autónoma de México, México, 298 p.

Kite, G.W. (1988), Frequency and Risk Analyses in Hydrology, Water Resources Publications, Littleton, Colorado.

Haan, C.T. (1977), Statistical Methods in Hydrology, The Iowa State University Press, Ames, Iowa.

IMTA, (2002), Banco Nacional de Datos de Aguas Superficiales (BANDAS), Región hidrológica 25, México.