本發(fā)明屬于洪水預(yù)報(bào)領(lǐng)域,更具體地,涉及一種基于廣義第二類貝塔分布(Generalized beta distribution of the second kind,GB2)的洪水頻率分析方法。
背景技術(shù):
洪水一般用洪水發(fā)生的概率密度定義洪水大小,如20年一遇、50年一遇和百年一遇等。洪水頻率分析的目就是通過頻率曲線的外延,推求T年一遇洪水的設(shè)計(jì)洪水值。如計(jì)算的設(shè)計(jì)洪水值較大,則規(guī)模過大,會(huì)增加投資,造成浪費(fèi);如計(jì)算的設(shè)計(jì)洪水值較低,則規(guī)模過小,又可能在不利水文條件下導(dǎo)致工程失事造成損失。
因此,開展高精度的洪水頻率分析是水利水電工程設(shè)計(jì)與規(guī)劃的首要問題,選擇合適的頻率分布線型與參數(shù)估計(jì)方法是其重要內(nèi)容。
目前多數(shù)研究?jī)H選取單一的頻率分布線型,如指數(shù)分布(Exponential,EXP)、Weibull分布、Gamma分布、Gumbel分布、廣義極值分布(GEV)、皮爾遜III型分布(P-III)、對(duì)數(shù)皮爾遜III型分布(LP-III)及對(duì)數(shù)正態(tài)分布(LN)等分布進(jìn)行洪水頻率分析,其設(shè)計(jì)洪水結(jié)果具有較大的不確定性,設(shè)計(jì)洪水值的高估與低估會(huì)導(dǎo)致投資過多或安全風(fēng)險(xiǎn)增大等后果。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)的以上缺陷或改進(jìn)需求,本發(fā)明提供了一種基于廣義第二類貝塔分布(GB2)的洪水頻率分析方法,其目的在于將廣義第二類貝塔分布引入洪水頻率分析中,并依據(jù)分布函數(shù)特點(diǎn)采用最大熵原理實(shí)現(xiàn)分布函數(shù)的參數(shù)估計(jì),在此基礎(chǔ)上開展基于廣義第二類貝塔分布的設(shè)計(jì)洪水計(jì)算,由此解決現(xiàn)有分析技術(shù)的洪水頻率分析精度不高的技術(shù)問題。
為實(shí)現(xiàn)上述目的,按照本發(fā)明的一個(gè)方面,提供了一種基于廣義第二類貝塔分布的洪水頻率分析方法,該方法包括以下步驟:
(1)采用年最大取樣方法,采集年最大流量樣本序列;
(2)應(yīng)用廣義第二類貝塔分布建立洪水概率密度模型:
其中,變量x表示年最大洪水流量,f(x)表示流量為x的概率密度;B()為貝塔函數(shù);r1、r2、r3是形狀參數(shù),且r1>0,r2>0,r3>0,r3決定全局形狀,r1控制左尾形狀,r2控制右尾形狀,參數(shù)r1和r2共同決定分布的偏態(tài)特性;b為位置參數(shù),b>0;
(3)推求基于最大熵原理的廣義第二類貝塔分布的概率密度函數(shù)參數(shù)值,包括以下子步驟:
(31)引入最大熵原理,最大熵原理指出,某一隨機(jī)變量x的概率密度函數(shù)f(x)可通過最大化熵值得到:
其中,gi(x)為x的函數(shù);Ci為gi(x)的期望;
依據(jù)拉格朗日乘子法,f(x)可表示為:
f(x)=exp(-λ0-λ1g1(x)-λ2g2(x)λmgm(x)) (3)
其中:m為約束個(gè)數(shù);λi,i=0,1,2,...,m為拉格朗日乘子;
(32)基于最大熵原理,廣義第二類貝塔分布約束條件表達(dá)式為:
其中,q為構(gòu)造的約束條件參數(shù);E為期望;
則廣義第二類貝塔分布的概率密度函數(shù)可構(gòu)造為:
其中,λ2'為構(gòu)造的拉格朗日乘子;
(33)推導(dǎo)拉格朗日乘子與廣義第二類貝塔分布函數(shù)的約束條件之間關(guān)系,將式(5)帶入到(4a)中可得:
令p=b-q、和t=pxq,則上式可化簡(jiǎn)為:
令則因?yàn)閥(0)=0且y(∞)=1,y∈[0,1],則:
即有下式成立:
同時(shí),計(jì)算λ0的另一種方法為:
令隨后對(duì)式(9)、(10)中的λ1和λ2分別求導(dǎo),可得:
式中:為digamma函數(shù);
則拉格朗日乘子與廣義第二類貝塔分布函數(shù)約束條件之間滿足:
對(duì)式(11)求二階導(dǎo)可得下式:
(34)推導(dǎo)拉格朗日乘子與廣義第二類貝塔分布函數(shù)參數(shù)之間關(guān)系,將式(8)帶入到式(6)中,并與式(1)作比較,則下式成立:
(35)推求廣義第二類貝塔分布函數(shù)參數(shù)與約束條件之間關(guān)系,將式(16)代入式(13)和式(14)中,可得廣義第二類貝塔分布函數(shù)參數(shù)與約束條件之間滿足下式:
式中,var為方差;將步驟(1)中年最大流量樣本序列,即x序列代入公式(17),求出參數(shù)r1、r2、r3和b;
(4)將參數(shù)r1、r2、r3和b代入公式(1)中,即可得到洪水概率密度函數(shù),可利用該函數(shù)得到洪水為某一量級(jí)x時(shí)的概率值f(x);還可利用洪水概 率密度函數(shù),推求概率f(x)為T年一遇的設(shè)計(jì)洪水值x。
總體而言,通過本發(fā)明所構(gòu)思的以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)特征及有益效果:
四參數(shù)的廣義第二類貝塔分布包含了指數(shù)分布、威布爾(Weibull)分布及伽馬(Gamma)分布,具有足夠的靈活性模擬復(fù)雜多變的數(shù)據(jù)集,因此非常適于水文頻率分析。本發(fā)明通過引入廣義第二類beta分布,并利用最大熵原理推求估計(jì)了分布函數(shù)參數(shù),實(shí)現(xiàn)了精度較高的洪水頻率分析。其擬合效果優(yōu)于水文中的其它常用分布;最大熵原理能夠有效地估計(jì)分布函數(shù)的參數(shù),得到精度高的洪水頻率分布函數(shù)。
附圖說明
圖1為本發(fā)明方法流程圖;
圖2為本發(fā)明方法擬合的洪水序列邊緣分布圖及概率密度曲線效果圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。此外,下面所描述的本發(fā)明各個(gè)實(shí)施方式中所涉及到的技術(shù)特征只要彼此之間未構(gòu)成沖突就可以相互組合。
如圖1所示,本發(fā)明包括以下流程:
(1)采用年最大取樣方法,采集年最大流量樣本序列;
(2)應(yīng)用廣義第二類貝塔分布建立洪水概率密度模型:
其中,變量x表示年最大洪水值,f(x)表示流量為x的概率密度;B()為貝塔函數(shù);r1、r2、r3是形狀參數(shù),且r1>0,r2>0,r3>0,r3決定全局形狀,r1控制左尾形狀,r2控制右尾形狀,參數(shù)r1和r2共同決定分布的偏態(tài)特性;b為位置 參數(shù),b>0;
(3)基于最大熵原理,推導(dǎo)出廣義第二類貝塔分布函數(shù)的參數(shù)計(jì)算公式:
將步驟(1)中采集年最大流量樣本序列數(shù)據(jù)作為序列x,代入以上公式,求出參數(shù)r1、r2、r3和b;
(4)將參數(shù)r1、r2、r3和b代入公式(1)中,得到洪水概率密度函數(shù),可利用該函數(shù)輸入需預(yù)測(cè)洪水流量x,計(jì)算得到洪水流量達(dá)到x的概率密度f(x);還可利用洪水概率密度函數(shù),輸入洪水發(fā)生的概率密度f(x),計(jì)算發(fā)生該概率下洪水流量x。
實(shí)施例:現(xiàn)利用某流域典型水文站點(diǎn)A、B和C的年最大日流量數(shù)據(jù),檢驗(yàn)廣義第二類貝塔分布的模型效果。基于最大熵原理的方法,由A、B和C三個(gè)水文站點(diǎn)的年最大日流量序列求出模型的參數(shù),表1給出了A、B和C三個(gè)水文站點(diǎn)洪水概率密度函數(shù)的參數(shù),圖2給出了基于GB2分布的3站年最大洪水序列邊緣分布和概率密度曲線的擬合結(jié)果,結(jié)果顯示GB2分布擬合效果良好,可用于設(shè)計(jì)洪水的計(jì)算。
表1
采用GB2分布、正態(tài)分布、指數(shù)分布(EXP)、Gamma分布、Gumbel 分布、廣義正態(tài)分布(Generalized normal,GN)、P-III分布、廣義Pareto分布(Generalized Pareto,GP)及Weibull分布等擬合典型水文站C的年最大日流量序列,并基于K-S(Kolmogorov-Smirnov,K-S)檢驗(yàn)法、均方根誤差以及AIC準(zhǔn)則(Akaike information criterion,AIC)對(duì)各分部的擬合結(jié)果進(jìn)行比較分析,確定擬合最優(yōu)的分布函數(shù),進(jìn)行洪水頻率分析。
取K-S檢驗(yàn)顯著性水平為α=0.05,P值大于0.05時(shí)通過檢驗(yàn),RMSE和AIC值越小說明擬合效果越好,表2給出了各分布K-S檢驗(yàn)統(tǒng)計(jì)量P值、RMSE和AIC值。結(jié)果表明,所有分布均通過了K-S檢驗(yàn)。比較各分部的RMSE和AIC值可知,GB2分布的擬合效果最優(yōu)。
表2
表3給出了基于上述分布函數(shù)計(jì)算的水文站點(diǎn)C的設(shè)計(jì)洪水值。結(jié)果表明,當(dāng)重現(xiàn)期較大時(shí),各分布計(jì)算結(jié)果差異明顯,考慮到工程設(shè)計(jì)中,低估的設(shè)計(jì)值將大大增加大壩及下游的洪水風(fēng)險(xiǎn),由表中數(shù)據(jù)比較分析可知GB2的頻率分析結(jié)果更優(yōu)。
表3
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。