• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于統(tǒng)計(jì)推斷的GEV分布水文頻率計(jì)算充分樣本長(zhǎng)度研究

      2022-09-05 09:22:30戈立婷宋松柏
      水利學(xué)報(bào) 2022年8期
      關(guān)鍵詞:參數(shù)估計(jì)水文長(zhǎng)度

      戈立婷,宋松柏,2

      (1.西北農(nóng)林科技大學(xué) 水利與建筑工程學(xué)院,陜西 楊凌 712100;2.西北農(nóng)林科技大學(xué) 旱區(qū)農(nóng)業(yè)水土工程教育部重點(diǎn)實(shí)驗(yàn)室,陜西 楊凌 712100)

      1 研究背景

      水文頻率分析的主要目的是根據(jù)頻率模型估計(jì)水文變量的設(shè)計(jì)值及其相關(guān)重現(xiàn)期,計(jì)算過程具有不確定性,進(jìn)而影響分析結(jié)果的可靠性。認(rèn)知不確定性是由于對(duì)研究系統(tǒng)的認(rèn)識(shí)不完全而產(chǎn)生的,取決于數(shù)據(jù)長(zhǎng)度和模型推理重現(xiàn)潛在水文過程的能力。模型不確定性源于線型選擇和參數(shù)估計(jì)方法,其不確定性分析方法主要有貝葉斯理論和NUSAP法和抽樣分布理論。而水文計(jì)算和分析模型需要足夠長(zhǎng)的數(shù)據(jù),充分樣本長(zhǎng)度是可靠建模和準(zhǔn)確參數(shù)估計(jì)的先決條件。Su等評(píng)估了洪水災(zāi)害中采樣造成的不確定性,結(jié)果表明增加數(shù)據(jù)長(zhǎng)度提高了Gumbel模型的可靠性,降低了采樣誤差和不確定性。Hao等建立多指標(biāo)干旱監(jiān)測(cè)模型,發(fā)現(xiàn)至少需要30年的數(shù)據(jù)可以減少計(jì)算偏差。設(shè)計(jì)方案的運(yùn)行性能會(huì)受到樣本長(zhǎng)度的影響。Soukissian等采用不同參數(shù)估計(jì)方法,在不同樣本長(zhǎng)度下進(jìn)行模擬研究,研究結(jié)果表明廣義極值(GEV)分布參數(shù)估計(jì)方法的性能取決于參數(shù)估計(jì)方法和選用樣本容量。Khastagir等研究表明由于序列長(zhǎng)度的變化,GEV分布參數(shù)會(huì)有很大差異。

      目前,世界許多水文學(xué)工作者采用概率論的經(jīng)驗(yàn)法則,結(jié)合區(qū)域水文計(jì)算經(jīng)驗(yàn),獲得了水文頻率計(jì)算30年的標(biāo)準(zhǔn)。數(shù)理統(tǒng)計(jì)中30的樣本長(zhǎng)度普遍基于正態(tài)分布假設(shè),可以利用正態(tài)分布的一些性質(zhì)來推斷總體參數(shù)。根據(jù)這一方法,李鴻雁等采用數(shù)值模擬方法對(duì)隨機(jī)生成樣本和代表性站點(diǎn)的均值、均方差進(jìn)行分析,采用假設(shè)性檢驗(yàn)證明30年樣本長(zhǎng)度的充分性。然而樣本長(zhǎng)度的充分性與研究問題有關(guān),標(biāo)準(zhǔn)很難界定。水文概率分布的復(fù)雜程度、待估計(jì)參數(shù)數(shù)目和統(tǒng)計(jì)推斷方法的選取都與樣本長(zhǎng)度密切相關(guān)。這一經(jīng)驗(yàn)法則,對(duì)于估計(jì)均值來說是充分合理的,而論證相對(duì)復(fù)雜且具有多個(gè)參數(shù)的分布是否充分值得商榷。其次,不同統(tǒng)計(jì)推理方法、不同參數(shù)的收斂速度差別較大,因此,在=30的情況下,計(jì)算結(jié)果差別也很大。此外,30年的樣本長(zhǎng)度并不能為不同重現(xiàn)期的設(shè)計(jì)值計(jì)算提供有效參考。洪水頻率分析中,計(jì)算較大重現(xiàn)期的設(shè)計(jì)值,要得到可靠的結(jié)果,需要的樣本長(zhǎng)度也相應(yīng)更長(zhǎng)。Katz等的分析結(jié)果表明,GEV分布的極端分位數(shù)估計(jì)在小樣本(<25)情況下非常不穩(wěn)定。Robson等認(rèn)為采用GEV分布進(jìn)行頻率計(jì)算需要的樣本量是重現(xiàn)期的4倍。Vanem等認(rèn)為35年數(shù)據(jù)足以估計(jì)100年的設(shè)計(jì)值。Hu等結(jié)果顯示估計(jì)重現(xiàn)期為100年的設(shè)計(jì)值,35年的序列長(zhǎng)度比20年的誤差小50%。Merz等的研究表明一定樣本長(zhǎng)度下,增加更多的數(shù)據(jù)并不意味著可以提高計(jì)算精度。Benson等指出不超過序列長(zhǎng)度兩倍的重現(xiàn)期,能得到可靠的結(jié)果。而Jeong等認(rèn)為數(shù)據(jù)長(zhǎng)度外推3至4倍的重現(xiàn)期,其頻率計(jì)算是合理的。

      以上研究表明:(1)樣本長(zhǎng)度不充分,難以支撐分析結(jié)果的可靠性,模型的運(yùn)行性能也會(huì)因樣本短缺而受到影響。(2)30年樣本長(zhǎng)度這一標(biāo)準(zhǔn)并不能為不同頻率下的設(shè)計(jì)值計(jì)算提供有效參考。(3)模擬和實(shí)例分析大都是基于固定長(zhǎng)度的樣本,樣本長(zhǎng)度分析方法較為主觀。目前,不同頻率下樣本長(zhǎng)度的充分性沒有共識(shí),水文頻率分析中缺少一種基于嚴(yán)謹(jǐn)?shù)臄?shù)理統(tǒng)計(jì)推理而非經(jīng)驗(yàn)法則的分析方法進(jìn)行給定頻率計(jì)算所需的充分樣本長(zhǎng)度推求,且在這一過程中,缺乏充分考慮到線型、參數(shù)估計(jì)方法、重現(xiàn)期的影響。基于此,本文應(yīng)用漸近正態(tài)性質(zhì)、極限近似理論原理,選用GEV分布,研究不同參數(shù)下充分樣本長(zhǎng)度的確定方法,并驗(yàn)證其合理性。在此基礎(chǔ)上,根據(jù)誤差指標(biāo)進(jìn)行分析比較,采用數(shù)值模擬方法分析參數(shù)、頻率、參數(shù)估計(jì)方法與樣本長(zhǎng)度的潛在關(guān)系及規(guī)律,可在實(shí)際工作中用于判斷計(jì)算數(shù)據(jù)是否足夠充分用于模型的建立和參數(shù)估計(jì)。文中方法以期為確定水文頻率所需樣本長(zhǎng)度,提高水文設(shè)計(jì)值成果的可靠性等提供支撐。

      2 GEV分布及其參數(shù)估計(jì)方法

      廣義極值分布(Generalized Extreme Value Distribution,GEV)的概率密度函數(shù)()及其分布函數(shù)()分別為:

      (1)

      (2)

      極值Ⅰ型分布是GEV分布的一個(gè)特例,形狀參數(shù)=0,極值Ⅰ型分布的概率密度函數(shù)()及其分布函數(shù)()分別為:

      (3)

      (4)

      式中:為尺度參數(shù);為位置參數(shù);為形狀參數(shù),當(dāng)<0時(shí),為極值Ⅱ型分布(或Frechet分布),當(dāng)>0時(shí),為極值Ⅲ型分布(或Weibull分布),=0時(shí),為極值Ⅰ型分布(或Gumbel分布)。

      最大似然法(Maximun Likelihood Method,MLM)是根據(jù)對(duì)數(shù)似然函數(shù)最大化進(jìn)行概率分布參數(shù)估計(jì)的方法,要求對(duì)數(shù)似然函數(shù)是可微的。MLM與大多數(shù)參數(shù)估計(jì)方法相比,其優(yōu)勢(shì)在于它直接為GEV分布參數(shù)估計(jì)提供近似的標(biāo)準(zhǔn)誤差和誤差邊界,同時(shí)允許將協(xié)變量信息合并到參數(shù)估計(jì)中。此外,MLM具有良好的漸近性質(zhì)。由于這些優(yōu)點(diǎn),MLM是目前最主要的參數(shù)估計(jì)方法之一,也是GEV分布參數(shù)估計(jì)中最為常用的估計(jì)方法。Smith等和Coles等指出>-0.5時(shí),MLM具有一般的漸近性質(zhì);-1<<-0.5,MLM結(jié)果存在,但不具有漸近性質(zhì);<-1時(shí),MLM結(jié)果通常不存在;>0.5時(shí),不存在二階矩和高階矩,此時(shí)極值分布有一個(gè)非常短的有界右尾,這在極值分布的應(yīng)用中極少出現(xiàn)。因此,極大似然理論的局限性在實(shí)際應(yīng)用中影響不大。

      矩法(Method of Moments,MOM)的基本假設(shè)為樣本矩等于相應(yīng)的總體矩,對(duì)未知參數(shù)進(jìn)行求解。詳細(xì)的求解過程參見文獻(xiàn)[25-27]。

      3 充分樣本長(zhǎng)度確定方法

      以GEV分布為例,數(shù)值模擬可以假設(shè)總體規(guī)模足夠大,足以進(jìn)行充分樣本長(zhǎng)度的分析。然而,在實(shí)際的工程設(shè)計(jì)中,選用的數(shù)據(jù)有限,必須論證選用資料長(zhǎng)度估計(jì)結(jié)果的準(zhǔn)確性和所需的充分樣本長(zhǎng)度?;赽ootstrap的數(shù)學(xué)分析方法采用Shapiro-Wilk方法檢驗(yàn)設(shè)計(jì)值的正態(tài)性,計(jì)算充分樣本長(zhǎng)度,判斷計(jì)算數(shù)據(jù)長(zhǎng)度是否足以進(jìn)行參數(shù)估計(jì)。原假設(shè)定義為:樣本長(zhǎng)度為時(shí),MLM設(shè)計(jì)值服從正態(tài)分布。如果拒絕原假設(shè),說明在給定顯著性水平下,樣本長(zhǎng)度不足,需要采集更多的樣本,并再次應(yīng)用上述方法進(jìn)行檢驗(yàn),直到增加樣本至無法拒絕原假設(shè)。詳細(xì)步驟如下。

      步驟一:給定參數(shù)(,,),生成=600服從GEV分布的隨機(jī)樣本=(,,…,)。

      步驟二:根據(jù)bootstrap法,從中抽取-1組相同容量的樣本,得到再生樣本=(1,2,…,),其中=2,…,。

      (5)

      (6)

      曲線擬合法是基于極限近似理論,用解析表達(dá)式來逼近離散數(shù)據(jù)。選取95%的相對(duì)置信區(qū)間(Relative confidence interval,RCI),平均相對(duì)誤差(the mean relative error,RMAE)兩種不確定性分析指標(biāo)。在水文頻率的不確定性分析中,通常根據(jù)置信區(qū)間來量化設(shè)計(jì)值的不確定性。置信區(qū)間的寬度隨樣本長(zhǎng)度的增加而減小,但隨重現(xiàn)期的增加而增大。相比較而言,使不同重現(xiàn)期下無法直接對(duì)比的置信區(qū)間變?yōu)榭杀?。避免誤差相互抵消,可以反映實(shí)際誤差的大小,也具有可比性。由某一樣本長(zhǎng)度下的多組設(shè)計(jì)值,計(jì)算得到、,隨樣本長(zhǎng)度不斷增大,根據(jù)其變化趨勢(shì),擬合數(shù)據(jù)點(diǎn)繪制出曲線,確定出最佳擬合方程。具體方法描述如下。

      步驟一:給定參數(shù)(,,),生成=2000組服從GEV分布,樣本長(zhǎng)度為(=3,4,…,500)的隨機(jī)樣本。

      (7)

      用對(duì)不同樣本長(zhǎng)度下設(shè)計(jì)值誤差進(jìn)行定量評(píng)價(jià),定義如下式所示:

      (8)

      式中:為樣本長(zhǎng)度、頻率下的估計(jì)設(shè)計(jì)值;為GEV分布下的真實(shí)設(shè)計(jì)值。

      步驟四:隨樣本長(zhǎng)度不斷增大,根據(jù)各指標(biāo)的變化趨勢(shì),擬合數(shù)據(jù)點(diǎn)繪制出曲線,由評(píng)價(jià)其擬合效果,確定出最佳擬合方程。

      步驟五:將3.1中計(jì)算出的代入擬合方程,得到MLM估計(jì)下擬合曲線對(duì)應(yīng)的、值。給定值,根據(jù)離均系數(shù)計(jì)算公式建立~|Ф|的曲線關(guān)系,與、值的變化趨勢(shì)來驗(yàn)證文中方法的正確性。通過分析MLM、MOM估計(jì)下、與樣本長(zhǎng)度的擬合曲線的交叉點(diǎn),進(jìn)一步分析樣本長(zhǎng)度與參數(shù)估計(jì)方法間的關(guān)系。

      4 數(shù)值模擬結(jié)果

      本節(jié)基于GEV分布,應(yīng)用上述方法進(jìn)行數(shù)值模擬實(shí)驗(yàn)。根據(jù)最大似然估計(jì)量的漸近正態(tài)性,采用正態(tài)檢驗(yàn)方法確定頻率計(jì)算所需的充分樣本長(zhǎng)度,并驗(yàn)證其合理性。在此基礎(chǔ)上,選用、為誤差指標(biāo),應(yīng)用曲線擬合法建立擬合關(guān)系表達(dá)式,定量分析不同參數(shù)、頻率、參數(shù)估計(jì)方法與樣本長(zhǎng)度間的關(guān)系,根據(jù)充分樣本長(zhǎng)度的規(guī)律性進(jìn)一步論證方法的正確性。最后,分析、兩種參數(shù)估計(jì)方法在同一誤差標(biāo)準(zhǔn)下的優(yōu)劣。

      根據(jù)GEV分布設(shè)計(jì)值的計(jì)算公式,設(shè)計(jì)值的大小與位置參數(shù)、尺度參數(shù)成正比,但隨形狀參數(shù)的變化呈e指數(shù)增加,不同頻率下設(shè)計(jì)值對(duì)的變化更為敏感,值對(duì)擬合結(jié)果有較大影響。其次,GEV分布根據(jù)形狀參數(shù)值的不同,分為極值Ⅰ型、極值Ⅱ型、極值Ⅲ型,三種分布的曲線形狀也大不相同。因此,本文根據(jù)不同值和頻率,計(jì)算所需的充分樣本長(zhǎng)度。在水文應(yīng)用中,的取值范圍一般為[-0.3,0.3]。本文給定GEV分布參數(shù)=(,,),取100,取10,的取值范圍為[-0.3,0.3],步長(zhǎng)為0.1。

      選取頻率為0.5%,不同值下的模擬結(jié)果進(jìn)行分析。隨樣本長(zhǎng)度變化Shapiro-Wilk檢驗(yàn)的平均α值及其95%的上下置信區(qū)間如圖1所示。從圖1可以看出,整體呈現(xiàn)上升趨勢(shì),水平線α=0.05,對(duì)應(yīng)垂線為充分樣本長(zhǎng)度:樣本長(zhǎng)度小于時(shí),下置信區(qū)間位于水平線之下,或上下波動(dòng),樣本長(zhǎng)度大于時(shí),下置信區(qū)間均位于水平線之上,說明在>時(shí),最大似然估計(jì)量服從正態(tài)分布,估計(jì)結(jié)果是漸近有效的,證明樣本長(zhǎng)度充分,那么的樣本長(zhǎng)度就足以估計(jì)該頻率下的設(shè)計(jì)值。

      圖1 頻率為0.5%,不同形狀參數(shù)下,Shapiro-Wilk檢驗(yàn)的平均α值及其95%置信區(qū)間

      樣本長(zhǎng)度為模擬100次,計(jì)算頻率為0.5%的設(shè)計(jì)值,給出設(shè)計(jì)值的正態(tài)概率圖,如圖2所示。圖2表明,不同條件下,散點(diǎn)均勻分布在紅色參照線上,且位于95%的上下置信區(qū)間內(nèi),表明該樣本長(zhǎng)度下,計(jì)算得到的0.5%設(shè)計(jì)值分布近似服從正態(tài)分布。進(jìn)一步對(duì)樣本長(zhǎng)度下0.5%的設(shè)計(jì)值,進(jìn)行卡方擬合優(yōu)度檢驗(yàn),顯著性水平取=0.05,檢驗(yàn)結(jié)果同樣表明,設(shè)計(jì)值的分布近似服從正態(tài)分布,說明是指定頻率下設(shè)計(jì)值計(jì)算所需的充分樣本長(zhǎng)度。

      圖2 頻率0.5%,不同形狀參數(shù)設(shè)計(jì)值的正態(tài)概率圖

      以相同的方法計(jì)算得到不同值和頻率下,計(jì)算所需的充分樣本長(zhǎng)度,如表1所示,頻率為5%~99%范圍內(nèi)30的樣本長(zhǎng)度基本能夠滿足不同參數(shù)下的設(shè)計(jì)值計(jì)算,而0.1%~2%范圍內(nèi),即重現(xiàn)期為50~1000年時(shí),30年的樣本長(zhǎng)度用于設(shè)計(jì)值計(jì)算是遠(yuǎn)遠(yuǎn)不夠的,且隨重現(xiàn)期增大所需樣本長(zhǎng)度也增加。>0,為極值Ⅲ型分布,曲線的頭部趨平,因此有上限值,在0.1%~2%范圍內(nèi)所需的樣本長(zhǎng)度較短,但不適合水文數(shù)據(jù)擬合。

      以表1中=-0.3、-0.1、0.1、0.3為例,計(jì)算不同樣本長(zhǎng)度的、,采用曲線擬合法得到-、-的擬合曲線,確定出最佳擬合方程=1,=2。結(jié)果表明冪率函數(shù)擬合良好,均大于0.9。將代入擬合方程得到估計(jì)下擬合曲線對(duì)應(yīng)的值、值,如圖3所示。圖中的、表示在頻率下用充分樣本長(zhǎng)度進(jìn)行頻率計(jì)算,設(shè)計(jì)值結(jié)果對(duì)應(yīng)的誤差值。兩種誤差指標(biāo)的變化趨勢(shì)大致相同,0.1%~75%范圍內(nèi),隨值增大,、值變??;75%~99%范圍內(nèi),隨值增大,、值變大。研究洪水問題時(shí),<50%,隨值增大,重現(xiàn)期減小,估計(jì)所需的樣本長(zhǎng)度減小。75%~99%為研究枯水問題時(shí)的常用頻率范圍,隨頻率增大,重現(xiàn)期增大,估計(jì)設(shè)計(jì)值所需的樣本長(zhǎng)度增加。圖中存在明顯的規(guī)律性:75%前后趨勢(shì)有所不同,在0.1%~75%范圍內(nèi)隨值增大,誤差曲線依次降低,而在75%~99%范圍內(nèi),隨值增大,誤差曲線依次升高,顯然這與的取值有關(guān)。

      表1 不同形狀參數(shù)下頻率計(jì)算所需的充分樣本長(zhǎng)度na

      圖3 na對(duì)應(yīng)擬合曲線中的RCI、RMAE值

      進(jìn)一步分析值對(duì)設(shè)計(jì)值的影響,根據(jù)謝欣榮GEV分布離均系數(shù)的推導(dǎo),當(dāng)≠0時(shí),頻率對(duì)應(yīng)的離均系數(shù)Ф的計(jì)算公式為:

      =±{Γ(1+)-[-ln(1-)]}/[Γ(1+2)-Γ(1+)]

      (9)

      式中:>0時(shí),取正;<0時(shí),取負(fù)。

      當(dāng)=0時(shí),頻率對(duì)應(yīng)的離均系數(shù)Ф計(jì)算公式為:

      (10)

      給定值,由離均系數(shù)計(jì)算公式可建立~|Ф|的曲線關(guān)系,如圖4所示,不同值下,離均系數(shù)|Ф|的變化與圖3中、值的變化趨勢(shì)相同,符合客觀規(guī)律,進(jìn)一步說明了文中方法的正確性。

      圖4 不同形狀參數(shù)下不同頻率的離均系數(shù)|ФP|

      采用參數(shù)估計(jì)方法計(jì)算同一參數(shù)和頻率下不同樣本長(zhǎng)度設(shè)計(jì)值的、,根據(jù)其變化趨勢(shì),擬合數(shù)據(jù)點(diǎn)得到-、-的擬合曲線,結(jié)果表明冪率函數(shù)擬合良好,均大于0.9。由圖3中對(duì)應(yīng)的、值,可以得到同一誤差標(biāo)準(zhǔn)下MOM頻率計(jì)算所需的樣本長(zhǎng)度。給出頻率為0.5%、99%,兩種參數(shù)估計(jì)方法的對(duì)比結(jié)果,如圖5所示。

      由圖5可見,同一、和同一參數(shù)估計(jì)方法的、擬合曲線的參數(shù)、值較為接近,曲線變化趨勢(shì)相同。隨值增大,與的曲線越來越接近,兩種參數(shù)估計(jì)方法的誤差隨之減小。隨樣本長(zhǎng)度的增加,、下降較為明顯,之后趨于穩(wěn)定。起初樣本長(zhǎng)度較小,比的估計(jì)誤差小,得到的結(jié)果誤差很大但相對(duì)穩(wěn)定,而需要一定量的樣本才能進(jìn)行參數(shù)估計(jì),在重現(xiàn)期較大且樣本長(zhǎng)度極小的情況下無法得到合理的結(jié)果。這與Martins等和Hosking等的研究結(jié)果相一致,在樣本量較小的情況下,GEV分布的最大似然估計(jì)值不穩(wěn)定,有時(shí)會(huì)得到不合理的形狀參數(shù)估計(jì)值,在極值上分位數(shù)估計(jì)中造成較大的偏差和均方根誤差。0.5%、99%代表重現(xiàn)期較大時(shí)的洪水、枯水稀遇事件,=-0.3時(shí),同一誤差指標(biāo)下需要較大樣本量,基本上無觀測(cè)站能滿足這樣的條件。

      圖5 MLM、MOM估計(jì)下RCI、RMAE與樣本長(zhǎng)度的擬合結(jié)果對(duì)比

      達(dá)到一定樣本量,兩種參數(shù)估計(jì)方法的、擬合曲線出現(xiàn)交叉點(diǎn),如圖6所示,<時(shí),采用進(jìn)行參數(shù)估計(jì)得到的設(shè)計(jì)值誤差較小,>采用誤差較小。0.1%~5%范圍內(nèi)隨頻率增大減小,在=10%~75%時(shí)趨于平穩(wěn),=75%~99%,逐漸增大,且隨值增大,誤差曲線依次變高,與圖3、圖4表現(xiàn)一致。

      圖6 兩種參數(shù)估計(jì)方法的RCI、RMAE擬合曲線交叉點(diǎn)nc

      由圖3中對(duì)應(yīng)的、值,可以得到同一誤差標(biāo)準(zhǔn)下頻率計(jì)算所需的樣本長(zhǎng)度。取-0.3、-0.1、0.1、0.3時(shí),給出不同頻率下兩種參數(shù)估計(jì)方法的對(duì)比結(jié)果,如表2所示。在頻率為5%~99%時(shí),較小在30上下波動(dòng),值對(duì)樣本長(zhǎng)度的影響不大,僅在=-0.3時(shí)估計(jì)需要40左右的樣本量,取30基本能滿足計(jì)算要求,與李鴻雁等認(rèn)為水文頻率計(jì)算需要30年的樣本結(jié)論相同。而在為0.1%~2%范圍內(nèi)普遍需要更長(zhǎng)的樣本用于頻率計(jì)算。且不同參數(shù)和頻率下計(jì)算得到的不同,這與熊立華等基于P-Ⅲ型分布的研究結(jié)論相一致,因?yàn)镻-Ⅲ分布與GEV分布擬合一些水文序列較接近。而在為75%~99%范圍內(nèi)逐漸增大,且同頻率下>0比<0大。由極值Ⅱ型與極值Ⅲ型的曲線形狀可以發(fā)現(xiàn),Ⅲ型曲線尾部相較于Ⅱ型曲線坡度更大,得到相對(duì)穩(wěn)定的結(jié)果需要的樣本長(zhǎng)度更長(zhǎng),因此也更大。

      表2 同一RCI、RMAE標(biāo)準(zhǔn)下MOM、MLM頻率計(jì)算充分樣本長(zhǎng)度對(duì)比

      5 實(shí)例分析

      將上述方法應(yīng)用于徑流、降水、洪峰數(shù)據(jù)序列,以民和、蘭州年徑流序列,西安、周至年降水序列,宜昌、長(zhǎng)洲、纜子灣、沙坪年最大洪峰序列為例,分析數(shù)據(jù)長(zhǎng)度是否足以進(jìn)行相應(yīng)頻率下的水文設(shè)計(jì)值計(jì)算,序列長(zhǎng)度及其統(tǒng)計(jì)參數(shù)、GEV分布參數(shù)如表3所示。

      表3 實(shí)測(cè)序列長(zhǎng)度及其統(tǒng)計(jì)參數(shù)、GEV分布參數(shù)

      基于GEV分布,針對(duì)年徑流、年降水序列,選取具有代表性的特豐水年、豐水年、平水年、枯水年、特枯水年作為設(shè)計(jì)代表年,設(shè)計(jì)頻率分別選擇為5%、25%、50%、75%、95%,年最大洪峰序列選取重現(xiàn)期分別為200、100、50、30、10、5年進(jìn)行充分樣本長(zhǎng)度的計(jì)算。以長(zhǎng)洲站年洪峰序列為例,不同樣本長(zhǎng)度變化Shapiro-Wilk檢驗(yàn)的平均α值及其95%的上下置信區(qū)間計(jì)算結(jié)果如圖7所示。圖中水平線α=0.05,對(duì)應(yīng)垂線為該重現(xiàn)期下頻率計(jì)算所需的充分樣本長(zhǎng)度,重現(xiàn)期越大,頻率計(jì)算所需樣本長(zhǎng)度越大。

      圖7 長(zhǎng)洲站年最大洪峰序列不同重現(xiàn)期Shapiro-Wilk檢驗(yàn)的平均α值及其95%置信區(qū)間

      將上述方法應(yīng)用于民和、蘭州年徑流序列,西安、周至年降水序列,宜昌、纜子灣、沙坪年最大洪峰序列,得到法進(jìn)行頻率計(jì)算所需的樣本長(zhǎng)度,并作假設(shè)驗(yàn)證。采用假設(shè)檢驗(yàn)中的ANOVA來論證該樣本下計(jì)算洪水頻率的合理性。ANOVA的基本思想是設(shè)定了一種描述數(shù)據(jù)變異的指標(biāo),分析出樣本長(zhǎng)度和隨機(jī)誤差影響和貢獻(xiàn),從而確定可控因素(樣本長(zhǎng)度)對(duì)研究結(jié)果影響力的大小。方差分析采用的檢驗(yàn)統(tǒng)計(jì)量是統(tǒng)計(jì)量,即值檢驗(yàn),是組間與組內(nèi)的離差平方和與自由度的比值。計(jì)算統(tǒng)計(jì)量的觀測(cè)值,給定顯著性水平,可做出決策,>0.05表示差異性不顯著。

      將相應(yīng)頻率所需的樣本長(zhǎng)度,與長(zhǎng)度為+10的樣本計(jì)算得到的各20組設(shè)計(jì)值進(jìn)行方差分析,如表4和表5。表5中列“”表示選取序列長(zhǎng)度不足以進(jìn)行該重現(xiàn)期下的頻率計(jì)算。其余均通過方差齊性檢驗(yàn),顯著性水平均大于0.05,在基礎(chǔ)上增加樣本長(zhǎng)度計(jì)算得到的設(shè)計(jì)值,總體上與計(jì)算得到的結(jié)果并無顯著差異,說明該樣本長(zhǎng)度下進(jìn)行水文頻率計(jì)算是充分且合理的。

      表4 不同設(shè)計(jì)頻率計(jì)算的充分樣本長(zhǎng)度及其假設(shè)檢驗(yàn)結(jié)果

      表5 不同重現(xiàn)期洪水頻率計(jì)算的充分樣本長(zhǎng)度及其假設(shè)檢驗(yàn)結(jié)果

      6 結(jié)論與討論

      本文首先闡述了極大似然估計(jì)量的漸近正態(tài)性質(zhì),界定了充分樣本長(zhǎng)度的概念,將bootstrap、Shapiro-Wilk正態(tài)性檢驗(yàn)方法用于確定給定水文序列頻率計(jì)算所需的充分樣本長(zhǎng)度,判斷水文數(shù)據(jù)長(zhǎng)度是否足夠充分?;贕EV分布,根據(jù)形狀參數(shù)的取值變化,在不同參數(shù)和頻率下進(jìn)行數(shù)值模擬分析,推求頻率計(jì)算的充分樣本長(zhǎng)度。基于極限近似理論,選取、為誤差指標(biāo),根據(jù)曲線擬合法分析參數(shù)、頻率、參數(shù)估計(jì)方法與樣本長(zhǎng)度間的潛在關(guān)系規(guī)律。并應(yīng)用于徑流、降水、洪峰數(shù)據(jù),推求不同設(shè)計(jì)頻率(重現(xiàn)期)下頻率計(jì)算的充分樣本長(zhǎng)度,進(jìn)行假設(shè)檢驗(yàn)進(jìn)一步驗(yàn)證方法的可行性。經(jīng)理論推導(dǎo)、模擬分析與實(shí)際應(yīng)用,獲得以下幾點(diǎn)結(jié)論:

      (1)文中充分樣本長(zhǎng)度的推理方法具有嚴(yán)謹(jǐn)?shù)臄?shù)理統(tǒng)計(jì)基礎(chǔ),不依賴于模型及經(jīng)驗(yàn)法則,可避免主觀因素的影響。

      (2)文中模型不同頻率下設(shè)計(jì)值的充分樣本長(zhǎng)度表明,重現(xiàn)期越大,所需樣本長(zhǎng)度越大。表明在樣本長(zhǎng)度不夠充分的情形下,對(duì)結(jié)果進(jìn)行不確定性評(píng)估是至關(guān)重要的。

      (3)數(shù)值模擬及實(shí)例計(jì)算結(jié)果均通過檢驗(yàn),論證了文中方法的合理性。充分樣本長(zhǎng)度對(duì)應(yīng)的誤差指標(biāo)與的取值有關(guān),且在不同指標(biāo)下呈現(xiàn)的趨勢(shì)相同,也與相應(yīng)值、相應(yīng)頻率下設(shè)計(jì)值離均系數(shù)的曲線趨勢(shì)一致,符合客觀規(guī)律,進(jìn)一步說明了方法的正確性。

      (4)最大似然估計(jì)法需要一定長(zhǎng)度的樣本量才能得到合理的結(jié)果,當(dāng)矩法與最大似然法估計(jì)誤差都較大時(shí),矩法表現(xiàn)更好,交叉點(diǎn)之后誤差顯著減小,最大似然估計(jì)優(yōu)于矩法,表現(xiàn)出其良好的估計(jì)性能。

      (5)在10%~75%的頻率范圍內(nèi),充分樣本長(zhǎng)度及交叉點(diǎn)基本小于30,或在30上下波動(dòng),說明在這一頻率范圍內(nèi)30的樣本量足以進(jìn)行最大似然估計(jì),表現(xiàn)出其良好的估計(jì)性能。而在該頻率范圍外,交叉點(diǎn)的樣本長(zhǎng)度大于30,矩法、最大似然估計(jì)法在30的樣本長(zhǎng)度下存在較大誤差。

      本文研究成果可為水文頻率計(jì)算中充分樣本長(zhǎng)度的確定提供一定參考依據(jù),定量論證了水文數(shù)據(jù)進(jìn)行分析計(jì)算的充分長(zhǎng)度,以期提高水文分析計(jì)算的嚴(yán)謹(jǐn)性。但其中存在幾點(diǎn)值得進(jìn)一步深入研究:(1)本文方法基于數(shù)理統(tǒng)計(jì)推斷,沒有考慮物理測(cè)量、水文成因在內(nèi)的其他因素影響。(2)文中假定水文序列是平穩(wěn)序列進(jìn)行了充分樣本長(zhǎng)度的分析計(jì)算,而對(duì)于非平穩(wěn)序列頻率計(jì)算:可采用混合概率模型、分段平穩(wěn)模型,序列分解法模型,結(jié)合本文中充分樣本長(zhǎng)度計(jì)算方法進(jìn)行研究。而對(duì)于時(shí)變參數(shù)模型,需要進(jìn)一步研究時(shí)變參數(shù)的抽樣評(píng)定方法。(3)文中基于GEV分布充分樣本長(zhǎng)度的分析方法可應(yīng)用于其他概率模型,以探究該方法的普適性。

      猜你喜歡
      參數(shù)估計(jì)水文長(zhǎng)度
      2022年《中國(guó)水文年報(bào)》發(fā)布
      基于新型DFrFT的LFM信號(hào)參數(shù)估計(jì)算法
      1米的長(zhǎng)度
      水文
      水文水資源管理
      愛的長(zhǎng)度
      怎樣比較簡(jiǎn)單的長(zhǎng)度
      水文
      Logistic回歸模型的幾乎無偏兩參數(shù)估計(jì)
      基于向前方程的平穩(wěn)分布參數(shù)估計(jì)
      旬阳县| 叶城县| 克山县| 托里县| 新田县| 西贡区| 宜兰县| 东台市| 潮安县| 卓资县| 林芝县| 武清区| 延川县| 内丘县| 精河县| 景东| 浑源县| 桦南县| 上栗县| 应城市| 城口县| 奉贤区| 逊克县| 孝义市| 太谷县| 大宁县| 调兵山市| 香河县| 扶风县| 万盛区| 阳新县| 来安县| 抚顺县| 平顺县| 兴义市| 霍城县| 渝北区| 阿克苏市| 包头市| 兴义市| 鹿泉市|