郭德俊 王悅 唐旭偉 崔惠娟
摘要:基于信息熵理論,計算了大通水文站的流量歷時曲線。利用兩個簡單約束方程對流量歷時曲線進行建模,運用概率總和與平均流量以及約束方程推導最大熵獲得曲線參數,最終確定了流量歷時曲線。通過對大通控制站觀測到的流量數據進行驗證,發(fā)現基于信息熵理論得到的流量歷時曲線與觀測到的曲線一致。自2003年三峽工程建設投運以來,大通水文站觀測到的均值流量和最大流量趨勢發(fā)生了變化,卻未發(fā)現均值與最大值的比值存在顯著差異。在此期間,其表征分布形態(tài)的熵參數也并未發(fā)生顯著變化。
關鍵詞:流量歷時曲線;信息熵;熵參數;大通水文站
中圖法分類號:P337
文獻標志碼:A
DOI:10.15974/j .cnki.slsdkb.2019.08.001
1 研究背景
大通水文站位于安徽省池州市梅隴,為長江下游的控制水文站,距長江口約700 km,控制面積約170萬km2。該站于1922年10月設立,1949年10月1日后由長江水利委員會管轄,觀測資料包括水位、流量、泥沙、雨量等。
流量歷時曲線代表水文控制站不同頻率對應的流量由低到高排列,一般在某一時間尺度用0-100%的數值刻畫。流量歷時曲線可看作某一站點某一時段的流量累積頻率曲線,而非時間序列。由于流量歷時曲線是通過觀測范圍內所有觀測到的流量判定的,考慮到流域的綜合水文條件,可用來比對不同河流的情況,經常用來預測未來供水流量的分布[1]、水力發(fā)電量[2]、沉積物負荷[3]及污染指數[4]。
一般來說,可通過每日平均流量構建流量歷時曲線,也可根據需要建立周、月和季步長上的流量歷時曲線,但隨著時間間隔增加,流量變化的細節(jié)變得模糊。對于多數河流,月流量的歷時曲線并不能充分反映流量的變化情況,而基于年平均流量建立的流量歷時曲線由于其變化范圍較小,幾乎沒有價值。H.A. Foster[5]研究表明,基于日流量確定的流量歷時曲線與基于月流量確定曲線的差異可能高達35%。對于不同的河道,時間間隔變化的影響也不盡相同。對于一些日流量幾乎均勻的河道,周流量的歷時曲線可能與日流量的歷時曲線幾乎相同。而對于突然發(fā)生洪水的河道,其日流量和周流量的歷時曲線將存在較大差異。通常根據經驗分布構建流量歷時曲線。本文采用2014年V.P.Singh等[6]研發(fā)的信息熵模型,結合最大熵理論,確定大通水文站流量歷時曲線,并與其觀測值進行比較驗證。
2 研究方法
為利用信息熵理論計算流量歷時曲線,需假設大通站觀測到的日流量Q為獨立隨機變量,服從未知概率分布f(Q)。
V.P.Singh等[6]基于信息熵理論的流量歷時曲線計算步驟包括:①定義信息熵;②確定流量約束條件;③利用拉格朗日方程求最大熵并獲得流量概率分布;④計算拉格朗日參數并求得流量歷時曲線。
2.1 定義流量的Shannon熵
考慮觀測到的流量Q服從未知分布f(Q),利用Shannon熵[7],流量的信息熵H(Q)可定義為式中,Qmax和Qmax分別為上下限,表征最大及最小流量。H表征流量概率分布f(Q)所包含的不確定性,代表樣本Q所包含信息量的期望。通過式(1),根據最大熵理論求得最不偏的概率分布f(Q)。最大熵理論由E.T.Jaynes[8]的研究成果發(fā)展而來,只需明確流量約束條件即可求得。根據最大熵理論可知,對僅知部分信息的變量或關系,對其最不偏的判斷滿足熵最大的情況。
2.2 約束條件
首先,作為Q的概率分布f(Q)必須滿足其總和等于1的條件:
能量守恒定律也能作為約束條件,然而D.E.Barbe等[9]的研究表明,對于河道流速的分布,利用信息熵理論時僅需上述兩個約束條件就已足夠。為不增加計算的復雜性,該研究中僅采用上述兩個約束條件進行計算。
2.3最 大化
利用拉格朗日算子,可以將式(1)所定義的信息熵最大化,并求得熵最大時的概率分布:
2.4 流量歷時曲線
流量歷時曲線代表了流量和不小于該流量時長之間的關系,因此可假設觀測到的時均流量為在其最大值Qmax與最小值Qmin之間的概率分布。這符合實際情況和Laplacian不充分原則。為此,流量的累積概率F(Q)可表示為
F(Q)=1-t/T=1-τ,τ=t/T
(6)式中,t為流量不小于Q的時長(天數),T為考慮的總時長(365 d)。值得注意的是,F(Q)為關于流量Q的函數,t/T是關于τ的函數。上述線性累積分布假設是對流量Q與時長百分比τ的線性假設,相似的假設已應用于不少研究[10-12]。相應地,也可假設流量與時長百分比間具有非線性關系。為簡化計算步驟,本文采用上述線性假設關系。
參照文獻[6],對通過最大化信息熵獲得的概率分布,在Qmax和Qmax之間進行積分,即可得到流量歷時曲線:
3 計算結果
3.1 大通站日流量
采用大通水文控制站1951-2013年日均流量進行計算,以2003年三峽工程建成投運為界,分為2003年前后兩個序列。表1總結了2003年前后大通站年均流量、年最大流量、年最小流量的歷史平均值(Qmax,Qmax,Qmax)及其觀測到的歷史最大流量Qpeak。由表1可以看出,三峽工程建設投運以來,年均流量變化幅度不顯著,年最大流量減少,年最小流量增加,其流量變化范圍減小,然而該變化并不顯著。
為更準確地表明2003年前后的流量變化,圖1顯示了2003年前后兩組觀測流量的概率分布。由圖1可以看出,2003年之后的流量概率分布相比2003年前更為集中,流量在12 000-20 000m3/s之間的情況明顯增加,無流量小于9 000m3/s或大于65 000 m3/S的觀測值。對2003年前后的概率進行配線并對比,發(fā)現兩組序列所配的概率分布存在明顯差異,通過t檢驗得知2003年前后的流量不服從同一分布。
3.2 熵參數變化
如式(8)所示,該研究方法中唯一的參數熵M取決于均值與最大值的比值。圖2展示了大通站日均流量與最大日流量隨時間的變化趨勢,由圖可知,2003年三峽工程建成投運對其最大流量帶來了較顯著影響,2003年為最大流量的顯著拐點。2003年前,最大流量呈現增加趨勢;而2003年后,不僅最大流量值明顯小于歷時平均,且具有下降趨勢。相反地,大通站觀測的日均流量2003年前后并未發(fā)生顯著差異,其趨勢也不明顯。結合Mann-Kendall趨勢檢驗方法來檢驗其變化趨勢,結果如表2所示。只有2003年前的最大流量和最小流量的變化具有顯著趨勢(p<0.05),且2003年后這些變化也不再顯著,與圖2所展示的結果一致。
本研究分析了日均流量與最大流量的比值是否受三峽工程的影響。圖3展示了2003年前后日均流量與最大流量的比值范圍,圖中藍點展示2003年前后的均值與最大流量的比值,其范圍在0.28-0.57之間,而2003年后其比值范圍僅在0.32-0.43之間。利用式(8),求得各個時段對應的熵參數M值。相應地,2003年前絕大多數M值分布在2.1-3.2之間,1955年出現最大值3.55。2003年后M值范圍縮小為2.3-3.2之間,這是由于三峽水庫運行后流量范圍明顯減小。然而通過配線擬合發(fā)現,2003年前后所有點幾乎都落到同一條曲線上,雖然參數略有差異,但差異并不顯著。上述分析說明,雖然2003年三峽水庫運行導致大通站的流量發(fā)生了變化,然而從信息熵的角度來講,兩組數據所包含的信息量并不存在顯著差異,數據分布形態(tài)并無顯著區(qū)別。
3.3 流量歷時曲線
通過計算所得的熵參數M值,可根據式(7)確定大通站每年的流量歷時曲線。圖4展示了1960年的流量歷時曲線,圖中圓點代表觀測值由大到小排序計算的流量歷時曲線,紅線代表利用信息熵理論算得的曲線。通過對比發(fā)現,兩者十分接近,進一步說明由信息熵理論算得的流量歷時曲線符合觀測結果。
為比較三峽工程對流量歷時曲線的影響,圖5中將2003年前的流量歷時曲線用灰色范圍表示,用不同的顏色線代表2003年后的大通站的流量歷時曲線。圖5結果表明,雖然三峽工程運行導致其流量發(fā)生了顯著變化,尤其是最大流量明顯減小,但其流量歷時曲線并沒有超出歷史范圍,這一結論也與熵參數M沒有發(fā)生顯著變化一致。
4 結語
本文基于信息熵理論,確定了大通水文控制站的流量歷時曲線。假設觀測得到的流量為隨機變量,利用概率總和與均值定理作為約束條件,對流量歷時曲線進行建模?;谧畲箪乩碚撏茖Я髁繗v時曲線過程中,采用線性累積分布假設,最終確定流量歷時曲線。利用信息熵確定的流量歷時曲線,由于無需提前確定流量具體服從何種分布,不需要擬合,簡化了計算難度,僅需基于觀測確定參數。本研究通過對大通控制站觀測到的流量數據進行驗證,發(fā)現基于信息熵理論得到的流量歷時曲線與觀測數據曲線一致。2003年三峽工程建成投運以來,大通水文站觀測到的均值流量和最大流量的趨勢發(fā)生了變化,然而均值對最大值的比值卻未發(fā)現顯著差異,其表征分布形態(tài)的熵參數在三峽工程建成投運前后也并未發(fā)生顯著變化,因為三峽工程建成投運并未對大通水文站的流量歷時曲線帶來顯著影響。
參考文獻
[1] Mitchell W D. Flow-duration of Illinois Streams [M] . Illi- nois : Illinois Department of Public Works and Buildings ,Division of Waterways, 1957.
[2] Hickox G H, Wessenauer G0. Application of durationcurves to hydroelectric studies [Jl. Transactions ofASCE, 1933(98) : 1276-1308.
[3] Miller C R. Analysis of Flow Duration, Sediment-ratingCurve Method of Computing Sediment Yield [M] . Denver :Department of Interior, Bureau of Reclamation, Sedimen-tation Section, Hydrology Branch, 1951.
[4] Searcy J K. Flow-duration Curves [Ml. Washington, D.C.: USGS Water-Supply Paper, U.S. Govemment Print-ing Office, 1959.
[5] Foster H A. Duration curves [Jl. Transaction of ASCE,1934( 99) : 1213-1267.
[6] Singh V P, Byrd A , Cui H. Flow duration curve usingentropy theory [Jl. Journal of Hydrological Engineering,2014,19(7) :1340-1348.
[7] Shannon C E. A mathematical theory of communications ,I and II [Jl. Bell System Technical Journal, 1948 (27) :379-443.
[8] Jaynes E T. Information theory and statistical mechanics[J]. I. Physical Review, 1957(106) :620-630.
[9] Barbe D E, Cruise J F, Singh V P. Solution of 3-con-straint entropy-based velocity distribution [Jl. Hydraul.Eng. , 1991 ,117(10) : 1389-1396.
[10] Singh V P. Entropy theory for derivation of infiltration equations [Jl. Water Resources Research, 2010 (46) :1-20.
[11] Singh V P. Tsallis entropy theory for derivation of infil-tration equations [J]. Transactions of the ASABE, 2010(2) : 447-463.
[12]Al-Hamdan O Z, Cruise J F. Soil moisture profile de-velopment from surface observations by principle of max-imum entropy [J]. Joumal of Hydrologic Engineering,2010(5) :327-337.