白云天 ,孟祥國 ,孫萬光
(1.嫩江尼爾基水利水電有限責(zé)任公司,黑龍江齊齊哈爾161005;2.嫩江尼爾基水利水電有限責(zé)任公司,黑龍江齊齊哈爾161005;3.中水東北勘測設(shè)計研究有限責(zé)任公司科學(xué)研究院,吉林長春130061;4.水利部寒區(qū)工程技術(shù)研究中心,吉林長春130061)
尼爾基水利樞紐位于黑龍江省與內(nèi)蒙古自治區(qū)交界的嫩江干流中上游,水庫壩址距離嫩江河口585 km,控制流域面積66 382 km2,占嫩江流域面積的22.35%。壩址處多年平均年徑流量為104.7×108m3,約占嫩江流域年徑流量的45.7%。尼爾基水利樞紐是嫩江流域集防洪、供水、發(fā)電、航運、水環(huán)境保護(hù)于一體,綜合利用效益十分顯著的大型控制性工程,水庫調(diào)節(jié)庫容59.68×108m3,徑流調(diào)節(jié)能力突出,為多年調(diào)節(jié)水庫。較準(zhǔn)確的入庫徑流預(yù)報可為水庫調(diào)度提供決策依據(jù),對充分發(fā)揮樞紐的防洪及興利效益具有十分重要的意義。
嫩江及尼爾基水庫壩址以上流域長期徑流預(yù)報已取得了比較豐富的研究成果。李鴻雁對嫩江流域徑流的大氣環(huán)流影響及其敏感性和相關(guān)性進(jìn)行分析,并對嫩江流域徑流的可預(yù)報性及其時間尺度進(jìn)行了深入的研究[1-3],認(rèn)為采用大氣環(huán)流因子進(jìn)行入庫徑流預(yù)報適用的時間尺度一般為月。周長美采用前后期徑流相關(guān)法對尼爾基水庫枯季入庫徑流進(jìn)行預(yù)報[4],并取得了比較滿意的結(jié)果。尼爾基水庫枯季(11月至翌年3月)入庫徑流預(yù)報因流域降水主要以固態(tài)形式存在于流域內(nèi),不參與水循環(huán),徑流主要以河網(wǎng)和地下水退水為主。但非枯季節(jié)(4—10月),入庫徑流受降水、融雪、退水等因素影響,使入庫徑流預(yù)報變得十分復(fù)雜。尼爾基水庫非枯季節(jié)中期入庫徑流預(yù)報對樞紐的興利調(diào)度特別是發(fā)電調(diào)度意義重大,但目前可用于作業(yè)預(yù)報的入庫徑流預(yù)報方法一直比較匱乏。本文擬對入庫徑流影響因子進(jìn)行篩選,采用數(shù)理統(tǒng)計方法對尼爾基水庫非枯季節(jié)中期入庫徑流進(jìn)行預(yù)報。
入庫徑流預(yù)報通常建立自變量與多因變量之間的相關(guān)關(guān)系數(shù)學(xué)模型,歸納起來可分為兩類:線性模型和非線性模型。線性模型中,多元門限回歸模型較其他模型具有一定優(yōu)勢[5]:它通過設(shè)置門限元數(shù)量,能有效描述具有突變性、準(zhǔn)周期性、分段相依性等復(fù)雜問題,以分區(qū)間的線性模型來表述研究對象在整個區(qū)間的非線性變化特征,也可以解決具有一定非線性的問題。非線性模型中[5],投影尋蹤模型以其模型結(jié)構(gòu)簡單、穩(wěn)健性好而得到廣泛應(yīng)用。
多元門限回歸能有效地描述具有突變、準(zhǔn)周期性、分段相依等復(fù)雜現(xiàn)象的非線性動態(tài)系統(tǒng)。其基本思想是:當(dāng)給出預(yù)報因子資料后,首先根據(jù)門限變量和門限值決定在不同情況下使用不同預(yù)報關(guān)系的方程,以此解釋各種類似于突變的現(xiàn)象。其實質(zhì)是,把預(yù)報問題按狀態(tài)空間的取值進(jìn)行分類,用分段的線性回歸模型來描述總體非線性問題。
設(shè)預(yù)報對象 yt與因子 x(ti)構(gòu)成的非線性模型形式為:
式中:N為樣本容量;m為因子數(shù);φ1,φ2,…,φm為待定參數(shù)。
若其中有某個特殊因子x(i),當(dāng)其值低于某個水平時,預(yù)報對象與預(yù)報因子之間是一種函數(shù)關(guān)系,而當(dāng)其值高于某個水平時,預(yù)報對象與因子之間又是一種函數(shù)關(guān)系,則稱x(i)為門限變量,導(dǎo)致預(yù)報對象與因子函數(shù)關(guān)系改變的
xk(i))(1<k<N)值稱為門限值。
根據(jù)門限變量將預(yù)報對象和預(yù)報因子分為L段,將每段進(jìn)行多元回歸分析,其數(shù)學(xué)模型如下:
式中:rj(j =1,2,…,L-1)為門限值;L為門限區(qū)間個數(shù);φ(j , s)(s =1,2,…,m )為第 j個門限區(qū)間內(nèi)的回歸系數(shù);y(i)為預(yù)報對象序列;x(s , i)(s =1,2,…,m )為預(yù)報因子序列,m為預(yù)報因子個數(shù);x(k ,i)(1 ≤k≤m )為門限變量;d為門限延遲步數(shù);ε(j , i)為白噪聲。
投影尋蹤是用來分析和處理高維觀測數(shù)據(jù),尤其是非線性、非正態(tài)高維數(shù)據(jù)的一種新興人工智能技術(shù),它通過把高維數(shù)據(jù)投影到低維子空間,尋找能反映原高維數(shù)據(jù)結(jié)構(gòu)或特征的投影,達(dá)到研究分析高維數(shù)據(jù)的目的。其中心思想是:找到若干個投影方向,將高維數(shù)據(jù)投影到一維空間后,用若干個嶺函數(shù)加權(quán)和的形式來逼近回歸函數(shù)。投影尋蹤回歸方法的數(shù)學(xué)表達(dá)式為:
式中:Y為因變量;m為逼近的子函數(shù)個數(shù);gm為第m個光滑嶺函數(shù);bm為權(quán)值,表示第m個嶺函數(shù)對輸出值的貢獻(xiàn)大??;amj為第m個投影方向的第 j個分量;p為輸入空間的維數(shù);要求
投影尋蹤回歸的實現(xiàn),是對參數(shù)步步尋優(yōu),對回歸函數(shù)的結(jié)構(gòu)形式無太大依賴關(guān)系,回歸模型對系統(tǒng)信息的識別由3個參數(shù)來實現(xiàn):投影方向a、嶺函數(shù)g、權(quán)重b。實現(xiàn)投影尋蹤回歸的核心問題有兩個:
1)投影問題。實現(xiàn)投影尋蹤回歸的第一步就是通過對系統(tǒng)信息的分析,得到最能反映系統(tǒng)特征的投影方向,投影的過程必須實現(xiàn)兩個目標(biāo)分別為降低維數(shù)和投影方向能夠反映系統(tǒng)特征。
2)尋蹤問題。樣本序列投影到低維子空間后,為避免信息的重復(fù)利用引起的過度擬合問題,需要在已有的嶺函數(shù)中,優(yōu)選其中最能表達(dá)系統(tǒng)特征的嶺函數(shù),寫進(jìn)最后的加權(quán)和式(3)中,這個過程稱為尋蹤,其目標(biāo)是確定模型的最優(yōu)嶺函數(shù)的值。
投影尋蹤回歸方法包括參數(shù)方法和非參數(shù)方法。由于非參數(shù)回歸模型要求大量樣本才能實現(xiàn)無偏估計,對于資料短缺的水文水資源預(yù)測而言,用基于非線性的Hermite多項式的參數(shù)投影尋蹤回歸模型較為合適,其優(yōu)越性已被大量的實踐所證實。
旬徑流預(yù)報是在預(yù)報因子中加入未來一旬氣象預(yù)報信息。由于沒有流域氣象預(yù)報的歷史數(shù)據(jù),降雨預(yù)報數(shù)據(jù)采用歷史實測降雨代替,氣溫采用嫩江氣象站實測數(shù)據(jù)。在預(yù)報因子篩選過程中發(fā)現(xiàn),一般情況下,引入氣象預(yù)報信息均能不同程度地提高預(yù)報精度,但由于氣象預(yù)報信息具有不確定性,若引入氣象預(yù)報信息相關(guān)的因子不能顯著提高預(yù)報精度,則將該因子剔除。經(jīng)篩選后確定各旬預(yù)報的預(yù)報因子,如表1所示。
表1 旬徑流預(yù)報預(yù)報因子表
由表1可知,除4月中旬和6月中旬外,旬徑流一般與前一旬的降水和徑流關(guān)系最為密切,與本旬的降水相關(guān)關(guān)系并不強。這是因為尼爾基水庫以上流域面積較大,匯流時間長所致,故所建立的旬徑流預(yù)報模型預(yù)報精度受氣象預(yù)報精度的影響不大。
根據(jù)水文氣象資料情況,采用選定的預(yù)報因子,利用1970—2003年的資料訓(xùn)練模型參數(shù),利用2004—2013年10年的資料進(jìn)行預(yù)報檢驗。為使建立的模型具有代表性,在選擇訓(xùn)練樣本時剔除了存在極端特大值的樣本,如6月下旬徑流預(yù)報中剔除了1998年的樣本。分別采用多元門限回歸模型和投影尋蹤模型進(jìn)行了模擬預(yù)報,當(dāng)兩種預(yù)報模型模擬結(jié)果無顯著性差別時,推薦采用穩(wěn)定性較好的多元門限回歸模型。推薦模型的模擬預(yù)報結(jié)果如表2所示。
表2 旬徑流預(yù)報精度評價表
按照《水文情報預(yù)報規(guī)范》的相關(guān)規(guī)定,本次旬徑流預(yù)報精度除4月中旬預(yù)報合格率低于80%外,其他各旬預(yù)報精度均大于80%。若將歷史旬同期的徑流時間序列視為一個徑流過程,從確定性系數(shù)判斷,除4月上、中旬確定性系數(shù)低于0.7外,其他各旬均為大于0.7或0.8。這表明所建立的旬徑流模型能夠反映尼爾基水庫流域徑流變化規(guī)律,可用于作業(yè)預(yù)報中。
1)利用數(shù)理統(tǒng)計方法進(jìn)行旬徑流預(yù)報時,預(yù)報因子宜按表1選用。除4月中旬和6月中旬外,旬徑流一般與前一旬的降水和徑流關(guān)系最為密切,與本旬的降水相關(guān)關(guān)系并不強,且在預(yù)報因子篩選過程中,未選入不能顯著提高模型預(yù)報精度的與氣象預(yù)報信息相關(guān)的因子,故所建立的旬徑流預(yù)報模型預(yù)報精度受氣象預(yù)報精度的影響不大。
2)采用數(shù)理統(tǒng)計方法進(jìn)行旬徑流預(yù)報時,根據(jù)預(yù)報時段,推薦按表2選擇相應(yīng)的預(yù)報模型。按照《水文情報預(yù)報規(guī)范》的相關(guān)規(guī)定,旬徑流預(yù)報精度除4月中旬預(yù)報合格率低于70%外,其他各旬預(yù)報精度均較高。若將歷史旬同期的徑流時間序列視為一個徑流過程,從確定性系數(shù)判斷,除4月上、中旬為低于0.7外,其他各旬均達(dá)0.7甚至0.8以上,模型模擬預(yù)測值與實測值的變化過程有良好的一致性,表明所建立的旬徑流模型能夠反映尼爾基水庫流域徑流變化規(guī)律,可用于作業(yè)預(yù)報。