曾思明,吳杰康2,陳永進(jìn),趙俊浩2,翁興航
(1.廣東電網(wǎng)有限責(zé)任公司韶關(guān)供電局,廣東 韶關(guān) 512000; 2.廣東工業(yè)大學(xué)自動(dòng)化學(xué)院,廣東 廣州 510006)
韶關(guān)市地理位置是在廣東省的中北部,由于地處溫帶而且受濕潤(rùn)的季風(fēng)氣候影響[1],所以全年降水量充足,而且河流數(shù)目非常多,水量以及水力資源都十分豐富,非常有利于小水電的開發(fā)與建造。
其中,南水河作為韶關(guān)主要河流之一,其集水面積是1489 km2,多年的平均年徑流量是1.34×109m3,由于南水河地貌的特點(diǎn)為峽谷非常多、河流落差較大,所以流域內(nèi)已經(jīng)建造了中大型的水庫[2]。因此,如果能對(duì)南水河的徑流量進(jìn)行研究以及準(zhǔn)確的預(yù)測(cè),對(duì)于合理利用南水河的水資源有著重要的意義,也為開發(fā)小水電提供重要的科學(xué)依據(jù)。
近年來,許多學(xué)者已經(jīng)使用了多種預(yù)測(cè)方法對(duì)徑流量進(jìn)行了預(yù)測(cè)與研究[3-6]。例如針對(duì)流溪河水庫,文獻(xiàn)[7]使用BP神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)該水庫的徑流量。文獻(xiàn)[8]以石泉水庫為例,研究了BP神經(jīng)網(wǎng)絡(luò)以及馬爾科夫預(yù)測(cè)的優(yōu)劣,提出了BP神經(jīng)網(wǎng)絡(luò)馬爾科夫模型來預(yù)測(cè)河流徑流量。文獻(xiàn)[9]采用灰色系統(tǒng)理論中的GM(1,1)模型,研究了黃河年徑流量的變化特點(diǎn),擬合并預(yù)測(cè)了唐乃亥河花園口的年徑流量。在此基礎(chǔ)上,文獻(xiàn)[10]結(jié)合了R/S分析,采用R/S灰色預(yù)測(cè)的方法對(duì)黑河出山年徑流量進(jìn)行預(yù)測(cè)。文獻(xiàn)[11]使用了支持向量機(jī)預(yù)測(cè)模型,以黃河上游蘭州站為例,預(yù)測(cè)該水文站的年徑流量。文獻(xiàn)[12]則在支持向量機(jī)的基礎(chǔ)上作出了改進(jìn),將改進(jìn)后的模型應(yīng)用在開都河年徑流量的預(yù)測(cè)上。綜合上述學(xué)者的研究,現(xiàn)在用于徑流量的預(yù)測(cè)基本是利用多年的徑流量數(shù)據(jù)作為模型的輸入輸出,利用各種算法找到輸入輸出之間的數(shù)學(xué)關(guān)系,以此來擬合并預(yù)測(cè)河流的徑流量。
由于不同預(yù)測(cè)模型都有自己不一樣的特點(diǎn),如何在某一地點(diǎn)選擇恰當(dāng)?shù)念A(yù)測(cè)模型成為評(píng)估該地區(qū)水資源的一個(gè)難點(diǎn)。下面首先分析了灰色系統(tǒng)預(yù)測(cè)、基于遺傳算法神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)3種預(yù)測(cè)方法對(duì)韶關(guān)市南水河徑流量預(yù)測(cè)結(jié)果;然后對(duì)比3種方法的預(yù)測(cè)值與實(shí)際值的誤差;最后評(píng)價(jià)各模型的性能,為研究南水河區(qū)域水資源以及評(píng)估該區(qū)域水資源豐富度提供科學(xué)的決策依據(jù),對(duì)于在該區(qū)域研究以及建立微電網(wǎng)有著重要的意義。
由于韶關(guān)市南水河的徑流量數(shù)據(jù)較少,而且該河流徑流量的隨機(jī)性以及波動(dòng)性較大,為了更好研究韶關(guān)水資源的變化趨勢(shì),在預(yù)測(cè)方法中,采用了灰色系統(tǒng)理論中的GM(1,1)模型、基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)3種方法對(duì)南水河的年徑流量進(jìn)行擬合以及預(yù)測(cè)。
在傳統(tǒng)的系統(tǒng)行為分析中,大多數(shù)的數(shù)據(jù)分析法都是要通過分析大量的歷史數(shù)據(jù),從中得到數(shù)據(jù)相關(guān)的數(shù)學(xué)規(guī)律。但是對(duì)于徑流量這一物理量來說,其變化一般是隨機(jī)波動(dòng)的且歷史數(shù)據(jù)量難以獲取。而在灰色系統(tǒng)中,其預(yù)測(cè)方法是可以從少量的數(shù)據(jù)尋找系統(tǒng)的變化規(guī)律,并且灰色預(yù)測(cè)方法計(jì)算較為簡(jiǎn)單,所以首先使用灰色系統(tǒng)理論中的GM(1,1)模型[13-15],并在此模型基礎(chǔ)上作出改進(jìn)用于徑流量的預(yù)測(cè)。
1.1.1 GM(1,1)模型
GM(1,1)模型所對(duì)應(yīng)的白化形式微分方程為
(1)
(2)
(3)
(4)
求解模型的微分方程,可以得到徑流量的預(yù)測(cè)模型方程為
k=0,1,2,...,n
(5)
1.1.2 改進(jìn)GM(1,1)模型
由于GM(1,1)模型只能應(yīng)用于一階線性微分方程,但是南水河的年徑流量的變化是不符合這一條件的,直接使用GM(1,1)模型對(duì)南水河的年徑流量進(jìn)行預(yù)測(cè)是很難得到一個(gè)理想結(jié)果的,需對(duì)GM(1,1)模型進(jìn)行改進(jìn)。具體步驟如下:
1)在坐標(biāo)軸上繪出南水河年徑流量的逐年變化曲線圖;
(6)
3)作閾值L與曲線的交點(diǎn)圖,可以得到遞增的時(shí)間序列;
4)將GM(1,1)模型用在該時(shí)間序列中,得到該閾值的預(yù)測(cè)模型;
5)作出其他閾值的GM(1,1)預(yù)測(cè)模型;
6)根據(jù)上述得到的一系列預(yù)測(cè)模型,作出徑流量的預(yù)測(cè)圖。
由于BP神經(jīng)網(wǎng)絡(luò)在全局中的搜索能力差,比較容易陷入局部極值且算法的收斂速度較慢,當(dāng)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值選擇不恰當(dāng)?shù)臅r(shí)候,網(wǎng)絡(luò)輸出的結(jié)果不理想,模擬精度較低,誤差較大。所以針對(duì)徑流量的預(yù)測(cè),利用遺傳算法在全局搜索能力強(qiáng)且速度較快的優(yōu)點(diǎn),將BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值放進(jìn)遺傳算法中進(jìn)行優(yōu)化,以BP神經(jīng)網(wǎng)絡(luò)輸出的徑流量預(yù)測(cè)值與實(shí)際值的誤差作為遺傳算法的適應(yīng)度函數(shù),得出最優(yōu)的權(quán)值閾值。最后使用BP神經(jīng)網(wǎng)絡(luò)在這一組權(quán)值和閾值中進(jìn)行仿真,得到最后的徑流量預(yù)測(cè)輸出值[16-20]。該優(yōu)化模型的具體步驟如圖1所示。
圖1 基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)流程
在統(tǒng)計(jì)學(xué)習(xí)的理論當(dāng)中,認(rèn)為當(dāng)經(jīng)驗(yàn)風(fēng)險(xiǎn)函數(shù)最小的時(shí)候,模型對(duì)于訓(xùn)練集的學(xué)習(xí)是最好的。但是這存在著約束條件,訓(xùn)練樣本的數(shù)目需要足夠大,這樣經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的模型才能夠更好地進(jìn)行學(xué)習(xí)。當(dāng)訓(xùn)練樣本較少的時(shí)候,根據(jù)這一經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的理論來對(duì)模型進(jìn)行訓(xùn)練則會(huì)出現(xiàn)過擬合。1995年,Corinna Cortes和Vapnik兩位學(xué)者首次提出了支持向量機(jī)這一概念,這是基于上述統(tǒng)計(jì)學(xué)習(xí)理論所提出的一種新的算法。他們認(rèn)為當(dāng)某一數(shù)據(jù)集遵循某一規(guī)律分布的時(shí)候,如果要使得模型的實(shí)際輸出值能更好地模擬實(shí)際值,就要使得結(jié)構(gòu)風(fēng)險(xiǎn)最小化,而不是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化。而支持向量機(jī)(support vector machine,SVM)則能很好地實(shí)現(xiàn)這一結(jié)構(gòu)風(fēng)險(xiǎn)最小化的理論,在小樣本的條件下,支持向量機(jī)可以在統(tǒng)計(jì)學(xué)習(xí)中的分類和回歸的研究中起到非常理想的效果[21-25]。
支持向量機(jī)回歸(support vector regression,SVR)是使用核函數(shù)將樣本數(shù)據(jù)從地位空間映射到高維空間,然后在這個(gè)高維空間求解問題的回歸方程。SVR對(duì)于徑流量的預(yù)測(cè)回歸步驟如下:
1)利用多年的徑流量數(shù)據(jù),徑流量的回歸預(yù)測(cè)函數(shù)在高維空間的形式為
f(x)=ωx+b
(7)
式中:ω是權(quán)值向量;b為偏置量。
2)若樣本數(shù)據(jù)點(diǎn)在超平面與支持向量之間,則認(rèn)為該數(shù)據(jù)點(diǎn)沒有損失,定義如下:
(8)
式中:y為實(shí)際的徑流量;ε為反應(yīng)允許偏差的參數(shù)。
3)引入松弛系數(shù),則徑流量回歸問題可以表示為
(9)
(10)
4)根據(jù)拉格朗日乘子,將徑流量回歸問題變成對(duì)偶形式:
(11)
(12)
5)最后求解可得徑流量回歸預(yù)測(cè)函數(shù)為
表1 南水河年徑流量預(yù)測(cè)模型
(13)
為了對(duì)比上述3種方法對(duì)于徑流量預(yù)測(cè)的結(jié)果,以韶關(guān)市的南水河為研究對(duì)象,利用Matlab軟件[26-28]分別使用灰色預(yù)測(cè)、基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)對(duì)南水河1978—2015的年徑流量進(jìn)行仿真研究。
由于根據(jù)南水河1978—2010年徑流量的數(shù)據(jù),該河域在這33年最大流量為1.451×109m3,最小流量為5.35×108m3,所以使用灰色預(yù)測(cè)時(shí),在設(shè)定閾值時(shí),從最小值開始每次往上增加0.5×108m3,直到最大值,且當(dāng)某些年份沒有相對(duì)應(yīng)的閾值,則設(shè)定該年份實(shí)際值也作為一個(gè)閾值,要求每個(gè)閾值對(duì)應(yīng)的樣本數(shù)不少于4個(gè),因此對(duì)于南水河一共建立了14個(gè)模型,結(jié)果如表1所示。
圖2是灰色預(yù)測(cè)對(duì)南水河徑流量的擬合值與實(shí)際徑流量的對(duì)比,可以看出擬合出來的曲線大部分年份的擬合值與實(shí)際值相差不大,灰色系統(tǒng)對(duì)于南水河年徑流量的擬合精度為84.24%,而且擬合曲線與實(shí)際曲線的變化趨勢(shì)基本一致,可見灰色系統(tǒng)可以較好擬合出南水河年徑流量。表2為利用灰色系統(tǒng)的預(yù)測(cè)模型對(duì)2011—2015年南水河年徑流量進(jìn)行預(yù)測(cè)。根據(jù)水文預(yù)報(bào)的標(biāo)準(zhǔn)(誤差低于20%)來看,可見預(yù)測(cè)的合格率為80%,而且最高年份的誤差為22.80%,最低誤差為2.71%,因此灰色預(yù)測(cè)模型對(duì)于南水河年徑流量的預(yù)測(cè)結(jié)果較為理想。
對(duì)于南水河的年徑流量預(yù)測(cè),使用基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)是在Matlab軟件下進(jìn)行實(shí)驗(yàn)編程仿真的,具體參數(shù)設(shè)置如下:遺傳算法中適應(yīng)度函數(shù)選為模型輸出值與實(shí)際徑流量的誤差;個(gè)體數(shù)目為50;選擇方法采用隨機(jī)遍歷采樣方法;最大遺傳代數(shù)設(shè)為100代;代溝為0.95;使用單點(diǎn)交叉算子以及離散變異算子,交叉概率以及變異概率的參數(shù)分別為0.7和0.001。在BP神經(jīng)網(wǎng)絡(luò)中使用3層網(wǎng)絡(luò),使用traingdm作為網(wǎng)絡(luò)的訓(xùn)練函數(shù),隱含層的激活函數(shù)選擇S型的正切函數(shù),輸出層則選擇純線性函數(shù)作為激活函數(shù),迭代次數(shù)為1000,徑流量預(yù)測(cè)誤差取值為0.001,學(xué)習(xí)速率則設(shè)為0.001。
圖2 灰色預(yù)測(cè)徑流量擬合值與實(shí)際值的比較
年份預(yù)測(cè)值/(108 m3)實(shí)際值/(108 m3)誤差/(108 m3)相對(duì)誤差/%201110.188.29-1.8922.80201210.5011.140.645.75201311.1111.420.312.71201411.809.961.8418.4720158.009.461.4615.43
經(jīng)過Matlab對(duì)于GA-BP神經(jīng)網(wǎng)絡(luò)對(duì)南水河年徑流量的仿真,如表3所示,可以知道GA-BP神經(jīng)網(wǎng)絡(luò)對(duì)于南水河往年徑流量的擬合誤差過大,有部分年份誤差甚至超過100%,所以此模型不適用于南水河徑流量的擬合。但是從表3可以看出,GA-BP神經(jīng)網(wǎng)絡(luò)對(duì)于未來年份徑流量的預(yù)測(cè)中,除了2012年的相對(duì)誤差為38.45%,其他年份以水文預(yù)報(bào)誤差標(biāo)準(zhǔn)來看,都是滿足水文預(yù)報(bào)的標(biāo)準(zhǔn)的,該模型對(duì)于這4年的預(yù)測(cè)都是合格的。
表3 GA-BP神經(jīng)網(wǎng)絡(luò)徑流量預(yù)測(cè)結(jié)果
在對(duì)南水河年徑流量預(yù)測(cè)的支持向量機(jī)模型中,采用1978—2010年作為模型的訓(xùn)練集,2011—2015年作為模型的測(cè)試集。支持向量機(jī)的具體參數(shù)設(shè)定為:核函數(shù)類型選擇RBF徑向基函數(shù);SVM設(shè)置類型選為epsilon-SVR回歸分析,設(shè)置損失函數(shù)p為0.01;核函數(shù)的gamma參數(shù)設(shè)為0.022 097,懲罰系數(shù)設(shè)為1024。在Matlab軟件的環(huán)境下進(jìn)行徑流量的擬合預(yù)測(cè)仿真。
圖3為支持向量機(jī)對(duì)南水河1984—2010年徑流量的擬合圖??梢娭С窒蛄繖C(jī)模型對(duì)于這27年的擬合結(jié)果非常接近,除了少量年份外,其他年份的擬合值與實(shí)際值基本重合,支持向量機(jī)對(duì)于南水河往年年徑流量擬合的平均精度為95.67%。根據(jù)水文預(yù)測(cè)的相對(duì)誤差標(biāo)準(zhǔn),其中只有1年的擬合值相對(duì)誤差大于20%,合格率達(dá)到96%,故支持向量機(jī)模型用于南水河年徑流量的擬合效果非常理想。
圖3 支持向量機(jī)徑流量輸出值與實(shí)際值的比較
表4為支持向量機(jī)徑流量預(yù)測(cè),從表中可以看出,支持向量機(jī)對(duì)2011—2015年南水河徑流量的預(yù)測(cè)值與實(shí)際值的變化趨勢(shì)基本一致,除了2011年誤差為3.05%之外,其他4年誤差低于1%,因此該支持向量機(jī)徑流量預(yù)測(cè)模型用于韶關(guān)南水河十分合適,預(yù)測(cè)效果非常理想。
表4 支持向量機(jī)徑流量預(yù)測(cè)結(jié)果
圖4為利用上述支持向量機(jī)模型對(duì)南水河未來年份進(jìn)行預(yù)測(cè),可以看出,2016—2025年南水河年徑流量的波動(dòng)趨勢(shì)基本與往年一致,其中最大年徑流量是2019年的1.197×109m3,最小年徑流量預(yù)計(jì)在2025年,大小為5.29×108m3。
圖4 2016—2025年南水河年徑流量預(yù)測(cè)
1)灰色系統(tǒng)理論、基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)3種方法對(duì)于南水河年徑流量的預(yù)測(cè)合格率都在80%以上。其中,基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)雖然預(yù)測(cè)合格率高,但是其對(duì)南水河往年徑流量的擬合度低,所以這種方法不適用于南水河徑流量的擬合?;疑到y(tǒng)理論則可以應(yīng)用于南水河年徑流量的擬合及預(yù)測(cè)中,但其擬合精度以及預(yù)測(cè)精度不是非常高。而支持向量機(jī)無論是對(duì)南水河往年年徑流量的擬合,還是對(duì)年徑流量的預(yù)測(cè),兩者的精度都非常高,所以支持向量機(jī)在南水河徑流量研究中的效果是十分理想的。
2)通過支持向量機(jī)對(duì)南水河2016—2025年的年徑流量的預(yù)測(cè)中,可以看出,該河域未來徑流量的變化趨勢(shì)基本與往年一致,說明南水河的水資源比較穩(wěn)定,對(duì)于微電網(wǎng)的建設(shè)來說,可以利用南水河水資源補(bǔ)給比較穩(wěn)定,建設(shè)合理數(shù)量以及容量的小水電站。