陳吉江,毛洪翔,李鵬程,夏國團,章衛(wèi)軍
(1. 余姚市水利局,浙江余姚 315400; 2. 宜水環(huán)境科技(上海)有限公司,上海 200125)
目前,水質(zhì)預(yù)測主要利用監(jiān)測的歷史數(shù)據(jù)作為初始序列或訓(xùn)練數(shù)據(jù),運用不同數(shù)學(xué)邏輯方法推算在各類影響因素作用下未來水質(zhì)數(shù)據(jù)的發(fā)展趨勢[1]。方法有時間序列模型[2]、灰色理論模型[3]、模糊理論模型[4]、回歸模型和動態(tài)系統(tǒng)物元模型[5],以及近年來得到應(yīng)用的人工神經(jīng)網(wǎng)絡(luò)[6]等。其中,基于自回歸的時間序列模型,理論基礎(chǔ)堅實,計算方法簡便,在水質(zhì)預(yù)測中受到普遍歡迎,得到廣泛應(yīng)用?;谧曰貧w的水質(zhì)預(yù)測方法可以有多種型式,如①單一自回歸模型, 即對時間序列建立單一自回歸方程進行預(yù)測;②小波分解+雙自回歸,即預(yù)先對時間序列進行小波分解,然后對分解所得的高、低頻序列分別建立各自的自回歸方程,最后以高、低頻自回歸方程計算值的疊加值作為預(yù)測值;③自回歸+卡爾曼濾波,即對單一自回歸模型求得的預(yù)測值,采用卡爾曼濾波進行校正,作為最終預(yù)測值;④小波分解+雙自回歸+卡爾曼濾波,即對小波分解+雙自回歸模型求得的預(yù)測值,采用卡爾曼濾波進行校正,作為最終預(yù)測值。進行水質(zhì)預(yù)測時,為了盡量提高預(yù)測的精度,要根據(jù)水庫水質(zhì)監(jiān)測資料的實際情況,合理選擇模型,這點至關(guān)重要。
一些水庫的水質(zhì)監(jiān)測數(shù)據(jù)序列在頻域上存在著明顯的高頻部分和低頻部分。自回歸預(yù)測模型的方法基于時間序列的平穩(wěn)假設(shè),對數(shù)據(jù)的平穩(wěn)性要求較高。如果把時間序列看做一種信號,通過將原始信號分離成低頻信號和高頻信號,必然可以提高時間序列的平穩(wěn)性,從而提高自回歸預(yù)測模型的精度。因此,本文選擇上述第2種模型,對其原理、步驟及預(yù)測成果(以梁輝水庫為例)進行介紹,并與單一自回歸模型預(yù)測成果進行比較。
水質(zhì)監(jiān)測數(shù)據(jù)序列的預(yù)處理采用離散小波變換,多尺度離散小波變換能將原始信號(也就是原始水質(zhì)監(jiān)測數(shù)據(jù)序列)進行不同時間分辨率上的分解。以分解層數(shù)n為例,其一般步驟為先將原始信號S分解為低頻部分c1和高頻部分d1,然后對低頻部分c1進一步分解為c2和d2,以此類推,逐層分解[7]。
多尺度小波分解與重構(gòu)一般通過Mallat算法實現(xiàn)[8]。Mallat算法理論如下:設(shè)Vj是L2(R)中的一個多分辨率的分析,φ為尺度函數(shù),ψj,n為小波函數(shù),Mallat算法的分解式如下:
(1)
式中:H為低通濾波器;G為高通濾波器。通過式(1)可以將原始信號分解為d1,d2,…,dj和cj(j為最大分解層數(shù)),cj和dj分別稱為原始信號在分辨率為2-j的低頻信號和高頻信號。
為保證水質(zhì)預(yù)測結(jié)果更加可靠,分解后還必須利用Mallat算法分別重構(gòu)分解后的高頻和低頻信號[9],使它們的樣本數(shù)與原信號S的樣本數(shù)一致,重構(gòu)描述公式如下:
(2)
式中:H*和G*分別是H和G的對偶算子。
采用上式對小波分解后的信號進行重構(gòu),且有:T=D1+D2+…+Dj+Cj
(3)
式中:D1,D2,…,Dj分別為第1層、第2層、…、第j層高頻信號重構(gòu)結(jié)果;Cj為第j層低頻信號重構(gòu)結(jié)果。
(4)
(5)
上述方法中,用最小二乘法進行參數(shù)估計非常簡單,參數(shù)估計無偏,精度高,可表示為以下方程組:
(6)
則Φ的最小二乘估計為:φ=(xTx)-1xTY
(7)
本文則以直接最小二乘估計和Akaike信息檢驗準(zhǔn)則的FPE(Final Prediction Error),AIC(Akaike Information Criterion) ,BIC 準(zhǔn)則結(jié)合具體計算成果進行討論。準(zhǔn)則的具體計算公式如下:
(8)
(9)
(10)
在各自的準(zhǔn)則函數(shù)取得最小值時的模型為適用模型。
該模型建模共分以下5個步驟: ①利用多尺度小波分析理論對水質(zhì)數(shù)據(jù)序列進行多尺度分解,得到數(shù)據(jù)序列的低頻信號和高頻信號;②通過低通濾波器和高通濾波器的對偶算子分別重構(gòu)水質(zhì)信號的低頻部分和高頻部分;③對重構(gòu)后的高頻信號(D1,D2,…)和低頻信號(Cj)自回歸模型進行定階和參數(shù)估計,并對模型的適用性進行檢驗,最后分別建立J+1個自回歸模型;④建立的自回歸模型分別預(yù)測各層重構(gòu)后的高頻信號和低頻信號;⑤疊加各層預(yù)測值得出下一個時刻的預(yù)測結(jié)果。
以梁輝水庫為例,詳細(xì)說明小波分解高、低頻雙自回歸模型進行水庫水質(zhì)預(yù)測的具體過程。梁輝水庫位于余姚市梨洲街道南廟村,流域面積35.06 km2,是一座以防洪、供水為主,結(jié)合發(fā)電、水產(chǎn)等綜合利用功能的中型水庫,總庫容3 152.3萬m3。根據(jù)浙江省水資源監(jiān)測中心余姚監(jiān)測站多年的人工水質(zhì)監(jiān)測數(shù)據(jù),影響其水質(zhì)的主要因素為pH(酸堿度)、DO(dissolved oxygen-溶解氧)、TN(total nitrogen-總氮)、TP(total phosphorus-總磷) 。
選取2005年1月至2011年12月的水質(zhì)指標(biāo)(PH,DO,TN,TP)數(shù)據(jù)用于預(yù)測模型的建立,2012年1月至2012年12月的數(shù)據(jù)用于預(yù)測結(jié)果的對比驗證。由于篇幅的限制,只以DO水質(zhì)指標(biāo)為例。
(a) 低 頻 (b) 高 頻圖1 DO 小波分解Fig.1 DO wavelet low frequency and high frequency diagram
為避免分層過多造成各層預(yù)測誤差的疊加現(xiàn)象,故對水質(zhì)監(jiān)測數(shù)據(jù)序列進行一層分解。將DO序列分解,所得到的高頻與低頻序列如圖1。
(a) 方差和FPC曲線 (b) AIC和BIC曲線 圖2 由DO高頻數(shù)據(jù)所得的方差和各準(zhǔn)則函數(shù)曲線Fig.2 Variance and standard curves given by DO high frequency data
同理可以得到低頻系列的AR模型參數(shù)。
最后將高頻低頻的系列值疊加,得到小波分解高、低頻雙自回歸模型的率定期和預(yù)測期的DO過程(圖3)。
(a) 率定期模擬 (b) 預(yù)測期模擬圖3 小波分解高、低頻雙自回歸模型模擬DO的率定期和預(yù)測期Fig.3 Simulation results of wavelet decomposition high and low frequency double autoregressive model for DO in the period of calibration and predication
由圖3可見,小波分解高、低頻雙自回歸模型得到的率定期和預(yù)測期模擬效果較好,通過計算其相對誤差的平均值可知率定期模擬的平均相對誤差為4.23%,預(yù)測期的平均相對誤差為4.34%。因此,對于DO數(shù)據(jù)系列,小波分解高、低頻雙自回歸模型得到了令人滿意的預(yù)測效果。這一模型與單一自回歸模型的應(yīng)用效果對比見表1。
表1 小波分解高、低頻雙自回歸模型與單一自回歸模型的應(yīng)用效果對比Tab.1 Comparison between application effects of the wavelet decomposition of high and
由表1可見,不管是在率定期還是在檢驗期,小波分解高、低頻雙自回歸模型的模擬精度大大優(yōu)于單一自回歸模型。
從數(shù)據(jù)序列平穩(wěn)性角度出發(fā),將多尺度小波分析理論方法與自回歸模型相結(jié)合,提出了小波分解高、低頻雙自回歸模型的方法,并將其應(yīng)用于水質(zhì)預(yù)測中。分析結(jié)果表明:
(1)小波的多層分解可以過濾出更加精細(xì)的數(shù)據(jù)信號系列,但在建立自回歸模型時,各層預(yù)測誤差會出現(xiàn)疊加現(xiàn)象,為避免多個系列誤差的疊加現(xiàn)象,層數(shù)不宜過多,一般作一層分解。
(2)不管是在率定期還是在檢驗期,小波分解高、低頻雙自回歸模型的模擬精度均大大優(yōu)于單一自回歸模型,表明了這一模型的可行性與實用價值。
(3)定期復(fù)核,動態(tài)優(yōu)化模型參數(shù)。自回歸模型基于歷史系列進行模型參數(shù)的率定,因此,隨著歷史序列數(shù)據(jù)的增加,數(shù)據(jù)樣本容量增加,自回歸模型的參數(shù)宜每隔幾年做必要的復(fù)核,以動態(tài)識別參數(shù),保證模型的適用性及精度,必要時可采用卡爾曼濾波實時校正。由于自回歸方法本身的局限性(僅僅從歷史數(shù)據(jù)推測未來的演變情況),當(dāng)出現(xiàn)突發(fā)污染事件的情況下,小波分解高、低頻雙自回歸模型的預(yù)測精度可能達不到要求,這時可以結(jié)合水庫的具體情況,采用卡爾曼濾波進行實時校正,即上面介紹的第4種模型(小波分解+雙自回歸+卡爾曼濾波)。
參 考 文 獻:
[1]黃國如, 芮孝芳. 流域降雨徑流時間序列的混沌識別及其預(yù)測研究進展[J]. 水科學(xué)進展, 2004, 15(2): 255-260. (HUANG Guo-ru, RUI Xiao-fang. Study advances in diagnosis of chaotic behaviour and its prediction for rainfall and streamflow time series in watershed[J]. Advances in Water Science, 2004, 15(2): 255-260. (in Chinese))
[2]翟顥瑾, 高晶. 長江未來水質(zhì)污染的時間序列分析[J]. 沈陽師范大學(xué)學(xué)報: 自然科學(xué)版, 2006, 24(1): 22-24. (ZHAI Hao-jin, GAO Jing. Time series analysis of future water pollution in Yangtze River[J]. Journal of Shenyang Normal University (Natural Science), 2006, 24(1): 22-24. (in Chinese))
[3]王開章, 劉福勝, 孫鳴. 灰色模型在大武水源地水質(zhì)預(yù)測中的應(yīng)用[J]. 山東農(nóng)業(yè)大學(xué)學(xué)報: 自然科學(xué)版, 2002, 33(1): 66-71. (WANG Kai-zhang, LIU Fu-sheng, SUN Ming. The application of greymodel in Dawu water quality predication water resource site[J]. Journal of Shandong Agricultural University (Natural Science), 2002, 33(1): 66-71. (in Chinese))
[4]汪萬芬, 譚綠貴, 劉曉升. 基于模糊綜合評價法的淠河水環(huán)境質(zhì)量評價[J]. 資源開發(fā)與市場, 2008, 24(5): 411- 413. (WANG Wan-fen, TAN Lü-gui, LIU Xiao-sheng. Water quality assessment of Pihe River based on fuzzy comprehensive evaluation[J]. Resource Development & Market, 2008, 24(5): 411- 413. (in Chinese))
[5]萬金保, 朱邦輝. 物元模型在廬山風(fēng)景名勝區(qū)水環(huán)境質(zhì)量評價中的應(yīng)用[J]. 安徽農(nóng)業(yè)科學(xué), 2010, 38(6): 3094-3097. (WAN Jin-bao, ZHU Bang-hui. Application of matter element model in water environment quality of Lushan scenic areas[J]. Journal of Anhui Agriculture Science, 2010, 38(6): 3094-3097. (in Chinese))
[6]田建平, 曹東衛(wèi), 李海楠. LM-BP神經(jīng)網(wǎng)絡(luò)在于橋水庫水質(zhì)預(yù)測中的應(yīng)用[J]. 水利信息化, 2010(3): 31-34. (TIAN Jian-ping, CAO Dong-wei, LI Hai-nan. Application of LM-BP neural network in water quality prediction for Yuqiao reservoir[J]. Water Resources Informatization, 2010(3): 31-34. (in Chinese))
[7]MALLAT S G. A theory for multiresolution signal decomposition: the wavelet representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1989, 11(7): 674-693.
[8]徐偉, 何金平. 基于多尺度小波分析的大壩變形自回歸預(yù)測模型[J]. 武漢大學(xué)學(xué)報: 工學(xué)版[J]. 2012, 45(3): 285-289. (XU Wei, HE Jin-ping. Forecast model of dam deformation based on multi-scale wavelet analysis and autoregressive method[J]. Engineering Journal of Wuhan University: 2012, 45(3): 285-289. (in Chinese))
[9]顧嵐, 安鴻志. 自回歸模型的精細(xì)結(jié)構(gòu)與統(tǒng)計分析[J]. 應(yīng)用數(shù)學(xué)學(xué)報, 1985, 8(4): 433- 445. (GU Lan, AN Hong-zhi. Statistical analysis of subset AR models[J]. Acta Mathematicae Applicatae Sinica, 1985, 8(4): 433- 445. (in Chinese))