黃繼文 ,陳華偉 ,郭旭維
(1.山東省水利科學(xué)研究院,山東 濟南 250014;2.山東省水利廳,山東 濟南 250014)
統(tǒng)計分析技術(shù)中的數(shù)據(jù)挖掘模型有相關(guān)分析、回歸分析、差異分析、聚類分析、時間序列分析等方法。本文主要采用K-均值聚類模型和差分自回歸移動平均時間序列模型(ARIMA)進行數(shù)據(jù)的統(tǒng)計分析、預(yù)測。
K-均值算法流程如下:
1)給定大小為n的數(shù)據(jù)集,令I(lǐng)=1,選取k個初始聚類中心 Zj(I),j=1,2,…,k;
2)計算每個數(shù)據(jù)對象與聚類中心的距離D(xi,Zj(I)),i=1,2,…,n,j=1,2,…,k,如果滿足
則 xi∈Wj;
3)令I(lǐng)=I+1,計算k個新的聚類中心和誤差平方和準則Jc的值:
4)判斷:若 Zj(I+1)≠Zj(I), j=1,2,…,k,則I=I+1,返回 2);否則算法結(jié)束。
ARIMA模型的通用表達式為:
式中:φ1,φ2, …,φP為自回歸系數(shù);p 為回歸階次;θ1,θ2,…,θq為移動平均系數(shù);q 為移動平均階次;{εi}為白噪聲序列。若以d表示差分階次,則常略記為 ARIMA(p,d,q)。
根據(jù)《山東省統(tǒng)計年鑒》(2011年)和《山東省水資源公報 (2010年)》,計算出全省及17市2010年萬元工業(yè)增加值取水量。根據(jù)萬元工業(yè)增加值取水量將17市分成6類。經(jīng)聚類統(tǒng)計量計算結(jié)果檢驗,聚類變量在6個分類檔次中均值顯著差異,聚類結(jié)果有效。據(jù)此聚類結(jié)果,結(jié)合2015年全省萬元工業(yè)增加值下降率為25%的目標,分6個檔次初步設(shè)定各設(shè)區(qū)的市萬元工業(yè)增加值取水量下降率,詳見表1。
1)定額法預(yù)測。根據(jù)《山東省國民經(jīng)濟和社會發(fā)展第十二個五年規(guī)劃綱要(2011—2015年)》以及全省各地級市國民經(jīng)濟和社會發(fā)展 “十二五”規(guī)劃提出的經(jīng)濟社會發(fā)展指標,綜合確定各地級市工業(yè)增長率,預(yù)測2015年工業(yè)增加值。根據(jù)初步設(shè)定的萬元工業(yè)增加值取水量下降率,推求2015年萬元工業(yè)增加值取水量,進行全省及各地級市2015年工業(yè)需水量預(yù)測。經(jīng)預(yù)測,到2015年,全省工業(yè)增加值達到29 625億元,2011—2015年年均增長率9.5%。按照2015年全省萬元工業(yè)增加值取水量下降到10.67萬m3的目標,到2015年,全省工業(yè)需水量將達到316 099萬m3。
表1 山東省2010年萬元工業(yè)增加值取水量聚類結(jié)果
2)ARIMA模型預(yù)測。采用預(yù)測精度較高的ARIMA模型對非平穩(wěn)序列進行差分處理,預(yù)測2015年工業(yè)需水量,進而預(yù)測2015年全省17個設(shè)區(qū)的市工業(yè)用水效率,詳見表2。
表2 ARIMA模型預(yù)測2015年全省工業(yè)需水量及用水效率
從表2可知,到2015年,全省工業(yè)需水量將達到年32.39億m3。結(jié)合全省工業(yè)增加值預(yù)測結(jié)果,可以推求出2015年萬元工業(yè)增加值取水量為10.93 m3,略大于10.67 m3。因此,隨著全省不斷推進節(jié)水型社會建設(shè)工作,到2015年,全省基本能實現(xiàn)2015年萬元工業(yè)增加值取水量較2010年下降25%的目標。
根據(jù)聚類結(jié)果及2015年需水預(yù)測結(jié)果,同時參考各市2010—2012年萬元工業(yè)增加值取水量下降率情況,調(diào)整全省17個設(shè)區(qū)市萬元工業(yè)增加值下降幅度初步方案,見表3。經(jīng)校核計算,將全省萬元工業(yè)增加值下降率為25%的指標在全省范圍內(nèi)進行分解后,17個設(shè)區(qū)的市工業(yè)需水量與全省工業(yè)需水量基本協(xié)調(diào)一致。
表3 調(diào)整后全省及17市萬元工業(yè)增加值取水量分解成果表
實踐證明,選用統(tǒng)計學(xué)模型算法,從大量的水資源及其相關(guān)數(shù)據(jù)中提取有用的信息,能夠為解決水資源管理領(lǐng)域的突出問題提供新的分析方法和科學(xué)的決策支持。