王同旭,王鐵,雷冠軍
(1.黑龍江大慶水文局,黑龍江大慶163316;2.中國(guó)水利水電科學(xué)研究院水資源研究所,北京100038)
模糊C均值聚類法在節(jié)水灌溉水平聚類分析中的應(yīng)用
王同旭1,王鐵1,雷冠軍2
(1.黑龍江大慶水文局,黑龍江大慶163316;2.中國(guó)水利水電科學(xué)研究院水資源研究所,北京100038)
闡述了模糊C均值聚類法對(duì)樣本進(jìn)行聚類的基本原理,對(duì)模糊C均值聚類法不能有效確定聚類數(shù)目的問(wèn)題進(jìn)行分析,提出采用動(dòng)態(tài)聚類方法計(jì)算出聚類數(shù)目的前提下對(duì)模糊C均值聚類法進(jìn)行改進(jìn)。利用改進(jìn)模糊C均值聚類法對(duì)某地區(qū)的節(jié)水灌溉水平進(jìn)行聚類分析,結(jié)果表明模糊C均值聚類法具有較高的適用性。
模糊C均值聚類;動(dòng)態(tài)聚類法;不一致系數(shù);節(jié)水灌溉指標(biāo)體系
模糊C均值聚類法是用隸屬度確定某個(gè)樣本點(diǎn)屬于某個(gè)聚類的一種聚類方法,該方法是對(duì)普通聚類法的改進(jìn),模型簡(jiǎn)單實(shí)用,能夠有效減小運(yùn)算時(shí)間。張肆紅[1]運(yùn)用模糊C均值聚類法針對(duì)現(xiàn)場(chǎng)調(diào)查的泥石流的各因素劃分泥石流溝的類別,分類結(jié)果表明泥石流溝類別的劃分與現(xiàn)場(chǎng)調(diào)查和室內(nèi)結(jié)果較為一致,說(shuō)明模糊C均值聚類法具有較好的適用性。張文[2]針對(duì)泥石流影響因素較多的問(wèn)題,運(yùn)用主成分分析法進(jìn)行降維處理,對(duì)提取出的主成分運(yùn)用模糊C均值聚類法進(jìn)行分類,分類結(jié)果與現(xiàn)場(chǎng)實(shí)際情況吻合較好。徐茵[3]針對(duì)泥石流6個(gè)常用的影響因子采用熵權(quán)法計(jì)算各因子的權(quán)重,運(yùn)用模糊C均值聚類法對(duì)烏爾德庫(kù)區(qū)的泥石流進(jìn)行聚類,實(shí)際調(diào)查發(fā)現(xiàn)實(shí)際聚類結(jié)果能夠體現(xiàn)泥石流溝的發(fā)育狀態(tài)。張曙紅[4]指出模糊C均值聚類法對(duì)于處理低維的數(shù)據(jù)具有較高的有效性,但是難以很好地處理高維的數(shù)據(jù),提出一種基于遺傳算法采樣的模糊C均值聚類法,能夠提高處理大規(guī)模數(shù)據(jù)的能力。
模糊C均值聚類算法需要預(yù)先確定被分類的元素分為幾類,從初始分類出發(fā)用迭代方法進(jìn)行修正,直到分類結(jié)果符合要求[5],具有較大的不確定性。針對(duì)模糊C均值聚類法需要人為確定出聚類數(shù)的不足,對(duì)模糊C均值聚類法改進(jìn),采用動(dòng)態(tài)聚類方法求出聚類數(shù),進(jìn)而采用模糊C均值聚類法聚類。構(gòu)建了節(jié)水灌溉水平的評(píng)價(jià)指標(biāo)體系,運(yùn)用改進(jìn)的模糊C均值聚類法聚類,聚類結(jié)果與動(dòng)態(tài)聚類法保持一致,能夠有效避免模糊C均值聚類法聚類主觀性強(qiáng)的問(wèn)題。
1.1 模型簡(jiǎn)介
給定樣本矩陣:
其中,X的每一行為一個(gè)樣品(或觀測(cè)),每一列為一個(gè)變量的n個(gè)觀測(cè)值,X是由n個(gè)對(duì)象的(x1,x2,…,xn)的p個(gè)變量的觀測(cè)值構(gòu)成的矩陣。
假定將n個(gè)對(duì)象劃分為c類(2≤c≤n),設(shè)定c個(gè)類的聚類中心V=(v1,v2,…,vc),其中vi=(vi1,vi2,…,vip),(i=1,2,…,c)。令uik表示第k個(gè)對(duì)象xk屬于第i類的隸屬度,這里能夠使得各對(duì)象與聚類中心的距離最小的分類即為最佳的聚類。定義目標(biāo)函數(shù)
其中,U=(uik)c×n為隸屬度矩陣,dik=‖xk-vi‖。顯然,J(U,V)表示了各類中對(duì)象到聚類中心的加權(quán)平方距離之和,權(quán)重是對(duì)象xk屬于第i類的隸屬度的m次方。模糊C均值聚類法的聚類準(zhǔn)則是求U,V,使J(U,V)取得最小值。
1.2 建模步驟
模糊C均值聚類法的具體步驟如下:
2)通過(guò)下式計(jì)算第l步的聚類中心V(l):
3)修正隸屬度矩陣U(l),計(jì)算目標(biāo)函數(shù)值J(l)。
4)對(duì)給定的隸屬度終止容限ξu>0,當(dāng)max時(shí),停止迭代,否則l=l+1,然后轉(zhuǎn)2,不斷迭代直到滿足迭代終止條件為止。
經(jīng)過(guò)以上步驟的迭代之后,可以求得最終的隸屬度矩陣U和聚類中心V,使得目標(biāo)函數(shù)J(U,V)的值達(dá)到最小。根據(jù)最終的隸屬度矩陣U中元素的取值可以確定所有樣品的歸屬,當(dāng)時(shí),可將樣品xk歸為第j類。
1.3 模糊C均值聚類法的改進(jìn)
模糊C均值聚類法是在已知聚類數(shù)目的前提下,根據(jù)目標(biāo)函數(shù)最小來(lái)確定最終的聚類結(jié)果,因而模糊C均值聚類法聚類數(shù)目的確定直接影響了聚類結(jié)果的優(yōu)劣。對(duì)于一系列樣本觀測(cè)值往往聚類數(shù)目的確定讓人莫衷一是,因而本文提出采用動(dòng)態(tài)聚類的方法對(duì)模糊C均值聚類法進(jìn)行改進(jìn)。
設(shè)定聚類的閾值C,采用動(dòng)態(tài)聚類法,當(dāng)一個(gè)節(jié)點(diǎn)和它的所有子節(jié)點(diǎn)的不一致系數(shù)小于C時(shí),該節(jié)點(diǎn)及其下面的所有節(jié)點(diǎn)被聚為一類,不斷調(diào)整聚類閾值,觀察聚類的個(gè)數(shù)。為了有效判定當(dāng)次聚類效果的優(yōu)劣,采用不一致系數(shù)作為衡量聚類結(jié)果優(yōu)劣的標(biāo)準(zhǔn)。不一致系數(shù)可用來(lái)確定最終的分類個(gè)數(shù),在聚類過(guò)程中,若某一次聚類所對(duì)應(yīng)的不一致系數(shù)較上次有大幅度增加,則說(shuō)明該次聚類的效果較差。
式中:ξi為第i次聚類時(shí)的不一致系數(shù);di1為第i次聚類時(shí)的聚類距離;di2為第i次聚類時(shí)所涉及的聚類距離的均值;di3為第i次聚類時(shí)所涉及的聚類距離的標(biāo)準(zhǔn)差;i=1,2,…,n-1,n為樣本的個(gè)數(shù)。
2.1 節(jié)水灌溉的內(nèi)涵
節(jié)水灌溉是根據(jù)種植作物的需水規(guī)律以及當(dāng)?shù)厮Y源的供給條件,最大限度利用當(dāng)?shù)刈匀唤邓凸喔人?,以獲取農(nóng)業(yè)的最佳綜合利用效益(包括經(jīng)濟(jì)效益、社會(huì)效益、生態(tài)環(huán)境效益等)為目標(biāo),而采取的多種措施的總稱。節(jié)水灌溉實(shí)際上是以降低灌溉用水的無(wú)效損耗量來(lái)實(shí)現(xiàn)節(jié)約水資源的目的,因此節(jié)水灌溉的技術(shù)體系就圍繞水資源的高效利用展開,具體技術(shù)貫穿于從水源到田間入水口等各輸水環(huán)節(jié)、從田間入水口到作物根系的灌水環(huán)節(jié),以及作物吸收利用根系層土壤水分的耗水環(huán)節(jié),在農(nóng)業(yè)灌水過(guò)程中,節(jié)約用水的理念無(wú)處不在。
2.2 節(jié)水灌溉指標(biāo)體系構(gòu)建
節(jié)水灌溉受到氣候、地質(zhì)等自然因素的影響,同時(shí)也受到經(jīng)濟(jì)、社會(huì)、技術(shù)等發(fā)展水平的制約,是一個(gè)復(fù)雜的多目標(biāo)、多層次的系統(tǒng)。節(jié)水灌溉水平的研究,就是對(duì)一個(gè)地區(qū)節(jié)水灌溉各指標(biāo)的研究,建立合理全面易于操作的評(píng)價(jià)指標(biāo)體系是研究節(jié)水灌溉水平的關(guān)鍵。評(píng)價(jià)指標(biāo)體系的建立有分析法、綜合法、頻度統(tǒng)計(jì)法和統(tǒng)計(jì)分析法等多種方法。
楊旭[6]將節(jié)水灌溉工程所涉及的指標(biāo)分為七大類,涉及到政策、技術(shù)、經(jīng)濟(jì)、財(cái)務(wù)、資源、環(huán)境、社會(huì)等指標(biāo),對(duì)于指標(biāo)的綜合評(píng)價(jià)提出采用加權(quán)等方法對(duì)綜合指標(biāo)進(jìn)行協(xié)調(diào)。李曉淵[7]遵照指標(biāo)設(shè)定的系統(tǒng)性、簡(jiǎn)潔性和可操作性原則,將新疆地區(qū)的節(jié)水灌溉的技術(shù)經(jīng)濟(jì)指標(biāo)評(píng)價(jià)體系分為投入產(chǎn)出、效果評(píng)價(jià)和比較效果三類指標(biāo),建立了組合賦權(quán)法的綜合評(píng)價(jià)模型,能夠有效對(duì)新疆地區(qū)的節(jié)水灌溉水平進(jìn)行評(píng)價(jià)。張晶楠[8]在分析了節(jié)水灌溉的影響因素的基礎(chǔ)上,選取了工程節(jié)水、農(nóng)業(yè)節(jié)水和管理節(jié)水所對(duì)應(yīng)的34項(xiàng)指標(biāo)構(gòu)建節(jié)水灌溉評(píng)價(jià)指標(biāo)體系,采用模糊綜合評(píng)價(jià)法對(duì)四川省的節(jié)水灌溉水平進(jìn)行評(píng)價(jià)。王慧[9]針對(duì)西北缺水地區(qū),從社會(huì)、經(jīng)濟(jì)、資源環(huán)境效益三方面共提出25個(gè)評(píng)價(jià)指標(biāo),利用改進(jìn)的集對(duì)分析法對(duì)灌區(qū)節(jié)水改造效益進(jìn)行綜合評(píng)價(jià)。張占龐[10]對(duì)生態(tài)灌區(qū)的水資源可持續(xù)利用建立了水資源發(fā)展程度、水資源與社會(huì)、經(jīng)濟(jì)、生態(tài)環(huán)境的協(xié)調(diào)程度的指標(biāo),并簡(jiǎn)要論述了生態(tài)灌區(qū)的綜合評(píng)價(jià)方法。韓振中[11]等提出大型灌區(qū)節(jié)水改造評(píng)價(jià)指標(biāo)體系,包括水土資源指標(biāo)、生態(tài)環(huán)境指標(biāo)、社會(huì)經(jīng)濟(jì)指標(biāo)等7個(gè)準(zhǔn)則層,采用線性加權(quán)法進(jìn)行灌區(qū)評(píng)估。高峰[12]等構(gòu)建了涵蓋技術(shù)、經(jīng)濟(jì)、資源、財(cái)務(wù)、政策、環(huán)境、社會(huì)評(píng)價(jià)7個(gè)準(zhǔn)則、41個(gè)具體指標(biāo)的節(jié)水灌溉工程評(píng)價(jià)指標(biāo)體系。劉從柱[13]依據(jù)關(guān)中灌區(qū)節(jié)水改造項(xiàng)目,建立包括項(xiàng)目效益、項(xiàng)目可持續(xù)性、建設(shè)過(guò)程、項(xiàng)目管理的灌區(qū)節(jié)水改造項(xiàng)目評(píng)價(jià)指標(biāo)體系,結(jié)合模糊綜合評(píng)判法將其應(yīng)用于關(guān)中灌區(qū),該研究構(gòu)建了較為完善的指標(biāo)體系,但是評(píng)價(jià)方法和權(quán)重確定的比較簡(jiǎn)單。
節(jié)水灌溉指標(biāo)體系的建立,應(yīng)該能夠科學(xué)合理地反映節(jié)水灌溉的特征和優(yōu)勢(shì),應(yīng)遵循下列基本原則:經(jīng)濟(jì)合理性原則,技術(shù)先進(jìn)性原則,方案可行性原則,生態(tài)協(xié)調(diào)性原則、可持續(xù)性發(fā)展原則。基于目前極端氣候現(xiàn)象嚴(yán)重,將節(jié)水灌溉水平的指標(biāo)定為社會(huì)效應(yīng)、經(jīng)濟(jì)效應(yīng)、環(huán)境效應(yīng),構(gòu)成節(jié)水灌溉水平評(píng)價(jià)的指標(biāo)體系,見(jiàn)表1。
我國(guó)是農(nóng)業(yè)大國(guó)兼灌溉大國(guó),灌區(qū)在我國(guó)社會(huì)經(jīng)濟(jì)發(fā)展中的地位舉足輕重,合理高效地利用灌區(qū)水資源,是灌區(qū)生態(tài)環(huán)境保護(hù)的重要保障。為緩解我國(guó)灌區(qū)水資源短缺、水資源利用效率低下、生態(tài)環(huán)境惡化等問(wèn)題,大規(guī)模的節(jié)水型農(nóng)業(yè)建設(shè)應(yīng)運(yùn)而生。
由于評(píng)價(jià)區(qū)域多樣性,其自然生態(tài)環(huán)境各有不同,區(qū)域在發(fā)展節(jié)水灌溉過(guò)程中側(cè)重于對(duì)灌區(qū)的節(jié)水灌溉水平進(jìn)行綜合評(píng)價(jià),然而根據(jù)灌區(qū)的實(shí)際情況進(jìn)行綜合聚類,為灌區(qū)的綜合管理提供分區(qū)管理、分區(qū)整治的依據(jù)是必需的。建立具有實(shí)際操作意義的全面反映我國(guó)界水灌溉狀況與進(jìn)程,以及社會(huì)、經(jīng)濟(jì)和生態(tài)環(huán)境之間相互協(xié)調(diào)程度的指標(biāo)體系及評(píng)價(jià)方法,從而科學(xué)地指導(dǎo)節(jié)水灌溉的良性健康發(fā)展。
表1 節(jié)水灌溉水平評(píng)價(jià)指標(biāo)體系
為了研究河北某地區(qū)的節(jié)水灌溉水平,選取能夠找到的相關(guān)指標(biāo)作為該地區(qū)節(jié)水灌溉水平的評(píng)價(jià)指標(biāo),見(jiàn)表2。
表2 待評(píng)價(jià)地區(qū)指標(biāo)
對(duì)各待評(píng)價(jià)地區(qū)的節(jié)水灌溉指標(biāo)分別計(jì)算,依據(jù)指標(biāo)進(jìn)行聚類,選擇閾值是0.1,0.5,1.0,1.5,2.0,2.5,分別進(jìn)行動(dòng)態(tài)聚類,聚類結(jié)果見(jiàn)表3,由于在聚類數(shù)目最小且聚類效果最好的原則下,選取聚類數(shù)目為3類。
在確定聚類數(shù)目為3類的條件下,采用模糊C均值聚類法進(jìn)行聚類,見(jiàn)表4及圖1。
表3 動(dòng)態(tài)聚類表
由于各地區(qū)的指標(biāo)的量綱不同,為了消除量綱的影響,對(duì)不同地區(qū)的指標(biāo)值采取歸一化處理,如表4。
表4 各地區(qū)模糊聚類的隸屬度及聚類結(jié)果
圖1 節(jié)水灌溉水平聚類樹形圖
在采用動(dòng)態(tài)聚類法確定聚類數(shù)目的前提下,運(yùn)用C均值模糊聚類法對(duì)六個(gè)地區(qū)的節(jié)水灌溉水平進(jìn)行評(píng)價(jià),結(jié)果表明模糊C均值聚類法和動(dòng)態(tài)聚類法結(jié)果保持一致,說(shuō)明模糊C均值聚類法的正確性,同時(shí)在動(dòng)態(tài)聚類法確定聚類數(shù)目的基礎(chǔ)上運(yùn)用模糊C均值聚類法,能夠有效提高該方法的實(shí)用性。
本文在對(duì)模糊C均值聚類法的基本原理進(jìn)行闡述的基礎(chǔ)上,采用動(dòng)態(tài)聚類的不一致性系數(shù)對(duì)模糊C均值聚類法進(jìn)行改進(jìn),并對(duì)某地區(qū)的節(jié)水灌溉水平運(yùn)用改進(jìn)后的方法進(jìn)行分類,結(jié)果表明,改進(jìn)后的方法能夠有效確定聚類數(shù)目,且聚類結(jié)果與動(dòng)態(tài)聚類結(jié)果保持一致,說(shuō)明改進(jìn)后的模糊C均值聚類法具有較強(qiáng)的適用性。
[1]張肆紅,路曉光,趙偉.FCM(模糊C-均值聚類)法在石流分類中的應(yīng)用[J].福建建筑,2010(3):77—79.
[2]張文,陳劍平,秦勝伍,李明,等.基于主成分分析的FCM法在泥石流分類中的應(yīng)用[J].吉林大學(xué)學(xué)報(bào)(地球科學(xué)版),2010,40(2):368—372.
[3]徐茵.烏爾德庫(kù)區(qū)泥石流模糊C均值聚類法初步分類研究[J].水文地質(zhì)與工程地質(zhì),2014,41(2):129—133.
[4]張曙紅,孫建勛,諸克軍.基于遺傳優(yōu)化的采樣模糊C均值聚類算法[J].系統(tǒng)工程理論與實(shí)踐,2004,24(5):121—125.
[5]朱喜林,武星星,李曉梅.基于改進(jìn)型模糊聚類的模糊系統(tǒng)建模方法[J].控制與決策,2007,22(1):73—77.
[6]楊旭,曾賽星,王蔚武,張金萍.節(jié)水灌溉綜合評(píng)價(jià)指標(biāo)體系與量化方法[J].黑龍江水利科技,2005,33(4):27—28.
[7]李曉淵,朱美玲,何繼武.新疆干旱區(qū)農(nóng)業(yè)高效節(jié)水灌溉技術(shù)經(jīng)濟(jì)評(píng)價(jià)指標(biāo)體系構(gòu)建初探[J].農(nóng)村經(jīng)濟(jì)與科技,2010,21(4):62—63.
[8]張晶楠,楊路華,翟寧,樓豫紅,等.基于可變模糊集理論的區(qū)域節(jié)水灌溉發(fā)展水平評(píng)價(jià)方法[J].河北農(nóng)業(yè)大雪學(xué)報(bào),2010,33(3):111—115+119.
[9]王慧,毛曉敏,董鋒.灌區(qū)節(jié)水綜合效應(yīng)評(píng)價(jià)的集對(duì)分析模型比較[J].節(jié)水灌溉,2010(2):48—51.
[10]張占龐,韓熙.生態(tài)灌區(qū)基本內(nèi)涵及評(píng)價(jià)指標(biāo)體系評(píng)價(jià)方法研究[J].安徽農(nóng)業(yè)科學(xué),2009,37(18):8621—8623.
[11]韓振中,門冠宇,劉云波,等.大型灌區(qū)續(xù)建配套與節(jié)水改造評(píng)價(jià)指標(biāo)體系的研究[J].中國(guó)農(nóng)村水利水電,2002(7):17—21.
[12]高峰,雷聲隆,龐鴻賓.節(jié)水灌溉工程模糊神經(jīng)網(wǎng)絡(luò)綜合評(píng)價(jià)模型[J].農(nóng)業(yè)工程學(xué)報(bào),2003,19(4):84—87.
[13]劉從柱.大型灌區(qū)節(jié)水改造項(xiàng)目后評(píng)估指標(biāo)體系與評(píng)估方法研究[D].西安理工大學(xué),2007.
S274
A
1002-0624(2017)07-0055-04
2016-09-24