康 明,王麗萍,趙璧奎,張驗(yàn)科
(華北電力大學(xué)可再生能源學(xué)院,北京 102206)
水質(zhì)評價(jià)是水資源管理與決策的重要組成部分,是根據(jù)已有的水質(zhì)標(biāo)準(zhǔn)建立水質(zhì)分類的模型,然后依據(jù)該模型對參與評價(jià)的樣本進(jìn)行水質(zhì)級別的評價(jià)。最基本的評價(jià)方法就是,直接對照標(biāo)準(zhǔn)規(guī)定的各個(gè)項(xiàng)目單因子的評價(jià)。但在實(shí)際應(yīng)用中,僅僅基于單項(xiàng)影響指標(biāo)的水質(zhì)評價(jià)結(jié)果難免會不相容,因此直接對照水質(zhì)評價(jià)標(biāo)準(zhǔn)表評價(jià)水體質(zhì)量缺乏必要的實(shí)用性。一般情況下,水質(zhì)的評價(jià)總是基于多種指標(biāo)的綜合評定,因而要進(jìn)行客觀嚴(yán)謹(jǐn)?shù)脑u價(jià)就必須建立起與之對應(yīng)的多因素 (多指標(biāo))評價(jià)模型。文獻(xiàn)[1]建立了一個(gè)基于可拓神經(jīng)網(wǎng)絡(luò)的水質(zhì)評價(jià)模型;文獻(xiàn)[2]將模糊數(shù)學(xué)的原理應(yīng)用到水質(zhì)評價(jià)中;文獻(xiàn)[3]提出了一個(gè)基于組合權(quán)重的水質(zhì)評價(jià)模型;文獻(xiàn)[4]建立了一個(gè)基于投影尋蹤新算法的評價(jià)模型。這些模型都存在某些局限性。例如,在計(jì)算過程中需人為地給定參數(shù),或者對于同一等級內(nèi)的水質(zhì)無法給出量化的比較,以及對影響因素的權(quán)重沒有主客觀綜合考慮。
因此,本文引入投影尋蹤動態(tài)聚類的方法,提出相應(yīng)的水庫水質(zhì)評價(jià)模型,一方面,可以避免在水質(zhì)評價(jià)模型運(yùn)算過程中需要人為給定的參數(shù)的缺點(diǎn);另一方面,可以根據(jù)決策者的側(cè)重的因素進(jìn)行分類并直接輸出水質(zhì)綜合評價(jià)分級標(biāo)準(zhǔn)值。
投影尋蹤就是將高維數(shù)據(jù)向低維空間投影,通過低維空間研究高維數(shù)據(jù)的結(jié)構(gòu)或特征。投影尋蹤聚類是根據(jù)投影尋蹤原理形成的一種聚類方法,在水質(zhì)評價(jià)、洪水分類、關(guān)鍵因子識別等涉及多因素影響的問題研究中廣泛應(yīng)用。然而,在實(shí)際聚類分析中,投影尋蹤聚類方法尚存在著不足之處,主要體現(xiàn)在兩個(gè)方面:一是在求解基于投影尋蹤聚類方法模型過程中,涉及到的唯一參數(shù)——密度窗寬取值目前還必須依靠經(jīng)驗(yàn)或試算來確定,缺乏相應(yīng)的理論依據(jù);另外,此類模型的運(yùn)算結(jié)果需要利用其他方法進(jìn)行分類處理,才能得到最終的聚類結(jié)果。
針對投影尋蹤聚類的上述問題,引入動態(tài)聚類方法[5]。動態(tài)聚類法可以將樣本數(shù)據(jù)點(diǎn)聚成既定數(shù)量的類,使得每一類的元素都是聚合的,并且類與類之間能夠很好地區(qū)分開來。投影尋蹤動態(tài)聚類法,通常先是利用投影降維技術(shù)將高維數(shù)據(jù)投影到低維空間 (本文實(shí)際應(yīng)用為線性一維),然后利用動態(tài)聚類法對投影到低維空間的投影特征值進(jìn)行聚類分析。
首先,通過生成水質(zhì)樣本構(gòu)造出模型所需的投影數(shù)據(jù)。按照水質(zhì)標(biāo)準(zhǔn),在各水質(zhì)級別范圍內(nèi)隨機(jī)產(chǎn)生一定量的樣本數(shù)據(jù);將水質(zhì)樣本的影響指標(biāo)記為 Xij(i=1,2,…,n; j=1,2,…,m; n 為樣本個(gè)數(shù), m為影響指標(biāo)個(gè)數(shù))。質(zhì)量標(biāo)準(zhǔn)等級分為5級,在每個(gè)等級范圍內(nèi)生成100個(gè)樣本,則樣本數(shù)n=500。為了與水庫水質(zhì)質(zhì)量標(biāo)準(zhǔn)相對應(yīng),本文規(guī)定水體受到污染的程度越嚴(yán)重,則該樣本水質(zhì)的級別值越大。將污染最嚴(yán)重的水質(zhì)級別記為Ⅴ,較嚴(yán)重的記為Ⅳ,依次類推,污染最輕的級別值記為Ⅰ。由于水質(zhì)樣本各影響指標(biāo)的量綱不盡相同或數(shù)值范圍相差較大,因此在建模之前要對各項(xiàng)指標(biāo)數(shù)據(jù)進(jìn)行無量綱化處理。對于越小越優(yōu)型指標(biāo),采用式(1);對于越大越優(yōu)型指標(biāo),采用式(2)
式中,Xjmax、Xjmin分別為第j個(gè)水質(zhì)影響指標(biāo)的樣本最大值與最小值。
所謂投影就是從不同角度觀察數(shù)據(jù),尋找能夠最大程度反映水質(zhì)樣本數(shù)據(jù)特征的最佳觀察角度,即最優(yōu)投影方向[6]。本文采用線性投影,將水質(zhì)樣本的多項(xiàng)影響指標(biāo)值投影到一維空間,得到反映該水質(zhì)樣本特征的數(shù)值,該數(shù)值被認(rèn)為是能夠反映該水質(zhì)樣本優(yōu)劣程度的量化值,在模型中用投影特征值zi來表示。設(shè)為m維單位投影方向向量,記為=(a1,a2,…,am), 則水質(zhì)樣本影響指標(biāo) xij的一維投影特征值zi可以表示為
投影指標(biāo)是樣本數(shù)據(jù)由多維向低維投影形成聚類所遵循的原則,由于聚類分析的實(shí)質(zhì)就是將待評價(jià)樣本進(jìn)行合理的分類,可以根據(jù)分類指標(biāo)來構(gòu)造投影指標(biāo)。本文應(yīng)用動態(tài)聚類方法來構(gòu)造模型的投影指標(biāo),通過求解投影指標(biāo)函數(shù),得到能夠反映水質(zhì)樣本特征的最優(yōu)投影方向,同時(shí)輸出投影特征值聚類結(jié)果,即水質(zhì)綜合評價(jià)的分級標(biāo)準(zhǔn)值。構(gòu)造投影指標(biāo)的步驟如下:
設(shè)水質(zhì)樣本投影特征值集合為 Ω={z1,z2,…,zn},任意兩個(gè)投影特征值間的距離記為s(zi,zk),即s(zi,zk)=(k=1,2,…,n)。 若將水質(zhì)樣本分為 N(N≤n)類,則第h類樣本投影特征值集合可記為θh(h=1,2,…,N), 即
式中, d(Ah-zi)=, d(At-zi)=。 其中,Ah和At分別為第h類和第t類的初始聚核 (聚類的中心點(diǎn))。式(4)表明了動態(tài)聚類方法中聚合分類的原則。依據(jù)動態(tài)聚類的算法,每一類的初始聚核會被上一次該類樣本投影特征值的均值所迭換,直至滿足結(jié)束條件,即分類結(jié)果趨于穩(wěn)定。
式中, dh()=
為達(dá)到類類樣本充分散開、類內(nèi)樣本盡量集中的聚類目的[7],根據(jù)動態(tài)聚類法構(gòu)建的投影指標(biāo)應(yīng)為
式(7)表明,各類之間分散度越大或類內(nèi)聚集程度越高,投影指標(biāo)QQ()越大。
實(shí)際應(yīng)用中,若決策者對水庫水質(zhì)的某單項(xiàng)或多項(xiàng)影響指標(biāo)存在偏好,可以通過增加模型的約束條件來實(shí)現(xiàn)。例如,在所有影響指標(biāo)中,決策者最關(guān)心的是第二項(xiàng)指標(biāo),根據(jù)投影原理,即認(rèn)為在a2方向上的投影值最大,因此可增加約束
上述優(yōu)化問題用遺傳算法求解,參閱文獻(xiàn)[8]。
2012年2月深圳市供水系統(tǒng)中5個(gè)水庫的水質(zhì)監(jiān)測結(jié)果見表1。根據(jù)深圳市水源水質(zhì)的特點(diǎn),選擇了pH、氨氮、總氮、總磷、高錳酸鹽指數(shù)等作為水源地水庫水質(zhì)影響指標(biāo)。依據(jù)水源地水質(zhì)要求,選擇GB 3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》作為評價(jià)依據(jù),結(jié)果見表2。
表1 深圳市5個(gè)供水水庫2012年2月水質(zhì)監(jiān)測結(jié)果
表2 水庫水質(zhì)評價(jià)標(biāo)準(zhǔn)
本文在每個(gè)水質(zhì)標(biāo)準(zhǔn)級別范圍內(nèi)隨機(jī)生成30個(gè)樣本,而水庫水質(zhì)評價(jià)標(biāo)準(zhǔn)分為5級,于是總共得到了150個(gè)水質(zhì)樣本。依據(jù)生成的各級樣本數(shù)據(jù)建立起深圳市5所水庫基于投影尋蹤動態(tài)聚類方法的水質(zhì)評價(jià)模型,其中n=150,m=5,N=5。
表3 水質(zhì)綜合評價(jià)分級標(biāo)準(zhǔn)值及模型評價(jià)結(jié)果
可以看出,實(shí)例中的深圳市5個(gè)水庫中有2個(gè)達(dá)到地表水Ⅱ類標(biāo)準(zhǔn),3個(gè)達(dá)到Ⅲ類標(biāo)準(zhǔn)。根據(jù)表1的監(jiān)測數(shù)據(jù),對照水庫水質(zhì)評價(jià)標(biāo)準(zhǔn),在編號為(1)的水庫中有2個(gè)指標(biāo)屬于Ⅴ級、3個(gè)指標(biāo)屬于Ⅰ級,編號為(2)的水庫中有1指標(biāo)屬于Ⅳ級、1個(gè)指標(biāo)屬于Ⅴ級、其他3個(gè)指標(biāo)都屬于Ⅰ級,編號為(4)的水庫有1指標(biāo)屬于Ⅳ級、1個(gè)指標(biāo)屬于Ⅴ級、其他3個(gè)指標(biāo)都屬于Ⅱ級。就污染程度而言,水庫(4)大于水庫(2)和(1), 而水庫(2)有 4個(gè)的指標(biāo)都要比水庫(1)大, 所以綜合評價(jià)(4)>(2)>(1), 符合表 3中評價(jià)樣本特征值的大小排序。分析比較編號(3)、(5)這兩個(gè)水庫,同樣可以得出與模型評價(jià)結(jié)果相一致的結(jié)論。由此可見,基于投影尋蹤動態(tài)聚類方法的水庫水質(zhì)評價(jià)模型計(jì)算出來的結(jié)果是較為合理的。
然而,不同地區(qū)的水庫由于自然環(huán)境及功能不同對水質(zhì)的要求不盡相同。從深圳市近兩年的水質(zhì)連續(xù)監(jiān)測數(shù)據(jù)分析,總氮及總磷指標(biāo)超標(biāo)的頻率較高,這兩項(xiàng)指標(biāo)對控制水體富營養(yǎng)化有重要的作用,因此可以假設(shè)決策者會提高這兩項(xiàng)指標(biāo)對其決策的影響力。在模型中通過增加約束的方法來考慮決策者的這種偏好: a2>aj(j=1,3,5); a4>aj(j=1,3,5)。
表4 考慮決策者偏好的模型評價(jià)結(jié)果
由表4可以看出,這一結(jié)果與不考慮決策者偏好的結(jié)果基本相同。其主要原因是:根據(jù)投影尋蹤方法的原理,最優(yōu)投影方向向量反映了各個(gè)因素的不同重要程度,而且它為單位投影方向的向量,滿足平方和為1。因而,可以將wi=(…,)作為各影響因素的權(quán)重[9]。在不考慮決策者此偏好時(shí),總磷及總氮的所占權(quán)重已經(jīng)很大,故兩次評價(jià)結(jié)果保持一致。
(1)將投影尋蹤技術(shù)和動態(tài)聚類的方法相結(jié)合,應(yīng)用于水庫水質(zhì)評價(jià)模型,既操作簡單,又增加了模型的客觀性,充分發(fā)揮了投影尋蹤技術(shù)在處理多因素綜合評價(jià)模型上的優(yōu)勢。
(2)針對可能出現(xiàn)的決策者偏好的情況,本文通過增加約束條件,使得模型能夠綜合考慮客觀權(quán)重和決策者的偏好,擴(kuò)大了模型的適用范圍。
(3)模型應(yīng)用于深圳市5個(gè)供水水庫的實(shí)際分析結(jié)果表明,基于投影尋蹤動態(tài)聚類的方法能夠合理地對水庫水質(zhì)進(jìn)行綜合評價(jià)。
[1]閆英戰(zhàn),楊勇,陳愛斌.可拓神經(jīng)網(wǎng)絡(luò)在水質(zhì)評價(jià)中的應(yīng)用[J].人民長江, 2010, 41(15):27-30.
[2]張媛,王世真,朱秀華.模糊數(shù)學(xué)用于地表水的綜合評價(jià)[J].大連鐵道學(xué)院學(xué)報(bào),2004,25(1):7-11.
[3]金菊良,黃慧梅,魏一鳴.基于組合權(quán)重的水質(zhì)評價(jià)模型[J].水力發(fā)電學(xué)報(bào), 2004, 23(3):3-19.
[4]張欣莉,丁晶,李祚泳,等.投影尋蹤新算法在水質(zhì)評價(jià)模型中的應(yīng)用[J].中國環(huán)境科學(xué), 2000, 20(2):187-189.
[5]任若恩,王惠文.多元統(tǒng)計(jì)數(shù)據(jù)分析-理論、方法、實(shí)例[M].北京:國防工業(yè)出版社,1999,76-80.
[6]倪長健,崔鵬.投影尋蹤動態(tài)聚類模型[J].系統(tǒng)工程學(xué)報(bào),2007, 22(6):634-638.
[7]倪長健,王順久,崔鵬.投影尋蹤動態(tài)聚類模型及其在地下水分類中的應(yīng)用[J].四川大學(xué)工程學(xué)報(bào):工程科學(xué)版,2006,38(6):29-33.
[8]王順久,張欣莉,倪長健,等.水資源優(yōu)化配置原理及方法[M].北京:中國水利水電出版社,2007,226-227
[9]王麗萍,葉季平,蘇學(xué)靈,等.基于可拓學(xué)理論的防洪調(diào)度方案評價(jià)研究與應(yīng)用[J].水利學(xué)報(bào), 2009, 40(12):1425-1431.