王 敬,宋明忠,韓 忠,曲興玥,劉海松,叢培章
(1.山東省第六地質(zhì)礦產(chǎn)勘查院,山東威海264200;2.山東科技大學(xué)地球科學(xué)與工程學(xué)院,山東青島266590;3.青島地質(zhì)工程勘察院,山東青島266590;4.山東省地礦局城市地質(zhì)與地下空間資源重點(diǎn)實(shí)驗(yàn)室,山東青島266590;5.招金礦業(yè)股份有限公司,山東招遠(yuǎn)265400)
水質(zhì)是反映流域水環(huán)境的重要指標(biāo),有效識(shí)別流域豐、枯水期水質(zhì),對(duì)于合理開發(fā)利用保護(hù)水資源,評(píng)定水體的利用價(jià)值具有重要指導(dǎo)意義[1]。近年來,學(xué)者先后提出系統(tǒng)聚類分析法[2]、層次分析法[3]、人工神經(jīng)網(wǎng)絡(luò)法[4]、灰色系統(tǒng)評(píng)價(jià)法[5]等流域水質(zhì)識(shí)別方法。這些研究成果對(duì)于指導(dǎo)地下水合理利用,保護(hù)劃分水源地發(fā)揮了重要的作用。但是,由于豐水期與枯水期水質(zhì)受區(qū)域氣候、水文特征等多種指標(biāo)影響,評(píng)價(jià)過程中存在多種不確定性因素,使得上述方法存在一定的局限性。因此,選取合理的模型識(shí)別流域豐、枯水期水質(zhì)一直是廣大學(xué)者探索的課題。
本文結(jié)合山東省濰坊市昌邑水源地實(shí)例,基于SPSS因子分析,確定水源地地下水豐、枯水期水質(zhì)識(shí)別主控因素,并通過方差分析計(jì)算各主控因素影響權(quán)重,進(jìn)而采用距離判別模型對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行識(shí)別、回判。實(shí)例證明,因子分析、方差分析及距離判別模型相耦合的豐、枯水期水質(zhì)識(shí)別方式較好地克服了神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法中網(wǎng)絡(luò)結(jié)構(gòu)難于確定、收斂速度慢、局部極小值、過學(xué)習(xí)與欠學(xué)習(xí)以及訓(xùn)練時(shí)需要大量數(shù)據(jù)樣本等不足,具有一定的借鑒意義。
圖1 成分旋轉(zhuǎn)
通過Matlab提供的anova2函數(shù)實(shí)現(xiàn)雙因素方差分析[8],得到水源地地下水豐、枯水期水質(zhì)與各主控因素方差分析、描述統(tǒng)計(jì)量分別見表1、2。得到各主控因素估算邊際均值、方差分析殘差分別見圖3、4。
表1 方差分析
表2 描述性統(tǒng)計(jì)量
圖2 水質(zhì)主控因素專題
圖3 主控因素估算邊際均值
表3 主控因素影響權(quán)重
依據(jù)距離判別分析的算法[9],在Matlab平臺(tái)上編寫源程序代碼,將通過因子分析得到的豐、枯水期訓(xùn)練樣本中與第一主因子密切相關(guān)的水質(zhì)指標(biāo)數(shù)據(jù)及其所占權(quán)重作為樣本數(shù)據(jù)分別輸入Matlab,分別得到2類訓(xùn)練樣本自身間的歐式距離、絕對(duì)距離、馬氏距離矩陣Ra和Rb,將矩陣Ra、Rb輸入Matlab,利用sqrt、mahal函數(shù)求出2類訓(xùn)練樣本總體之間的馬氏距離矩陣Rc,即
以豐、枯水期2類水質(zhì)作為2個(gè)不同的總體,并假設(shè)2個(gè)總體的協(xié)方差矩陣相等,對(duì)8個(gè)未知測(cè)試樣本數(shù)據(jù)進(jìn)行學(xué)習(xí),依據(jù)本文提出的距離判別分析模型,基于Matlab軟件編寫程序進(jìn)行建模。
新建函數(shù)function[W,d,r1,r2,alpha,r]=f(X1,X2,X)。其中,W是判別系數(shù)矩陣;d是馬氏距離;r1是對(duì)X1的回判結(jié)果;r2是對(duì)X2的回判結(jié)果;alpha是誤判率;r是對(duì)X的判別結(jié)果。
圖4 方差分析殘差
依據(jù)Matlab輸出結(jié)果:W1=-0.008 1、W2=0.049 6、W3=0.242 0、W4=1.386 0;d=1.692 0;r1=2 212 121 111;r2=2 222 222 222;alpha=0.200 0;r=11 211 112。從結(jié)果中可以看出,W(x)=-0.008 1x1+0.049 6x2+0.242 0x3+1.386 0,測(cè)試樣本中,1、2、4、5、6、7樣本為豐水期水樣,3、8樣本為枯水期水樣。
通過對(duì)昌邑水源地豐、枯水期地下水質(zhì)研究,依據(jù)MATLAB編程,建立了水質(zhì)判別模型,并通過實(shí)際對(duì)比驗(yàn)證了模型的準(zhǔn)確性,進(jìn)而對(duì)研究區(qū)內(nèi)8個(gè)未知水樣進(jìn)行預(yù)測(cè),識(shí)別流域豐、枯水期水質(zhì),實(shí)現(xiàn)了對(duì)地下水的合理開發(fā)利用。
本文借助SPSS因子分析,對(duì)豐、枯水期化學(xué)指標(biāo)數(shù)據(jù)進(jìn)行降維,提取2類訓(xùn)練樣本數(shù)據(jù)主因子,有效消除了水質(zhì)識(shí)別指標(biāo)間的相互影響;基于方差分析確定主因子對(duì)水質(zhì)識(shí)別的影響權(quán)重,避免了因素間的交互作用;采用Matlab編程進(jìn)行距離判別分析,計(jì)算簡(jiǎn)便、準(zhǔn)確率高。
基于Matlab編程及SPSS軟件,依據(jù)地下水化學(xué)組分?jǐn)?shù)據(jù),將三者的優(yōu)勢(shì)有效結(jié)合,在因子分析的基礎(chǔ)上,借助方差分析確定各主控因素影響權(quán)重,進(jìn)而采用距離判別模型進(jìn)行豐、枯水期水質(zhì)識(shí)別,并通過回代結(jié)果確定模型誤判率。實(shí)例分析表明,將因子分析及方差分析引入距離判別模型處理中,并將三者應(yīng)用到昌邑水源地地下水豐、枯水期水質(zhì)判別中是可行的,水質(zhì)識(shí)別率較高,為合理開發(fā)利用保護(hù)水資源,評(píng)定水體的利用價(jià)值提供理論基礎(chǔ)。