王 婷 宋紫陽 邊 疆
主成分分析法在奎河水污染分析中的應用
王 婷 宋紫陽 邊 疆
奎河發(fā)源于江蘇省徐州市西南郊的云龍湖,為徐州市內重要的景觀河道。隨著城市化進程不斷加快,日趨頻繁和劇烈的人類活動使得奎河水質污染嚴重。最近十幾年,奎河的開發(fā)與治理矛盾尖銳。因此,如何客觀而準確地找出影響奎河水質的主要因素,對于奎河規(guī)劃治理具有重要的意義。目前國內外常用于水環(huán)境評價方法有指數法、主成分分析法、模糊綜合評價法、灰色數學法、神經網絡法等,其中主成分分析法理論是比較完善的多元統(tǒng)計分析方法,在解決很多類似問題時已取得較好的效果。本文選擇使用主成分分析方法進行實證分析,找出影響奎河水質的主要因素,定量化研究奎河水環(huán)境污染問題。
主成分分析(PrincipalComponents Analysis,PCA)是研究多個定量(數值)變量間相關性的一種多元統(tǒng)計方法。它是通過研究如何通過少數幾個主分量(即原始變量的線性組合)來解釋多變量的方差—共變量結構。具體地說,就是通過相關性分析,分離出少數幾個主分量,保證它們能代表盡可能多的原始數據信息。主成分常被用來尋找判斷某種事物或現(xiàn)象的綜合性指標,并將綜合指標所蘊藏的信息適當地解釋,以便更深刻地表現(xiàn)事物內在的規(guī)律。
(1)匯總分析指標,設需要分析的河流共有n個監(jiān)測斷面,k項監(jiān)測指標,收集各斷面某個時段(年、季、月)平均監(jiān)測數據來構成原始數據矩陣為:
式中:X為各斷面監(jiān)測原始數據矩陣;xij是第i個斷面的第j項監(jiān)測數據。
為排除量綱和數量級的不同,對原始數據進行標準化處理,計算公式為:
同時,設X'為標準化矩陣,見下式:
(2)求解矩陣X'的相關系數矩陣R,并代入特征方程求解非負特征值λ(λ1>λ2>…λp>0)及對應的特征向量C1,C2,…Cp,其中Cm=(cm1,cm2,…,cmk)T且(m=1,2,…,p),并計算各分量的方差貢獻率為:
式中:at為當前r個主分量的累計方差貢獻率,若滿足時,則前r個主分量對應的監(jiān)測指標值為主成分。
(3)計算前r個主分量的主成分得分Yt,則:
(4)以各主分量方差貢獻率為權數,構造分析函數,即:
式(4)中Fi代表第i個測站點水質指標的綜合得分,綜合得分越高,表明該段河流水環(huán)境質量污染越嚴重。出現(xiàn)負值說明綜合水質情況達標,正值則超標。
(5)分析河流的污染源情況,即綜合得分高的河段污染物超標,其中累計方差貢獻率大于85%的指標為其主要污染物。
本文選取徐州市水環(huán)境監(jiān)測中心2013年奎河上五個水質監(jiān)測段的平均監(jiān)測數據,共11項監(jiān)測指標作為分析資料,見表1。
對表1中數據進行標準化處理,結果見表2。
表1 奎河2013年水質監(jiān)測均值表(單位:mg/L)
表2 標準化數據表
表3 特征值計算結果表
將表2數據導入SPSS軟件進行計算,很容易就得到了相關系數矩陣的特征值和特征向量,并計算各特征值對應主成分的方差貢獻率,如表3所示。
由表3中的結果可知,前兩個特征值對應主成分的累計方差貢獻率已經達到92.45%>85%,故它們所對應的兩個主成分已經能夠反映原始指標的絕大部分信息,可利用它們對奎河五個檢測段的水環(huán)境質量進行分析。按各主成分線性表達式中主成分特征值及對應的標準化數據,構造出兩個主成分Y1和Y2函數如下:
各主成分得分與對應的方差貢獻率乘積的總和即為綜合得分。最后計算出五個監(jiān)測段各自的主成分得分及綜合得分,得分越大,表明污染程度越嚴重,由此可對各斷面的水環(huán)境質量狀況進行排序和分級,最終結果見表4。
(1)由表4的結果可知,奎河水污染情況不均衡,五個監(jiān)測段中1、2號測段得分最低,污染程度最?。?號測段得分處于平均水平;4、5號測段綜合得分最高,說明其污染程度最高。
表4 奎河水污染分析結果表
(2)由表2數據可知,在主成分中,氨氮貢獻率為76%,總磷貢獻率達到16%,絕對值較大,對奎河水質起主導作用;其次高錳酸鹽、COD的貢獻率為7.55%,也對奎河水質產生一定的影響。由于氨氮、總磷指數代表水體富營養(yǎng)化的營養(yǎng)元素的污染狀況,因此,對于奎河的治理工作,應重點控制4、5號監(jiān)測段的氨氮、總磷類污染源。
(3)本文的分析結果與2013年徐州市環(huán)境質量報告中的結果基本一致,說明此分析方法符合奎河的實際情況。
通過本文的實證應用,在多指標綜合分析方面主成分分析法的優(yōu)勢明顯,主成分分析法能夠最大限度地減少水質監(jiān)測數據信息損失量,以主要的變量來代替原有的多維數組,大大簡化了數據結構和計算量;并能通過數值計算確定各污染物的權重系數,避免了主觀隨意性。文中的分析方法缺點在于只能對數值類指標進行分析,若能進一步改進,并編成計算軟件,則此分析方法在水環(huán)境質量管理方面會有更好的應用前景■
(作者單位:淮安市淮河水利建設工程有限公司 223400)