吉祝美,方 里,張 俊 ,馬晶晶
(江蘇省鹽城市環(huán)境監(jiān)測中心站, 江蘇 鹽城 224001)
河流監(jiān)測一般按照GB 3838—2002《地表水環(huán)境質(zhì)量標準》確定的24個基本項目進行分析,由于項目眾多,要將所有項目全面評價到位顯得比較困難。由于這些項目相互之間有一定的相關(guān)性,我們就可以運用主成分分析法選取少數(shù)幾個互相無關(guān)的指標來代替它們進行評價。主成分分析方法(PCA法)是一種將多維因子納入同一系統(tǒng)中進行定量化研究、理論比較完善的多元統(tǒng)計分析方法,在解決很多實際問題時取得了較好的效果[1-2]。
主成分分析法是一種降維處理技術(shù)的數(shù)學(xué)變換方法,其基本思想就是設(shè)法將原來眾多且具有一定相關(guān)性的指標,轉(zhuǎn)化成少數(shù)幾個綜合指標。該方法主要研究如何通過少數(shù)幾個主成分來揭示多個變量間的內(nèi)部結(jié)構(gòu),即從原始變量中導(dǎo)出少數(shù)幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān)。
進行主成分分析的主要計算步驟為[3-5]:
(1)根據(jù)研究問題選取指標與數(shù)據(jù)。
(2)進行指標數(shù)據(jù)標準化,以消除不同指標之間的量綱影響。
(3)進行指標之間的相關(guān)性判定,確定待分析的原始變量是否適合進行因子分析。
(4)確定主成分的個數(shù)m。主成分個數(shù)提取原則:①只取特征根λ>1時對應(yīng)的主成分;② 累計百分比達到80% ~85%以上的λ值對應(yīng)的主成分;③根據(jù)特征根變化的突變點決定主成分的數(shù)量。
(5)確定主成分Fi的表達式。
(6)進行主成分Fi的命名。
(7)計算綜合主成分值并進行評價與研究。
在“分析”菜單“降維”中選擇“因子分析”命令,在彈出的“因子分析”對話框(圖1)中,從對話框左側(cè)的變量列表中選擇需要分析的變量,使之添加到變量框中。
圖1 “因子分析”對話框
分別單擊“描述”、“抽取”、“旋轉(zhuǎn)”、“得分”及“選項”按鈕,彈出“因子分析:描述統(tǒng)計”對話框(圖2)、“因子分析:抽取”對話框(圖3)、“因子分析:旋轉(zhuǎn)”對話框(圖4)、“因子分析:因子得分”對話框(圖5)、“因子分析:選項”對話框(圖6),按圖中顯示勾選相關(guān)復(fù)選框后,單擊繼續(xù)按鈕返回“因子分析”對話框,在“因子分析”對話框點擊“確定”按鈕,完成計算,SPSS很快給出計算結(jié)果(圖7)。
圖2 “因子分析:描述統(tǒng)計”對話框
圖3 “因子分析:抽取”對話框
圖4 “因子分析:旋轉(zhuǎn)”對話框
圖5 “因子分析:因子得分”對話框
圖6 “因子分析:選項”對話框
圖7 主成分分析的結(jié)果
在因子分析時,SPSS會自動對原始數(shù)據(jù)進行標準化處理,所以得到的變量都是經(jīng)過標準化處理后的變量。但SPSS并不直接給出標準化后的數(shù)據(jù),如需要得到標準化數(shù)據(jù),則需調(diào)用描述過程進行計算。具體方法是在“分析”菜單“描述統(tǒng)計”中選擇“描述”命令,在彈出的“描述性”對話框(圖8)中,從對話框左側(cè)的變量列表中選擇需要分析的變量,使之添加到變量框中,并勾選“將標準化得分另存為變量”選項。點擊“確定”后得到標準化數(shù)據(jù)。
圖8 “描述性”對話框
串場河是里下河地區(qū)與沿海墾區(qū)之間縱貫?zāi)媳钡娜斯ず拥?。南起海安三里閘,經(jīng)富安、安豐、東臺、劉莊、鹽城、上岡,至阜寧入射陽河,沿途穿斗龍港、新洋港、黃沙港等,是里下河地區(qū)各河(港)排水入海的總調(diào)節(jié)河道,也是里下河地區(qū)和沿海墾區(qū)的分界線。串場河基本反映了鹽城市阜寧縣城以南大部分水域的水質(zhì)狀況,所有串場河以西的河水都要與串場河交匯,對串場河的水質(zhì)有一定影,串場河水質(zhì)對反映鹽城市水質(zhì)狀況有一定的代表性。共設(shè)8個監(jiān)測斷面開展串場河水質(zhì)例行監(jiān)測(圖9)。2011年各斷面年均值見表1。
圖9 監(jiān)測點位示意圖
將監(jiān)測數(shù)據(jù)進行標準化處理后得到的標準化數(shù)據(jù)見表2,標準化處理后各行數(shù)據(jù)平均值等于零,標準差等于1。
表1 2011年各監(jiān)測斷面8個評價指標的年均值 mg/L
表2 標準化處理后的數(shù)據(jù)
利用SPSS軟件分別對溶解氧(X1)、高錳酸鹽指數(shù)(X2)、五日生化需氧量(X3)、氨氮(X4)、石油類(X5)、揮發(fā)酚(X6)、化學(xué)需氧量(X7)、總磷(X8)8個評價指標的相關(guān)系數(shù)和特征值進行分析并根據(jù)累計貢獻率確定主成分個數(shù)。相關(guān)系數(shù)矩陣見圖10。
從相關(guān)系數(shù)矩陣中看出,大部分相關(guān)系數(shù)大于0.3,可見許多變量之間直接的相關(guān)性比較強,證明
,他們存在信息上的重疊,則這些原始變量適合進行因子分析。生化需要量與溶解氧、氨氮及總磷有很強的相關(guān)性(其中與溶解氧成負相關(guān)),相關(guān)系數(shù)分別達到 0.821、0.900 和 0.798。
根據(jù)主成分分析法中主成分個數(shù)選取原則,從圖11可見特征值λ>1時有兩個成分:λ1=3.877,λ2=2.612,此時累計百分比達到81.111%,同時通過圖12分析特征根衰減的突變,可以確定應(yīng)提取2個主成分,即k=2(SPSS軟件自動提取了2個主成分)。
圖10 相關(guān)系數(shù)矩陣
圖11 主成分方差與方差貢獻
圖12 特征根數(shù)值衰減折線
從初始因子荷載矩陣(圖13)可知,生化需要量、氨氮、總磷在第一主成分上有較高載荷,說明第一主成分基本反映了這些指標的信息,高錳酸鹽指數(shù)和石油類指標在第二主成分上有較高載荷,第二主成分主要反映的是這兩個指標的信息。
初始因子荷載矩陣由SPSS直接得到,而主成分荷載矩陣(表3)需用初始因子荷載矩陣中數(shù)據(jù)除以主成分相對應(yīng)特征值的平方根,得到2個主成分中每個指標對應(yīng)的系數(shù),才得到相應(yīng)的主成分荷載值。
表3 主成分載荷矩陣
根據(jù)以上分析結(jié)果,得知:
F1為第一主成分,代表生化需要量、氨氮、總磷三個評價指標;F2為第二主成分,代表了高錳酸鹽指數(shù)和石油類兩個評價指標。
根據(jù) λ1=3.877 ,λ2=2.612,得到相應(yīng)的主成分表達式(綜合評價函數(shù))如下:
根據(jù)綜合評價函數(shù),計算各監(jiān)測斷面和整條河流的水質(zhì)污染綜合得分,計算結(jié)果見表4,給出水質(zhì)污染程度的定量化描述,得分越大,表明污染越嚴重。
由表4可以看出,2011年串場河的水質(zhì)污染程度排序為:
黃海大橋>新興公路橋>溝墩大橋>啤酒廠>李舍>廉貽大橋>白駒鎮(zhèn)北
從第一主成分F1得分的排名來看,黃海大橋得分遠高于其他監(jiān)測斷面,說明該處生化需氧量、氨氮和總磷含量相對較高;從第二主成分F2得分排名來看,溝墩大橋和啤酒廠得分較高,說明此兩處高錳酸鹽指數(shù)和石油類污染較重。從水質(zhì)監(jiān)測數(shù)據(jù)來看,證實主成分分析結(jié)果較真實地反映了實際情況。
表4 各監(jiān)測斷面水質(zhì)綜合評價結(jié)果
借助SPSS軟件,采用主成分分析法研究串場河水質(zhì)特征,結(jié)果表明:從原始水質(zhì)數(shù)據(jù)中提取占總方差的81.111%的2個因子來反映水體的污染程度,經(jīng)過分析識別得到串場河的2個主成分因子:生化需氧量、氨氮和總磷;高錳酸鹽指數(shù)和石油類。結(jié)果與實際情況相吻合,說明主成分分析法是一種有效的水質(zhì)評價方法。同時,在水質(zhì)綜合評價時,可以根據(jù)主成分分析法得出的結(jié)論,重點考慮排名靠前的指標,刪除那些次要的指標,確定造成污染的主要成分。這樣不僅避免了人為選擇指標的隨意性,更節(jié)省了監(jiān)測所需的人力物力,使評價方法更加科學(xué)與準確。
[1]龐鴻賓.節(jié)水農(nóng)業(yè)工程技術(shù)[M].鄭州:河南科學(xué)技術(shù)出版社,2000:40-63.
[2]Huang B R,F(xiàn)ry J D.Root anatomical physiological and Morphological responses to drought stress for fescue cultivars[J].Crop Sci,1998(38):1017 - 1022.
[3]王艾,馮紹元,鄭艷.主成分分析法在溫榆河水質(zhì)評價中的初步應(yīng)用[J].北京水務(wù),2011,(2):49-52.
[4]魯斐,李磊.主成分分析法在遼河水質(zhì)評價中的應(yīng)用[J].水利科技與經(jīng)濟,2009,12(10):660 -662.
[5]方紅衛(wèi),孫世群,朱雨龍,等.主成分分析法在水質(zhì)評價中的應(yīng)用及分析[J].環(huán)境科學(xué)與管理,2009,34(12):152-154.