摘 要:文章采用因子分析法對全國31個(gè)省、自治區(qū)、直轄市的環(huán)境污染進(jìn)行了分析、評價(jià),并運(yùn)用統(tǒng)計(jì)軟件SPSSl8.0對數(shù)據(jù)進(jìn)行了處理、計(jì)算。通過分析表明我國目前環(huán)境污染較為嚴(yán)重,其中河北、山東、廣東、重慶幾省的綜合污染最為嚴(yán)重。文章的分析評價(jià)可以為我國的環(huán)境污染防治提供一定的數(shù)據(jù)支持。同時(shí)因子分析模型能簡化數(shù)據(jù)結(jié)構(gòu),減少信息冗余,識(shí)別環(huán)境污染的主要因素,為各地區(qū)環(huán)境整治提供了客觀、科學(xué)、準(zhǔn)確的量化指標(biāo)。
關(guān)鍵詞:因子分析 環(huán)境污染 貢獻(xiàn)率
中圖分類號(hào):F205 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-4914(2013)03-008-02
一、引言
由于人們對工業(yè)高度發(fā)達(dá)的負(fù)面影響預(yù)料不夠,預(yù)防不利,導(dǎo)致了全球性的三大危機(jī):資源短缺、環(huán)境污染、生態(tài)破壞。環(huán)境污染不僅會(huì)給生態(tài)系統(tǒng)造成直接與間接的破壞和影響,如沙漠化、森林破壞、溫室效應(yīng)、酸雨和臭氧層破壞,而且影響人類的生活質(zhì)量、身體健康和生產(chǎn)活動(dòng)。嚴(yán)重的污染事件不僅帶來健康問題,也造成社會(huì)問題。據(jù)統(tǒng)計(jì),我國2010年度環(huán)境污染治理投資總額已高達(dá)2566億元,環(huán)境保護(hù)刻不容緩。評價(jià)各地區(qū)環(huán)境污染程度以及確定污染類型,能夠?yàn)榄h(huán)境保護(hù)的科學(xué)決策提供基礎(chǔ)的數(shù)據(jù)支持。當(dāng)前,國家統(tǒng)計(jì)局提供的關(guān)于各地區(qū)環(huán)境污染程度的統(tǒng)計(jì)數(shù)據(jù)有23大類之多,且各組數(shù)據(jù)間有大量的信息交叉和冗余,很難以直觀的方式予以表達(dá)。為此,本文將因子分析模型引入到環(huán)境污染處理中,首先通過降維技術(shù)把多個(gè)相關(guān)的數(shù)據(jù)組轉(zhuǎn)換成少數(shù)主因子,簡化了數(shù)據(jù)結(jié)構(gòu);其次通過因子旋轉(zhuǎn)使主因子之間互不相關(guān),減少了信息的交叉;最后根據(jù)因子載荷矩陣分別計(jì)算各地區(qū)主因子得分情況,然后根據(jù)各因子的方差貢獻(xiàn)率,計(jì)算總因子得分。這時(shí)即可直觀地看出各個(gè)地區(qū)環(huán)境污染的主要影響因素。
二、因子分析理論
(一)因子分析概述
因子分析的最初設(shè)想的基本思想是用少數(shù)幾個(gè)潛在指標(biāo)(因子)的線性組合來表示實(shí)際存在的多個(gè)指標(biāo)。因子分析的主要應(yīng)用有兩個(gè)方面:一方面是尋求基本結(jié)構(gòu),簡化觀測系統(tǒng),即構(gòu)造一個(gè)因子模型,確定模型中的參數(shù),然后根據(jù)分析結(jié)果進(jìn)行因子解釋;另一方面是對變量或樣本進(jìn)行分類,對公共因子進(jìn)行估計(jì),并進(jìn)一步分析。因子分析的基本目的是用少數(shù)幾個(gè)隨機(jī)變量來描述多個(gè)變量間協(xié)方差關(guān)系,其基本思想是,根據(jù)相關(guān)性大小對變量分組,使組內(nèi)變量間高相關(guān)、組間變量低相關(guān),每組變量代表一個(gè)基本結(jié)構(gòu)就是因子。
(二)因子分析的數(shù)學(xué)模型
用矩陣表示:X=AF+ε且滿足:
(1)m≤p;
(2)即F與ε是不相關(guān)的;
(3)D(F)=Im即F1……Fm不相關(guān)且方差皆為1,Im表示m階單位矩陣。ε1……εm不相關(guān)且方差不同。
其中X是可觀測的p個(gè)指標(biāo)所構(gòu)成的p維隨機(jī)向量,F(xiàn)=(F1……Fm)'是不可觀測的向量,F(xiàn)稱為X的公共因子;aij成為因子載荷,是第i個(gè)因子在第j個(gè)公共因子上的負(fù)荷,它反映了第i個(gè)因子在第j個(gè)公共因子上的相對重要性,ε是特殊因子,它包含了隨機(jī)誤差。
(三)模型的統(tǒng)計(jì)意義
模型中公共因子F1……Fm是在各個(gè)原觀測變量的表達(dá)式中都共同出現(xiàn)的因子,F(xiàn)=(F1……Fm)'是對所有的Xi(i=1,2,…,p)都起作用的因子,故稱為X的公因子,且公因子是相互獨(dú)立的不可觀測的理論變量,它們的含義必須結(jié)合具體問題的實(shí)際意義而定。εi叫做特殊因子,是向量X的分量Xi(i=1,2,…,p)所特有的因子,即εi只對Xi起作用,并且各特殊因子之間以及特殊因子與所有公共因子之間都是相互獨(dú)立的。
模型中載荷矩陣A中的元素(aij)pm為因子載荷,因子載荷aij是Xi與Fi的協(xié)方差也是Xi與Fj的相關(guān)系數(shù),它表示Xi依賴Fj的程度,反映了第i個(gè)變量在第j個(gè)公共因子上的相對重要性。aij的絕對值越大,表明Xi與Fj的互相依賴的程度越大或稱公共因子Fj對于Xi的載荷量越大。為了得到因子分析結(jié)果的經(jīng)濟(jì)解釋,因子載荷矩陣A中有兩個(gè)統(tǒng)計(jì)量十分重要,它們是變量共同度和公共因子的方差貢獻(xiàn)。
因子載荷矩陣A中第i行元素之平方和記為hi2,稱為變量Xi的共同度。它是全部公共因子對Xi的方差所做出的貢獻(xiàn),反映了全部公共因子對變量Xi的影響。hi2大表明X的第i個(gè)分量Xi對于F的每一分量F1……Fm的共同依賴程度大。
將因子載荷矩陣A的第j列(j=1,2,…,m)的各元素的平方和記為gj2,我們稱其為公共因子Fj對X的方差貢獻(xiàn)。gj2就表示第j個(gè)公共因子Fj對于X的每一分量Xi(i=1,2,…,p)所提供方差的總和,它是衡量公共因子相對重要性的指標(biāo)。gj2越大,表明公共因子Fj對X的貢獻(xiàn)越大,或者說對X的影響和作用就越大。如果將因子載荷矩陣A的所有g(shù)j2(j=1,2,…,m)都計(jì)算出來,使其按照大小排序,就可以依此提煉出最有影響力的公共因子。
(四)因子分析的一般步驟
1.原始數(shù)據(jù)的標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化的目的在于消除不同變量的量綱影響,而且標(biāo)準(zhǔn)化不會(huì)改變變量的相關(guān)系數(shù)。
2.計(jì)算標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)矩陣,并求出相關(guān)系數(shù)矩陣的特征值和特征向量。
3.進(jìn)行正交變換,通過使用方差最大法。其目的是使因子載荷兩極分化,而且旋轉(zhuǎn)后的因子仍然正交。
4.確定因子個(gè)數(shù),計(jì)算因子得分,進(jìn)行統(tǒng)計(jì)分析。
三、環(huán)境污染的因子分析
(一)原始數(shù)據(jù)的選取
原始數(shù)據(jù)(2010年統(tǒng)計(jì)年鑒)為我國各省、直轄市工業(yè)和生活污染物排放量。其中:x1為生活污水排放量(萬噸),x2為生活污水中化學(xué)需氧量排放量(萬噸),x3為生活二氧化硫排放量(萬噸),x4為生活煙塵排放量(萬噸),x5為工業(yè)固體廢物排放量(噸),x6為工業(yè)廢氣排放量(億平方立米),x7為工業(yè)廢水排放量(萬噸)。
(二)因子分析的輸出結(jié)果
將上述原始數(shù)據(jù)標(biāo)準(zhǔn)化處理后,經(jīng)SPSS18.0統(tǒng)計(jì)軟件分析可以得到變量相關(guān)系數(shù)矩陣。結(jié)果表明7個(gè)變量之間的相關(guān)性很高,適合用因子分析來研究變量之間的內(nèi)部依賴關(guān)系。
因子分析的關(guān)鍵就是利用相關(guān)系數(shù)矩陣求出相應(yīng)的因子特征值和累計(jì)貢獻(xiàn)率,用SPSS18.0統(tǒng)計(jì)軟件可得到總方差解釋表。結(jié)果表明取其中3個(gè)因子已提供了原資料85.333%的信息,滿足因子選取原則:m個(gè)因子的累計(jì)貢獻(xiàn)率大于或等于85%。同時(shí)還表明旋轉(zhuǎn)前后的總累計(jì)貢獻(xiàn)率沒有發(fā)生變化,即總的信息量無損失。
因子分析的主要目的是將具有相近的因子載荷的各變量置于一個(gè)公因子之下,當(dāng)初始因子不能典型的代表變量的含義時(shí),對因子載荷矩陣采用旋轉(zhuǎn)方法,并施以25次正交旋轉(zhuǎn),使因子載荷值向兩極端發(fā)展,以便對因子的意義作出更合理的解釋。
成分矩陣和旋轉(zhuǎn)成分矩陣表明:旋轉(zhuǎn)前后因子載荷的變量結(jié)果基本一致,第一類公因子在變量x1,x2,x6,x7上的因子載荷比較大,命名為水污染因子f1,第二類公因子在x3,x4上的因子載荷比較大,命名為氣體污染因子f2,第三類公因子在x5上的因子載荷比較大,命名為固體污染因子f3。
為更好地進(jìn)行分析評價(jià),可運(yùn)用spss得出各因子在主因子上的得分系數(shù)矩陣。計(jì)算三個(gè)公因子得分函數(shù)為:
通過公因子得分表達(dá)式,可以算出公因子得分。發(fā)現(xiàn)河北、江蘇、山東、廣東幾個(gè)省在f1上的得分較大,所以可知這幾個(gè)省的水污染嚴(yán)重,應(yīng)注意加強(qiáng)對工業(yè)和生活污水的治理,使之達(dá)到國家污水排放標(biāo)準(zhǔn)。同時(shí)可以看出,河北、山西、內(nèi)蒙古、遼寧、山東幾個(gè)省的氣體污染嚴(yán)重,這是因?yàn)檫@幾個(gè)省有的省份屬于國家老工業(yè)基地,工業(yè)污染的企業(yè)多,有的企業(yè)對環(huán)境污染的處理不重視,有的省份鄉(xiāng)鎮(zhèn)企業(yè)發(fā)展迅速,由于鄉(xiāng)鎮(zhèn)企業(yè)對環(huán)境保護(hù)意識(shí)不強(qiáng),所以污染嚴(yán)重。重慶的固體污染最為嚴(yán)重說明該省在生產(chǎn)建設(shè)、日常生活和其他活動(dòng)中產(chǎn)生污染環(huán)境的固態(tài)、半固態(tài)廢棄物質(zhì)較多。從得分f可以看出河北、山東、廣東、重慶幾個(gè)省的cpufrkdT2F1TgD7gHCfIicjWN5RVVdzbhyd+bwdghUA=綜合污染嚴(yán)重。說明這幾個(gè)省的環(huán)境污染嚴(yán)重,應(yīng)采取措施治理環(huán)境污染,促進(jìn)經(jīng)濟(jì)社會(huì)和環(huán)境的和諧發(fā)展,可持續(xù)發(fā)展。
四、結(jié)束語
從以上可驗(yàn)證因子分析在我國環(huán)境污染分析中應(yīng)用的可行性,可減少甚至避免選取綜合評價(jià)指標(biāo)和權(quán)重的主觀性,不合理性。因子分析模型作為一種分析多元數(shù)據(jù)的強(qiáng)有力工具,能將復(fù)雜的數(shù)據(jù)結(jié)果化簡,信息交叉冗余減少,挖掘出直觀有用的數(shù)據(jù),在社會(huì)經(jīng)濟(jì)狀況普查,環(huán)境污染監(jiān)測,空間數(shù)據(jù)處理等方面有著廣泛的應(yīng)用。伴隨著未來信息源的飛速增多,能否從紛繁復(fù)雜的信息中快速提取有價(jià)值的信息,這將是因子分析模型與相關(guān)學(xué)科專業(yè)結(jié)合的最具生命力的生長點(diǎn),也將促使更多的專業(yè)人士拓展它的應(yīng)用范圍。
參考文獻(xiàn):
1.高惠璇.應(yīng)用多元統(tǒng)計(jì)分析[M].北京大學(xué)出版社,2004
2.黃潤龍.SPSS軟件實(shí)用教程[M].高等教育出版社,2004
3.國家統(tǒng)計(jì)局.全國統(tǒng)計(jì)年鑒2010.北京:中國統(tǒng)計(jì)出版社,2010
4.牛瑞濤.因子分析模型在環(huán)境污染專題制圖中的應(yīng)用[J].技術(shù)交流,2009(6)
5.鄧朝生,尚金城,陳鵬.我國環(huán)境污染的因子分析[J].內(nèi)蒙古環(huán)境保護(hù),2003(15)
6.吳靜,其木格,于洪文.應(yīng)用SPSS軟件包對我國化境污染的因子分析[J].內(nèi)蒙古統(tǒng)計(jì),2000(5)
7.劉旭華,王勁峰,孟斌.中國環(huán)境污染的原因分析[J].地理研究,2004(23)
8.張永生,房靖華.森林與大氣污染[J].環(huán)境科學(xué)與技術(shù),2003(4)
9.Sehmel G A.Particle and Gas Dry Deposition.Atmospheric Environment [J].1980(14)
10.K Paul Becett, P H Freer-Smith, Gail Taylor.Particulate pollution capture by urban trees: effect of species and windspeed[J].Global Change Biology,2000(6)
(作者單位:大同大學(xué)商學(xué)院 山西大同 037009)
(責(zé)編:賈偉)