【摘要】林分類型信息的提取是遙感影像分類中的熱點(diǎn)和難點(diǎn),而大興安嶺地區(qū)又是我國重點(diǎn)林區(qū)和天然林主要分布區(qū)之一,植被類型豐富,種類繁多,為林分類型精確識別帶來了很大的難度。本文采用的數(shù)據(jù)為黑龍江省大興安嶺地區(qū)塔河縣塔河林業(yè)局盤古林場的SPOT-5影像和不同時相的RADARSAT-2全極化SAR影像組合而成的11個波段為變量,其數(shù)據(jù)為像元值,目視解譯選取的訓(xùn)練樣本分為落葉松(Larixgmelinii)、樟子松(Pinussylvestrisvarmongolica)、白樺(Betulaplatyphylla)、非林地、水體,五類共計1250個象元值。旨在通過分析五類總體的統(tǒng)計學(xué)性質(zhì),為提高林分類型的分類精度提供新思路。
【關(guān)鍵詞】林分類型 判別分析 主成分分析 多維標(biāo)度法
一、多元正態(tài)分布均值向量和協(xié)方差陣的檢驗(yàn)
(一)單一總體協(xié)方差陣Σ未知時均值向量的檢驗(yàn)
選取白樺為總體
則H0:μ=μ0 H1:μ≠μ0
其中μ0為選取的為小興安地區(qū)的白樺象元均值,目的考察不同地區(qū)同一樹種象元值是否
μ0=(.244156192,.692591546,.041963218,.064344538,.1375 43219,.885053115,.090804954,.055939596,.097414752,.21043111, 43.71188295)
假設(shè)H0成立,檢驗(yàn)統(tǒng)計量為
■
利用Spss求得樣本離差陣S,并由matlab求解得:■0.1041*(250-11)/(250-1)*11)=0.01225
查表在0.01水平下F(11,239)=1.57>0.01225接受原假設(shè)μ=μ0均值檢驗(yàn)說明不同地域之間的相同樹種對應(yīng)的像元值平均偏差不大,也就是說同種樹種象元識別受地域影響不大。
(二)單一總體協(xié)方差檢驗(yàn)
檢驗(yàn)假設(shè):H0:Σ=Ip H1:Σ≠Ip
統(tǒng)計量為:■
由一中的樣本離差陣S計算-2lnλ=1.18426;
0.05水平下χ2(66)=48.305>-2lnλ,
0.005水平下χ2(66)=40.158>-2lnλ,
在給定水平下均接受原假設(shè),即說明選取的變量之間的相關(guān)程度不高,即波段之間相關(guān)性不強(qiáng)。
二、判別分析
對新樣本70個待定象元劃入五個總體進(jìn)行判別分析:
(一)馬氏距離判別法
則待判定樣本到各組的馬氏距離是:■
判別規(guī)則為:若■,則X判別為第i類。
可以設(shè)■,則:■,計算得到W后,可得:
■
以X=(0.2444 0.6791 0.0395 0.0786 0.1146 0.9252 0.0643 0.0953 0.0848 0.3309 52.0485),分別計算得到五個馬氏距離,其中■=2.005最小,故該樣品用距離判定法得到的結(jié)果為第2類,即為落葉松。
(二)貝葉斯判別法和費(fèi)希爾判別法
費(fèi)希爾判別:
在分析中使用第一個4規(guī)范判別式函數(shù)。
1通過4的顯著性為0.000,表示四個判別函數(shù)可以顯著區(qū)分各類;2通過4與3通過4的顯著性為0.00,表示除去一,二函數(shù)能將各類顯著區(qū)分;4的顯著性大于0.05,表示除了前三個函數(shù)不能區(qū)分各類。
根據(jù)標(biāo)準(zhǔn)化系數(shù)和未標(biāo)準(zhǔn)化系數(shù)來分別判別計算每個個案的判別得分。利用計算得到的每類的重心在平面上的位置,可用于距離判別。下面計算各組先驗(yàn)概率,在此選擇的是各組先驗(yàn)概率相等,進(jìn)而計算每組的分類函數(shù),用于貝葉斯判別分析。
得到最終分類結(jié)果。分類結(jié)果對66.2%的個案進(jìn)行了正確分類。分類結(jié)果精度較低,原因在于總體間的差異性較小,從專業(yè)角度分析由于樹種對不同波段的反射特性基本差別不顯著,導(dǎo)致象元值之間的差異也不顯著,這點(diǎn)在組間差異檢驗(yàn)中有所體現(xiàn)。但是就遙感分類來說,能達(dá)到期望精度要求。
三、主成分分析
(一)利用主成分分析降維去相關(guān)
本章選取了20個行業(yè)15個經(jīng)濟(jì)指標(biāo)做分析。自2011年起,統(tǒng)計口徑為年主營業(yè)務(wù)收入2000萬元及以上的工業(yè)企業(yè)。分別是:X1:流動資產(chǎn)合計,X2:應(yīng)收帳款,X3:產(chǎn)成品,X4:資產(chǎn)合計,X5:負(fù)債合計,X6:主營業(yè)務(wù)收入,X7:主營業(yè)務(wù)成本,X8:主營業(yè)務(wù)稅金及附加,X9:銷售費(fèi)用,X10:管理費(fèi)用,X11:財務(wù)費(fèi)用,X12:利息支出,X13:利潤總額,X14虧損企業(yè)虧損額,X15:應(yīng)交增值稅,單位統(tǒng)一為億元。
數(shù)據(jù)采用15個經(jīng)濟(jì)指標(biāo)對行業(yè)的發(fā)展情況進(jìn)行評判,采用主成分分析減少指標(biāo)個數(shù)。雖然變量單位相同,但是數(shù)據(jù)大小差異大,先對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。在軟件計算時spss會自動標(biāo)準(zhǔn)化,所以輸入原始數(shù)據(jù)就可以了。通過計算初始變量的相關(guān)系數(shù)矩陣表,可以看到多個變量之間的相關(guān)系數(shù)較大,且對應(yīng)的顯著性普遍偏小,說明變量之間存在顯著的相關(guān)性。特別是很多變量達(dá)到了0.8甚至0.9以上,說明其相關(guān)程度很大,因此進(jìn)行主成分分析很有必要。
通過對原始數(shù)據(jù)進(jìn)行主成分提取,可以得到主成分的特征值與各自貢獻(xiàn)率表。實(shí)際應(yīng)用中常取累計方差貢獻(xiàn)率大于等于90%),確定主成分的個數(shù)??梢钥闯?,前4個主成分的累計貢獻(xiàn)率已經(jīng)達(dá)到92.908%,因此,取前4個主成分即可滿足要求。則將維度由15降到了4。
(二)利用主成分分析進(jìn)行綜合評價
由相關(guān)系數(shù)矩陣計算特征根為及特征根對應(yīng)的特征向量,通過分析,我們以15個特征根為權(quán)計算綜合得分。進(jìn)而得到各行業(yè)綜合得分及排名,由計算結(jié)果可以看出木材加工和木、竹、藤、棕、草制品業(yè)在這幾個經(jīng)濟(jì)指標(biāo)下,綜合排名在第一,而原始數(shù)據(jù)也反映該行業(yè)存在明顯優(yōu)勢。
四、多維標(biāo)度法
為分析不同省份森林受災(zāi)水平,用多維標(biāo)度法對27個省份進(jìn)行分析,將結(jié)果呈現(xiàn)在圖上。選用:森林火災(zāi)次數(shù)(次),火場總面積(公頃),森林病蟲鼠害發(fā)生面積(萬公頃),森林病蟲鼠害防治率(%)這4個變量。利用標(biāo)準(zhǔn)化后的這四個變量計算出距離陣,用spss分析,可得到結(jié)果,即樣品間的距離陣,這里采用的是歐式距離,距離陣為歐式距離陣。輸出結(jié)果得到Y(jié)oung壓力指數(shù)為0.14486K壓力指數(shù)小于15%,RSQ為93.781%,所以認(rèn)為該模型擬合的結(jié)果還是可以接受的。
通過繪制,得到在二維平面上直觀的反應(yīng)27個省在森林災(zāi)害4個指標(biāo)體系中所處的位置。27(新疆)21(海南)距離最遠(yuǎn),從原始數(shù)據(jù)來看新疆海南森林災(zāi)害較為嚴(yán)重,特別是鼠害面積上在27個省中顯得尤為突出。而海南在林火面積上位于第一,3(內(nèi)蒙古)綜合林火面積與鼠害面積因而距離也遠(yuǎn)。17(廣西)與其他省比鼠害防治率低,19(四川)鼠害不嚴(yán)重,防治較好,但林火嚴(yán)重。綜合分析第一維橫軸主要是林火災(zāi)害水平,第二維縱軸主要是鼠害水平。得到的線性擬合圖是歐式距離模型線性擬合的散點(diǎn)圖,由散點(diǎn)圖可以看出,歐式距離(實(shí)際距離)與差異點(diǎn)(擬合距離)在y=x直線附近,這說明模型擬合的效果是比較理想的。
作者簡介:屈曉陽(1992-),女,滿族,遼寧鳳城人,遼寧大學(xué)碩士研究生在讀,應(yīng)用統(tǒng)計。