李佳遜
摘 要 隨著遙感科學的迅速發(fā)展,高光譜圖像受到人們越來越多的關注。尤其是分類問題已經(jīng)成為高光譜遙感最為重要的應用方向,具有重要的研究價值。多種圖像處理技術已經(jīng)廣泛應用于高光譜遙感圖像的分類中,并取得了一定的效果。本文通過介紹幾種主要的分類方法,加深對高光譜圖像分類方法的了解。
關鍵詞 高光譜遙感 遙感技術 圖像分類
中圖分類號:TP751. 1 文獻標識碼:A
遙感是一項重要的現(xiàn)代觀測技術,其最大的特點就是不直接接觸物體而對物體的各種性質(zhì)進行感知。遙感技術通過地面目標對不同波長電磁波的響應來獲取關于目標的信息,然后對接收到的信息進行分析,進而對所感知物體的各種性質(zhì)進行判斷和識別。它憑借著覆蓋范圍廣、得到的地物信息豐富并且實時性高等一系列傳統(tǒng)手段不具有的優(yōu)點,已經(jīng)在資源勘探、環(huán)境監(jiān)測、精細農(nóng)業(yè)、災害評估、目標識別等眾多的技術領域得到了廣泛的應用。遙感圖像分類主要有兩類分類方法:一種是非監(jiān)督分類方法,另一種是監(jiān)督分類方法。非監(jiān)督分類方法是一個聚類過程,而監(jiān)督分類則是一個學習和訓練的過程,需要一定的先驗知識。
1 K-均值
K-均值分類方法也稱為k-means算法,是一種較典型的逐點修改迭代的動態(tài)運算的聚類算法,也是一種普遍采用算法。K-means聚類的準則是使每一聚類中多模式點到該類別的中心距離的平方和最小。首先確定初始聚類點,然后把其余的待分點分到各類中,完成初始分類。初始分類完成后,重新計算各聚類中心,完成第一次迭代,依次循環(huán)迭代,直至前后兩次的聚類中心相同,循環(huán)結束。
k-means算法是一種無監(jiān)督的分類方法,該方法的不足是初始聚類中心和最佳聚類數(shù)對聚類結果影響很大。
2 支持向量積
支持向量積(SVM)主要思想是建立一個超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。同理,在多維空間假定訓練數(shù)據(jù)可以被一個超平面分開,如果這個向量集合能被超平面沒有錯誤地分開,并且離超平面最近的向量與超平面之間的距離最大,則稱這個向量集合被這個最優(yōu)超平面最大分開。
SVM作為一種高維有監(jiān)督的分類方法,它憑借著不受Hughes現(xiàn)象影響的優(yōu)勢,取得了很好的分類效果。
3 K-最鄰近結點算法
K-最鄰近結點算法,是一個理論上比較成熟的方法,也是最簡單的機器學習算法之一。該方法的思路是:如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。KNN算法中,所選擇的鄰居都是已經(jīng)正確分類的對象。該方法在定類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。
當樣本不平衡時,如一個類的樣本容量很大,而其他類樣本容量很小時,有可能導致當輸入一個新樣本時,該樣本的K個鄰居中大容量類的樣本占多數(shù)。因此可以采用權值的方法(和該樣本距離小的鄰居權值大)來改進。該方法的另一個不足之處是計算量較大,因為對每一個待分類的樣本都要計算它到全體已知樣本的距離,才能求得它的K個最近鄰點。目前常用的解決方法是事先對已知樣本點進行剪輯,事先去除對分類作用不大的樣本。該算法比較適用于樣本容量比較大的類域的自動分類,而那些樣本容量較小的類域采用這種算法比較容易產(chǎn)生誤分。
下面對K-近鄰算法描述:
輸入:訓練數(shù)據(jù)集,其中是第個樣本的條件屬性,是類別,新樣本,距離函數(shù)。
輸出:的類別。
For i = 1 to N do
計算和之間的距離;
End for
對距離排序,得到;
選擇前個樣本:;
統(tǒng)計中每個類別出現(xiàn)的次數(shù),確定的類別。
4平行多面體分類方法
平行多面體分類法是根據(jù)設定在各軸上的值域,在多維數(shù)據(jù)特征空間中劃分出若干個互不重疊的平行多面體塊段(特征子空間)。應用這種方法進行分類需要由訓練組數(shù)據(jù)學習產(chǎn)生基本的統(tǒng)計量信息,包括每個類別的均值向量和標準向量。若有個波段,個類別,用代表第類第波段的均值,為對應的標準差,為像元在波段的像元值。
對于某一個類別,當像元滿足:
,
即該像元在所有波段的灰度值都符合上述條件,就把像元歸入第列,即;否則不能歸入已知類別,即。式中為人為規(guī)定的閾值,相當于有概率分布觸發(fā),采用幾個標準差作為可信的分類邊界,越大則一個類的范圍越大。
這種方法比較簡單,計算速度比較快。主要問題是按照各個波段的均值為標準差劃分的平行多面體與實際地物類別數(shù)據(jù)點分布的點群形態(tài)不一致,也就造成兩類的互相重疊,混淆不清的情況。
5結論
本文針對高光譜圖像,介紹了四種常見的分類方法,并分析了它們的特點以及實現(xiàn)算法,對高光譜圖像的分類有一定的研究意義。
參考文獻
[1] 胡高翔,韓孜. 基于K均值的遙感圖像自動識別分類[J].武漢理工大學學報(信息與管理工程版),2005.
[2] 譚琨,杜培軍.基于支持向量機的高光譜遙感圖像分類[J].紅外與毫米波學報, 2008,27(2):123-128.
[3] 趙振凱.結合近鄰選擇的高光譜圖像分類算法研究[D].南京師范大學,2016.
[4] 劉紅巖,陳劍,陳國青.數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J].清華大學學報自然科學版,2002, 42(6):727-730.