• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種高光譜圖像的半監(jiān)督分類(lèi)方法

      2018-03-07 06:44:45李彩虹趙祎霏
      測(cè)繪通報(bào) 2018年2期
      關(guān)鍵詞:光譜聚類(lèi)距離

      李彩虹,趙祎霏

      (1. 蘭州大學(xué)信息科學(xué)與工程學(xué)院,甘肅 蘭州 730000; 2. 蘭州大學(xué)資源與環(huán)境學(xué)院, 甘肅 蘭州 730000)

      高光譜技術(shù)將圖像和光譜相結(jié)合,可以更清晰、多層次地表達(dá)地物特征。高光譜遙感技術(shù)在海洋監(jiān)測(cè)、精細(xì)農(nóng)業(yè)、環(huán)境監(jiān)測(cè)等領(lǐng)域獲得了成功的應(yīng)用[1-3]。高光譜圖像分類(lèi)是遙感領(lǐng)域研究的重要問(wèn)題之一。針對(duì)傳統(tǒng)圖像聚類(lèi)算法多利用像元的光譜信息、較少考慮圖像的空間信息、容易受到噪聲干擾的問(wèn)題,文獻(xiàn)[4]提出了一種整合超像元分割和峰值密度的高光譜圖像聚類(lèi)算法。楊凱歌等[5]提出了一個(gè)優(yōu)化子空間SVM集成的高光譜圖像分類(lèi)方法,該方法采用支持向量機(jī)(SVM)作為基分類(lèi)器,并通過(guò)SVM之間的模式差別對(duì)隨機(jī)子空間進(jìn)行k-means聚類(lèi),最后選擇每類(lèi)中J-M距離最大的子空間進(jìn)行集成,從而實(shí)現(xiàn)高光譜圖像分類(lèi)。針對(duì)主動(dòng)學(xué)習(xí)算法能主動(dòng)從大量未標(biāo)記樣本中選擇最能提高分類(lèi)器性能的樣本加入訓(xùn)練集,可從小的非最優(yōu)訓(xùn)練集建立高性能的分類(lèi)器這一特點(diǎn),以及傳統(tǒng)主動(dòng)學(xué)習(xí)算法熵值裝袋查詢(xún)的多值偏置問(wèn)題,提出了改進(jìn)的均值熵值裝袋查詢(xún)算法[6]。孫樂(lè)等[7]提出一種新的兩分類(lèi)器融合的高光譜圖像空譜聯(lián)合分類(lèi)方法,即稀疏性解混和子空間多項(xiàng)式邏輯回歸分類(lèi)器融合的高光譜圖像分類(lèi)方法。通過(guò)融合高光譜遙感影像的光譜和空間結(jié)構(gòu)信息,基于主成分分析降維,文獻(xiàn)[8—9]分別提出了增量分類(lèi)算法和基于圖的半監(jiān)督分類(lèi)方法?;谙∈璞硎荆:鼵均值算法,稀疏流形學(xué)習(xí)方法和其他一些技巧,許多學(xué)者還提出了一些性能優(yōu)越的高光譜分類(lèi)方法[10-12]。然而,由于高光譜圖像具有高維數(shù)、高冗余和高噪音等特點(diǎn),如何給出好的高光譜分類(lèi)方法,依然是一個(gè)挑戰(zhàn)性的問(wèn)題。

      半監(jiān)督分類(lèi)通過(guò)標(biāo)記少量樣本,從而達(dá)到了提高精度的目的。通常采用的隨機(jī)標(biāo)注方法有時(shí)并不能真實(shí)反映類(lèi)的結(jié)構(gòu),利用基于密度的抽樣方法克服了這一缺點(diǎn)。另外,對(duì)于高光譜圖像的高維特征,采用動(dòng)態(tài)時(shí)間扭曲距離可以更好地反映出像素之間的相似性。因此,基于密度的抽樣和動(dòng)態(tài)時(shí)間扭曲距離,本文改進(jìn)了主動(dòng)學(xué)習(xí)的半監(jiān)督模糊聚類(lèi)方法。試驗(yàn)結(jié)果表明,可以得到理想的分類(lèi)效果。

      1 半監(jiān)督模糊聚類(lèi)

      1.1 基于密度的數(shù)據(jù)抽樣

      基于密度的抽樣[13-14]是根據(jù)數(shù)據(jù)的局部密度確定抽樣樣本。給定一個(gè)數(shù)據(jù)集和抽樣率,該方法可以得到一個(gè)保持原始數(shù)據(jù)分布特征的抽樣集,因此,所得到的標(biāo)簽樣本更真實(shí)地反映了原始類(lèi)結(jié)構(gòu)的情況。

      給定一個(gè)具有n個(gè)樣本點(diǎn)的d維數(shù)據(jù)集D和抽樣率σ∈[0,1],首先通過(guò)將每個(gè)屬性劃分為等長(zhǎng)的k份,進(jìn)而將樣本劃分為多個(gè)子空間。統(tǒng)計(jì)每個(gè)格中樣本點(diǎn)的個(gè)數(shù),將格中樣本點(diǎn)的個(gè)數(shù)作為格的點(diǎn)密度,每個(gè)格中的點(diǎn)有同樣的概率被抽中。

      抽樣概率函數(shù)f(i)定義為

      (1)

      式中,e∈[0,1]是一個(gè)控制抽樣的參數(shù)。e=0意味著一般的抽樣方法,本文令e=0.5。

      全部的抽樣數(shù)為

      (2)

      式中,M為劃分子空間的個(gè)數(shù)。

      總體抽樣率σ為

      (3)

      由式(1)和式(3),得到了每個(gè)子空間中的抽樣率

      (4)

      1.2 動(dòng)態(tài)時(shí)間扭曲距離

      動(dòng)態(tài)時(shí)間扭曲距離[15]最早應(yīng)用于語(yǔ)音識(shí)別問(wèn)題,進(jìn)而在時(shí)間序列的分類(lèi)中也獲得了成功的應(yīng)用。如果把高光譜圖像中每個(gè)像素點(diǎn)的光譜看作一個(gè)序列,顯然可以用動(dòng)態(tài)時(shí)間扭曲距離計(jì)算兩個(gè)像素點(diǎn)之間的相似程度。

      假設(shè)有像素點(diǎn)x=(x1,x2,…,xn)和y=(y1,y2,…,yn),xi表示像素點(diǎn)x的第i個(gè)波段的值,則x與y之間動(dòng)態(tài)時(shí)間扭曲距離的計(jì)算如下

      DTWx,y=dxi,yj+min[dxi-1,yj-1,

      dxi,yj-1,dxi-1,yj]

      (5)

      式中,dxi,yj表示歐氏距離或曼哈頓距離。本文采取的是歐氏距離。

      動(dòng)態(tài)時(shí)間扭曲距離的計(jì)算應(yīng)滿(mǎn)足以下條件:

      (1) 邊界條件:路徑起始點(diǎn)為(x1,y1),終止點(diǎn)為(xn,yn),即時(shí)間序列端點(diǎn)對(duì)齊。

      (2) 連續(xù)性:對(duì)于彎曲路徑上任意相鄰兩點(diǎn)(xi,yj)和(xs,yh),滿(mǎn)足s-i≤1,h-j≤1,即每次只能沿矩陣相鄰元素移動(dòng)。

      (3) 單調(diào)性:對(duì)于彎曲路徑上任意相鄰兩點(diǎn)(xi,yj)和(xs,yh),滿(mǎn)足s-i≥0,h-j≥0,即彎曲路徑只能沿著時(shí)間軸單向移動(dòng)。

      1.3 半監(jiān)督模糊C均值聚類(lèi)

      Pedryc[16]提出一種半監(jiān)督模糊C均值算法,通過(guò)一部分有標(biāo)簽樣本的類(lèi)別信息來(lái)引導(dǎo)無(wú)標(biāo)簽樣本點(diǎn)的最終分類(lèi),分類(lèi)信息在目標(biāo)函數(shù)的計(jì)算中同樣起到一定的作用。由于該方法可以利用有標(biāo)簽的信息提高聚類(lèi)精度,因此被進(jìn)行了多種改進(jìn)。文獻(xiàn)[11]在分析了前人工作的基礎(chǔ)上,提出了一種較簡(jiǎn)單的半監(jiān)督模糊C均值算法,改進(jìn)后的目標(biāo)函數(shù)如下

      (6)

      修改后的隸屬度公式和質(zhì)心更新公式如下

      (7)

      (8)

      聚類(lèi)中心的公式也可寫(xiě)成

      vj=1-σvXU+σvXL

      新的聚類(lèi)中心的計(jì)算包括了兩部分,由有標(biāo)簽樣本點(diǎn)計(jì)算的聚類(lèi)中心和無(wú)標(biāo)簽樣本點(diǎn)計(jì)算出的聚類(lèi)中心按照一定比例相加得到。顯然,當(dāng)σ=0時(shí),該方法退化為FCM算法。

      1.4 基于密度抽樣的半監(jiān)督模糊C均值聚類(lèi)

      由于高光譜圖像的波段可能高達(dá)220個(gè),對(duì)所有的波段進(jìn)行等長(zhǎng)劃分子空間,顯然復(fù)雜度是指數(shù)形式的。因此,首先計(jì)算每個(gè)波段的方差并進(jìn)行排序,選擇前3個(gè)方差值大的波段進(jìn)行子空間劃分。在半監(jiān)督模糊C均值聚類(lèi)中,用動(dòng)態(tài)時(shí)間扭曲距離代替原算法中的歐氏距離。

      本文所提出的算法描述如下:

      步驟1:計(jì)算所給高光譜圖像所有波段的方差,并進(jìn)行排序。

      步驟2:劃分子空間,對(duì)于給定的抽樣比例σ,通過(guò)式(4)在每個(gè)子空間進(jìn)行抽樣,得到有標(biāo)簽樣本的集合XL。

      步驟3:利用式(5)計(jì)算式(6)。

      步驟4:通過(guò)式(5)計(jì)算式(7)和式(8)并更新隸屬度和質(zhì)心。

      步驟5:當(dāng)Js-Js-1<ε(指定的閾值)時(shí),輸出隸屬度矩陣。

      2 試驗(yàn)與分析

      試驗(yàn)采用了由機(jī)載可見(jiàn)光/紅外成像光譜儀AVIRIS所采集到的高光譜Indian Pines數(shù)據(jù)集,其波長(zhǎng)范圍為0.4~2.5 μm,光譜分辨率為10 μm,數(shù)據(jù)尺寸為145×145×200,地面分辨率20 m,其分類(lèi)結(jié)果如圖1所示,包含16種地物類(lèi)型。Pavia University數(shù)據(jù)是由ROSIS傳感器于2003年采集的意大利帕維亞大學(xué)的遙感圖像。圖像包括103個(gè)光譜波段,波長(zhǎng)范圍在0.43~0.86 μm之間,空間分辨率為1.3 m,像素個(gè)數(shù)為610×340,共有9個(gè)類(lèi),其分類(lèi)結(jié)果如圖2所示。這兩幅高光譜數(shù)據(jù)集均廣泛地應(yīng)用于測(cè)試各種高光譜分類(lèi)算法。通過(guò)計(jì)算方差,取最大的3個(gè),10等分劃分空間,然后進(jìn)行密度抽樣。

      圖1 Indian Pines的分類(lèi)結(jié)果

      圖2 Pavia University的分類(lèi)結(jié)果

      分別采用OA值和Kappa系數(shù)來(lái)衡量分類(lèi)結(jié)果,顯然大的OA值和Kappa系數(shù)對(duì)應(yīng)著好的分類(lèi)結(jié)果。在抽樣比例為5%、10%和20%的情況下,將所提出的算法和其他算法,如MS、BT、MBT、nEQB[17-20]、FCM和SFCM[11]算法進(jìn)行了比較,試驗(yàn)結(jié)果表明,利用本文算法得到的分類(lèi)結(jié)果優(yōu)于其余6個(gè)算法。圖3和圖4分別給出了5種算法在16個(gè)類(lèi)上的分類(lèi)結(jié)果,7種算法的OA值與Kappa系數(shù)的比較結(jié)果。

      圖3 5種算法在Indian Pines數(shù)據(jù)集上的分類(lèi)精度比較

      圖4 7種算法在Indian Pines數(shù)據(jù)集上OA值與Kappa系數(shù)的比較

      在圖3中,SFCM算法[11]的值是在樣本抽樣率取為20%得到的精度值。從圖4可以看出,采用本文提出的算法所得到的分類(lèi)精度(OA=0.901 4和Kappa=0.883)高于其余6種算法(最高為OA=0.889 3和Kappa=0.861)。對(duì)于類(lèi)wheat,Hay-windrowed、Grass-trees和Hay-windrowed、MS和BT算法展示了其卓越的分類(lèi)能力。整體上可以得到理想的分類(lèi)效果,意味著采用密度的抽樣更能反映出原始數(shù)據(jù)的類(lèi)結(jié)構(gòu),動(dòng)態(tài)時(shí)間扭曲距離可以更好地描述高維數(shù)據(jù)的相似性。隨著標(biāo)記比例的增加,整體分類(lèi)精度展示出提高的趨勢(shì),符合半監(jiān)督分類(lèi)的思想。在標(biāo)記比例5%的情況下,分類(lèi)精度略高于FCM算法,表示有標(biāo)簽的樣本在分類(lèi)過(guò)程中起到了引導(dǎo)分類(lèi)的作用。更多的比較結(jié)果,可以參考文獻(xiàn)[7—8]給出的其他算法的分類(lèi)結(jié)果。

      由于Pavia University數(shù)據(jù)集類(lèi)結(jié)構(gòu)依然有不均衡的特點(diǎn),因此各種算法對(duì)每個(gè)類(lèi)的劃分呈現(xiàn)出了不同的結(jié)果。在圖5中可以看出,對(duì)于Painted metal sheets類(lèi),MS和BT算法都展示出了很好的分類(lèi)能力,幾乎能夠分對(duì)所有的樣本點(diǎn)。在Meadows、Gravel和Trees 3個(gè)類(lèi)的劃分中,本文的算法表現(xiàn)出優(yōu)秀的分類(lèi)能力。圖6說(shuō)明了本文所提出的算法可以得到整體最佳的分類(lèi)效果。

      圖5 5種算法在Pavia U數(shù)據(jù)集上的分類(lèi)精度比較

      圖6 7種算法在Pavia U數(shù)據(jù)集上OA值與Kappa系數(shù)的比較

      3 結(jié) 論

      針對(duì)標(biāo)記高光譜圖像樣本成本較高的問(wèn)題,本文提出了一種通過(guò)標(biāo)記少量樣本的半監(jiān)督模糊分類(lèi)算法。采用密度的標(biāo)記方法克服了隨機(jī)標(biāo)記不能反映原始數(shù)據(jù)類(lèi)結(jié)構(gòu)的缺點(diǎn),從而改善了分類(lèi)精度。動(dòng)態(tài)時(shí)間扭曲距離在一定程度上反映了兩個(gè)像素點(diǎn)波段形狀的相似性,從而受噪音點(diǎn)的影響較小。雖然試驗(yàn)結(jié)果表明了該算法在兩幅廣泛使用的高光譜圖像上取得了良好的分類(lèi)效果,然而由于高光譜數(shù)據(jù)的復(fù)雜性和多樣性,如何給出分類(lèi)精度高、速度更快的分類(lèi)算法,依然是一個(gè)十分值得研究的問(wèn)題。

      [1] 楊國(guó)鵬,余旭初,馮伍法,等.高光譜遙感技術(shù)的發(fā)展與應(yīng)用現(xiàn)狀[J].測(cè)繪通報(bào),2008(10):1-4.

      [2] 杜培軍,夏俊士,薛朝輝.高光譜遙感影像分類(lèi)研究進(jìn)展[J].遙感學(xué)報(bào),2016, 20(2): 236-256.

      [3] 張良培, 黃昕. 遙感影像信息處理技術(shù)的研究進(jìn)展[J].遙感學(xué)報(bào),2009, 13(4):559-569.

      [4] 于文博,王忠勇,李山山,等. 整合超像元分割和峰值密度的高光譜圖像聚類(lèi)[J].中國(guó)圖象圖形學(xué)報(bào),2016,21(10):1402-1410.

      [5] 楊凱歌,馮學(xué)智,肖鵬峰,等. 優(yōu)化子空間SVM集成的高光譜圖像分類(lèi)[J].遙感學(xué)報(bào),2016, 20(3):409-419.

      [6] 李寵 ,谷瓊,蔡之華,等. 改進(jìn)的主動(dòng)學(xué)習(xí)算法及在高光譜分類(lèi)中的應(yīng)用[J]. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2013, 41(S2):274-278.

      [7] 孫樂(lè),吳澤彬,馮燦, 等. 一種新的兩分類(lèi)器融合的空譜聯(lián)合高光譜分類(lèi)方法[J].電子學(xué)報(bào),2015,43(11):2210-2217.

      [8] 王俊淑,江南,張國(guó)明, 等. 融合光譜一空間信息的高光譜遙感影像增量分類(lèi)算法[J].測(cè)繪學(xué)報(bào),2015,44(9):1003-1013.

      [9] 程志會(huì),謝福鼎. 基于空間特征和紋理信息的高光譜圖像半監(jiān)督分類(lèi)[J].測(cè)繪通報(bào),2016(12):56-59.

      [10] 羅甫林.高光譜圖像稀疏流形學(xué)習(xí)方法研究[J].測(cè)繪學(xué)報(bào),2017,46(3):400.

      [11] 謝福鼎,李壯, 基于改進(jìn)的半監(jiān)督FCM 算法的高光譜遙感影像分類(lèi)[J]. 測(cè)繪通報(bào), 2016(9):60-62.

      [12] 邵遠(yuǎn)杰,吳國(guó)平,馬麗.屬類(lèi)概率距離構(gòu)圖的半監(jiān)督高光譜圖像分類(lèi)[J].測(cè)繪學(xué)報(bào),2014,43(11):1182-1189.

      [13] HUANG J B, SUN H L, KANG J M, et al. ESC: An Efficient Synchronization-based Clustering Algorithm[J]. Knowledge-based Systems, 2013, 40:111-122.

      [14] KOLLIOS G, GUNOPULOS D, KOUDAS N, et al. Efficient Biased Sampling for Approximate Clustering and Outlier Detection in Large Data Sets[J]. IEEE Transactions on Knowledge and Data Engineering, 2003, 15(5):1170-1187.

      [15] MACIEJ L. Hierarchical Clustering of Time Series Data with Parametric Derivative Dynamic Time Warping[J]. Expert Systems with Applications,2016, 62(15):116-130.

      [16] PEDRYC Z W, WALETZKY J. Fuzzy Clustering with Partial Supervision [J]. IEEE Transactions on Systems Man & Cybernetics Part B, 1997, 27(5): 787-795.

      [17] TUIA D, VOLPI M, COPA L, et al. A Survey of Active Learning Algorithms for Supervised Remote Sensing Image Classification[J]. IEEE Journal of Selected Topics in Signal Processing, 2011, 5(3): 606-617.

      [18] TONG L, KRAMER K, SAMSON S, et al. Active Learning to Recognize Multiple Types of Plankton[J]. Journal of Machine Learning Research, 2004,6(4): 478-481.

      [19] TUIA D, RATLE F, PACIFICI F, et al. Active Learning Methods for Remote Sensing Image Classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2009, 47(7): 2218-2232.

      [20] LI J, BIOUCAS J M, PLAZA A. Hyperspectral Image Segmentation Using a New Bayesian Approach with Active Learning[J]. IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(10): 3947-3960.

      猜你喜歡
      光譜聚類(lèi)距離
      基于三維Saab變換的高光譜圖像壓縮方法
      算距離
      基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
      每次失敗都會(huì)距離成功更近一步
      山東青年(2016年3期)2016-02-28 14:25:55
      基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
      星載近紅外高光譜CO2遙感進(jìn)展
      愛(ài)的距離
      母子健康(2015年1期)2015-02-28 11:21:33
      一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
      苦味酸與牛血清蛋白相互作用的光譜研究
      距離有多遠(yuǎn)
      泰来县| 达日县| 平凉市| 普兰县| 沂水县| 文水县| 阿城市| 府谷县| 宁南县| 龙海市| 宜君县| 公主岭市| 平舆县| 布拖县| 农安县| 望都县| 湄潭县| 肃北| 含山县| 太仓市| 诏安县| 巴塘县| 威远县| 苗栗市| 乌苏市| 治多县| 新乐市| 漳浦县| 光泽县| 灵山县| 六安市| 内黄县| 林州市| 扎兰屯市| 云龙县| 绥芬河市| 彭州市| 永和县| 通海县| 北票市| 大新县|