趙 峰
(泰州職業(yè)技術(shù)學(xué)院 機(jī)電技術(shù)學(xué)院,江蘇 泰州 225300)
隨著互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)的量級(jí)呈指數(shù)型函數(shù)飛快增長(zhǎng),大數(shù)據(jù)已經(jīng)滲透到各個(gè)領(lǐng)域。經(jīng)過(guò)半個(gè)世紀(jì)的探索和嘗試,遙感技術(shù)已經(jīng)在實(shí)用化的方向邁出了堅(jiān)實(shí)的一步,數(shù)據(jù)獲取的渠道更加趨于多樣化,需要處理的遙感信息量也快速增加[1]。傳統(tǒng)的數(shù)據(jù)處理模式已經(jīng)無(wú)法適用于大數(shù)據(jù)的分析[2]。遙感場(chǎng)景識(shí)別是在計(jì)算機(jī)系統(tǒng)的支持下,通過(guò)對(duì)遙感場(chǎng)景中各類(lèi)地物信息的空間特征和光譜特征進(jìn)行綜合分析、提取,將特征空間劃分成互不重疊的子空間,然后將圖像中的各個(gè)像元?jiǎng)澐值礁鱾€(gè)子空間對(duì)應(yīng)的地物類(lèi)別,極大地提高了從遙感場(chǎng)景中獲取信息的速度和遙感信息自身的客觀性[3]?;诖髷?shù)據(jù)的遙感場(chǎng)景識(shí)別問(wèn)題成為遙感信息處理面臨的一個(gè)難題。
MATLAB 具有方便的數(shù)據(jù)可視化功能,可以將向量和三維的可視化、圖像處理、動(dòng)畫(huà)和表達(dá)式作圖[4-6]。Liblinear 是用于大型線性分類(lèi)的庫(kù),主要用于海量數(shù)據(jù)的分類(lèi),一般用于大規(guī)模的數(shù)據(jù)集,具有速度快,尤其是針對(duì)稀疏的特征的優(yōu)點(diǎn),但缺點(diǎn)是內(nèi)存資源消耗高。
WHU-RS19是從谷歌衛(wèi)星影像上獲取的遙感場(chǎng)景。每幅遙感場(chǎng)景的像素均為600*600,它是由機(jī)場(chǎng)、海灘、橋、商業(yè)等19 種1005 幅場(chǎng)景組成的。AID(Aerial Image Dataset)航空?qǐng)D像數(shù)據(jù)集來(lái)源于Google 地球圖像中采集的樣本圖像,由機(jī)場(chǎng)、荒地、棒球場(chǎng)等30種10000幅場(chǎng)景組成。
LBP(Local Binary Pattern),局部二值模式,是一種用來(lái)描述圖像局部特征的算子,優(yōu)點(diǎn)是具備灰度不變性和旋轉(zhuǎn)不變性。由于LBP 特征計(jì)算簡(jiǎn)單、效果較好,因此LBP 特征在計(jì)算機(jī)視覺(jué)的諸多領(lǐng)域都得到了廣泛的應(yīng)用[7]。
SIFT(Scale Invariant Feature Transform),尺度不變特征變換,對(duì)旋轉(zhuǎn)、尺度縮放、亮度變化等特征均保持不變,是一種非常穩(wěn)定的局部特征。SITF 算法具有穩(wěn)定性、獨(dú)特性、多量性、可擴(kuò)展性、高速性、實(shí)時(shí)性等特點(diǎn)。
CH(Color Histogram),顏色直方圖,是一種全局特征,對(duì)圖像本身的尺寸、方向、視角的依賴(lài)性較小,具有較高的魯棒性。CH算子特征提取優(yōu)點(diǎn)是旋轉(zhuǎn)不變性和平移不變性;不受數(shù)字圖像尺度變化的影響;其缺點(diǎn)是不能有效地表現(xiàn)出顏色的空間分布信息;實(shí)際應(yīng)用中受到天氣的影響較大,結(jié)果具有不穩(wěn)定性。
SVM(Support Vector Machine),支持向量機(jī),是一種常見(jiàn)的判別方法。在機(jī)器學(xué)習(xí)領(lǐng)域,是一個(gè)有監(jiān)督的學(xué)習(xí)模型,通常用來(lái)進(jìn)行模式識(shí)別、分類(lèi)以及回歸問(wèn)題的分析[8]。
SVM 支持向量機(jī)通過(guò)一個(gè)非線性映射p,把樣本空間映射到一個(gè)高維乃至無(wú)窮維的特征空間中(Hilbert空間),使得在原來(lái)的樣本空間中非線性可分的問(wèn)題轉(zhuǎn)化為在特征空間中的線性可分的問(wèn)題。
基于大數(shù)據(jù)的高分辨率遙感場(chǎng)景識(shí)別通常采用監(jiān)督法分類(lèi)方法。本文研究的數(shù)據(jù)量較大,因此采用隨機(jī)函數(shù)來(lái)進(jìn)行樣本的選取,依據(jù)訓(xùn)練區(qū)的樣本選擇提取特征參數(shù),通過(guò)分類(lèi)器進(jìn)行分類(lèi)[9]。第一步選取WHU-RS19 數(shù)據(jù)集和AID 航空數(shù)據(jù)集;第二步分別使用LBP 算子、SIFT 算法和CH算子進(jìn)行特征提?。坏谌绞褂肧VM支持向量機(jī)進(jìn)行分類(lèi)。
(1)LBP算子特征提取。參數(shù)信息見(jiàn)表1。
表1 LBP算子特征提取參數(shù)
如果識(shí)別圖像大于600px則進(jìn)行等比例縮放。
(2)SIFT算法特征提取。參數(shù)信息見(jiàn)表2。
表2 SIFT算法特征提取參數(shù)
將顏色場(chǎng)景轉(zhuǎn)化為灰度圖并轉(zhuǎn)化為矩陣,如果場(chǎng)景像素大于600,則進(jìn)行等比例縮放。
(3)CH算子特征提取。參數(shù)信息見(jiàn)表3。
表3 CH算子特征提取參數(shù)
將顏色場(chǎng)景轉(zhuǎn)化為矩陣,如果場(chǎng)景像素大于600,則進(jìn)行等比例縮放。
(4)特征信息綜合。參數(shù)信息見(jiàn)表4。
表4 綜合特征提取參數(shù)
通過(guò)循環(huán)對(duì)每類(lèi)場(chǎng)景特征進(jìn)行信息整合,文件名按照原文件名加參數(shù)的格式保存。如果文件夾中已有先前生成的文件則提示文件已存在,不再重新進(jìn)行計(jì)算。
參數(shù)信息如表5 所示。通過(guò)循環(huán)對(duì)數(shù)據(jù)集進(jìn)行樣本學(xué)習(xí)以及訓(xùn)練[10]。
表5 SVM分類(lèi)參數(shù)信息
本文通過(guò)每類(lèi)場(chǎng)景的識(shí)別率來(lái)判斷算法的效果。
(1)WHU-RS19數(shù)據(jù)集實(shí)驗(yàn)結(jié)果。
通過(guò)多次試驗(yàn),并進(jìn)行結(jié)果分析,不同樣本比例的LBP算子、SIFT算法和CH算子特征提取識(shí)別率統(tǒng)計(jì)如表6所示,折線圖如圖1所示。
表6 不同樣本比例的LBP算子、SIFT算法和CH算子特征提取識(shí)別率統(tǒng)計(jì)(RS19數(shù)據(jù)集)
圖1 不同樣本比例的LBP算子、SIFT算法和CH算子特征提取識(shí)別率折線圖(RS19數(shù)據(jù)集)
根據(jù)表6 和圖1 可以得到:CH 算子的識(shí)別率明顯高于LBP 算子和SIFT 算法;隨著樣本比例的增大,CH算子、LBP算子和SIFT算法的識(shí)別率總體呈增長(zhǎng)趨勢(shì)[11]。
混淆矩陣(Confusion Matrix)也稱(chēng)誤差矩陣,可以很好地反映圖像分類(lèi)的精度,適用于監(jiān)督學(xué)習(xí)。LBP算子在50%樣本比例中的混淆矩陣如圖2所示[12]。
根據(jù)LBP 算子在50%比例中得到的混淆矩陣中可以得出如下結(jié)論:橋、工業(yè)、公園場(chǎng)景識(shí)別效果較差。容易混淆的場(chǎng)景:農(nóng)田和停車(chē)場(chǎng),草地和停車(chē)場(chǎng),池塘和海灘。海灘、足球場(chǎng)、森林、草地、山、火車(chē)站和高架橋識(shí)別率較高。
通過(guò)三種不同的算法的比較,森林、山和火車(chē)站的識(shí)別率較高。橋的識(shí)別率較低。由于RS19數(shù)據(jù)集圖片數(shù)量相對(duì)較少,在實(shí)驗(yàn)過(guò)程中采用的是隨機(jī)算法,導(dǎo)致出現(xiàn)個(gè)別實(shí)驗(yàn)隨著樣本比例升高識(shí)別率下降的現(xiàn)象。但是總體上隨著樣本比例升高,場(chǎng)景的識(shí)別率越高。而且在低層次場(chǎng)景識(shí)別上,CH算子提取的特征比LBP算子和SIFT的效果好[13]。
(2)AID 數(shù)據(jù)集實(shí)驗(yàn)結(jié)果。通過(guò)多次試驗(yàn),并進(jìn)行結(jié)果分析,不同樣本比例的LBP 算子、SIFT算法和CH算子特征提取識(shí)別率統(tǒng)計(jì)如表7所示,折線圖如圖3所示。
圖2 樣本比例為50%的LBP算子混淆矩陣
圖3 不同樣本比例的LBP算子、SIFT算法和CH算子提取識(shí)別率折線圖(AID數(shù)據(jù)集)
表7 不同樣本比例的LBP算子、SIFT算法和CH算子特征提取識(shí)別率統(tǒng)計(jì)(AID數(shù)據(jù)集)
根據(jù)表7 和圖3 可以得到以下結(jié)論:(1)CH算子的識(shí)別率明顯高于LBP算子和SIFT算法;(2)隨著樣本比例的增大,CH算子、LBP算子和SIFT算法的識(shí)別率都呈增長(zhǎng)趨勢(shì)[14]。
通過(guò)三種不同的算法的比較,密集的住宅和停車(chē)場(chǎng)的識(shí)別率較高。橋、中心、火車(chē)站、旅游勝地、學(xué)校和廣場(chǎng)的識(shí)別率較低[15]??傮w上,不管是哪種算法,樣本比例越高,場(chǎng)景的識(shí)別率越高;在低層次場(chǎng)景識(shí)別上,CH算子提取的特征比LBP算子和SIFT的效果好。
本文在基于大數(shù)據(jù)的高分辨遙感圖像識(shí)別過(guò)程中,通過(guò)LBP 算子、SIFT 算法和CH 算子對(duì)RS19 數(shù)據(jù)集和AID 數(shù)據(jù)集進(jìn)行遙感場(chǎng)景識(shí)別,通過(guò)其結(jié)果不難看出:CH算子的識(shí)別率最高,LBP算子的識(shí)別率其次,SIFT 算子的識(shí)別率最低;識(shí)別率隨著樣本比例的提高也逐漸提高。雖然低層特征所需的資源消耗少,但是其精度仍然是有限的(總體低于50%),后續(xù)將采用中層特征和高層特征來(lái)進(jìn)行遙感場(chǎng)景的分類(lèi)識(shí)別。