肖讓 唐亮 張勇
摘? 要:遙感圖像技術隨著發(fā)展,其應用領域不斷擴大,同時在各個領域中進行分類,使其利用效率和應用效果得到最大限度地提高和發(fā)揮,與實際應用相結合,對遙感圖像分類進行加強研究,也是目前重要的研究課題。在深度神經(jīng)網(wǎng)絡領域,通過對典型遙感圖像模型的分析,從提高分類準確率和減少訓練時間等方面對模型進行相應改進和優(yōu)化,該文就此進行了進一步闡述。
關鍵詞:深度神經(jīng)網(wǎng)絡? 遙感圖像? 分類研究
中圖分類號:TP751 ? ?文獻標識碼:A 文章編號:1672-3791(2020)01(a)-0022-02
1? 深度神經(jīng)網(wǎng)絡及網(wǎng)絡模型概述
1.1 深度神經(jīng)網(wǎng)絡
深度神經(jīng)網(wǎng)絡成為近年來研究的熱點,其所涉及的領域包括物理生物、計算機、數(shù)學等,基于人工神經(jīng)系統(tǒng)進行模擬的復雜數(shù)學模型,通過各種連接方式,將神經(jīng)元作為基本節(jié)點,構成不同的網(wǎng)絡結構和模型,信號傳輸過程中的加權值通過神經(jīng)元之間的連接進行表現(xiàn),由激勵函數(shù)和權重值對網(wǎng)絡輸出進行確定[1]。
典型的神經(jīng)網(wǎng)絡要由學習規(guī)則,激活函數(shù)和結構3個部分組成;單層神經(jīng)網(wǎng)絡主要由有限個神經(jīng)元組成;而典型的三層神經(jīng)網(wǎng)絡主要由隱含層、輸入層和輸出層構成。根據(jù)神經(jīng)網(wǎng)絡中內(nèi)部信息流動的方向進行劃分,可分為兩種:前饋性和反饋型。前一種網(wǎng)絡中最廣泛應用的是反向傳播算法,其主要分為正向傳播和反向傳播兩個步驟[2]。
在針對待解決的問題,采用傳統(tǒng)模式進行識別時,主要通過人工設計相應的特征,并通過特定的算法對特征進行提取,按照所提取的特征進行分類器輸出,并對分類器進行訓練,然后對測試樣本按照訓練好的分類器進行分類。在這種識別模式中,由于特征設計受到限制,對圖像中所蘊含的豐富信息無法充分表達,通過神經(jīng)網(wǎng)絡的應用,從圖像中提取特征更為全面。
1.2 AlexNet網(wǎng)絡遙感模型
此模型在基于深度卷積神經(jīng)網(wǎng)絡的應用中,在完成圖像分類和目標定位任務方面取得了較好的應用成果,因此受到極大的關注和重視。此網(wǎng)絡模型所使用的公開數(shù)據(jù)集,含有2萬多個類別的,超過1500萬幅帶標簽的高分率圖像;采用多個GPU應用于訓練過程和輸入數(shù)據(jù)處理的加速計算,可實現(xiàn)分段同步進行訓練,使訓練時間有效縮短;具有的Dropout組合模型,可對不同模型進行結果預測,使測試誤差降低,但其所對單個網(wǎng)絡結構進行訓練所需時間較長,能夠使神經(jīng)遠之間較為復雜的自適應關系得到一定程度的降低,并通過被迫學習,對不同的網(wǎng)絡結構提高參數(shù)的適應性,使網(wǎng)絡結構的泛化能力提高。
在數(shù)據(jù)處理方式主要采用利用PCA對RGB的色彩空間進行成分分析,以及隨機裁剪輸入的圖像兩種方式。前者通過對RGB像素集合,進行PCA處理,主要借助于自然圖像中光照顏色和強度在圖像識別不變的情況下變化不定的重要屬性進行操作,并進行高斯擾動;后者是對訓練圖像進行隨機裁剪,圖像輸出大小為256×256,隨機裁剪大小設定為224×224,同時執(zhí)行水平翻轉(zhuǎn),并在測試過程需要進行5次裁剪,包括中間、右上、右下、左上、左下,通過水平翻轉(zhuǎn),最終進行平均值的計算。
2? 遙感圖像分類
圖像分類中因所含成分復雜、地物數(shù)量較多,根據(jù)尺度的不同進行分類時,主要采用兩種分類方式:基于像素和面向?qū)ο?。其中面向?qū)ο蟮姆诸愔?,基于深度神?jīng)網(wǎng)絡的遙感圖像對象分類,主要研究方向為提高分類的準確率[3]。
2.1 分類模型選擇
目前隨著研究,出現(xiàn)了不同類型的卷積神經(jīng)網(wǎng)絡,隨著層數(shù)不斷增多,目前網(wǎng)絡模型現(xiàn)在達到22層,在大規(guī)模的分類任務中,網(wǎng)絡越深獲得成效越好,層數(shù)增加使分類識別率提高的同時,也增大了計算量,對計算資源也提出了更高的要求,另外時間成本也隨之提高,因此對于小規(guī)模任務和實時性任務而言,需要針對特定的分類任務確定相應的平衡點。
在針對VGG、AlexNet、Googlenet、Lenet這4種深度神經(jīng)網(wǎng)絡,進行最適合的網(wǎng)絡進行選擇時,通過UCM公開遙感數(shù)據(jù)集進行訓練時間和分類準確率的測試。從表1的數(shù)據(jù)對比可以看出,在分類準確率的表現(xiàn)上,Lenet不太理想,AlexNet雖然在準確率方面不如Googlenet優(yōu)異,但其訓練時間表現(xiàn)較好,因此作為最終的遙感圖像分類網(wǎng)絡模型。
2.2 改進的遙感圖像分類模型
在標準網(wǎng)絡結構中主要有:3個池化層、1個softmax層、3個全連接層、5個卷積層。在深度神經(jīng)網(wǎng)格模型中,可以實現(xiàn)特征的提取,訓練樣本的特征表達向量由此模型的最后一個全連接層進行輸出,特征向量分類由最后一層的softmax進行完成[4]。針對此流程可以通過SVW對最后一層進行替換,對分類任務進行優(yōu)化。同樣經(jīng)過數(shù)據(jù)集訓練和測試,改進前后的對比數(shù)據(jù)如表2所示。
從對比數(shù)據(jù)中可以看出,改進后的網(wǎng)絡模型在分類準確率上有了提升,同時訓練時間也極大地縮短,對原模型進行了優(yōu)化。但從整體效果來看,其分類準確類依然未達到較高水平,而UCM遙感圖像數(shù)據(jù)集的訓練樣本較少,也受到較小規(guī)模的網(wǎng)絡模型的學習特征的限制,其分類準確率較低,而圖像數(shù)據(jù)集的規(guī)模因受到各因素的限制較難擴大,因此只能通過對訓練過程的優(yōu)化和改進,使分類準確率得到提高。
所以針對此問題,采用模型先利用其他數(shù)據(jù)進行訓練,再對剛開始訓練的網(wǎng)絡模型中的權重變量進行賦值的方式進行權值遷移,而賦予的權得來自于已訓練好的網(wǎng)絡模型的權重值[5]。
3? 結語
基于深度神經(jīng)網(wǎng)絡的遙感圖像分類研究中,對特定領域的分類問題,通過深度學習予以解決,其中訓練數(shù)據(jù)集的建立以及分類原則至關重要,在進行深度,神經(jīng)網(wǎng)絡訓練過程中,網(wǎng)絡收斂速度和最終結果受參數(shù)選擇的直接影響,深度神經(jīng)網(wǎng)絡在對樣本本質(zhì)特征進行提取時,應提高樣本的數(shù)量和質(zhì)量,由于數(shù)據(jù)集時常受到客觀條件的限制,可以利用權值遷移的輸入的方式,對網(wǎng)絡權重隨機初始化進行替代,使訓練效果提高。
參考文獻
[1] 王生生,王萌,王光耀.基于深度神經(jīng)網(wǎng)絡剪枝的兩階段遙感圖像目標檢測[J].東北大學學報:自然科學版,2019,40(2):25-30.
[2] 楊瑩,張海仙.基于卷積神經(jīng)網(wǎng)絡的圖像分類研究[J].現(xiàn)代計算機,2016(5):67-71.
[3] 付偉鋒,鄒維寶.深度學習在遙感影像分類中的研究進展[J].計算機應用研究,2018,35(12):7-11.
[4] 業(yè)巧林,許等平,張冬.基于深度學習特征和支持向量機的遙感圖像分類[J].林業(yè)工程學報,2019,4(2):119-125.
[5] 張日升,朱桂斌,張燕琴.基于卷積神經(jīng)網(wǎng)絡的衛(wèi)星遙感圖像區(qū)域識別[J].信息技術,2017(11):91-94.