焦計晗,張 帆,張 良
(1.湖北大學 資源環(huán)境學院,武漢 430062; 2.中國地質(zhì)大學 計算機學院,武漢 430074;3.農(nóng)業(yè)部遙感應用中心武漢分中心, 武漢 430062)
農(nóng)作物面積監(jiān)測主要是利用遙感技術對地表農(nóng)作物種植面積和種植分布進行估測監(jiān)視,是農(nóng)情監(jiān)測調(diào)查的重要一環(huán)。農(nóng)作物面積估測為農(nóng)作物估產(chǎn)提供了有效方法,進而為國家糧食政策的制定提供依據(jù),維護國家糧食安全[1]。
傳統(tǒng)的遙感農(nóng)作物面積估測主要是根據(jù)農(nóng)作物在遙感影像上特定的波譜特征或者物候特征進行識別分類[2]。對于單時相遙感影像數(shù)據(jù)而言,基于波譜特征的分類方法易受遙感影像分辨率影響,尤其對于微小地塊和分辨率較低的影像數(shù)據(jù),“同物異譜”和“異物同譜”的現(xiàn)象較為常見。而根據(jù)農(nóng)作物物候特征進行分類同樣受影像數(shù)據(jù)影響較大,如何在單幅遙感影像上提取特定作物的物候特征也有很大局限性。之后隨著多時相遙感變化檢測的提出,利用多幅遙感影像對農(nóng)作物進行識別監(jiān)測成為可能,如何馨[3]利用小波變換將MODIS與TM影像數(shù)據(jù)進行融合后,對2008年河南省原陽縣玉米種植信息進行分析,得到種植面積和種植分布,估測精度達到78.76%。而多時相農(nóng)作物遙感變化監(jiān)測同樣面臨同一作物不同時期或同一作物不同數(shù)據(jù)源的影像數(shù)據(jù)獲取問題,其次不同分辨率影像數(shù)據(jù)的融合方法仍值得研究。
針對農(nóng)作物遙感影像,提出一種基于改進后的AlexNet[4]卷積神經(jīng)網(wǎng)絡模型。并將該模型用于湖北省荊門市油菜作物種植面積的識別估測中。該模型可以在識別大量的遙感影像地物后,隱式的學習到油菜作物遙感影像特征,進而對種植面積進行估測。
卷積神經(jīng)網(wǎng)絡(convolutional neural network, CNN)是深度學習中研究和應用較為廣泛的一個分支,是一種專門用來處理具有類似網(wǎng)絡數(shù)據(jù)結構的神經(jīng)網(wǎng)絡。CNN類似于一個黑盒子,只需要將網(wǎng)絡數(shù)據(jù)直接輸入,它便會隱式的提取數(shù)據(jù)的特征進行學習,得出學習結果。CNN與傳統(tǒng)神經(jīng)網(wǎng)絡的不同是它采用局部感知視野和參數(shù)共享機制并加入池化層,在使用反向傳播算法的同時使網(wǎng)絡的結構得到極大的簡化和優(yōu)化[5]。
卷積神經(jīng)網(wǎng)絡的訓練過程實質(zhì)是一個參數(shù)不斷學習更新的過程,訓練給定一個初始隨機參數(shù),得到輸出值,當輸出值與標準值不同時,計算誤差,之后采用反向傳播算法(back propagation,簡稱BP算法),從輸出層向反方向一層一層更新參數(shù),直至訓練精度達到最高[6]。更新權值公式如下:
w(t+1)=w(t)+η*δ(t)*x(t)
(1)
其中:x(t)為神經(jīng)元的輸出,δ表示該神經(jīng)元的誤差項,η表示學習率。
卷積神經(jīng)網(wǎng)絡學習圖像的特征是靠卷積層和池化層來實現(xiàn)的。卷積運算主要作用為提取圖像特征,而之后的池化層則是降低特征維度,以此達到減小計算復雜度,避免過擬合的目的。卷積公式如下:
y(n)=x(n)*h(n)
(2)
其中:*表示卷積,x(n)為卷積對象,h(n)為卷積核,y(n)為卷積結果,n是卷積核位移的量,在提出的改進模型中n為3或2。
卷積神經(jīng)網(wǎng)絡的全連接層,即指輸出層的神經(jīng)元和輸入層的每個神經(jīng)元都相連接。其本質(zhì)就是一個分類器。常用的分類器包括:多層感知機、徑向基網(wǎng)絡、多項式邏輯回歸和Softmax回歸函數(shù),其中Softmax回歸函數(shù)復雜度低且分類效果好,因此在神經(jīng)網(wǎng)絡中得到廣泛應用。輸出向量的維度取決于分類任務,分類效果取決于隱含層的設計[7]。
經(jīng)典的AlexNet卷積神經(jīng)網(wǎng)絡模型來源于ImageNet[8]大賽,主要用于分辨率較高,圖片尺寸較大的圖片識別。對于遙感影像來說,分辨率較高意味著同等尺寸下,影像實際范圍較小,不適合大尺度遙感監(jiān)測分析。圖片尺寸大則意味著同等分辨率下,影像實際范圍較大,影像內(nèi)地物較多,分辨精度易受其他地物影響。高分辨率影像,大尺寸單位圖片不適合做大范圍監(jiān)測,因而中低分辨率影像和小尺寸單位圖片更適合用于遙感影像大范圍農(nóng)作物識別監(jiān)測。對于湖北省荊門市油菜作物,采用中分辨率影像Landsat8影像數(shù)據(jù),將單位圖片大小調(diào)整為4*4像素大小,進而對AlexNet模型進行針對性改進。
受限于遙感影像時間和空間分辨率,原AlexNet模型的卷積核過大,不適合處理Landsat8荊門市遙感影像數(shù)據(jù)。改進后的AlexNet模型仍為8層,其中前5個是卷積層,其中第一、二、五層的每個卷積層后都加一個池化層,后3個是全連接層。與原模型不同的是各個卷積層的卷積核大小以及相應的步長,針對遙感影像數(shù)據(jù)做出了針對性的調(diào)整。前兩個卷積核大小調(diào)整為3*3大小,后3個卷積核大小調(diào)整為2*2大小,步長均調(diào)整為1。對于池化層,前兩個池化層卷積核大小不變?yōu)?*3,最后一個調(diào)整為2*2,步長同樣均調(diào)整為1。將卷積核變小以及步長均調(diào)整為1,是為了適應訓練數(shù)據(jù)中單位遙感圖片大小為4*4像素,如果卷積核大于4*4像素,卷積提取的特征值就會代表性不強,最終的精度也會降低。如表1所示。
在卷積神經(jīng)網(wǎng)絡訓練過程中,有時限于數(shù)據(jù)集的大小和過
表1 改進前后模型結構對比
度訓練,會出現(xiàn)過擬合現(xiàn)象,即訓練的模型在訓練數(shù)據(jù)集中擬合程度很好,但在其他測試數(shù)據(jù)集中擬合效果較差。為了防止過擬合,提出了3種優(yōu)化方案。一是擴大訓練數(shù)據(jù)集,將湖北省荊門市遙感影像劃分為十塊區(qū)域,每塊區(qū)域提取訓練數(shù)據(jù)圖片880張,其中油菜為440張,非油菜為440張,共得到訓練數(shù)據(jù)8800張。二是Earlystopping,即在模型對訓練數(shù)據(jù)收斂之前停止迭代來防止過擬合。在每一次訓練數(shù)據(jù)遍歷之后計算模型訓練精度accuracy,當accuracy在最近連續(xù)十次的迭代中均保持不變時,停止迭代,默認訓練精度達到最好。三是在全連接層后加入dropout[9],dropout是在每層神經(jīng)元單元訓練開始時,隨機的刪除一定比例的(比例自己根據(jù)實際需要設定,一般設為0.5)隱藏層神經(jīng)元,即認為這些神經(jīng)元是不存在的,但輸入層與輸出層的個數(shù)并不會改變。在參數(shù)學習更新時,已經(jīng)刪除的神經(jīng)元單元不會再更新,這樣每次迭代都隨機刪除一些神經(jīng)元,直至訓練結束。如圖1。
圖1 dropout原理圖
即dropout在訓練過程中會以一定概率將隱含節(jié)點的輸出清零,而用bp更新權值時,不再更新與該節(jié)點相連的權值[9]。如式(3):
r=m*a(Wv)
(3)
其中:v是n*1維的列向量,W是d*n維的矩陣,m是個d*1的0、1列向量,a(x)是一個滿足a(x)=0的激發(fā)函數(shù)。這里的m和a(Wv)相乘是對應元素的相乘。
湖北省荊門市是我國重要的油菜作物主產(chǎn)區(qū),種植面積常年維持在150萬畝以上,2017年荊門市統(tǒng)計局統(tǒng)計的數(shù)據(jù)顯示,2017年油菜種植面積為163萬畝。選用2017年3月29日的兩幅Landsat8影像,裁剪拼接后得到荊門市影像圖,采用改進后的AlexNet模型對影像圖進行訓練并估測荊門市2017年油菜種植面積。
遙感數(shù)據(jù)是利用地物的反射,將其電磁波信息通過分類分成若干個光譜波段,不同的波段所攜帶的信息量和信息大小均不同,不同波段組合起來所涵蓋的信息也不盡相同[10]。因此在波段組合方面考慮兩個方面。一是所選波段信息量要少。二是波段間的相關性要大。用CNN模型對油菜信息進行提取,就類似于對遙感影像進行二分類,油菜作物為一類,其它地物為一類。若波段所含信息量太大,除油菜信息以外的其它信息過多,會影響訓練數(shù)據(jù)的選取,加大數(shù)據(jù)的制作難度。而波段相關性小同樣會影響波段組合后數(shù)據(jù)的純度。綜合這兩方面,通過計算各波段的標準差和波段間的相關系數(shù),選取4、3、2波段作為實驗組合波段。
卷積神經(jīng)網(wǎng)絡模型的訓練需要大量數(shù)據(jù),數(shù)據(jù)的質(zhì)量和數(shù)量在很大程度上影響著模型的訓練效果。為了保證選取的數(shù)據(jù)能夠覆蓋整個荊門市,將拼接裁剪后得到的荊門市影像圖分成十塊區(qū)域,之后通過目視解譯,在每塊區(qū)域按照油菜與非油菜1:1的比例隨機選取單位大小為4*4像素的圖片共1100張,十塊區(qū)域總共獲得11000張。然后將這11000張圖片按照4:1的比例分成訓練數(shù)據(jù)集和測試數(shù)據(jù)集。其中,前者用于模型的訓練與學習,后者用于檢驗模型學習效果。
卷積神經(jīng)網(wǎng)絡在訓練數(shù)據(jù)集和測試數(shù)據(jù)集上訓練測試后,將對整個荊門市影像圖進行預測識別。將大小為5192*4516像素的荊門市影像圖切分為4*4大小的圖片1465442張,生成預測數(shù)據(jù)集。
油菜信息提取流程主要分為三步。第一步是通過訓練數(shù)據(jù)對各模型進行訓練,在訓練精度收斂時及時停止迭代,保存各參數(shù)。第二步是用測試數(shù)據(jù)對訓練后的模型進行檢驗,根據(jù)測試精度的大小(設定一個閾值)決定是否繼續(xù)執(zhí)行第三步,測試精度的大小視實際需要而定,此次試驗閾值設為95%。第三步即是用訓練和測試效果較好的模型對整個荊門市影像數(shù)據(jù)進行分類識別,提取出油菜信息,得到油菜種植面積并獲得油菜種植分布。如圖2所示。
圖2 油菜信息提取流程
為了驗證提出的改進后卷積神經(jīng)網(wǎng)絡模型在遙感影像上的優(yōu)異性以及dropout防止過擬合的特性,將原AlexNet模型,改進后的AlexNet模型(無dropout)和改進后的AlexNet模型(有dropout)3種模型進行試驗對比。對比從測試精度、Kappa一致性檢驗和估測面積三方面進行。
3.3.1 測試精度
3種模型的測試精度相差不大,均達到95%以上。改進后的模型相較改進前的模型測試精度有顯著提高,其中改進后的AlexNet模型在加入dropout后,測試精度有一個小幅度的提高,說明dropout的加入的確在一定程度上避免過擬合的產(chǎn)生。測試結果見表2。
表2 各模型優(yōu)異性對比
3.3.2Kappa一致性檢驗
Kappa[11]是重在檢驗估測信息與實際信息兩者的一致性,一般認為當Kappa系數(shù)大于0.8時,兩者一致性很高。當Kappa系數(shù)小于0.4時,說明一致性較差。Kappa的值越接近1,一致性越高。在測試數(shù)據(jù)中隨機選擇1000個數(shù)據(jù),其中油菜400張,非油菜600張,對3種模型進行檢驗,結果顯示3種模型一致性均較高,說明卷積神經(jīng)網(wǎng)絡模型用于油菜信息提取具有很強的適用性。另外改進后的加入dropout的模型一致性相對更高一些,則表明針對遙感影像做出的模型調(diào)整確實起到了優(yōu)化作用。結果見表2。
3.3.3 估測面積
湖北省荊門市統(tǒng)計局5月份的統(tǒng)計數(shù)據(jù)顯示,2017年荊門市油菜種植面積為163萬畝。采用的3種模型所估測的種植面積均大于實際面積,改進后的模型估測面積要與實際面積更加接近。其中,加入dropout的改進后模型估測面積誤差率最低,僅為2.39%。估測結果見表2。
綜合表2各信息可知,對于遙感影像油菜信息識別而言,改進后的AlexNet模型相較于原模型表現(xiàn)更加優(yōu)異,測試精度、一致性檢驗以及面積估測的誤差率均有較大幅度的提升。另外dropout的加入,也在一定程度上對模型進行了優(yōu)化,避免了過擬合現(xiàn)象的出現(xiàn)。
對于估測面積普遍偏高這一問題,在后續(xù)單一地物類別模型識別檢驗中發(fā)現(xiàn),3種模型對油菜識別準確率要比對非油菜的識別率高,模型將過多非油菜地物識別為油菜地物,導致估測結果中油菜作物面積偏高。測試數(shù)據(jù)中油菜為400,非油菜為600,測試結果見表3。
表3 各模型單一地物識別精度對比 %
最后將訓練好的3種模型對整個荊門市遙感影像進行識別分類,得到荊門市油菜種植分布圖,從圖中可以看出,各個模型下的油菜種植分布基本一致,油菜主要分布在荊門市西北部和西南部,東部較少。這與荊門市西平東高的地形非常契合。驗證了卷積神經(jīng)網(wǎng)絡在遙感影像油菜作物識別上的適用性。
圖3 各模型下油菜種植分布
經(jīng)典的卷積神經(jīng)網(wǎng)絡模型在一般的圖像識別領域表現(xiàn)出色,但在遙感影像農(nóng)作物識別領域,影像的空間和時間分辨率、地物的波譜特征等對其都有一定程度的影響,使其識別分類效果減弱。結合遙感影像特征和農(nóng)作物物候特征,制作合適的訓練與測試數(shù)據(jù)集,進而對經(jīng)典的AlexNet模型進行調(diào)整,將卷積核大小調(diào)整為適合遙感影像訓練數(shù)據(jù)的大小,并加入dropout方法減少過擬合的出現(xiàn)。將改進后的模型用于湖北省荊門市油菜作物種植面積和種植分布的預測,預測誤差率控制在3%以內(nèi),驗證了卷積神經(jīng)網(wǎng)絡在農(nóng)作物遙感識別領域的適用性。同時在實驗的過程中,卷積神經(jīng)網(wǎng)絡在農(nóng)作物遙感影像識別領域的應用也存在一些問題。
1)中低分辨率遙感影像數(shù)據(jù)受云霧影響較大,對于一些云霧遮擋區(qū)域,改進后的AlexNet卷積神經(jīng)網(wǎng)絡模型是否適用是下一步工作的重點。
2)Landsat8影像數(shù)據(jù)空間分辨率大小為30米,本文采用的數(shù)據(jù)單位大小為4*4像素,所代表的實際地物面積為21.6畝,因此對于實際地物中面積較小的零碎地塊無法做到精確識別。是否可以將模型訓練數(shù)據(jù)單位大小再進一步縮小為3*3或2*2甚至是1個像素大小,這也是下一步的研究重點。
3)改進后的AlexNet模型在農(nóng)作物遙感識別領域中的初步應用效果較好,其他在ImageNet大賽中表現(xiàn)優(yōu)異的模型,如GoogleNet,ResNet等,是否也可以在農(nóng)作物遙感識別領域得到應用同樣值得探究。
改進后的AlexNet卷積神經(jīng)網(wǎng)絡模型在遙感影像湖北省荊門市油菜作物種植面積估測中的成功應用,為卷積神經(jīng)網(wǎng)絡在遙感測量領域的應用提供了新的思路。
[1] 王 迪, 周清波, 陳仲新,等. 基于合成孔徑雷達的農(nóng)作物識別研究進展[J]. 農(nóng)業(yè)工程學報, 2014, 30(16):203-212.
[2] 宋 茜, 周清波, 吳文斌,等. 農(nóng)作物遙感識別中的多源數(shù)據(jù)融合研究進展[J]. 中國農(nóng)業(yè)科學, 2015, 48(6):1122-1135.
[3] 何 馨. 基于多源數(shù)據(jù)融合的玉米種植面積遙感提取研究[D]. 南京:南京信息工程大學, 2010.
[4]KrizhevskyA,SutskeverI,HintonGE.ImageNetclassificationwithdeepconvolutionalneuralnetworks[A].InternationalConferenceonNeuralInformationProcessingSystems[C].CurranAssociatesInc. 2012:1097-1105.
[5] 常 亮, 鄧小明, 周明全,等. 圖像理解中的卷積神經(jīng)網(wǎng)絡[J]. 自動化學報, 2016, 42(9):1300-1312.
[6] 劉長征, 相文波. 基于改進卷積神經(jīng)網(wǎng)絡的肺炎影像判別[J]. 計算機測量與控制, 2017, 25(4):185-188.
[7] 侯敬軒. 基于卷積神經(jīng)網(wǎng)絡的壓縮視頻后處理[D].北京:北京交通大學,2017.
[8]DengJ,DongW,SocherR,etal.ImageNet:Alarge-scalehierarchicalimagedatabase[A].CVPR2009.IEEEConferenceonComputerVisionandPatternRecognition, 2009. [C].IEEE, 2009:248-255.
[9]HintonGE,SrivastavaN,KrizhevskyA,etal.Improvingneuralnetworksbypreventingco-adaptationoffeaturedetectors[J].ComputerScience, 2012, 3(4): 212-223.
[10] 王海軍.AGA-BP模型在遙感影像分類中的應用研究[J]. 計算機測量與控制,2017,25(5):212-214.
[11]CohenJ.Acoefficientofagreementfornominalscales.[J].Educational&PsychologicalMeasurement, 2016, 20(1):37-46.