程清 張航 張承明 殷復(fù)偉 王程成
摘要:針對目前利用深度學(xué)習(xí)技術(shù)進行高分光學(xué)遙感圖像分類方法研究中尚存在的不足,本文提出了一種以多時相遙感數(shù)據(jù)為數(shù)據(jù)源,面向農(nóng)作物種植信息提取的分類算法。該算法首先獲取農(nóng)作物在若干典型生長時期的光學(xué)遙感圖像并進行配準(zhǔn)等預(yù)處理,然后建立了一種以像素為單位的數(shù)據(jù)組織結(jié)構(gòu),該結(jié)構(gòu)包含不同生長時期的作物信息、紋理信息,能較好地解決現(xiàn)有分類研究中信息不足的問題;接著以前饋神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),建立了一種以像素為單位的分類算法,最后以得到的逐像素分類結(jié)果為基礎(chǔ)進行成圖。與同類方法相比,本文提出的算法綜合考慮了農(nóng)作物在不同生長時期的特征,更能發(fā)揮深度學(xué)習(xí)技術(shù)的優(yōu)勢,且多時相數(shù)據(jù)在提高農(nóng)作物提取信息精度方面具有明顯優(yōu)勢。
關(guān)鍵詞:遙感分類;多時相數(shù)據(jù);信息提??;農(nóng)作物;神經(jīng)網(wǎng)絡(luò)
中圖分類號:S127文獻標(biāo)識號:A文章編號:1001-4942(2018)04-0149-05
Abstract In view of the shortages in researching high resolution optical remote sensing image classification method by the deep learning technology, a classification algorithm for crop information extraction based on the multi-temporal remote sensing data was proposed in this paper. The algorithm firstly obtained the optical remote sensing images of crop at several typical growth stages, and preprocessed these images such as registration. Then it established data organization structure based on pixels to solve the problem of insufficient information in the existing classification researches, which contained crop information and texture information at different growth stages. And it proposed a pixel classification algorithm based on the feedforward neural network. Finally,it mapped images based on pixel by pixel classification results. Comparing to the previous methods, this method comprehensively considered the characteristics of crop at different growth stages,could give full play to the advantages of the deep learning technology and had obvious advantages in improving the precision of crop information extraction.
Keywords Remote sensing classification; Multi-temporal data; Information extraction; Crop; Neural network
獲取準(zhǔn)確的農(nóng)作物種植種類、面積、空間分布等信息,對于加強農(nóng)業(yè)生產(chǎn)管理和國家宏觀調(diào)控、保障農(nóng)業(yè)可持續(xù)發(fā)展并最終保障國家糧食安全具有重要的意義。
圍繞該問題,研究者們已開展了很多研究,并取得一定成果。閆慧敏等[1]利用MODIC/EVI時間序列影像,分析了鄱陽湖農(nóng)業(yè)區(qū)多熟種植時空格局特征;鄭長春等[2]以黑龍江852農(nóng)場為研究區(qū)域,利用 SPOT 影像基于簡單決策樹分類器提取了水稻、小麥和玉米三大作物組成的種植結(jié)構(gòu)信息;Mathur 等[3]利用IRS-1D 影像的光譜單波段特征量,采用支持向量機分類器提取出了印度旁遮普區(qū)域棉花和水稻兩大農(nóng)作物的空間分布;苗翠翠等[4]利用TM與NOAA影像數(shù)據(jù),以江蘇省水稻面積分布為研究對象,對NOAA-AVHRR進行混合像元分解,統(tǒng)計出各市的水稻面積;王凱[5]利用多源遙感數(shù)據(jù),建立了針對湖北省的作物耕作面積提取及其動態(tài)監(jiān)測技術(shù)體系;胡瓊等[6]對利用遙感數(shù)據(jù)提取農(nóng)作物種植結(jié)構(gòu)的研究進行了綜述,分析了各類方法的適應(yīng)性;舒田等[7]在分析農(nóng)作物光譜信息特征基礎(chǔ)上,利用不同數(shù)據(jù)變換形式和10種常用植被指數(shù)對采收期的7種農(nóng)作物進行了識別能力研究。盡管以往的研究中研究者們提出了多種優(yōu)秀的提取算法,但由于數(shù)據(jù)源的限制,導(dǎo)致結(jié)果的精度仍較低,不能更好地滿足農(nóng)業(yè)生產(chǎn)管理和決策的需要。
隨著高分辨率衛(wèi)星的發(fā)展,人們獲取的光學(xué)遙感圖像的分辨率不斷提高。在我國,隨著高分系列衛(wèi)星的成功發(fā)射,研究者已經(jīng)可以穩(wěn)定獲取1 m分辨率的遙感圖像,成為可靠的數(shù)據(jù)源。高分辨率圖像與中低分辨率圖像存在著較大的差異,突出表現(xiàn)在:高分辨率圖像中地物的光譜特征更加豐富,同類地物內(nèi)的光譜差異增大,而不同類別間的光譜差異減少,導(dǎo)致同物異譜及同譜異物現(xiàn)象更加普遍;同時,影像中大量細(xì)節(jié)的出現(xiàn)和地物光譜特征的復(fù)雜化導(dǎo)致了基于光譜統(tǒng)計特征進行分類的傳統(tǒng)方法如極大似然法、最小距離法、K-均值聚類法等分類準(zhǔn)確性的降低,甚至不能應(yīng)用[8,9]。針對高分遙感圖像的分類問題,研究者們已進行了大量研究,目前遙感影像分類方法主要分為兩大類:監(jiān)督分類與非監(jiān)督分類[10]。監(jiān)督分類是理論最成熟、應(yīng)用最廣泛的一類方法,主要包括最大似然法、最小距離法、人工神經(jīng)網(wǎng)絡(luò)等。
現(xiàn)有研究中基于高分遙感圖像的分類算法多是針對一般地物的,專門考慮農(nóng)作物分類的算法較少。事實上,農(nóng)作物信息提取與一般地物分類問題有很大不同,其中最大的不同之處在于農(nóng)作物存在一個明顯的生長變化過程,只有綜合利用多個時相的數(shù)據(jù),才能有效提高分類精度[11]。為此,本研究提出了一種利用多時相遙感數(shù)據(jù)提取農(nóng)作物信息的方法,該算法將多幅典型生長時期的遙感圖像統(tǒng)一按像素組織,然后利用神經(jīng)網(wǎng)絡(luò)強大的自學(xué)習(xí)能力學(xué)習(xí)每類樣本的特征,最終利用學(xué)習(xí)到的特征進行農(nóng)作物信息提取。
1 研究區(qū)概況與數(shù)據(jù)來源
1.1 試驗區(qū)概況
本研究選取華容區(qū)作為試驗區(qū)。華容區(qū)隸屬湖北省鄂州市,位于鄂州市西部,長江中下游南岸。地處東經(jīng)114°30′~115°05′,北緯30°~30°36′。位于我國地勢第二階梯過渡到第三階梯的地帶,以丘陵為主,西北部為壟崗平原,東南部多湖泊。
華容區(qū)屬典型的亞熱帶大陸性季風(fēng)氣候,四季分明,光照充足,雨量充沛。無霜期年均266 d,年降水量1 315 mm,年均日照射時數(shù)1 995 h。良好的氣候條件為農(nóng)作物提供了良好的生長環(huán)境。
華容區(qū)土地總面積為49 274.72 hm2,占全市土地面積的39.2%。其中,耕地面積20 682.55 hm2,占總面積的41.97%,糧食生產(chǎn)在該區(qū)占據(jù)重要地位,是我國主要的糧、棉、油生產(chǎn)基地之一。因此,及時準(zhǔn)確地掌握華容區(qū)的農(nóng)作物信息,可以為農(nóng)業(yè)生產(chǎn)部門提供有利數(shù)據(jù),具有極大的利用價值。
1.2 數(shù)據(jù)來源
高分二號衛(wèi)星(GF2)于2014年8月19日11時15分發(fā)射,是迄今為止中國地面像元分辨率最高的光學(xué)對地觀測衛(wèi)星,具有米級空間分辨率,全色分辨率為1 m,多光譜分辨率為4 m,成像幅寬為45 km。主要參數(shù)見表1。
本研究選取了華容區(qū)2015年11月、2016年3月、2016年5月共三期的GF2遙感影像,并利用華容區(qū)的矢量邊界對獲得的三期高分影像進行裁剪,最終得到研究區(qū)域的遙感影像圖(圖1)。
2 方法建立
2.1 數(shù)據(jù)預(yù)處理
遙感數(shù)據(jù)在采集過程中,由于受到衛(wèi)星高度、角度、傳感器性質(zhì)等多種因素的影響,會產(chǎn)生圖像變形。因此,首先利用ENVI軟件中的RPC(有利多項式系數(shù))和FLAASH模塊分別對影像進行正射投影和大氣校正,接著進行圖像融合,以提升圖像的空間分辨率和光譜分辨率,利于監(jiān)測。
2.2 數(shù)據(jù)結(jié)構(gòu)
為了充分利用遙感數(shù)據(jù)提供的信息,考慮到紋理信息是由多個相鄰像元共同表現(xiàn)出的特征,是二維結(jié)構(gòu)的數(shù)據(jù),而光譜信息是一維結(jié)構(gòu)的數(shù)據(jù),本方法首先設(shè)計了一個以一維數(shù)據(jù)存儲像素信息的數(shù)據(jù)結(jié)構(gòu),以便逐像素統(tǒng)一存儲光譜和紋理信息。該結(jié)構(gòu)以經(jīng)過預(yù)處理的數(shù)據(jù)為基礎(chǔ),采用逐像素逐時相存儲的方式,首先存儲像素第一個時相的光譜信息,然后存儲第一個時相的紋理信息,由于每個像素的紋理是3×3的結(jié)構(gòu),需將該結(jié)構(gòu)逐行逐列轉(zhuǎn)化成一維結(jié)構(gòu)加以存儲;然后存儲像素第二個時相的信息,依此類推。
2.3 模型建立與學(xué)習(xí)
神經(jīng)網(wǎng)絡(luò)和遺傳算法都是仿效生物處理模式,并從中獲取解決復(fù)雜實際問題的方法。神經(jīng)元網(wǎng)絡(luò)算法是一種“黑匣”式的映射,無需明確兩者之間的確切關(guān)系,只需要“現(xiàn)象上”存在關(guān)系即可,非常適合解決非線性的復(fù)雜問題,具有極強的容錯性、自組織性、非線性模擬和泛映射能力;但運用該算法容易陷入局部最優(yōu),得不到全局最優(yōu)解,且其網(wǎng)絡(luò)的設(shè)計沒有理論上的指導(dǎo),完全依賴設(shè)計者的經(jīng)驗和樣本空間的反復(fù)試驗,這限制了運用神經(jīng)網(wǎng)絡(luò)求得全局最優(yōu)解的可能性。遺傳算法(genetic algorithm,GA)是基于自然選擇和遺傳學(xué)機理的迭代自適應(yīng)概率搜索算法,是一種全局優(yōu)化算法,能夠收斂得到全局最優(yōu)解,魯棒性好,但其不具備自適應(yīng)學(xué)習(xí)能力。因此,將神經(jīng)網(wǎng)絡(luò)和遺傳算法結(jié)合起來,不僅能發(fā)揮神經(jīng)網(wǎng)絡(luò)的泛化映射能力,而且能使神經(jīng)網(wǎng)絡(luò)具有較快的收斂性、全局優(yōu)化能力和較強的學(xué)習(xí)能力,進一步提高網(wǎng)絡(luò)訓(xùn)練速度和預(yù)測精度。
基于以上考慮,本文提出一種基于GA-BP神經(jīng)網(wǎng)絡(luò)優(yōu)化的分類模型,并以此為基礎(chǔ)進行農(nóng)作物信息提取。該模型首先建立一個BP神經(jīng)網(wǎng)絡(luò),并利用遺傳算法對網(wǎng)絡(luò)的節(jié)點權(quán)值進行優(yōu)化;然后將樣本逐像素數(shù)據(jù)作為遺傳神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),像素的類別作為輸出,通過學(xué)習(xí),建立一個能夠用于分類的識別模型。其分類識別流程如圖2所示。
遺傳算法對BP神經(jīng)網(wǎng)絡(luò)進行優(yōu)化的具體步驟如下:
(1)初始化BP神經(jīng)網(wǎng)絡(luò),確定輸出輸入節(jié)點個數(shù)X、Y,隱含層數(shù)H,訓(xùn)練次數(shù)N,訓(xùn)練誤差ε等。
(2)遺傳編碼。確定遺傳算法的種群規(guī)模P,染色體個數(shù)n與最大迭代次數(shù)T,交叉概率Pc與變異概率Pm,將BP網(wǎng)絡(luò)權(quán)值與閾值按一定順序級聯(lián)起來,作為遺傳算法的一個染色體,其長度l為神經(jīng)網(wǎng)絡(luò)的權(quán)值個數(shù)和閾值個數(shù)之和,即:
l=H×(X+Y)+H+Y 。
(3)適應(yīng)度函數(shù)計算。將BP網(wǎng)絡(luò)的誤差函數(shù)E作為適應(yīng)度函數(shù),計算種群中每一個染色體的適應(yīng)度。
(4)遺傳進化。將交叉和變異算子作用于父代種群Pt產(chǎn)生子代種群Qt,并將兩個種群聯(lián)合在一起形成2n的種群Rt,對Rt進行非劣分類操作,按照擁擠選擇算子的原則產(chǎn)生下一代種群Pt+1,并將副本復(fù)制到P′。
(5)重復(fù)(2)~(4)步,直到滿足終止條件為止。至此,將P′中最優(yōu)個體解碼,作為BP網(wǎng)絡(luò)的初始權(quán)值和閾值。
GA的進化代數(shù)要求不是很大, 因為GA-BP神經(jīng)網(wǎng)絡(luò)中只要求GA為BP神經(jīng)網(wǎng)絡(luò)提供具有全局性的進化較好解,并不要求GA進化至權(quán)值、域值的最優(yōu)解。
2.4 分類實現(xiàn)
改進好的BP神經(jīng)網(wǎng)絡(luò),設(shè)置輸入層神經(jīng)元節(jié)點數(shù)目為4,輸出層神經(jīng)元節(jié)點數(shù)目為5,最后確定隱含層神經(jīng)元節(jié)點數(shù),即根據(jù)輸入、輸出層神經(jīng)元節(jié)點數(shù)目、網(wǎng)絡(luò)傳遞函數(shù)等參數(shù),采用遺傳算法進化確定隱含層神經(jīng)元數(shù)目。在Matlab中讀入待分類圖像數(shù)據(jù)并歸一化,然后將向量數(shù)據(jù)輸入到訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)中,再結(jié)合紋理信息在Matlab中實現(xiàn)農(nóng)作物信息的提取。
3 試驗驗證
利用本文構(gòu)建的方法,對華容區(qū)的作物進行識別分類。分類模型在Matlab中編程實現(xiàn),成圖在ENVI中實現(xiàn)。圖3給出了分類結(jié)果圖,圖4給出了以分類結(jié)果為基礎(chǔ)形成的矢量圖。
該方法的總體分類精度達到87.133 2%,Kappa系數(shù)達到0.803 3,與單一時相的光學(xué)遙感數(shù)據(jù)分類算法相比,分類結(jié)果準(zhǔn)確度較高,能獲得較為理想的分類效果,具有明顯的優(yōu)勢??梢?,在運用神經(jīng)網(wǎng)絡(luò)進行遙感分類的基礎(chǔ)上,考慮數(shù)據(jù)源問題,結(jié)合合適的紋理信息進行分類,能夠獲得更好的分類結(jié)果。
4 結(jié)論
本文提出了一種基于GA-BP神經(jīng)網(wǎng)絡(luò)的利用多時相遙感數(shù)據(jù)的農(nóng)作物信息提取方法,該方法首先建立了一種能夠逐像元統(tǒng)一存儲多時相光譜信息和紋理信息的數(shù)據(jù)結(jié)構(gòu),然后建立一個BP神經(jīng)網(wǎng)絡(luò),并采用遺傳算法對BP網(wǎng)絡(luò)的節(jié)點權(quán)值進行優(yōu)化,獲取一個最優(yōu)權(quán)值作為BP網(wǎng)絡(luò)的初始權(quán)值;完成BP網(wǎng)絡(luò)訓(xùn)練后,以多時相光學(xué)遙感數(shù)據(jù)作為輸入,生成逐像素的分類圖,并利用ENVI軟件進行成圖。
試驗結(jié)果表明:
(1)本文提出的數(shù)據(jù)結(jié)構(gòu)能夠有效、統(tǒng)一地存儲像素的光譜信息和紋理信息,并應(yīng)用于神經(jīng)網(wǎng)絡(luò)模型,解決了異構(gòu)數(shù)據(jù)在神經(jīng)網(wǎng)絡(luò)中的應(yīng)用問題。
(2)經(jīng)與單一時相光學(xué)遙感數(shù)據(jù)分類算法對比,新優(yōu)化算法的總體分類精度達到87.133 2%,Kappa系數(shù)達到0.803 3,能取得利用潛力更好的特征和信息,有效提高識別精度,能夠用于工程實踐。
參 考 文 獻:
[1] 閆慧敏, 黃河清, 肖向明, 等. 鄱陽湖農(nóng)業(yè)區(qū)多熟種植時空格局特征遙感分析[J]. 生態(tài)學(xué)報, 2008, 28(9):4517-4523.
[2] 鄭長春, 王秀珍, 黃敬峰. 基于特征波段的SPOT-5衛(wèi)星影像水稻面積信息自動提取的方法研究[J]. 遙感技術(shù)與應(yīng)用, 2008, 23(3): 294-299.
[3] Mathur A, Foody G M. Crop classification by support vector machine with intelligently selected training data for an operational application [M]. Taylor & Francis, Inc.,2008.
[4] 苗翠翠, 江南, 彭世揆, 等. 基于NDVI時序數(shù)據(jù)的水稻種植面積遙感監(jiān)測分析——以江蘇省為例[J]. 地球信息科學(xué)學(xué)報,2011,13(2):273-280.
[5] 王凱. 基于多源衛(wèi)星遙感的湖北省作物耕作面積提取及其動態(tài)監(jiān)測[D]. 荊州:長江大學(xué), 2015.
[6] 胡瓊, 吳文斌, 宋茜, 等. 農(nóng)作物種植結(jié)構(gòu)遙感提取研究進展 [J]. 中國農(nóng)業(yè)科學(xué), 2015,48(10):1900-1914.
[7] 舒田,岳延濱,李莉婕,等.基于高光譜遙感的農(nóng)作物識別[J]. 江蘇農(nóng)業(yè)學(xué)報,2016,32(6):1310-1314.
[8] 劉大偉, 韓玲, 韓曉勇. 基于深度學(xué)習(xí)的高分辨率遙感影像分類研究[J]. 光學(xué)學(xué)報, 2016,36(4):298-306.
[9] Cybenko G. Approximation by superpositions of a sigmoidal function[J]. Approximation Theory & Its Applications, 1993, 9(3):17-28.
[10]Lippmann R P. Pattern classification using neural networks[J]. Communications Magazine IEEE, 2002, 27(11):47-50.
[11]郝衛(wèi)平, 梅旭榮, 蔡學(xué)良, 等. 基于多時相遙感影像的東北三省作物分布信息提取 [J]. 農(nóng)業(yè)工程學(xué)報, 2011, 27(1):201-207.