田琳靜,宋文龍,盧奕竹,呂 娟,李煥新,陳 靜
(1.首都師范大學(xué) 資源環(huán)境與旅游學(xué)院,北京 100048;2.中國(guó)水利水電科學(xué)研究院 水利部防洪抗旱減災(zāi)工程技術(shù)研究中心,北京 100038;3.渭南市東雷二期抽黃工程管理局,陜西 渭南 714000)
農(nóng)業(yè)干旱較為復(fù)雜,同時(shí)涉及地上氣象-水文通量(如降水、灌溉、蒸散發(fā)等)和地下水文通量(如土壤水),并且農(nóng)業(yè)干旱情勢(shì)與影響因作物類型及其生長(zhǎng)發(fā)育階段等而異[1-6]。農(nóng)業(yè)區(qū)土地利用快速監(jiān)測(cè)與分類對(duì)農(nóng)業(yè)旱情與旱災(zāi)監(jiān)測(cè)評(píng)估具有重要意義,有助于制定合理的抗旱減災(zāi)應(yīng)對(duì)措施,并為政府部門制定規(guī)劃、土地資源管理、生態(tài)環(huán)境保護(hù)規(guī)劃與決策提供了重要的基礎(chǔ)數(shù)據(jù)[7-8]。
近些年無(wú)人機(jī)(Unmanned Aerial Vehicle,簡(jiǎn)稱UAV)低空遙感技術(shù)快速發(fā)展,具有云下作業(yè)、機(jī)動(dòng)靈活、數(shù)據(jù)分辨率高等優(yōu)勢(shì),能夠彌補(bǔ)衛(wèi)星遙感影像獲取能力的不足,在高分辨率遙感影像快速獲取與應(yīng)急方面優(yōu)勢(shì)日益突出[9-10]?;谛l(wèi)星遙感的土地利用分類研究較為成熟[11-16],傳統(tǒng)的分類方法主要包括監(jiān)督分類、非監(jiān)督分類、面向?qū)ο蠓诸惖?。非監(jiān)督分類操作簡(jiǎn)單,人為干預(yù)少,但分類精度較低。監(jiān)督分類需要對(duì)分類地區(qū)有一定的先驗(yàn)知識(shí),利用樣本區(qū)干預(yù)分類類別及結(jié)果,通過(guò)提高樣本區(qū)的質(zhì)量來(lái)提高分類精度。這兩種分類方法都是基于像元進(jìn)行分類,存在“椒鹽”現(xiàn)象[17]。而面向?qū)ο蠓诸惙椒軌蛴行У臏p少基于像元分類出現(xiàn)的“椒鹽”噪聲現(xiàn)象,但其對(duì)圖像的特征提取不夠全面[18-20]。近年來(lái),源于人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法,作為機(jī)器學(xué)習(xí)的一個(gè)研究新領(lǐng)域受到社會(huì)廣泛關(guān)注,具有利用多層非線性的網(wǎng)絡(luò)結(jié)構(gòu)從大量數(shù)據(jù)中學(xué)習(xí)數(shù)據(jù)本質(zhì)特征的能力[21-25]。其中,卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法具有較強(qiáng)的分層學(xué)習(xí)特征能力,在語(yǔ)音識(shí)別、視覺(jué)識(shí)別以及圖像分類等方面表現(xiàn)出獨(dú)特優(yōu)勢(shì)[26-29]。杜敬[30]利用深度學(xué)習(xí)方法,結(jié)合無(wú)人機(jī)影像進(jìn)行水體提??;王術(shù)波等[31]對(duì)雜草進(jìn)行分類;金永濤等[32]利用深度學(xué)習(xí)結(jié)合面向?qū)ο蠓椒▽?duì)典型地物進(jìn)行提取,其提取精度較理想。
本文面向無(wú)人機(jī)技術(shù)在高分辨率下墊面信息快速獲取方面的優(yōu)勢(shì),利用卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法開(kāi)展農(nóng)業(yè)區(qū)土地利用分類研究,主要通過(guò)建立樣本庫(kù)、利用樣本庫(kù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型以及圖像分類等步驟實(shí)施,并與最大似然法比較,利用隨機(jī)選取的樣本點(diǎn)對(duì)二者進(jìn)行精度評(píng)價(jià),并結(jié)合視覺(jué)評(píng)估驗(yàn)證該方法的可行性。
2.1 研究區(qū)選取東雷二期抽黃灌區(qū)中具有代表性下墊面的兩個(gè)典型區(qū)域作為研究區(qū)(見(jiàn)圖1),區(qū)域1、區(qū)域2總面積分別為1 333 099.33m2、168 698.41m2。東雷二期灌區(qū)地處陜西省關(guān)中東部旱塬地區(qū),位于東經(jīng)109°10′~110°10′、北緯34°41′~35°00′之間,地勢(shì)由西北向東南傾斜,海拔385 ~ 600 m,總面積1469.81 km2。該地區(qū)干濕季分明,年平均降水量519~552 mm,年蒸發(fā)量1700~2000 mm。主要農(nóng)作物為冬小麥、夏玉米,經(jīng)濟(jì)作物為水果、蔬菜等。其中,冬小麥生長(zhǎng)周期為10月至次年6月中旬,夏玉米生長(zhǎng)周期為6月下旬至10月,蔬菜主要采用大棚種植。
圖1 東雷二期抽黃灌區(qū)典型區(qū)域航飛圖(區(qū)域1和區(qū)域2)
2.2 數(shù)據(jù)源研究區(qū)無(wú)人機(jī)航片利用大疆精靈phantom 4 Pro無(wú)人機(jī)搭載全色相機(jī)航拍獲得,無(wú)人機(jī)和相機(jī)主要參數(shù)參見(jiàn)表1。以2018年6月15日東雷二期抽黃灌區(qū)區(qū)域1和區(qū)域2兩個(gè)區(qū)域的無(wú)人機(jī)全色航片為數(shù)據(jù)源,其飛行高度為200 m,每張航片尺寸為5472×3648像素,空間分辨率5.45 cm,采用由中國(guó)水利水電科學(xué)研究院與北京易測(cè)天地科技有限公司聯(lián)合研發(fā)、具有獨(dú)立知識(shí)產(chǎn)權(quán)的無(wú)人機(jī)航片智能處理軟件(YC-mapper)系統(tǒng),對(duì)無(wú)人機(jī)航片進(jìn)行校正、拼接等預(yù)處理,該軟件無(wú)需人工干預(yù),可快速完成空三解算、DEM生成、正射影像拼接等一系列任務(wù)。
表1 大疆精靈phantom 4 Pro無(wú)人機(jī)及其相機(jī)主要參數(shù)
3.1 深度學(xué)習(xí)原理深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域一個(gè)新的研究方向,其主要利用多層非線性結(jié)構(gòu),由低到高逐層提取數(shù)據(jù)特征,并利用其特征訓(xùn)練模型,從對(duì)數(shù)據(jù)信息進(jìn)行預(yù)測(cè)及識(shí)別。如圖2所示,深度學(xué)習(xí)模型是由輸入層、隱藏層(一層或多層)和輸出層等多層感知器組成。典型的深度學(xué)習(xí)模型有層疊自動(dòng)去燥編碼機(jī)(Stacked Deoising Autoencoder,SDA)、深度置信網(wǎng)絡(luò)(Deep Belief Network,DBN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)等[30,33]。
圖2 深度學(xué)習(xí)網(wǎng)絡(luò)模型
其中,CNN在語(yǔ)音識(shí)別、視覺(jué)識(shí)別以及圖像分類等方面應(yīng)用廣泛,并表現(xiàn)出獨(dú)特的優(yōu)勢(shì)[34]。CNN是一種前饋式多層神經(jīng)網(wǎng)絡(luò),其具有局部連接的結(jié)構(gòu),權(quán)重共享的特點(diǎn),并有較強(qiáng)的分層學(xué)習(xí)特征能力。CNN的基本結(jié)構(gòu)主要包括輸入層、卷積層、池化層(子采樣層)、全連接層以及輸出層五個(gè)部分(見(jiàn)圖3)。一個(gè)CNN結(jié)構(gòu)中至少存在一個(gè)卷積層,并且卷積層與池化層是成對(duì)出現(xiàn)的,即一個(gè)卷積層后面緊跟一個(gè)池化層,共同構(gòu)成特征提取器[35]。
圖3 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
卷積層是CNN網(wǎng)絡(luò)結(jié)構(gòu)的核心部分,主要作用是從樣本數(shù)據(jù)中提取樣本數(shù)據(jù)特征,并利用這些特征作為濾波器,對(duì)整幅影像進(jìn)行卷積運(yùn)算,最終獲得整幅影像每個(gè)位置不同特征的激活值[31]。其計(jì)算公式為
式中:為卷積層n的第j個(gè)特征圖;f為激活函數(shù);Mi為選擇輸入特征圖;為卷積層n-1的第i個(gè)特征圖;*為卷積操作;kij為上一卷積層第i個(gè)特征圖與本卷積層第j個(gè)特征圖之間的卷積核;為卷積層n的偏置值。
池化層是對(duì)圖像局部區(qū)域不同位置的特征進(jìn)行聚類統(tǒng)計(jì)運(yùn)算,以減少訓(xùn)練分類器的計(jì)算量,避免過(guò)擬合現(xiàn)象的發(fā)生。其計(jì)算公式為:
式中,f為激活函數(shù);為子采樣系數(shù);down()為子采樣函數(shù);為子采樣層n-1的第j個(gè)特征圖;為子采樣層n的偏置值。
卷積層與池化層組成的提取器所提取的是局部特征,全連接層的作用在于將提取的局部特征進(jìn)行優(yōu)化,通過(guò)權(quán)值矩陣獲得全局特征,以減少特征數(shù)量提高計(jì)算速度。其計(jì)算公式為
式中,f為激活函數(shù);wn為全連接網(wǎng)絡(luò)的權(quán)重系數(shù);xn-1為上一層的特征圖;bn為全連接層n的偏置值。
CNN本質(zhì)是構(gòu)建輸入與輸出的一種映射關(guān)系,根據(jù)輸入層的數(shù)據(jù)由低到高逐層提取特征,從而構(gòu)建一個(gè)從低級(jí)到高級(jí)特征的映射。在這個(gè)過(guò)程中,不需要具體的數(shù)學(xué)公式計(jì)算,只需要用已知的樣本數(shù)據(jù)對(duì)CNN進(jìn)行訓(xùn)練,從而構(gòu)建出具有輸入輸出能力的網(wǎng)絡(luò)[23]。本研究采用CNN深度學(xué)習(xí)方法對(duì)目標(biāo)地物進(jìn)行提取。
3.2 深度學(xué)習(xí)基本流程采用CNN深度學(xué)習(xí)方法,基于高空間分辨率的無(wú)人機(jī)遙感影像,對(duì)農(nóng)業(yè)區(qū)土地利用進(jìn)行分類,基本流程如圖4所示。在通過(guò)深度學(xué)習(xí)方法對(duì)特定的目標(biāo)地物進(jìn)行識(shí)別時(shí),首先需要建立目標(biāo)地物的樣本庫(kù),樣本庫(kù)構(gòu)建的質(zhì)量直接影響利用深度學(xué)習(xí)識(shí)別目標(biāo)地物的精度。因此,在建立樣本庫(kù)時(shí),每類地物的樣本庫(kù)應(yīng)該選取包含該類地物各種形態(tài)的面狀樣本數(shù)據(jù),并且盡量保證每類樣本庫(kù)都是“較純”樣本庫(kù),即每類樣本庫(kù)內(nèi)只存在本類樣本,不摻雜其他類型的樣本,以防止給模型的構(gòu)建以及訓(xùn)練帶來(lái)干擾,影響分類結(jié)果。研究區(qū)土地利用分類的樣本庫(kù)構(gòu)建如表2所示,樣本類型主要包括林地、裸地、建設(shè)用地、農(nóng)作物以及大棚等,其中建設(shè)用地包括建筑物和道路等,裸地包括收割后未種植的耕地。然后利用構(gòu)建的樣本庫(kù)訓(xùn)練模型,進(jìn)而利用訓(xùn)練好的模型對(duì)研究區(qū)域進(jìn)行土地利用分類,最終對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià)。
圖4 基于深度學(xué)習(xí)和無(wú)人機(jī)遙感影像識(shí)別目標(biāo)地物的流程圖
4.1 土地利用分類結(jié)果根據(jù)研究區(qū)下墊面類型特征,東雷二期抽黃灌區(qū)研究區(qū)域1面積為133 099.33 m2,土地利用分類主要包括林地、裸地、建設(shè)用地三類,研究區(qū)域2面積為168 698.41 m2,土地利用分類主要包括林地、農(nóng)作物、裸地、大棚、建設(shè)用地五類,分類結(jié)果如圖5和表3所示。因試驗(yàn)區(qū)為農(nóng)作物種植區(qū),主要土地利用類型以農(nóng)用地為主,包括裸地(收割后未種植耕地)、大棚、生長(zhǎng)中的農(nóng)作物等,建設(shè)用地、林地占比較少。兩個(gè)實(shí)驗(yàn)區(qū)內(nèi),裸地(收割后未種植耕地)所占比例最大,分別占試驗(yàn)區(qū)總面積的61.49%和51.69%,主要原因是無(wú)人機(jī)航拍時(shí)間為6月15日,冬小麥剛收割,大部分耕地未種植或已種植作物但并未長(zhǎng)出。區(qū)域1中林地占比較大,約為29.15%;區(qū)域2中大棚占比較大,約為27.56%。
表2 目標(biāo)地物樣本庫(kù)
圖5 基于深度學(xué)習(xí)的土地利用分類結(jié)果
表3 土地利用各類型所占面積及比例
4.2 精度驗(yàn)證與分析利用基于最大似然法的監(jiān)督分類方法與本方法進(jìn)行對(duì)比?;谧畲笏迫环ǖ姆诸惤Y(jié)果如圖6所示,并采用隨機(jī)抽樣方法,分別在每個(gè)研究區(qū)域影像上以均勻分布的原則選擇158個(gè)樣本點(diǎn),用于評(píng)價(jià)兩種方法的分類精度,樣本點(diǎn)分布情況如圖7所示。精度結(jié)果顯示,基于深度學(xué)習(xí)的土地利用分類,區(qū)域1總體精度為93.04%,Kappa系數(shù)為0.90;區(qū)域2總體精度為93.04%,Kap-pa系數(shù)為0.91?;谧畲笏迫环ǖ谋O(jiān)督分類,區(qū)域1總體精度81.65%,Kappa系數(shù)為0.73;區(qū)域2總體精度為70.26%,Kappa系數(shù)為0.62。
圖7 東雷二期抽黃灌區(qū)(區(qū)域1、區(qū)域2)樣本點(diǎn)分布圖
如表4—表7所示,在土地利用分類的混淆矩陣中可以看出,影像中林地、農(nóng)作物這兩類在顏色、紋理等特征上存在極大的相似性,難以完全有效區(qū)分開(kāi)。建筑物附近存在大量的樹(shù)木,且建筑物類型復(fù)雜,增大了分類難度,與林地間也存在部分混分現(xiàn)象。基于深度學(xué)習(xí)的土地利用分類效果較為理想,少數(shù)樣本點(diǎn)存在錯(cuò)分漏分現(xiàn)象。區(qū)域1中,錯(cuò)分誤差低至10.91%,漏分誤差低至9.26%,制圖精度達(dá)到90.74%,用戶精度達(dá)到89.09%。區(qū)域2中,錯(cuò)分誤差低至21.62%,漏分誤差低至13.33%,制圖精度為86.67%,用戶精度為78.36%。由于區(qū)域2比區(qū)域1中分類類別多,其分類精度略低于區(qū)域1的分類精度。而基于最大似然法的土地利用分類結(jié)果錯(cuò)分漏分現(xiàn)象較為嚴(yán)重,其中,建設(shè)用地錯(cuò)分為裸地、大棚的比例較高,林地與農(nóng)作物兩類混分現(xiàn)象較嚴(yán)重。區(qū)域1中,錯(cuò)分誤差高達(dá)36.07%,漏分誤差高達(dá)41.94%,制圖精度低至58.06%,用戶精度達(dá)到63.93%。區(qū)域2中,錯(cuò)分誤差高達(dá)50.00%,漏分誤差高達(dá)79.41%,制圖精度為20.59%,用戶精度為50.00%?;谏疃葘W(xué)習(xí)的土地利用分類結(jié)果優(yōu)于最大似然法的土地利用分類方法,尤其在分類類別較多的情況下優(yōu)勢(shì)更加明顯。
表4 東雷二期抽黃灌區(qū)區(qū)域1土地利用分類混淆矩陣(個(gè))
基于較高空間分辨率無(wú)人機(jī)航片與深度學(xué)習(xí)方法的農(nóng)業(yè)區(qū)土地利用分類,在地物邊界識(shí)別方面具有明顯優(yōu)勢(shì),如圖8所示,林地、農(nóng)作物、裸地的邊界能夠被清晰地識(shí)別并提取出來(lái)。但由于受陰影的影響,大棚和建設(shè)用地的邊界提取存在一定的誤差。
表5 東雷二期抽黃灌區(qū)區(qū)域1土地利用錯(cuò)分誤差、漏分誤差、制圖精度與用戶精度(%)
表6 東雷二期抽黃灌區(qū)區(qū)域2土地利用分類混淆矩陣(個(gè))
表7 東雷二期抽黃灌區(qū)區(qū)域2土地利用錯(cuò)分誤差、漏分誤差、制圖精度與用戶精度(%)
圖8 邊界識(shí)別提取
本文以東雷二期抽黃灌區(qū)具有下墊面代表性的小區(qū)域?yàn)檠芯繀^(qū),利用深度學(xué)習(xí)方法,針對(duì)較高空間分辨率的無(wú)人機(jī)航片影像,開(kāi)展了農(nóng)業(yè)區(qū)土地利用監(jiān)測(cè)分類研究,并利用基于最大似然法的監(jiān)督分類方法進(jìn)行對(duì)比,探究該方法對(duì)于農(nóng)業(yè)區(qū)土地利用監(jiān)測(cè)分類的適用性。主要結(jié)論如下:
(1)研究區(qū)的土地利用分類總體精度達(dá)到93%以上,Kappa系數(shù)為0.9以上,錯(cuò)分誤差低至21.62%,漏分誤差低至13.33%,制圖精度達(dá)到86.67%以上,用戶精度達(dá)到78.36%以上。錯(cuò)分誤差較大和用戶精度較低的類型為農(nóng)作物,漏分誤差較高和制圖精度較差的類型為大棚。并該方法的分類精度明顯優(yōu)于最大似然法,尤其在分類類別較多的情況下優(yōu)勢(shì)更加明顯。
(2)利用CNN深度學(xué)習(xí)方法對(duì)較高空間分辨率的無(wú)人機(jī)航片影像進(jìn)行土地利用分類,能夠更清晰地識(shí)別提取出地物邊界,如林地、農(nóng)作物以及裸地,但由于受陰影的影響,大棚和建設(shè)用地的邊界提取存在一定的誤差;林地與農(nóng)作物間,林地與建設(shè)用地間,由于顏色、紋理等特征相似性,存在混分現(xiàn)象;進(jìn)一步提高分類精度是未來(lái)該領(lǐng)域的研究方向之一。