黃健熙,侯矞焯,蘇 偉,劉峻明,朱德海
(中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京 100083)
基于GF-1 WFV數(shù)據(jù)的玉米與大豆種植面積提取方法
黃健熙,侯矞焯,蘇 偉,劉峻明,朱德海
(中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京 100083)
準確掌握農(nóng)作物的空間種植分布情況,對于國家宏觀指導(dǎo)農(nóng)業(yè)生產(chǎn)、制定農(nóng)業(yè)政策有重要意義。針對黑龍江省玉米與大豆生育期接近、光譜特征相似,較難區(qū)分的問題,以多時相16 m空間分辨率高分一號(GF-1)衛(wèi)星寬覆蓋(wide field of view, WFV)影像為數(shù)據(jù)源,選擇歸一化植被指數(shù)(normalized difference vegetation index, NDVI)、增強植被指數(shù)(enhanced vegetation index, EVI)、寬動態(tài)植被指數(shù)(wide dynamic range vegetation index, WDRVI)、歸一化水指數(shù)(normalized difference water index, NDWI)4個特征,結(jié)合實地調(diào)查樣本點,采用隨機森林分類算法,提取黑龍江省黑河市嫩江縣玉米與大豆種植面積。研究表明,區(qū)分玉米與大豆的最佳時段為9月下旬至10月上旬,即大豆已收獲而玉米未收獲的時段,在4個待選特征中,NDVI、NDWI與WDRVI指數(shù)組合表現(xiàn)最佳;隨機森林算法與最大似然算法、支持向量機算法相比,分類精度更高,其總體分類精度為84.82%,Kappa系數(shù)為77.42%。玉米制圖精度為91.49%,用戶精度為93.48%;大豆制圖精度為91.14%,用戶精度為82.76%。該方法為大區(qū)域農(nóng)作物的分類提供重要參考和借鑒價值。
遙感;提取;分類;隨機森林;大豆;玉米
黃健熙,侯矞焯,蘇 偉,劉峻明,朱德海. 基于GF-1 WFV數(shù)據(jù)的玉米與大豆種植面積提取方法[J]. 農(nóng)業(yè)工程學(xué)報,2017,33(7):164-170.doi:10.11975/j.issn.1002-6819.2017.07.021 http://www.tcsae.org
Huang Jianxi, Hou Yuzhuo, Su Wei, Liu Junming, Zhu Dehai. Mapping corn and soybean cropped area with GF-1 WFV data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(7): 164-170. (in Chinese with English abstract)doi:10.11975/j.issn.1002-6819.2017.07.021 http://www.tcsae.org
掌握農(nóng)作物的空間種植分布狀況,對于宏觀指導(dǎo)農(nóng)業(yè)生產(chǎn)、合理采取農(nóng)作物管理措施具有重要的現(xiàn)實意義,同時也為農(nóng)情監(jiān)測的提供了重要基礎(chǔ)數(shù)據(jù)。而傳統(tǒng)的農(nóng)業(yè)統(tǒng)計報表和抽樣調(diào)查,通常耗費大量人力物力,并且持續(xù)時間長,作業(yè)效率不高。遙感技術(shù)為大區(qū)域農(nóng)作物種植面積提取提供了有效的技術(shù)手段,國內(nèi)外學(xué)者從遙感數(shù)據(jù)源、分類方法等角度,對此進行了大量的研究。
植被指數(shù)能夠反映植物生長狀況,利用衛(wèi)星不同的波段數(shù)據(jù)組合而成,以高分一號(GF-1)衛(wèi)星[1-2]、HJ-1 A/B衛(wèi)星[3-5]或者Landsat衛(wèi)星[6-7]為數(shù)據(jù)源,利用時間序列影像獲取分類特征,精度較高,因此考慮利用時序植被指數(shù)影像等獲取玉米與大豆的光譜特征進行分類。與30 m空間分辨率、16 d重訪周期的Landsat8 OLI衛(wèi)星相比,國產(chǎn)GF-1衛(wèi)星16 m空間分辨率寬覆蓋(wide field of view, WFV)空間和時間分辨率(4 d)都較高,能夠獲得滿足玉米與大豆識別的關(guān)鍵生育期影像。因此,本文選擇GF-1衛(wèi)星作為遙感數(shù)據(jù)源。常用的分類算法,例如支持向量機(support vector machine,SVM)[4]、最大似然方法(maximum likelihood, ML)[8]、決策樹[9]等區(qū)分玉米與大豆,識別精度并不高。這是由于選用的分類指標如歸一化植被指數(shù)(normalized difference vegetation index,NDVI)較為單一,難以有效區(qū)分玉米與大豆,另一方面是因為分類器在獲取有效分類特征方面存在局限性。王利民等[10]基于Landsat-8 OLI數(shù)據(jù),從短波紅外重要性的角度,利用最大似然方法,區(qū)分玉米與大豆種植面積,但Landsat-8衛(wèi)星較長的回訪周期限制了關(guān)鍵生育期影像的獲取。陳思寧等[11-14]的研究針對玉米與大豆兩者的區(qū)分、單獨提取玉米或大豆,結(jié)合當?shù)刈魑镂锖颉⒌匦蔚忍攸c,利用作物波段特點、回歸樹或者波譜角分類(spectral angle mapper,SAM)分類器等進行分類提取,精度較好。但是國外學(xué)者研究區(qū)多選擇為巴西等大片單一作物種植地,降低了區(qū)分二者的難度。Hao等[15]研究了時間序列MODIS數(shù)據(jù)中特征的選擇對于分類的影響,時間序列數(shù)據(jù)中覆蓋作物關(guān)鍵生育期即7月和8月的時相最為重要。利用MODIS數(shù)據(jù)[15-20]與MODIS NDVI、MODIS EVI產(chǎn)品[20-24]進行大區(qū)域范圍內(nèi)的作物分類,均采用多時相數(shù)據(jù)使用不同的方法進行作物識別,精度較高。
黑龍江省種植的玉米與大豆生育期接近,光譜信息相似,利用遙感數(shù)據(jù)原始光譜波段難以進行區(qū)分,并且存在玉米與大豆混種的現(xiàn)象,加大了區(qū)分難度。近年來,隨機森林算法得到廣泛應(yīng)用。隨機森林(random forest,RF)分類器由Breiman提出[25],是一種自然的非線性建模工具。隨機森林基于統(tǒng)計學(xué)習(xí)理論,采用bootstrap重抽樣方法從原始訓(xùn)練集中選取多個樣本,且每個樣本的樣本容量與原始訓(xùn)練集中一樣,進而對每個選取的樣本建立相應(yīng)的決策樹模型,最終組合多棵決策樹的預(yù)測結(jié)果進行投票判斷。隨機森林預(yù)測準確率高,對異常值和噪聲具有很好的容忍度,并且不容易出現(xiàn)過擬合[26]。Ghosh等[27]在隨機森林提取等方面對Landsat數(shù)據(jù)進行分析得到了較理想的效果,劉毅等[28]也比較了多種方法發(fā)現(xiàn)隨機森林是精度最高的一種方法。然而,RF方法對玉米和大豆的有效區(qū)分是否適用仍然是一個需要探索的問題。本文采用隨機森林算法區(qū)分玉米和大豆,并給出最優(yōu)的區(qū)分時段。
1.1 研究區(qū)概況
本文研究區(qū)選擇為黑龍江省黑河市嫩江縣,位于黑龍江省西北部,地跨 124°44′30″~126°49′30″E,48°42′35″~51°00′05″N,面積超過15 000 km2,且縣內(nèi)地物類型分布較為復(fù)雜,增大了分類難度。如圖 1所示,嫩江縣底圖為高分一號真彩色圖像。嫩江縣包括九三農(nóng)場管理局所屬的絕大部分農(nóng)場,屬中溫帶半濕潤大陸季風(fēng)氣候,年平均無霜期 80~130 d,雨熱同季,年日照2 728.2 h,年平均氣溫0.4 ℃左右,全縣從南至北積溫在2 500~1 600 ℃之間,光照充足,適合多種作物生長。多年平均降水量為500 mm,縣內(nèi)河流屬嫩江水系。
圖1 研究區(qū)樣本點分布示意圖Fig.1 Location of sampling points in study area
在正常年份,玉米于4月25日至30日播種,5月15日至20日出苗,6月15日至20日拔節(jié),7月10日至15日抽雄,成熟于9月10日至15日,收獲于10月中下旬;在嫩江縣北部的農(nóng)場,大豆于陽歷5月15日至20日播種,南部的農(nóng)場播種日期則在4月末,10 d左右出苗,經(jīng)過90至110 d后,大豆成熟,收獲于9月中旬。
嫩江縣土地肥沃,適宜大豆、小麥、玉米、甜菜、馬鈴薯等作物生長,是農(nóng)牧生產(chǎn)的黃金地帶,中國著名的麥、豆生產(chǎn)基地,國家重要的商品糧食生產(chǎn)基地,中國“大豆之鄉(xiāng)”。只有少量的水稻種植,因此是研究大豆、玉米作物面積提取的理想研究區(qū)。
1.2 GF-1 WFV時間序列數(shù)據(jù)集
高分一號(GF-1)衛(wèi)星搭載的4臺多光譜相機(WFV)幅寬可達800 km,包括藍(0.45~0.52μm)、綠(0.52~0.59μm)、紅(0.63-0.69μm)、近紅外(0.77~0.89μm)4個波段,空間分辨率達到16 m,重訪周期為2 d,同時具有較高空間和時間分辨率的特點,能獲取無云的作物關(guān)鍵生育期的遙感影像??紤]到所選影像應(yīng)該在同一天內(nèi)覆蓋嫩江縣,且影像應(yīng)該無云或少云,因此選取在玉米、大豆、小麥等主要種植作物生長季(2015年4月至9月)的7個時相的遙感數(shù)據(jù)[15],分別為2015年4月14日、2015年5月20日、2015年6月26日、2015年7月16日、2015年8月26日、2015年9月4日、2015年9 月29日。
影像的預(yù)處理包括輻射定標、大氣校正和幾何校正、拼接裁剪。大氣校正模型采用6S(second simulation of the satellite signal in the solar spectrum)模型,得到真實地表反射率數(shù)據(jù),可以用于作物分類研究。幾何校正是先采用影像自帶RPC(rational polynomial coefficient)文件進行正射校正,再以同時期Landsat-8影像為基準進行幾何精校正,最終獲得GF-1 WFV時間序列數(shù)據(jù)集。
1.3 實地調(diào)查數(shù)據(jù)
為獲取黑龍江省黑河市嫩江縣主要地物類型的分布,2015年9月對嫩江縣進行地面實地調(diào)查(圖1)。野外調(diào)查時采用手持GPS(global positioning system)測量特征地塊的經(jīng)緯度坐標并記錄植被類型、拍攝照片,調(diào)查路線覆蓋嫩江縣絕大部分農(nóng)場,農(nóng)場外農(nóng)田中也有少量樣本點被采集,而嫩江縣北部為伊勒呼里山、東部為小興安嶺,多為林地,故沒有在此采集樣本點。此次調(diào)查共獲取樣本點757個,其中玉米315個,大豆264個,小麥23個,其他植被113個,建設(shè)用地28個,水體14個。
依據(jù)研究區(qū)主要作物種植情況結(jié)合野外調(diào)查數(shù)據(jù),在嫩江縣極少有水稻分布,因此水稻不單獨作為提取作物中的一類。此外,實地調(diào)查還發(fā)現(xiàn)有零星分布種植的蔬菜水果等,本研究中將其與林地、荒草、瓜果、高粱等歸為其他植被一類。因此分類類別包括大豆、玉米、小麥、其他植被、建設(shè)用地、水體共6類。
將選取的黑龍江省黑河市嫩江縣多時相 GF-1 WFV影像進行預(yù)處理,計算特征變量后產(chǎn)生特征變量數(shù)據(jù)集,結(jié)合訓(xùn)練樣本集輸入隨機森林分類器中進行分類識別,在分類器中進行多棵決策樹的構(gòu)建并且對結(jié)果進行投票得出最后分類結(jié)果,然后根據(jù)驗證樣本集進行精度評價。具體流程如圖2所示。
2.1 特征指數(shù)數(shù)據(jù)集
由于玉米與大豆 2種作物的光譜特征相似,因此不將原始數(shù)據(jù)波段作為待選分類特征。而根據(jù)黑龍江省黑河市嫩江縣當?shù)氐淖魑锓N植結(jié)構(gòu)以及已有遙感影像等,選擇能夠檢測植被綠度、植被覆蓋度的NDVI,具有校正土壤背景和氣溶膠散射影響的增強植被指數(shù)(enhanced vegetation index,EVI),歸一化水指數(shù)(normalized difference water index,NDWI)。其中計算公式(2)系數(shù)G、C1、C2、L根據(jù)文獻[29]進行取值。此外,還選用了寬動態(tài)植被指數(shù)(wide dynamic range vegetation index,WDRVI),該指數(shù)中利用一個比重系數(shù)來縮小近紅外波段和紅波段對植被指數(shù)貢獻之間的差距,研究表明比重系數(shù)取 0.2時能夠使得玉米和大豆的植被指數(shù)與其生物量有最優(yōu)線性擬合,能有效區(qū)分玉米與大豆2種作物[14],避免了NDVI等指數(shù)在2種作物上相近特征。
圖2 分類流程圖Fig.2 Flowchart of classification
根據(jù)預(yù)處理后得到的GF-1多光譜反射數(shù)據(jù),計算4種指數(shù),用其對嫩江縣地區(qū)的主要農(nóng)作物進行動態(tài)監(jiān)測,計算公式如下。
式中ρNIR、ρRED、ρBLUE、ρGREEN分別為近紅外波段、紅波段、藍波段、綠波段的反射率;G為增益因子,取值2.5[29];C1、C2為氣溶膠阻抗系數(shù),取值6和7.5[29];C1、C2為氣溶膠阻抗系數(shù),取值6[29]和7.5[29];L為冠層背景調(diào)整因子,取值1[29];α為權(quán)重系數(shù),取值0.2[14]。
2.2 分類過程
將上述計算得到的7個時相的4種指數(shù)圖像(共28景)疊加,已獲取的 757個地面調(diào)查點隨機挑選,按照7:3的比例[30]將其分為訓(xùn)練樣本點(533個)與驗證樣本點(224個),然后將待分類影像與訓(xùn)練樣本點輸入到隨機森林分類器中,獲得最終的分類結(jié)果。
3.1 典型地物時間序列變化分析
根據(jù)嫩江縣主要作物的物候期特征以及典型地物時序變化圖,玉米與大豆的播種期在4月末至5月中旬,在5月20日的影像中NDVI、EVI值較低,由于小麥于3月底播種,到5月20日時其值已經(jīng)較高,可以將小麥有效區(qū)分。在圖3,根據(jù)NDVI、EVI、WDRVI、NDWI時序變化曲線可以看出玉米與大豆2種作物在4~6月變化趨勢較為接近,在7~9月4種指數(shù)的值差異較大且變化趨勢也不同,其中在9月29日4種指數(shù)的值差異最大,能夠較好的區(qū)分玉米與大豆,這是因為大豆在9月29日已經(jīng)完成收獲,而玉米還未收獲,玉米種植地的植被覆蓋度快速降低而大豆種植地的植被覆蓋度變化相對較小,表現(xiàn)為這2種作物在該時期的NDVI、EVI和WDRVI時序曲線值差異較大。而建設(shè)用地和水體 2類時序曲線整體變化趨勢比較穩(wěn)定,與植被差異較大,其中水體在NDVI時序曲線圖中表現(xiàn)為最低值而在NDWI時序曲線中表現(xiàn)為最高值,建設(shè)用地在 NDVI時序曲線圖中的值僅高于水體卻低于植被,有利于區(qū)分水體、建設(shè)用地和植被。
圖3 2015年典型地物時序變化Fig.3 Temporal changes of main crops in 2015
3.2 不同指數(shù)組合的分類精度對比
由圖 3可知由同一地物的光譜值計算得到的不同指數(shù)值有較大差異,為評估不同指數(shù)組合對分類精度的影響與貢獻度,利用待選取的NDVI、EVI、WDRVI、NDWI 共 4個特征組合,分別進行分類提取,得到不同特征組合下的提取精度(圖4)。
由圖4可以直觀的看出,玉米與大豆2種作物的最佳區(qū)分特征為NDVI、NDWI、WDRVI 3者組合,且其總體分類精度在所有組合中也是最高的,大豆的用戶精度達到82%、制圖精度達到94%,玉米的用戶精度達到92%、制圖精度達到89%。由圖4中第2~第4組合中可知,NDVI分別與EVI、NDWI、WDRVI組合時并沒有提高分類精度,如大豆的用戶精度保持在 80%,這可能是因為NDVI能夠較好地反映植被的綠度特征[2],在此基礎(chǔ)上再增加其他植被特征時會提高分類精度,如分類時在特征組合NDVI、NDWI的基礎(chǔ)上增加WDRVI特征,大豆的制圖精度提高了5%。在圖4最后2個組合即特征組合NDVI、NDWI、EVI和特征組合NDVI、EVI、NDWI、WDRVI中,由于EVI的加入降低了大豆的分類精度,這可能是因為EVI適用于植被茂密區(qū),而大豆植株較為矮小并不適宜使用EVI獲取特征信息[14],加入分類器中反而會影像決策樹的建立,因此 4種特征組合時并沒有提高3種待選特征組合時的提取精度。
圖4 不同特征組合下的分類精度Fig.4 Classification accuracy of combinations of different features
將7個時相的GF-1影像輸入到隨機森林分類器中,根據(jù)NDVI、NDWI、WDRVI 3種特征組合進行分類提取,獲得嫩江縣主要農(nóng)作物分布圖(圖5)。從圖5中可以看出玉米與大豆多分布在嫩江縣中部與西南部(多為國營農(nóng)場所在地),北部也有少量分布,其中玉米種植面積多于大豆種植面積;圖 5中,其他植被類多分布在北部與東部,原因為嫩江縣林地、荒草等多分布在嫩江縣的北部與東部;小麥在嫩江縣分布較為零散,與實地調(diào)查情況相符。
圖5 嫩江縣分類結(jié)果Fig.5 Classification results in Nenjiang County
本研究中以利用隨機森林算法分類過程中確定的222個驗證樣本點對分類結(jié)果進行精度驗證。驗證樣本點包括大豆79個、玉米94個、小麥6個、其他植被31個,建設(shè)用地8個,水體4個。各作物樣本點提取精度結(jié)果如表1所示。
表1 地物識別混淆矩陣Table1 Confusion matrix of crops identification
如表 1所示,在所有驗證樣本點中,被正確分類的樣本點有190個,總體樣本精度為84.82%,由計算式(5)計算得來的Kappa系數(shù)(Kappa coefficient)為77.42%。玉米驗證樣本點共94個,被正確分類的樣本點有86個;大豆驗證樣本點共79個,被正確分類的樣本點為72個:玉米與大豆2類的訓(xùn)練樣本點較多,其分類精度也較高,但是由于玉米與大豆播種時間相近,生育期中光譜特征等比較相似,因此玉米與大豆較難區(qū)分,也能夠解釋表中玉米與大豆錯分的現(xiàn)象。小麥驗證樣本點共 6個,被正確分類的樣本點為 5個:由于小麥樣本點較少,能夠放入分類器中的訓(xùn)練樣本點也較少,沒有充分的訓(xùn)練樣本,隨機森林分類器所得分類精度不高。其他植被類驗證樣本點共31個,被正確分類的樣本點為16個:在其他植被類中,由于將林地、荒草、瓜果、高粱等都放入其中,光譜差異較大,會影響隨機森林分類器中決策樹的構(gòu)建,分類精度自然較低,由此也可以解釋其他植被類樣本點中錯分為其他作物的樣本點也較多,其他作物中錯分為其他植被類中的樣本點也較多。建設(shè)用地驗證樣本點共8個,被正確分類的樣本點為7個;水體驗證樣本點共4個,被正確分類的樣本點為4個:對于建筑用地和水體 2類,其光譜特征與植被差異很大,不同于小麥訓(xùn)練樣本點數(shù)量少造成的分類精度較低,在其訓(xùn)練樣本點數(shù)量較少的情況下仍能有效的與植被類進行區(qū)分,分類精度相對較高。
式中Po為實際一致率,Pe為理論一致率[31]。
3.3 分類算法對比
為進一步驗證本文所采用的隨機森林算法的有效性,將隨機森林算法分類結(jié)果與最大似然算法、SVM算法分類結(jié)果進行對比分析。黑龍江九三農(nóng)場管理局下大部分農(nóng)場都位于嫩江縣,選擇位于嫩江縣并且種植大量玉米與大豆 2種作物的嫩江農(nóng)場作為驗證區(qū),該農(nóng)場位于嫩江縣東南部,面積489 km2。
本研究利用與上文中相同的實地調(diào)查點信息,其中嫩江農(nóng)場包括大豆樣本點52個、玉米樣本67個。以嫩江農(nóng)場為驗證區(qū)分別進行最大似然分類與SVM分類,分類結(jié)果如圖6所示。圖7為玉米與大豆樣本個數(shù)統(tǒng)計。
圖6 3種分類算法分類結(jié)果Fig.6 Classification results based on three methods
圖7 玉米與大豆樣本個數(shù)統(tǒng)計Fig.7 Statistic number of corn and soybean samples
從圖6可以看出,隨機森林算法、SVM算法、最大似然算法 3種算法中隨機森林算法分類精度最高,表現(xiàn)為分類地塊較為完整,并且能夠分類出絕大部分農(nóng)田。由圖6和圖7可知,隨機森林算法將所有樣本點所在種植區(qū)全部識別出來,效果最好;最大似然算法分類結(jié)果最差,與圖 6中結(jié)果一致。這是由于最大似然算法是一種基于統(tǒng)計的算法,通過計算樣本間的似然度來判別像元是否歸屬于某一類,而在嫩江農(nóng)場中玉米與大豆均有種植且分布不規(guī)律,其光譜特征等較為相似,增大了通過似然度判別地類的難度,結(jié)果較差;SVM算法是建立在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上的機器學(xué)習(xí)方法,其主要思想是在高維空間中尋找一個超平面作為 2類的分割,與最大似然算法相比具有更多的學(xué)習(xí)過程,且分類結(jié)果優(yōu)于最大似然分類,但是玉米與大豆 2類作物相似的光譜特性依舊影響了SVM分類器分類精度。而隨機森林算法通過構(gòu)建多棵決策樹進行投票決定最終分類結(jié)果,能夠在一定程度上避免 1次分類帶來的誤差,對于玉米和大豆 2種作物的區(qū)分尤為有效,圖6和圖7也表明了這一點。
本文以 2015年大豆、玉米生長季內(nèi)的高分一號(GF-1)數(shù)據(jù)為數(shù)據(jù)源,以黑龍江省黑河市嫩江縣為研究區(qū),通過利用嫩江縣主要作物的物候期,將歸一化植被指數(shù)(normalized difference vegetation index,NDVI)等植被指數(shù)時序數(shù)據(jù)集、歸一化水指數(shù)(normalized difference water index,NDWI)時序數(shù)據(jù)集、大量的實地調(diào)查樣本點輸入到隨機森林分類器中進行決策樹構(gòu)建,提取了2015年的主要農(nóng)作物的空間分布信息,得到以下結(jié)論:
1)采用隨機森林分類器,嫩江縣典型地物分類總體精度達到84.82%,Kappa系數(shù)達到77.42%。
2)在黑龍江地區(qū)區(qū)分玉米和大豆的最優(yōu)時間為9月下旬至10月上旬,即大豆已收獲而玉米未收獲的時間。而在4個分類特征中,NDVI、NDWI和WDRVI 3個特征組合在提取玉米與大豆 2種作物時精度最高,NDVI 和WDRVI指數(shù)的貢獻度最大。
3)與最大似然算法、SVM算法相比,隨機森林算法分類精度最高。但是高精度隨機森林算法通常需要較多的訓(xùn)練樣本和較長的模型訓(xùn)練時間。因此,在實際應(yīng)用時需要綜合考慮模型精度和執(zhí)行效率。
[1] 黃健熙,賈世靈,武洪峰,等. 基于GF-1 WFV影像的作物面積提取方法研究[J]. 農(nóng)業(yè)機械學(xué)報,2015(增刊 1):253-259. Huang Jianxi, Jia Shiling, Wu Hongfeng, et al. Extration method of crop planted area based on GF-1 WFV image[J]. Transactions of The Chinese Society for Agricultural Machinery, 2015(Supp.1): 253-259. (in Chinese with English abstract)
[2] 楊閆君,占玉林,田慶久,等. 基于 GF-1/WFVNDVI時間序列數(shù)據(jù)的作物分類[J]. 農(nóng)業(yè)工程學(xué)報,2015(24):155-161. Yang Yanjun, Zhan Yulin, Tian Qingjiu, et al. Crop classification based on GF-1/WFV NDVI time series[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015(24): 155-161. (in Chinese with English abstract)
[3] 李鑫川,徐新剛,王紀華,等. 基于時間序列環(huán)境衛(wèi)星影像的作物分類識別[J]. 農(nóng)業(yè)工程學(xué)報,2013,29(2):169-176. Li Xinchuan, Xu Xingang, Wang Jihua, et al. Crop classification recognition based on time-series images from HJ satellite[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(2): 169-176. (in Chinese with English abstract)
[4] 劉慶生,黃翀,劉高煥,等. 基于關(guān)鍵期HJ衛(wèi)星數(shù)據(jù)提取無棣縣作物種植面積[J]. 中國農(nóng)學(xué)通報,2014,30(26):284-290. Liu Qingsheng, Huang Chong, Liu Gaohuan, et al. Planting area extraction of a crop key growth period in Wudi County based on HJ satellite data[J]. Chinese Agricultural Science Bulletin, 2014, 30(26): 284-290. (in Chinese with English abstract)
[5] 周靜平,李存軍,史磊剛,等. 基于決策樹和面向?qū)ο蟮淖魑锓植夹畔⑦b感提取[J]. 農(nóng)業(yè)機械學(xué)報,2016,47(9):318-326.. Zhou Jingping, Li Cunjun, Shi Leigang, et al. Crops distribution remote sensing extraction based on decision tree and object-oriented method[J]. Transactions of The Chinese Society for Agricultural Machinery, 2016, 47(9): 318-326. (in Chinese with English abstract)
[6] Dong Jinwei, Xiao Xiangming, Kou Weili, et al. Tracking the dynamics of paddy rice planting area in 1986-2010 through time series Landsat images and phenology-based algorithms[J]. Remote Sensing of Environment, 2015, 160: 99-113.
[7] Dong Jinwei, Xiao Xiangming, Menarguez M A., et al. Mapping paddy rice planting area in northeastern Asia with Landsat 8 images, phenology-based algorithm and Google Earth Engine[J]. Remote Sensing of Environment, 2016,185:142.
[8] 徐新剛,李強子,周萬村,等. 應(yīng)用高分辨率遙感影像提取作物種植面積[J]. 遙感技術(shù)與應(yīng)用,2008,23(1):17-23. Xu Xingang, Li Qiangzi, Zhou Wancun, et al. Classification application of QuickBird imagery to obtain crop planting area[J]. Remote Sensing Technology and Application, 2008, 23(1): 17-23. (in Chinese with English abstract)
[9] 馬麗,徐新剛,賈建華,等. 利用多時相TM影像進行作物分類方法[J]. 農(nóng)業(yè)工程學(xué)報,2008,24(增刊2):191-195. Ma Li, Xu Xingang, Jia Jianhua, et al. Crop classification method using multi-temporal TM images[J].Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2008, 24(Supp.2): 191-195. (in Chinese with English abstract)
[10] 王利民,劉佳,楊玲波,等. 短波紅外波段對玉米大豆種植面積識別精度的影像[J]. 農(nóng)業(yè)工程學(xué)報,2016,32(19):169-178. Wang Limin, Liu Jia, Yang Lingbo. Impact of short infrared wave band on identification accuracy of corn and soybean area[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(19): 169-178. (in Chinese with English abstract)
[11] 陳思寧,趙艷霞,申雙和. 基于波譜分析技術(shù)的遙感作物分類方法[J]. 農(nóng)業(yè)工程學(xué)報,2012,28(5):154-160. Chen Sining, Zhao Yanxia, Shen Shuanghe. Crop classification by remote sensing based on spectral analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 288(5): 154-160. (in Chinese with English abstract)
[12] Maxwell S K, Nuckols J R, Ward M H, et al. An automated approach to mapping corn from Landsat imagery[J]. Computers And Electronics In Agriculture, 2004, 43(1): 43-54.
[13] Chang J, Hansen M C, Pittman K, et al. Corn and soybean mapping in the united states using MODIS time-series data sets[J]. Agronomy Journal, 2007, 99(6): 1654-1664.
[14] De Souza C H W, Mercante E, Johann J A, et al. Mapping and discrimination of soya bean and corn crops using spectro-temporal profiles of vegetation indices[J]. International Journal of Remote Sensing, 2015, 36(7): 1809-1824.
[15] Hao Pengyu, Zhan Yulin, Wang Li, et al. Feature selection of time series MODIS data for early crop classification using random forest: A case study in Kansas, USA[J]. Remote Sensing, 2015, 7(5): 5347-5369.
[16] Franch B, Vermote E F, Becker-Reshef I, et al. Improving the timeliness of winter wheat production forecast in the United States of America, Ukraine and China using MODIS data and NCAR growing degree day information[J]. Remote Sensing of Environment, 2015, 161: 131-148.
[17] Wu Zhuoting, Thenkabail P S, Rick M, et al. Seasonal cultivated and fallow cropland mapping using MODIS-based automated cropland classification algorithm[J]. Journal of Applied Remote Sensing, 2014, 8(1): 397-398.
[18] Sakamoto T, Wardlow B D, Gitelson A A, et al. A Two-Step Filtering approach for detecting maize and soybean phenology with time-series MODIS data[J]. Remote Sensing of Environment, 2010, 114(10): 2146-2159.
[19] Pittman K, Hansen M C, Becker-Reshef I, et al. Estimating global cropland extent with multi-year MODIS Data[J]. Remote Sensing, 2010, 2(7): 1844-1863.
[20] Ozdogan M. The spatial distribution of crop types from MODIS data: Temporal unmixing using independent component analysis[J]. Remote Sensing of Environment, 2010, 114(6): 1190-1204.
[21] Pan Yaozhong, Li Le, Zhang Jinshui, et al. Winter wheat area estimation from MODIS-EVI time series data using the crop proportion phenology index[J]. Remote Sensing of Environment, 2012, 119(3): 232-242.
[22] Damien A, Milton J, Dubreuil V, et al. Classification of MODIS EVI time series for crop mapping in the state of Mato Grosso, Brazil[J]. International Journal of Remote Sensing,2011, 32(22): 7847-7871.
[23] Wardlow B D, Egbert S L, Kastens J H. Analysis of time-series MODIS 250 m vegetation index data for crop classification in the US Central Great Plains[J]. Remote Sensing of Environment, 2007, 108(3): 290-310.
[24] Wardlow B D, Egbert S L. Large-area crop mapping using time-series MODIS 250 m NDVI data: An assessment for the US Central Great Plains[J]. Remote Sensing of Environment, 2008, 112(3): 1096-1116.
[25] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[26] 方匡南,吳見彬,朱建平,等. 隨機森林方法研究綜述[J].統(tǒng)計與信息論壇,2011,26(3):32-38. Fang Kuangnan, Wu Jianbin, Zhu Jianping, et al. A review of technologies on random forests[J]. Statistics & Information Forum, 2011, 26(3): 32-38. (in Chinese with English abstract)
[27] Ghosh A, Sharma R, Joshi P K. Random forest classification of urban landscape using Landsat archive and ancillary data: Combining seasonal maps with decision level fusion[J]. Applied Geography, 2014, 48(2): 31-41.
[28] 劉毅,杜培軍,鄭輝,等. 基于隨機森林的國產(chǎn)小衛(wèi)星遙感影像分類研究[J]. 測繪科學(xué),2012,37(4):198-200. Liu Yi, Du Peijun, Zheng Hui, et al. Classification of China small satellite remote sensing image based on random forests[J]. Science of Surveying and Mapping, 2012, 37(4): 198-200. (in Chinese with English abstract)
[29] Liu H Q, Huete A. A feedback based modification of the NDVI to minimize canopy background and atmospheric noise[J]. IEEE Transactions on Geoscience And Remote Sensing, 1995, 33(2): 457-465.
[30] 劉勇洪,牛錚. 基于MODIS遙感數(shù)據(jù)的宏觀土地覆蓋特征分類方法與精度分析研究[J]. 遙感技術(shù)與應(yīng)用,2004, 19(4):217-224. Liu Yonghong, Niu Zheng. Regional land cover image classification and accuracy evaluation using MODIS Data[J]. Remote Sensing Technology and Application, 2004, 19(4): 217-224. (in Chinese with English abstract)
[31] 田苗,王鵬新,嚴泰來,等. Kappa系數(shù)的修正及在干旱預(yù)測精度及一致性評價中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報,2012, 28(24):1-7. Tian Miao, Wang Pengxin, Yan Tailai, et al. Adjustment of Kappa coefficient and its application in precision and agreement evaluation of drought forecasting models[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(24): 1-7. (in Chinese with English abstract)
Mapping corn and soybean cropped area with GF-1 WFV data
Huang Jianxi, Hou Yuzhuo, Su Wei, Liu Junming, Zhu Dehai
(College of Information and Electrical Engineering, China Agricultural University, Beijing100083, China)
Planting area and spatial distribution information of crops are vital for guiding agricultural production, taking effective management measurements, and monitoring crop growth conditions. Numerous crop classification algorithms have been developed with rapid development of different remote sensing data. However, distinguishing of corn and soybean cropping areas still remains a difficult challenge due to their similar growth calendar and spectral characteristics. In this study, we tried to identify corn and soybean cropping area using random forest (RF) classifier which has been proved to be an effective method in land cover classification based on multi-temporal GF-1 WFV (wide field of view) imagery. We selected Nenjiang County, Heilongjiang Province in China as the study area which was called the Town of Soybean. Seven GF-1 WFV time-series images (April 14th, May 20th, June 26th, July 16th, August 26th, September 4th, and September 29th), from which the key growth stages could be extracted and the effects of clouds could be avoided, were chosen to classify main crops. First, we conducted atmospheric and geometric corrections on multi-temporal GF-1 imagery. In order to improve the accuracy of distinguishing corn and soybean cropping area, the parameters of RF classifier were input, which included normalized difference vegetation index (NDVI), wide dynamic range vegetation index (WDRVI), enhanced vegetation index (EVI), and normalized difference water index (NDWI), and hundreds of field sample points were collected in the field survey. Also, it’s necessary to evaluate the importance of different combination of these indices. The results showed that the combination of NDVI, WDRVI and NDWI achieved the best accuracy with the producer accuracy of 91.14% for soybean and 91.49% for corn, and with the user accuracy of 82.76% for soybean and 93.48% for corn. Then, the support vector machine (SVM) and maximum likelihood (ML) supervised classifiers were also used to map corn and soybean cropping areas; the classification results from the SVM and ML methods were compared with that from the RF approach with the Nenjiang Farm as the case study. The comparisons showed that the crop classification from the RF classifier had the higher accuracy than the others. Our results indicated that GF-1 data had particular advantages in mapping cropping area with its higher spatial and temporal resolutions, and could provide more effective remote sensing data during crop growth season. The temporal changes of main crops showed the best classifying date was September 29thwhen soybean has been harvested but corn hasn’t, and their vegetation indices showed the maximum difference. The multi-temporal imagery contributed to the separation of different spectral feature curves of different crops in the growth stages when crops had similar temporal variation profiles, which helped to decrease the omission and commission errors of the resultant mapping. The results also showed that the extracted spectral information of water and construction land was very different from vegetation and could be easily masked. Comparing the SVM and ML classifiers with RF classifier, the results suggested that RF classifier could successfully distinguish corn and soybean, and its overall accuracy reached up to 84.82%. This study provides important reference for crop mapping in other agricultural regions.
remote sensing; extraction; classification; random forest; soybean; corn
10.11975/j.issn.1002-6819.2017.07.021
TP79; S127
A
1002-6819(2017)-07-0164-07
2016-10-06
2017-04-11
國家自然科學(xué)基金資助 (41671418, 41471342,41371326)
黃健熙,男,副教授,博士,博士生導(dǎo)師,主要從事定量遙感等研究。北京 中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,100083.
Email:jxhuang@cau.edu.cn