孫家波 張曉艷 牛魯燕 劉延忠 劉炳福 張維戰(zhàn)
摘要:本研究以北京市昌平區(qū)作為研究區(qū)域,基于2.5 m空間分辨率的SPOT5遙感影像,同時利用SEaTH算法和CART決策樹兩種分類方法,在自動獲取分類規(guī)則的基礎上,實現了對耕地信息的快速提取。結果表明,兩種分類方法的總體精度均在90%以上,KAPPA系數均能達到0.80;SEaTH算法與CART決策樹相比,在從高分辨率遙感影像中快速提取耕地專題信息時,耕地的漏分現象得到明顯改善,且分類的穩(wěn)定性更好。
關鍵詞:高分辨率遙感影像;耕地;信息提??;面向對象影像分析
中圖分類號:S127文獻標識號:A文章編號:1001-4942(2018)02-0132-06
Abstract In this paper, Changping District of Beijing City was selected as research area, and its farmland information was extracted from 2.5-meter SPOT5 remotely-sensed images using SEaTH and CART methods on the basis of automatic access to classification rules. The results showed that the overall accuracy of the two classification methods were above 90%, and the KAPPA coefficient could reach 0.80. Compared with CART method, the leakage of farmland was decreased obviously and the classification stability was better using SEaTH method.
Keywords High-resolution remotely-sensed image; Farmland; Information extraction; Object-based image analysis
耕地的數量和質量關系著我國的糧食安全。隨著社會經濟發(fā)展和城鎮(zhèn)化進程的加劇,非法占用耕地的現象隨處可見,耕地面積逐漸減少。為了有效保護耕地資源,國土資源部先后提出了“保持耕地總量動態(tài)平衡”和“嚴守20億畝耕地紅線”等目標,并于2014年下發(fā)了《關于強化管控落實最嚴格耕地保護制度的通知》,提出了新形勢下耕地保護的新目標、新要求和新舉措。耕地數量及分布信息的獲取是實現耕地保護的前提,也能夠為耕地動態(tài)監(jiān)測、耕地地力調查與評價、基本農田劃定等提供數據支持。
遙感技術能夠從廣域和局域的空間尺度客觀地獲取耕地信息,基于遙感影像的耕地信息提取一直以來也是研究的熱點。隨著遙感技術的發(fā)展和國內外高分辨率衛(wèi)星的發(fā)射,目前高分辨率影像在測繪制圖、交通建設、資源環(huán)境、災害監(jiān)測和國土管理等領域已得到廣泛應用。高分辨率影像能夠清晰、準確地表達地物的邊界、形狀、表面紋理、內部結構和空間關系,因此能夠充分利用影像信息進行耕地信息提取,提取的結果從數量和空間分布上也更為可信。但是,高分辨率影像自身的特點也為耕地信息的快速提取帶來了一定的難度和挑戰(zhàn),主要體現在:(1)類內差異增強。以耕地為例,耕地與周圍地物在空間上鑲嵌并相互交織,構成一些不易識別的混合體,同時由于土壤屬性、作物組成、種植方式等的差異,造成耕地內部的光譜差異。(2)干擾因素復雜。由于影像內容的高度細節(jié)化,加上地物邊緣部分的模糊性及地物內部區(qū)域的陰影遮擋等,導致影像內部“同物異譜”現象突出,“異物同譜”現象也依舊存在。(3)數據量急劇增加。覆蓋一個縣域行政區(qū)的數據量通常超過若干GB。(4)自動化處理難度增加。高度細節(jié)化及結構獨立化使得解譯對象的數量急劇增加,而適用于高分辨率影像自動解譯的技術非常缺乏,且遠未達到實用化階段。
國內外眾多研究已表明,面向對象的影像分析比傳統(tǒng)的基于像素的分類更適合于高分辨率影像專題信息提取。面向對象的影像分析主要包含分割和分類兩個過程,由于均需要較多的人工參與,分類自動化程度較低,導致實際應用中高分辨率影像仍然以目視解譯為主。分類過程難點主要集中在分類規(guī)則的自動獲取,目前常用的方法包括CART(Classification and Regression Tree)決策樹和SEaTH(Separability and Thresholds)算法。CART決策樹的基本原理是通過由測試變量和目標變量構成的訓練數據集的循環(huán)分析形成二叉樹結構的決策樹,其結構清晰,易于理解,能夠清晰地指出變量對分類的重要性。Laliberte等結合CART決策樹和面向對象影像分析技術,實現了對濕地植被覆蓋的分類[1]。SEaTH算法基本原理是首先利用J-M(Jeffries-Matudita)距離衡量兩兩類別之間基于某特征的可分離性,選擇分離度較高的特征作為類別區(qū)分的顯著特征,其次基于高斯概率分布混合模型確定顯著特征對應的最佳閾值,以保證當使用該閾值時兩兩類別之間的混分最少。Nussbaum利用SEaTH算法基于航片、ASTER影像、QuickBird影像等,對核設施進行面向對象分類和變化檢測,均取得了較高的精度[2];Gao等利用SEaTH算法對ETM+影像進行土地覆蓋分類,并與面向對象的最鄰近分類和基于像素的最大似然分類進行比較,精度分別為79%、66%和69%,證明了該算法同樣適用于中分辨率影像[3]。
CART決策樹和SEaTH算法均能解決分類規(guī)則自動獲取的問題,前者雖然能夠直接得到分類決策樹,但是需要同時兼顧所有地類,針對性差;后者基于兩兩地類進行分析,針對性較強,能夠直接提取典型地類專題信息。因此,本研究以北京市昌平區(qū)為例,選用SPOT5高分辨率遙感影像,利用SEaTH算法實現耕地分類規(guī)則的自動構建,提取耕地專題信息,并與CART決策樹方法的結果進行對比分析,為實現高分辨率影像其他典型地類的專題信息快速提取提供借鑒。
1 研究區(qū)概況與研究方法
1.1 研究區(qū)概況
研究區(qū)選擇北京市昌平區(qū)百善鎮(zhèn),該區(qū)域耕地以種植玉米、小麥和大豆為主,設施農業(yè)也占了一定的比例,以蔬菜、草莓等溫室大棚為主。試驗數據為融合后的SPOT5影像(圖1),空間分辨率為2.5 m,時相為2002年10月1日,包括紅、綠、藍和近紅外四個波段。以2002年昌平區(qū)1∶10 000土地利用現狀矢量數據為基準,對影像進行幾何校正,均方根誤差控制在1個像元以內。
1.2 研究方法
1.2.1 土地覆蓋分析 影像中的地物類別依據其存在的獨立性,可以劃分為基礎類別和附屬類別[4],前者是指某類別的存在與其他類別的存在沒有直接聯系,后者是指某類別的存在依賴于其他一個或多個類別的存在。研究區(qū)的基礎類別包括耕地、林地、建設用地、裸地和水體;附屬類別包括陰影,這里將陰影也作為一種覆蓋類別。每一種地類的具體細分及覆蓋表現如圖2。
1.2.2 影像分割 分割是面向對象影像分析的基礎,分割效果的好壞直接關系到分類的精度[5]。本研究是以耕地作為目標地類,只需要保證耕地的分割效果,不需要綜合考慮全部地類的分割效果,因此只建立了一個分割層;在分割算法的選擇上采用的是多尺度分割結合光譜差異分割的形式,即先利用多尺度分割算法對影像實現過分割,然后再利用光譜差異分割算法對分割結果進行優(yōu)化。利用eCognition 9.0軟件,通過多次參數設置及分割效果的目視分析,多尺度分割算法的參數設置為:光譜因子權重0.9,形狀因子權重0.1,緊致度因子權重0.5,平滑度因子權重為0.5;光譜差異分割的參數設置為5。兩種分割算法執(zhí)行的效果如圖3所示。
2 結果與分析
2.1 分類規(guī)則的自動獲取
利用SEaTH算法的J-M距離分析耕地各個
子類與非耕地類別的可區(qū)分度,結果如圖4??梢缘玫饺缦滦畔ⅲ海?)密集作物覆蓋和菜地這兩種耕地子類,出現在同一個圖例中,表示它們與非耕地類別區(qū)分使用的特征是一致的,因此可以合并為一個類別,不需要單獨提取;(2)非耕地類別與耕地子類的J-M距離均在1.80以上,表明利用SEaTH算法優(yōu)選出來的兩兩類別區(qū)分的特征是比較有效的;(3)對耕地整體分析,J-M距離大于1.95表示特征區(qū)分兩種類別的效果非常好,可以發(fā)現與耕地最容易區(qū)分的地類包括水體、陰影和建筑物,因此在提取耕地時應該按照“從易到難”的原則,將涉及這三種類別的規(guī)則執(zhí)行順序放在最前面,首先排除掉這三種類別;(4)對耕地子類分析,密集作物覆蓋和菜地與非耕地類別最容易區(qū)分,其次是中等作物覆蓋和稀疏作物覆蓋,而無作物覆蓋與水泥地面較難區(qū)分,中等作物覆蓋和林地較難區(qū)分,這些均與實際相符。
利用SEaTH算法自動獲取耕地各個子類與非耕地類別區(qū)分的規(guī)則,如表1到表4所示。對于分類特征一致的多條規(guī)則,可以合并為一條。
2.2 耕地提取精度分析
基于相同的分類樣本和分類特征,使用CART決策樹算法進行耕地信息提取,并基于相同的驗證樣本進行精度評價,結果如圖5所示。雖然兩種算法耕地提取總體精度均在90%以上,但CART決策樹算法的用戶精度和KAPPA系數明顯低于SEaTH算法,表明CART算法對耕地對象的錯分較為嚴重,且耕地提取的質量較差。
為了更好地比較SEaTH算法和CART決策樹算法的耕地提取效果,首先將兩種算法的耕地提取結果矢量數據S1和S2取交集得到S3,然后分別從S1和S2中擦除S3得到S1′和S2′,如圖6所示,S1′區(qū)域用紅色表示,即SEaTH算法分為耕地而CART決策樹算法分為非耕地的影像對象;S2′區(qū)域用藍色表示,即CART決策樹算法分為耕地而SEaTH算法分為非耕地的影像對象。
分別統(tǒng)計S1′和S2′涉及的影像對象的真實類別,結果如表5所示。可以看出:(1)CART決策樹算法對耕地錯分明顯比SEaTH算法要嚴重,這與兩種算法用戶精度的差異是一致的;(2)SEaTH算法漏分的耕地對象是46個,CART決策樹算法漏分的耕地對象是78個,前者也優(yōu)于后者。
3 討論
對于高分辨率遙感影像而言,利用面向對象的影像分析技術進行信息提取,可采用兩種分類器,一種是監(jiān)督分類,一種是規(guī)則分類。監(jiān)督分類對于大范圍、大數據量的高分辨率影像而言,不僅計算速度非常慢,而且分類效果較差。而規(guī)則分類是一種分層分類法,更具有針對性,更符合目視解譯的一般過程,即面對復雜影像,按照先易后難、從已知到未知、先清楚后模糊、先整體后局部等原則,進行多層次的分析判斷,因此可以增強信息提取能力、分類精度和計算效率,且在數據分析和解譯方法上表現出更大的靈活性[6,7]。本研究在進行耕地專題信息提取時,正是運用這種分層分類法,不僅在很大程度上避免了異物同譜的地物被劃歸為一類,同時可以先將一些易于識別的地物區(qū)分出來,為后面的信息提取創(chuàng)造純凈的環(huán)境;而對于那些不易于分類的地物,可以運用掩膜進行分類,以節(jié)省分類時間??梢?,利用分層分類法進行高分辨率影像信息提取時,每層處理只針對一類目標進行提取,目標明確,問題相對簡單,從而提高了每一類目標的提取精度[8]。
對于分層分類法而言,關鍵在于每層分類規(guī)則的構建。分類規(guī)則的有效性直接影響到提取精度,分類規(guī)則獲取的自動性直接影響到提取效率[9,10]。SEaTH算法和CART決策樹算法是目前較為常用的兩種分類規(guī)則自動獲取方法。本研究從分類精度和分類效果上均證明SEaTH算法更適合于耕地的專題信息提取。
但在應用該方法的過程中也發(fā)現了一些問題:(1)與CART決策樹算法相比,SEaTH算法得到的分類規(guī)則層次性差,先執(zhí)行哪條規(guī)則、后執(zhí)行哪條規(guī)則需要根據J-M距離的大小人工判斷,這在一定程度上降低了耕地提取的自動化程度,是今后需要改進的地方之一。(2)規(guī)則又可分為確定性規(guī)則和模糊規(guī)則,又稱為硬分類規(guī)則和軟分類規(guī)則,本研究中耕地提取采用的僅是確定性規(guī)則,而且每一條規(guī)則里僅選用了一個分類特征,并沒有使用多個分類特征的交集或者并集這種形式,這種方式對于J-M距離較大、與耕地容易區(qū)分的類別,例如水體、陰影、建筑物等提取效果較好,但是對于J-M距離較小、與耕地容易混淆的類別,如裸地、林地等,分類精度相對較差,因此需要引入模糊規(guī)則,利用隸屬度分類的方法,減少漏分,糾正錯分,進一步提高耕地的提取精度。(3)SEaTH算法最初是用于核設施的監(jiān)測,即用來提取建設用地信息,與提取耕地信息相比較為容易。這是因為建設用地可以看作是不透水面,而易與不透水面混淆的地類非常少;耕地是透水面,有作物覆蓋時容易與林地混淆,無作物覆蓋時則容易與裸地混淆。因此本研究提出的針對耕地的快速提取方法,可以推廣至建設用地,實現對新增建設用地的快速檢測。
4 結論
本研究基于高分辨率的SPOT5影像,以北京市昌平區(qū)百善鎮(zhèn)為研究區(qū),利用SEaTH算法實現了耕地專題信息的獲取,并與CART決策樹方法進行了對比分析。結果表明,SEaTH算法無論是在耕地提取精度和分類穩(wěn)定性上均優(yōu)于CART決策樹方法,而且SEaTH算法的針對性更強,能夠通過自動獲取分類規(guī)則實現耕地信息的快速提取。
參 考 文 獻:
[1] Liliberte A S, Fredrickson E L, Rango A. Combining decision trees with hierarchical object-oriented image analysis for mapping arid rangelands [J]. Photogrammetric Engineering & Remote Sensing, 2007, 73(2): 197-207.
[2] Nussbaum S, Niemeyer I. Automated extraction of change information from multispectral satellite imagery [J]. Esarda Bulletin, 2007, 36: 19-25.
[3] Gao Y, Marpu P, Niemeyer I, et al. Object—based classification with features extracted by a semi-automatic feature extraction algorithm—SEaTH [J]. Geocarto International, 2011, 26(3): 211-226.
[4] 鄧媛媛, 巫兆聰, 易俐娜, 等. 面向對象的高分辨率影像農用地分類[J]. 國土資源遙感, 2010, 22(4): 117-121.
[5] 李敏, 崔世勇, 李成名, 等. 面向對象的高分辨率遙感影像信息提取——以耕地提取為例[J]. 遙感信息, 2008, 11(6): 63-66.
[6] 柳稼航. 基于視覺特征的高分辨率光學遙感影像目標識別與提取技術研究[D]. 上海:上海交通大學, 2011.
[7] 周成虎, 駱劍承, 楊曉梅,等. 遙感影像地學理解與分析[J]. 北京: 科學出版社, 1999: 267-269.
[8] 孫家波. 基于知識的高分辨率遙感影像耕地自動提取技術研究[D]. 北京:中國農業(yè)大學, 2014.
[9] 葛春青, 張凌寒, 楊杰. 基于決策樹規(guī)則的面向對象遙感影像分類[J]. 遙感信息, 2009(2):86-90,56.
[10]鄧勁松, 王珂, 沈掌泉, 等. 基于特征波段的 SPOT-5 衛(wèi)星影像耕地信息自動提取的方法研究[J]. 農業(yè)工程學報, 2005, 20(6): 145-148.