羅 巍邵全琴* 王東亮汪陽春
(1.中國科學院地理科學與資源研究所陸地表層格局與模擬院重點實驗室,北京,100101;2.中國科學院成都山地災害與環(huán)境研究所,成都,610041)
基于面向?qū)ο蠓诸惖拇笮鸵吧巢輨游镒R別方法
——以青海三江源地區(qū)為例
羅 巍1邵全琴1*王東亮1汪陽春2
(1.中國科學院地理科學與資源研究所陸地表層格局與模擬院重點實驗室,北京,100101;2.中國科學院成都山地災害與環(huán)境研究所,成都,610041)
大型野生食草動物;無人機影像;多尺度分割;模板匹配;模糊邏輯分類
青海三江源地區(qū)位于中國西部,世界屋脊—青藏高原的腹地,青海省南部,平均海拔3 500~4 800 m,氣候條件極為惡劣,傳統(tǒng)的基于地面觀測的野生動物調(diào)查方法耗時費力,難以長期開展。本文提出了一種基于無人機航拍影像的大型野生食草動物調(diào)查方法,使用2016年7月在三江源地區(qū)獲取的無人機影像,采用面向?qū)ο蟮挠跋穹治龇椒?,對大型野生食草動物進行了自動識別和數(shù)量統(tǒng)計。首先,利用多尺度分割技術(shù)將影像中的動物輪廓從背景中大致分割出來;接著,選擇目標動物的典型樣本生成匹配模板對分割結(jié)果進行分類檢測,初步找出一些疑似目標對象;然后深入挖掘影像中目標動物對象的光譜特征、形狀特征,構(gòu)建特征知識庫,對檢測結(jié)果進行篩選;最后,利用目視解譯結(jié)果對統(tǒng)計提取出來的動物數(shù)量進行了精度評價。實驗表明,該方法不僅提取速度快,而且精度較高。該方法將有望顯著減少甚至取代部分野生動物地面調(diào)查工作,提升野生動物調(diào)查的效率和精度。
青海三江源地區(qū)是世界高寒地區(qū)生物多樣性集中區(qū),據(jù)統(tǒng)計,區(qū)內(nèi)有國家重點保護動物69種。其中國家Ⅰ級重點保護動物16種,國家Ⅱ級重點保護動物53種[1]。自從三江源國家自然保護區(qū)建立以來,該地區(qū)的生態(tài)環(huán)境明顯改善,大型野生食草動物種群數(shù)量逐年增加。如何系統(tǒng)全面地掌握該地區(qū)大型野生食草動物的種群數(shù)量成為對其進行科學合理保護的關(guān)鍵所在。
現(xiàn)階段各國對野生動物種群數(shù)量監(jiān)測的方法主要有樣線法[2]、抽樣調(diào)查法[3]、足跡遇見法[4]、有人機計數(shù)法[5]以及衛(wèi)星遙感監(jiān)測法[6]等等。由于野生動物個體相對較小,其皮毛顏色易與地面混淆,使用衛(wèi)星遙感監(jiān)測手段很難分辨清楚。再者,三江源地區(qū)海拔較高、氣候惡劣,傳統(tǒng)的人工地面調(diào)查難以開展。
隨著無人機技術(shù)及航拍技術(shù)的迅速發(fā)展,越來越多的學者開始借助無人機航拍的方式監(jiān)測野生動物,如趙忠琴等[7]采用無人機遙感技術(shù)對丹頂鶴(Grusjaponensis)進行了相關(guān)研究。但其僅僅局限于遙感影像的低層次應(yīng)用,對目標體的識別仍采用傳統(tǒng)的目視解譯方法。隨著近年來模式識別、人工智能領(lǐng)域新技術(shù)新方法的不斷出現(xiàn)[8-9],借助計算機算法實現(xiàn)海量數(shù)據(jù)的自動解譯變得不再遙不可及。
eCognition是世界上第一個面向?qū)ο蟮闹悄芑跋穹治鲕浖?,它模仿人類思維進行影像綜合智能分析和信息提取,具有模糊邏輯分類、模型化、復雜語意分析及整合多源數(shù)據(jù)等功能。通過人機交互定義的分割尺度、顏色、形狀等參數(shù)進行影像對象分割,以影像對象為基本空間單元進行地物目標提取,可應(yīng)用于各種專題研究[10]。本文基于在三江源地區(qū)實地獲取的大量無人機航拍數(shù)據(jù),將eCognition先進的影像分析技術(shù)、基于對象探測的計算機視覺技術(shù)及自動化解譯技術(shù)三位一體地應(yīng)用于大型野生食草動物的自動識別和統(tǒng)計,最終取得了良好效果。
面向?qū)ο蠓椒愃朴谌祟惔竽X的認知過程,首先將圖像分割為不同的對象,即同質(zhì)像素的集合。通過分割能夠?qū)⒃肼暼诤线M對象之中,從而較好地解決了噪聲干擾問題。接著,選擇具有典型性的目標樣本,通過eCognition的模板匹配功能構(gòu)建針對特定目標的識別模板,初步檢測出一些疑似目標對象。然后,充分利用動物對象的光譜特征、形狀特征、空間紋理特征等構(gòu)建特征知識庫,剔除非目標對象。最后,結(jié)合目視解譯的結(jié)果對統(tǒng)計出來的各類動物數(shù)量進行精度評價。本文技術(shù)路線圖如圖1所示。
圖1 本文技術(shù)路線Fig.1 Technology roadmap of this paper
1.1 影像預處理
影像分割過程中,灰度差異較小但分屬不同地物類型的相鄰像元,分割后容易被合并為一個對象,從而造成錯提、漏提。為此,需對原始影像進行預處理,增大提取目標與背景的反差,以取得更好的分割效果。一種有效的處理方法是對影像進行分段拉伸,增大像元之間灰度值的差距。
1.2 影像分割
面向?qū)ο筇崛〉年P(guān)鍵是影像分割,許多影像分割算法都是針對影像的灰度特征的,但是僅僅依靠灰度特征將會造成有破碎邊界的影像目標。因此,在分割時有必要加入形狀因子使對象更加完整,從而提高分割質(zhì)量。本文采用光譜特征與形狀特征相結(jié)合的多尺度分割方法。先將單個像元合并為較小的影像對象,然后再將較小的影像對象逐漸合并為較大的多邊形對象。分割時要遵循兩個原則:一是盡可能地設(shè)置較大的光譜權(quán)值;二是對于那些邊界不很光滑但聚集度較高的影像應(yīng)盡可能使用必要的形狀因子。
1.3 模板匹配檢測
模板匹配以“對號入座”的方式選擇一些目標的典型樣本生成匹配模板,然后用生成的模板對分割出來的對象進行分類檢測。該過程包含兩個步驟,通過使用模版編輯進行模板生成,然后通過使用模板匹配算法進行模板應(yīng)用。
1.4 特征知識庫構(gòu)建
模板匹配檢測結(jié)果通常存在一定誤差,往往會把一些不相關(guān)的地物誤分為動物。因此,必須結(jié)合影像中動物對象自身的特征構(gòu)建知識庫,利用知識庫中的規(guī)則對檢測結(jié)果進行篩選,從而提高提取精度。本文以三江源地區(qū)具有代表性的大型野生食草動物藏野驢(Equuskiang)為例,選取以下幾個特征構(gòu)建知識庫。
(1)像元灰度值。藏野驢的皮毛呈棕黑色,與地物背景有較大差異,是較為明顯的特征。
(2)對象面積。影像中藏野驢對象的大小一般不超過50個像元,因此模板匹配檢測出來的大于50個像元的對象應(yīng)予剔除。
(3)最大光譜差異。最大光譜差異值<灰度均值<像元層灰度<對象特征值。
1.5 對象分類統(tǒng)計
分類的結(jié)果是將所有的藏野驢對象用相同顏色的多邊形標記,通過eCognition自帶的函數(shù)對這些多邊形的個數(shù)進行統(tǒng)計,從而得到最終結(jié)果。
本實驗以青海省果洛藏族自治州瑪多縣作為研究區(qū),選取2016年7月獲取的無人機航拍影像作為實驗數(shù)據(jù)。圖2為一幅瑪多縣扎陵湖附近獲取的原始無人機影像,該影像包括藍、綠、紅3個波段,尺寸6 000×4 000像素,空間分辨率為0.15 m。
如圖2中局部放大部分所示,影像中包含大量藏野驢。本實驗即以藏野驢作為目標,開展提取實驗。實驗采用Definiens Developer Trial 9.2進行。為了增大提取目標與背景的反差,以取得更好的分割效果,對原始影像進行了分段拉伸。
接著,對預處理后的影像進行多尺度分割。為了把藏野驢的輪廓從背景中分割出來,本實驗對尺度參數(shù)進行了多次嘗試,最終確定分割尺度為20,形狀差異性權(quán)值為0.1,緊致度權(quán)值為0.5。
為了從分割結(jié)果中檢測出藏野驢對象,本實驗從原始影像中選擇一些典型的藏野驢樣本生成檢測模板,并不斷對樣本進行測試,直到檢測模板的匹配度達標為止,最終設(shè)置的匹配度參數(shù)為80%。
使用生成的匹配模板對分割結(jié)果進行檢測,初步找出一些疑似藏野驢的對象,圖3中用紅色予以標識。
圖3的檢測結(jié)果存在誤分現(xiàn)象,一些不相關(guān)地物(如巖石、塔頭墩等)被當成了藏野驢。為了將它們剔除,需要根據(jù)藏野驢對象的特征構(gòu)建知識庫。本實驗給出了3條規(guī)則,分別是紅波段值小于55、單個對象面積小于50以及Max.Diff值小于0.45。
執(zhí)行上述規(guī)則后圖2中局部放大部分的篩選結(jié)果如圖4右半部分所示,其中藏野驢對象被標記為紅色多邊形。圖4左半部分為對應(yīng)的原始影像。
篩選完成后我們給出一條規(guī)則(animal at Level merge:number_animal=number)用以統(tǒng)計藏野驢對象的數(shù)量(number_animal),最終得出圖2中的藏野驢數(shù)量為12頭。
為了評價本文方法的提取精度,我們給出了一個直觀的評價指標,即:
其中,自動解譯個數(shù)即使用本文面向?qū)ο蠓诸惙ǖ玫降膭游飩€數(shù),如上可知圖2中藏野驢數(shù)量為12頭。人工解譯個數(shù)即通過人工數(shù)數(shù)的方法得到的動物個數(shù),用此方法得出圖2中的藏野驢個數(shù)為14頭。因此,本文方法的準確度為12/14×100%=85.7%。
圖2 原始無人機航拍影像Fig.2 Original UAV aerial image
圖3 匹配模板檢測結(jié)果Fig.3 Detection result of the matching template
圖4 篩選檢測結(jié)果Fig.4 The screening detection result
本文基于面向?qū)ο蟮乃枷?,探討了一種從無人機航拍影像中自動獲取大型野生食草動物信息并統(tǒng)計數(shù)量的方法。首先,綜合應(yīng)用形狀差異性、緊致度等因子大致分割出動物對象;接著構(gòu)建匹配模板對分割對象進行分類檢測;然后構(gòu)建規(guī)則知識庫,利用模糊邏輯進一步篩選檢測結(jié)果;最后對分類結(jié)果進行統(tǒng)計。通過與人工解譯結(jié)果相比較,該方法具有較高的精度。如何挖掘出更多的動物對象特征,從而進一步提高提取精度并擴大可提取動物的范圍,成為下一步研究的重點。
致謝:中國科學院動物研究所蔣志剛研究員為本次野生動物航拍給予了方法指導;中國科學院西北高原生物研究所李來興副研究員為此次航拍調(diào)查給予了大量幫助;中國科學院地理科學與資源研究所樊江文研究員、李俞哲助理研究員為野生動物識別工作提供了大量寶貴經(jīng)驗;北京天目創(chuàng)新科技有限公司提供了免費的Definiens Developer Trial 9.2版軟件,謹致謝忱!
[1] 邵全琴,樊江文.三江源區(qū)生態(tài)系統(tǒng)綜合監(jiān)測與評估[M].北京:科學出版社,2012:300-301.
[2] 趙垚.淺析我國野生動物保護現(xiàn)狀與對策[J].山西林業(yè),2007(6):4-5.
[3] 魏輔文,婁治平.中國野生動物保護研究現(xiàn)狀[J].中國科學院院刊,2010,25(6):668-673.
[4] 劉寧.野生動物數(shù)量調(diào)查方法綜述[J].云南林業(yè)科技,1998(2):58-60.
[5] Ottichilo W K,de Leeuw J,Prins H H T.Population trends of resident wildebeest[Connochaetestaurinushecki(Neumann)]and factors influencing them in the Masai Mara ecosystem,Kenya[J].Biological Conservation,2001,97(3):271-282.
[6] 馬建維,高中信.遙感技術(shù)在野生動物資源調(diào)查中的應(yīng)用[J].野生動物,1991,12(4):3-6.
[7] 趙忠琴,李金錄,馮科民,等.大型水禽航空調(diào)查方法[J].野生動物,1985,6(4):25-27.
[8] 陳自寬,孫穎.基于功率譜分析的指紋實時識別系統(tǒng)[J].光學學報,1994,14(9):903-907.
[9] 白鵬,牟龍芳,王婕.圖像閾值分割方法的研究[J].科協(xié)論壇,2011(3):76-77.
[10] Shi Yiqiang,Zhu Xiaoling,Lin Fang.Based on multi-factor objects of high spatial resolution remote sensing image road extraction[J].Journal of Jimei University,2010,15(4):312-316.
Wild large herbivores;UAV image;Multi-resolution segmentation;Template matching;Fuzzy logical classification
An Object-Oriented Classification Method for Detectdion f Large Wild Herbivores:a Case Study in the Source Region of Three Rivers in Qinghai
Luo Wei1Shao Quanqin1*Wang Dongliang1Wang Yangchun2
(1.Key Laboratory of Land Surface Pattern and Simulation(IGSNRR),Chinese Academy of Sciences(CAS),Beijing,100101,China;2.Institute of Mountain Hazards and Environments(CAS),Chengdu,610041,China)
The source region of the Three Rivers in Qinghai is in western China in the hinterland of the Qinghai Tibet Plateau in southern Qinghai Province.Elevation ranges from 3 500 to 4 800 meters and climate conditions are harsh.In this region,it is difficult to use traditional wildlife monitoring methods.Based on aerial images acquired by unmanned aerial vehicles(UAVs)in this region in July 2016,we used object-oriented image analysis to automatically extract information on large wild herbivores and we analyzed quantitative statistics.First,the contours of the animals in the images were roughly separated from the background using a multi-scale segmentation technique.Next,typical samples of the target animals were selected to generate matching templates to classify and detect the segmentation results and to locate suspected target objects.Then,the spectral features and shape features of the target animal objects in the images were extracted to construct a feature knowledge base and to screen the detection results.Finally,we evaluated accuracy by combining the number of animals extracted from the statistics with those extracted from the results of visual interpretation.This method had both high extraction speed and high precision.The method is expected to significantly reduce or even replace part of the ground survey for wildlife,and improve the efficiency and accuracy of wildlife survey.
稿件運行過程
2017-01-10
修回日期:2017-01-23
發(fā)表日期:2017-11-10
Q958.1
A
2310-1490(2017)04-561-04
國家重點研發(fā)計劃項目(2017YFC0506505;2017YFB0503005);國家自然科學基金面上項目(41571504;41501416);青??萍加媱濏椖?2015-SF-A4-1)
羅巍,男,34歲,博士后;主要從事地圖學與地理信息系統(tǒng)方面研究。E-mail:luowei@radi.ac.dn
*通訊作者:邵全琴,E-mail:shaoqq@igsnrr.ac.cn