劉世川,王 慶,魏 薇,唐 晴,劉 浪,何輝羽,蘆佳飛
(長江大學(xué) 地球科學(xué)學(xué)院,湖北 武漢 430100)
森林病蟲害是森林健康和林業(yè)生產(chǎn)的宿敵。松材線蟲是對松樹危害較大的外來入侵物種之一,感染松樹后會造成松樹針葉黃褐色或紅褐色,在6個月內(nèi)即導(dǎo)致病樹整株干枯死亡。且該病蟲繁殖速度快,傳播途徑廣,傳播范圍廣,難以防治,是使松林大片被毀的重要害蟲。張增光[1]提出基于過程模型的松材線蟲災(zāi)害的遙感早期識別,利用光譜分析和葉子含水量用知識規(guī)則的決策樹方法對植物進(jìn)行分類,但只運用光譜分析提取結(jié)果未使用其空間特征等其他特征。馬箐[2]結(jié)合遙感影像,對不同染病時期的馬尾松單株進(jìn)行單株測定、生態(tài)因子調(diào)查、蒸騰速率測定和光譜特征建模,模型復(fù)雜且受環(huán)境濕度、溫度的影像較大。吳瓊[3]基于深度神經(jīng)網(wǎng)絡(luò)分類算法監(jiān)測病蟲害樹木,但是需求的數(shù)據(jù)量大且參數(shù)過多時難以訓(xùn)練。李豐毅[4]將多光譜圖像進(jìn)行光譜特征、紋理特征和空間特征分析,但紋理特征計算復(fù)雜且效果不明顯。
所以基于多特征提取的高分辨率遙感影像松材線蟲病樹識別,對松材線蟲病樹的植被指數(shù)、顏色模型、空間分布特征進(jìn)行多特征分析,篩選疑似病樹的方法速度快、針對性強,可以實現(xiàn)高效率、高精度的提取病樹。既能減少人工篩查的成本,更能監(jiān)測人工無法到達(dá)的深山林區(qū),提升了篩查病害樹木的效率,及時發(fā)現(xiàn)病害樹木和枯死樹木,防止病害進(jìn)一步擴大感染范圍,減少病蟲害造成的經(jīng)濟(jì)損失。
松材線蟲的侵染能明顯引起寄主植株葉綠素、類胡蘿卜素發(fā)生改變,從而導(dǎo)致植物光譜特征發(fā)生變化。健康松樹的反射光譜在綠光區(qū)(510~570 nm)有一個較低的反射峰值;紅光區(qū)(640~680 nm)有一個較低的吸收谷值;感染松材線蟲后松樹綠光區(qū)的反射峰會逐漸減弱,紅光區(qū)的吸收谷卻會逐漸增強[5]。高分辨率影像上的病樹像元會表現(xiàn)出聚集性的空間特性,由此可篩去部分噪點,并且滿足周圍一定范圍內(nèi)有健康樹木的空間分布特性。
植被指數(shù)就是利用綠色植被在不同波段的反射和吸收特性,對傳感器不同波段進(jìn)行組合運算,增強植被的信息。其本質(zhì)上是綜合考慮各有關(guān)光譜信號,把多波段反射率做一定的數(shù)學(xué)變換,使其在增強植被信息的同時,使非植被信息最小化。目前較為常見的歸一化植被指數(shù)NDVI(Normalized Vegetation Index)、比值植被指數(shù) RVI(ratio vegetation index)、差值植被指數(shù)DVI(Difference Vegetation Index)、增強型植被指數(shù) EVI(enhanced vegetation index)、過綠指數(shù) EXG(Excess Green)、歸一化綠紅差異指數(shù) NGRDI(Normalized Green-red Difference Index)、仿照NGRDI構(gòu)造的歸一化綠藍(lán)差異指數(shù) NGBDI (Normalized Green-blue Difference Index)及紅綠比值指數(shù) RGRI(Red-green Ratio Index)[6],計算公式如表1。
在可見光范圍,松材線蟲病樹死亡前的顏色變化主要包括:先是褪色發(fā)黃,此現(xiàn)象可以出現(xiàn)在單枝或少量枝條上,也可出現(xiàn)在整株,針葉進(jìn)而枯萎變成紅褐色?,F(xiàn)在絕大部分的彩色圖像是基于RGB顏色三基色模型,但RGB空間中3個分量之間存在很強的相關(guān)性,因而不適于直接用于基于3個分量獨立運算的圖像分割。利用各種變換,可以由RGB空間推導(dǎo)出其他顏色空間如表2。
表1 植被指數(shù)計算公式(其中R、G、B分別為紅、綠、藍(lán)三色的光譜反射率)
表2 顏色空間模型
Relief算法是一種高效的過濾式特征選擇方法,由Kira和Rendell提出用于二分類問題的特征選擇算法[4]。根據(jù)各個特征和類別的相關(guān)性賦予特征不同的權(quán)重,權(quán)重小于某個閾值的特征將被移除。Relief算法中特征和類別的相關(guān)性是基于特征對近距離樣本的區(qū)分能力。計算公式如下:
δj=∑i-diff(Xji,Xji,nh)2+diff(Xji,Xji,nm)2
(1)
式(1)中,若xi與其猜中近鄰xi,nh在屬性j上的距離小于xi與其非同類別的最近鄰xi,nm的距離,則說明屬性j對區(qū)分同類與異類樣本是有利的,反之則不利,因此公式的值越大則說明該屬性的分類能力越強[5]。
利用Relief特征選擇算法得到單個樣本對每個特征的評價值,將所有樣本對同一個特征的評價值進(jìn)行平均就得到了該屬性的相關(guān)統(tǒng)計分量,分量值越大,分類能力就越強,從而選出最優(yōu)特征用以分類病樹像元和非病樹像元。
通過人工篩選高分辨率航空樣本影像(含紅色、綠色、藍(lán)色和近紅外波段),取樣得到病樹、健康樹、房屋、裸土地和柏油路的樣本像元區(qū)域。計算樣本像元區(qū)域的光譜特征,利用Relief特征選擇算法,得到二分類病樹和非病樹的最佳特征。將最佳特征的病樹像元樣本集進(jìn)行統(tǒng)計分析,取得合適閾值構(gòu)建病樹的光譜特征模型,用以在目標(biāo)影像上篩選出病樹像元。再運用空間聚類算法對像元進(jìn)行聚類分析,并剔除周圍一定范圍內(nèi)不附著健康樹像元的病樹像元,最后得到結(jié)果像元集(圖1)。
圖1 技術(shù)路線
將2019年10月份拍攝于30°1′33″~ 30°1′46″N/111°43′9″~111°44′24″E和30°38′6″~ 30°38′23″N/111°33′48″~111°34′16″E附近的高分辨率遙感影像數(shù)據(jù)進(jìn)行RGB真彩色顯示,采用人工取樣的形式,得到病樹、健康樹、藍(lán)頂房屋、灰頂房屋、裸土、柏油路和小路的像元區(qū)域(圖2)并統(tǒng)計出像元樣本數(shù)量(表3)。
圖2 人工取樣示意
表3 各地物像元樣本總數(shù)
特征:將各植被指數(shù)和各顏色模型所包含的各分量作為單獨特征種類,總計21種特征。數(shù)量:由于樣本數(shù)量參差不齊,以及考慮到運算耗時,各類地物選取300份樣本總計2100份樣本。Relief特征選擇算法得出各特征所對應(yīng)的權(quán)重(表4、圖3)。
表4 各特征權(quán)重
圖3 各特征權(quán)重統(tǒng)計
經(jīng)過實驗和比較,選擇權(quán)重較高的OHTA、NDVI、DVI作為病樹模型參數(shù),各參數(shù)的箱線圖見圖4。
圖4 各參數(shù)箱線圖
提取各參數(shù)的10%至90%作為置信區(qū)間,采用較為成熟的DBScan聚類算法[11]進(jìn)行病樹的空間聚集性篩選算法,并結(jié)合周圍一定范圍內(nèi)有一定數(shù)量上的健康樹木像元,對拍攝地點30°1′N/111°43′E附近的三幅高分辨率遙感影像篩選病樹,將自動識別結(jié)果與人工目判結(jié)果進(jìn)行對比(圖5、表5),得到統(tǒng)計結(jié)果(表6)。
注:左中紅斑為人工識別,右中白斑為自動識別
表5 人工篩選和自動識別結(jié)果對比
表6 自動識別相對人工篩選數(shù)據(jù)統(tǒng)計 %
基于光譜特征與空間特征的高分辨率遙感影像松材線蟲病樹識別總體來看,耗時是人工目視判讀的45%左右,數(shù)量識別的相對準(zhǔn)確度為80%左右,實現(xiàn)了高效率、較高準(zhǔn)確度識別松材線蟲病樹。本次識別過程中得出以下結(jié)論。
(1) 由于EXG與OHTA的I3分量計算方法一樣,所以在各特征權(quán)重統(tǒng)計圖權(quán)重一樣,在作為特征參數(shù)識別病樹時舍棄了重復(fù)的EXG指數(shù)。
(2) 針對健康樹木的光譜樣本缺少對松材線蟲病樹的針對性,采用隨機取樣,作為病樹空間分布特征的參數(shù)效果不佳。
(3) 光譜特征閾值與前期光譜實驗樣本質(zhì)量關(guān)系緊密,光譜實驗采樣的樣本僅局限于所識別目標(biāo)30°1′N/111°43′E附近的單幅圖像,如果擴大采樣范圍和樣本數(shù)量,將有利于提升多特征識別準(zhǔn)確度和應(yīng)用范圍。