辛 潔,高德民,張 朔,孫 權(quán)
(南京林業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院,江蘇 南京 210037)
森林火災(zāi)是一種突發(fā)性強(qiáng)、破壞性大、處置救助較為困難的自然災(zāi)害。林火不只燒毀成片的森林植被,傷害林內(nèi)動(dòng)物,引起空氣污染,影響森林演替,破壞森林在小氣候涵養(yǎng)水源上的作用,甚至導(dǎo)致生態(tài)環(huán)境失去平衡,同時(shí)也給人類的生存和生命財(cái)產(chǎn)造成了極大的威脅[1]。據(jù)統(tǒng)計(jì),2003-2016年我國(guó)共發(fā)生森林火災(zāi)10萬余次,過火面積254.37萬hm2,損失折人民幣超過21億元[2]。
林火產(chǎn)生的偶然性大,原因復(fù)雜多變。但是,從林火火源類型來看,天然火源如雷擊火等占比重極小,更多的是人為火源,其中以燒荒燒炭、野外吸煙和上墳燒紙為主[3]。目前我國(guó)林火監(jiān)測(cè)措施主要是地面巡護(hù)、近地面監(jiān)測(cè)、航空監(jiān)測(cè)和衛(wèi)星監(jiān)測(cè)。由于地面巡護(hù)和近地面監(jiān)測(cè)耗費(fèi)大量人力物力且不能避免疏漏,也不能保證巡護(hù)人員的安全;航空監(jiān)測(cè)工作時(shí)間受限,只能用于撲救時(shí)監(jiān)測(cè)燃燒趨勢(shì);衛(wèi)星監(jiān)測(cè)的監(jiān)測(cè)時(shí)間同樣受限,同時(shí)受云層的影響較大,數(shù)據(jù)精確度不高[4]。目前林火預(yù)測(cè)預(yù)警仍然面臨著很大的挑戰(zhàn)。
隨著機(jī)器學(xué)習(xí)和物聯(lián)網(wǎng)技術(shù)不斷發(fā)展,其應(yīng)用的領(lǐng)域越來越廣。物聯(lián)網(wǎng)將現(xiàn)實(shí)世界數(shù)字化,為森林防火行業(yè)低成本優(yōu)化策略提供更好的解決方案[5]。國(guó)家林業(yè)局在2015年發(fā)布《中國(guó)智慧林業(yè)發(fā)展指導(dǎo)意見》。林火是林業(yè)最大的威脅之一,預(yù)測(cè)和預(yù)警勢(shì)在必行。鑒于傳統(tǒng)林火監(jiān)測(cè)措施存在很多不足,新技術(shù)也在快速發(fā)展,本文介紹的森林火災(zāi)預(yù)測(cè)預(yù)警系統(tǒng)將機(jī)器學(xué)習(xí)和物聯(lián)網(wǎng)技術(shù)用到數(shù)據(jù)處理當(dāng)中,達(dá)到更好林火預(yù)測(cè)和預(yù)警效果。
到目前為止,林火預(yù)測(cè)和預(yù)警研究歷經(jīng)百年,國(guó)內(nèi)外研究機(jī)構(gòu)和學(xué)者進(jìn)行了大量研究。美國(guó)的森林火災(zāi)撲救指揮系統(tǒng),兼?zhèn)渲笓]、行動(dòng)、計(jì)劃、后勤及行政管控五項(xiàng)功能[6]。加拿大林火危險(xiǎn)等級(jí)系統(tǒng)是世界上被廣泛應(yīng)用的火險(xiǎn)系統(tǒng)之一[7]。在國(guó)內(nèi),除最原始的地面巡護(hù)和瞭望塔監(jiān)測(cè)外,紅外線技術(shù)借助于紅外熱成像原理和無線傳輸技術(shù)最先開始用于森林火災(zāi)的報(bào)警中[8]。遙感技術(shù)和地理信息系統(tǒng)、無人機(jī)等也陸續(xù)開始用在林火監(jiān)測(cè)中[9,10];隨著物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,也逐漸被用于林火的預(yù)測(cè)預(yù)警[11]。
物聯(lián)網(wǎng)是以互聯(lián)網(wǎng)、傳統(tǒng)電信網(wǎng)等信息承載體,讓所有能行使獨(dú)立功能的普通物體實(shí)現(xiàn)互聯(lián)互通的網(wǎng)絡(luò)。機(jī)器學(xué)習(xí)是計(jì)算機(jī)科學(xué)的一個(gè)分支,以人類智能相似的方式做出反應(yīng)的智能方式。隨著物聯(lián)網(wǎng)和機(jī)器學(xué)習(xí)技術(shù)不斷發(fā)展,應(yīng)用領(lǐng)域不斷擴(kuò)大,技術(shù)逐漸出現(xiàn)在林火預(yù)測(cè)預(yù)警方面。決策樹(Decision tree)是一類常見的機(jī)器學(xué)習(xí)方法,決策樹學(xué)習(xí)的目的是為了產(chǎn)生一顆泛化能力強(qiáng),即處理新的示例能力強(qiáng)的決策樹,其基本流程遵循簡(jiǎn)單而直觀的“分而治之”策略。
目前,大部分林火監(jiān)測(cè)系統(tǒng)是用傳感器采集數(shù)據(jù),用低功耗、低成本、近距離的ZigBee傳輸數(shù)據(jù)[11]。由于ZigBee傳輸距離太短,本文所介紹的系統(tǒng)數(shù)據(jù)傳輸采用LoRa技術(shù)。LoRa是一種基于擴(kuò)頻技術(shù)的遠(yuǎn)距離無線傳輸技術(shù),具有遠(yuǎn)距離、低功耗、多節(jié)點(diǎn)、低成本的特性。在空曠環(huán)境下Lo-Ra通信距離可達(dá)15 km,采用自適應(yīng)數(shù)據(jù)速率策略,使其接收電流低達(dá)10 mA,休眠電流小于200 nA,從而使電池壽命有效延長(zhǎng)[12]。供電能源采用太陽能,綠色環(huán)保且可持續(xù),同時(shí)也避免了頻繁更換電源等問題。
由于森林火險(xiǎn)等級(jí)是通過處理終端采集的大量氣象數(shù)據(jù)所得到的,數(shù)據(jù)的采集、傳輸和數(shù)據(jù)的正確性對(duì)于林火預(yù)測(cè)預(yù)警極為重要。本系統(tǒng)主要包括數(shù)據(jù)采集模塊、數(shù)據(jù)傳輸模塊和數(shù)據(jù)處理模塊3部分。數(shù)據(jù)采集模塊負(fù)責(zé)獲取溫度、濕度、風(fēng)速、日降水量等氣象數(shù)據(jù);數(shù)據(jù)傳輸模塊負(fù)責(zé)由服務(wù)器向終端發(fā)送命令和將終端獲取的數(shù)據(jù)返回服務(wù)器;數(shù)據(jù)處理模塊將返回的數(shù)據(jù)進(jìn)行處理并預(yù)測(cè)當(dāng)前林火發(fā)生情況。系統(tǒng)的工作流程如下:
1)服務(wù)器對(duì)終端節(jié)點(diǎn)發(fā)出數(shù)據(jù)采集命令;
2)終端節(jié)點(diǎn)的傳感器獲取當(dāng)前時(shí)刻氣象數(shù)據(jù);
3)傳輸設(shè)備將數(shù)據(jù)返回到服務(wù)器;
4)服務(wù)器對(duì)返回的數(shù)據(jù)進(jìn)行處理,根據(jù)決策樹模型得出當(dāng)前的火險(xiǎn)等級(jí)。
系統(tǒng)采用太陽能電池供能。太陽能是可再生和無污染的資源。實(shí)驗(yàn)結(jié)果表明,一個(gè)節(jié)點(diǎn)即使不充電,也可以一次工作超過15天。
加拿大森林火險(xiǎn)等級(jí)系統(tǒng)(CFFDRS)是當(dāng)前世界上發(fā)展最完善、應(yīng)用最廣泛的系統(tǒng)之一,加拿大森林火險(xiǎn)氣候指數(shù)(FWI)系統(tǒng)是CFFDRS的重要組成部分。FWI系統(tǒng)以時(shí)滯—平衡含水率理論為基礎(chǔ),將氣象條件和可燃物含水率有機(jī)地聯(lián)系起來,通過天氣條件的變化計(jì)算可燃物含水率的變化,然后再根據(jù)不同大小或位置的可燃物含水率確定潛在火險(xiǎn)等級(jí)[13]。
FWI系統(tǒng)所需數(shù)據(jù)包括4個(gè)氣象因子(溫度、相對(duì)濕度、風(fēng)速、降雨量)。系統(tǒng)由6個(gè)部分組成:3個(gè)濕度碼代表可燃物濕度,包括細(xì)小可燃物濕度碼FFMC,粗腐殖質(zhì)濕度碼DMC和干旱碼DC;2個(gè)中間子指數(shù)代表火災(zāi)蔓延速率和可燃物的消耗率,即初始蔓延指數(shù)ISI和累積指數(shù)BUI;1個(gè)最終指數(shù)代表火險(xiǎn)氣候指數(shù),即FWI。FWI的結(jié)果分為五級(jí),級(jí)數(shù)越大,表示火險(xiǎn)越高。
Scikit-learn決策樹算法類庫(kù)內(nèi)部實(shí)現(xiàn)是使用了調(diào)優(yōu)過的CART決策樹算法,本文以CART決策樹算法為例對(duì)表1中的示例數(shù)據(jù)進(jìn)行分析。
表1 氣象數(shù)據(jù)詳細(xì)信息
CART決策樹使用基尼指數(shù)來選擇劃分屬性。假定當(dāng)前樣本集合D中第k類樣本所占的比例為pk(k=1,2,…,||y),則D的純度可用基尼值來度量:
直觀來說,Gini(D)反映了從數(shù)據(jù)集D中隨機(jī)抽取兩個(gè)樣本,其類別標(biāo)記不一致的概率。因此,Gini(D)越小,則數(shù)據(jù)集D的純度越高。
以表1中氣象數(shù)據(jù)為例,該數(shù)據(jù)集D包含12個(gè)訓(xùn)練樣例。顯然, ||y=3,在決策樹學(xué)習(xí)開始時(shí),根節(jié)點(diǎn)包含D中的所有樣例,其中于是,根據(jù)(1)式可計(jì)算出根結(jié)點(diǎn)的基尼值為:
假定離散屬性a有V個(gè)可能的取值{a1,a2,…,av},若使用a來對(duì)樣本D進(jìn)行劃分,則會(huì)產(chǎn)生v個(gè)分支結(jié)點(diǎn),其中第v個(gè)分支結(jié)點(diǎn)包含了D中所有在屬性a上取值為av的樣本,記為Dv。我們可根據(jù)上式計(jì)算出Dv的基尼值,再考慮到不同的分支結(jié)點(diǎn)所包含的樣本數(shù)不同,給分支結(jié)點(diǎn)賦予權(quán)重,即樣本數(shù)越多的分支結(jié)點(diǎn)的影響越大。于是,屬性a的基尼指數(shù)定義為:
在候選屬性集合A中,選擇使得劃分后基尼指數(shù)最小的屬性作為最優(yōu)劃分屬性。
假定平均氣溫低于8°為低溫,高于25°為高溫,其余為中溫;相對(duì)濕度低于20為干燥,高于70為潮濕,其余為適中;風(fēng)速低于10為微風(fēng),高于20為大風(fēng),其余為強(qiáng)風(fēng);日降水量小于10 mm為小雨,大于25 mm為大雨,其余為中雨。此時(shí),表1可轉(zhuǎn)化為表2。
計(jì)算當(dāng)前屬性集合{溫度,相對(duì)濕度,風(fēng)速,日降水量}中每個(gè)屬性的基尼指數(shù)。以溫度為例,它有可能的3個(gè)取值:{低溫,中溫,高溫}。若使用該屬性對(duì)D進(jìn)行劃分,則可得到3個(gè)子集,分別記為D1(溫度=低溫),D2(溫度=中溫),D3(溫度=高溫)。子集D1包含2個(gè)樣例,其中包含4個(gè)樣例,其中個(gè)樣例,其中計(jì)算出溫度劃分之后獲得的3個(gè)分支結(jié)點(diǎn)的基尼值為:
表2 氣象數(shù)據(jù)等級(jí)信息表
類似地,我們可計(jì)算出其他屬性的基尼指數(shù):
Gini_index(D,相對(duì)濕度)=0.306
Gini_index(D,風(fēng)速)=0.440
Gini_index(D,日降水量)=0.593
顯然,屬性相對(duì)濕度的基尼指數(shù)最小。所以,它被選為劃分屬性。圖1給出了基于相對(duì)濕度對(duì)根結(jié)點(diǎn)進(jìn)行劃分的結(jié)果,各分直接點(diǎn)所包含的樣例子集顯示在結(jié)點(diǎn)中。
圖1 基于相對(duì)濕度劃分的部分決策樹
決策樹學(xué)習(xí)算法將對(duì)每個(gè)分支結(jié)點(diǎn)做進(jìn)一步劃分,過程同上。最終得到的決策樹結(jié)果,如圖2所示。
圖2 基于相對(duì)濕度劃分的完整決策樹
以2015年南京的氣象數(shù)據(jù)(圖3)和FWI系統(tǒng)生成的火險(xiǎn)等級(jí)為學(xué)習(xí)樣本,用Python實(shí)現(xiàn)決策樹算法,最終生成的決策樹分類散點(diǎn)圖如圖4所示。
在此說明:圖3(a)是溫度變化折線圖,結(jié)果顯示南京夏季溫度高,冬季溫度低。圖3(b)是相對(duì)濕度折線圖,說明南京一年四季濕度較高。圖3(c)是風(fēng)速折線圖,反映了南京風(fēng)速變化與季節(jié)無關(guān)。圖3(d)是日降水量折線圖,圖中明顯看出夏秋兩季降水遠(yuǎn)遠(yuǎn)多于春冬兩季。南京夏季氣溫高降水量大,冬季則剛好相反,春秋兩季相對(duì)濕度低,即春季和秋季森林火災(zāi)的概率高于夏季和冬季。這與我們的認(rèn)識(shí)是一致的。
圖3 2015年南京市氣象數(shù)據(jù)折線
圖4 (a)是由溫度和相對(duì)濕度繪制的散點(diǎn)圖,從圖中可以看出相對(duì)濕度對(duì)火險(xiǎn)等級(jí)的影響比溫度的影響要大,濕度與火險(xiǎn)等級(jí)呈負(fù)相關(guān)。圖4(b)說明風(fēng)速對(duì)火險(xiǎn)等級(jí)的影響比溫度大,風(fēng)速與火險(xiǎn)等級(jí)呈正相關(guān)。圖4(c)剛好驗(yàn)證了圖4(a)和圖4(b)的結(jié)果。圖4(d)說明日降水量對(duì)火險(xiǎn)等級(jí)的影響比溫度大,且日降水量與火險(xiǎn)等級(jí)呈負(fù)相關(guān)。圖4(e)說明日降水量與相對(duì)濕度正相關(guān)。圖4(f)說明風(fēng)速對(duì)火險(xiǎn)等級(jí)的影響比日降水量大。
圖4 每?jī)蓪?duì)參數(shù)繪成的決策樹散點(diǎn)圖
FWI系統(tǒng)的火險(xiǎn)等級(jí)分為5級(jí),但2015年未出現(xiàn)“極度危險(xiǎn)”等級(jí)。由圖4我們可以看到,火險(xiǎn)的影響因素較多,僅憑兩個(gè)因素并不能準(zhǔn)確地判斷火險(xiǎn)等級(jí)??傮w來說,溫度越高、風(fēng)速越大、日降水量和相對(duì)濕度越低,火險(xiǎn)等級(jí)越高。
我們利用學(xué)習(xí)的結(jié)果來預(yù)測(cè)測(cè)試數(shù)據(jù),結(jié)果如表3所示。
表3 系統(tǒng)預(yù)測(cè)結(jié)果
在實(shí)際的使用過程中,1表示低級(jí)火險(xiǎn),2表示中級(jí)火險(xiǎn),3表示較高級(jí)火險(xiǎn),4表示高級(jí)火險(xiǎn),5表示極其危險(xiǎn)和發(fā)生火災(zāi)?;诖宋覀兛梢悦刻鞂?duì)學(xué)習(xí)數(shù)據(jù)進(jìn)行添加和修正,提高系統(tǒng)預(yù)測(cè)結(jié)果的準(zhǔn)確度。
本文提出了一種基于無線傳感網(wǎng)和決策樹模型的森林火災(zāi)預(yù)測(cè)方法。在無線傳感網(wǎng)中采集氣象數(shù)據(jù)使用傳感器,數(shù)據(jù)傳輸采用LoRa技術(shù),以2015年南京的氣象數(shù)據(jù)為例對(duì)系統(tǒng)進(jìn)行了簡(jiǎn)單的介紹和證明,最后將系統(tǒng)的預(yù)測(cè)結(jié)果與FWI所預(yù)測(cè)的結(jié)果進(jìn)行了對(duì)比,驗(yàn)證了系統(tǒng)的正確性。實(shí)踐表明,系統(tǒng)還可滿足對(duì)海量數(shù)據(jù)的分析和預(yù)測(cè),與傳統(tǒng)監(jiān)測(cè)方法相比,減少了人力物力的投入,具有實(shí)用價(jià)值。為了通過最大限度地減少誤差和提高統(tǒng)計(jì)測(cè)量率來改善決策樹算法,建議培訓(xùn)和測(cè)試所需的年數(shù)也要增加。