謝非凡 張世濤 黃威
摘? 要: 通過(guò)C#編程語(yǔ)言與ArcEngine開(kāi)發(fā)引擎編寫(xiě)一種BP神經(jīng)網(wǎng)絡(luò)的滑動(dòng)窗口算法,實(shí)現(xiàn)活躍火頻次預(yù)測(cè)。對(duì)中南半島五國(guó)活躍火進(jìn)行建模,預(yù)測(cè)2020年活躍火頻次并與實(shí)際對(duì)比。經(jīng)過(guò)多次迭代實(shí)驗(yàn),結(jié)果表明,模型程序在誤差小于0.8或?qū)W習(xí)訓(xùn)練次數(shù)大于8000作為單次結(jié)束條件時(shí)具有優(yōu)良的預(yù)測(cè)效果。
關(guān)鍵詞: 神經(jīng)網(wǎng)絡(luò); 活躍火; 機(jī)器學(xué)習(xí); 中南半島
中圖分類號(hào):TP399.4? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1006-8228(2023)09-124-05
Research and implementation of BP neural network sliding window algorithm
in active fire spatiotemporal prediction model
Xie Feifan, Zhang Shitao, Huang Wei
(Faculty of Land and Resources, Kunming University of Science and Technology, Kunming, Yunnan 650000, China)
Abstract: A sliding window algorithm for BP neural networks is developed using C# programming language and ArcEngine development engine to predict active fire frequency. Active fires in five countries on Indochina Peninsula are modeled to predict the frequency of active fires in 2020 and compare with the actual situation. The results of several iterations show that the model program has a good prediction effect when the error is less than 0.8 or the number of learning training is more than 8000 as a single end condition.
Key words: neural network; active fire; machine learning; Indochina Peninsula
0 引言
活躍火(Active fire)是全球生態(tài)系統(tǒng)碳循環(huán)的重要因素,亦是影響大氣污染、公共安全、生物多樣性等重要因素之一?;钴S火在地球表面的大部分地區(qū)均產(chǎn)生重要的生態(tài)作用,是全球氣候變化與森林生態(tài)系統(tǒng)反饋的關(guān)鍵因子[1-2]。熱帶活躍火在全球的發(fā)生頻率日益加劇,已對(duì)全球陸生、水生和大氣系統(tǒng)造成重大影響[3]。 在微觀尺度上,活躍火通過(guò)植被燃燒、溫度升高改變土壤的理化性質(zhì),直接影響植被生長(zhǎng)[4-5],從而改變植被和土壤的結(jié)構(gòu)和組成[6]。全球每年由火災(zāi)引起的碳排放量可達(dá)2~4Pa,是每年化石燃料的50%。因此,預(yù)估和預(yù)測(cè)活躍火,對(duì)大氣環(huán)境治理及檢測(cè)評(píng)估等具有重要的參考價(jià)值[7]。中南半島山區(qū)歷來(lái)有刀耕火種的農(nóng)業(yè)耕作傳統(tǒng),且山地移民的增加又進(jìn)一步提高了刀耕火種的利用強(qiáng)度,從而加劇了植被焚燒與森林野火的發(fā)生概率[8-9]。美國(guó)火災(zāi)信息資源管理系統(tǒng)(FIRMS)提供了近乎實(shí)時(shí)的活躍火位置矢量產(chǎn)品數(shù)據(jù),已被各個(gè)領(lǐng)域研究者廣泛應(yīng)用[10]。其數(shù)據(jù)質(zhì)量得到了廣泛的認(rèn)可,但在挖掘此矢量數(shù)據(jù)信息時(shí),研究人員更多的是在統(tǒng)計(jì)分析層面來(lái)解析數(shù)據(jù),缺乏更為深層次的數(shù)據(jù)挖掘方法與技術(shù)手段[11-15]。因此從時(shí)間和空間上建模進(jìn)而預(yù)測(cè)是非常有意義和有必要的。
目前BP神經(jīng)網(wǎng)絡(luò)已經(jīng)在許多領(lǐng)域得到應(yīng)用,理論上BP神經(jīng)網(wǎng)絡(luò)可以逼近任何復(fù)雜的函數(shù)[16-17]。技術(shù)人員和研究人員設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)算法模型對(duì)火災(zāi)的預(yù)測(cè)需要大量的火災(zāi)影響因子數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)[18-19],小區(qū)域研究范圍內(nèi)的研究取得了不錯(cuò)的預(yù)測(cè)效果,但針對(duì)大區(qū)域面積的研究時(shí),獲取各種相關(guān)因素?cái)?shù)據(jù)存在許多困難。因此本文提出一種次優(yōu)的基于BP神經(jīng)網(wǎng)絡(luò)的滑動(dòng)窗口算法對(duì)東南亞活躍火頻次進(jìn)行預(yù)測(cè)。本文相關(guān)研究成果可以對(duì)大尺度空間范圍活躍火進(jìn)行預(yù)測(cè)評(píng)估,希望能為同行提供參考,為活躍火相關(guān)因子評(píng)估分析提供科學(xué)的啟發(fā)與思考。
1 源數(shù)據(jù)整理
從NASA FIRMS分別下載了中南半島五國(guó)(柬埔寨,老撾、緬甸、泰國(guó)、越南)2000年至2020年的MODIS與VIIRS活躍火矢量數(shù)據(jù)。MODIS的歷史數(shù)據(jù)更加充足,更加的有利于下文的神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)建模,剔除MODIS數(shù)據(jù)缺失的時(shí)間段,最終選用MODIS產(chǎn)品2010年至2020年的數(shù)據(jù)作為我們的研究源數(shù)據(jù),通過(guò)GIS軟件強(qiáng)大的空間數(shù)據(jù)統(tǒng)計(jì)分析能力做了初步的統(tǒng)計(jì)處理,統(tǒng)計(jì)表如表1所示。
據(jù)統(tǒng)計(jì),2010年至2020年間柬埔寨活躍火頻次總數(shù)達(dá)3.80591×105次,老撾達(dá)4.42116×105次,緬甸達(dá)6.97154×105次,泰國(guó)達(dá)3.04636×105次,越南達(dá)2.09489×105次。緬甸活躍火每年頻次總數(shù)均大于其他四國(guó),且走勢(shì)較為陡峭,在2010年達(dá)到峰值,其他四國(guó)數(shù)據(jù)波動(dòng)較為平緩,越南每年活躍火頻次均低于其他四國(guó)。在2010至2011年中南半島各國(guó)活躍火頻次均在降低,在2018年至2019年均在上升,我們認(rèn)為可能是某種大環(huán)境因素導(dǎo)致其同步變化(圖1)。11年間柬埔寨活躍火總頻次密度約為1.4074次/km2,老撾約為1.3527次/km2,緬甸約為0.8469次/km2,泰國(guó)約為0.4364次/km2,越南約為0.4198次/km2。在密度分布上柬埔寨、老撾、緬甸走勢(shì)較為陡峭,越南與泰國(guó)較為平緩,其數(shù)據(jù)的平滑性更有利于下文神經(jīng)網(wǎng)絡(luò)在時(shí)間序列的函數(shù)擬合(圖2)。
通過(guò)整理發(fā)現(xiàn)柬埔寨活躍火頻次密集時(shí)間段在每年的1月、2月、3月、12月,老撾活躍火頻次密集時(shí)間段在3月和4月,緬甸集中在2月、3月、4月,泰國(guó)集中在1月、2月、3月、4月、12月較為平滑,泰國(guó)集中在2月、3月、4月。根據(jù)這一數(shù)據(jù)特征,可以將每個(gè)國(guó)家的數(shù)據(jù)按此特征分為兩組作為滑動(dòng)窗口神經(jīng)網(wǎng)絡(luò)算法的處理數(shù)據(jù)集,目的是為了訓(xùn)練的數(shù)據(jù)集在數(shù)據(jù)上更加的平滑,為BP算法計(jì)算各參數(shù)值時(shí)減輕負(fù)擔(dān)。
2 數(shù)據(jù)構(gòu)型
火災(zāi)的發(fā)生有人為因素和自然因素,火災(zāi)是一個(gè)復(fù)雜的物理過(guò)程,選用具有處理復(fù)雜非線性問(wèn)題的BP神經(jīng)網(wǎng)絡(luò)模型建立其預(yù)測(cè)模型是非常必要的。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)需要大量數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),在小尺度空間范圍時(shí),據(jù)有關(guān)實(shí)驗(yàn)表明,其在諸多領(lǐng)域具有良好的預(yù)測(cè)效果,但面對(duì)大尺度空間范圍時(shí),往往會(huì)因?yàn)閿?shù)據(jù)的收集困難導(dǎo)致實(shí)驗(yàn)難以繼續(xù),或因數(shù)據(jù)不足導(dǎo)致訓(xùn)練效果較差,實(shí)驗(yàn)誤差大。因此我們采用本文提出的次優(yōu)的基于滑動(dòng)窗口神經(jīng)網(wǎng)絡(luò)算法,分別對(duì)中南半島的柬埔寨,老撾、緬甸、泰國(guó)、越南五個(gè)國(guó)家數(shù)據(jù)進(jìn)行了總量的預(yù)測(cè)和分網(wǎng)格的預(yù)測(cè),采用局部和整體混合驗(yàn)證模型,以保其精確度。
2.1 BP神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是對(duì)人腦神經(jīng)工作過(guò)程進(jìn)行抽取模擬出的,類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型。BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)包括輸入層、輸出層和多個(gè)隱層,BP算法的學(xué)習(xí)過(guò)程,由信息的正向傳播和誤差的反向傳播兩個(gè)過(guò)程組成。理論上隱層只要足夠多就可以逼近任意復(fù)雜的非線性函數(shù)。三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
神經(jīng)網(wǎng)絡(luò)中的訓(xùn)練或者學(xué)習(xí),旨在求解所要解決問(wèn)題的網(wǎng)絡(luò)模型中的參數(shù),這些參數(shù)包括神經(jīng)元之間的連接權(quán)重(w1,w2..wxm)以及偏置等,偏置的存在可以更好的擬合數(shù)據(jù)。根據(jù)不同的實(shí)際問(wèn)題,設(shè)計(jì)者所構(gòu)造出來(lái)的網(wǎng)絡(luò)模型是不同的,為了求出這些參數(shù),往往需要算法進(jìn)行學(xué)習(xí)和訓(xùn)練來(lái)迭代找出最優(yōu)的參數(shù),BP算法就是現(xiàn)在應(yīng)用最為廣泛的和成功的算法之一[20]。
2.2 數(shù)據(jù)設(shè)計(jì)
本實(shí)驗(yàn)首先對(duì)柬埔寨,老撾、緬甸、泰國(guó)五個(gè)國(guó)家活躍火數(shù)據(jù)按月進(jìn)行統(tǒng)計(jì)標(biāo)記,統(tǒng)計(jì)完成后按時(shí)間序列進(jìn)行滑動(dòng)窗口數(shù)據(jù)設(shè)計(jì),以此形成一種次優(yōu)的基于滑動(dòng)窗口神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練學(xué)習(xí)。訓(xùn)練數(shù)據(jù)組織排列方式如下:
[x1x2x3x4x5x2x3x4x5x6……………xn-4xn-3xn-2xn-1xn] ⑴
X1至Xn為每個(gè)國(guó)家按月統(tǒng)計(jì)的活躍火頻次數(shù)據(jù),按照以上數(shù)據(jù)排列方式進(jìn)行訓(xùn)練,值得注意的是此處的滑動(dòng)窗口設(shè)計(jì)的數(shù)據(jù)列數(shù)可以根據(jù)實(shí)際需求調(diào)整,未來(lái)輸出的個(gè)數(shù)來(lái)決定。研究區(qū)按(10km×10km)劃分格網(wǎng),每個(gè)格網(wǎng)里以月為單位統(tǒng)計(jì)活躍火頻次,以每個(gè)格網(wǎng)為單位進(jìn)行訓(xùn)練學(xué)習(xí),預(yù)測(cè)出每個(gè)格網(wǎng)的結(jié)果,對(duì)每個(gè)國(guó)家的結(jié)果進(jìn)行累加,與整體的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比驗(yàn)證小于閾值時(shí)輸出結(jié)果。
3 模型
3.1 模型設(shè)計(jì)
本預(yù)測(cè)模型需要通過(guò)GIS軟件進(jìn)行初步的數(shù)據(jù)統(tǒng)計(jì)與整理,篩選出時(shí)間與空間數(shù)據(jù)序列,其次將統(tǒng)計(jì)后的數(shù)據(jù)作為預(yù)測(cè)模型的輸入數(shù)據(jù),預(yù)測(cè)模型核心利用.NET Framework框架通過(guò)c#(sharp)編程語(yǔ)言與ArcEngine開(kāi)發(fā)引擎編寫(xiě)而成,神經(jīng)網(wǎng)絡(luò)搭配使用AForge.NET庫(kù)。AForge.NET主要用于計(jì)算機(jī)視覺(jué)、人工智能、機(jī)器學(xué)習(xí)、圖像處理、機(jī)器人等領(lǐng)域。一種次優(yōu)的基于滑動(dòng)窗口神經(jīng)網(wǎng)絡(luò)算法對(duì)東南亞活躍火頻次進(jìn)行預(yù)測(cè),極大的降低了對(duì)多元數(shù)據(jù)的要求,擴(kuò)大了其應(yīng)用場(chǎng)景與廣度。通過(guò)以上數(shù)據(jù)的整理構(gòu)建東南亞活躍火頻次預(yù)測(cè)模型,通過(guò)交叉驗(yàn)證的方法對(duì)網(wǎng)絡(luò)訓(xùn)練進(jìn)行進(jìn)一步的控制以提高預(yù)測(cè)精度。中南半島活躍火頻次預(yù)測(cè)模型包含對(duì)原始數(shù)據(jù)整體的時(shí)間序列整理,對(duì)劃分網(wǎng)格后的各網(wǎng)格內(nèi)活躍火頻次按時(shí)間序列整理,對(duì)神經(jīng)網(wǎng)絡(luò)模型的建立,對(duì)兩次預(yù)測(cè)模型的閾值設(shè)置與評(píng)判。BP神經(jīng)網(wǎng)絡(luò)的建立包括對(duì)原始數(shù)據(jù)的歸一化處理、初始化權(quán)重、激活函數(shù)的選擇、網(wǎng)絡(luò)模型的構(gòu)建、網(wǎng)絡(luò)訓(xùn)練。中南半島活躍火頻次預(yù)測(cè)模型構(gòu)架圖如圖4所示。
3.2 模型實(shí)驗(yàn)與結(jié)果
本文通過(guò)中南半島活躍火頻次預(yù)測(cè)模型在時(shí)間上以時(shí)間序列月為單位組織數(shù)據(jù)結(jié)構(gòu),在空間上通過(guò)格網(wǎng)10km*10km進(jìn)行劃分,在統(tǒng)計(jì)數(shù)據(jù)的基礎(chǔ)上應(yīng)用模型對(duì)2020年實(shí)際數(shù)據(jù)與模型的輸出數(shù)據(jù)進(jìn)行了實(shí)驗(yàn)對(duì)比。數(shù)據(jù)每個(gè)格網(wǎng)的時(shí)間尺度序列數(shù)據(jù)為輸入,將結(jié)果和實(shí)際值及誤差數(shù)據(jù)通過(guò)GIS軟件可視化出圖。統(tǒng)計(jì)每個(gè)格網(wǎng)的實(shí)際值,根據(jù)2020年活躍火頻次數(shù)量填充格網(wǎng)顏色得到活躍火頻次圖(圖5),通過(guò)模型預(yù)測(cè)的頻次數(shù)量統(tǒng)計(jì)得2020年活躍火預(yù)測(cè)頻次圖、誤差圖(圖6、圖7),實(shí)驗(yàn)表明該模型有較好的穩(wěn)定性、準(zhǔn)確性??蔀榇蟪叨鹊幕钴S火預(yù)測(cè)評(píng)估提供科學(xué)的數(shù)據(jù)支撐。
4 結(jié)束語(yǔ)
本文對(duì)中南半島五國(guó)2020年活躍火進(jìn)行建模預(yù)測(cè)并與實(shí)際對(duì)比,單格網(wǎng)內(nèi)誤差絕對(duì)最大為8。經(jīng)過(guò)多次迭代實(shí)驗(yàn)測(cè)試結(jié)果表明,單個(gè)格網(wǎng)模型程序在誤差小于0.8或者學(xué)習(xí)訓(xùn)練次數(shù)大于8000作為單次結(jié)束條件具有優(yōu)良的預(yù)測(cè)效果。值得注意的是,在做參數(shù)優(yōu)化時(shí)誤差不能設(shè)定的太小,作者在參考其他學(xué)者的研究時(shí)發(fā)現(xiàn),有學(xué)者將其設(shè)置為很小,這可能會(huì)導(dǎo)致程序假死陷入無(wú)線循環(huán)導(dǎo)致無(wú)法結(jié)束。一種次優(yōu)的基于滑動(dòng)窗口神經(jīng)網(wǎng)絡(luò)算法設(shè)計(jì)目的是在沒(méi)有相關(guān)因子情況下,科學(xué)的對(duì)數(shù)據(jù)未來(lái)趨勢(shì)進(jìn)行預(yù)測(cè)評(píng)估,是一種適用于空間大尺度區(qū)域的預(yù)測(cè)算法,是一種適應(yīng)于實(shí)際生產(chǎn)需求的次優(yōu)的算法。本文通過(guò)編程語(yǔ)言合理的設(shè)計(jì)模型并對(duì)中南半島2020年活躍火頻次進(jìn)行了預(yù)測(cè),實(shí)驗(yàn)效果良好。此模型雖然減少了數(shù)據(jù)的輸入量,但是與多因子模型相比精度會(huì)低一些。
參考文獻(xiàn)(References):
[1] 李鵬,李文君,封志明,等.基于FIRMS MODIS與VIIRS的東南亞活躍火頻次時(shí)空動(dòng)態(tài)分析[J].資源科學(xué),2019,41(8):1526-1540.
[2] 劉穎,李鵬,肖池偉,等.中南半島旱季VIIRS活躍火的空間特征與國(guó)別差異[J].地理科學(xué)進(jìn)展,2021,40(8):1406-1418.
[3] Leigh B. Lentile,Zachary A. Holden,Alistair M. S. Smith,el al.Remote sensing techniques to assess active fire characteristics and post-fire effects[J]. International Journal of Wildland Fire,2006,15(3).
[4] U. Choromanska,T.H. DeLuca. Microbial activity andnitrogen mineralization in forest mineral soils following heating: evaluation of post-fire effects[J]. Soil Biology and Biochemistry,2002,34(2).
[5] He Han,ChangYu,LiuZhihua,et al. Evaluations on theConsequences of Fire Suppression and the Ecological Effects of Fuel Treatment Scenarios in a Boreal Forest of the Great Xing'an Mountains, China[J]. Forests,2023,14(1).
[6] Charles W. McHugh,Thomas E. Kolb. Ponderosa pinemortality following fire in northern Arizona[J]. International Journal of Wildland Fire,2003,12(1).
[7] 劉怡媛,李鵬,肖池偉,等.老撾VIIRS活躍火的主要自然地理要素特征[J].地理研究,2020,39(3):749-760.
[8] 廖諶婳,封志明,李鵬,等.緬老泰交界地區(qū)刀耕火種農(nóng)業(yè)的時(shí)空變化格局[J].地理研究,2014,33(8):1529-1541.
[9] 李文君,肖池偉,封志明,等.2015年厄爾尼諾年?yáng)|南亞主要國(guó)家活躍火發(fā)生類型與影響分析[J].自然資源學(xué)報(bào),2020,35(10):2539-2552.
[10] 薛乃婷,張震,杜志恒,等.北極地區(qū)活躍火的時(shí)空分布格局分析[J].極地研究,2020,32(4):555-564.
[11] 李軍,張志東,喬元健,等.基于自適應(yīng)集成神經(jīng)網(wǎng)絡(luò)的火災(zāi)預(yù)測(cè)方法[J].消防科學(xué)與技術(shù),2020,39(12):1727-1731.
[12] 薛乃婷,張震,杜志恒,等.北極地區(qū)活躍火的時(shí)空分布格局分析[J].極地研究,2020,32(4):555-564.
[13] 楊偉,姜曉麗.森林火災(zāi)火燒跡地遙感信息提取及應(yīng)用[J].林業(yè)科學(xué),2018,54(5):135-142.
[14] 丁青,馮險(xiǎn)峰.歐亞北方森林MODIS14數(shù)據(jù)的林火變化分析——以俄羅斯歐洲地區(qū)為例[J].地球信息科學(xué)學(xué)報(bào),2013,15(3):476-482.
[15] 胡超.基于BP人工神經(jīng)網(wǎng)絡(luò)的區(qū)域森林火災(zāi)預(yù)測(cè)研究[D].浙江:浙江海洋學(xué)院,2015.
[16] 史一通.基于BP神經(jīng)網(wǎng)絡(luò)的城市區(qū)域火災(zāi)風(fēng)險(xiǎn)評(píng)估模型研究[D].四川:西南交通大學(xué),2018.
[17] 汪文野,劉靜,賈南.基于神經(jīng)網(wǎng)絡(luò)的森林火災(zāi)預(yù)測(cè)分析[J].武警學(xué)院學(xué)報(bào),2020,36(6):15-20.
[18] 李曉明,顧鈺培,張俊濤.一種滑動(dòng)窗口的GPS軌跡點(diǎn)地圖匹配算法[J].西安工業(yè)大學(xué)學(xué)報(bào),2017,37(6):459-462.
[19] 南虎,路璐,麻曉晶,等.基于卷積神經(jīng)網(wǎng)絡(luò)的滑動(dòng)窗口算法在高分辨電鏡圖像中的應(yīng)用[J].電子顯微學(xué)報(bào),2021,40(3):242-250.
[20] 王亞琴,王耀力,郭學(xué)斌,等.基于直連BP神經(jīng)網(wǎng)絡(luò)模型的森林火險(xiǎn)預(yù)測(cè)[J].森林防火,2018(2):41-45,54.