劉世澤,范書瑞,郭書緯,賈穎淼
(1.北京航空航天大學(xué) 軟件學(xué)院,北京 100191;2.河北工業(yè)大學(xué) 電子信息工程學(xué)院,天津 300401)
近年來,我國經(jīng)濟(jì)由高速增長階段轉(zhuǎn)向高質(zhì)量發(fā)展階段,改善環(huán)境日漸成為人們的迫切需求,空氣質(zhì)量檢測已經(jīng)成為全體人民關(guān)切的頭等大事。本文結(jié)合傳感網(wǎng)絡(luò)的邊緣檢測技術(shù),通過邊緣檢測算法以及一系列未知點的預(yù)估策略,直觀得到區(qū)域空氣污染物濃度分布狀況;再根據(jù)污染的分布情況對癥下藥,以更加高效地治理環(huán)境污染等問題。
由于監(jiān)測站點是離散隨機(jī)分布的,現(xiàn)如今常用基于圖論知識的Relative Neighborhood Graph(RNG)和Gabriel Graph(GG)拓?fù)溥B接規(guī)則組成一個傳感網(wǎng)絡(luò)結(jié)構(gòu)。Shu Lei 等提出了一種基于RNG 和GG 的平面化邊緣檢測方法,該方法是一種高效的連續(xù)目標(biāo)邊界監(jiān)測方法。傳感器存儲單元內(nèi)含有與它相鄰節(jié)點的檢測狀態(tài),如果節(jié)點讀取到的狀態(tài)出現(xiàn)某種邊界節(jié)點特征,就可以鎖定邊界節(jié)點,從而極大地節(jié)約無線傳感網(wǎng)絡(luò)能量。但是通過監(jiān)測節(jié)點濃度和坐標(biāo)進(jìn)行邊界節(jié)點檢測只考慮有限的邊界節(jié)點,對于實際復(fù)雜的環(huán)境是遠(yuǎn)不夠的。因此,文獻(xiàn)[2]進(jìn)行了關(guān)于無線傳感網(wǎng)絡(luò)空洞檢測方面的研究,考慮工廠環(huán)境下可能存在的污染氣體泄漏問題,并針對最有可能和最有價值的傳感網(wǎng)絡(luò)空洞進(jìn)行修補。為了能獲得完整的傳感器網(wǎng)絡(luò)事件邊緣,師澤源等人提出了一種基于擴(kuò)展場強模型的稀疏AQI 空間插值新算法,這種方法利用最小均方根誤差得出參數(shù)值,與同樣基于空間分布的反距離插值法和權(quán)重質(zhì)心法相比,在空間插值方面更加精準(zhǔn)。
然而以上插值方法僅利用單一距離權(quán)重,沒有考慮風(fēng)速對空氣中顆粒物的擴(kuò)散作用。為了更加貼合實際,本文采用一種顧及風(fēng)向和風(fēng)速的空氣污染物濃度插值方法。該方法強調(diào)結(jié)合風(fēng)速和風(fēng)向以及距離三種因素,繼承了氣體擴(kuò)散模型中“擴(kuò)散”的思想,針對區(qū)域進(jìn)行插值預(yù)測,具有更加良好的效果。
大部分的無線傳感網(wǎng)絡(luò)節(jié)點無法更換電池,所以無線傳感網(wǎng)絡(luò)是一個對功耗有極為嚴(yán)格要求的網(wǎng)絡(luò),需要使用能夠有效延長傳感器節(jié)點壽命的拓?fù)淇刂品椒ā3R姷耐負(fù)鋱D有最小生成樹(Minimum Spanning Tree,MST)、相 關(guān) 鄰 近 圖(Relative Neighborhood Graph,RNG)、泰森多邊形(Voronoi Graph)等。
鄰近圖是一種并不復(fù)雜的幾何圖形,由于其頂點滿足某些特殊要求,可通過連接他們的頂點形成圖形的邊,使其具備一定的幾何特性。在無線傳感網(wǎng)絡(luò)中,鄰近圖可以用來連接無線傳感網(wǎng)絡(luò)節(jié)點的拓?fù)浣Y(jié)構(gòu)。相關(guān)鄰近圖是為了使所有節(jié)點選出距離自己最近的節(jié)點作為自己的鄰居進(jìn)行連接。
相關(guān)鄰近圖連接方法如圖1 所示。頂點,與其他頂點滿足以下條件:,距離小于等于到的距離和到的距離的最大值,即在?≠的條件下滿足:
圖1 RNG 平面示意圖
唐山市開平區(qū)空氣監(jiān)測站點過少,需要采取類似的空洞填充策略,將未覆蓋的區(qū)域進(jìn)行插值填充。為了解決在無線傳感網(wǎng)絡(luò)中的邊緣檢測和傳感網(wǎng)絡(luò)空洞填充的問題,除了平面鄰近圖這樣的通過傳感器節(jié)點和通信鏈路組成的幾何圖形,還有德勞內(nèi)(Delaunay)三角圖、泰森多邊形等基于點線幾何平面關(guān)系建立的幾何圖形,它們都具有良好的空間分布特性。
泰森多邊形解決的實際問題是利用離散的隨機(jī)點將區(qū)域分割成不同區(qū)塊,每個區(qū)塊的中心點是某一個離散點,任何一個點到達(dá)所在區(qū)域的離散點的距離相較于其他離散點是最近的,一般可將該離散點的特征作為所在區(qū)域泰森多邊形的特征。Delaunay 三角圖和泰森多邊形是在城市規(guī)劃中依據(jù)城市相互作用理論對城市進(jìn)行空間分割常用的方法。在環(huán)境監(jiān)測領(lǐng)域,泰森多邊形是對城市進(jìn)行區(qū)域劃分使用較多的方法,它可以突出多種因素影響下的城市分布特征。
利用RNG 的圖論知識可以判斷出邊界節(jié)點,繼而通過邊界節(jié)點的連線判斷出大致邊界,但是存在節(jié)點分布稀疏、精確度不足的問題,因此本文利用泰森多邊形對區(qū)域的潛在空洞位置進(jìn)行填充。從泰森多邊形上看,節(jié)點分布密集的中心城區(qū)有良好的填充作用,但對邊界的作用并不明顯?,F(xiàn)在有很多種不同的插值方法可以選擇,本節(jié)擬采用反距離權(quán)重算法和基于場強模型的空間插值算法兩種不同的基于距離的空間插值方法,呈現(xiàn)更加精確的邊界信息。
反距離權(quán)重算法是一種十分簡單的插值方法,它主要依賴于反距離的冪值,冪參數(shù)可基于距輸出點的距離來控制已知點對內(nèi)插值的影響。該方法中,每個輸入點對最后結(jié)果都有著局部影響,影響隨著距離的增加而減弱,所有影響的疊加求和即為此點的待估值,其算法步驟如下:
1)計算出待測點到已知點的距離:
2)根據(jù)需要,取個距離待測點最近的已知點,權(quán)值為距離的倒數(shù),表示為:
3)將各部分疊加起來作為估計值,即:
空間插值理論適用的前提是待插值的對象有著明顯的空間分布特征,不同對象具有一定程度的空間分布相似性。因此,場強模型就是從物理學(xué)上的電荷電場分布進(jìn)行類比后得出的一種計算空間插值的方法,相對于其他的依據(jù)地理位置信息的計算方法,在均方根誤差方面更具有優(yōu)勢。本節(jié)采用了場強模型插值對空間區(qū)域進(jìn)行插值預(yù)估,場強模型如下:
式中:q是一共個已知節(jié)點中的每一個節(jié)點的數(shù)值;r是,點的經(jīng)緯距離,是受已知點的影響疊加出來的插值結(jié)果。
結(jié)合氣體濃度符合空間特性的結(jié)論,利用擴(kuò)展場強模型算法找到合適的值,并計算RMSE,計算流程為:
1)隨機(jī)選取個已知節(jié)點的任意節(jié)點,與其余-1個節(jié)點計算距離,此時設(shè)置=1,代入式(5)計算插值E;
2)將得到的插值E與已知節(jié)點γ做差,得到ζ;
3)計算均方根誤差RMSE,計算公式如下:
傳統(tǒng)的以距離為單位的插值方法在大氣穩(wěn)定的情況下,具有簡單、效果良好的特點。但是在日常環(huán)境中,風(fēng)對于氣體擴(kuò)散有著重要的影響,單純的運用單一距離為權(quán)重的插值在精確度方面低于利用風(fēng)速風(fēng)向的擴(kuò)散模型的插值方法。利用風(fēng)速風(fēng)向的擴(kuò)散模型的插值方法流程如圖2 所示,首先利用空間插值方法獲得整個區(qū)域的風(fēng)場數(shù)值;其次計算一種基于風(fēng)場數(shù)據(jù)的相鄰單元擴(kuò)散距離;再結(jié)合經(jīng)典的Dijkstra 最短路徑算法,把相鄰單元擴(kuò)散距離結(jié)果轉(zhuǎn)化成一種有向權(quán)鄰接矩陣,矩陣內(nèi)的參數(shù)為相鄰兩點之間的路程,利用最短路徑算法,找出風(fēng)場的最短路徑;最后利用反距離權(quán)重法求解出待測點的污染氣體濃度。
圖2 風(fēng)向和風(fēng)速的空氣污染物濃度插值方法
計算基于風(fēng)場數(shù)據(jù)的相鄰單元擴(kuò)散距離的目的是生成有向權(quán)鄰接矩陣,矩陣內(nèi)的數(shù)值就是相鄰單元擴(kuò)散距離,計算公式為:
式中:Cost 是相鄰單元擴(kuò)散距離,它是由函數(shù)、參數(shù)、參數(shù)共同構(gòu)成;函數(shù)由風(fēng)向作為影響因子;和分別代表a 和b 網(wǎng)格單元處風(fēng)向所表示的方位角;D代表ab 方向的方位角。函數(shù)考慮風(fēng)向因素對于相鄰網(wǎng)格單元間擴(kuò)散的影響,下風(fēng)向的擴(kuò)散距離小,上風(fēng)向的擴(kuò)散距離大。
式中:權(quán)重和充分顧及風(fēng)速因素對于擴(kuò)散的影響,對于下風(fēng)向,風(fēng)速越大擴(kuò)散距離越小,對于上風(fēng)向,風(fēng)速越大擴(kuò)散距離越大,指數(shù)上面的符號函數(shù)通過判斷風(fēng)向得到,如果是同一方向,則對權(quán)重的指數(shù)是正數(shù),對結(jié)果影響較大,如果不是同一方向,則權(quán)重中的指數(shù)為負(fù),整體權(quán)重就會偏小。用上述方法計算出有向加權(quán)鄰接矩陣的元素,得到有向權(quán)鄰接矩陣。
最短路徑是指在每條邊都有權(quán)重的連接圖中,兩個點之間的所有權(quán)重相加后最小的那一條路徑。計算機(jī)在對路徑進(jìn)行遍歷計算時,當(dāng)出現(xiàn)更短路徑時,會替換掉先前路徑,保證路徑的權(quán)值是最短的,縮短距離的過程稱為松弛。經(jīng)典的最短路徑算法有Dijkstra 算法、Bellman?Ford算法等。Dijkstra 算法不需要對邊進(jìn)行迭代松弛,而是選擇與初始點最近的起點開始,不斷選擇距離起點最近的頂點。Dijkstra 算法也有松弛行為,但并不是盲目地對任何一條邊進(jìn)行重復(fù)性松弛計算,它是根據(jù)已確認(rèn)的最短路徑點到下一個待確認(rèn)點的路徑進(jìn)行松弛。因此選用該方法是為了在進(jìn)行不同濃度貢獻(xiàn)度疊加時,選擇的是最有效果的擴(kuò)散路徑。
本文使用的數(shù)據(jù)是唐山微型站2018 年2 月小時數(shù)據(jù),里 面 涵 蓋 的 是 從2018 年2 月1 日00:00 開 始 到2018 年2 月28 日23:00 為 止 詳 細(xì) 的 污 染 物 濃 度 數(shù) 據(jù)。這些數(shù)據(jù)來自唐山市的路北區(qū)、開平區(qū)、豐潤區(qū)、古冶區(qū)等9 塊區(qū)域,400 個監(jiān)測站。采集到的數(shù)據(jù)包含有PM,PM,SO,O,NO,CO 多種污染物數(shù)據(jù)的統(tǒng)計,考慮到數(shù)據(jù)庫數(shù)據(jù)龐大,本次實驗選擇開平區(qū)2 月數(shù)據(jù)進(jìn)行相關(guān)研究。
4.2.1 RNG 方法實現(xiàn)
對目標(biāo)區(qū)域節(jié)點依據(jù)地理位置信息,利用geopy 庫中的geodesic 函數(shù),將經(jīng)緯距離轉(zhuǎn)化為以千米為單位的實際距離。對整個傳感網(wǎng)絡(luò)分塊劃分,將區(qū)域內(nèi)的全部節(jié)點分別作為當(dāng)前計算的中心點,稱之為點,而判斷是否可以連通的計算點稱為點。點的范圍是除了點以外的點都要成為一次節(jié)點,點是作為判斷,能否連通的關(guān)鍵條件,每一個點都要參與檢查自身點是否存在于,的RNG 規(guī)則區(qū)域內(nèi)。最終得到拓?fù)鋱D如圖3 所示。
圖3 開平區(qū)PNG 拓?fù)鋱D
由圖3 可以看出,兩節(jié)點之間的連線較長,圖中存在明顯的空洞。在得到了整張區(qū)域圖的節(jié)點信息后,將節(jié)點濃度指數(shù)(如PM)按照國際標(biāo)準(zhǔn)的顏色對應(yīng)檢測站點數(shù)值,在地圖上呈現(xiàn)出來。圖中綠色節(jié)點PM濃度小于35 μg/m;黃色節(jié)點PM濃度在35~75 μg/m之間;橙色已經(jīng)是輕度污染,PM濃度在115~150 μg/m之間;紅色是重度污染,濃度為150~250 μg/m;紫色為嚴(yán)重污染,濃度在250 μg/m及以上。
4.2.2 泰森多邊形孔洞實現(xiàn)
本文利用泰森多邊形數(shù)學(xué)上的特性進(jìn)行空洞填充。由于預(yù)測空氣檢測站點分布稀疏,相應(yīng)多邊形區(qū)域面積較大,無法準(zhǔn)確預(yù)估空洞地區(qū)的濃度情況,故利用泰森多邊形的相關(guān)性質(zhì),其在無線傳感網(wǎng)絡(luò)的空洞填充方面上具有良好的特性。
泰森多邊形最重要的性質(zhì)為每一個泰森多邊形內(nèi)任意一個點到所在多邊形的內(nèi)部已知點距離是最短的,即如果出現(xiàn)了傳感網(wǎng)絡(luò)空洞,空洞最容易存在的位置是泰森多邊形的頂點位置,該位置若未被傳感器節(jié)點檢測區(qū)域覆蓋,且由于該點距離多邊形中心點的距離是最大的,因此該位置出現(xiàn)空洞的可能性和空洞面積相比其他位置是較大的。圖4 所示為開平區(qū)監(jiān)測站構(gòu)建的泰森多邊形。圖4 中,軸為緯度,軸為經(jīng)度,藍(lán)點是監(jiān)測站點,紅線交叉點是需要進(jìn)行節(jié)點填充的位置。
圖4 開平區(qū)監(jiān)測站泰森多邊形
從圖4 可看出,相較孔洞填充前,區(qū)域中心位置節(jié)點密度明顯增強,但是對于處在地圖區(qū)縣邊緣的節(jié)點,依然稀疏,無法精確地檢測該區(qū)域的邊界。傳感網(wǎng)絡(luò)空洞最容易存在的位置是泰森多邊形的頂點位置,該位置若未被傳感器節(jié)點檢測區(qū)域覆蓋且由于該點距離多邊形中心點的距離是最大的,因此該位置出現(xiàn)空洞的可能性和空洞面積與其他位置相比是較大的。
4.3.1 反距離權(quán)重法結(jié)果
應(yīng)用反距離權(quán)重法對區(qū)域坐標(biāo)進(jìn)行插值,其結(jié)果如圖5 所示。
以距離的倒數(shù)為權(quán)重的預(yù)測方式,從圖5 上看,呈現(xiàn)的是一個向外的類似圓形區(qū)域,根據(jù)反距離權(quán)重法的原理,距離越遠(yuǎn),濃度越小,但在精確度方面并不是很好。
圖5 基于反距離權(quán)重法的插值結(jié)果
4.3.2 基于場強模型的空間插值結(jié)果
根據(jù)式(5)、式(6),計算不同條件下的值以及RMSE 數(shù)值大小。當(dāng)值很小的時候,整個權(quán)重對于距離的依賴程度會很高,分母很小會造成場強疊加的數(shù)值變大,不同點的插值結(jié)果差異較大;而當(dāng)值很大時,會造成整個分母所占比重較大,距離對最終疊加值的影響較小,并且分母數(shù)值過大,造成疊加值大小變得平滑且數(shù)值偏小。因此,將參數(shù)的數(shù)值以0.1 為間隔均勻增加,根據(jù)式(5)、式(6),計算不同條件下的值和RMSE 數(shù)值大??;RMSE 小,代表著當(dāng)前值是在若干中誤差最小、最具有代表性的,則選擇此值完成場強的疊加并計算最終的插值??臻g場強的插值方法最終結(jié)果如圖6 所示。
圖6 基于擴(kuò)展場強模型的插值結(jié)果
圖7 為顧及風(fēng)向和風(fēng)速的空氣污染物濃度插值結(jié)果,結(jié)合地理和氣候環(huán)境情況分析如下:濃度最高的區(qū)域為開平站附近周圍3 家大型耐火材料工廠和1 家冶金行業(yè)工廠。到了冬季,鍋爐等需求量大,因此耐火材料需求量也相對旺盛。生產(chǎn)耐火材料所需的大部分原材料(以礦渣、玄武巖及白云石為主)都是經(jīng)過焦炭為燃料煅燒或電熔后才能使用的,并且在生產(chǎn)過程中還伴有主要成分為粉塵和SO的沖天爐廢氣的產(chǎn)生。另外在上料過程中,由于傳送皮帶之間、皮帶和送料口之間存在高度差,造成部分物料形成揚塵。開平區(qū)南部存在另一個嚴(yán)重污染區(qū)域,該區(qū)域地處開平工業(yè)區(qū),工業(yè)污染較為嚴(yán)重。
圖7 顧及風(fēng)向和風(fēng)速的空氣污染物濃度插值結(jié)果
2 月份正值中國新年之際,煙花爆竹的燃放會造成PM、PM、CO 升高,嚴(yán)重地影響空氣質(zhì)量,并且當(dāng)氣溫較低,大氣層對流運動較弱時,污染物易堆積在近地面,不利于污染物消散,會加劇污染造成空氣質(zhì)量變差。同時冬季的相對濕度小,降水凈化能力弱,不利于空氣質(zhì)量的改善。將三種插值方法得到的PM濃度與真實濃度對比,得到的折線圖如圖8 所示。本實驗選擇的監(jiān)控站是冀東水泥二分公司東南808727 站點。由圖8 可知,三種方法與真實值的折線趨勢大致相同;當(dāng)PM數(shù)值較小時反距離權(quán)重法更接近真實值;當(dāng)PM數(shù)值較大時,風(fēng)向風(fēng)速插值法更接近真實值。2 月前12 天,三種方法差距不大;后16 天PM濃度增加,三種方法結(jié)果出現(xiàn)較明顯差距。
圖8 三種方法對比折線圖
為了直觀地體現(xiàn)各種空間插值方法的實驗結(jié)果誤差,將三種插值方法的根均方誤差(RMSE)計算出來,如表1 所示。由表1 可知,風(fēng)向和風(fēng)速插值法方法與擴(kuò)展場強插值法的插值結(jié)果精度相近,反距離插值方法的插值結(jié)果精度明顯低于擴(kuò)展場強插值法和風(fēng)向風(fēng)速插值法,而本文重點研究的風(fēng)向風(fēng)速插值方法的插值精度相比擴(kuò)展場強插值方法又有所提高。
表1 三種方法的根均方誤差
使用傳感網(wǎng)絡(luò)對污染區(qū)域進(jìn)行邊界檢測,相比人工手持設(shè)備檢測濃度,不但可以提高檢測效率與精度,監(jiān)測范圍也顯著的擴(kuò)大。但是固定的監(jiān)測站點少、流動性差,分布不均使得無法直接對相關(guān)區(qū)域濃度進(jìn)行全方位監(jiān)測。本文基于唐山市各區(qū)縣空氣污染數(shù)據(jù),對豐潤區(qū)的幾十個傳感器節(jié)點進(jìn)行邊界劃分,可以清楚地得到污染區(qū)域的傳感器邊界節(jié)點,通過對邊界節(jié)點的連線可以初步確定邊界的大致形狀。由于傳統(tǒng)的氣體擴(kuò)散模型過于復(fù)雜,并且參數(shù)很難確定,文中采取一種風(fēng)向風(fēng)速氣體擴(kuò)散模型,將空間點轉(zhuǎn)換為一種元素為距離的有向權(quán)鄰接矩陣,利用反距離權(quán)重法得出預(yù)測點濃度大小。最終結(jié)果比以上其他方法更為精確,均方根誤差最小。