中國地質(zhì)大學(xué)(北京) 王君豪 張浩然 時廣升 梅 鋼
遙感影像中提取道路目標(biāo)對城市發(fā)展、鄉(xiāng)村建設(shè)等具有重要意義。相比于日常地圖,遙感影像智能提取技術(shù)能更完整準(zhǔn)確地識別出農(nóng)村的道路情況。本文基于深度學(xué)習(xí)理論,使用二值語義分割網(wǎng)絡(luò)從遙感影像中提取出路網(wǎng),并將路網(wǎng)應(yīng)用于石家莊農(nóng)村新冠疫情分布中,使用空間自相關(guān)分析路網(wǎng)與疫情分布的相關(guān)性。結(jié)果顯示,路網(wǎng)提取結(jié)果具有更高的準(zhǔn)確率,疫情的分布特征和傳播途徑與路網(wǎng)均有很強的正相關(guān)性。本文使用遙感影像分析的路網(wǎng),具備一定的實際應(yīng)用價值,可為采取針對性的疫情防控措施提供理論依據(jù)。
近年來,隨著人工智能的發(fā)展,深度學(xué)習(xí)已經(jīng)成為了研究熱點。作為人工智能中發(fā)展最快的技術(shù),深度學(xué)習(xí)在遙感影像分析領(lǐng)域取得了令人滿意的結(jié)果。道路作為遙感影像中的重要地物,其智能提取技術(shù)在抗震救災(zāi)、交通規(guī)劃、水利工程等方面都具有重要的應(yīng)用價值。
新冠肺炎疫情傳播性強,嚴(yán)重程度高,已成為世界上許多國家和地區(qū)的流行病,其傳播具有流行病學(xué)特征。自去年武漢疫情以來,石家莊最近又爆發(fā)了比較嚴(yán)重的新冠疫情,引起了全國上下的關(guān)注。為了分析此次 疫情分布特點,本文將遙感影像智能化提取的路網(wǎng)應(yīng)用于疫情傳播中,分析路網(wǎng)與疫情分布的相關(guān)性。
傳統(tǒng)路網(wǎng)提取方法大致可分為基于像元方法和面向?qū)ο蠓椒▋深?。前者在確定基本像元后,通過光譜分析識別分割出路網(wǎng),后者則是對道路整體進行建模,從圖像中識別出路網(wǎng)。兩種傳統(tǒng)方法雖相較人工提取方法有效率高,成本低等優(yōu)勢,但提取結(jié)果精準(zhǔn)度仍不太理想,且對于城市道路標(biāo)記較為準(zhǔn)確,而對農(nóng)村道路識別欠缺。
本文基于深度學(xué)習(xí)技術(shù),從遙感影像分析出的農(nóng)村道路網(wǎng)具有更完整更準(zhǔn)確的特點,這種遙感影像智能提取方法可以高效快速獲得所需道路信息,更能反映實際的農(nóng)村道路分布情況。在本文的工作中,我們制作了遙感影像數(shù)據(jù)集,使用語義分割神經(jīng)網(wǎng)絡(luò)進行道路提取任務(wù)的實驗,并將實驗結(jié)果應(yīng)用于新冠疫情,使用空間自相關(guān)分析得到疫情分布與路網(wǎng)的相關(guān)性。
實驗圖像來源于圖新地球衛(wèi)星遙感影像,選取河北石家莊正定國際機場及其周邊村莊8.741km×11.438km的矩形區(qū)域,實驗部分區(qū)域如圖1所示。圖像包括道路、停車場、田地、房屋等多種場景信息。
圖1 實驗區(qū)域部分遙感圖像
石家莊正定國際機場附近的村莊新冠肺炎疫情資料來源于河北省衛(wèi)生健康委員會,選取時間為2021年1月2日至7日。在該地區(qū)內(nèi)新冠肺炎病例短時間內(nèi)迅速增多,達到了傳染病聚集性疫情的標(biāo)準(zhǔn)。
(1)遙感影像道路提?。菏紫戎谱鬟b感影像數(shù)據(jù)集,采用自主人工標(biāo)記標(biāo)簽的方式,將數(shù)據(jù)集中的道路進行標(biāo)注,形成精確度高的道路數(shù)據(jù)集標(biāo)簽,用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練。接著,采用D-LinkNet語義分割神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)集訓(xùn)練、測試,得到道路提取結(jié)果。使用Python將提取小圖拼接,對機場附近道路情況進行可視化展示,得到該區(qū)域的路網(wǎng)。
(2)相關(guān)性分析:采用空間自相關(guān)分析方法。利用全局空間自相關(guān)系數(shù)(Moran's I)分析疫情在空間上是否具有聚類特征,以Z檢驗和P值進行顯著性評價。局部空間自相關(guān)(Local Moran's I)用于分析不同空間單元與鄰近區(qū)域空間差異程度及其顯著水平。對于分析正定機場附近村莊疫情分布特征,該方法具有良好的適用性及研究價值。
2.1.1 數(shù)據(jù)集制作
獲取衛(wèi)星遙感影像后,使用ArcGIS軟件校正圖像的地理坐標(biāo),使遙感圖像及其提取結(jié)果都帶有精確的地理坐標(biāo),方便后續(xù)應(yīng)用。為了便于模型訓(xùn)練,本文對原始圖像做了裁剪處理,得到1862張衛(wèi)星瓦片數(shù)據(jù),圖像分辨率為256×256。
圖2 圖像裁剪小圖
本文使用的是開源圖像標(biāo)注工具Labelme,它基于Python語言,使用QT開發(fā)界面,可以創(chuàng)建定制化標(biāo)注任務(wù)或執(zhí)行圖像標(biāo)注。本文為二值語義分割問題,只對道路這一個對象進行標(biāo)注即可。軟件界面如圖3所示。為了標(biāo)注簡單,選取的標(biāo)注底圖為原始大圖,標(biāo)注完成后裁剪為小圖并與遙感圖像小圖相對應(yīng)。標(biāo)記結(jié)果為png格式圖片,白色道路區(qū)域像素值為255,其余區(qū)域像素值為0。道路標(biāo)記結(jié)果如圖4所示。到此,本文所用的數(shù)據(jù)集制作完成。
圖3 Labelme界面
圖4 標(biāo)記結(jié)果
2.1.2 模型訓(xùn)練
本文使用D-LinkNet語義分割神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)采用編碼器-解碼器結(jié)構(gòu)、空洞卷積和預(yù)訓(xùn)練編碼器進行道路提取任務(wù),在高分辨率遙感影像識別任務(wù)中可以得到良好的道路提取結(jié)果。
深度學(xué)習(xí)模型訓(xùn)練需要大量的計算能力才能高效運行,因而道路提取實驗對電腦硬件要求較為嚴(yán)格。本文的操作系統(tǒng)為Windows10環(huán)境,使用GeForce GTX 1060顯卡,Anaconda配置的Python3.8環(huán)境,配置Pytorch1.7.1深度學(xué)習(xí)框架用于模型訓(xùn)練。詳細實驗參數(shù)如表1所示。
表1 實驗參數(shù)詳細信息
本文的數(shù)據(jù)集分成1000個訓(xùn)練圖像,862張測試圖像。模型訓(xùn)練中,設(shè)置batch size=4,total epoch=300,學(xué)習(xí)率最初設(shè)定為0.0002,并且每運行3個epoch學(xué)習(xí)率減少5%,使用BCE(二進制交叉熵)+Dice系數(shù)作為損失函數(shù),選擇Adam作為優(yōu)化器。
2.1.3 實驗結(jié)果及分析
模型訓(xùn)練完畢,即得到遙感圖像道路提取模型。將待測試圖像輸入,即可輸出道路提取結(jié)果。部分提取結(jié)果如圖5所示。
圖5 部分道路提取結(jié)果
使用Python編程將小圖拼接為大圖,得到路網(wǎng)如圖6所示。從該圖中,可以直觀地看出石家莊正定機場及其附近村莊的道路分布情況。該區(qū)域交通便利,路網(wǎng)復(fù)雜,人員流通頻繁,這為疫情快速傳播提供了條件。
圖6 拼接后的路網(wǎng)
將路網(wǎng)與日常地圖(以百度地圖為例)對比分析,可發(fā)現(xiàn)路網(wǎng)能更完整地識別出農(nóng)村的道路特征,真實地還原實際的道路情況。百度地圖雖然能夠精準(zhǔn)顯示城市的道路,但對于農(nóng)村間道路的標(biāo)記卻不夠完整。從圖7可以看出,百度地圖基本沒有對農(nóng)村小路的標(biāo)記,這說明了遙感影像道路提取的優(yōu)越性,從而可以更精確地應(yīng)用于后續(xù)的疫情與路網(wǎng)相關(guān)性分析中。
圖7 百度地圖與路網(wǎng)對比分析(左為百度地圖,右為路網(wǎng))
2.2.1 疫情分布概況
圖8 機場與出現(xiàn)病例村莊的位置關(guān)系
石家莊正定機場附近,截至1月7日,有8個村莊出現(xiàn)了新冠肺炎病例。其中小果莊村,劉家佐村和南橋寨村病例較多,分別為41例,35例和19例,其余5個村莊感染病例均為1至2例。各村疫情病例數(shù)如表2所示。
表2 各村疫情每日新增病例數(shù)
通過對機場附近村莊新冠肺炎感染情況的可視化呈現(xiàn),可看出該地區(qū)感染病例具有很強的聚集性。
2.2.2 全局空間相關(guān)分析
采用空間自相關(guān)系數(shù)定量地描述各村莊疫情病例數(shù)在空間上的相關(guān)程度與分布特征Moran's I系數(shù)取值范圍為[-1~1],當(dāng)取值>0時表示空間呈正相關(guān),越接近于1表示空間聚集性越強;當(dāng)取值<0時表示空間呈負(fù)相關(guān),越接近于-1表示空間差異性越大;當(dāng)取值=0時表示空間不相關(guān)。
顯著性檢驗:采用標(biāo)準(zhǔn)化統(tǒng)計量Z值,P值來判斷全局空間聚集性是否具有統(tǒng)計學(xué)意義及分析統(tǒng)計學(xué)特征以病例最多的小果莊村為例,計算得到其各指標(biāo)值:Moran's I=0.1287>0,Z=2.4353>1.96且P=0.04<0.05。表明該區(qū)新冠肺炎感染明顯為空間正相關(guān)分布,且呈聚集性分布,聚集性具有統(tǒng)計學(xué)意義。
2.2.3 局部空間相關(guān)分析
采用局部空間自相關(guān)性系數(shù)(Local Moran's I)分析:
根據(jù)Local Moran's I可分出4種類型空間聚集模式。Local Moran's I小于0時表示村莊和其周邊村莊之間空間差異性大。分為低-高聚集:感染人數(shù)低于平均值的地區(qū)(低值地區(qū))被病例高于平均值的地區(qū)(高值地區(qū))包圍;高-低聚集:高值地區(qū)被低值地區(qū)包圍。Local Moran's I大于0時表示村莊和其周邊村莊之間空間差異性小。分為高-高聚集:高值地區(qū)被高值地區(qū)包圍;低-低聚集:低值地區(qū)被低值地區(qū)包圍。
局部自相關(guān)分析顯示,機場附近村莊新冠肺炎疫情分布主要表現(xiàn)為空間正相關(guān),存在高—高、高—低和低—低三種聚集形式,分別位于劉家佐村周圍聚集區(qū),小果莊村周圍聚集區(qū)以及吳村鋪村周圍聚集區(qū)。小果莊村為高度聚集區(qū),附近路網(wǎng)分布密集,人流量大,疫情分布與路網(wǎng)具有很強的相關(guān)性。
2.2.4 疫情傳播與路網(wǎng)相關(guān)性
經(jīng)過調(diào)查,小果莊村存在若干名機場務(wù)工人員,在1月2日前在兩地有過往返經(jīng)歷,而機場人流量大,屬于病毒傳播高風(fēng)險區(qū),這可能是導(dǎo)致小果莊村首先出現(xiàn)大批量感染患者的關(guān)鍵原因。
以小果莊村為中心,疫情傳播與路網(wǎng)具有很強的相關(guān)性。小果莊村成為周圍村莊的傳染源,以其為中心有兩條十字交叉的道路,連通附近村莊,南北向連接劉家佐村、南橋寨村以及北橋寨村,東西向連接牛家莊村和東橋寨村。
圖9 以小果莊村為中心的兩條十字交叉道路
由于交通便利,人員流通頻繁,且人口密度較大,新冠疫情傳播迅速。南北向道路流量較大,這可能是劉家佐村和南橋寨村感染人數(shù)增長過高的原因。三個村莊及其附近區(qū)域都是重點聚集區(qū),需重點關(guān)注,加大疫情監(jiān)測強度,并提前采取針對性防控措施;在非熱點地區(qū)也應(yīng)保持疫情監(jiān)測的敏感性。
本文對遙感影像中道路目標(biāo)的提取進行分析,旨在得到更準(zhǔn)確的提取結(jié)果。基于深度學(xué)習(xí)技術(shù),使用語義分割網(wǎng)絡(luò)對自制的遙感影像數(shù)據(jù)集訓(xùn)練、測試,得到了石家莊國際機場及其附近的路網(wǎng)分布圖。而后,將路網(wǎng)應(yīng)用于疫情分析中,使用空間自相關(guān)分析路網(wǎng)與疫情分布的相關(guān)性。結(jié)果顯示,機場附近村莊疫情呈空間正相關(guān)分布,并具有典型的聚集性,并以小果莊村為重度聚集中心。本文使用遙感影像提取路網(wǎng),可客觀全面反映農(nóng)村道路信息,具備一定的實際應(yīng)用價值。