張煒 周昱杏 楊夢琪
近年來,為促進(jìn)城市綠色基礎(chǔ)設(shè)施建設(shè),評估綠色空間感知效果,綠視率(visible green index)評估已成為評定城市綠化空間的標(biāo)準(zhǔn)指標(biāo)之一,用以指導(dǎo)城市公園、街道等綠色空間的規(guī)劃設(shè)計(jì)。綠視率的概念首先由日本學(xué)者青木陽二提出,其定義為“在人的視野中綠色所占的比例”[1]。綠視率同人的視覺和心理感受密切相關(guān),是一項(xiàng)可以讓人們直觀了解城市綠化水平的指標(biāo)。綠化率作為城市綠色景觀評價(jià)體系的常規(guī)標(biāo)準(zhǔn)之一,相關(guān)研究包括綠視率的影響因素及其對街道景觀、環(huán)境舒適度、人的心理感受方面的影響等[2-3]。
在綠視率的實(shí)踐應(yīng)用中,也逐漸反映出一些問題。由于綠視率基于視野平面范圍進(jìn)行測量,其植被占比不能反映人視環(huán)繞空間中可視綠量的真實(shí)水平。同時(shí),統(tǒng)計(jì)綠視率所依賴照片的拍攝角度、鏡頭焦距等指標(biāo)具有主觀性和不確定性,會(huì)對評估結(jié)果產(chǎn)生一定的影響。
近年來開始出現(xiàn)的全景影像攝影技術(shù)(panoramic photography),是一項(xiàng)使用特定設(shè)備或軟件獲取全景視野圖像的攝影技術(shù),可以捕捉記錄相機(jī)環(huán)繞360°的全景影像,讓觀看者產(chǎn)生身臨其境的效果。全景影像的獲取通常使用多鏡頭相機(jī)拍攝直接獲取,或普通相機(jī)拍照經(jīng)后期拼合處理生成全景影像,目前全景攝影在Web街景服務(wù)、全景VR及攝影展示等領(lǐng)域已獲得廣泛應(yīng)用。全景圖像已成為綠視率研究中新的數(shù)據(jù)來源,如郝新華等[4]通過網(wǎng)絡(luò)爬蟲獲取騰訊地圖的街景圖像,對每個(gè)點(diǎn)獲取前后左右4個(gè)方向的平面圖像,進(jìn)行綠視率評估得出平均值。崔喆等[5]通過Python腳本調(diào)用地圖API批量下載圖片,下載取樣點(diǎn)前后左右4個(gè)方向的街景圖像,并將街景圖轉(zhuǎn)換成HSV色彩空間,提取其中的綠色部分進(jìn)行綠視率計(jì)算。
但目前相關(guān)研究中,使用街景圖分析城市街道綠量等指標(biāo)時(shí),主要通過截取街景全景圖的沿街視角范圍實(shí)現(xiàn)。此類方法本質(zhì)上依然是基于二維視平面的研究,而并非完整的全景球面范圍。因此,本研究擬從完整全景影像入手分析,通過等積投影轉(zhuǎn)換,實(shí)現(xiàn)對全景圖直接的識(shí)別和測量。
綠視率的計(jì)算通常采用網(wǎng)格法,即人為辨識(shí)圖像中的植被區(qū)域并計(jì)算其所占網(wǎng)格面積的比率。通過計(jì)算綠色植物所占方格數(shù)量與總方格數(shù)量的百分比獲得相應(yīng)的全景綠視率。此方法對于少量數(shù)據(jù)的操作簡便易行,但由于人工的介入,存在一定的主觀性,面對大量數(shù)據(jù)難以快速處理。近年來一些研究者對綠視率的計(jì)算提出新的思路。如彭銳等[6]在傳統(tǒng)綠視率計(jì)算方法上探索出一種新的自動(dòng)化計(jì)算方法,利用HSL色彩空間模型對獲取圖像進(jìn)行色彩解析。徐磊青等[7]基于公共空間布局效能和關(guān)鍵指標(biāo)研究建筑界面與綠視率對街道環(huán)境迷人性的不同程度的影響,通過構(gòu)建空間變量的虛擬場景以及虛擬現(xiàn)實(shí)技術(shù)(virtual reality,簡稱VR)沉浸式體驗(yàn)的方法,調(diào)查了體驗(yàn)者在不同綠視率環(huán)境下的主觀感受。
深度學(xué)習(xí)(deep learning,簡稱DL)是指學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,使機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識(shí)別文字、圖像和聲音等數(shù)據(jù)。目前,深度學(xué)習(xí)在人工智能技術(shù)領(lǐng)域中已經(jīng)獲得愈加廣泛的應(yīng)用[8]。近年來隨著深度學(xué)習(xí)技術(shù)的發(fā)展,出現(xiàn)了一系列用于圖像語義分割(sematic segmentation)的開源卷積神經(jīng)網(wǎng)絡(luò)模型。本研究分析和比較現(xiàn)有常用街景識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)模型(convolutional neural networks,簡稱CNN)識(shí)別全景影像中的植被部分,以實(shí)現(xiàn)綠視率計(jì)算的自動(dòng)化。
本研究基于全景影像,在傳統(tǒng)綠視率基礎(chǔ)上,提出全景綠視率概念,并將其定義為:站在固定位置的人環(huán)視四周即360°球面視野中可視綠量占球面視野面積的百分比(圖1)。計(jì)算公式為:
全景綠視率使用全景球面影像替代傳統(tǒng)綠視率所使用的二維圖像。與傳統(tǒng)綠視率指標(biāo)相比,全景綠視率具有兩點(diǎn)優(yōu)勢:
1)全景綠視率綜合反映指定場地環(huán)視360°的綠視率,與人的主觀視覺感受一致,切實(shí)可靠反映該場地周邊環(huán)境綠量的可視情況。
2)全景圖的拍攝過程不會(huì)因相機(jī)鏡頭方向、焦距大小、可視范圍等因素產(chǎn)生影響,可以使得評估結(jié)果更為客觀和準(zhǔn)確。
本研究基于全景影像,提出計(jì)算全景綠視率的方法步驟,包括全景影像獲取、全景影像投影變換、可視植被面積計(jì)算。
全景圖影像的獲取可通過2種方式:傳統(tǒng)相機(jī)拍攝和多鏡頭全景相機(jī)拍攝。
1)用傳統(tǒng)相機(jī)拍攝各取樣點(diǎn),沿水平方向每隔相同角度照相1次,以取樣點(diǎn)多個(gè)視覺角度后期拼合而初步成像。即依據(jù)視覺特征對照片進(jìn)行拼合處理。但此方法步驟復(fù)雜,須后期拼合處理。
2)利用全景拍攝設(shè)備,如多鏡頭全景相機(jī)等進(jìn)行拍攝,直接獲取全景影像,此方法便捷,能夠獲取同時(shí)空下不同視角的全景圖。隨著VR和影像業(yè)發(fā)展,全景設(shè)備應(yīng)用愈加廣泛,直接使用全景相機(jī)拍攝將是未來趨勢。
全景相機(jī)或相關(guān)設(shè)備所獲得的全景影像一般為等距圓柱投影(equirectangular projection)。投影展開圖為一張2 : 1的長方形圖像。在等距圓柱投影圖中,投影面積相等的區(qū)域其真實(shí)面積并不相等。為使全景圖像的面積可量測,需要將其轉(zhuǎn)換為等積圓柱投影(cylindrical equal-area projection)進(jìn)行計(jì)算。具體計(jì)算過程為首先將原始等距圓柱投影轉(zhuǎn)換為球面坐標(biāo),然后將球面坐標(biāo)轉(zhuǎn)換為等積圓柱投影。
2.2.1 等距圓柱投影轉(zhuǎn)球面坐標(biāo)
等距圓柱投影是圓柱投影面與地軸平行,按經(jīng)線長度不變的條件將經(jīng)緯線網(wǎng)投影到圓柱面上,再沿某一母線剖開展平的一種投影。此類投影緯線間隔與實(shí)地等長,經(jīng)線與緯線表現(xiàn)為相互垂直的等距平行直線[9](圖2)。
等距圓柱投影轉(zhuǎn)為球面經(jīng)緯坐標(biāo)公式:
式中,λ是球面坐標(biāo)定點(diǎn)所在位置的經(jīng)度,φ是球面坐標(biāo)定點(diǎn)所在位置的緯度,φ1是球面坐標(biāo)標(biāo)準(zhǔn)緯線,λ0是球面坐標(biāo)中央經(jīng)線,x1是等距圓柱投影位置的水平坐標(biāo),y1是等距圓柱投影位置的垂直坐標(biāo)。
等距圓柱投影轉(zhuǎn)換后生成全景球面(圖3)。
2.2.2 球面坐標(biāo)轉(zhuǎn)等積圓柱投影
等積圓柱投影是在與全景球面赤道相切的圓柱上按等面積條件進(jìn)行投影,其中經(jīng)線為等距平行直線,緯線為垂直于經(jīng)線且間隔隨緯度增加而間距逐漸縮小的平行直線(圖4)。
全景球面轉(zhuǎn)換為等積圓柱投影計(jì)算公式:
式中,λ是全景球面所在位置的經(jīng)度,φ是全景球面所在位置的緯度,λ0是全景球面的中央經(jīng)線,x2是等積圓柱投影位置的水平坐標(biāo),y2是等積圓柱投影位置的垂直坐標(biāo)。
1 全景綠視率原理示意Schematic diagram of panoramic visible green index
2 等距圓柱投影Equirectangular projection
3 全景球面Spherical panorama
4 等積圓柱投影Cylindrical equal-area projection
5 神經(jīng)網(wǎng)絡(luò)模型圖像語義分割過程 [14]Neural-network based semantic segmentation process[14]
將全景圖像轉(zhuǎn)換為等積圓柱投影后,就可以直接測量其各部分投影面積獲得其相對面積。通過等積投影圖像中植被面積所占的比率計(jì)算全景綠視率,其計(jì)算公式為:
投影圖像中植被面積通常用網(wǎng)格法進(jìn)行計(jì)算,但面對大量數(shù)據(jù)時(shí)耗時(shí)較長。為了實(shí)現(xiàn)綠視率的自動(dòng)識(shí)別,部分研究中使用GNU Image Manipulation Program、Adobe Photoshop等圖像處理軟件,基于RGB或HSL通道設(shè)置閾值,篩選提取其綠色像素信息,作為植被部分進(jìn)行計(jì)算。但是,由于光照條件差異,植物莖干等非綠色區(qū)域的存在,以及其他綠色物品干擾等原因,單純依賴于顏色信息,往往并不能準(zhǔn)確代表植物范圍。
本研究嘗試使用基于語義分割的神經(jīng)網(wǎng)絡(luò)模型,對全景圖像中的植被區(qū)域進(jìn)行自動(dòng)識(shí)別,以實(shí)現(xiàn)客觀準(zhǔn)確批量化地計(jì)算綠視率。并將其結(jié)果同傳統(tǒng)人工判別計(jì)算綠視率的方法進(jìn)行對比分析。
神經(jīng)網(wǎng)絡(luò)(neural network)模型是通過模擬人類大腦神經(jīng)元對信息處理的方式,建立數(shù)學(xué)模型,來分析、學(xué)習(xí)和解析數(shù)據(jù)。卷積神經(jīng)網(wǎng)絡(luò)是前饋神經(jīng)網(wǎng)絡(luò)的一種,在圖像識(shí)別中具有廣泛的應(yīng)用,其通常由頂端的全連接層、一個(gè)或多個(gè)卷積層以及池化層構(gòu)成[10]。神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像處理需經(jīng)過圖像預(yù)處理、圖像壓縮、圖像特征提取、圖像分割和圖像識(shí)別五大步驟[11-12],且具有以下特點(diǎn):處理速度快;自適應(yīng)能力強(qiáng);可以建立數(shù)學(xué)模型來分析圖像信息;可處理圖像中的非線性問題;可預(yù)處理圖像中的噪聲或雜質(zhì)數(shù)據(jù)等[13]。
語義分割是圖像分析的一項(xiàng)常用操作,描述了將圖像的每一個(gè)像素同一個(gè)類型標(biāo)簽(如花朵、人物、道路等)建立聯(lián)系的過程(圖5),其通常應(yīng)用于自動(dòng)駕駛、工業(yè)監(jiān)測、遙感影像分類以及醫(yī)學(xué)影像分析等領(lǐng)域。
本研究選擇基于MXNet進(jìn)行封裝的Wolfram Neural Net Repository所提供的5項(xiàng)卷積神經(jīng)網(wǎng)絡(luò)模型[15](表1),對全景圖像中的不同物體進(jìn)行識(shí)別和分類,并針對植被比較各模型的識(shí)別效果。
各模型訓(xùn)練數(shù)據(jù)集均來自Cityscapes數(shù)據(jù)集。Cityscapes數(shù)據(jù)集來源于基于語義理解進(jìn)行手動(dòng)標(biāo)注的25 000張街景圖像,其中包括精細(xì)注釋5 000張和粗略注釋20 000張街景圖像。圖像源自德國50個(gè)城市的街景圖像[19]。每張街景圖像經(jīng)人工識(shí)別將圖像基于內(nèi)容進(jìn)行分割,標(biāo)注共劃分為8組30種類型(表2)[20]。
各模型語義分割識(shí)別的準(zhǔn)確性可使用交并比(Intersection over Union,簡稱IoU)進(jìn)行衡量。IoU是一項(xiàng)衡量目標(biāo)識(shí)別結(jié)果和模型預(yù)測結(jié)果之間重疊百分比的指標(biāo)。IoU指數(shù)的計(jì)算公式為:
IoU=(目標(biāo)結(jié)果∩預(yù)測結(jié)果)/(目標(biāo)結(jié)果∪預(yù)測結(jié)果) (7)
平均交并比即mIoU,通過計(jì)算不同類別的IoU指標(biāo)的平均值,用來衡量圖像語義分割結(jié)果的準(zhǔn)確性[21]。
2019年3月6日,使用Garmin VIRB 360全景相機(jī)在華中農(nóng)業(yè)大學(xué)校園拍攝全景圖像,通過上述各卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別分析,所獲得全影像分辨率為5 640×2 820像素。為提高識(shí)別速度和效率,將其壓縮至分辨率1 600×800像素,并轉(zhuǎn)換為等積圓柱投影圖片進(jìn)行識(shí)別。
表1 不同卷積神經(jīng)網(wǎng)絡(luò)模型相關(guān)信息Tab. 1 The information of different CNNs
表2 Cityscapes數(shù)據(jù)集的類型劃分Tab. 2 Type classification of Cityscape database labeling
為定量評估各模型識(shí)別的準(zhǔn)確性,本研究使用圖像編輯軟件,對等積全景圖的植被范圍進(jìn)行人工識(shí)別,并轉(zhuǎn)換為二值圖像進(jìn)行分析(圖6)。
總體而言,對于樹木部分的識(shí)別,相關(guān)神經(jīng)網(wǎng)絡(luò)會(huì)將樹木枝干所占據(jù)的范圍均識(shí)別為植被部分,而并不會(huì)劃分枝葉之間的孔隙,這導(dǎo)致了對于存在大量枝干孔隙的全景圖,各模型識(shí)別結(jié)果綠視率比依照傳統(tǒng)綠視面積判別方法人工標(biāo)定數(shù)據(jù)要高出5%~15%。但也由于神經(jīng)網(wǎng)絡(luò)并不識(shí)別植被間的較小孔隙這項(xiàng)特點(diǎn),可以降低植被在不同季節(jié)因葉片數(shù)量、顏色、形態(tài)變化而產(chǎn)生的影響,從而保持在不同季相下識(shí)別和評估結(jié)果的一致性。
從不同模型之間的識(shí)別差異來看,各模型識(shí)別效果差異主要表現(xiàn)在對近景草坪和頂層覆蓋空間的識(shí)別效果。Ademxapp Model A1對遠(yuǎn)景植被識(shí)別不夠準(zhǔn)確;Dilated ResNet-22對于覆蓋空間中的植被識(shí)別誤差較大,并將部分地表鋪裝錯(cuò)誤識(shí)別為植被,Multi-scale Context Aggregation Net模型對遠(yuǎn)景和覆蓋空間中的植被識(shí)別效果不夠準(zhǔn)確。為定量評估各神經(jīng)網(wǎng)絡(luò)計(jì)算結(jié)果的準(zhǔn)確性,本研究將人工識(shí)別的植被范圍作為標(biāo)準(zhǔn)數(shù)據(jù)(ground truth),計(jì)算各神經(jīng)網(wǎng)絡(luò)識(shí)別出的綠地范圍的IoU。
依據(jù)mIoU計(jì)算結(jié)果(表3),各項(xiàng)模型識(shí)別準(zhǔn)確度從高至低依次為:Dilated ResNet-105>Dilated ResNet-38 >Multi-scale Context Aggregation Net> Ademxapp Model A1>Dilated ResNet-22。因此,本研究使用Dilated ResNet-105進(jìn)行綠視率測量的實(shí)證研究。
基于前述全景綠視率的評估方法,選取武漢市紫陽公園,對公園內(nèi)各級園路和活動(dòng)廣場的全景綠視率進(jìn)行測量評估。紫陽公園是位于武漢市武昌區(qū)的綜合公園,因紫陽湖得名。公園面積約28.0 hm2,其中水體面積約11.7 hm2,陸地面積約16.3 hm2。
全景影像拍攝時(shí)間為2019年3月12日(周二)09:30—15:30,此期間游客較少,可以降低拍攝過程中游人對測量的干擾。拍攝當(dāng)天平均氣溫16℃,光照條件良好,園內(nèi)落葉樹尚處于萌芽期,枝葉尚不十分茂密,郁閉度較低。
基于紫陽公園游人可進(jìn)入游覽的區(qū)域進(jìn)行等距選點(diǎn)。沿各級園路中心線、道路交叉口、廣場區(qū)域每間隔30 m進(jìn)行一次拍攝,獲得不同活動(dòng)區(qū)域的全景綠視率情況。場地內(nèi)水域和種植區(qū)內(nèi)部等游人不可進(jìn)入?yún)^(qū)域則未進(jìn)行拍攝。拍攝期間由于紫陽湖湖心島和中心路段因施工封閉,因此未能進(jìn)入拍攝。最終總計(jì)獲得126個(gè)拍攝點(diǎn)(圖7)。
全景圖拍攝設(shè)備為Garmin VIRB 360 全景相機(jī),合成全景影像照片分辨率為5 640×2 820像素。相機(jī)自帶GPS+GLONASS衛(wèi)星定位系統(tǒng),可自動(dòng)記錄拍攝影像的地理坐標(biāo)。相機(jī)的拍攝高度根據(jù)國家衛(wèi)健委于2015年發(fā)布的中國成年男女的平均身高設(shè)定視點(diǎn)高度,為1.6 m。
在獲得影像數(shù)據(jù)之后,將原始影像的等距圓柱投影轉(zhuǎn)換為等積圓柱投影,使用Dilated ResNet-105卷積神經(jīng)網(wǎng)絡(luò)對全景影像中綠色植被部分進(jìn)行識(shí)別分析和計(jì)算(表4)。
基于Dilated ResNet-105卷積神經(jīng)網(wǎng)絡(luò)識(shí)別和計(jì)算后,得出紫陽公園出入口、各級園路及活動(dòng)廣場的全景綠視率(圖8)。綜合全園樣點(diǎn)計(jì)算得出公園可游覽區(qū)域的平均全景綠視率為51.18%。從全景綠視率的空間分布來看,各路段綠視率差異不大。其中三級路的平均全景綠視率最高,活動(dòng)廣場最低,公園主路北段和南段綠視率最高,東南和西北路段綠視率略低。區(qū)域內(nèi)平均綠視率從高到低依次為三級路>二級路>公園入口>一級路>活動(dòng)廣場。從全園來看,綠視率最高點(diǎn)為85.42%,最低點(diǎn)21.19%,綠視率最高點(diǎn)位于三級路,是鋪設(shè)于大面積草坪上的汀步,上層植被為高大的喬木,頂層植被覆蓋率高。綠視率最低點(diǎn)位于二級路,四周是大面積水域,植被距離攝像機(jī)鏡頭較遠(yuǎn)。因此在圖像的識(shí)別過程中,綠色植被所占比例較低。
為衡量卷積神經(jīng)網(wǎng)絡(luò)綠視率識(shí)別的準(zhǔn)確性,本研究同時(shí)對126張全景圖像綠視率進(jìn)行人工識(shí)別計(jì)算。通過圖像編輯軟件,對等積圓柱投影的全景圖植被范圍進(jìn)行人工標(biāo)記,并轉(zhuǎn)換為二值圖像,依據(jù)面積百分比計(jì)算相應(yīng)的綠視率。并將人工標(biāo)記數(shù)據(jù)作為標(biāo)定數(shù)據(jù),計(jì)算神經(jīng)網(wǎng)絡(luò)識(shí)別植被區(qū)域的IoU。并以各張圖像的IoU為橫坐標(biāo),神經(jīng)網(wǎng)絡(luò)識(shí)別綠視率及人工識(shí)別綠視率分別作為縱坐標(biāo),繪制得出散點(diǎn)圖(圖9)。
6 不同卷積神經(jīng)網(wǎng)絡(luò)模型對全景圖像的識(shí)別效果Result comparison of different CNNs
7 武漢市紫陽公園全景影像樣點(diǎn)位置Locations of panoramic images at Ziyang Park in Wuhan
8 武漢市紫陽公園全景綠視率分析Distribution of panoramic visible green indices in Ziyang Park in Wuhan
9 不同IoU下卷積神經(jīng)網(wǎng)絡(luò)識(shí)別和人工識(shí)別的綠視率分布The distribution of visible green indices recognized by both CNNs and human under different IoU
表3 神經(jīng)網(wǎng)絡(luò)模型對綠地部分識(shí)別結(jié)果的IoU比較Tab. 3 IoU comparison by different CNNs for green area identification單位:%
表4 基于卷積神經(jīng)網(wǎng)絡(luò)的全景綠視率識(shí)別結(jié)果Tab. 4 Panoramic visible green index identification by CNNs
經(jīng)分析可知,使用Dilated ResNet-105卷積神經(jīng)網(wǎng)絡(luò)綠地范圍識(shí)別的IoU在33.13%~83.68%之間,mIoU為62.53%。從綠視率識(shí)別結(jié)果來看,神經(jīng)網(wǎng)絡(luò)識(shí)別綠視率同人工識(shí)別的綠視率差異在0.40%~23.86%之間,平均差異為9.17%。圖像識(shí)別的IoU越高,相應(yīng)綠視率的平均偏差也就越低(表5)。
為分析卷積神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果和人工識(shí)別結(jié)果間存在差異的原因,將二者植被區(qū)域的二值圖像進(jìn)行對比分析(表6)。
由于語義分割標(biāo)記操作的慣例,卷積神經(jīng)網(wǎng)絡(luò)會(huì)將喬木枝干間的孔隙部分作為植被進(jìn)行識(shí)別。而傳統(tǒng)人工識(shí)別方法,由于植物孔隙顏色與植被存在顯著區(qū)別,因此往往不會(huì)包含植物的孔隙部分。這導(dǎo)致了對于枝葉稀疏的喬木(表6中①~③所示),二者的識(shí)別結(jié)果存在顯著差異。而對于枝葉茂密的植被范圍,二者識(shí)別結(jié)果較為接近(表6中⑤~⑥所示)。
另外,由于本研究所選取的神經(jīng)網(wǎng)絡(luò)模型均采用Cityscapes街景數(shù)據(jù)進(jìn)行訓(xùn)練,其數(shù)據(jù)集來源于德國城市街景,同中國公園環(huán)境存在一定差異。同時(shí),對于圓柱投影下的全景圖,由于相關(guān)要素存在一定的變形,影響了識(shí)別的準(zhǔn)確性。在部分全景圖的識(shí)別過程中,模型會(huì)誤將樹木枝干在地面上的投影、水中的倒影等識(shí)別為植被,或因地形變化而未識(shí)別出部分草坪。在拍攝過程中,相機(jī)底部三腳架不可避免會(huì)對全景圖底部范圍形成局部遮擋,對部分結(jié)果產(chǎn)生一定影響。
表5 卷積神經(jīng)網(wǎng)絡(luò)識(shí)別與人工識(shí)別效果比較Tab. 5 Comparison between CNN recognition and manual recognition
表6 部分圖片的識(shí)別效果對比Tab. 6 Comparison of recognition results of some images
本研究基于全景攝影技術(shù),在傳統(tǒng)綠視率的基礎(chǔ)之上,提出了全景綠視率的概念。并將全景攝影所獲得的等距圓柱投影通過坐標(biāo)轉(zhuǎn)換轉(zhuǎn)為等積圓柱投影,用于測量植被所占區(qū)域的面積,并通過基于語義分割的卷積神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)全景綠視率的自動(dòng)識(shí)別和計(jì)算。
目前普遍使用的全景圖片通常使用等距圓柱投影,其圖上面積并不代表真實(shí)面積,因此對全景影像進(jìn)行等積投影變換,是實(shí)現(xiàn)準(zhǔn)確測算其面積比率的先決條件。本研究通過將全景影像轉(zhuǎn)換為等積圓柱投影,可以在實(shí)現(xiàn)圖片面積可量測的同時(shí),保持圖片內(nèi)容的易識(shí)別性,方便后續(xù)進(jìn)行神經(jīng)網(wǎng)絡(luò)識(shí)別或人工判別。
通過對5項(xiàng)卷積神經(jīng)網(wǎng)絡(luò)模型的植被識(shí)別效果同人工判別結(jié)果比較發(fā)現(xiàn),Dilated ResNet-105神經(jīng)網(wǎng)絡(luò)模型具有最高的識(shí)別準(zhǔn)確性(mIoU為 69.91%)。
從實(shí)際案例應(yīng)用來看,卷積神經(jīng)網(wǎng)絡(luò)識(shí)別計(jì)算的綠視率同人工判別結(jié)果之間存在一定差異,其主要原因在于卷積神經(jīng)網(wǎng)絡(luò)語義分割的識(shí)別特點(diǎn),即前景物體中的孔隙并不會(huì)進(jìn)行單獨(dú)識(shí)別,造成綠地識(shí)別過程中喬灌木的孔隙統(tǒng)一作為植被范圍,使其綠視率平均高于人工判別結(jié)果9.17%左右。但從另一角度來看,卷積神經(jīng)網(wǎng)絡(luò)語義分割的此項(xiàng)特點(diǎn),可以顯著降低不同物候期植物枝葉疏密程度對綠視率所造成的影響,使綠視率的評價(jià)結(jié)果在不同物候條件下保持一致性。
其他造成卷積神經(jīng)網(wǎng)絡(luò)綠視率識(shí)別存在差異的原因包括圖像投影變形、地表陰影、水面投影等產(chǎn)生的影響。對于這些因素,后續(xù)研究中可以通過針對全景圖的標(biāo)定數(shù)據(jù)進(jìn)行訓(xùn)練、調(diào)整神經(jīng)網(wǎng)絡(luò)參數(shù)、優(yōu)化模型層級結(jié)構(gòu)等方式,提升識(shí)別的準(zhǔn)確性。
圖表來源(Sources of Figures and Tables):
圖1~4、6~9由作者繪制,圖5引自參考文獻(xiàn)[14];表1根據(jù)參考文獻(xiàn)[15-17]相關(guān)神經(jīng)網(wǎng)絡(luò)模型的描述信息進(jìn)行總結(jié)歸納;表2源自www.cityscapes-dataset.com/datasetoverview/#class-definitions;表3~6為作者繪制。