王 丹,李 琦,*,梁 棟,張爍瑜
(1.河北工業(yè)大學(xué)電子信息工程學(xué)院,天津300401;2.河北工業(yè)大學(xué)土木與交通學(xué)院,天津300401)
公路是我國道路交通網(wǎng)中至關(guān)重要的構(gòu)成部分,良好的道路狀態(tài)是保證公路交通安全的首要條件,如何更有效地規(guī)避道路安全威脅成為首要問題。其中路面裂縫就是威脅道路安全的主要因素之一,準(zhǔn)確快速獲取路面損壞信息已成為道路養(yǎng)護(hù)首要任務(wù)[1]。目前實(shí)際路面裂縫檢測主要依靠人工肉眼識別,這種肉眼檢測方法具有很多弊端:耗費(fèi)大量資源與人力成本;效率低危險(xiǎn)系數(shù)大;檢測結(jié)果受人為影響,容易發(fā)生漏檢誤檢等[2]。因此,借助技術(shù)手段對公路路面裂縫實(shí)現(xiàn)快速高效準(zhǔn)確的檢測具有較大的實(shí)際需求。
現(xiàn)階段路面裂縫檢測算法主要分為兩類,第一類是傳統(tǒng)的基于圖像處理的裂縫檢測方法,首先需通過圖像背景差[3]或細(xì)節(jié)增強(qiáng)法[4]對圖像進(jìn)行預(yù)處理,然后借助邊緣檢測[5]、多尺度分析[6]、多特征融合[7]等方法對路面圖像進(jìn)行分割,得到路面裂縫區(qū)域,但受道路上的多種噪聲干擾較大。另一類基于深度學(xué)習(xí)的路面裂縫檢測算法在應(yīng)對路面噪聲方面表現(xiàn)良好,它主要使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)[8]進(jìn)行裂縫塊狀區(qū)域分類。文獻(xiàn)[9]提出了一種自適應(yīng)增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò),通過增加殘差反向傳播層和自適應(yīng)增強(qiáng)模塊提高路面裂縫的檢測精度。文獻(xiàn)[10]建立了3個(gè)路面裂縫識別模型,可有效檢測出病害類別,并將結(jié)果傳遞給下一模型進(jìn)行特征提取,大幅度提高路面裂縫檢測效率。文獻(xiàn)[11]對不同尺度圖像子塊的中間層特征編碼,并將所獲取的局部特征與淺層的全局特征融合,以描述圖像多尺度特征。文獻(xiàn)[12]利用改進(jìn)Otsu法解決了分割裂縫信息時(shí)對過小信息不敏感以及受背景光照影響較大的問題。
由于基于CNN的路面裂縫檢測算法無法做到預(yù)測結(jié)果與像素的一一對應(yīng),近年來,基于全卷積神經(jīng)網(wǎng)絡(luò)的語義分割成為主要發(fā)展趨勢。LONG等[13]提出的全卷積神經(jīng)網(wǎng)絡(luò)(FCN)為路面裂縫進(jìn)行像素尺度的圖像分割帶來了較大的進(jìn)展,成為該領(lǐng)域較為先進(jìn)的方法。文獻(xiàn)[14]在其基礎(chǔ)上利用4倍上采樣的全卷積神經(jīng)網(wǎng)絡(luò)對圖像做處理,融合了更多的細(xì)節(jié)信息,但4倍上采樣層大大地增加了算法迭代時(shí)間和網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜度。文獻(xiàn)[15]利用不同尺寸的池化層進(jìn)行多尺度特征識別來獲取多層特征,解決訓(xùn)練模型匹配關(guān)系錯誤并且無視小物體的問題。BADRINARAYANAN等[16]通過編碼網(wǎng)絡(luò)、解碼網(wǎng)絡(luò)以及一個(gè)像素級別的分類層代替FCN編解碼器,做到解碼器低分辨率特征映射放大特征圖,但以犧牲分割性能為代價(jià)提高了對占用內(nèi)存空間的壓縮。YU等[17]在原算法基礎(chǔ)上采用空洞卷積與FCN結(jié)合擴(kuò)大感受野,一定程度上融合了更大尺度信息而不損失分辨率。然而,目前的路面裂縫檢測算法沒有充分考慮到全局特征信息,損失了大量圖像細(xì)節(jié)。
針對上述問題,為了探尋準(zhǔn)確率更高的路面裂縫檢測算法,本文提出了一種更為精確的多尺度全卷積與條件隨機(jī)場(CRF)結(jié)合的方法對路面裂縫檢測展開研究。通過對比性能指標(biāo)發(fā)現(xiàn),相較于經(jīng)典的全卷積網(wǎng)絡(luò),改進(jìn)后的算法分割效果有顯著提高。
基于VGGNet優(yōu)異的特征提取能力,本文算法采用以VGG-16為主體框架的FCN-8s網(wǎng)絡(luò),并針對提高網(wǎng)絡(luò)模型檢測準(zhǔn)確性進(jìn)行改進(jìn)。改進(jìn)算法步驟為:
1) 將VGG-16的池化層pool3、pool4的strides設(shè)置為[1,1,1,1],padding設(shè)置為SAME,使圖像特征信息不因池化層影響而損失,又可保留池化整合的特性。
2) 利用空洞卷積構(gòu)建多尺度模塊,并聯(lián)三條空洞率分別為1、2、5的空洞卷積通道,將VGG-16的卷積層conv5的輸出特征圖作為該模塊的輸入,并將三條通道得到的特征信息進(jìn)行融合。
3) 增加BN層和PReLU層,刪除FCN-8s原有的dropout層,防止過擬合現(xiàn)象并進(jìn)行特征歸一化。
4) 對卷積層輸出結(jié)果進(jìn)行反卷積操作,再與pool4節(jié)點(diǎn)進(jìn)行跳躍連接和特征融合。通過選擇不同步長的反卷積層對融合結(jié)果進(jìn)行二次反卷積,并與pool3節(jié)點(diǎn)進(jìn)行跳躍連接,以修正層級迭代帶來的特征消失現(xiàn)象。
5) 將CRF層與多尺度全卷積網(wǎng)絡(luò)進(jìn)行端到端的連接,通過SoftMax層做歸一化處理,計(jì)算出損失函數(shù)并不斷迭代,實(shí)現(xiàn)網(wǎng)絡(luò)的全局感知。
算法模型結(jié)構(gòu)如圖1所示。為了更清晰地展示本文所提出的網(wǎng)絡(luò)結(jié)構(gòu),在圖1中省略了VGG-16框架的部分主體結(jié)構(gòu)。
圖1 本算法模型結(jié)構(gòu)圖Fig.1 Structural diagram of the algorithm model
在CNN算法中,通常由全連接層起到分類器作用,但由于全連接層將輸入特征展開為一維向量,無法將分類結(jié)果與像素一一對應(yīng),損失了輸入的空間信息。
本文采用了以VGG-16為主體框架的FCN算法,將全連接層替換為卷積層,構(gòu)成全卷積神經(jīng)網(wǎng)絡(luò)。采用跳躍連接結(jié)構(gòu)將淺層網(wǎng)絡(luò)特征與深層網(wǎng)絡(luò)特征融合,利用反卷積層[18]對特征融合結(jié)果進(jìn)行上采樣,恢復(fù)特征圖分辨率。這是由于在網(wǎng)絡(luò)迭代過程中,較深層的感受野變大,造成細(xì)節(jié)特征丟失現(xiàn)象,而較淺層的感受野較小,具有更多細(xì)節(jié)信息。深層特征與淺層特征的融合可提高網(wǎng)絡(luò)模型的細(xì)節(jié)捕獲能力,有利于共享中間特征。
根據(jù)反卷積層位置,可將FCN劃分為FCN-32s,F(xiàn)CN-16s,F(xiàn)CN-8s三種模型,模型結(jié)構(gòu)如圖2所示。本文算法采用FCN-8s模型。
圖2 經(jīng)典FCN模型結(jié)構(gòu)圖Fig.2 Structural diagram of classical FCN model
FCN卷積尺寸的增加使感受野變大,但帶來參數(shù)計(jì)算量的增多。Chen[19]提出了空洞卷積結(jié)構(gòu),在擴(kuò)大感受野的同時(shí)避免了額外參數(shù)計(jì)算量的增加。同時(shí),空洞卷積對池化層的替代,有效地減少池化層帶來的特征信息損失,保留圖像細(xì)節(jié)。
空洞卷積利用空洞率r控制輸出特征圖分辨率大小,對輸出特征圖y[m,n],空洞卷積過程定義如下:
(1)
式中,x[m,n]為輸入特征圖;w[i,j]為空洞濾波器;m與n分別為特征圖像素的長和寬;i與j分別為卷積核的長和寬??斩绰蕆決定卷積核的采樣間隔,當(dāng)r≥1,表示卷積核之間引入r-1個(gè)空洞,當(dāng)r=1,空洞卷積為正常卷積??斩淳矸e結(jié)構(gòu)如圖3所示。
圖3 空洞卷積結(jié)構(gòu)Fig.3 Dilated convolution structure
如圖3所示,分別為卷積核大小為3×3,空洞率為1、2、4的空洞卷積。當(dāng)空洞率為r,卷積核大小為k×k時(shí),空洞卷積的感受野擴(kuò)大為
k+(k+1)(r-1),
(2)
使用stride為1的普通卷積,當(dāng)卷積層數(shù)為Μlayer,感受野大小為
(k-1)×Μlayer+1。
(3)
相比之下,空洞卷積可有效地增大感受野。在圖3中,當(dāng)卷積層數(shù)為1時(shí),空洞卷積將普通卷積的感受野由3擴(kuò)大為7和15,有效地減少了參數(shù)計(jì)算量。
2.2.2改進(jìn)多尺度空洞卷積
路面裂縫識別算法多采用單尺度網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行特征提取,忽略了多尺度裂縫特征的感知,造成細(xì)小裂縫特征丟失等問題。若再對細(xì)小裂縫特征進(jìn)行重復(fù)獲取會導(dǎo)致結(jié)構(gòu)冗余[20]。為解決這一問題,本文算法提出利用空洞卷積構(gòu)建多尺度模塊,該模塊共包括3條并行通道。
3條通道的空洞率選擇應(yīng)滿足彼此間不具有大于1的公約數(shù),則該卷積結(jié)構(gòu)可以避免損失信息的連續(xù)性,且需滿足
Mi=max[Mi+1+2ri,
Mi+1-2(Mi+1-ri),r],
(4)
式中,ri為第i層的空洞率;Mi為第i層的最大空洞率。當(dāng)共有n層時(shí),Mn=rn。當(dāng)卷積核大小為k×k時(shí),要求M2≤k,則該空洞率下的空洞卷積核可以覆蓋圖像所有空洞[21]。
經(jīng)多次實(shí)驗(yàn),當(dāng)空洞率r分別為1、2、5時(shí),網(wǎng)絡(luò)模型對路面裂縫的學(xué)習(xí)效果最好,故采用空洞率r分別為1、2、5的三層空洞卷積層,卷積核大小均為3×3。每個(gè)尺度為一個(gè)獨(dú)立分支,分別感知不同尺度感受野的信息。然后,將3個(gè)空洞卷積的信息進(jìn)行融合,并傳遞給下一模塊。
一方面,不同的空洞率可控制多尺度模塊學(xué)習(xí)不同尺度的特征,既保留了原有特征信息,又融合了多個(gè)尺度的特征信息,解決了模型對細(xì)小裂縫信息不敏感的問題。另一方面,并行的多尺度模塊避免了卷積層過多帶來的結(jié)構(gòu)冗余,減少了參數(shù)計(jì)算量。多尺度空洞卷積結(jié)構(gòu)如圖4所示。
圖4 多尺度空洞卷積結(jié)構(gòu)Fig.4 Multiscale dilated convolution structure
由于SoftMax層中的交叉熵?fù)p失函數(shù)反映的是每一個(gè)像素?fù)p失值的和,具有不連續(xù)性,并不能充分考慮相鄰像素之間的空間一致性。
為了克服SoftMax層的局限性,本文算法將CRF與FCN進(jìn)行端到端連接,使FCN可有效提取全局信息。這是由于CRF充分考慮到相鄰像素標(biāo)簽間的上下文聯(lián)系,能有效地增強(qiáng)模型的邊緣約束能力,讓圖像在邊界處進(jìn)行分割,避免標(biāo)簽間獨(dú)立決策導(dǎo)致的準(zhǔn)確率限制。
CRF的能量函數(shù)[22]為
(5)
式中,i、j為像素點(diǎn);xi、xj為像素i、j對應(yīng)的標(biāo)簽值。式中第一項(xiàng)為一元勢函數(shù),描述前端FCN網(wǎng)絡(luò)的輸出,當(dāng)P(xi)為像素i的標(biāo)簽分配概率時(shí),
ψi(xi)=-logP(xi),
(6)
式中第二項(xiàng)為二元勢函數(shù),描述像素間的空間一致性,表示當(dāng)i≠j時(shí),鄰近的像素點(diǎn)i、j的標(biāo)簽xi、xj之間的相關(guān)關(guān)系以及觀測值對其影響,可理解為當(dāng)觀測值接近,xi和xj屬于同一標(biāo)簽的概率較大,反之則較小。二元勢函數(shù)可用如下公式計(jì)算:
(7)
在運(yùn)算過程中,CRF首先確定模型對像素的預(yù)測值,再確定像素值,即該像素的實(shí)際類別。接著,對相鄰兩像素之間的實(shí)際類別和像素預(yù)測值進(jìn)行編碼,求出依賴關(guān)系勢能值。當(dāng)相鄰像素間的實(shí)際類別相同時(shí),其依賴關(guān)系勢能較高,由于CRF是完全連接的,所以即使是路徑很遠(yuǎn)的像素間也可共享信息。最后,利用SoftMax層歸一化[23]輸出結(jié)果:
(8)
式中,Zi為歸一化因子。該式計(jì)算出每個(gè)類別的對應(yīng)概率,輸出特征圖的預(yù)測值。
實(shí)驗(yàn)?zāi)P痛钶dTensorflow深度學(xué)習(xí)框架,基于Windows操作系統(tǒng),硬件配置為Intel Core i5 8300H CPU、Nvidia 1050 Ti顯卡、8GB內(nèi)存,軟件配置為CUDA 9.0、cuDNN 7.5.1,代碼均使用Python 3.5實(shí)現(xiàn)。
由于目前的開放數(shù)據(jù)集如ImageNet、COCO等缺乏路面裂縫數(shù)據(jù),本實(shí)驗(yàn)訓(xùn)練所用數(shù)據(jù)集來自于自行采集并標(biāo)注的1 006幅路面裂縫圖像,包括了不同光照、干擾、場景下的數(shù)據(jù)。為了獲得更多數(shù)據(jù),通過旋轉(zhuǎn)、鏡像、隨機(jī)裁剪、添加椒鹽噪聲的方式進(jìn)行數(shù)據(jù)增強(qiáng),將其擴(kuò)充為8 048幅。測試集為自行采集并標(biāo)注的200幅路面裂縫圖像。均由Nikon D5200相機(jī)拍攝,并將圖像分辨率壓縮為320 pixel×320 pixel。
采集的部分圖像數(shù)據(jù)集如圖5所示。
圖5 部分圖像數(shù)據(jù)集Fig.5 Part of image data set
圖像共標(biāo)注了2類標(biāo)簽,人為地將裂縫處像素值標(biāo)注為1,背景處像素值標(biāo)注為0。加載了VGG-16網(wǎng)絡(luò)在ImageNet上的參數(shù)來初始化模型,減少模型訓(xùn)練時(shí)間,并將網(wǎng)絡(luò)參數(shù)設(shè)置為:Batch size=2,Learning rate=10-6,Max iteration=105。
實(shí)驗(yàn)針對多尺度FCN-8s結(jié)合CRF的算法對路面裂縫識別進(jìn)行研究,在所有訓(xùn)練參數(shù)相同,迭代次數(shù)均為105次的基礎(chǔ)上,對8 048幅路面裂縫數(shù)據(jù)集進(jìn)行訓(xùn)練。在訓(xùn)練過程中,本文算法經(jīng)迭代得到的訓(xùn)練集和驗(yàn)證集損失函數(shù)曲線如圖6所示。其中:縱坐標(biāo)為損失值,橫坐標(biāo)為迭代次數(shù)??梢钥闯?,在模型訓(xùn)練迭代初期,訓(xùn)練集與測試集的損失函數(shù)較大,下降速度較快,此時(shí)的訓(xùn)練結(jié)果不夠真實(shí)。經(jīng)過不斷迭代,損失函數(shù)下降趨勢逐漸平緩,當(dāng)?shù)螖?shù)為40 000次時(shí)接近收斂,該情況下模型對于各類別之間的判定接近于期望結(jié)果。
圖6 迭代過程中損失函數(shù)變化曲線Fig.6 Loss function curve in iteration process
為了更直觀地展示算法檢測效果,通過對比分析經(jīng)典算法FCN-16s、FCN-8s和本文多尺度FCN算法、本文多尺度FCN結(jié)合CRF算法的性能,利用測試集中幾種路面裂縫圖片,對比了算法實(shí)際的圖像分割效果,如圖7所示。
通過對比各算法產(chǎn)生的路面裂縫識別效果,由圖7(c)可以看出,經(jīng)典的FCN-16s算法雖然融合了Pool4層,再進(jìn)行16倍上采樣,將深層次特征與淺層次特征進(jìn)行初步融合,但結(jié)果較為平滑,對裂縫形狀不夠敏感,只能得到裂縫信息的大致輪廓;由圖7(d)可以看出,經(jīng)典的FCN-8s算法依次融合了Pool4層和Pool3層,有效地提升了分類效果,但是仍然損失很多細(xì)節(jié)特征,對更細(xì)小的信息無法準(zhǔn)確識別。
由圖7(e)可以看出,本文多尺度FCN算法有效地避免了池化層帶來的特征損失現(xiàn)象,可同時(shí)感知不同尺度大小的裂縫信息,與單尺度網(wǎng)絡(luò)相比,減少了分割效果的平滑性和模糊性,檢測出上述網(wǎng)絡(luò)中未感知到的細(xì)小裂縫,同時(shí)避免了非裂縫信息的干擾,不受路面背景中的污漬、凹坑的影響,具有較強(qiáng)的魯棒性;由圖7(f)可以看出,本文多尺度FCN結(jié)合CRF的算法與標(biāo)簽圖像的細(xì)節(jié)最相似,具有良好的邊緣約束能力,使圖像在細(xì)小裂縫的邊界處進(jìn)行分割,具有更多的細(xì)節(jié)信息,表現(xiàn)出良好的分割性能。
圖7 幾種算法圖像分割效果對比Fig.7 Comparison of image segmentation effects of several algorithms
路面裂縫分割問題可等效為像素的分類問題,為了評估本文算法的性能,通過分析每個(gè)像素映射到標(biāo)簽的分類結(jié)果,對經(jīng)典算法FCN-16s、FCN-8s和本文算法多尺度FCN-8s、多尺度FCN-8s與CRF結(jié)合算法分別計(jì)算了其性能指標(biāo)。
為了更好地描述性能指標(biāo)的意義,引入以下4種性能指標(biāo)的度量標(biāo)準(zhǔn)。True Positive(TP)表示當(dāng)像素的標(biāo)簽值為1時(shí)預(yù)測值也為1的情況,F(xiàn)alse Positive(FP)表示當(dāng)像素標(biāo)簽值為0時(shí)預(yù)測值為1的情況,F(xiàn)alse Negative(FN)表示當(dāng)像素的標(biāo)簽值為1時(shí)預(yù)測值為0的情況,True Negative(TN)表示當(dāng)像素標(biāo)簽值為0時(shí)預(yù)測值也為0的情況。性能指標(biāo)的度量標(biāo)準(zhǔn)如表1所示。
表1 性能指標(biāo)的度量標(biāo)準(zhǔn)Tab.1 Measure standard of performance indicators
利用NTP、NFP、NFN、NTN分別表示TP、FP、FN、TN情況下的像素個(gè)數(shù),并用其計(jì)算性能指標(biāo)交并比(IOU)、平均準(zhǔn)確率(Mean-Accuracy)、查準(zhǔn)率(Precision)、召回率(Recall),根據(jù)指標(biāo)數(shù)據(jù)評估本文算法的性能。
3.3.1交并比
交并比指預(yù)測值與標(biāo)記值的交疊率,即被預(yù)測正確的路面裂縫像素占其他所有像素的比例,是兩個(gè)標(biāo)簽集合的交集與并集的比值,可以表示為
(9)
它反映了模型對判斷目標(biāo)的捕獲程度和精確程度,是語義分割、目標(biāo)檢測領(lǐng)域最常用的指標(biāo)。交并比的值越大,分割結(jié)果越好,細(xì)節(jié)也就越多。如表2所示為4種算法在不同迭代次數(shù)下的交并比的值。
表2 不同迭代次數(shù)下的交并比Tab.2 IOU with different iterations
3.3.2平均準(zhǔn)確度
準(zhǔn)確度為預(yù)測值正確的像素占所有像素的比值,可以表示為
(10)
平均準(zhǔn)確度分別計(jì)算每個(gè)類內(nèi)被正確分類的路面裂縫像素比例,再求平均值,是準(zhǔn)確度的一種提升,可以表示為
(11)
式中,k為標(biāo)簽類別的數(shù)量;Ai為第i類的平均準(zhǔn)確度。如表3所示為算法在不同迭代次數(shù)下的平均準(zhǔn)確度的值。
表3 不同迭代次數(shù)下的平均準(zhǔn)確度Tab.3 Mean accuracy with different iterations
3.3.3查準(zhǔn)率
查準(zhǔn)率表示預(yù)測值為1且真實(shí)值也為1的像素在預(yù)測值為1的所有像素中所占的比例,即預(yù)測正確的路面裂縫像素占所有被預(yù)測為路面裂縫的像素的比例,可以表示為
(12)
表4所示為4種算法在不同迭代次數(shù)下的查準(zhǔn)率的值。
表4 不同迭代次數(shù)下的查準(zhǔn)率Tab.4 Precision with different iterations
3.3.4召回率
召回率也稱為查全率,表示預(yù)測值為1且標(biāo)簽值也為1的像素與標(biāo)簽值為1的所有樣本像素的比值,即在所有標(biāo)簽值應(yīng)為路面裂縫的像素中,被預(yù)測為路面裂縫的像素所占的比例??梢员硎緸?/p>
(13)
表5所示為4種算法在不同迭代次數(shù)下的召回率的值。
表5 不同迭代次數(shù)下的召回率Tab.5 Recall with different iterations
從表5中數(shù)據(jù)可以看出,在模型迭代105次時(shí),本文多尺度FCN算法的IOU較經(jīng)典FCN-8s提升了0.96%,平均準(zhǔn)確度提升了1.11%,查準(zhǔn)率提升了0.69%,召回率提升了1.24%。本文多尺度FCN結(jié)合CRF算法與未添加CRF之前的IOU相比提升了1.47%,平均準(zhǔn)確度提升了2.71%,查準(zhǔn)率提升了2.2%,召回率提升了2.28%。
可以看出本文算法在準(zhǔn)確性、對細(xì)節(jié)的敏感性上均優(yōu)于傳統(tǒng)FCN算法,可有效地提升圖像分割的準(zhǔn)確性,減少誤判漏判情況,性能更優(yōu)。
針對道路養(yǎng)護(hù)工作中路面裂縫難以精確定位的需求,提出了一種利用條件隨機(jī)場結(jié)構(gòu)結(jié)合全局特征的多尺度全卷積神經(jīng)網(wǎng)絡(luò)路面裂縫檢測算法。相較于經(jīng)典算法主要做了以下三方面的改進(jìn):
1)將FCN-8s的反卷積層跳躍結(jié)構(gòu)應(yīng)用于路面裂縫檢測中,并融合淺層特征信息擴(kuò)充圖像細(xì)節(jié)。相比傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò),此方法可提高模型檢測準(zhǔn)確度。
2)移除FCN的部分池化層,避免特征損失,提高路面裂縫檢測準(zhǔn)確率。并提出一種空洞率分別為1、2、5的三條空洞卷積支路并行模塊。其中,不同的空洞率可實(shí)現(xiàn)對較大裂縫和較小裂縫的多尺度特征感知,彌補(bǔ)了層級迭代帶來的細(xì)節(jié)損失,提高了對不同尺度的裂縫特征的敏感度。空洞卷積可減少前述池化層移除帶來的參數(shù)計(jì)算量,提高訓(xùn)練速度。最終實(shí)現(xiàn)準(zhǔn)確率提高、模型訓(xùn)練時(shí)間減少。
3)設(shè)計(jì)了一種FCN與CRF端到端連接的層級結(jié)構(gòu),利用CRF與SoftMax函數(shù)結(jié)合的方式計(jì)算損失函數(shù)。充分考慮到相似像素之間標(biāo)簽相同的可能性,有效融合了全局特征,使網(wǎng)絡(luò)在持續(xù)迭代中不斷優(yōu)化訓(xùn)練結(jié)果,實(shí)現(xiàn)了將分類結(jié)果與像素一一對應(yīng)。
通過將FCN-16s、FCN-8s以及本文改進(jìn)算法模型性能指標(biāo)做對比,在迭代十萬次后,本文多尺度FCN結(jié)合CRF算法的交并比可達(dá)到80.3%,平均準(zhǔn)確度為96.9%,查準(zhǔn)率為69.7%,召回率可達(dá)到91.7%,均高于經(jīng)典網(wǎng)絡(luò)。該算法較經(jīng)典FCN算法的路面裂縫識別精確度有顯著提高,可以滿足實(shí)際裂縫識別任務(wù)的需求。