杜漸,宋建斌,胡弘毅,符鋅砂
(1.招商新智科技有限公司,北京 100073;2.華南理工大學(xué)土木與交通學(xué)院,廣東 廣州 510641)
截至2020 年末,我國(guó)公路總里程已達(dá)到519.81 萬(wàn)km[1]。公路運(yùn)營(yíng)安全受到全社會(huì)的廣泛關(guān)注,高速公路特別是隧道路段一旦發(fā)生火災(zāi),若不能第一時(shí)間發(fā)現(xiàn)險(xiǎn)情,往往容易演變成重特大交通事故,給人民群眾生命財(cái)產(chǎn)安全造成極大的威脅[2]。因此,火災(zāi)煙霧的及時(shí)識(shí)別與報(bào)警對(duì)于道路運(yùn)營(yíng)管理非常重要。隨著我國(guó)高速公路的監(jiān)控系統(tǒng)由初期的重點(diǎn)路段監(jiān)控逐步發(fā)展為全路段無(wú)盲點(diǎn)的視頻監(jiān)控覆蓋,基于監(jiān)控視頻圖像對(duì)公路火災(zāi)事件進(jìn)行識(shí)別研究非常重要。
早期多采用傳統(tǒng)圖像處理方式提取圖像特征,建立煙霧識(shí)別模型。胡燕等[3]根據(jù)煙霧運(yùn)動(dòng)特征,通過(guò)Harris 檢測(cè)算法尋找特征點(diǎn),計(jì)算運(yùn)動(dòng)矢量信息,實(shí)現(xiàn)多特征煙霧識(shí)別。劉鵬[4]融合背景差分法和RGB 顏色特征檢測(cè)獲取圖像中的疑似煙霧區(qū)域,并采用Adaboost 分類器檢測(cè)煙霧面積與邊界。類似地,袁雯雯等[5]提出基于改進(jìn)高斯混合模型(Gaussian Mixture Model,GMM)的林火煙霧識(shí)別算法,融合背景差分法提取場(chǎng)景光照特征,檢測(cè)場(chǎng)景中相對(duì)完整的動(dòng)態(tài)煙霧區(qū)域。然而傳統(tǒng)圖像處理方法的特征提取能力有限,建立的模型泛化能力不強(qiáng),對(duì)于不同的場(chǎng)景,模型的檢測(cè)效果往往差別很大。隨著深度學(xué)習(xí)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[6]在目標(biāo)檢測(cè)領(lǐng)域中發(fā)展出Faster R-CNN[7],YOLO[8]等識(shí)別網(wǎng)絡(luò),不少學(xué)者也在煙霧識(shí)別研究中應(yīng)用了深度學(xué)習(xí)方法。楊明瀟[9]通過(guò)人工采集和公開林火煙霧數(shù)據(jù)集訓(xùn)練Faster R-CNN,SSD 和VGG神經(jīng)網(wǎng)絡(luò),基于神經(jīng)網(wǎng)絡(luò)構(gòu)建了煙霧識(shí)別可視化平臺(tái),識(shí)別準(zhǔn)確率達(dá)到75%。馮路佳等[10]提出了一種基于目標(biāo)區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)火災(zāi)煙霧識(shí)別方法,構(gòu)建2 層的火災(zāi)煙霧識(shí)別模型,提取煙霧目標(biāo)區(qū)域并輸入識(shí)別層,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)精細(xì)提取煙霧的深層特征后進(jìn)行分類,完成火災(zāi)煙霧的識(shí)別。Saponara等[11]基于YOLOv2網(wǎng)絡(luò)構(gòu)建了室內(nèi)火災(zāi)識(shí)別系統(tǒng)對(duì)固定場(chǎng)景火災(zāi)進(jìn)行識(shí)別報(bào)警。卷積神經(jīng)網(wǎng)絡(luò)特別是深度卷積神經(jīng)網(wǎng)絡(luò),由于具有多層線性與非線性映射參數(shù),對(duì)圖像數(shù)據(jù)的特征提取能力相較于傳統(tǒng)手工特征提取方法有了很大提高,但由于網(wǎng)絡(luò)層數(shù)多,造成網(wǎng)絡(luò)參數(shù)量大,計(jì)算復(fù)雜度高,網(wǎng)絡(luò)參數(shù)和中間層輸出占用大量計(jì)算資源和顯存,導(dǎo)致深度卷積神經(jīng)網(wǎng)絡(luò)在邊緣端需要布設(shè)多臺(tái)設(shè)備才能同時(shí)處理多臺(tái)公路監(jiān)控?cái)z像機(jī)的圖像輸入,同時(shí)為訓(xùn)練出精度滿足實(shí)際識(shí)別要求的卷積神經(jīng)網(wǎng)絡(luò)而需要導(dǎo)入大量圖像數(shù)據(jù),故對(duì)訓(xùn)練樣本的標(biāo)注質(zhì)量也有較高要求。
針對(duì)公路場(chǎng)景煙霧識(shí)別的精度問(wèn)題,本文基于目前目標(biāo)檢測(cè)領(lǐng)域的新型網(wǎng)絡(luò)YOLOX[12]進(jìn)行研究,深入分析其結(jié)構(gòu)與特征提取優(yōu)勢(shì),同時(shí)人工收集公路場(chǎng)景煙霧圖像結(jié)合部分Smoke100K 數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,采用數(shù)據(jù)增強(qiáng)方法對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充,提高訓(xùn)練集的多樣性,從而提高網(wǎng)絡(luò)在不同場(chǎng)景下的識(shí)別能力。針對(duì)深層卷積網(wǎng)絡(luò)計(jì)算資源占用過(guò)多的問(wèn)題,利用深度可分離卷積方法壓縮網(wǎng)絡(luò)主體結(jié)構(gòu),實(shí)驗(yàn)階段構(gòu)建并對(duì)比分析不同結(jié)構(gòu)網(wǎng)絡(luò)的煙霧識(shí)別精確度,旨在搭建滿足精確度要求且計(jì)算資源占用盡量小的模型,實(shí)現(xiàn)基于視頻圖像的公路場(chǎng)景火災(zāi)煙霧智能識(shí)別及工程應(yīng)用。
近年來(lái),目標(biāo)識(shí)別網(wǎng)絡(luò)在交通行業(yè)的應(yīng)用越來(lái)越普遍,YOLO 系列識(shí)別網(wǎng)絡(luò)在車輛識(shí)別[13]、行人識(shí)別[14]、交通標(biāo)志檢測(cè)[15]等任務(wù)中取得了較好的效果。然而對(duì)于公路場(chǎng)景下的煙霧識(shí)別,由于煙霧的形狀不固定,公開的訓(xùn)練數(shù)據(jù)集較少,傳統(tǒng)的目標(biāo)識(shí)別網(wǎng)絡(luò)對(duì)煙霧的識(shí)別效果一般,因此在煙霧識(shí)別任務(wù)中對(duì)目標(biāo)識(shí)別網(wǎng)絡(luò)的特征提取能力有更高的要求。同時(shí),由于公路場(chǎng)景一般由多攝像頭同時(shí)監(jiān)控,若模型參數(shù)過(guò)于龐大,對(duì)硬件算力和存儲(chǔ)需求較高,將直接導(dǎo)致計(jì)算成本大幅增加,因此追求模型精度的同時(shí)必須盡量減少網(wǎng)絡(luò)的參數(shù)量與中間層輸出。
YOLOX 網(wǎng)絡(luò)在YOLOv5[16]的基礎(chǔ)上對(duì)模型網(wǎng)絡(luò)作了優(yōu)化,在特征提取部分采用了CSPDarknet網(wǎng)絡(luò)[17],獲取特定特征層作特征融合后,在分類回歸層中采用了YOLOHead[12]方法,對(duì)傳統(tǒng)YOLO網(wǎng)絡(luò)的分類回歸層結(jié)構(gòu)作了優(yōu)化調(diào)整。本文針對(duì)公路場(chǎng)景下的煙霧識(shí)別問(wèn)題,構(gòu)建了小型煙霧圖像數(shù)據(jù)集,網(wǎng)絡(luò)訓(xùn)練過(guò)程中在圖像預(yù)處理上采用Mosaic 數(shù)據(jù)增強(qiáng)方法[17],提升了數(shù)據(jù)的多樣性,同時(shí)為了實(shí)現(xiàn)網(wǎng)絡(luò)輕量化,采用深度可分離卷積的方法壓縮主干網(wǎng)絡(luò),構(gòu)建nano網(wǎng)絡(luò),降低了部分精度但大大精簡(jiǎn)了網(wǎng)絡(luò)結(jié)構(gòu)的總參數(shù)量。本文就YOLOX 主干網(wǎng)絡(luò)、模型輕量化方法進(jìn)行分析。
YOLOX 的主干網(wǎng)絡(luò)包括3 部分,分別是特征提取層CSPDarknet 網(wǎng)絡(luò)、特征融合層以及分類回歸層YOLOHead。
1.1.1 特征提取
CSPDarknet 網(wǎng)絡(luò)是通過(guò)堆疊多個(gè)Resblock body 模塊對(duì)圖像特征進(jìn)行提取,具體結(jié)構(gòu)見表1。首先輸入640×640 的RGB 三通道圖像并通過(guò)Focus對(duì)圖像尺寸和通道數(shù)進(jìn)行調(diào)整。利用4個(gè)堆疊的Resblock body 模塊作特征提取。Resblock body模塊由卷積層與CSPlayer 層組成,其中CSPlayer層優(yōu)化了參數(shù)數(shù)量并保留了較好的特征提取能力。最終CSPDarknet 的輸出是第2,3,4 個(gè)Resblock body模塊的輸出特征圖。
表1 CSPDarknet結(jié)構(gòu)
1.1.2 特征融合
CSPDarknet 輸出的3 個(gè)特征圖會(huì)輸入至特征融合層,用作特征融合與加強(qiáng)特征提取。特征融合層采用YOLOv4 的Panet 結(jié)構(gòu)[17],輸入特征圖通過(guò)卷積層調(diào)整尺寸,通過(guò)上、下采樣層(UpSampling2D,DownSampling2D)作特征融合。特征融合層的有效輸出是部分CSPlayer層的輸出特征圖,特征融合層的具體結(jié)構(gòu)見圖1。最終用于分類回歸層的有效特征圖為輸出特征圖6,7,8。
1.1.3 分類回歸
完成特征融合與加強(qiáng)特征提取后,3 張輸出特征圖將分別輸入至分類回歸層YOLOHead,最終輸出網(wǎng)絡(luò)識(shí)別結(jié)果,包括物體識(shí)別的種類和標(biāo)注框的坐標(biāo)。傳統(tǒng)YOLO 系列識(shí)別網(wǎng)絡(luò)的分類回歸層通過(guò)1×1 卷積層實(shí)現(xiàn)分類和回歸同時(shí)處理,但YOLOHead 具有2 條卷積分支,其中一條卷積分支用于實(shí)現(xiàn)物體分類(Cls),輸出物體識(shí)別類型;另一條卷積分支用于判斷特征點(diǎn)中物體是否存在(Obj)和回歸標(biāo)注框坐標(biāo)(Reg)。YOLOHead的具體結(jié)構(gòu)如圖2所示。
Sifre等[18]提出的深度可分離卷積是網(wǎng)絡(luò)輕量化的重要方法。該方法將標(biāo)準(zhǔn)卷積操作拆分為深度卷積和逐點(diǎn)卷積兩個(gè)步驟。通過(guò)深度可分離卷積方法,在盡量減少網(wǎng)絡(luò)精度損失的同時(shí),可大大精簡(jiǎn)網(wǎng)絡(luò)參數(shù),減少運(yùn)算量。
標(biāo)準(zhǔn)卷積過(guò)程中,取N組具有相同尺寸(Dk×Dk×C)的卷積核對(duì)輸入圖像進(jìn)行卷積,假設(shè)需要的特征圖尺寸為(W×H×N),卷積核參數(shù)總量(P)和卷積操作的總運(yùn)算量即內(nèi)積運(yùn)算量(CA)的計(jì)算公式分別如式(1)、式(2)所示。
標(biāo)準(zhǔn)卷積操作如圖3(a)所示,假設(shè)輸入的圖像尺寸為10×10×3,通過(guò)3×3×3 的卷積核可以卷積獲得1個(gè)8×8×1的特征圖,若堆疊256組具有相同尺寸的卷積核則可以對(duì)輸入圖像卷積獲得8×8×256 的輸出特征圖。對(duì)于該標(biāo)準(zhǔn)卷積操作,根據(jù)式(1)、式(2),該卷積層參數(shù)量為3×3×3×256,共6 912;內(nèi)積運(yùn)算量為3×3×3×256×8×8,共442 368。
深度可分離卷積則包含2個(gè)步驟,如圖3(b)所示。第1 步是深度卷積。深度卷積的卷積核為單通道形式(3×3×1),取3 組卷積核對(duì)圖像進(jìn)行標(biāo)準(zhǔn)卷積操作,此時(shí)獲取的特征層尺寸維度為8×8×3,深度卷積的卷積核參數(shù)量為3×3×1×3,共27;總運(yùn)算量為3×3×1×3×8×8,共1 728。第2 步是逐點(diǎn)卷積。逐點(diǎn)卷積的卷積核為3 通道但尺寸為1×1,采用256組相同的1×1×3的卷積核對(duì)深度卷積的輸出圖像進(jìn)行標(biāo)準(zhǔn)卷積操作,即可獲得與標(biāo)準(zhǔn)卷積方法相同的8×8×256 輸出特征圖,逐點(diǎn)卷積的卷積核參數(shù)量為1×1×3×256,共768;總運(yùn)算量為1×1×3×256×8×8,共49 152。在完整的深度可分離卷積過(guò)程中,卷積層總參數(shù)量為27+768=795,內(nèi)積運(yùn)算量為1728+49152=50880。相較于標(biāo)準(zhǔn)卷積,深度可分離卷積的卷積層總參數(shù)量與內(nèi)積運(yùn)算量均顯著減少。
兩種方法各自需要的卷積層參數(shù)量、內(nèi)積運(yùn)算量如表2 所示。深度可分離卷積方法可壓縮網(wǎng)絡(luò)規(guī)模和減少運(yùn)算量,在利用相同寬和高的卷積核獲取固定尺寸特征圖的過(guò)程中,深度可卷積方法的總參數(shù)量與內(nèi)積運(yùn)算量均為標(biāo)準(zhǔn)卷積方法的1/N+1/Dk2,是實(shí)現(xiàn)輕量化的關(guān)鍵。nano 網(wǎng)絡(luò)是在普通YOLOX 網(wǎng)絡(luò)的基礎(chǔ)上運(yùn)用深度可分離卷積方法精簡(jiǎn)參數(shù)構(gòu)建的輕量化網(wǎng)絡(luò)。
表2 兩種卷積方法對(duì)比
本文搜集了多個(gè)高速公路路段不同監(jiān)控場(chǎng)景、不同攝像機(jī)視角下的煙霧圖像樣本,同時(shí)為了增加樣本場(chǎng)景的多樣性,數(shù)據(jù)集中加入了公開數(shù)據(jù)集Smoke100K[19]的部分煙霧數(shù)據(jù)圖像。數(shù)據(jù)集共有圖像5 367 張,對(duì)圖像中的煙霧部分進(jìn)行了人工標(biāo)注,按照7∶1∶2 劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,部分樣本實(shí)例及標(biāo)注形式如圖4所示。數(shù)據(jù)集導(dǎo)入網(wǎng)絡(luò)訓(xùn)練前,采用Mosaic 數(shù)據(jù)增強(qiáng)方法對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充。
由于實(shí)驗(yàn)收集標(biāo)注的煙霧數(shù)據(jù)集為小型數(shù)據(jù)集,訓(xùn)練樣本量較少且存在重復(fù)場(chǎng)景,為了增加煙霧樣本的多樣性,豐富目標(biāo)的背景,本文在圖像數(shù)據(jù)預(yù)處理過(guò)程中采用了Mosaic 數(shù)據(jù)增強(qiáng)方法[17],盡量避免網(wǎng)絡(luò)在訓(xùn)練過(guò)程中陷入過(guò)擬合,以提高網(wǎng)絡(luò)的識(shí)別精確度與泛化能力。
Mosaic 數(shù)據(jù)增強(qiáng)對(duì)訓(xùn)練集的具體操作如圖5所示。首先從總的訓(xùn)練數(shù)據(jù)集中隨機(jī)抽取一批圖像,然后從該批圖像中隨機(jī)選出4 張,再對(duì)4 張圖像分別進(jìn)行隨機(jī)裁剪、放縮、旋轉(zhuǎn)操作,最后拼接為新的圖像并作為網(wǎng)絡(luò)訓(xùn)練的輸入圖像。需要注意的是,處理過(guò)程中的圖像是含有標(biāo)注框坐標(biāo)信息的,因此獲取的新圖像同樣含有煙霧標(biāo)注框的坐標(biāo)信息。
本實(shí)驗(yàn)的機(jī)器配置如下:一個(gè)NVIDIA GTX-3060-12G 圖形處理器(GPU)和一個(gè)AMD Ryzen 7 5800X 中央處理器(CPU)?;谏疃葘W(xué)習(xí)框架Pytorch 搭建YOLOX 目標(biāo)檢測(cè)模型,即根據(jù)結(jié)構(gòu)與參數(shù)量的不同搭建YOLOX-m,YOLOX-s,YOLOX-tiny 和YOLOX-nano 共4 種目標(biāo)檢測(cè)模型。在訓(xùn)練階段導(dǎo)入煙霧數(shù)據(jù)集測(cè)試之前,為了提高網(wǎng)絡(luò)的泛化能力,預(yù)訓(xùn)練權(quán)重采用經(jīng)由大型數(shù)據(jù)集COCO[20]訓(xùn)練的模型參數(shù),梯度下降優(yōu)化策略采用Adam 優(yōu)化器。實(shí)驗(yàn)過(guò)程中采用兩階段訓(xùn)練法:第1 階段凍結(jié)網(wǎng)絡(luò)主體參數(shù),僅訓(xùn)練網(wǎng)絡(luò)分類層參數(shù),初始學(xué)習(xí)率設(shè)置為0.00 1;第2階段訓(xùn)練網(wǎng)絡(luò)所有參數(shù),初始學(xué)習(xí)率設(shè)置為0.00 01。實(shí)驗(yàn)過(guò)程中兩階段各訓(xùn)練60 個(gè)迭代(epoch),共訓(xùn)練120 個(gè)迭代。需要對(duì)原始圖像作預(yù)處理,壓縮為640×640 的RGB 圖像,同時(shí)不同參數(shù)規(guī)模的網(wǎng)絡(luò)每批次輸入的最大圖片數(shù)量也有所不同:對(duì)于YOLOX-m 和YOLOX-s,第1 階段每批次輸入圖像數(shù)為64,第2 階段每批次輸入圖像數(shù)為16;對(duì)于YOLOX-tiny和YOLOX-nano,第1階段每批次輸入圖像數(shù)為128,第2 階段每批次輸入圖像為32。通過(guò)實(shí)驗(yàn)設(shè)置可以發(fā)現(xiàn),網(wǎng)絡(luò)結(jié)構(gòu)越精簡(jiǎn)、參數(shù)量越少的網(wǎng)絡(luò)同一批次能處理的圖像數(shù)量越多。
本節(jié)對(duì)YOLOX 不同規(guī)模的目標(biāo)檢測(cè)網(wǎng)絡(luò)(m,s,tiny,nano)進(jìn)行對(duì)比。以精確度(Precision)作為實(shí)驗(yàn)結(jié)果評(píng)價(jià)指標(biāo),具體網(wǎng)絡(luò)參數(shù)與實(shí)驗(yàn)結(jié)果如表3所示。識(shí)別效果實(shí)例見圖6。
表3 YOLOX不同規(guī)模網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果對(duì)比
由實(shí)驗(yàn)結(jié)果可知:
(1)4 種規(guī)模的YOLOX 在公路場(chǎng)景下的煙霧識(shí)別精確度均達(dá)到90%以上。其中,tiny,s,m 網(wǎng)絡(luò)的識(shí)別精確度達(dá)到了95%以上,可以滿足實(shí)際運(yùn)營(yíng)管理要求。就同系列YOLOX 的網(wǎng)絡(luò)精度與規(guī)模而言,本次實(shí)驗(yàn)結(jié)果符合目標(biāo)檢測(cè)網(wǎng)絡(luò)的一般性結(jié)果,即:結(jié)構(gòu)層數(shù)越多、參數(shù)量越多的卷積神經(jīng)網(wǎng)絡(luò)特征提取能力越強(qiáng),模型的泛化能力越強(qiáng),識(shí)別精確度越高。
(2)4 種網(wǎng)絡(luò)的精確度差異不超過(guò)10%。測(cè)試過(guò)程中每秒識(shí)別幀數(shù)(Frames Per Second,FPS)均大于30,但網(wǎng)絡(luò)模型大小與總參數(shù)量差異極大,tiny網(wǎng)絡(luò)和nano網(wǎng)絡(luò)在普通YOLOX 網(wǎng)絡(luò)基礎(chǔ)上作了極大的精簡(jiǎn),tiny 網(wǎng)絡(luò)模型大小及總參數(shù)量是m 網(wǎng)絡(luò)的1/5,nano 網(wǎng)絡(luò)模型大小及總參數(shù)量?jī)H為m 網(wǎng)絡(luò)的1/25,說(shuō)明在相同硬件條件下輕量化模型tiny 和nano 能處理更多的輸入圖像。由于目前高速公路運(yùn)營(yíng)管理部門普遍設(shè)置多攝像頭同時(shí)對(duì)公路交通狀況進(jìn)行監(jiān)控,而輕量化網(wǎng)絡(luò)模型能同時(shí)處理多攝像頭傳輸圖像,因此能有效減少需要布置的圖像處理設(shè)備數(shù)量,在滿足識(shí)別精確度的前提下降低設(shè)備成本。
綜上所述,YOLOX 網(wǎng)絡(luò)模型在煙霧識(shí)別精度與速度方面均滿足使用要求,輕量化模型tiny網(wǎng)絡(luò)和nano 網(wǎng)絡(luò)在模型大小和參數(shù)量指標(biāo)上較m網(wǎng)絡(luò)和s 網(wǎng)絡(luò)有較大改善,能更好地完成多圖像并行處理的識(shí)別任務(wù),滿足對(duì)多交通視頻流同時(shí)進(jìn)行煙霧識(shí)別的工程應(yīng)用需求。
本文通過(guò)收集并標(biāo)注多公路監(jiān)控場(chǎng)景下的煙霧圖像數(shù)據(jù)集,結(jié)合Smoke100K 部分?jǐn)?shù)據(jù)集,整理形成公路場(chǎng)景煙霧數(shù)據(jù)集;搭建并訓(xùn)練了多種結(jié)構(gòu)不同層數(shù)的YOLOX 目標(biāo)識(shí)別網(wǎng)絡(luò),對(duì)YOLOX 系列網(wǎng)絡(luò)的主體結(jié)構(gòu)與輕量化方法進(jìn)行了分析。在訓(xùn)練過(guò)程中采用Mosaic 數(shù)據(jù)增強(qiáng)手段對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充,有效地提高了模型的泛化能力。通過(guò)導(dǎo)入煙霧圖像測(cè)試集,從網(wǎng)絡(luò)識(shí)別精度、模型大小及總參數(shù)量等指標(biāo)的角度對(duì)4種YOLOX 識(shí)別網(wǎng)絡(luò)進(jìn)行對(duì)比分析,結(jié)果表明YOLOX 系列模型均能較好地完成煙霧識(shí)別任務(wù),精確度均達(dá)到90%以上,m,s 和tiny 網(wǎng)絡(luò)的識(shí)別精度達(dá)到95%以上,說(shuō)明YOLOX 網(wǎng)絡(luò)結(jié)構(gòu)具有較強(qiáng)的煙霧特征提取能力,可以滿足公路運(yùn)營(yíng)監(jiān)控對(duì)火災(zāi)煙霧事件的識(shí)別精度要求。同時(shí),基于深度可分離卷積方法構(gòu)建的輕量化網(wǎng)絡(luò)nano,煙霧識(shí)別精度比m 網(wǎng)絡(luò)和s 網(wǎng)絡(luò)略低,但模型規(guī)模遠(yuǎn)小于m 網(wǎng)絡(luò)和s 網(wǎng)絡(luò);nano 網(wǎng)絡(luò)較m 網(wǎng)絡(luò)的識(shí)別精度低8.35%,但模型大小及總參數(shù)量?jī)H為m 網(wǎng)絡(luò)的1/25,說(shuō)明輕量化模型對(duì)計(jì)算資源的占用較少,在識(shí)別精度滿足公路運(yùn)營(yíng)監(jiān)控要求的前提下適當(dāng)壓縮模型規(guī)模,可以增加同批次輸入網(wǎng)絡(luò)的圖像數(shù)量,使煙霧識(shí)別模型在邊緣端得到更好的應(yīng)用。
此外,受Mosiac 數(shù)據(jù)增強(qiáng)方法的啟發(fā),在今后的研究中將從對(duì)樣本數(shù)據(jù)集作特征提取的角度進(jìn)一步探究輕量化模型在樣本不足條件下的訓(xùn)練精度問(wèn)題。同時(shí),注意到由于參數(shù)量減少會(huì)降低輕量化模型的特征提取能力進(jìn)而影響識(shí)別精度,后續(xù)將繼續(xù)深入研究模型輕量化與識(shí)別精度的平衡問(wèn)題,分析網(wǎng)絡(luò)各層的特征提取能力,進(jìn)一步提高公路場(chǎng)景下煙霧識(shí)別效率。