李榮磊, 裴莉莉, 關(guān) 偉, 袁 博, 李 偉
1(長安大學(xué) 信息工程學(xué)院, 西安 710064)
2(交通運輸部公路科學(xué)研究所, 北京 100088)
我國交通部建立了足尺路面環(huán)道試驗場[1]來更好地研究道路結(jié)構(gòu)、交通荷載、氣候狀況等因素對道路壽命的影響問題, 通過埋設(shè)傳感器對瀝青路面各項性能進(jìn)行測量[2], 感知數(shù)據(jù)基本能夠反映不同路面結(jié)構(gòu)的健康狀態(tài). 為能夠準(zhǔn)確研究車輛輪跡帶的分布所導(dǎo)致的路面受力情況的不同, 從而進(jìn)行全路域受力分析以及研究車轍演變規(guī)律, 需要及時發(fā)現(xiàn)該類感知數(shù)據(jù)的異常, 因此本文對車轍兩側(cè)壓力感知數(shù)據(jù)展開研究.
傳統(tǒng)的異常數(shù)據(jù)辨識需要結(jié)合主觀判斷來完成,在篩查過程中需要耗費大量時間和精力, 同時人工篩查的結(jié)果在很大程度上受到人為因素的影響, 無法得到客觀準(zhǔn)確的分析結(jié)果, 導(dǎo)致在評價道路健康狀況時出現(xiàn)偏差[3-6]. 近年來不少學(xué)者在數(shù)據(jù)自動檢測和異常辨識方面展開了研究. Park 等人[7]提出了一種基于不同感知數(shù)據(jù)的深度學(xué)習(xí)網(wǎng)絡(luò)來辨識車輛行駛位置的方法. 在網(wǎng)絡(luò)設(shè)計中采用了長短時記憶單元和集成學(xué)習(xí),并采用了特征選擇技術(shù), 在不損失性能的前提下排除了不必要的感知數(shù)據(jù). 通過實驗對所提出的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了訓(xùn)練和驗證. 通過4 種不同的試驗驗證了該方法具有良好的分類性能. 金鵬等人[8]提出了一種利用深度信念網(wǎng)絡(luò)對傳感器異常數(shù)據(jù)進(jìn)行檢測的算法. 創(chuàng)新點在于對高維數(shù)據(jù)進(jìn)行降維, 主要處理方法是利用文章中提到的深度信念網(wǎng)絡(luò)對數(shù)據(jù)的特征進(jìn)行提取, 并利用QSSVM 結(jié)合滑動窗口模型針對降維后的數(shù)據(jù)實現(xiàn)了在線實時監(jiān)測, 新算法不僅降低了時間復(fù)雜度, 而且獲得了更好的檢測效果. 使用了抽樣的方法對數(shù)據(jù)做了相應(yīng)的預(yù)處理以統(tǒng)一尺度, 之后將處理好的數(shù)據(jù)切片作為原始輸入數(shù)據(jù), 利用包含4 層特征提取層的網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練, 相比其它傳統(tǒng)方法提高了檢測精度. 錢宇騁等人[9]針對在線監(jiān)測數(shù)據(jù)中異常值特點, 以及一般的異常狀態(tài)檢測方法是基于閾值, 噪聲數(shù)據(jù)難以及時甄別的問題, 提出了一種基于灰色關(guān)聯(lián)度和K-means 聚類的方法, 并通過某變電站的在線監(jiān)測數(shù)據(jù)對此算法進(jìn)行驗證, 結(jié)果表明此方法準(zhǔn)確率高, 具有一定的實用價值. 陸秋琴等人[10]提出了一種組合異常數(shù)據(jù)檢測算法(SWDS-LOF)以檢測異常值, 并利用多項式擬合的方法對異常數(shù)據(jù)進(jìn)行修正. 最終以某汽車公司的監(jiān)測數(shù)據(jù)為例進(jìn)行實證分析并驗證所提算法和所建模型, 檢測所得效果優(yōu)異, 證明了此方法的有效性.
以上提到的對傳感器異常數(shù)據(jù)辨識方法大多采用的是長短時記憶單元、聚類、閾值分割等, 數(shù)據(jù)的選取需要結(jié)合橋梁等各類復(fù)雜場景[11-13], 對數(shù)據(jù)的格式要求較高, 數(shù)據(jù)的預(yù)處理往往比較復(fù)雜[14], 之后還需要建立具體的模型不斷進(jìn)行調(diào)優(yōu)[15], 效率低下且檢測精度不高.
為解決足尺環(huán)道試驗場海量感知數(shù)據(jù)異常辨識問題[16], 本文將數(shù)據(jù)可視化為圖像, 在數(shù)據(jù)預(yù)處理方面不需要過于復(fù)雜的操作. 在圖像分類方面, 深度學(xué)習(xí)方法往往是一種不錯的選擇, 其不僅具有可觀的檢測速度,而且經(jīng)過結(jié)構(gòu)與參數(shù)上的調(diào)優(yōu), 最終能達(dá)到良好的效果[17]. 本文根據(jù)數(shù)據(jù)的各項特征選擇輕量級的卷積神經(jīng)網(wǎng)絡(luò)模型GhostNet[18]進(jìn)行參數(shù)與結(jié)構(gòu)上的設(shè)計, 對異常數(shù)據(jù)進(jìn)行辨識, 并選擇傳統(tǒng)的ResNet50[19]分類模型進(jìn)行對比實驗, 證明了該異常辨識方法的有效性.
本文首先提取出了原始的足尺環(huán)道傳感器加載數(shù)據(jù), 結(jié)合數(shù)據(jù)特征并通過相關(guān)的可視化方法對數(shù)據(jù)類型進(jìn)行了轉(zhuǎn)換. 將可視化后的數(shù)據(jù)作為原始數(shù)據(jù)集, 結(jié)合數(shù)據(jù)特征較簡單的特點選取了輕量級的卷積神經(jīng)網(wǎng)絡(luò)模型GhostNet, 設(shè)計了一系列輸入?yún)?shù)并對其進(jìn)行訓(xùn)練、測試, 結(jié)果良好. 同時又使用傳統(tǒng)的ResNt50 模型進(jìn)行測試并對比分析. 整體研究步驟如圖1 所示.
圖1 實驗技術(shù)路線
訓(xùn)練好的網(wǎng)絡(luò)里的特征圖往往存在很多冗余信息,大部分特征長得很相似, 對于這些長得很相似的特征,我們可以通過簡單的線性變化或者濾波得到, 就沒必要通過復(fù)雜的卷積運算了, GhostNet 就是基于這種思想所設(shè)計的. 如圖2.
Ghost 模塊如圖2 所示, 可以看到, Ghost 模塊分成3 步:
圖2 Ghost 模塊
(1)首先將輸入的特征圖進(jìn)行卷積, 但是與常規(guī)卷積中輸出的通道數(shù)為N不同, 首先通過對輸入進(jìn)行卷積得到特征圖, 其輸出的通道數(shù)為N/2;
(2)隨后將特征圖的每個通道單獨進(jìn)行某種“線性變換”;
(3)最后, 把第1 次卷積和第2 次卷積得到的特征圖拼接在一起, 得到輸出.
Ghost bottleneck (G-bneck)與residual block (殘差模塊)類似, 主要由兩個Ghost 模塊堆疊兩次, 第1 個模塊用于增加特征維度, 增大的比例稱為膨脹率, 而第2 個模塊則用于減少特征維度, 使其與輸入一致.
G-bneck 包含步長為1 和步長為2 版本, 對于步長為2, shortcut 路徑使用下采樣層, 并在Ghost 模塊中間插入步長為2 的縱深卷積. 為了加速, Ghost 模塊的原始卷積均采用點態(tài)卷積. G-bneck 結(jié)構(gòu)圖如圖3.
圖3 G-bneck 結(jié)構(gòu)
ResNet 提出了殘差學(xué)習(xí)的思想, 所謂殘差學(xué)習(xí)是指將輸入信息直接傳遞到輸出, 與逐層傳遞不同, 這樣的方式可以最大程度的保護(hù)信息的完整性, 整個網(wǎng)絡(luò)只需要學(xué)習(xí)輸入和輸出之間差異的一部分, 從而簡化了學(xué)習(xí)目標(biāo), 降低了學(xué)習(xí)難度. 該模型首先對輸入做了卷積操作,之后經(jīng)過4 個殘差塊, 最后進(jìn)行全連接操作以便進(jìn)行分類任務(wù), 網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖4 所示.
圖4 ResNet50 整體結(jié)構(gòu)圖
本文采用的實驗數(shù)據(jù)取自交通部足尺路面環(huán)道試驗場, 其中結(jié)構(gòu)響應(yīng)狀態(tài)采集系統(tǒng)由若干個相關(guān)的傳感器和數(shù)據(jù)采集單元組成, 能夠?qū)崟r、全方位的采集到各類動態(tài)響應(yīng)數(shù)據(jù). 比如溫濕度傳感器、多點位移計、基底應(yīng)變計等, 采集的數(shù)據(jù)能夠一定程度上反映路面結(jié)構(gòu)性能的變化. 本文選取型號為L140 的土壓力計來分析其采集到的異常數(shù)據(jù), 傳感器特征如圖5 所示, 其主要技術(shù)參數(shù)如表1, 其中, F.S.表示滿量程輸出.
圖5 Sisgeo L140 土壓力盒圖
表1 傳感器主要技術(shù)參數(shù)
路面埋設(shè)的傳感器在不停歇采集數(shù)據(jù), 除了車輛負(fù)載所產(chǎn)生的加載數(shù)據(jù)外包含許多無用的噪聲, 因此第一步需要先將目標(biāo)數(shù)據(jù)采用特定軟件截取出來. 此時得到的加載數(shù)據(jù)特征復(fù)雜難以直接進(jìn)行處理分析,本文選擇將數(shù)值型數(shù)據(jù)轉(zhuǎn)換成圖像進(jìn)行處理, 數(shù)據(jù)可視化工具如圖6 所示.
圖6 DynamicAnalysis 數(shù)據(jù)可視化工具
本文選取2019 年1 月到3 月足尺環(huán)道STR3路段編號為P151827 的土壓力計采集到的數(shù)據(jù)來進(jìn)行處理并作相應(yīng)的分析. 感知數(shù)據(jù)經(jīng)過可視化處理后可分為以下兩種情況: 正常數(shù)據(jù)與異常受干擾數(shù)據(jù), 如圖7 所示.
圖7 正常數(shù)據(jù)與異常數(shù)據(jù)
得到兩類共計2 211 張圖像, 其中第一類包括1 099張, 第二類包括1 112 張.
分別對GhostNet 模型和ResNet50 模型進(jìn)行訓(xùn)練,可得到在訓(xùn)練集上的模型精確率和損失變化曲線如圖8 及圖9 所示.
圖8 GhostNet 模型訓(xùn)練集acc 和loss 曲線圖
圖9 ResNet50 模型訓(xùn)練集acc 和loss 曲線圖
由圖8 分析可知, 模型收斂速度快, 精度也較高,而從圖9 可知, ResNet50 網(wǎng)絡(luò)在第8 次迭代之后, 準(zhǔn)確率與loss 值基本不再發(fā)生變化, 打印網(wǎng)絡(luò)參數(shù)可知靠后的網(wǎng)絡(luò)層各項參數(shù)也基本不再發(fā)生變化. 這表明模型已經(jīng)“過度學(xué)習(xí)”了, 我們推測由于模型的復(fù)雜度與數(shù)據(jù)特點并不匹配從而導(dǎo)致訓(xùn)練極易產(chǎn)生過擬合現(xiàn)象,同時模型參數(shù)初始化之后也需要重新設(shè)計.
在對模型參數(shù)進(jìn)行優(yōu)化并且使學(xué)習(xí)率和優(yōu)化器都與GhostNet 相統(tǒng)一后, 繼續(xù)訓(xùn)練模型, 分別選擇正常數(shù)據(jù)99 張, 異常數(shù)據(jù)112 張圖像作為驗證集并對其進(jìn)行測試. 兩個網(wǎng)絡(luò)的測試結(jié)果用混淆矩陣表示, 分別如圖10, 圖11 所示.
圖10 GhostNet 模型驗證集結(jié)果混淆矩陣
圖11 ResNet50 模型驗證集結(jié)果混淆矩陣
結(jié)合驗證集混淆矩陣的結(jié)果, 計算模型評價量化指標(biāo), 如表2 所示.
我們選擇的輕量級的網(wǎng)絡(luò)模型GhostNet 的訓(xùn)練及測試結(jié)果如圖11 及表2 所示, 異常數(shù)據(jù)的辨識準(zhǔn)確率約為99%, 精度相比最開始選用的ResNet50 模型改善較明顯, 速度相比ResNet50 模型也有較大提升.
表2 異常數(shù)據(jù)辨識精度評價指標(biāo)
通過上述方法我們能夠快速準(zhǔn)確的在海量加載數(shù)據(jù)中完成對異常數(shù)據(jù)的辨識, 后續(xù)我們可以根據(jù)異常數(shù)據(jù)對應(yīng)的時空信息我們可以對異常數(shù)據(jù)的來源進(jìn)行具體的分析并定位, 對未來的傳感器故障檢測、路面破損研究也具備重大的現(xiàn)實意義. 部分異常數(shù)據(jù)對應(yīng)的時空信息如表3 所示, 從表中可以知道異常數(shù)據(jù)發(fā)生的時空信息, 例如由表3 可知位于瀝青層下12 cm處的土壓力計在6 點25 分29 秒左右采集到的數(shù)據(jù)為異常數(shù)據(jù).
表3 異常數(shù)據(jù)對應(yīng)時空信息
本文結(jié)合數(shù)據(jù)可視化算法并利用GhostNet 網(wǎng)絡(luò)完成了對道路動態(tài)高頻感知數(shù)據(jù)的異常辨識問題, 主要結(jié)論如下:
1) 本文選取足尺環(huán)道STR3 路段傳感器編號為P151827 的土壓力計所采集的數(shù)據(jù)進(jìn)行分析, 將加載過的動態(tài)高頻數(shù)據(jù)通過可視化的方式進(jìn)行提取, 構(gòu)建數(shù)據(jù)集.
2)采用ResNet50 網(wǎng)絡(luò)模型對可視化數(shù)據(jù)進(jìn)行訓(xùn)練和測試, 分析發(fā)現(xiàn)可能是由于網(wǎng)絡(luò)參數(shù)量過多和結(jié)構(gòu)復(fù)雜等原因使檢測結(jié)果易發(fā)生過擬合現(xiàn)象, 經(jīng)過調(diào)整學(xué)習(xí)率和優(yōu)化器, 使之與GhostNet 模型參數(shù)基本保持一致之后, 檢測精度明顯提升, 但速度上仍然存在不足.
3)選取一個更輕量級的神經(jīng)網(wǎng)絡(luò)模型GhostNet,對該網(wǎng)絡(luò)進(jìn)行訓(xùn)練并在驗證集上進(jìn)行測試, 實現(xiàn)了對異常數(shù)據(jù)的辨識, 且檢測速度和檢測精度均有較大提升, 最終檢測精度能夠達(dá)到99%左右, 檢測速度也由原來的分鐘級提高為秒級.
本文提出的基于輕量級網(wǎng)絡(luò)GhostNet 的異常數(shù)據(jù)辨識模型, 能夠有效快速地監(jiān)測道路海量動態(tài)高頻感知數(shù)據(jù)中的異常, 為道路傳感器故障監(jiān)測、路面健康狀況研究提供有力的數(shù)據(jù)支持.