梁 宇
(廣西壯族自治區(qū)收費公路聯(lián)網(wǎng)收費清分結(jié)算中心,廣西 南寧 530022)
隨著全球城市化進程的加速,交通擁堵和交通事故問題日益嚴(yán)重。為確保道路交通安全和暢通,對交通事件進行有效的實時檢測成為當(dāng)務(wù)之急[1]。目前,交通事件檢測主要采用傳統(tǒng)圖像處理方法[2]、基于二維卷積神經(jīng)網(wǎng)絡(luò)方法[3]和其他機器學(xué)習(xí)方法[4]。
傳統(tǒng)圖像處理方法,如光流法、背景減除法等,雖在一定程度上能夠?qū)崿F(xiàn)交通事件檢測,但其對于復(fù)雜場景的適應(yīng)性較差,且易受光照、遮擋等因素影響?;诙S卷積神經(jīng)網(wǎng)絡(luò)[5]的方法在檢測準(zhǔn)確性上有顯著提升,然而其在處理時序信息方面的能力有限,難以捕捉事件的動態(tài)變化。其他機器學(xué)習(xí)方法,如支持向量機等,雖然可以實現(xiàn)一定程度的事件檢測,但在處理大規(guī)模高維數(shù)據(jù)時,計算復(fù)雜度較高,實時性受到限制。
針對現(xiàn)有方法的不足,本文提出了一種基于三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)的交通事件檢測系統(tǒng)[6]。3D CNN在空間和時間維度上進行卷積操作,能夠有效地捕捉交通事件的時空信息。相較于傳統(tǒng)方法和二維卷積神經(jīng)網(wǎng)絡(luò),基于3D CNN的方法具有以下優(yōu)點:(1)整合時間信息,能夠捕捉交通事件的動態(tài)變化,提高檢測準(zhǔn)確性;(2)在處理大規(guī)模高維數(shù)據(jù)時,計算復(fù)雜度較低,有利于實現(xiàn)實時性能。
三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)是一種在空間和時間維度上進行卷積操作的深度學(xué)習(xí)模型,能夠有效地提取交通事件視頻數(shù)據(jù)中的時空特征(見圖1)。3D CNN包括卷積層、池化層和全連接層。卷積層負責(zé)提取交通事件視頻的局部時空特征,通過在輸入數(shù)據(jù)的寬、高和時序三個維度上執(zhí)行卷積操作。可以將第i個三維卷積層中第j個特征圖上位置(x,y,z)處的值γ的數(shù)學(xué)表達式寫為:
圖1 二維卷積與三維卷積示意圖
(1)
式中:f——激活函數(shù);
M(i-1)——第(i-1)層的特征圖數(shù)量;
Pi和Qi——三維卷積核的高和寬;
Ri——其在時間維度的長度;
ω和b——通過訓(xùn)練在數(shù)據(jù)集中學(xué)習(xí)得到。
池化層的作用是減小特征映射的空間大小,減小計算復(fù)雜度,同時保留關(guān)鍵信息。全連接層負責(zé)將前層的輸出與輸出層相連,實現(xiàn)特征整合以及對交通事件的最后分類。
為了提高模型在交通事件視頻數(shù)據(jù)上的泛化能力,數(shù)據(jù)預(yù)處理是必不可少的環(huán)節(jié)。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)擴充和規(guī)范化處理。數(shù)據(jù)擴充可以通過對原始交通事件視頻進行隨機旋轉(zhuǎn)、翻轉(zhuǎn)、裁剪等操作,增加模型訓(xùn)練時的樣本多樣性,降低過擬合風(fēng)險。標(biāo)準(zhǔn)化處理即歸一化,可將輸入交通事件視頻數(shù)據(jù)縮放到相同的范圍內(nèi),有助于提高模型收斂速度和穩(wěn)定性。
在模型訓(xùn)練階段,需確定損失函數(shù)、優(yōu)化策略以及評價指標(biāo)。損失函數(shù)衡量模型在交通事件視頻數(shù)據(jù)預(yù)測結(jié)果與實際標(biāo)簽間的差異,主要的損失函數(shù)有交叉熵損失、平均平方誤差損失等。本系統(tǒng)使用前者作為損失函數(shù),其表達式如下:
(2)
式中:N——樣本數(shù)量;
y——網(wǎng)絡(luò)的預(yù)測值;
優(yōu)化方法負責(zé)調(diào)節(jié)模型參數(shù)以降低損失函數(shù)的值,如隨機梯度下降(SGD)、Adam等。梯度下降法的表達式如下:
θ=θ-α*?L(θ)
(3)
式中:θ——模型參數(shù);
α——學(xué)習(xí)速率;
?L(θ) ——損失函數(shù)L關(guān)于模型參數(shù)θ的梯度。
評價指標(biāo)用于量化模型在交通事件視頻測試集上的表現(xiàn),典型指標(biāo)包括準(zhǔn)確率、召回率和F1分?jǐn)?shù)等。
2.1.1 實時交通事件監(jiān)測
實時交通事件監(jiān)測作為系統(tǒng)的關(guān)鍵功能之一,其目的是實時分析道路圖像數(shù)據(jù),自動識別交通事件并即時報告。系統(tǒng)采用基于3D CNN的策略,高效地提取視頻序列中的時空特征。通過高效的計算和優(yōu)化技術(shù),系統(tǒng)可以在短時間內(nèi)處理大規(guī)模高維數(shù)據(jù),確保監(jiān)測結(jié)果的實時性。
2.1.2 交通事件分類與識別
除了實時監(jiān)測交通事件外,本系統(tǒng)還具有對交通事件進行分類與識別的能力。通過對各類交通事件進行標(biāo)注和學(xué)習(xí),系統(tǒng)能夠自動識別多種交通事件,如車輛逆向行駛、停車異常、行人闖入等。這些分類數(shù)據(jù)能夠助力交通管理機構(gòu)制定有針對性的應(yīng)對措施,從而提升道路交通效率與安全性。
2.1.3 數(shù)據(jù)可視化與報警
為方便用戶和交通管理部門了解實時交通情況,本系統(tǒng)還提供數(shù)據(jù)可視化與報警功能。系統(tǒng)將檢測到的交通事件以直觀的方式展示在用戶界面上,并在發(fā)現(xiàn)緊急事件時發(fā)出警報。另外,系統(tǒng)還能產(chǎn)生歷史數(shù)據(jù)報告,有助于用戶分析交通情況的變遷趨勢,并為交通策劃與管理提供有力的決策依據(jù)。
圖2 基于三維卷積神經(jīng)網(wǎng)絡(luò)的交通事件檢測系統(tǒng)架構(gòu)圖
2.2.1 數(shù)據(jù)采集層
數(shù)據(jù)采集層負責(zé)實時獲取來自攝像頭或其他視頻數(shù)據(jù)源的視頻流。該層需要確保數(shù)據(jù)的高質(zhì)量和實時性,以便于后續(xù)處理。為了提高系統(tǒng)的可擴展性,數(shù)據(jù)采集層支持多種數(shù)據(jù)格式和輸入源,包括IP攝像頭、文件存儲的視頻數(shù)據(jù)等。
2.2.2 數(shù)據(jù)預(yù)處理層
數(shù)據(jù)預(yù)處理層對收集到的初始視頻數(shù)據(jù)加以處理,以滿足后續(xù)三維卷積神經(jīng)網(wǎng)絡(luò)層輸入要求。主要處理過程包括視頻幀的抽取、縮放、歸一化和數(shù)據(jù)增強。通過這些處理階段,有助于降低數(shù)據(jù)噪聲、增強模型泛化性能,進而提升交通事件識別的準(zhǔn)確度。
2.2.3 三維卷積神經(jīng)網(wǎng)絡(luò)層
三維卷積神經(jīng)網(wǎng)絡(luò)層作為本系統(tǒng)的關(guān)鍵部分,負責(zé)對經(jīng)過預(yù)處理的視頻數(shù)據(jù)進行深度學(xué)習(xí)。通過卷積層、池化層和全連接層,該層自動提取交通事件的時空特征,對不同類型的交通事件進行識別和分類。模型訓(xùn)練和優(yōu)化在此層進行,以保證系統(tǒng)在實際應(yīng)用中的高準(zhǔn)確性和實時性。
2.2.4 結(jié)果分析與展示層
結(jié)果分析與展示層將三維卷積神經(jīng)網(wǎng)絡(luò)層的輸出結(jié)果進行解析和可視化。該層提供實時監(jiān)控畫面,將交通事件的識別信息疊加在原始視頻畫面上,使用戶能夠直觀地了解當(dāng)前交通狀況。此外,該層還支持自動報警功能,當(dāng)檢測到重大交通事件時,會向相關(guān)人員發(fā)送報警通知。
3.1.1 數(shù)據(jù)集描述
本試驗采用了一個包含多種交通事件的視頻數(shù)據(jù)集進行訓(xùn)練和測試。數(shù)據(jù)集涵蓋眾多城市道路及高速公路的交通監(jiān)控視頻片段,包含了如逆行行駛、非正常??俊⑿腥饲秩?、火警、異常拋撒物等典型交通事件。為了評估模型在不同場景下的泛化能力,數(shù)據(jù)集還包含了不同天氣、光照和拍攝角度下的視頻。數(shù)據(jù)集中的視頻已進行標(biāo)注,包括事件類型、發(fā)生時間和位置信息,以便于模型訓(xùn)練和評估。
3.1.2 網(wǎng)絡(luò)參數(shù)與試驗環(huán)境
采用一個經(jīng)過預(yù)訓(xùn)練的三維卷積神經(jīng)網(wǎng)絡(luò)模型作為基礎(chǔ)結(jié)構(gòu),并對其進行適當(dāng)調(diào)整以適應(yīng)交通事件檢測任務(wù)。關(guān)鍵網(wǎng)絡(luò)參數(shù)涉及卷積層個數(shù)、卷積核尺寸、池化層配置等。在試驗過程中,采用交叉驗證技術(shù)對模型進行了訓(xùn)練與驗證,以確定最優(yōu)網(wǎng)絡(luò)參數(shù)。表1為試驗使用的網(wǎng)絡(luò)參數(shù)。
表1 試驗參數(shù)設(shè)置表
表2 各類交通事件檢測結(jié)果表
試驗環(huán)境方面,本研究使用了具有i7-8700處理器、32G內(nèi)存以及RTX 2070顯卡的計算機進行模型訓(xùn)練和測試。為了確保試驗結(jié)果的可重復(fù)性,本文采用了TensorFlow深度學(xué)習(xí)框架,并統(tǒng)一了隨機數(shù)種子、初始權(quán)重等相關(guān)設(shè)置。
3.2.1 交通事件檢測準(zhǔn)確率
通過對測試集數(shù)據(jù)進行評估,基于三維卷積神經(jīng)網(wǎng)絡(luò)的交通事件檢測系統(tǒng)表現(xiàn)出了較高的準(zhǔn)確率。試驗顯示,該模型在處理車輛逆行、異常停車、行人闖入、火災(zāi)、異常拋撒物等交通事故檢測任務(wù)時,整體識別準(zhǔn)確率高達92%,相較于傳統(tǒng)視頻分析方法有顯著提升。這說明所提出的基于三維卷積神經(jīng)網(wǎng)絡(luò)的方法具有較強的泛化能力,能夠在多種復(fù)雜場景下有效地識別交通事件。
3.2.2 交通事件分類與識別效果
試驗結(jié)果還顯示,所提出的方法在各類交通事件的分類與識別上也具有優(yōu)良表現(xiàn)。具體來說,該方法在車輛逆行、異常停車、行人入侵、火災(zāi)、異常拋撒物等事件的識別準(zhǔn)確率分別為89.2%、93.3%、91.7%、95.3%、90.4%,這些結(jié)果均超過了傳統(tǒng)方法在相應(yīng)任務(wù)上的表現(xiàn)。表明該方法在處理不同類型交通事件時,都能取得較好的分類與識別效果。
本文主要研究了基于三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)的交通事件檢測系統(tǒng)。該系統(tǒng)采用了數(shù)據(jù)采集層、數(shù)據(jù)預(yù)處理層、三維卷積神經(jīng)網(wǎng)絡(luò)層和結(jié)果分析與展示層四層架構(gòu)設(shè)計,實現(xiàn)了實時交通事件檢測、交通事件分類與識別以及數(shù)據(jù)可視化與報警等功能。試驗結(jié)果表明,該系統(tǒng)在多種交通事件類型上的識別準(zhǔn)確率均較高,具有較強的泛化能力和實用性。
未來工作還需關(guān)注以下方向:(1)持續(xù)對模型結(jié)構(gòu)和參數(shù)進行優(yōu)化,旨在進一步增強交通事故檢測的準(zhǔn)確性和實時響應(yīng)能力;(2)將嘗試引入多模態(tài)數(shù)據(jù),如融合車載傳感器數(shù)據(jù),以提高系統(tǒng)的魯棒性;(3)考慮將系統(tǒng)應(yīng)用于更廣泛的場景,如智能交通管理、無人駕駛等領(lǐng)域,為現(xiàn)代交通管理提供更多的技術(shù)支持。