呂東芳,宋雷震
(淮南聯(lián)合大學(xué) a.信息工程學(xué)院;b.智能制造學(xué)院,淮南 232038)
工業(yè)革命的發(fā)展使得社會生產(chǎn)力得到了顯著的提升,社會經(jīng)濟(jì)也隨之而持續(xù)發(fā)展,人們的出行方式也產(chǎn)生了顯著的改變。汽車已經(jīng)成為21世紀(jì)使用最為廣泛的交通工具,然而與此同時也出現(xiàn)了大量的交通事故,因此對車輛行駛的識別預(yù)警系統(tǒng)進(jìn)行優(yōu)化迫在眉睫。車輛預(yù)警系統(tǒng)可以協(xié)助車主避免高速、低速追尾等事故的發(fā)生,有效地避免車輛偏離車道、與人碰撞等事故,還可以幫助觀察道路險情,不斷檢測分析前方道路的情況,識別和判斷各種潛在危險狀態(tài)。并且最重要的一點(diǎn)就是可以通過不同的聲音和視覺來提醒駕駛員有效避免事故的發(fā)生。
卷積神經(jīng)網(wǎng)絡(luò)作為一種深度學(xué)習(xí)的模型,能夠?qū)颖镜纳顚犹卣鬟M(jìn)行有效提取,在處理類似網(wǎng)絡(luò)結(jié)構(gòu)的數(shù)據(jù)時,具有極強(qiáng)的準(zhǔn)確性與可行性,因此卷積神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于多項領(lǐng)域之中。本文將針對卷積神經(jīng)網(wǎng)絡(luò)的模型架構(gòu),以及其在車輛行駛識別預(yù)警中的應(yīng)用進(jìn)行深入的探析,旨在為車輛行駛的識別預(yù)警系統(tǒng)的優(yōu)化提供一定的參考價值。
卷積神經(jīng)網(wǎng)絡(luò)是應(yīng)用最為廣泛的一種人工神經(jīng)網(wǎng)絡(luò),具有深度前向反饋機(jī)制,能夠?qū)λ写龣z圖像的像素進(jìn)行準(zhǔn)確高效的響應(yīng)[1]。卷積神經(jīng)網(wǎng)絡(luò)還具有多層次的相關(guān)特點(diǎn),其中每一層的元素均由若干個二維平面所構(gòu)成,該種二維平面可被定義為相應(yīng)的二維特征圖。卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)模型結(jié)構(gòu)如圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
通過圖1可知,在卷積神經(jīng)網(wǎng)絡(luò)中,每一個單獨(dú)的二維平面上均存在著若干個不同的神經(jīng)元,各個神經(jīng)元節(jié)點(diǎn)均對應(yīng)著二維特征圖中的所有特征點(diǎn)。卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)中包含了輸入層、卷積層、降采樣層、分類器輸入層、隱層以及輸出層[2]。在上述模型的基本結(jié)構(gòu)中,重點(diǎn)是特征提取器與分類器,其中特征提取器指的是由多個卷積層與降采樣層組成的結(jié)構(gòu)。圖1中第1層為輸入層,是一個二維圖像,通過多個卷積核與輸入層進(jìn)行卷積運(yùn)算,以獲取到若干特征圖,由獲取到的特征圖進(jìn)一步構(gòu)成卷積層。卷積運(yùn)算是指卷積核持續(xù)不斷地在目標(biāo)圖像之上進(jìn)行上下左右多方位的移動。由于圖像特征具有一定的豐富性與多樣性,且每個卷積核僅僅可以提取到圖像中的單一特征,因此需要大量的卷積核參與到卷積運(yùn)算的過程中,才能夠全面完整地提取到目標(biāo)圖像的各種特征。在此之后,該模型會對特征圖進(jìn)行降采樣的操作,達(dá)到使特征圖尺寸縮小至適宜范圍的目標(biāo),以優(yōu)化計算過程,降低計算的難度,該步驟完成之后即可成功構(gòu)成降采樣層。通過數(shù)次卷積與降采樣處理后,特征圖的尺寸達(dá)到適宜狀態(tài),且數(shù)量有所增加,對圖像特征的識別能力得到進(jìn)一步提升。最后分類器將會對所得特征圖進(jìn)行鋪展處理,進(jìn)而形成一個目標(biāo)特征向量,為分類識別做準(zhǔn)備,最終輸出檢測識別的相關(guān)結(jié)果[3]。在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)中,所有網(wǎng)絡(luò)都包含了數(shù)量巨大的節(jié)點(diǎn),而相鄰的網(wǎng)絡(luò)層之間的所有節(jié)點(diǎn),必須滿足全部相連的狀態(tài),全連接示意如圖2所示。
由圖2可知,所有的網(wǎng)絡(luò)層在運(yùn)行過程中,均會通過節(jié)點(diǎn)運(yùn)算而產(chǎn)生大量的參數(shù),使得網(wǎng)絡(luò)訓(xùn)練的難度有所提升。為了減小整個網(wǎng)絡(luò)層的計算量,完成網(wǎng)絡(luò)訓(xùn)練,需要采取一定的措施來減少參數(shù)的數(shù)量,以期提高運(yùn)算的速度與精度,通??墒褂镁植扛兄c權(quán)值共享2種方法。在將圖像像素的連接方式轉(zhuǎn)換為局部連接后,像素之間的連接有所減弱,需要在圖像的局部感知區(qū)域進(jìn)行多次重疊采樣處理,以加強(qiáng)像素之間的聯(lián)系[4]。重疊采樣中移動的像素個數(shù)小于卷積核的邊長個數(shù),運(yùn)算示意及輸出結(jié)果如圖3所示。
圖2 卷積神經(jīng)網(wǎng)絡(luò)全連接示意
圖3中展現(xiàn)了卷積運(yùn)算的具體形式,其中移動的像素個數(shù)被稱之為步長。從圖3(a)中可看到特征圖像的尺寸為5×5像素;黃色部分為卷積核,尺寸為3×3像素。以卷積核部分的數(shù)值與紅色數(shù)值做點(diǎn)積運(yùn)算,且根據(jù)由左至右、由上至下的方向進(jìn)行移動,即可得到卷積輸出結(jié)果(圖3(b)),即一個大小為3×3的矩陣特征圖。在實(shí)際的卷積運(yùn)算中,還需要對獲取到的卷積結(jié)果設(shè)置一個偏置系數(shù),使得最終輸出層的尺寸為[(r-a)/k+1]×[(r-a)/k+1],其中r為輸入層的尺寸邊長,a為卷積核的邊長,k為步長。
圖3 卷積運(yùn)算操作示意
車輛的識別預(yù)警系統(tǒng)既需要考慮兩車間的安全距離,又需考慮碰撞時間,二者兼顧才可制定出合理的防撞預(yù)警策略,進(jìn)而保障人們的行車安全。結(jié)合1.1卷積神經(jīng)網(wǎng)絡(luò)的相關(guān)內(nèi)容與特性,構(gòu)建出車輛識別預(yù)警系統(tǒng),如圖4所示。
圖4 基于卷積神經(jīng)網(wǎng)絡(luò)的車輛識別預(yù)警系統(tǒng)
基于卷積神經(jīng)網(wǎng)絡(luò)車輛行駛的識別預(yù)警系統(tǒng)主要分為2個部分:①視頻處理,獲取車輛圖像;②車輛識別,獲取到相關(guān)的車輛識別結(jié)果。視頻處理通過相關(guān)的運(yùn)動目標(biāo)檢測算法,在圖像形態(tài)學(xué)的基礎(chǔ)上獲取到車輛圖像[5]。車輛識別包含4個主要部分,分別為車輛圖片歸一化、卷積神經(jīng)網(wǎng)絡(luò)模型、車輛特征提取以及車輛圖片分類。在具體的識別過程中,將卷積神經(jīng)網(wǎng)絡(luò)算法應(yīng)用至視頻處理的輸出中,對車輛圖像進(jìn)行歸一化處理,以滿足卷積神經(jīng)網(wǎng)絡(luò)的輸入條件。在識別到基礎(chǔ)的車輛圖像特征信息之后,依據(jù)該目標(biāo)在圖像中的位置,綜合利用攝像機(jī)參數(shù)與幾何關(guān)系,獲取兩車之間的實(shí)際距離;根據(jù)車輛行進(jìn)信息,包括行駛速度與加速度,來計算兩車的碰撞時間;其投影模型是一種理想狀態(tài)的幾何模型,車距估算示意見圖5[6]。
圖5中的斜線區(qū)域為水平地面車輛行駛區(qū)域,A與B分別表示自車與前車,攝像頭P安裝于A車前輪后側(cè)上方后視鏡位置,B車采集點(diǎn)在后車輪與地面切點(diǎn),近似于B車后輪中心,方便通過幾何投影計算兩車距離。兩車之間的實(shí)際距離以Z來表示;P點(diǎn)為A車攝像頭的位置所在,由于其相對體積較小,因此可視作一個質(zhì)點(diǎn);f為焦距;H為質(zhì)點(diǎn)P與水平地面間的距離;y表示A車和水平線的接觸點(diǎn)與垂線上端交點(diǎn)的距離。由此可得y/f=H/Z,則兩車之間實(shí)際距離Z的計算公式如下:
圖5 基于圖像幾何原理的車距估算
Z=f×H/y
(1)
在A車攝像頭參數(shù)的設(shè)定完成后,式(1)可改寫為式(2):
Z=f×H/y=F×H/Y
(2)
式中:F為A車攝像頭的等效垂直焦距;Y為B車底部到圖像中線位置的像素數(shù)。
隨后需要對碰撞時間進(jìn)行計算,令不同時刻中車輛在圖像中大小的變換關(guān)系為h,則
h=Z0/Zt
(3)
式中:Z0,Zt分別為初始時刻和t時刻由圖像中檢測到的車寬。
在Δt時間內(nèi),兩車均做勻速運(yùn)動,且保持著一定的相對速度,則
(4)
式中:v為速度差。
將A車在制動時產(chǎn)生加速度的情況納入考慮,則在Δt時間內(nèi)車距為
Z(Δt)=0.5×a×Δt2+v×Δt+Z0
(5)
式中:a為制動參數(shù)。
令碰撞時間為G,由式(1)—(5),以及幾何關(guān)系,可得碰撞時間:
(6)
完成兩車距離與碰撞時間的估算后,可正式制定避撞預(yù)警策略。由于在車輛行駛過程中,路況形式具有多樣性,車輛數(shù)量也處于不可控的狀態(tài),因此視頻錄像中會出現(xiàn)多輛車,實(shí)際進(jìn)行兩車距離與碰撞時間的計算時會出現(xiàn)多個車輛及相關(guān)參數(shù),增加計算量[7]。在一定程度上對預(yù)警的準(zhǔn)確性造成消極影響,因此需要對前向碰撞的可能性進(jìn)行分析,如圖6所示。
圖6 前向碰撞可能性分析
從圖6中可以看到,視頻錄像中可能出現(xiàn)A1至A5多輛車,應(yīng)該具有針對性地選取最易產(chǎn)生碰撞的車輛進(jìn)行分析。由于A3與A4位于同一行車道,僅需要分析A4與A3之間的距離和碰撞時間,就可以確保行車安全。設(shè)兩車之間的安全車距為D,當(dāng)Z>D時,車輛行駛處于安全狀態(tài);當(dāng)Z 通過對卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行深入分析,構(gòu)建出基于卷積神經(jīng)網(wǎng)絡(luò)的車輛識別預(yù)警系統(tǒng),進(jìn)行多次實(shí)驗分析。在實(shí)際的分析過程中,實(shí)驗車輛囊括了多種顏色、尺寸、品牌的車型,綜合考慮了諸多外界條件因素,如光照強(qiáng)度與天氣環(huán)境等,以此來確保實(shí)驗的可信度與準(zhǔn)確性[9]。除圖3中的運(yùn)算形式結(jié)構(gòu)外,此次研究中還設(shè)置了兩組不同配置的網(wǎng)絡(luò),作為對照組,其參數(shù)設(shè)置如表1所示。 表1 對照組參數(shù)設(shè)置 根據(jù)表1可知,α組的結(jié)構(gòu)是在圖3中結(jié)構(gòu)上進(jìn)行增添,使每層的特征圖數(shù)有所增加;β組的結(jié)構(gòu)相對于圖3結(jié)構(gòu)而言,改動較少,僅減少最后一層。最終α、β和圖3對單樣本車輛進(jìn)行計算的平均時間分別為0.0167,0.0323以及0.0135 s;準(zhǔn)確率分別為97.89%,94.06%以及98.64%。通過對比可知,本次研究中圖3結(jié)構(gòu)趨于完美,其對樣本車輛進(jìn)行識別的正確率最高,且耗時較短。而α組與β組只能在正確率與耗時上占據(jù)1項優(yōu)勢,無法做到兼并。3種結(jié)構(gòu)網(wǎng)絡(luò)的測試ROC曲線如圖7所示。 圖7直觀地展示了3種不同結(jié)構(gòu)網(wǎng)絡(luò)的識別率,圖3結(jié)構(gòu)為最優(yōu)結(jié)構(gòu),其正確率高且耗費(fèi)時間短。檢測錯誤的樣本車輛大都屬于壞樣本,壞樣本覆蓋的類型主要為三種,分別為含有過多背景的車輛樣本、僅含有局部信息的車輛樣本,以及遠(yuǎn)距離時的模糊車輛樣本。另一方面,此次研究還針對不同路況條件進(jìn)行了大量實(shí)驗,識別檢測結(jié)果見圖8。 如圖8所示,在圖8(a)—圖8(j)10種不同的路況條件下,基于卷積神經(jīng)網(wǎng)絡(luò)的車輛行駛識別算法均可以對前方車輛進(jìn)行有效地檢測識別,進(jìn)而計算自車與前車之間的實(shí)時車距與碰撞時間,準(zhǔn)確地實(shí)現(xiàn)相關(guān)的預(yù)警操作。然而在圖8(k)和圖8(l)中,由于雨天與夜晚的自然條件相對惡劣,導(dǎo)致自車前擋風(fēng)玻璃變得模糊,前車底部到圖像中線位置的像素數(shù)無法進(jìn)行測量,進(jìn)而導(dǎo)致該算法出現(xiàn)失敗。大部分情況下,基于卷積神經(jīng)網(wǎng)絡(luò)的車輛行駛識別算法仍然可以滿足基本的識別預(yù)警需求。為進(jìn)一步檢測此次研究中識別預(yù)警技術(shù)的性能,將傳統(tǒng)的遺傳算法與基于卷積神經(jīng)網(wǎng)絡(luò)的算法進(jìn)行對比,分析在實(shí)際識別預(yù)警過程中所耗費(fèi)的時間,結(jié)果如圖9所示。 圖8 不同場景與路況下的車輛檢測結(jié)果 圖9中顯示了2種算法的識別耗時對比,橫軸表示車輛圖像序列,為了確保識別的精度,每10幀為1個單位;縱軸表示該算法處理10幀的車輛圖像所耗費(fèi)的時間。由圖9可知,2種識別預(yù)警方法在耗時上具有顯著的差別,傳統(tǒng)的識別預(yù)警方法耗時較長,而基于卷積神經(jīng)網(wǎng)絡(luò)車輛行駛的識別預(yù)警方法更為快捷高效,其耗時遠(yuǎn)遠(yuǎn)低于前者,且浮動較小,更加趨于穩(wěn)定,能夠滿足車輛圖像信息處理的要求。 將卷積神經(jīng)網(wǎng)絡(luò)作為研究的重點(diǎn)對象,深入分析了卷積神經(jīng)網(wǎng)絡(luò)的原理,并將其靈活地運(yùn)用到車輛行駛的識別預(yù)警系統(tǒng)中,并進(jìn)行多次對照實(shí)驗。研究結(jié)果顯示,基于卷積神經(jīng)網(wǎng)絡(luò)的車輛行駛識別預(yù)警系統(tǒng)具有較強(qiáng)的準(zhǔn)確性,且進(jìn)行識別與預(yù)警等操作的耗時較短,可以大量地投入到實(shí)際交通系統(tǒng)中,實(shí)現(xiàn)對駕駛員和車輛的實(shí)時安全預(yù)警,并實(shí)時將行車過程中采集的各類報警信息,如:前碰撞報警、車道偏離報警、行人碰撞報警、安全車距預(yù)警、急加速/減速報警、急轉(zhuǎn)彎報警、疲勞駕駛報警等信息和視頻圖像上傳至云端,達(dá)到遠(yuǎn)程監(jiān)管和統(tǒng)計分析駕駛行為的目的,有效改善駕駛員不規(guī)范駕駛行為,提升管理水平,防范事故于未然。2 實(shí)驗與分析
3 結(jié)束語