魏婷婷,林 楠,曹仰杰,魏君飛,楊 聰
1(鄭州大學(xué) 軟件學(xué)院,鄭州 450002) 2(鄭州大學(xué) 漢威物聯(lián)網(wǎng)研究院,鄭州 450002)
近年來(lái),隨著一些惡性交通事故的發(fā)生,使“毒駕”這一民眾所不了解的高危駕駛行為逐漸進(jìn)入到公眾的視野當(dāng)中.“毒駕”(Drug-driving)是指交通行為參與人在未完全戒斷毒癮、正在使用毒品或使用毒品后進(jìn)行機(jī)動(dòng)車駕駛的行[1].“毒駕”行為隱蔽性高且社會(huì)危害性極大,目前,我國(guó)對(duì)由“毒駕”引發(fā)的道路交通事故尚無(wú)權(quán)威的統(tǒng)計(jì)數(shù)字,在國(guó)內(nèi)的相關(guān)報(bào)道中,2003-2005年,由“毒駕”引發(fā)的交通道路事故平均每年不足10起;2006-2008年,達(dá)到每年10~20起;2009年則上升至40起以上[2].2013-2016年,國(guó)內(nèi)媒體有關(guān)“毒駕”的報(bào)道分別為1940篇、4120篇、10400篇和13500篇,從近年相關(guān)報(bào)道反應(yīng)出,其造成的交通道路事故呈上升態(tài)勢(shì)[3].因此,對(duì)于“毒駕”行為的檢測(cè),是避免其造成公民的人身和財(cái)產(chǎn)安全的重要措施.
毒品檢測(cè)標(biāo)準(zhǔn)方法包括氣相-質(zhì)譜聯(lián)用(GC-MS)[4]與液相-質(zhì)譜聯(lián)用技術(shù)(LC-MS)[5,6],這兩種技術(shù)相對(duì)比較成熟.此外,常見(jiàn)的毒品檢測(cè)方法還有色譜法[7]、光譜法[8]、免疫分析法[9,10]等方法,此類檢測(cè)方式需要使用大型專業(yè)儀器設(shè)備.對(duì)于實(shí)驗(yàn)環(huán)境具有一定要求,因此面對(duì)復(fù)雜道路環(huán)境,這些方法雖然檢測(cè)準(zhǔn)確但無(wú)法適用于常規(guī)道路稽查.國(guó)內(nèi)對(duì)于機(jī)動(dòng)車駕駛者的毒駕檢測(cè)主要采用血液檢測(cè)、尿液檢測(cè)和唾液檢測(cè)3種方式,如表1所示.相較于另外兩種方式,唾液檢測(cè)在毒檢道路現(xiàn)場(chǎng)更為普遍.唾液檢測(cè)采用的試紙檢測(cè)方式,只需將待檢測(cè)物質(zhì)與試紙反應(yīng)區(qū)接觸即可完成檢測(cè),具有成本低、靈敏度高、方便快捷等特點(diǎn).但在實(shí)際研究和應(yīng)用中其試紙判斷方式存在不足.目前毒駕道路檢測(cè)中對(duì)唾檢試紙的常用判斷方式為目測(cè)法,目測(cè)法進(jìn)行試紙反應(yīng)色域的識(shí)別,會(huì)受到環(huán)境影響及人眼顏色識(shí)別的差異,且唾液檢紙?bào)w積較小,其有效試紙前景區(qū)域面積為15mm×15mm,僅僅依靠目測(cè),檢測(cè)結(jié)果缺乏準(zhǔn)確性.
表1 國(guó)內(nèi)常見(jiàn)機(jī)動(dòng)車駕駛員毒駕檢測(cè)方式對(duì)比Table 1 Comparison of common driving test methods for motor vehicle drivers in China
隨著移動(dòng)設(shè)備的普及以及圖像識(shí)別技術(shù)的發(fā)展,使得利用手機(jī)、相機(jī)等攝像設(shè)備結(jié)合機(jī)器學(xué)習(xí)等方法,形成一種更加高效便捷的毒駕識(shí)別方式成為了可能.首先,利用攝像頭采集毒檢試紙,經(jīng)轉(zhuǎn)換后存儲(chǔ)為圖片格式,之后從試紙圖像上提取色塊信息經(jīng)過(guò)數(shù)字信號(hào)處理后,對(duì)數(shù)據(jù)進(jìn)行分類,最終得出檢測(cè)結(jié)果.但在實(shí)際毒駕檢測(cè)試紙圖像成像過(guò)程中,存在以下問(wèn)題:
1)由于攝影設(shè)備、環(huán)境光照、色溫等影響,造成圖像目標(biāo)與背景對(duì)比度較低、噪聲較高、陰影干擾以及邊緣模糊的問(wèn)題,對(duì)于毒駕試紙圖像的識(shí)別檢測(cè)造成影響.
2)試紙圖像弱邊緣化.當(dāng)待檢測(cè)物質(zhì)濃度處于臨界范圍內(nèi),試紙條顯色區(qū)域呈現(xiàn)的色塊顏色較淺,且形狀不規(guī)則,呈現(xiàn)試紙色域邊界弱邊緣化,對(duì)判斷色域是否存在產(chǎn)生影響.
針對(duì)上述問(wèn)題,本文提出一種面向弱邊緣毒駕唾檢試紙圖像識(shí)別方法DrugChecking,旨在實(shí)現(xiàn)對(duì)采集到的毒駕唾檢試紙圖像進(jìn)行識(shí)別,并對(duì)所屬毒品類別進(jìn)行準(zhǔn)確分類.本文使用多顏色空間信息和機(jī)器學(xué)習(xí)方式,在真實(shí)毒駕唾檢試紙圖像數(shù)據(jù)集中進(jìn)行驗(yàn)證,試驗(yàn)結(jié)果表明,DrugChecking在高效準(zhǔn)確分割弱邊緣試紙圖像的同時(shí)能夠?qū)崿F(xiàn)對(duì)毒品的精確分類,為常規(guī)道路毒駕稽查提供了準(zhǔn)確有效的識(shí)別方式.
本節(jié)將重點(diǎn)介紹DrugChecking的整體流程,如圖1所示為毒駕唾檢試紙圖像的整體識(shí)別流程.首先,對(duì)原始圖像進(jìn)行預(yù)處理,使用邊緣檢測(cè)、投影變換等方式獲得試紙前景區(qū)域圖像,之后結(jié)合多顏色空間下不同圖像信息,進(jìn)行前景圖像的試紙分割,獲得原始圖像中的試紙圖像,采用PCA對(duì)試紙圖像進(jìn)行降維處理,并對(duì)降維后的數(shù)據(jù)進(jìn)行分類,從而獲得毒駕試紙中毒品所屬類別.
圖1 DrugChecking毒駕試紙檢測(cè)流程圖Fig.1 Flow chart of drug driving test strip image detection
原始毒駕唾檢試紙圖像中包含大量圖像信息,首先對(duì)圖像進(jìn)行預(yù)處理,排除干擾信息,鎖定試紙前景區(qū)域,不僅能減少設(shè)備計(jì)算量,也能避免由干擾信息引起的分類錯(cuò)誤.邊緣檢測(cè)是圖像處理領(lǐng)域的重要技術(shù),是計(jì)算機(jī)視覺(jué)尤其是特征檢測(cè)和提取的基本工具.傳統(tǒng)的邊緣檢測(cè)算法一階包括Prewitt算子、Sobel算子[11]、Roberts算子,二階包括Laplace算子、LOG算子等.通常,這類算子以導(dǎo)數(shù)極大值點(diǎn)或過(guò)零點(diǎn)作為候選邊緣點(diǎn),根據(jù)有效閾值,得到圖像邊緣.此類算子操作簡(jiǎn)單、運(yùn)算速度較快,但噪聲對(duì)該類算子影響較大,抗干擾能力弱,例如:LOG算子常產(chǎn)生雙邊界,Sobel算子易形成不閉合的區(qū)域,導(dǎo)致圖像邊緣不夠精準(zhǔn).而Canny算子[12]是最佳階梯型邊緣檢測(cè)算法,信噪比大且邊緣檢測(cè)精度高.
本文基于算法復(fù)雜度以及實(shí)際應(yīng)用效果考慮,采用Canny算子進(jìn)行圖像邊緣的獲取.由于采集到原始圖像邊緣存在無(wú)關(guān)信息干擾,如圖2(b)為原始圖像經(jīng)過(guò)邊緣檢測(cè)后所得圖像,因此,為獲得原始圖像中試紙前景圖像,選取邊緣圖像中的最大連通區(qū)域,從而排除其他無(wú)關(guān)圖像信息.首先在獲得的邊緣圖像中搜索所有連通域,從中尋找所需最大連通域(圖2(c))的位置,獲得試紙前景區(qū)域(圖2(d))并從原始圖像中裁剪得到圖2(e)試紙前景圖像,將圖像數(shù)據(jù)量由1920×2560×3減少至480×480×3,識(shí)別結(jié)果如圖2所示.
圖2 試紙前景圖像獲取示意圖Fig.2 Schematic diagram of obtaining test strip foreground image
試紙前景圖像四邊形角點(diǎn)位置由中點(diǎn)以及圖形所在點(diǎn)間距離決定,即圖2(d)中標(biāo)記區(qū)域.設(shè)Cj(j=1,2,3,4)為四邊形角點(diǎn),Oi為四邊形中點(diǎn),Pi表示最大連通域中坐標(biāo)點(diǎn),Pi∈{[x1,y1],[x2,y2],…,[xn,yn]},其中i=1,2,…,n.角點(diǎn)Cj的輸出定義如公式(1)所示.根據(jù)得到的4個(gè)角點(diǎn),對(duì)圖像裁剪獲得試紙前景圖像.
Cj=Max[(Pi-O0)(Pi-O0)T]
(1)
毒駕唾檢試紙圖像由于在成像過(guò)程中容易收到光照、色溫等影響,圖像中產(chǎn)生陰影、偽影等情況,同時(shí)試劑暈染模糊也會(huì)對(duì)試紙圖像的邊緣確定產(chǎn)生嚴(yán)重影響.常用的RGB顏色空間是面向硬件設(shè)備描述的顏色空間,通常攝像系統(tǒng)都是基于RGB顏色空間成像,但由于攝像設(shè)備所采集的圖像,存在由于設(shè)備物理性、環(huán)境高亮度比、色溫等諸多因素的影響,使得攝像得到的圖像與標(biāo)準(zhǔn)光照下比,會(huì)存在高噪聲、陰影、強(qiáng)度不均勻等情況,致使RGB顏色空間在描述物體色彩和計(jì)算處理方面不夠完全.HSV(Hue,Saturation,Value)顏色空間即色調(diào)、飽和度和亮度,3個(gè)分量相互獨(dú)立,受外界環(huán)境影響較小[13].因此將RGB顏色空間和HSV顏色空間的分量信息相結(jié)合,能夠從不同角度有效獲得所需試紙圖像特征信息.
將毒駕唾檢RGB圖像轉(zhuǎn)換到HSV顏色空間[14],圖像的各分量計(jì)算公式如下:
(2)
(3)
V=max(R,G,B)
(4)
式中,Cmax=max(R,G,B),Cmin=min(R,G,B),Δ=Cmax-Cmin.
本文采用RGB顏色空間中的B通道,HSV顏色空間中的H通道,以及由RGB顏色空間轉(zhuǎn)化所得灰度通道,共同構(gòu)建毒駕唾檢試紙圖像邊緣信息.B通道邊緣能夠擬合圖像的大部分邊緣,因此首先對(duì)B通道進(jìn)行形態(tài)學(xué)處理——膨脹,之后與其他通道進(jìn)行并運(yùn)算,這樣既能保持原有圖像邊緣輪廓,又能通過(guò)其他通道補(bǔ)充邊緣信息.最后,進(jìn)行閉操作能夠消除狹窄的間斷和細(xì)長(zhǎng)的鴻溝,使得圖像輪廓平滑,填補(bǔ)邊緣輪廓的斷裂,具體數(shù)學(xué)表達(dá)式[15]如下:
EB=A⊕B={x,y|Bxy?A}
(5)
E=EB∩EH∩Egray
(6)
E′=E·C=(E⊕C)?C
(7)
假設(shè)結(jié)構(gòu)元素B對(duì)集合A進(jìn)行操作,EB即為膨脹后B通道邊緣,E和E′分別表示進(jìn)行閉操作前后的試紙邊緣輪廓,EB,EH,Egray分別表示B通道、H通道和灰度通道的邊緣輪廓,最終得到試紙邊緣輪廓E′.
根據(jù)試紙條邊緣為直線的特點(diǎn),本文采用霍夫變換對(duì)圖像進(jìn)行直線檢測(cè),從每張前景圖像中可以得到3張毒駕試紙圖像.Hough變換[16]的參數(shù)方程如下所示:
ρ=xcosθ+ysinθ
(8)
用θ和ρ參數(shù)來(lái)描述直線,ρ表示原點(diǎn)到直線的垂直距離,θ表示該垂線與x軸的夾角.
霍夫變換通??梢栽趫D像中尋找到所需形狀曲線,根據(jù)曲線信息進(jìn)行下一步圖像處理.從原始圖像中獲取試紙前景圖像后,采用霍夫變換直線檢測(cè),圖3(a)即為采用霍夫直線檢測(cè)結(jié)果,霍夫變換的基本方法[16]:用圖像空間的邊緣數(shù)據(jù)點(diǎn)計(jì)算參數(shù)空間中的參數(shù)點(diǎn)的可能軌跡,并在一個(gè)累加器中給計(jì)算出參考點(diǎn)的計(jì)數(shù),最后選出符合條件的峰值,該峰值由ρ和θ決定,則在對(duì)應(yīng)到圖像空間中滿足該式的點(diǎn)(x,y)就組成該直線.得到所需試紙邊緣信息之后,裁剪獲得試紙圖像,圖3(b)為裁剪后試紙圖像.
圖3 毒駕圖像中試紙條區(qū)域的提取Fig.3 Images of drug driving test strips
直接對(duì)唾檢試紙圖像進(jìn)行分類會(huì)耗費(fèi)大量計(jì)算資源,通過(guò)對(duì)圖像進(jìn)行降維處理能夠有效提升處理速度.主成分分析(PCA)是一種利用從高維到低微的降維思想,是從高維的可觀測(cè)顯示變量中獲取信息,組成低維不可直接觀測(cè)的隱式變量.PCA[17]通過(guò)K-L變換,使用盡可能少的低維主成分代替之前高維數(shù)據(jù)信息,計(jì)算公式見(jiàn)式(9)-式(14).假設(shè)每張?jiān)嚰垐D像數(shù)據(jù)樣本矩陣為{x1,x2,…,xm},首先將數(shù)據(jù)樣本進(jìn)行中心化處理,取每個(gè)特征的均值:
(9)
(10)
從樣本特征中提取主要成分,進(jìn)行數(shù)據(jù)降維.需要計(jì)算樣本集的協(xié)方差矩陣,并使用SVD函數(shù)進(jìn)行數(shù)據(jù)計(jì)算:
(11)
[U,Λ,V]=svd(∑)
(12)
式中,∑表示樣本x的協(xié)方差矩陣,由∑計(jì)算可得樣本x的特征值和特征向量,特征值Λ=[λ1,λ2,…,λp],特征向量U=[u1,u2,…,up],其特征值是遞減排列,可選取全部p維特征中的前n維特征作為主要成分,通常選取保留的能量百分比E為95%以上的特征維度,即:
(13)
最終降維后的樣本數(shù)據(jù)為:
xPCA=[u1,u2,…,un]Td
(14)
本文480×100×3將維的分割所得試紙圖像,經(jīng)過(guò)PCA降維,成為480×1維數(shù)據(jù),由于降維后第一主成分的能量百分比為98.7376%,因此,使用第一主成分即可代表該圖像主要數(shù)據(jù),部分降維結(jié)果圖4所示:
圖4 部分試紙圖像降維結(jié)果示意圖Fig.4 Schematic diagram of PCA results of test strip images
從圖4可以看出,降維后圖像存在不同數(shù)目的峰值,峰值高低與圖像的明暗度和色塊顏色強(qiáng)弱有關(guān),而峰值個(gè)數(shù)則與試紙條圖像中色塊數(shù)目相對(duì)應(yīng),如圖4左上圖中,峰值與試紙色塊均為2,右上圖中峰值與試紙色塊均為1.因此,降維后的數(shù)據(jù)能夠有效代表原始圖片.
支持向量機(jī)(Support Vector Machine,SVM)[18]是機(jī)器學(xué)習(xí)中適用于小樣本數(shù)據(jù)的有效分類方法,通過(guò)構(gòu)造最優(yōu)超平面從而對(duì)未知樣本進(jìn)行分類.針對(duì)毒駕檢測(cè)試紙的小樣本性以及樣本特點(diǎn),本文選用機(jī)器學(xué)習(xí)支持向量機(jī)對(duì)試紙毒品進(jìn)行分類.SVM對(duì)于解決小樣本非線性的高維數(shù)據(jù)識(shí)別中具有很好的準(zhǔn)確率和泛化能力.非線性的支持向量機(jī)學(xué)習(xí)算法[19]如下:
輸入:訓(xùn)練數(shù)據(jù)集T={(x1,y1),(x2,y2),…,(xN,yN)},其中,xi∈Rn,yi∈{+1,-1},i=1,2,…,N;
輸出:分離超平面和分類決策函數(shù)f(x)
步驟1.選取合適的核函數(shù)K(x,z)和懲罰參數(shù)C>0;
步驟2.構(gòu)造并求解凸優(yōu)化問(wèn)題
(15)
(16)
0≤ai≤C,i=1,2,…,N
得到最優(yōu)解:
(17)
(18)
步驟4.構(gòu)造決策函數(shù)
(19)
式中,sgn()表示符號(hào)函數(shù).
SVM中常用核函數(shù)包括:線性核函數(shù)(Liner Kernel,Linear)、多項(xiàng)式核函數(shù)(Polynomial Kernal,Poly)、Sigmoid核函數(shù)、徑向核函數(shù)(Radical Basis Function,RBF),其表達(dá)式分別為:
K(y,yi)Linear=yyi
(20)
K(y,yi)Poly=(yyi+1)d
(21)
K(y,yi)Sigmoid=tanh(k(yyi)+θ)
(22)
K(y,yi)RBF=exp(-‖y-yi‖2/(2σ2))
(23)
針對(duì)不同數(shù)據(jù),核函數(shù)的選擇對(duì)于分類的準(zhǔn)確性具有重大影響,經(jīng)試驗(yàn),Poly核函數(shù)對(duì)于毒品試紙的正確分類具有顯著效果.在使用SVM進(jìn)行樣本分類時(shí),由于絕大數(shù)問(wèn)題都是非線性問(wèn)題,因此需要選用合適的核函數(shù)K(y,yi)將輸入向量由低維映射到高維特征空間,由非線性變?yōu)榫€性可分的數(shù)據(jù)向量.
本文實(shí)驗(yàn)采用64位Windows10操作系統(tǒng),處理器為Intel(R)Core(TM)i7-8700,內(nèi)存為16.0 GB,整體實(shí)驗(yàn)流程基于Matlab實(shí)現(xiàn).
本文所使用的毒駕檢測(cè)試紙圖像均是真實(shí)場(chǎng)景下常規(guī)道路稽查環(huán)節(jié)檢測(cè)所得圖像,共包括1920×2560×3尺寸的247張?jiān)紙D片,經(jīng)過(guò)圖片分割處理后獲得741張480×100×3尺寸的試紙圖像,按照試紙圖像中色塊位置的不同分為5個(gè)類別,類別信息如表2所示.
表2 毒駕試紙?jiān)碱悇e信息Table 2 Type information of drug driving test strips
每張?jiān)嚰埌?個(gè)色塊,從上而下分別代表色塊有效性、毒品A和毒品B,為了類別標(biāo)記的便捷性,我們將色塊的有無(wú)分別用1和0表示,組成5種類別,包括000,100,110,111和101,如圖5所示.000表示該試紙檢測(cè)無(wú)效;100表示試紙檢測(cè)有效,并且不存在毒品A和B;110表示試紙有效且存在毒品A,不存在毒品B;111表示試紙有效,同時(shí)毒品A和B都已檢測(cè)到;101表示試紙有效,不存在毒品A,存在毒品B.
在分類后的試紙數(shù)據(jù)中,類別之間樣本數(shù)量差距較大,類別3和類別4較多,而類別0、1、2則遠(yuǎn)遠(yuǎn)小于其樣本數(shù)量,存在嚴(yán)重?cái)?shù)據(jù)不平衡現(xiàn)象,影響后續(xù)SVM的樣本分類,造成分類精確度下降.目前解決樣本數(shù)據(jù)不平衡問(wèn)題的方法主要有加權(quán)法、采樣法以及對(duì)原始數(shù)據(jù)增加噪聲擴(kuò)大樣本量等方法[20,21].本文通過(guò)在原始圖像中加入均值為0,方差為0.025的高斯噪聲,將類別0、1、2進(jìn)行數(shù)據(jù)擴(kuò)充,數(shù)據(jù)擴(kuò)充后信息如表3所示,使得每個(gè)類別的樣本數(shù)據(jù)量處于均衡狀態(tài),這樣不僅增加了訓(xùn)練樣本量,解決數(shù)據(jù)不平衡問(wèn)題,也增強(qiáng)了算法分類的魯棒性.
圖5 試紙類別示意圖Fig.5 Different types of test strips
表3 毒駕試紙數(shù)據(jù)擴(kuò)充類別信息Table 3 Drug driving test strip data extended category information
在機(jī)器學(xué)習(xí)方法中,分類模型的評(píng)價(jià)指標(biāo)通常為準(zhǔn)確率(Accuracy,Acc)、精準(zhǔn)率(Precision,Pre)、召回率(Recall)、綜合評(píng)價(jià)指標(biāo)F1-Score(F1),各評(píng)價(jià)指標(biāo)所使用的樣本數(shù)據(jù)類別如表4所示.Acc表示該算法所有分類正確的樣本占所有數(shù)據(jù)樣本的比率,則Acc越高,代表該算法檢測(cè)出數(shù)據(jù)樣本真實(shí)情況的能力越強(qiáng).Pre和Recall都表示在不同分類情況下對(duì)該類別的判斷能力,Pre和Recall數(shù)值越高,則該算法對(duì)該類別的分類能力越強(qiáng).各項(xiàng)評(píng)價(jià)指標(biāo)如下所示:
表4 樣本數(shù)據(jù)類別表Table 4 Sample data category Table
(24)
(25)
(26)
(27)
3.4.1 試紙區(qū)域識(shí)別
為了從原始圖像中得到所需唾檢試紙圖像,通常選用RGB顏色空間或?qū)⒉噬珗D像轉(zhuǎn)化為灰度圖,進(jìn)行邊緣信息提取.由于毒駕檢測(cè)圖像中干擾信息較多,存在陰影、偽影以及顏色暈染等情況,使得在RGB顏色空間下無(wú)法獲得準(zhǔn)確邊緣,從而影響后續(xù)圖像識(shí)別,各通道邊緣識(shí)別準(zhǔn)確率如表5所示.
表5 不同顏色通道的邊緣識(shí)別準(zhǔn)確率Table 5 Accuracy of edge recognition for different color channels
在圖6中,Green、Blue、Gray分別代表RGB圖像的G通道、B通道以及由RGB圖像轉(zhuǎn)化得到的灰度圖通道,圖6(a)中由于顏色暈染及陰影,導(dǎo)致3個(gè)通道均未正確檢測(cè)到試紙邊緣,在圖6(b)中只有B通道能夠準(zhǔn)確識(shí)別識(shí)別試紙邊緣.因此,本文采用HSV顏色空間中H通道,RGB顏色空間中B通道和灰度圖通道,從表5中看出,使用Green、Blue、Gray顏色通道進(jìn)行圖像分割,分割正確率分別為88%、98%和97%,利用3個(gè)通道所疊加的邊緣信息進(jìn)行分割,在目前數(shù)據(jù)集中分割正確率為100%,能夠高效準(zhǔn)確識(shí)別試紙邊緣,進(jìn)行試紙圖像分割.
圖6 不同顏色通道試紙邊緣識(shí)別示意圖Fig.6 Test strip edges with different color channels
3.4.2 試紙分類結(jié)果
本文實(shí)驗(yàn)采用十折交叉驗(yàn)證策略,將數(shù)據(jù)集分成10份,其中9份作為訓(xùn)練數(shù)據(jù),剩余1份作為測(cè)試數(shù)據(jù).交叉驗(yàn)證重復(fù)10次實(shí)驗(yàn),綜合每次實(shí)驗(yàn)得出的Acc,Pre,Recall和F1,計(jì)算平均值作為對(duì)模型整體性能的評(píng)估,避免隨機(jī)結(jié)果造成的影響.
對(duì)于機(jī)器學(xué)習(xí),數(shù)據(jù)集中樣本類別的數(shù)據(jù)不平衡會(huì)影響單個(gè)類別預(yù)測(cè)精度,導(dǎo)致模型整體性能下降.因此在數(shù)據(jù)預(yù)處理時(shí),對(duì)原始圖像數(shù)據(jù)加入高斯噪聲,生成新的數(shù)據(jù)圖像,以平衡數(shù)據(jù)樣本類別.為了驗(yàn)證數(shù)據(jù)擴(kuò)充前后,模型對(duì)不同樣本類別及整體分類性能,本文經(jīng)過(guò)一系列對(duì)比實(shí)驗(yàn),得到數(shù)據(jù)擴(kuò)充前后的各種模型指標(biāo)如表6所示.
表6 數(shù)據(jù)擴(kuò)充前后各指標(biāo)對(duì)比Table 6 Comparison of indicators before and after data expansion
根據(jù)表6看出,加入噪聲后的擴(kuò)充數(shù)據(jù),分類準(zhǔn)確率由0.946提升至0.9804,其余3種評(píng)價(jià)指標(biāo)的數(shù)值也明顯高于原始數(shù)據(jù).由于原始數(shù)據(jù)中某些類別數(shù)據(jù)較少,模型對(duì)該類別學(xué)習(xí)能力較弱,當(dāng)擴(kuò)大數(shù)據(jù)集后,豐富的信息,使模型做出更加準(zhǔn)確的判斷.實(shí)驗(yàn)結(jié)果表明,使用該方法對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充能夠有效提高模型魯棒性,增強(qiáng)泛化能力.
此外,對(duì)于不同分類問(wèn)題,不同核函數(shù)的選擇對(duì)SVM算法模型性能有不同影響.本文使用Linear、Poly、Sigmoid和RBF核函數(shù)進(jìn)行實(shí)驗(yàn)對(duì)比,評(píng)價(jià)不同核函數(shù)對(duì)實(shí)驗(yàn)分類,結(jié)果見(jiàn)表7.
表7 不同核函數(shù)的評(píng)價(jià)指標(biāo)對(duì)比Table 7 Comparison of evaluation indicators of different kernel functions
根據(jù)表7看出,采用Poly核函數(shù)進(jìn)行毒駕試紙分類,由于數(shù)據(jù)內(nèi)部關(guān)聯(lián)性,其各個(gè)指標(biāo)均高于另外3種核函數(shù),因此,在SVM進(jìn)行樣本分類時(shí),本文選用Poly核函數(shù)能夠達(dá)到當(dāng)前最優(yōu)結(jié)果.
3.4.3 對(duì)比試驗(yàn)
本文所提出的使用毒檢試紙圖像的DrugChecking與常用毒品檢測(cè)方法(GC-MS[4]、LC-MS[6])相比具有較低的檢測(cè)時(shí)間,能夠有效提高對(duì)駕駛員的毒駕檢測(cè)效率,不同檢測(cè)方式用時(shí)如表8所示.
表8 不同檢測(cè)方式所的檢測(cè)時(shí)間Table 8 Time taken for different detection methods
常規(guī)的毒品檢測(cè)方式CG-MS和LC-MS需要首先對(duì)采集到的唾液等試劑進(jìn)行多種預(yù)處理,之后由于試劑的不同導(dǎo)致所需反應(yīng)時(shí)間也有所差異,但整個(gè)檢測(cè)過(guò)程通常耗費(fèi)較多時(shí)間.與試紙檢測(cè)的目測(cè)法相比,DrugChecking依然有更高的檢測(cè)效率.
3.4.4 模型分析
DrugChecking毒駕檢測(cè)試紙識(shí)別方法采用模塊化思想,降低算法耦合性,具有更高的靈活性和可擴(kuò)展性,為毒駕試紙檢測(cè)提供新的思路.當(dāng)該模型框架應(yīng)用于其他領(lǐng)域時(shí),可以根據(jù)不同需求進(jìn)行模塊或算法的修改,例如顏色空間的選擇、主成分分析時(shí)特征維度的保留、分類算法的選擇等方面.
表9 不同類別試紙的識(shí)別準(zhǔn)確率Table 9 Recognition accuracy of different types of test strip
DrugChecking同樣具有較強(qiáng)的抗干擾性,對(duì)環(huán)境干擾和試紙污染都能夠有效處理.一方面,此算法是應(yīng)用于日常道路毒駕檢測(cè),因此檢測(cè)環(huán)境的光照、天氣和溫度,所產(chǎn)生的高曝光、陰影、偽影等,都會(huì)對(duì)圖像的拍攝造成影響.另一方面,待檢測(cè)試劑與試紙的反應(yīng)不可避免的會(huì)產(chǎn)生色塊暈染情況.如圖6所示,陰影、偽影和色塊暈染對(duì)邊緣的識(shí)別具有影響.本文采用多顏色空間融合方式,HSV顏色空間能夠消除圖像中光線所造成的影響,而采用RGB顏色空間和灰度圖能夠排除試紙暈染帶來(lái)的干擾.本文采用的測(cè)試圖像包含此類干擾圖像,不同類別試紙的識(shí)別準(zhǔn)確率,如表9所示,DrugChecking對(duì)每個(gè)類別的試紙都具有較高的識(shí)別率.
本文針對(duì)毒駕唾檢試紙的特點(diǎn),提出了一種簡(jiǎn)潔、高效的試紙分類方法——DrugChecking.該方法在融合不同顏色空間下的試紙圖像邊緣信息基礎(chǔ)上,提取了毒駕唾檢試紙條區(qū)域,并對(duì)試紙條區(qū)域進(jìn)行降維分類,最終實(shí)現(xiàn)毒檢分類.本文針對(duì)毒駕唾檢試紙中樣本不平衡的問(wèn)題,通過(guò)數(shù)據(jù)擴(kuò)充有效提高了模型魯棒性,并增強(qiáng)模型泛化能力.此外,經(jīng)試驗(yàn)驗(yàn)證,DrugChecking對(duì)于常規(guī)道路毒駕檢測(cè)具有穩(wěn)定的識(shí)別能力和良好的分類性能.在之后的工作中,將進(jìn)一步提高模型對(duì)毒駕唾檢試紙的識(shí)別準(zhǔn)確率,并加強(qiáng)對(duì)處于檢測(cè)閾值的弱色塊識(shí)別能力.