張?zhí)熘茌x林,楊 仙
(1.景德鎮(zhèn)陶瓷大學(xué)機(jī)械電子工程學(xué)院;2.南昌大學(xué)信息工程學(xué)院,江西 南昌 330031)
探地雷達(dá)(ground penetrating radar,GPR)是一種利用地下介質(zhì)的不連續(xù)性對地下目標(biāo)探測的有效工具[1]。由于GPR具有探測速度快、探測過程連續(xù)、操作靈活方便、分辨率高、不破壞被探測目標(biāo)等特點,廣泛應(yīng)用于軍事和民用領(lǐng)域。探地雷達(dá)主要應(yīng)用于以下四個方向:(1)地下目標(biāo)定位;(2)地下目標(biāo)的尺寸估計;(3)地下目標(biāo)參數(shù)估計;(4)地下目標(biāo)識別。本文就地下目標(biāo)形狀識別進(jìn)行研究。
一般來說,地下目標(biāo)的電性能參數(shù)、位置以及形狀的估計涉及的算法目前可分為兩大類:基于物理模型方法和基于傳統(tǒng)人工設(shè)計特征提取的方法?;谖锢砟P头椒ㄖ?,采用線性逆散射方法設(shè)計測量參數(shù)成像來估計目標(biāo)位置[2-3],同時需要其他算法輔助完成;對地下目標(biāo)的形狀、電性能參數(shù)、大小的估計,通常使用合成孔徑雷達(dá)成像方法、時域反射以及非線性逆散射方法[4-7],不足之處為涉及的算法復(fù)雜度高、計算代價較大。在傳統(tǒng)目標(biāo)分類方法中,一般將人工設(shè)計的特征提取算法和分類器結(jié)合,從而實現(xiàn)對地下目標(biāo)的檢測和分類。傳統(tǒng)的人工設(shè)計的特征提取方法需要相關(guān)研究領(lǐng)域的知識為前提,并且耗時長、提取的特征不具有很好的描述性[8]。目前,隨著人工智能的迅速發(fā)展,深度學(xué)習(xí)算法中的卷積神經(jīng)網(wǎng)絡(luò)成為計算機(jī)視覺中最常用的自動特征提取算法[9]。CNN直接輸入圖像數(shù)據(jù),在特征提取中不需要過多的人工干預(yù),避免了復(fù)雜的人工設(shè)計的特征提取過程,同時CNN也廣泛應(yīng)用于醫(yī)學(xué)圖像識別[10]、人臉識別[11]等領(lǐng)域。但CNN中的Softmax分類器不能很好的處理非線性輸出問題。鑒于此,本文提出了基于CNN-SVM的地下目標(biāo)形狀識別算法。
本文的主要工作是將CNN-SVM算法應(yīng)用于地下目標(biāo)識別領(lǐng)域,減少復(fù)雜的人工特征提取操作,為了提高CNN提取的特征可分性,本文使用支持向量機(jī)代替CNN中的Softmax分類器,在地表面光滑和粗糙兩種情況下對地下目標(biāo)形狀識別,實驗結(jié)果表明,相比于原始CNN分類算法和傳統(tǒng)人工設(shè)計的特征提取分類算法,CNN-SVM方法具有更好地下目標(biāo)形狀識別效果。
由于GPR圖像雙曲線受發(fā)射波形、極化方式、背景介質(zhì)、埋藏深度、目標(biāo)的形狀和電性能參數(shù)的影響,對于探地雷達(dá)圖像的特征提取較為復(fù)雜,為了更好的評估CNN-SVM對地下目標(biāo)形狀分類性能,通過預(yù)處理提取地下圓形和矩形目標(biāo)的GPR圖像的感興趣區(qū)域(Region of interest,ROI),首先通過方差變化和能量分布確定地下圓形和矩形目標(biāo)位置,然后再去除地下背景數(shù)據(jù)留下地下目標(biāo)信息,最后再計算處理后的數(shù)據(jù)矩陣行和列的能量,進(jìn)而確定目標(biāo)的大致區(qū)域。能量掃描按式(1)計算:
(1)
式中:xn(i)是第道n數(shù)據(jù),M是總的數(shù)據(jù)道數(shù),En是第n道數(shù)據(jù)的能量。
然后去除背景數(shù)據(jù),并計算目標(biāo)的行列方向的能量分布。通過選取能量閾值來確定目標(biāo)位置,將大于閾值的位置保留,反之去除。閾值選取標(biāo)準(zhǔn)按式(2)選取
(2)
探地雷達(dá)由雷達(dá)主機(jī)、發(fā)射天線和接收天線組成。通過移動探地雷達(dá)天線獲取地下目標(biāo)的GPR圖像數(shù)據(jù),其中探地雷達(dá)的工作原理如圖1。
圖1 探地雷達(dá)工作原理圖
卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、非線性激活函數(shù)層、池化層和softmax分類輸出層組成。卷積神經(jīng)網(wǎng)絡(luò)的輸入層一般為二維的圖像數(shù)據(jù),使用已經(jīng)設(shè)定好的卷積核對輸入圖像通過卷積學(xué)習(xí)特征,池化層利用圖像局部相關(guān)性對圖像進(jìn)行下采樣,這樣既可以大幅度減少網(wǎng)絡(luò)的數(shù)據(jù)處理量,同時又保留了特征的有用信息。Softmax將學(xué)習(xí)到的特征映射到所屬的類。
為了更清楚的理解卷積層和池化層的操作,假設(shè)輸入數(shù)據(jù)集圖像像素大小為m×n,卷積核大小為m×n,步長設(shè)為1,外加入偏置項,則經(jīng)過卷積層輸出的特征圖大小為(m-p+1)×(n-q+1),卷積層的輸出一般為非線性激活函數(shù)輸入,非線性激活函數(shù)的輸出為池化層的輸入,池化層輸出特征圖數(shù)和卷積層相同,池化操作就是提取特征圖局部的均值或最大值。則第l個卷積層的第j個特征圖上的神經(jīng)元經(jīng)過激活函數(shù)的輸出為:
(3)
K(x)=max(0,x)
(4)
在CNN中使用Softmax作為網(wǎng)絡(luò)的分類器。該分類器以全連接為橋梁將CNN提取的特征映射為所屬類別輸出。Softmax分類器在網(wǎng)絡(luò)訓(xùn)練時可以與網(wǎng)絡(luò)的后向傳播有效的結(jié)合,便于CNN模型中的權(quán)值更新,但當(dāng)分類問題偏非線性時,Softmax不能夠很好的分類。
SVM利用自身的核函數(shù)將原始的特征空間中非線性分類界面映射到高維度的特征變換空間中,接著會產(chǎn)生線性分類界面,最后得到良好的分類效果。為了解決Softmax不能夠很好處理非線性問題,鑒于SVM對非線性分類問題表現(xiàn)良好。本文使用SVM代替Softmax作為CNN的模型分類器,并且對CNN提取的地下圓形和矩形目標(biāo)特征進(jìn)行分類。
本文在地表面光滑和粗糙兩種場景下,使用CNN-SVM算法對地下圓形和矩形目標(biāo)識別,具體步驟為:(1)預(yù)處理,提取GPR圖像的感興趣區(qū)域,主要提取圖像的雙曲線部分;(2)利用CNN學(xué)習(xí)特征;(3)將CNN學(xué)習(xí)的特征作為SVM分類器輸入進(jìn)行訓(xùn)練;(4)使用未訓(xùn)練的GPR圖片輸入訓(xùn)練好的CNN-SVM模型進(jìn)行分類測試。本文的數(shù)據(jù)預(yù)處理和CNN-SVM算法整體流程如圖2。
圖2 本文CNN-SVM整體流程圖
圖3 本文的CNN-SVM框架
在本文中使用CNN提取特征時,輸入的數(shù)據(jù)集是經(jīng)過ROI預(yù)處理GPR圖像,使得所有探地雷達(dá)圖像輸入大小均為64*64,此外,本文使用dropout斷開網(wǎng)絡(luò)中5%的網(wǎng)絡(luò)結(jié)點以防止網(wǎng)絡(luò)過擬合,同時在每個卷積層后面加入Batch-Normalization(BN)技術(shù)加快網(wǎng)絡(luò)的訓(xùn)練速度,使用2*2的最大池化(Max-pooling)。本文CNN-SVM整體的結(jié)構(gòu)為輸入層Input-卷積層C1-池化層S1-卷積層C2-池化層S2-卷積層C3-池化層S3-全連接層full connected-分類層SVM,實驗中SVM分類器使用線性核函數(shù),本文使用的CNN-SVM算法的整體實現(xiàn)過程如下:
(1)將經(jīng)過ROI預(yù)處理的探地雷達(dá)圖像數(shù)據(jù)集整體處理成64*64大小作為網(wǎng)絡(luò)的輸入。
(2)第一層卷積層的卷積核維度設(shè)定為7*7,使用20個卷積核,輸出20個58*58的特征圖。同時在該卷積后插入BN加快網(wǎng)絡(luò)訓(xùn)練速率,將第一層所有的特征圖經(jīng)過2*2的Max-pooling,即取局部特征圖中4個像素中的最大值,輸出為29*29的特征圖。
(3)將S1的輸出作為后面卷積層的輸入,第二層卷積核大小為10*10,經(jīng)過卷積后輸出60個20*20的特征圖,將C2的特征圖同上述中操作,得S2層的特征圖為10*10。
(4)將S2的特征圖作為第三層卷積層的輸入,第三層卷積核大小為5*5,輸出100個特征圖,C3特征圖為6*6。最大池化后的特征圖為3*3。
(5)最后將全連接的500張1*1的特征圖與SVM相連,全連接的輸出為1*1*500。
若訓(xùn)練集數(shù)為{1,2,3……m},測試集數(shù)為{1,2,3……n},則此時SVM特征的的訓(xùn)練集輸入維度為500×m,測試集m輸入維度為500×n,最后得目標(biāo)識別結(jié)果。
本文的CNN-SVM框架結(jié)果如圖3,實現(xiàn)細(xì)節(jié)如表1。
本文使用電磁仿真軟件gprMax分別仿真地表面在光滑和粗糙情況下,地下圓形和矩形目標(biāo)在不同介電常數(shù)、不同深度、不同大小情況下的探地雷達(dá)圖像,并使用仿真得到的探地雷達(dá)圖像進(jìn)行實驗。
表1 CNN-SVM實現(xiàn)細(xì)節(jié)
在地表面光滑GPR數(shù)據(jù)仿真中,發(fā)射波形與天線參數(shù)設(shè)置如下:(1)天線發(fā)射信號波形為中心頻率為900 MHz的ricker波;(2)發(fā)射天線和接收天線的距離d為0.15λ(λ為電磁波波長);(3)探地雷達(dá)距地面的高度0.06λ;(4)兩個相鄰收發(fā)一體的天線的距離為0.05 m;(5)時窗為25 ns。
地下圓形和矩形目標(biāo)特性設(shè)置為:(1)背景的介電常數(shù)為設(shè)為5,電導(dǎo)率為0.005 S·m-1;(2)地下場景的維度固定為4.2×4.2 m;(3)圓形目標(biāo)(埋藏深度[1.7 2.4]m),半徑范圍[0.1 0.28]m,介電常數(shù)εr∈[14.0 28.0],電導(dǎo)率為0.005 S·m-1);(4)矩形目標(biāo)(埋藏深度[1.7 2.4]m),大小范圍:長[0.1 1.0]m,寬[0.1 1.0]m,介電常數(shù)設(shè)置為εr[14.0 28.0],電導(dǎo)率為0.005 S·m-1)。
在地表面粗糙情況下,地表面粗糙度系數(shù)設(shè)置為0.4~0.6,發(fā)射天線、接受天線的參數(shù)設(shè)置以及地下目標(biāo)參數(shù)的設(shè)置和光滑地面所設(shè)置的相同。
地表光滑情況下,仿真得到500組探地雷達(dá)圖像,圓形和矩形目標(biāo)各250組。在地表粗糙情況下,仿真得到400組粗糙面探地雷達(dá)圖像,圓形和矩形目標(biāo)各200組。部分仿真的GPR圖像如圖4所示。
圖4 部分仿真GPR圖像數(shù)據(jù)
為了驗證本文CNN-SVM方法對地下圓形和矩形目標(biāo)的識別的有效性,使用仿真的地下目標(biāo)探地雷達(dá)圖像數(shù)據(jù)集進(jìn)行實驗,本文在地表面光滑和粗糙兩種情況下對地下圓形和矩形目標(biāo)識別實驗,首先在地表面光滑情況下,使用仿真的500組數(shù)據(jù),80%作為訓(xùn)練,20%作為測試。在地表面粗糙的場景下,同樣使用相同的訓(xùn)練和測試策略。輸入均為64*64的RGB探地雷達(dá)圖像。
在本實驗中,使用二分類問題常用的評價標(biāo)準(zhǔn)對分類模型進(jìn)行評測,分別為準(zhǔn)確率(accuracy)、精度(precision)和召回率(recall),計算公式為:
假設(shè)TP是目前類別為陽性且被預(yù)測為陽性的數(shù)量,F(xiàn)P是目前類別為陰性且被預(yù)測為陽性的數(shù)量,TN是目前類別為陰性且被預(yù)測為陰性的數(shù)量,F(xiàn)N是目前類別為陽性且被預(yù)測為陰性的數(shù)量,P為屬于該類別的總類別數(shù)。
實驗中,為了將CNN-SVM地下目標(biāo)形狀識別結(jié)果與傳統(tǒng)人工設(shè)計的特征的識別結(jié)果進(jìn)行比較,由于HOG特征是目前最具描述力的特征之一,在光滑地表面情況下,提取地下目標(biāo)探地雷達(dá)圖像的HOG特征,再使用SVM對地下目標(biāo)形狀的HOG特征進(jìn)行分類,實驗中使用400光滑地表面探地雷達(dá)圖像作為訓(xùn)練,100組做測試。
在CNN-SVM實驗中,首先搭建CNN對探地雷達(dá)圖像訓(xùn)練和特征學(xué)習(xí),搭建好CNN模型之后,CNN的參數(shù)設(shè)置如下:學(xué)習(xí)率設(shè)為0.003,網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)為200,Batch Size為320。在訓(xùn)練好CNN之后,使用SVM代替CNN中softmax分類層,將CNN中全連接的的特征輸入SVM進(jìn)行特征訓(xùn)練以及地下目標(biāo)形狀識別。由于實驗中CNN全連接層輸出的特征維度為500個1*1的特征,因此,將實驗中400組訓(xùn)練集探地雷達(dá)圖像經(jīng)過CNN后轉(zhuǎn)化為400*500的特征用于SVM訓(xùn)練,100組測試集轉(zhuǎn)化為100*500的特征用于SVM測試。
實驗中CNN訓(xùn)練200次得200個網(wǎng)絡(luò)模型,將每個網(wǎng)絡(luò)訓(xùn)練模型中的softmax分類層更換為SVM分類層,最后所得CNN-SVM的誤差曲線與原始CNN誤差曲線如圖6,同時比較實驗中CNN學(xué)習(xí)特征和傳統(tǒng)HOG特征的區(qū)別如圖5,可見,與提取的HOG特征相比,CNN學(xué)習(xí)的特征更具有更好的泛化力,分別計算CNN-SVM對測試集分類所得到的準(zhǔn)確率(accuracy)、精度(precision)和召回率(recall),并且與CNN、HOG-SVM算法對比,實驗結(jié)果如表2所示,得到ROC曲線如圖7。
圖5 CNN提取的特征與HOG特征
Epoch
False positive rate
表2 光滑地表面目標(biāo)識別結(jié)果
表3 粗糙地表面目標(biāo)識別結(jié)果
根據(jù)上述實驗結(jié)果,可以看出本文的CNN-SVM算法對于地下目標(biāo)形狀識別結(jié)果明顯優(yōu)于HOG-SVM和CNN算法,由圖3,CNN-SVM方法收斂更快,訓(xùn)練誤差更小。
在粗糙地表面情況下,對地下目標(biāo)形狀分類實驗中,使用的CNN-SVM框架和光滑地表面的相同,粗糙地表面情況下,使用400組粗糙面地下目標(biāo)探地雷達(dá)圖像進(jìn)行實驗,其中320作為訓(xùn)練,80組作為測試。CNN網(wǎng)絡(luò)參數(shù)將Batchsize改為300,最后所得分類結(jié)果如表3,ROC曲線如圖7。
由于仿真數(shù)據(jù)在地表面粗糙情況下和實際情況更接近,用于訓(xùn)練和測試的探地雷達(dá)圖像中存在的干擾較多,但是根據(jù)表3,CNN-SVM算法仍有相對較高的地下圓形和矩形目標(biāo)的分類結(jié)果。根據(jù)圖8 ROC曲線可以看出,CNN-SVM方法分類性能優(yōu)于CNN和HOG-SVM算法。
False positive rate
對于傳統(tǒng)地下目標(biāo)識別方法存在的問題,本文提出基于CNN-SVM地下目標(biāo)形狀識別方法。通過該算法解決傳統(tǒng)特征提取和CNN分類器中存在的問題,使用支持向量機(jī)代替CNN中Softmax分類器。利用光滑和粗糙地表面的探地雷達(dá)圖像數(shù)據(jù)集對該方法進(jìn)行驗證,實驗結(jié)果表明,在不需要人工提取特征的情況下,該方法對地表面光滑的地下目標(biāo)形狀識別實驗中,達(dá)到了97%的平均識別率,在地表面粗糙情況下,對地下目標(biāo)識別實驗中,該方法對地下目標(biāo)的識別率仍高于傳統(tǒng)分類算法,因此,該方法在探地雷達(dá)目標(biāo)識別領(lǐng)域具有一定的應(yīng)用價值。