陳 雷
上海市浦東公安分局刑事科學研究所,上海 200125
用指紋進行身份識別,雖然目前有很多的研究成果,在某些方面也非常成熟,但是這些成果作用于低質量的指紋圖像時,往往難以獲得較高的準確率。而且鑒于系統資源的有限性,在某些環(huán)境中,指紋的識別對實時性要求很高,所以在時間的限制下獲得較高的識別結果非常重要。有鑒于此,本文引入基于卷積神經網絡的深度學習模型,使用卷積神經網絡對圖像配準中的旋轉問題進行處理,從而實現利用有限的資源進行快速的配準。
在深度學習領域中,應用最廣泛的是卷積神經網絡,也稱之為卷積網絡,是一種專門用來處理具有類似網格結構的數據的神經網絡。卷積神經網絡在諸多應用領域都表現優(yōu)異,譬如時間序列數據。卷積神經網絡中一個典型層包含三級:在第一級中,這一層并行地計算多個卷積產生一組線性激活響應;在第二級中,每一個線性激活響應將會通過一個非線性的激活函數,該級有時也稱為探測級;在第三級中,利用卷積神經網絡提供的池化函數再次優(yōu)化其輸出。池化函數負責對卷積層提取的特征進行處理,以代替網絡在該位置的輸出,例如,最大池化函數給出相鄰矩形區(qū)域內的最大值。不管采用什么樣的池化函數,當輸入做出少量平移時,池化能夠幫助輸入的表示近似不變。使用池化操作可以認為是添加了足夠強的先驗:通過該層學習獲得的函數務必具備少量平移不變性的要求。當這個假設成立時,池化可以極大地提高網絡的統計效率。
圖像配準是指求解幾幅圖像之間的空間變換關系,從而使一對或多幅圖像達到空間上的對齊。目前從技術角度講,可以將圖像配準分為:圖像融合下的多模態(tài)配準、識別或定位下的模板配準、圖像深度變換和變形下的觀察點配準、檢測物體生長變化下的時間序列配準等。圖像配準的一般流程如下:
特征空間是點、邊緣等,是從圖像中抽取出來的用于配準的特征。從某種角度來看,特征空間直接關系到圖像中特征對配準算法的敏感性。
搜索空間是對浮動圖像進行變換的方式以及范圍。隨著搜索空間的增大,算法時間復雜度呈指數增長。因此,搜索空間在一定程度上影響搜索的速度。
相似性度量會影響空間變換模型的選擇,是衡量不同變換之下結果是否可靠的準則,在一定程度上與配準算法對干擾的抗性有關。
搜索策略直接影響著配準的速度,是算法優(yōu)化的重要方向。在理論上,通過窮舉的搜索策略一定可以找到最優(yōu)的參數,但是需要付出很大的時間代價,因此這往往是應用所無法接受的。
在指紋圖像庫中,提取參考圖像和浮動圖像,數據集為34300(5*7*7*7*20)對圖像。為了增強網絡的泛化能力,對每幅圖像添加了高斯白噪聲。在數據格式上,將圖像數據轉為HDF5格式,且對超過2GB的數據進行切分。切分后的數據按照4:1:1生成相應的訓練集、驗證集和測試集。
在數據預處理中,還有一項重要的工作就是對數據進行標準化,這樣做的目的是加快梯度下降獲得最優(yōu)解的速度,為了方便實現,整幅圖像灰度值均減去60,因為其灰度均值在60上下浮動。通過零均值化處理,可以提高模型的精度。
根據圖像大小,以LeNet-5為基礎,在其微小改動的基礎上,使其能夠處理100*100的輸入圖像,具體結構,見表1。
表1 網絡結構
本結構通過傳統的參數共享,以及參考圖像與浮動圖像在通道維度的合并,成功地提高了精度。為了方便預測,將輸入圖像的大小200*100分割為兩張100*100的圖像,然后依次經過卷積網絡各層的處理。在網絡內部,為了提升網絡的處理效果,使用小卷積核替代大卷積核,從而減少了網絡參數。
在深度網絡學習過程中,還需要對一些參數進行設置,比如每次批處理的圖像數,可以根據實際對batch_size進行賦值。通常情況下,該參數設置太小,很難保證網絡快速收斂;如果設置過大,又會占用太大的內存空間。因此,在綜合考量后,結合指紋處理的實際,將batch_size的值設定100。除此之外,為了有效激活神經元,還需要對negative_slope參數進行初始化,在參考相關文獻和多次試驗的基礎上,本文最終將negative_slope設置為0.01。
本試驗是在Ubuntu操作系統下進行的,具體硬件配置為:處理器(型號:i7-8750H;速度:2.2GHz;核心:6核)、內存(容量:8G+8G;插槽數量:2 x SO-DIMM)、硬盤(容量:1T;轉速:7200轉/分鐘;接口類型:M.2接口)、顯存(獨顯;芯片:GTX1070;容量:獨立8GB)。
在試驗中,針對不同的網絡結構進行了對比試驗,具體網絡結構有:五層雙分支、五層雙通道、八層雙分支、八層雙通道。通過測試發(fā)現,采用八層并將雙通道圖像作為輸入所得結果最好,其輸出指標數據為:訓練集loss為0.001236,測試集loss為0.001477,整個訓練時間為1671.373秒。
在深度學習中,網絡層數越多,網絡結構的表達能力就越強,但是從時間上來看,訓練持續(xù)的時間會更長。在多次測試調優(yōu)的過程中,針對不同的網絡結構,在不同參數設置對比后發(fā)現,初次學習率設置為0.16,收斂會有更好的效果。綜合來看,通過卷積神經網絡,可以實現指紋圖像配準過程中的角度旋轉以及平移等操作,而且從學習的時間來看,圖像數據集越大,深度學習的優(yōu)勢體現得就會越充分。
近年來,在信息技術的輔助下,指紋識別的研究取得了可喜的成績,但也存在精度不高等問題。為了彌補傳統指紋識別的缺陷,高分辨率的指紋識別得到推廣。本文針對兩幅圖像平移和旋轉的配準問題,采用卷積神經網絡進行圖像數據的學習,在構建有效網絡結構的基礎上,通過不同網絡的對比和參數的調優(yōu),成功降低了網絡的loss,充分體現了卷積神經網絡在大數據量下的數據處理優(yōu)勢。