吳坤帥,魏仲慧,何 昕,李佩君
(1. 中國(guó)科學(xué)院 長(zhǎng)春光學(xué)精密機(jī)械與物理研究所,吉林 長(zhǎng)春 130033;2. 中國(guó)科學(xué)院大學(xué), 北京 100049;3. 中國(guó)人民解放軍63850部隊(duì),吉林 白城 137000)
簽名是一項(xiàng)方便快速的個(gè)人身份認(rèn)證方式,具有使用簡(jiǎn)單方便和簽名特征穩(wěn)定可區(qū)分等優(yōu)點(diǎn),應(yīng)用范圍廣泛。由于個(gè)人簽名容易被刻意偽造,因此簽名筆跡檢測(cè)科學(xué)也隨之誕生,而計(jì)算機(jī)技術(shù)的高速發(fā)展,筆跡識(shí)別科學(xué)逐步進(jìn)入與計(jì)算機(jī)技術(shù)緊密結(jié)合的新時(shí)代。使用計(jì)算機(jī)進(jìn)行簽名識(shí)別有著速度快和數(shù)據(jù)量大的優(yōu)點(diǎn),適合于對(duì)大量簽名進(jìn)行初步的篩選,給出一份或者數(shù)份待選的正確結(jié)果,節(jié)省人力和物力。簽名識(shí)別技術(shù)一般包括圖像預(yù)處理,特征提取,特征分類3個(gè)組成部分。近年來,國(guó)內(nèi)外的學(xué)者進(jìn)行了大量理論研究和實(shí)際探索,提出了許多巧妙的識(shí)別方法,并取得了一定的成果。
Ferrer等在不同背景污染的情況下,提取簽名圖像的局部二值模式(Local Binary Pattern, LBP)特征用于識(shí)別[1]。Ferrer等的樣本大多是在書寫在發(fā)票及支票等常用書寫載體上,污染多為下劃線和水印等常見污染,此研究與現(xiàn)實(shí)應(yīng)用場(chǎng)景相近,有很高的應(yīng)用價(jià)值,但對(duì)熟練仿寫的簽名鑒別效果有限。Okawa使用視覺詞袋模型結(jié)合KAZE算法和VLAD(Vector of Locally Aggregated Descriptors)來研究簽名識(shí)別。Okawa結(jié)合了計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)最新算法到簽名識(shí)別之中,大大提高了識(shí)別的正確率,對(duì)偽隨機(jī)簽名數(shù)據(jù)集的識(shí)別率達(dá)到最先進(jìn)的水平。但是其數(shù)據(jù)集包含了較多隨機(jī)簽名的原因,分辨難度低,應(yīng)用價(jià)值有限[2-3]。Cui等使用AlexNet進(jìn)行簽名識(shí)別,總正確率為87.5%。他直接使用神經(jīng)網(wǎng)絡(luò)提取并進(jìn)行分類,避免了人工選擇特征,但神經(jīng)網(wǎng)絡(luò)需要的簽名數(shù)據(jù)量較大,現(xiàn)實(shí)生活中很難滿足[4]。Maergner等使用圖編輯距離(Graph Edit Distance)度量?jī)蓚€(gè)簽名的相似度,并使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,在公共數(shù)據(jù)集GPDS的隨機(jī)偽簽名集上取得了很高的識(shí)別正確率,但在熟練簽名集上的效果明顯差于隨機(jī)簽名集[5]。祖麗皮亞使用統(tǒng)計(jì)特征研究維吾爾簽名的識(shí)別,統(tǒng)計(jì)不同方向上的像素點(diǎn)的數(shù)目作為特征特征向量。統(tǒng)計(jì)特征提取簡(jiǎn)單快速,實(shí)現(xiàn)方便,提高了識(shí)別的速度,但需要大量的訓(xùn)練數(shù)據(jù)才能達(dá)到良好的識(shí)別效果[6]。
雖然目前的研究取得了一定的成果,但依然存在一些問題:盡管使用了不同的數(shù)據(jù)集、特征、分類器以及正確率評(píng)判的標(biāo)準(zhǔn),國(guó)內(nèi)外大多數(shù)的簽名識(shí)別方案的識(shí)別成功率在85%~95%之間(錯(cuò)誤率在5%~15%)[7-12],使用熟練簽名集的正確率要明顯低于使用偽隨機(jī)簽名集的正確率,要達(dá)到較高的識(shí)別正確率則需要大量的訓(xùn)練數(shù)據(jù)。而在現(xiàn)實(shí)生活中,需要我們識(shí)別的大多是熟練仿寫的簽名,許多情況下我們能獲取的簽名數(shù)據(jù)也是有限的。
在計(jì)算機(jī)簽名識(shí)別中,簽名識(shí)別的成功率不會(huì)無限地提升,它存在一個(gè)上限。計(jì)算機(jī)通過計(jì)算待識(shí)別樣本和真實(shí)簽名的特征相似程度,給出真?zhèn)闻袛啵哪7碌暮灻c真實(shí)簽名的相似度甚至可能要高于兩個(gè)真實(shí)簽名之間的相似度。因此,只要研究真實(shí)簽名的書寫規(guī)律,仿寫人就能夠?qū)懗霰M可能與真實(shí)簽名相似的簽名。這也是熟練偽造數(shù)據(jù)集識(shí)別成功率低的原因。二維特征簽名識(shí)別都忽略了筆跡的三維信息,而這些信息是仿寫人難以模仿的。
國(guó)內(nèi)外的研究人員對(duì)筆劃的三維深度特征進(jìn)行過一定的研究,但目前還處于起步階段,大多還未使用深度特征直接進(jìn)行簽名識(shí)別。Furukawa[13-14]采集了大量橫豎撇捺筆劃,發(fā)現(xiàn)同一書寫者筆劃深度之間的差異明顯小于不同書寫者之間的差異,這為深度特征在簽名識(shí)別上的應(yīng)用提供了理論支持,但他還沒有使用完整的簽名進(jìn)行研究。申思[15]等研究了套摹簽名與原始簽名行筆過程中壓痕曲線變化,發(fā)現(xiàn)原始簽名在行筆過程中的極值點(diǎn)位置(反映了行筆筆力的變化)具有一定的穩(wěn)定性,而同一套摹人的套摹簽名之間的極值點(diǎn)位置變化較大。申思的研究證明,摹寫簽名之間的深度特征變化大于原始簽名,這是由個(gè)人書寫習(xí)慣所決定的。目前的研究已經(jīng)證明筆劃三維深度特征中蘊(yùn)含了書寫者的個(gè)人特征,具有進(jìn)行簽名識(shí)別的理論基礎(chǔ)。
本文旨在研究簽名筆劃三維深度特征,對(duì)獲取的簽名筆劃進(jìn)行掃描和去噪處理,提取筆劃的深度信息,在熟練仿寫簽名數(shù)據(jù)集上進(jìn)行分類,證明三維深度特征在簽名識(shí)別上的有效性。
熟練偽造簽名與真實(shí)簽名的二維特征可以非常相似,而三維特征卻難以進(jìn)行模仿。中文漢字中,筆劃?rùn)M、豎、撇、捺的出現(xiàn)頻率很高,在書寫這4個(gè)筆劃的過程中,起筆、行筆以及收筆的力度大致是穩(wěn)定的,是由人的書寫習(xí)慣影響的,包含了個(gè)人的生物學(xué)特征。在其他書寫條件不變的情況下,書寫力度短期內(nèi)不會(huì)發(fā)生較大的改變,因此可以用來識(shí)別書寫者的身份。書寫時(shí)的力度信息屬于動(dòng)態(tài)特征,在離線簽名識(shí)別中,無法獲取書寫者寫下簽名時(shí)的力度信息,但是可以用深度信息來代替力度信息。圖1為簽名識(shí)別系統(tǒng)原理圖,它由顯微鏡掃描系統(tǒng)、簽名預(yù)處理、特征提取以及分類器4個(gè)主要模塊組成。
圖1 簽名識(shí)別系統(tǒng)原理圖Fig.1 Block diagram of signature recognition system
(1)簽名筆劃的采集。簽名筆劃的深度信息需要專業(yè)的掃描設(shè)備,這里使用高精度的體式顯微鏡采集簽名筆劃的表面形態(tài)。顯微鏡的Z軸精度為0.1 μm,一般情況下,筆劃的深度為10~60 μm之間,因此,采集誤差在可接受范圍之內(nèi)。采集到的信息以矩陣的形式等間隔存儲(chǔ)筆劃的表面深度信息,點(diǎn)云相鄰點(diǎn)之間的距離均相等,因此只按順序存儲(chǔ)下點(diǎn)的深度信息,不存位置信息,矩陣的長(zhǎng)和寬分別為筆劃的長(zhǎng)和寬,值為該位置點(diǎn)的深度。筆劃的深度信息存儲(chǔ)方式與灰度圖像的存儲(chǔ)方式類似,因此可以將深度信息當(dāng)作圖像來處理,作為筆劃的深度圖像。
(2)噪聲去除。采集到的筆劃表面形態(tài)帶有噪聲,需要先進(jìn)行濾波。深度圖像中的噪聲主要來源于機(jī)器運(yùn)轉(zhuǎn)時(shí)的微小振動(dòng),屬于隨機(jī)噪聲。我們參考圖像處理中圖像去噪的方法過濾深度圖像的隨機(jī)噪聲。高斯濾波是一種線性平滑濾波,對(duì)于濾去圖像中的高斯或近高斯噪聲有著非常好的效果。根據(jù)國(guó)際標(biāo)準(zhǔn)ISO11562規(guī)定,當(dāng)使用高斯濾波器作為建立表面輪廓基準(zhǔn)線的濾波器時(shí),規(guī)定的權(quán)函數(shù)為:
(1)
(2)
其中:λc為截止波長(zhǎng),λ=λc時(shí),濾波器的阻尼系數(shù)為0.5。二維的高斯卷積核由水平和垂直方向的卷積和直接卷積而來:
s2D(x,y)=sx(x)?sy(y),
(3)
在頻域上表現(xiàn)為:
S2D(X,Y)=Sx(X)·Sy(Y).
(4)
深度圖像與高斯濾波器進(jìn)行卷積,得到去除噪聲的圖像F(X,Y) 。
F(X,Y)=Fo(X,Y)·S2D(X,Y).
(5)
進(jìn)行深度圖像采集時(shí)發(fā)現(xiàn),除了噪聲外,紙面粗糙度也會(huì)對(duì)特征提取造成一定的影響。常見書寫紙一般表面不平整,還帶有一定的紙質(zhì)纖維和雜質(zhì)。這造成在未書寫的情況下,紙面的峰-谷可能會(huì)達(dá)到幾微米,這已經(jīng)與較輕的筆劃造成的深度相近了。通常情況下,這些粗糙點(diǎn)都是凸出紙面的,影響最高點(diǎn)的選取。因此我們?cè)谘毓P劃?rùn)M截面上,選擇橫截面平均值與最低值的差作為該截面的高度,并計(jì)算整個(gè)筆劃的深度,即:
(6)
通過式(6)可得到沿筆劃方向的深度矩陣,矩陣的長(zhǎng)度為筆劃的長(zhǎng)度。深度矩陣維數(shù)較大,不適合直接用作特征分類,還需要進(jìn)一步處理,選擇深度矩陣的統(tǒng)計(jì)特征作為筆劃的深度特征。常用的使用統(tǒng)計(jì)特性有平均值、標(biāo)準(zhǔn)差和矩陣的熵3種。筆劃深度的平均值反映了筆劃在行筆過程中的平均力度;沿筆劃方向的深度標(biāo)準(zhǔn)差反映了行筆過程中的力度變化;深度矩陣的熵是圖像處理和計(jì)算機(jī)視覺學(xué)科中度量圖像紋理隨性的一個(gè)常用特征,用來度量深度矩陣的隨機(jī)性。深度平均值一致的兩個(gè)筆劃,在行筆上也可能不同,這樣他們的熵值就有所區(qū)別。當(dāng)深度矩陣中的數(shù)值差異較大時(shí),熵的值就會(huì)小,當(dāng)深度矩陣中所有值一致時(shí),熵值取最大值[16]。以上3個(gè)特征分別由以下公式計(jì)算:
(7)
(8)
(9)
上式中,N為筆劃的采集行數(shù)。將一個(gè)簽名的所有筆劃提取的統(tǒng)計(jì)特征合在一起,作為簽名的完整深度特征。
傳統(tǒng)簽名識(shí)別中廣泛運(yùn)用的分類方法有支持向量機(jī)(Support Vector Machine,SVM),K-近鄰分類(K-Nearest Neighbor, KNN)以及人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)等。由于不同的數(shù)據(jù)集在不同分類器上的效果各有優(yōu)劣,因此我們同時(shí)使用這3種分類器來進(jìn)行分類,尋找最適合我們樣本的分類器。
2.3.1 SVM
SVM 是一種成熟的特征分類算法。在本實(shí)驗(yàn)中,它的目的是尋找一個(gè)超平面,將不同書寫者簽名的深度特征向量,以最大的間隔分類在超平面兩側(cè)。距離超平面最近的點(diǎn)稱為支持向量。最靠近超平面的數(shù)據(jù)點(diǎn)與超平面之間的距離越大,分類效果越好。
2.3.2 KNN
K-近鄰算法是機(jī)器學(xué)習(xí)中簡(jiǎn)單有效的分類算法,它計(jì)算待測(cè)樣本特征向量與已知簽名庫(kù)特征向量之間的距離,并選舉出K個(gè)最相鄰的數(shù)據(jù),通過統(tǒng)計(jì)這些數(shù)據(jù)的標(biāo)簽,得到樣本的歸屬判斷。KNN參數(shù)較少,實(shí)現(xiàn)方便,適合在樣本較少的情況下使用。它的主要流程如下:
(1)計(jì)算待分類簽名特征向量與簽名庫(kù)簽名特征向量之間的距離,并按照遞增排序;
(2)選取K個(gè)最相鄰的數(shù)據(jù);
(3) 統(tǒng)計(jì)這K個(gè)數(shù)據(jù)的標(biāo)簽出現(xiàn)次數(shù),并得到出現(xiàn)頻次最高的數(shù)據(jù)樣本,即為待測(cè)樣本的預(yù)測(cè)分類。
2.3.3 ANN
人工神經(jīng)網(wǎng)絡(luò)是用來模擬人類大腦中神經(jīng)元的工作方式的人造模型。1986年,Rumelhar和Hinton等人提出了反向傳播(Backpropagation,BP)算法,它的主要特點(diǎn)是特征向量前向傳遞,而誤差反向傳播,通過不斷修改神經(jīng)網(wǎng)絡(luò)權(quán)重和偏置,使得網(wǎng)絡(luò)的最終輸出與期望輸出盡可能接近,以達(dá)到訓(xùn)練的目的。本實(shí)驗(yàn)中,只使用神經(jīng)網(wǎng)絡(luò)作為分類器,輸入神經(jīng)網(wǎng)絡(luò)的特征是我們上一步提取到的深度特征。
簽名識(shí)別中常用的評(píng)判標(biāo)準(zhǔn)有錯(cuò)誤拒絕率、錯(cuò)誤接受率和錯(cuò)誤率3種,這里我們使用前兩種。并引入總正確率作為兩個(gè)指標(biāo)的綜合評(píng)判標(biāo)準(zhǔn)。
錯(cuò)誤拒絕率(False Rejection Rate, FRR),F(xiàn)RR是真實(shí)簽名當(dāng)作偽造簽名被系統(tǒng)拒絕的概率,即輸入識(shí)別系統(tǒng)的簽名為真實(shí)簽名,考察系統(tǒng)將簽名當(dāng)作是偽造簽名的概率。
(10)
錯(cuò)誤接受率(False Acceptance Rate,F(xiàn)AR),是偽簽名當(dāng)作真實(shí)簽名被系統(tǒng)接受的概率,即輸入識(shí)別系統(tǒng)的簽名為偽造簽名,考察系統(tǒng)將簽名當(dāng)作真實(shí)簽名接受的概率。
(11)
再使用總正確率考察兩個(gè)指標(biāo)的綜合結(jié)果,總正確率以公式(12)求得:
(12)
為了使簽名的二維特征盡可能地相似,偽造簽名使用套摹的方式得到。仿寫人獲得真實(shí)簽名后,經(jīng)過一定的練習(xí),對(duì)真實(shí)簽名進(jìn)行摹寫。真實(shí)簽名與偽造簽名對(duì)比如圖2所示。選取簽名中的長(zhǎng)豎筆劃進(jìn)行三維掃描,獲取深度矩陣,真實(shí)簽名與偽造簽名的對(duì)比如圖所示。我們可以看到,真實(shí)簽名與偽造簽名的二維特征難以用肉眼進(jìn)行區(qū)分,特征很相似,而筆劃的深度特征有明顯的區(qū)別,難以進(jìn)行模仿。
圖2 真實(shí)簽名與套摹簽名對(duì)比。(a)真實(shí)簽名與“帥”字長(zhǎng)豎筆劃的深度走勢(shì)圖;(b)套摹簽名與長(zhǎng)豎深度走勢(shì)圖。Fig2 Real signature versus forgery signature. (a)Real signature and depth chart of the vertical stroke of character “帥”; (b)Forgery signature and the depth chart of the corresponding stroke.
實(shí)驗(yàn)中使用的簽名數(shù)據(jù)是書寫人在平和的條件下寫下的,排除環(huán)境因素對(duì)簽名深度的影響。采集真實(shí)簽名與其熟練仿寫簽名各10個(gè),共計(jì)19組,即380個(gè)簽名。每個(gè)簽名圖像采集5~6個(gè)筆劃,每個(gè)筆劃提取3個(gè)特征(即平均深度,沿筆劃方向深度標(biāo)準(zhǔn)差和深度矩陣的熵),即每個(gè)簽名提取15~18個(gè)特征,真實(shí)簽名及其仿寫簽名采集的筆劃部位一致。
為了防止過擬合,使用數(shù)據(jù)增強(qiáng)增加數(shù)據(jù)集。常用的數(shù)據(jù)增強(qiáng)方法有:翻轉(zhuǎn)、旋轉(zhuǎn)、平移、縮放、裁剪以及增加噪聲。大量的實(shí)驗(yàn)表明,數(shù)據(jù)增強(qiáng)能明顯增加識(shí)別系統(tǒng)的泛化能力和魯棒性,減少錯(cuò)誤識(shí)別率。這里我們使用增加噪聲的方法進(jìn)行數(shù)據(jù)增強(qiáng),將數(shù)據(jù)集擴(kuò)展到原先的兩倍。具體增加數(shù)據(jù)集的方法為:首先使用隨機(jī)數(shù)生成器產(chǎn)生在[-10,10]之間的隨機(jī)矩陣,隨機(jī)矩陣的維數(shù)與簽名圖像的特征維數(shù)一致;將隨機(jī)矩陣乘以一個(gè)噪聲因子,此處設(shè)為0.01,并與原特征矩陣進(jìn)行點(diǎn)乘產(chǎn)生新的帶有噪聲的新的人工簽名特征。新的人工簽名的特征值與原特征值相差在10%以內(nèi)。
3.2.1 筆劃特征對(duì)比
如表1所示,是一組真實(shí)簽名-偽造簽名的單一筆劃特征的對(duì)比,包括該筆劃的平均深度(Stroke Mean)、沿筆劃方向深度標(biāo)準(zhǔn)差(Stroke Std.)和熵(Stroke Entropy)3項(xiàng)。表中顯示的了10個(gè)真實(shí)簽名(或偽造簽名)之間的均值和標(biāo)準(zhǔn)差??梢钥吹?,對(duì)于筆劃1,簽名人和其仿寫者之間,真實(shí)簽名和偽造簽名的3項(xiàng)特征的平均值有一定的差別,偽造簽名的平均深度大于真實(shí)簽名,且真實(shí)簽名的3項(xiàng)特征的標(biāo)準(zhǔn)差均小于偽造簽名,說明真實(shí)簽名的深度更加穩(wěn)定,行筆過程力度穩(wěn)定性好。而仿寫人由于刻意模仿筆劃的軌跡,行筆力度變化較大,因此簽名間的力度變化較大,深度差異大。筆劃2,是由另一個(gè)簽名人的簽名中的某一筆劃及其仿寫筆劃的特征??梢钥吹?,簽名人的筆劃深度小于仿寫人,且其特征的標(biāo)準(zhǔn)差也比較大,說明簽名人簽名力度較大,且力度變化范圍大,而仿寫人仿寫時(shí)下筆較輕且沉穩(wěn)。這兩個(gè)筆劃特征的對(duì)比中可以看出,簽名筆劃深度的特征值大小和穩(wěn)定度并不絕對(duì)與筆劃是正常情況下書寫或刻意仿寫相關(guān),而是簽名人和仿寫人的習(xí)慣相關(guān)。這與現(xiàn)實(shí)情況相吻合,不同人在簽名或者是仿寫時(shí),下筆的力度都會(huì)下意識(shí)遵循自己的習(xí)慣,因而與他人有所區(qū)別。
表1 真實(shí)簽名與偽造簽名筆劃特征對(duì)比Tab.1 Contrast on stroke features of real and forgery signature
續(xù) 表
3.2.2 熟練簽名集分類
在原始熟練簽名數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),將數(shù)據(jù)集隨機(jī)分為訓(xùn)練集和測(cè)試集,訓(xùn)練集占總體實(shí)驗(yàn)數(shù)據(jù)的比例(Training Rate, T_R)為0.5。提取到的特征分別使用支持向量機(jī)、K-近鄰分類器以及神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。實(shí)驗(yàn)結(jié)果如表2所示。從表2中可以得到,SVM、KNN以及ANN3個(gè)分類器的識(shí)別正確率分別為91.686%、97.393%以及95.209%。3個(gè)結(jié)果均高于90%,其中KNN分類器的結(jié)果達(dá)到了97.393%,高于傳統(tǒng)二維簽名識(shí)別85%~95%的正確率。這說明了筆劃的深度特征對(duì)于熟練簽名的識(shí)別具有優(yōu)秀的效果。
表2 不同訓(xùn)練比例和分類器下的簽名分類結(jié)果
Tab.2 Recognition rates of signature with different classifier and training rate
T_R0.50.40.3SVMFRR13.4028.7729.023FAR3.2266.1408.271ORR91.68692.54491.353K-NNFRR2.2737.0189.023FAR2.9413.5094.511ORR97.39394.73693.233ANNFRR6.5228.77212.030FAR3.0612.6324.511ORR95.20994.29891.730
在現(xiàn)實(shí)的應(yīng)用中,進(jìn)行簽名識(shí)別時(shí),我們能獲得簽名樣本一般都是有限的,需要保證在較少的訓(xùn)練樣本下也有不錯(cuò)識(shí)別效果。降低訓(xùn)練比例至0.4和0.3并進(jìn)行重復(fù)試驗(yàn),從表2中可以看到,減少樣本訓(xùn)練數(shù)據(jù)量情況下,3個(gè)分類器的識(shí)別正確率依然保持在90%以上,可以認(rèn)為識(shí)別系統(tǒng)在較少的訓(xùn)練數(shù)據(jù)下依然能保持較高的識(shí)別正確率。此外,訓(xùn)練數(shù)據(jù)的量較少,也導(dǎo)致了SVM和ANN這類參數(shù)較多的分類器無法充分排除所有誤差,而KNN的參數(shù)較少,受到的影響相對(duì)小一些,因而,KNN的識(shí)別正確率要高于另外兩個(gè)分類器。
3.2.3 數(shù)據(jù)增強(qiáng)后的實(shí)驗(yàn)結(jié)果
表3是原始簽名數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)后的實(shí)驗(yàn)結(jié)果。表3顯示,數(shù)據(jù)增強(qiáng)可以有效提高系統(tǒng)的簽名識(shí)別正確率,SVM、KNN和ANN三分分類方式的最高分類結(jié)果分別為: 96.108%、98.690%和97.378%。3項(xiàng)正確率分別相對(duì)于未進(jìn)行數(shù)據(jù)增強(qiáng)前上升了3.564%、1.297%和2.169%。數(shù)據(jù)增強(qiáng)后分類正確率的增加,是因?yàn)閿?shù)據(jù)集增加的同時(shí),訓(xùn)練數(shù)據(jù)也增加了。由于一般手寫簽名數(shù)據(jù)集的個(gè)數(shù)有限,數(shù)據(jù)增強(qiáng)是一個(gè)簡(jiǎn)單有效的增加實(shí)驗(yàn)數(shù)據(jù),提升分類正確率的方法。
同時(shí)對(duì)比表2和表3可以發(fā)現(xiàn),隨著訓(xùn)練集比例的增加,分類總體正確率有上升的趨勢(shì),這也說明了訓(xùn)練集越大,訓(xùn)練越充分,分類結(jié)果越高。
表3 數(shù)據(jù)增強(qiáng)后簽名分類結(jié)果
Tab.3 Recognition rates of signature after data augmentation
T_R0.50.40.3SVMFRR2.1746.2994.887FAR5.6104.8007.895ORR96.10894.45193.609K-NNFRR1.0750.8851.880FAR1.5463.0432.256ORR98.69098.03697.932ANNFRR0.4970.4412.226FAR7.8214.8035.263ORR95.84197.37896.256
3.2.4 與其他算法的對(duì)比
表4是本文算法與其他常用的簽名識(shí)別算法對(duì)比結(jié)果。從表中可以看出,本文提出的算法的FRR和FAR均比較小,性能優(yōu)于大多數(shù)的傳統(tǒng)算法,只略差于文獻(xiàn)[3]中的算法,表明了本文算法在簽名識(shí)別方面具有優(yōu)秀的性能。
表4 不同算法的分類結(jié)果對(duì)比Tab.2 Performance comparison on different algorithm
本文針對(duì)熟練偽造簽名識(shí)別正確率低的現(xiàn)狀,提出了基于筆劃三維深度特征的簽名識(shí)別方法,并收集了真實(shí)簽名和熟練偽造簽名數(shù)據(jù)集,偽造簽名通過套摹方式獲得,使用數(shù)據(jù)增強(qiáng)擴(kuò)充了數(shù)據(jù)集。簽名特征使用了筆劃深度的平均值、沿筆劃方向標(biāo)準(zhǔn)差和深度的熵3個(gè)統(tǒng)計(jì)量。實(shí)驗(yàn)結(jié)果表明,筆劃三維深度特征能有效識(shí)別熟練偽造簽名,在KNN分類器上,簽名識(shí)別正確率最高達(dá)到了98.69%,F(xiàn)RR、FAR優(yōu)于大多數(shù)傳統(tǒng)算法,具有優(yōu)秀的識(shí)別性能。