• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      利用VGGnet對印章印文分類識別的適用條件研究*

      2019-09-04 05:41:24郝紅光韓星周
      通信技術(shù) 2019年7期
      關(guān)鍵詞:印文印章次數(shù)

      張 倩 ,郝紅光 ,韓星周

      (1.中國人民公安大學,北京 100038;2.公安部物證鑒定中心,北京 100038)

      0 引 言

      印章印文的檢驗在文件檢驗工作中占較大比例,面對檢驗鑒定的工作量日益增長,蓋印條件、樣本提取質(zhì)量多樣化等情況,在大數(shù)據(jù)時代中,利用計算機作為輔助檢驗方法進行印章印文自動識別是當前學術(shù)研究的熱點。卷積神經(jīng)網(wǎng)絡(luò)作為一種出色的識別工具,具備優(yōu)秀的自主學習能力和適應(yīng)性,使得利用卷積神經(jīng)網(wǎng)絡(luò)對印章印文自動識別成為可能。

      1 卷積神經(jīng)網(wǎng)絡(luò)

      卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)Υ罅繄D像數(shù)據(jù)集進行學習并自動提取特征進行圖像分類識別。目前已在文本情感分析[1]、人臉識別[2]、圖像檢索[3]、字符識別[4]、筆跡識別[5]等領(lǐng)域中得到應(yīng)用。如Ling Ding通過比對多種分類識別方法的實驗結(jié)果,發(fā)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)對遙感影像的分類準確率最高[6]。R Almodfer等采用卷積神經(jīng)網(wǎng)絡(luò)對阿拉伯語手寫單詞進行識別,獲得了90%以上的精確度[7]。Cui W等證明了卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在離線簽名筆跡檢驗中的可行性,分類的平均準確率達到99.77%[8]。SG Lee等探究卷積神經(jīng)網(wǎng)絡(luò)在韓文字符分類識別中的可行性,平均分類成功率高達90.12%[9]。在計算機軟硬件不斷發(fā)展的推動下,基于前人的開發(fā)研究,使得利用卷積神經(jīng)網(wǎng)絡(luò)作為印文的分類識別方法成為可能。

      在各類卷積神經(jīng)網(wǎng)絡(luò)模型中,VGGnet以優(yōu)秀的適應(yīng)能力和學習能力在2014年Imagenet比賽的分類識別中獲得第二名。較多的卷積神經(jīng)網(wǎng)絡(luò)模型均以VGGnet作為基礎(chǔ)模型應(yīng)用于圖片檢測等任務(wù)中,因此本文選取VGGnet作為實驗模型進行印文的分類識別檢驗。該模型主要有三大部分,分別是卷積層、池化層和全連接層。在卷積層中對輸入的印章印文圖像進行矩陣運算,主要目的是對印章印文的特征進行逐層學習;池化層主要負責對卷積層中輸出的特征值進行降維處理,在整幅圖像像素中強化印文圖像的特征值。全連接層主要對前面步驟中提取的特征值進行分類運算,完成分類結(jié)果的輸出。

      2 實驗設(shè)計

      2.1 實驗目的

      為了更好的利用卷積神經(jīng)網(wǎng)絡(luò)進行印章印文自動識別,以實驗的消耗時間、損失值、識別準確率作為評價指標,探究印文分類識別的適用條件,如樣本量大小、迭代次數(shù)、學習率對識別準確率的影響。

      評價指標中消耗時間是指網(wǎng)絡(luò)開始運行到最終輸出準確率所需要的時間。網(wǎng)絡(luò)模型自主學習得出的分類特征值和真實樣本的特征值之間的差值即為損失值,損失值減小表示學習有效,越小的損失值表示模型正確分類能力越強、檢驗結(jié)果越準確。準確率作為一種十分直觀的優(yōu)劣指標,代表正確分類樣本數(shù)與所有樣本數(shù)的比值。

      訓練樣本量越大網(wǎng)絡(luò)學習的特征越多得到模型的識別能力越強,但制作海量的數(shù)據(jù)庫消耗的工程大且耗時長,在保障較優(yōu)的準確率前提下探究合適大小的樣本數(shù)據(jù)庫將為實際應(yīng)用研究提供參考。迭代次數(shù)是指模型學習完所有樣本的總次數(shù),隨著迭代次數(shù)適度的增加檢測的誤差會逐漸減小同時也會導致訓練時長增多。學習率是指學習過程的步長,影響訓練過程的快慢。學習率過小會使得模型參數(shù)值更新少、訓練時間長、損失值下降緩慢,學習率過大則會導致網(wǎng)絡(luò)只學習印文的局部特征,使得模型對測試樣本的適應(yīng)性較差。因此選擇合適的迭代次數(shù)和學習率是保證訓練的穩(wěn)定性和合理高速率的關(guān)鍵因素之一。

      2.2 實驗條件與樣本設(shè)計

      (1)實驗所用的計算機配置為Windows 10操作系統(tǒng),CPU類型為第六代智能英特爾酷睿i7四核處理器、運行速度為3.4 GHz。內(nèi)存最大支持容量為16 GB,獨立6GB的 GTX 1060顯卡。配置希捷7 200 轉(zhuǎn)/分機械硬盤。

      (2)選取章面內(nèi)容相同的固態(tài)光敏印章、塑膠印章、銅章各一枚,其中塑膠印章和銅章分別以印泥、印油為蓋印介質(zhì),均以十張A4復印紙為襯墊物,在壓力適中條件下蓋印完整的印文樣本。

      (3)使用1 200萬像素的相機以10 cm物距分別單個拍照,提取印文圖像作為訓練和測試的印文數(shù)據(jù)集。

      (4)訓練、測試樣本數(shù)據(jù)集分別設(shè)置如下:

      ①固態(tài)光敏印章蓋印7 000枚印文作為訓練樣本、1 000枚印文作為測試樣本;②塑膠章蘸取印泥、印油分別蓋印3 500枚印文作為訓練樣本,印泥、印油印文各500枚作為測試樣本;③銅章蘸取印泥、印油分別蓋印3 500枚印文作為訓練樣本,印泥、印油印文各500枚作為測試樣本。以上3組印文按照1:1:1等比設(shè)置6種不同大小的訓練樣本數(shù)據(jù)集依次為:21 000、18 000、15 000、12 000、9 000、6 000;測試樣本數(shù)據(jù)集依次為:3 000、1 500、300、150。

      (5)將待輸入的印章印文樣本圖像像素全部統(tǒng)一為224×224大小,采用初始的RGB三通道作為輸入源數(shù)據(jù)。計算機隨機讀取提供的印文樣本圖像,進行批量學習,為了弱化較強的特征數(shù)值對實驗效果的影響,網(wǎng)絡(luò)模型將每個樣本圖像像素減去所有樣本的像素均值,完成樣本圖像數(shù)據(jù)的前處理操作。

      3 實驗結(jié)果與分析

      3.1 樣本量對印章印文分類識別的影響

      設(shè)置學習率為一般推薦值0.001、迭代次數(shù)為10次,改變訓練和測試樣本量的大小,依次進行試驗將得到的準確率、損失值、消耗時間匯總?cè)绫?所示。

      表1 不同樣本量的實驗數(shù)據(jù)匯總

      從表1可見,隨著訓練樣本量的增加檢驗準確率逐漸遞增、損失值下降,同時消耗時間增多;測試樣本量的變化對準確率影響不明顯。以15 000枚印文樣本進行訓練,對300枚印文進行測試得到準確率為99%,損失值為0.0144;以18 000枚印文樣本訓練時,測試準確率提升為100%,損失值降低至0.000 2;以21 000枚印文樣本作為訓練集時準確率保持為100%但消耗時間最多。考慮到制作樣本的工程量和檢驗耗時長短,綜合比較得出選取18 000枚印文作為訓練樣本,對300枚印文進行分類識別的效果最好。

      3.2 迭代次數(shù)對印章印文分類識別的影響

      基于上述實驗結(jié)果,選取18 000枚印文作為訓練數(shù)據(jù)集和300枚印文作為測試數(shù)據(jù)集,學習率設(shè)置為0.001。改變迭代次數(shù),分別設(shè)置5次、10次、15次、20次共四組,試驗得到的準確率、損失值、消耗時間如表2所示。

      表2 不同迭代次數(shù)的實驗數(shù)據(jù)匯總

      從表2中得出,隨著迭代次數(shù)的增多,準確率得到提升至飽和。迭代次數(shù)進一步增多準確率反而降低,迭代次數(shù)越多消耗時間越長。與迭代5次的結(jié)果相比,迭代10次的測試準確率提升為100%,損失值降低至0.000 2,迭代15次的測試準確率為100%但耗時增長。迭代次數(shù)適度的提升能優(yōu)化識別的準確率和損失值,在保證一定準確率的前提下選擇耗時適中的10次迭代條件最為合適。

      3.3 學習率對印章印文分類識別的影響

      基于上述實驗結(jié)果,選取18 000枚印文樣本作為訓練集和300枚印文樣本作為測試集,迭代次數(shù)設(shè)置為10次。依次遞減改變學習率為0.1、0.01、0.001、0.000 1,實驗數(shù)據(jù)匯總?cè)绫?所示。

      表3 不同學習率的實驗數(shù)據(jù)匯總

      從表3中得出,學習率降低準確率會得到提升,同時消耗時間增大。在0.1的學習率下無準確率輸出,損失值的輸出變?yōu)椤癗AN”表示學習失敗;學習率降低為0.01時訓練恢復正常,得到98.67%的準確率;在0.001的學習率下準確率提升到100%,損失值縮減至0.000 2,再次降低學習率的結(jié)果優(yōu)化不明顯且耗時增大。

      網(wǎng)絡(luò)模型通過每層的誤差梯度來決定更新模型參數(shù)的大小,學習率增大使得網(wǎng)絡(luò)參數(shù)大幅度更新而不穩(wěn)定最終會導致學習失敗,適當?shù)慕档蛯W習率能緩解該問題,但同時增大了訓練耗時。選取0.001的學習率能取得100%的準確率且消耗時間較為適中,為實驗適用條件。

      4 結(jié) 語

      實驗結(jié)果表明在0.001學習率、迭代10次、以18 000枚印文作為訓練樣本的條件下,訓練得到的VGGnet模型對300枚印文進行檢測,能得到100%的準確率且損失值小。證明了借助卷積神經(jīng)網(wǎng)絡(luò)VGGnet作為輔助手段對印章印文分類識別具備可行性。

      猜你喜歡
      印文印章次數(shù)
      我終于有了自己的印章
      我們有印章咯
      大灰狼畫報(2022年4期)2022-06-05 07:13:16
      機場航站樓年雷擊次數(shù)計算
      2020年,我國汽車召回次數(shù)同比減少10.8%,召回數(shù)量同比增長3.9%
      商用汽車(2021年4期)2021-10-13 07:16:02
      一類無界算子的二次數(shù)值域和譜
      基于印文印跡特征判別印章類型技術(shù)的研究
      法制博覽(2020年19期)2020-07-01 12:12:04
      淺談司法鑒定中手工制作硬質(zhì)印章因蓋印條件不同而形成的差異
      自制橡皮印章
      童話世界(2017年14期)2017-06-05 09:13:49
      依據(jù)“次數(shù)”求概率
      印章
      宜兰县| 海宁市| 育儿| 广宁县| 沅陵县| 册亨县| 九龙坡区| 商洛市| 久治县| 微山县| 商河县| 商城县| 宁乡县| 桐柏县| 天门市| 普宁市| 项城市| 中阳县| 车致| 高陵县| 锡林浩特市| 桐乡市| 丘北县| 安新县| 怀柔区| 满城县| 松潘县| 永德县| 西昌市| 常山县| 新化县| 冷水江市| 民勤县| 阿拉善右旗| 绍兴县| 陇南市| 双鸭山市| 清新县| 久治县| 吉隆县| 玉环县|