• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)字圖像處理的字跡識(shí)別技術(shù)

      2019-10-11 01:38:20陳錦玉
      電子制作 2019年18期
      關(guān)鍵詞:傅立葉字跡端點(diǎn)

      陳錦玉

      (北京市第四中學(xué),北京,100043)

      0 引言

      字跡識(shí)別是對(duì)人通過(guò)落筆形成的字跡進(jìn)行鑒別和分析的活動(dòng),也叫筆跡鑒定[1]。不論年齡大小,在一定時(shí)間內(nèi),人的書(shū)寫(xiě)習(xí)慣都會(huì)具有一定的特征性和穩(wěn)定性,并反映在字跡中。通過(guò)對(duì)筆跡的觀察和分析,可以分辨出文件中的字跡來(lái)自于幾個(gè)人,是否是本人所寫(xiě),利用筆跡進(jìn)行一個(gè)人身份的認(rèn)定,查證文件的真?zhèn)?。在一般鑒定中,要先了解案件的大致情況,明確鑒定的要求;再觀察分析筆跡有無(wú)異樣,有無(wú)偽裝或因?yàn)槠渌蚨鴮?dǎo)致的字跡問(wèn)題;然后要選擇能反映出本人書(shū)寫(xiě)的穩(wěn)定的習(xí)慣的特征;最后,將選材中的特征和樣本中提取出的特征進(jìn)行比較,找出相同點(diǎn)和問(wèn)題點(diǎn)并制做鑒定書(shū),提出問(wèn)題點(diǎn)形成原因的綜合評(píng)斷并提出意見(jiàn)[2]。

      字跡識(shí)別作為人們的另一種身份證明,應(yīng)用廣泛,每年約幾萬(wàn)個(gè)案件涉及字跡識(shí)別技術(shù),在生活中也常用到[3]。但相對(duì)于人臉識(shí)別、指紋識(shí)別等,字跡識(shí)別技術(shù)的發(fā)展和應(yīng)用并沒(méi)有受到太多重視[4],無(wú)論是在刑事案件上還是民事訴訟上,一旦需要字跡鑒定都只能到司法機(jī)關(guān)鑒定,且需要一年的時(shí)間才能出鑒定結(jié)果。過(guò)程之長(zhǎng)增加了很多問(wèn)題的復(fù)雜度。本文將利用計(jì)算機(jī)代替人工鑒定,使字跡識(shí)別過(guò)程更快更準(zhǔn)確。

      因?yàn)楝F(xiàn)階段大部分字跡識(shí)別還仍靠字跡專(zhuān)家觀察鑒定,于是就存在字跡識(shí)別的主觀臆斷、人才短缺、酬金過(guò)高、申請(qǐng)流程復(fù)雜、分析時(shí)間過(guò)長(zhǎng)等問(wèn)題。專(zhuān)家鑒定這種人為觀察判斷很容易受主觀心理的影響而使分析結(jié)果有一定的偏差,而現(xiàn)階段國(guó)內(nèi)字跡專(zhuān)家人數(shù)相對(duì)較少,不能保證技術(shù)的全覆蓋和便利性,這一點(diǎn)對(duì)民眾來(lái)說(shuō)也是極大的困擾。如,很多人因?yàn)榻杩罘讲怀姓J(rèn)欠條上的簽名是自己簽的而拿不回應(yīng)得的借款,若他們拿欠條去做鑒定,更是需要長(zhǎng)達(dá)一年的時(shí)間才能得到結(jié)果,很多人因此放棄打官司,使不法分子逍遙法外,而為了保證質(zhì)量,人工鑒別必須需要大量重復(fù)性工作來(lái)驗(yàn)證結(jié)論。而如今隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展,特別是圖像處理技術(shù)的日益成熟,為字跡識(shí)別與鑒定提供了條件良好的基礎(chǔ)。

      結(jié)合上述問(wèn)題,通過(guò)了解和研究后,本文考慮到可以用圖像處理的方式來(lái)解決這個(gè)問(wèn)題,這樣就能夠極大地解決在字跡識(shí)別方面出現(xiàn)的很多問(wèn)題?,F(xiàn)階段對(duì)于基于圖像處理的字跡識(shí)別技術(shù)方面的研究相對(duì)較少,大多數(shù)是從整體到局部分析筆畫(huà)間的結(jié)構(gòu),用紋理分析法獲得全局特征,從特征字的比較提取局部特征的方法,把整體和局部特征進(jìn)行整合綜合決策。本文也將運(yùn)用圖像預(yù)處理法,結(jié)合構(gòu)建大數(shù)據(jù)數(shù)據(jù)庫(kù)的方法,通過(guò)筆記采集的方式采集樣本,提供后臺(tái)的數(shù)據(jù)支持。在后續(xù)的技術(shù)完善中,我們構(gòu)想將這些技術(shù)編入APP 或設(shè)備中,直接通過(guò)設(shè)備拍攝圖像,直接鑒別,做到速度更快,成本更低。

      基于圖像預(yù)處理的字跡識(shí)別技術(shù)將一定程度上解決國(guó)內(nèi)字跡識(shí)別主觀臆斷、專(zhuān)家短缺和流程復(fù)雜的問(wèn)題,極大地便利了各地警方破案的效率。同時(shí),在民事訴訟方面,如在借條、合同造假等問(wèn)題的分析和解決上更是提供了捷徑,加快了法律流程的速度,使人民積極參與法律活動(dòng),更便利快捷和有效地維護(hù)自身利益。本文運(yùn)用大數(shù)據(jù)分析法,通過(guò)筆記采集的方式,利用計(jì)算機(jī)更快捷有效地解決問(wèn)題。在此之后,我們可以構(gòu)建全國(guó)字跡大數(shù)據(jù)數(shù)據(jù)庫(kù),錄入每個(gè)人的字跡,使之成為繼臉部識(shí)別、指紋識(shí)別后,又一個(gè)認(rèn)證身份的有力證據(jù)。

      1 圖像預(yù)處理

      1.1 圖像拍攝與灰度化

      由于獲取圖像的工具或手段的影響,最開(kāi)始得到的圖像會(huì)受到多種條件的限制和不同的干擾,一般不能直接使用,必須要在視覺(jué)信息處理的早期階段對(duì)原始圖像進(jìn)行灰度化處理、二值化處理等的矯正,使矯正后的圖像選擇性地體現(xiàn)原始圖像上的信息,濾掉影響因素,增強(qiáng)某些對(duì)于往后的處理中比較重要的圖像特征。因此圖像預(yù)處理就顯得尤為重要,本文也將先運(yùn)用灰度化、二值化的方法對(duì)圖片進(jìn)行初步處理。

      灰度化處理是指,使具有色彩的圖像轉(zhuǎn)化成灰度圖像的過(guò)程。在彩色圖像中,每一個(gè)像素的色彩都取決于R、G、B 三個(gè)分量,其中,每個(gè)分量都另有255 個(gè)中值可以取到,這樣處理后,每個(gè)像素點(diǎn)就有255*255*255 種變化范圍變化色彩。灰度圖像就是由相同的這三個(gè)分量組成的一種特殊的圖像,其中,像素點(diǎn)的變化范圍就有255 種。雖然灰度化后的圖像在原圖的基礎(chǔ)上改變了大部分的色彩,但它同樣可以反映圖像整體和局部的色度和亮度等級(jí)的分布特征。因?yàn)镽、G、B 三個(gè)分量代表的是彩色值,我們需要將它們轉(zhuǎn)化成灰白圖像。這里,我們采用RGB 和HIS 的轉(zhuǎn)換,在算法中,HIS 和RGB 的轉(zhuǎn)換公式如下:

      在公式(1)中采用了加權(quán)平均法進(jìn)行灰度化。

      灰度化處理圖片的方法有很多:①分量法(做三個(gè)灰度圖像,灰度值分別選取原圖中的三個(gè)分量的亮度,再根據(jù)需要選一幅圖像)。②最大值法(灰度值采用三個(gè)分量中亮度的最大值)。③平均值法(灰度值采用三個(gè)分量亮度的平均值)。④加權(quán)平均法(灰度值選取三個(gè)分量亮度的加權(quán)平均)。本文運(yùn)用第三種平均值法,希望能快速簡(jiǎn)易并合理地處理圖像,并結(jié)合灰度拉伸技術(shù),使圖像的細(xì)節(jié)更加突出。

      圖像二值化(Image Binarization)指將整個(gè)圖像呈現(xiàn)出明顯的黑白效果的過(guò)程,也就是將圖像上的像素點(diǎn)的灰度值設(shè)置為0 或255。經(jīng)過(guò)二值化處理過(guò)后的圖像在關(guān)于字跡識(shí)別的圖像處理中同樣地位重要,經(jīng)過(guò)二值化處理后,圖像中的數(shù)據(jù)量大幅度降低,因此,處理后的圖像輪廓更鮮明。

      1.2 圖像的濾波去噪

      對(duì)于經(jīng)過(guò)灰度化和二值化處理后的圖像,為了減少圖像灰度的尖銳變化,減小噪聲,在字跡識(shí)別的圖像處理過(guò)程中,圖像的濾波去噪技術(shù)同樣是一個(gè)重要的步驟。通過(guò)圖像的濾波去噪,可以更便于觀察。如今圖像濾波去噪有很多途徑值得參考:運(yùn)用均值濾波器、中值濾波器、最大值濾波器、最小值濾波器。通過(guò)對(duì)比可以發(fā)現(xiàn):最大值濾波器和最小值濾波器都存在一定程度上忽略細(xì)節(jié)的問(wèn)題,最大值濾波器使圖片過(guò)亮,最小值濾波器使圖像更暗,兩者都造成了很大程度上的失真,而對(duì)于均值濾波器來(lái)說(shuō)更是存在邊緣模糊的問(wèn)題。這些問(wèn)題看似很小,但在字跡識(shí)別,一個(gè)比較注重細(xì)節(jié)的問(wèn)題上卻會(huì)造成很大的影響。對(duì)比下來(lái),用中值濾波器進(jìn)行濾波去噪雖然也存在忽略細(xì)節(jié)的問(wèn)題,相對(duì)于這兩種算法,中值濾波器忽略的細(xì)節(jié)會(huì)相對(duì)少一點(diǎn),失真也沒(méi)有那么嚴(yán)重。同時(shí)中值濾波器在邊緣上也比均值濾波器清晰。于是,通過(guò)對(duì)比,本文將運(yùn)用中值濾波器來(lái)處理字跡圖像。中值濾波器的原理就是將各個(gè)顏色點(diǎn)排序,在一個(gè)特定的范圍中取中值,使這個(gè)特定范圍中的顏色點(diǎn)都和中值顏色一樣。在中值濾波器中,有3*3、5*5、9*9、15*15、35*35 的處理,為了減少圖像模糊的問(wèn)題,我們選用3*3 的處理方法。

      1.3 圖像的歸一化

      圖像歸一化,顧名思義,就是將圖像的格式統(tǒng)一,讓它轉(zhuǎn)換成有一固定標(biāo)準(zhǔn)形式的圖片的過(guò)程,而這種處理后的圖像就被稱(chēng)作是歸一化的圖像。最開(kāi)始的圖像在經(jīng)過(guò)了幾步特殊的處理后就能成為副本圖像,而標(biāo)準(zhǔn)圖像就是由這些圖像經(jīng)過(guò)相同參數(shù)的圖像歸一化處理后得到的。

      在字跡識(shí)別方面,我們需要應(yīng)用圖像歸一化來(lái)調(diào)整字跡和字跡之間的間距和行距,使字跡看起來(lái)更工整,也更方便對(duì)字跡進(jìn)行特征的提取和對(duì)比。

      2 字跡特征提取識(shí)別

      2.1 建立字跡數(shù)據(jù)庫(kù)

      為提取字跡特征,首先需要用建立數(shù)據(jù)庫(kù)對(duì)各種已知出處的筆跡進(jìn)行歸納整理。本文事先采集了五十個(gè)不同出處的字跡原件,形成一個(gè)小型數(shù)據(jù)庫(kù)。為了更方便更快捷地從數(shù)據(jù)庫(kù)中找到對(duì)應(yīng)的字跡,在處理時(shí)我們會(huì)先將數(shù)據(jù)庫(kù)中的字跡原件進(jìn)行先一步分類(lèi),提高處理效率。

      首先通過(guò)整體紋理,再通過(guò)漢字局部識(shí)別。在實(shí)驗(yàn)中,選取了50 個(gè)不同的字跡,建數(shù)據(jù)庫(kù),從中隨機(jī)選取一個(gè)作為待識(shí)別的字跡。對(duì)于字跡紋理識(shí)別,我們選用分類(lèi)的方法,在處理前將收集到的字跡分成三類(lèi):左傾、右傾、豎直。經(jīng)過(guò)紋理識(shí)別后可提前獲知被分配的類(lèi)別以減少后續(xù)工作量。

      傅立葉變換也稱(chēng)傅氏變換,是一種常用的信號(hào)分析方法,它可以分析信號(hào)的成分,也可以用來(lái)合成信號(hào),傅立葉變換選用了正弦波作為信號(hào)的成分。傅立葉變換在概率學(xué)、聲學(xué)、海洋學(xué)、密碼學(xué)、結(jié)構(gòu)動(dòng)力學(xué)等領(lǐng)域都有著廣泛的作用,甚至可以將一首曲譜用波的形式來(lái)表示。

      通過(guò)傅立葉公式,將圖像信號(hào)變成頻率信號(hào),再處理后得到p 值。它的大小及方向能體現(xiàn)紋理的大小與粗細(xì),體現(xiàn)圖像的排列規(guī)律。在頻率域圖像分析法中,用傅立葉特征來(lái)分析圖像紋理是一種典型方法。研究者們經(jīng)常用研究譜成分的方法來(lái)研究它的物理意義。具體公式如下:

      經(jīng)過(guò)傅立葉公式轉(zhuǎn)換后就能用二維圖像反應(yīng)空間中頻率的強(qiáng)度。得到的圖像就是轉(zhuǎn)換完的功率譜圖像。圖像中幅值的變化方向和圖像的紋理有一定的關(guān)系。字跡紋理粗的話,幅值就會(huì)比較大。圖像的鏡像值能體現(xiàn)紋理的方向。由此可知,得到的值在范圍內(nèi),值的大小和鏡像的值能分出粗細(xì)與方向。

      傅立葉圖像轉(zhuǎn)化后可以根據(jù)圖譜建立坐標(biāo),以坐標(biāo)原點(diǎn)為0,粗紋在原點(diǎn)附近有較高的值,細(xì)紋的能量譜向周?chē)㈤_(kāi),坐標(biāo)軸范圍通常為(-N/2,N/2),顯出來(lái)即可分析紋理的粗細(xì)和方向。

      通過(guò)傅立葉的方式衡量紋理,是字跡的初步識(shí)別,屬于整體分析。

      2.2 字跡局部特征識(shí)別

      從上文所述的50 種字跡中,本文任意挑選了一種字跡中的一個(gè)字和原來(lái)的50 個(gè)字作對(duì)比。步驟如下:

      (1)調(diào)整圖像亮度、色度和飽和度,將50 幅圖像的背景統(tǒng)一起來(lái)。(2)調(diào)整圖像大小,統(tǒng)一格式,將圖像預(yù)處理。(3)將50 個(gè)字跡分成了三組:左傾、右傾、豎直。(4)將待測(cè)字體大致歸為一類(lèi)或多類(lèi)后,一對(duì)一的擬合。

      首先通過(guò)整體紋理,再通過(guò)漢字局部識(shí)別。在實(shí)驗(yàn)中,選取了50 個(gè)不同的字跡,建數(shù)據(jù)庫(kù),從中隨機(jī)選取一個(gè)作為待識(shí)別的字跡。

      對(duì)于擬合的方法我們選取了數(shù)待測(cè)字跡中端點(diǎn)、交叉點(diǎn)和拐點(diǎn)的個(gè)數(shù),看已知字跡中是否有字跡的三個(gè)數(shù)據(jù)完全一樣或相差一點(diǎn)。但在分析端點(diǎn)、交叉點(diǎn)和拐點(diǎn)之前,我們還需要做字跡骨架的優(yōu)化。

      簡(jiǎn)化后是端點(diǎn)提取。端點(diǎn)可以等效為交叉數(shù),一個(gè)黑色像素點(diǎn)的八鄰域,當(dāng)八鄰域中只有一組黑白像素交替的話,此黑點(diǎn)就是一個(gè)端點(diǎn)。我們?cè)O(shè)黑像素為(w,z),交叉點(diǎn)數(shù)為x,則x 的公式如下所示:

      利用這個(gè)公式來(lái)判斷,當(dāng)x 為1 時(shí)為端點(diǎn),x 等于3 時(shí)是交叉點(diǎn)。其中,nk為這個(gè)點(diǎn)的八個(gè)相鄰的點(diǎn),nk∈{0,1},且n9=n1。在x=1 時(shí),(w,z)就是一個(gè)端點(diǎn)。

      交叉點(diǎn)與端點(diǎn)提取方法類(lèi)似,而因?yàn)楣拯c(diǎn)的電腦計(jì)算十分復(fù)雜,本次采用了計(jì)數(shù)法。在算出端點(diǎn)、拐點(diǎn)和交叉點(diǎn)后,利用如下公式,計(jì)算相似度:

      最終我們發(fā)現(xiàn),圖1(待測(cè))和圖2 的相似度為百分之百,而圖1(待測(cè))與圖3 的相似度為百分之七十。

      圖3

      最終我們得出結(jié)論:圖1 和圖2 是一個(gè)人寫(xiě)的。

      3 結(jié)論

      本文通過(guò)對(duì)字跡進(jìn)行預(yù)處理、圖像紋理識(shí)別、圖像局部特征識(shí)別的方法,實(shí)現(xiàn)了筆跡識(shí)別與判斷,可以解決字跡鑒別不夠客觀、分析時(shí)間長(zhǎng)、操作不便利等問(wèn)題,雖然在準(zhǔn)確性上還有待優(yōu)化,還無(wú)法做到百分之百的正確率,但用圖像預(yù)處理和建立數(shù)據(jù)庫(kù)的方法識(shí)別字跡能為以后智能化的字跡識(shí)別技術(shù)提供了參考的依據(jù)。希望我的努力,能為字跡識(shí)別走向智能化提供參考依據(jù)和解決辦法,更能為維護(hù)廣大人民群眾利益、提高法律實(shí)效性做出一定的貢獻(xiàn)。希望字跡識(shí)別不再成為法律鑒別里的一道鴻溝,而是作為無(wú)辜者建立最堅(jiān)實(shí)的證據(jù)出現(xiàn)在法庭上,成為法網(wǎng)編織中不可或缺的、起指向性的重要一環(huán)。

      猜你喜歡
      傅立葉字跡端點(diǎn)
      非特征端點(diǎn)條件下PM函數(shù)的迭代根
      不同坐標(biāo)系下傅立葉變換性質(zhì)
      三角函數(shù)的傅立葉變換推導(dǎo)公式
      不等式求解過(guò)程中端點(diǎn)的確定
      電力電纜非金屬外護(hù)套材料的傅立葉紅外光譜鑒別法
      電線電纜(2018年6期)2019-01-08 02:45:36
      基于傅立葉變換的CT系統(tǒng)參數(shù)標(biāo)定成像方法探究
      字跡潦草
      參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點(diǎn)估計(jì)
      基丁能雖匹配延拓法LMD端點(diǎn)效應(yīng)處理
      筆跡不說(shuō)謊
      波密县| 城口县| 衢州市| 肇东市| 祁阳县| 桂阳县| 泰州市| 碌曲县| 崇州市| 长丰县| 五河县| 金山区| 浑源县| 额济纳旗| 云龙县| 惠东县| 汶上县| 肇东市| 长岭县| 南通市| 昆山市| 砀山县| 吉水县| 阜南县| 开远市| 永泰县| 宁海县| 曲水县| 商南县| 青岛市| 西宁市| 湘潭市| 凌云县| 酉阳| 江西省| 元谋县| 三门县| 奉新县| 柏乡县| 苍山县| 邻水|