• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      小篆文字的自動(dòng)識(shí)別

      2016-02-23 04:50:39周明全
      關(guān)鍵詞:字庫(kù)小篆自動(dòng)識(shí)別

      戴 瓊,周明全,付 倩

      (北京師范大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京 100875)

      小篆文字的自動(dòng)識(shí)別

      戴 瓊,周明全,付 倩

      (北京師范大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京 100875)

      小篆是秦統(tǒng)一后使用的文字,是漢字發(fā)展的一個(gè)重大里程碑。在書法、碑文、石刻等有大量存在。但是由于與現(xiàn)代漢字差異較大,大多數(shù)人無(wú)法辨識(shí)這些小篆文字。文中提出了一種利用計(jì)算機(jī)對(duì)小篆文字自動(dòng)辨識(shí)的方法。首先構(gòu)建標(biāo)準(zhǔn)以及小篆字體數(shù)據(jù)庫(kù),然后將用戶需要識(shí)別的小篆文字圖片縮放至標(biāo)準(zhǔn)大小,隨后采用迭代最近點(diǎn)算法(ICP算法)與庫(kù)中的小篆文字進(jìn)行匹配,最后計(jì)算其相似度,而得到的相似度最高文字,也就是識(shí)別的輸出結(jié)果,從而實(shí)現(xiàn)小篆字體的自動(dòng)識(shí)別。該方法經(jīng)過(guò)大量實(shí)驗(yàn)證明是有效的。

      小篆字體;ICP算法;相似度;自動(dòng)識(shí)別

      1 概 述

      弘一法師曾這樣說(shuō)過(guò),學(xué)字“先由篆字學(xué)起”。為什么呢?“若不學(xué)篆書,不講究‘說(shuō)文’,對(duì)于字學(xué)及文字起源,就不能明白”,“寫篆字也可以為寫隸書、楷書、行書的基礎(chǔ)”,“篆書是各種字的根本”[1]。

      篆書起源于西周末年,東周時(shí)在秦國(guó)一帶流行,至秦始皇時(shí)達(dá)到鼎盛,漢代開(kāi)始衰退,逐漸向分書過(guò)渡。這三個(gè)時(shí)期的篆書風(fēng)格有較大差異。為了加以區(qū)別,人們把東周時(shí)的篆書稱為大篆(或稱籀書),秦始皇時(shí)的稱為小篆,漢代的稱為漢篆[2]。

      小篆是秦統(tǒng)一六國(guó)“書同文”后規(guī)范化的文字,是先秦篆書的最終規(guī)范,是漢字發(fā)展的一個(gè)重大里程碑。東周時(shí)代,諸侯力政,不統(tǒng)于王,各國(guó)文字一方面因?yàn)閷?shí)用需要不斷簡(jiǎn)化,另一方面,為了美觀,常添加各種裝飾性的筆畫,結(jié)果文字異形,訛體歧出。秦統(tǒng)一六國(guó),秦始皇實(shí)行“書同文”政策,由丞相李斯厘定正體字,在原來(lái)秦使用的大篆基礎(chǔ)上吸收六國(guó)文字優(yōu)點(diǎn)并加以簡(jiǎn)化規(guī)范[3-4]。其規(guī)范的根本點(diǎn)是對(duì)從甲骨文到金文以及戰(zhàn)國(guó)時(shí)期各種裝飾性誡文字所運(yùn)用的曲線和結(jié)構(gòu)對(duì)稱性的提煉和凈化,也是對(duì)整個(gè)先秦時(shí)代人們審美趨向的總結(jié)升華。

      小篆在我國(guó)歷史上使用了千余年,自從漢朝通用隸書之后,小篆的應(yīng)用就日益減少。在漢末至六朝又出現(xiàn)了楷書,經(jīng)隋唐宋元明清一直沿用至現(xiàn)代。自從楷書通用以后,經(jīng)歷了一千多年的歷史,小篆就日漸從人們?nèi)粘I钪械耍鋺?yīng)用越來(lái)越少[2]。

      盡管如此,小篆的象征性和裝飾性在中國(guó)傳統(tǒng)藝術(shù)中發(fā)揮著巨大的作用并影響深遠(yuǎn)。比如名山大川、風(fēng)景名勝、遺址古建、寺院道觀、文保單位、公私堂所等處的石碑、摩崖、對(duì)聯(lián)、匾額、中堂條幅以及鑄件等處,都會(huì)刻有篆字。它們醒目、大氣、莊重、權(quán)威,無(wú)數(shù)的碑額借助于小篆的象征性樹(shù)立起權(quán)威的象征性。又如篆刻,它是小篆被廣泛運(yùn)用到印信中,并由此發(fā)展成的一門相對(duì)獨(dú)立的藝術(shù),由此也產(chǎn)生出一大批書法大家,如鄧石如、趙之謙等。再如秦磚漢瓦,是中國(guó)傳世文物中的一大項(xiàng)目,也是古代美術(shù)的一大類,上面也都刻有篆字,文字形式上較規(guī)范,內(nèi)容上實(shí)用性較強(qiáng)[5-6]。

      由此可以看出,即使在甲骨文三四千年后的現(xiàn)代,篆字(特別是小篆)的辨識(shí)依然具有其重要的意義,這關(guān)乎文史、美術(shù)與中華文明傳承。

      古代的書法、碑文、石刻等有大量的小篆,但由于與現(xiàn)代漢字差異較大,大多數(shù)人無(wú)法認(rèn)識(shí)這些小篆文字。因此有必要借助計(jì)算機(jī)技術(shù)幫助自動(dòng)辨識(shí)。而對(duì)于自動(dòng)識(shí)別,其結(jié)果就是找到在已建立的標(biāo)準(zhǔn)小篆字庫(kù)中與之相似度最大的字,則在計(jì)算相似度之前如何匹配當(dāng)前這兩個(gè)待比較的圖片是一個(gè)關(guān)鍵問(wèn)題。如果將每一個(gè)圖片中的字的部分的像素點(diǎn)看作是退化的二維平面上的點(diǎn)云,則可以借助很多的方法來(lái)實(shí)現(xiàn)匹配。這些匹配方法一般是基于迭代的算法,通過(guò)定義一個(gè)誤差函數(shù)來(lái)反映點(diǎn)云重疊區(qū)域間的吻合程度。目前應(yīng)用最廣泛的方法是由Besl等[7]以及Chen等[8]提出的迭代最近點(diǎn)(Iterative Closest Point,ICP)算法,此類算法通過(guò)迭代的計(jì)算,使兩片點(diǎn)云上對(duì)應(yīng)點(diǎn)對(duì)的均方誤差最小。

      當(dāng)前,大多數(shù)工作是輸入現(xiàn)代漢字,可以輸出小篆文字。而對(duì)小篆文字自動(dòng)辨識(shí)工作較少,西北大學(xué)針對(duì)瓦當(dāng)上小篆文字的識(shí)別展開(kāi)研究,提出了一種基于神經(jīng)網(wǎng)絡(luò)的方法[9]和基于文字幾何結(jié)構(gòu)的方法[10]。文中提出了一種通過(guò)照片對(duì)小篆文字自動(dòng)辨識(shí)的通用方法,通過(guò)建立小篆字庫(kù)計(jì)算字庫(kù)內(nèi)的字與輸入的字的相似度,實(shí)現(xiàn)小篆文字的自動(dòng)辨識(shí)。

      2 小篆字庫(kù)的構(gòu)建

      在該系統(tǒng)中,對(duì)所建立的3 755個(gè)一級(jí)國(guó)標(biāo)漢字按照其在標(biāo)準(zhǔn)中出現(xiàn)的順序按阿拉伯?dāng)?shù)字建立索引,并將其對(duì)應(yīng)的書法漢字圖像一并入庫(kù)進(jìn)行存儲(chǔ)以建立小篆字庫(kù)。每個(gè)小篆字圖片為600×600像素的二值圖片。圖1是一些字庫(kù)中的小篆字體的例子。

      圖1 標(biāo)準(zhǔn)小篆字體“北京師范大學(xué)”

      3 相似度的計(jì)算

      文中對(duì)于小篆字體的自動(dòng)識(shí)別,基于相似度的計(jì)算,其中輸入的待識(shí)別圖片與標(biāo)準(zhǔn)小篆字庫(kù)中的小篆字圖片相似度最大的字即為輸出結(jié)果。第二節(jié)已經(jīng)介紹了建立的小篆標(biāo)準(zhǔn)字庫(kù),其中的圖片大小為600×600,所以輸入的圖片經(jīng)過(guò)處理后應(yīng)該是與標(biāo)準(zhǔn)字部分基本重疊且大小同為600×600的圖片。相似度的計(jì)算介紹如下:

      若Pi,j是標(biāo)準(zhǔn)小篆字庫(kù)中當(dāng)前比較圖片(i,j)像素位置的顏色值,Qi,j是用戶輸入待識(shí)別圖片(i,j)像素位置的顏色值。其中i,j是圖片像素位置中的橫縱坐標(biāo),1≤i≤600,1≤j≤600。而Pi,j定義如下:

      Qi,j可以相似地定義。若K=600,則相似度可以由以式(1)計(jì)算得到。

      (1)

      在以上方程中分子部分為同為黑色(即同屬于字體)的像素個(gè)數(shù),分母為同為黑色或者顏色不同(一個(gè)屬于字體一個(gè)屬于背景)的像素個(gè)數(shù)??梢钥闯?,如果這兩個(gè)字完全匹配,則相似度為1;如果這兩個(gè)完全不匹配,則相似度為0。

      4 字體匹配

      小篆字體的自動(dòng)識(shí)別,輸出的是相似度最大的字作為結(jié)果。上節(jié)已經(jīng)介紹了相似度的計(jì)算??梢钥闯觯瑸榱吮WC結(jié)果的正確性,待識(shí)別的圖片與字庫(kù)中的圖片的匹配是十分重要的。由于用戶輸入的圖片大小及其中字的方向大小位置都不是確定的,所以在計(jì)算其相似度大小之前,需要對(duì)輸入圖片進(jìn)行處理,以致其圖片大小與標(biāo)準(zhǔn)圖片大小相同,且其中字的方向位置大小都與標(biāo)準(zhǔn)字盡可能一致。初始的圖片大小以及字的大小處理比較簡(jiǎn)單,而更復(fù)雜的字的方向位置處理采用ICP算法來(lái)完成。

      4.1 初始匹配

      由于用戶輸入圖片的隨意性,它的圖片大小及其中字的大小方向位置都需要盡可能匹配標(biāo)準(zhǔn)字以達(dá)到一致。

      對(duì)于輸入字的大小調(diào)整,是根據(jù)它與標(biāo)準(zhǔn)字的最小包圍圓來(lái)調(diào)整的。雖然中國(guó)漢字是方塊字,但是由于輸入字的方向不定不能保證它的方向一定是豎直向上的,所以這里用包圍圓來(lái)調(diào)整更為妥當(dāng)。其中最小包圍圓的圓心是根據(jù)字體像素的平均位置來(lái)決定的,半徑則是字體像素部分與圓心的最大距離。最小包圍圓調(diào)整字體大小的結(jié)果見(jiàn)圖2和圖3。

      圖2 與標(biāo)準(zhǔn)字“京”初始匹配結(jié)果

      4.2 ICP算法匹配

      經(jīng)過(guò)初始處理以后,輸入圖片被處理為字體最小包圍圓與當(dāng)前標(biāo)準(zhǔn)字的相同,且圖片大小為標(biāo)準(zhǔn)的600×600,如此已經(jīng)保證了計(jì)算相似度的可行性,但是仍不能保證其精確性。因此采用了ICP算法[11]來(lái)進(jìn)一步精確地匹配字體。ICP算法通過(guò)尋找初始處理后的輸入圖片字體像素點(diǎn)集以及標(biāo)準(zhǔn)字體像素點(diǎn)集的對(duì)應(yīng)匹配點(diǎn)之間的關(guān)系,計(jì)算兩個(gè)點(diǎn)集的變換參數(shù),以滿足給定的收斂精度,最終求得兩個(gè)點(diǎn)集之間的平移和旋轉(zhuǎn)參數(shù),來(lái)完成匹配過(guò)程。

      ICP算法用來(lái)解決多視點(diǎn)云間的對(duì)齊問(wèn)題,前面已經(jīng)提到ICP算法的理論,現(xiàn)在介紹一下ICP算法的實(shí)現(xiàn)過(guò)程。ICP算法本質(zhì)上是基于最小二乘法的最優(yōu)匹配方法。該算法重復(fù)進(jìn)行選擇對(duì)應(yīng)關(guān)系點(diǎn)對(duì),計(jì)算最優(yōu)剛體變換這一過(guò)程,直到滿足正確匹配的收斂精度要求。

      ICP算法的目的是要找到待匹配點(diǎn)云數(shù)據(jù)與參考點(diǎn)云數(shù)據(jù)之間的旋轉(zhuǎn)參數(shù)R和平移參數(shù)T,使得兩點(diǎn)集數(shù)據(jù)之間滿足某種度量準(zhǔn)則下的最優(yōu)匹配。

      假設(shè)給定兩個(gè)點(diǎn)集X1和X2,ICP方法的匹配步驟如下所示:

      (1)搜索X2中的每一個(gè)點(diǎn)在X1點(diǎn)集中的對(duì)應(yīng)最近點(diǎn);

      (2)求得使上述對(duì)應(yīng)點(diǎn)對(duì)平均距離最小的剛體變換,求得平移參數(shù)和旋轉(zhuǎn)參數(shù);

      (3)對(duì)X2使用上一步求得的平移和旋轉(zhuǎn)參數(shù),得到新的變換點(diǎn)集;

      (4)如果新的變換點(diǎn)集與參考點(diǎn)集滿足f(R,T)式的目標(biāo)函數(shù)要求,即兩點(diǎn)集的平均距離小于某一給定閾值,則停止迭代計(jì)算,否則新的變換點(diǎn)集作為新的X2繼續(xù)迭代,直到達(dá)到目標(biāo)函數(shù)的要求。

      而在(1)中,ICP搜索最近點(diǎn)的主要方法有:點(diǎn)對(duì)點(diǎn)最近點(diǎn)搜索算法[7]、點(diǎn)對(duì)面最近點(diǎn)搜索算法[13]、點(diǎn)投影最近點(diǎn)搜索算法[14]。這里把初始處理后的輸入圖片的像素點(diǎn)集以及標(biāo)準(zhǔn)字圖片的像素點(diǎn)集作為待匹配的兩個(gè)點(diǎn)云集,所以采用的是點(diǎn)對(duì)點(diǎn)最近點(diǎn)搜索算法。

      圖4是經(jīng)過(guò)初始處理的輸入圖片通過(guò)ICP算法精確匹配后的結(jié)果。

      圖4 ICP算法精確匹配

      5 自動(dòng)識(shí)別

      文中對(duì)于輸入的一個(gè)小篆字體圖片的自動(dòng)識(shí)別是通過(guò)輸入與小篆字庫(kù)中標(biāo)準(zhǔn)字逐個(gè)比較計(jì)算其相似度,最后得到其中相似度最大的字作為自動(dòng)識(shí)別的結(jié)果,流程圖見(jiàn)圖5。

      圖5 自動(dòng)識(shí)別算法流程圖

      具體來(lái)說(shuō),經(jīng)過(guò)以上匹配以后,得到了針對(duì)當(dāng)前標(biāo)準(zhǔn)字的匹配后的輸入處理結(jié)果?,F(xiàn)在將匹配后的輸入結(jié)果與當(dāng)前標(biāo)準(zhǔn)字,根據(jù)第三節(jié)中介紹的相似度計(jì)算方法可以計(jì)算出針對(duì)當(dāng)前標(biāo)準(zhǔn)字的相似度。對(duì)于字庫(kù)中的所有標(biāo)準(zhǔn)字,總共能得到3 755個(gè)相似度結(jié)果,其中最大的相似度即為輸出結(jié)果。比如圖4的例子中,最終計(jì)算的相似度“京”要比“學(xué)”要小,實(shí)際上其最終的識(shí)別結(jié)果也是“學(xué)”,如圖6所示。

      圖6 自動(dòng)識(shí)別結(jié)果

      6 結(jié)束語(yǔ)

      針對(duì)小篆文字辨識(shí)困難問(wèn)題,文中提出了一種利用計(jì)算機(jī)對(duì)小篆文字的自動(dòng)辨識(shí)方法。建立了一個(gè)標(biāo)準(zhǔn)小篆字庫(kù)。針對(duì)輸入的一個(gè)待識(shí)別小篆字體圖片,首先根據(jù)當(dāng)前標(biāo)準(zhǔn)字經(jīng)過(guò)初始處理得到標(biāo)準(zhǔn)圖片大小且字的大小大致相同的初始結(jié)果,然后對(duì)初始處理后的字與當(dāng)前標(biāo)準(zhǔn)字通過(guò)ICP精確匹配后調(diào)整它的位置與方向,最后計(jì)算其相似度。當(dāng)計(jì)算出輸入字與庫(kù)中所有字的相似度后,其中相似度最大的字即為其自動(dòng)識(shí)別的結(jié)果。

      該方法基于一個(gè)小篆的一級(jí)漢字庫(kù)(包括3 755個(gè)字),因此目前可以辨識(shí)一級(jí)漢字庫(kù)范圍內(nèi)的小篆文字,但是以后可以很方便地?cái)U(kuò)展字庫(kù),而且這種自動(dòng)識(shí)別的方法對(duì)于其他字體的識(shí)別同樣有效。未來(lái)系統(tǒng)可以移植到移動(dòng)設(shè)備如手機(jī)上,通過(guò)手機(jī)拍照,可以自動(dòng)辨識(shí)小篆文字,也可以用于印的篆刻等。

      [1] 羅喜澤.小篆技法教程[M].成都:四川師范大學(xué)電子出版社,2010.

      [2] 沃興華.中國(guó)書法史[M].上海:上海古籍出版社,2001.

      [3] 沃興華.中國(guó)書法篆刻簡(jiǎn)史[M].上海:上海古籍出版社,2010.

      [4] 高玉軍,劉慧杰,呂肖慶,等.小篆文本的在線編輯技術(shù)[J].計(jì)算機(jī)科學(xué),2007,34(12):241-243.

      [5] 趙昌智.中國(guó)篆刻史[M].上海:上海人民出版社,2006.

      [6] 林乾良,于良子.篆字辨識(shí)[M].杭州:西泠印社出版社,2009.

      [7]BeslPJ,MckayND.Amethodforregistrationof3-dshapes[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,1992,14(2):239-256.

      [8]ChenY,MedioniG.Objectmodelingbyregistrationofmultiplerangeimages[J].ImageandVisionComputing,1992,10(3):145-155.

      [9] 劉 磊.基于內(nèi)容的秦漢瓦當(dāng)小篆文字識(shí)別方法研究[D].西安:西北大學(xué),2015.

      [10] 周子駿.基于神經(jīng)網(wǎng)絡(luò)的瓦當(dāng)中小篆的識(shí)別方法[D].西安:西北大學(xué),2014.

      [11] 周春艷,李 勇,鄒崢嶸.三維點(diǎn)云ICP算法改進(jìn)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21(8):75-77.

      [12] 金 濤,童水光,顏永年.逆向工程技術(shù)[M].北京:機(jī)械工業(yè)出版社,2003.

      [13]BergevinR,SoucyM,GagnonH,etal.Towardsageneralmulti-viewregistrationtechnique[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,1996,18(5):540-547.

      [14]RusinkiewiczS,LevoyM.EfficientvariantsoftheICPalgorithm[C]//Procofthirdinternationalconferenceon3-Ddigitalimagingandmodeling.[s.l.]:IEEE,2001:145-152.

      Automatic Recognition of Xiaozhuan Fonts

      DAI Qiong,ZHOU Ming-quan,FU Qian

      (College of Information Science and Technology,Beijing Normal University,Beijing 100875,China)

      Xiaozhuan is the language used Qin unified China,and is a major milestone in the development of Chinese characters.In calligraphy,inscriptions,stone carvings,it is abound.However,due to large differences with the modern Chinese characters,most people cannot recognize these Xiaozhuan text.An automatic identification method of Xiaozhuan text by using computer technology is presented.First,the standard and database for Xiaozhuan font is built.Secondly,the Xiaozhuan text image which users want to identify is scaled to the standard size,and then the image is matched with these characters in the standard database of Xiaozhuan font by iterative closest point algorithm (ICP algorithm).Finally,the similarity is computed and the highest similarity ward is selected,that is the output result of recognition.Therefore automatic recognition of Xiaozhuan font is achieved.A lot of experiments have shown this method is effective.

      Xiaozhuan fonts;ICP;similarity;automatic recognition

      2015-06-20

      2015-09-23

      時(shí)間:2016-02-18

      國(guó)家自然科學(xué)基金資助項(xiàng)目(61170203)

      戴 瓊(1970-),女,碩士生,研究方向?yàn)橛?jì)算機(jī)應(yīng)用;周明全,教授,研究方向?yàn)橛?jì)算機(jī)應(yīng)用。

      http://www.cnki.net/kcms/detail/61.1450.TP.20160218.1638.090.html

      TP301

      A

      1673-629X(2016)03-0001-04

      10.3969/j.issn.1673-629X.2016.03.001

      猜你喜歡
      字庫(kù)小篆自動(dòng)識(shí)別
      宋伯軍小篆作品
      No.2 喜茶聯(lián)合漢儀字庫(kù)推出微型書和書簽
      自動(dòng)識(shí)別系統(tǒng)
      特別健康(2018年3期)2018-07-04 00:40:18
      某型號(hào)產(chǎn)品的字庫(kù)遷移優(yōu)化設(shè)計(jì)
      電子世界(2018年7期)2018-04-26 08:51:35
      李斯造小篆
      小篆的結(jié)構(gòu)練習(xí)(一)
      丹青少年(2017年3期)2018-01-22 02:50:24
      小篆的四個(gè)特點(diǎn)
      丹青少年(2017年3期)2018-01-22 02:50:24
      金屬垃圾自動(dòng)識(shí)別回收箱
      基于IEC61850的配網(wǎng)終端自動(dòng)識(shí)別技術(shù)
      相同字庫(kù)條件下激光打印文件特征的變化規(guī)律和特點(diǎn)
      昌平区| 郑州市| 江华| 时尚| 若羌县| 开阳县| 永城市| 若羌县| 日喀则市| 花莲市| 海阳市| 宜兴市| 永修县| 天门市| 岳阳县| 且末县| 九龙城区| 北京市| 格尔木市| 厦门市| 旌德县| 西乌| 连城县| 西乌珠穆沁旗| 潜山县| 屯门区| 钟山县| 古田县| 滨海县| 罗山县| 栖霞市| 秀山| 乐至县| 前郭尔| 林芝县| 汝城县| 平遥县| 南平市| 县级市| 南漳县| 临安市|