• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      藏文聯(lián)機手寫識別的研究與實現(xiàn)索

      2017-07-20 12:37南尖措關白李雷山發(fā)富
      計算機時代 2017年7期

      南尖措+關白+李雷+山發(fā)富

      摘 要: 提出了一種基于筆畫的藏文聯(lián)機手寫識別的方法。首先將每個藏文字分解為各個子模式,然后將子模式進一步劃分為筆畫,最后通過識別出的筆畫和每個藏文字之間對應規(guī)則判斷出使用者所書寫的藏文字。識別筆畫時,將其軌跡看成點的集合,使用八個方向碼對其進行標記,進而確定這個筆畫。在識別之前,先將相似的筆畫進行歸類合并,以解決使用者書寫不規(guī)范的情況。在不考慮連筆的情況下,對常用的600多個藏文字進行測試,準確率可以達到92%。

      關鍵詞: 藏文聯(lián)機手寫識別; 筆畫識別; 方向碼; 筆畫合并

      中圖分類號:TP391 文獻標志碼:A 文章編號:1006-8228(2017)07-10-03

      Research and implementation of Tibetan online handwritten recognition

      Suonan Jiancuo, Guan Bai, Li Lei, Shan Fafu

      (Tibetan information technology engineering research center, Tibet, Lhasa 850000, China)

      Abstract: This paper presents a method of Tibetan online handwriting recognition based on stroke and its corresponding rules, and implements it. First, each Tibetan text is decomposed into various sub patterns, and then the sub pattern is further divided into strokes. Through the identification of strokes and the corresponding rules of each Tibetan character, the user's handwriting character is recognized. In the identification of a stroke, its trajectory is taken as a set of points, and eight directional codes are used to mark it, and then the stroke is determined. Before the identification, the similar strokes are classified and merged to solve the problem of nonstandard user writing. Without considering the joined-up writing, tested on more than 600 Tibetan words commonly used, the accuracy rate can reach 92%.

      Key words: Tibetan online handwriting recognition; stroke recognition; directional code; stroke merge

      0 引言

      隨著如平板電腦、智能手機和數(shù)碼筆等基于筆和觸摸輸入設備的發(fā)展,聯(lián)機手寫字符識別再次引起了人們的興趣。近年來,研究人員開發(fā)出多種方法,來識別不同類別的字符并提高識別性能。這些方法力求在實際應用中以較低的復雜度來實現(xiàn)高性能的識別來滿足用戶的需求。

      在中國,藏文作為少數(shù)民族文字,大約被600萬人使用,尤其是在西藏自治區(qū),云南和青海等省。聯(lián)機手寫藏文字符識別也被廣泛應用到便攜設備以及桌面的應用程序[1]。然而,相較于中文、英文和日文等語言,藏文要達到高識別率仍然具有挑戰(zhàn)性。

      1 藏文聯(lián)機手寫識別

      1.1 研究方法

      手寫識別方面主要有基于統(tǒng)計決策模式的識別方法和基于文字結構模式的識別方法兩大類別[2-5],基于統(tǒng)計決策模式的識別方法是首先將待識別的文字提取出一組統(tǒng)計特征,然后根據此組特征形成該文字的多維特征向量,最后再將該多維特征向量與語料庫中每個字的訓練的多維特征向量進行比較,得出相似度最高的那個多維特征向量,此多維特征向量對應的文字就是所識別出的文字,如圖1所示。

      [待識別文字][多維特征向量][語料庫][識別結果][特征提取][判別函數(shù)][相似度]

      基于文字結構模式的識別方法就是將被識別的文字(本文中指單個藏文字)看成由多個子模式(本文中指藏文字母)按照一定的規(guī)則組成,而子模式又由基元(本文中指筆畫)組成,如圖2所示?;菢嫵稍撃J降淖钚卧Mㄟ^識別基元,進而識別出子模式,最終識別出該模式,即識別出要識別的藏文字,如圖3所示。識別藏文字時,可以把藏文字當作一種特殊的二維文字,其基本組成單元為:基字、前加字、上加字、下加字、后加字、再后加字、元音[6]。

      基于文字結構模式的識別方法相比于基于統(tǒng)計決策模式的識別方法,充分利用了藏文字的構字規(guī)律,因此本文采用基于文字結構模式的識別方法。

      1.2 筆畫的歸納及合并

      藏文的輸入及編碼已經有了統(tǒng)一的標準,但是在手寫識別研究方面的成果還不多,前人多是基于構件進行識別。本文采用一種基于筆畫的和規(guī)則的方法進行識別[7],首先對藏文筆畫進行歸類,然后建立每個藏文字與筆畫之間對應的規(guī)則,根據規(guī)則查找到對應的藏文字。

      一個藏文字由若干個部件構成,一個部件又由若干個筆畫組成,筆畫是組成藏文字的最小單位。要想識別藏文字,首先就要識別出筆畫。但是藏文字筆畫比較復雜和繁多,為了方便識別,我們首先對藏文字筆畫根據其特征進行分類,最終確定了20個筆畫,并用a—t對其分別命名,如圖4所示。然后確定了30個輔音字母的構成規(guī)則,如

      1.3 筆畫的識別問題

      我們采用了筆畫識別的方法進行藏文字識別,即先識別用戶輸入的筆畫,再根據筆畫的集合查找對應的藏文字所對應的筆畫序列,最終確定所寫藏文字。這種基于筆畫的藏文字識別方法,特點是寫一筆,識別一筆,即聯(lián)機識別。筆畫識別是藏文字識別的前提和關鍵。然而筆畫識別還存在諸多問題,例如筆畫的獲取算法對識別的影響、書寫速度的快慢對識別的影響、連筆情況下的識別等。

      1.3.1 書寫快慢影響的解決

      通過對訓練的筆畫的數(shù)據進行預處理,用以解決使用者在書寫快慢對識別率的影響。在筆畫識別的程序設計時,筆者把用戶輸入的筆畫軌跡看成點的集合,使用者在進行訓練或者書寫的時候,不同的書寫速度會對筆畫軌跡信息造成影響。例如寫“橫”的時候,雖然二者的方向數(shù)據都是“3”,但是在數(shù)據長度方面卻有很大差別,緩慢書寫要比快速書寫的長度要長許多,所以書寫的快慢也會影響識別率。

      對于此問題,本文提供兩種解決辦法。第一種是在數(shù)據訓練時,就故意快速寫和緩慢寫,此方法可以解決這種問題,但這對于訓練人員的要求較高,并且此種方法會產生大量的數(shù)據,會降低識別速度。第二種方法是將數(shù)據進行歸一化處理,連續(xù)相同的方向以一個數(shù)字代替,不計算其長度,只關注其方向,再拐點處再標記下一個方向。本文采用第一種方法,用數(shù)據的訓練來彌補技術的不足。

      1.3.2 連筆問題的解決

      人們書寫藏文經常會兩筆或多筆連寫,所以連筆是個需要解決的問題,不過已經有了解決思路。首先統(tǒng)計經常會連筆的筆畫,例如藏文字“”的最后兩筆,正常書寫應該像圖5的左邊是由兩筆完成,但是人們經常會按照圖5右邊那樣一筆寫完,所以我們采用一個藏文字對應兩個筆畫序列規(guī)則或者一個藏文字對應多個筆畫序列規(guī)則進行連筆識別,即“”對應的規(guī)則有正常書寫的“accm”和連筆書寫的“acd”兩個。

      1.3.3 訓練程序及識別程序的實現(xiàn)

      基于筆畫識別的藏文字識別方法還需考慮用戶在輸入的時候,難免會有一些抖動或者其他干擾因素導致和標準的藏文字體差別的情況,為此,本文提出了一種具有容錯機制的訓練方法,以達到能夠具有容錯的性能。

      具體的優(yōu)化方法為:

      第一步,將用戶輸入的點看作原點,以正上方為Y軸的正半軸,正右方為X軸的正半軸,建立一個平面直角坐標系,如圖6所示。原來采用正向上為方向碼“1”,現(xiàn)在采取兩邊各5度的容錯范圍,即在正上方(即Y軸的正半軸)向左偏離5度的范圍內或者向右偏離5度的范圍內都認為用戶輸入的是方向碼“1”,同理,方向碼“2”到方向碼“8”如圖6所示。

      第二步,開始對筆畫進行訓練,筆畫訓練起初是采用直接在電腦上進行訓練,用鼠標代替手寫輸入,給出所要訓練的筆畫,照著所給筆畫進行描寫,點擊保存則會保存當前筆畫軌跡信息,獲得該筆畫的訓練數(shù)據。后來,為了更加準確的獲得訓練數(shù)據,我們設計了安卓版的訓練軟件,使用戶可以在屏幕上用手直接進行訓練。

      在基于安卓手機的訓練程序完成后,我們找了20個藏族學生,每人訓練一小時,對筆畫進行了訓練。訓練完成后,開始對筆畫的識別,筆畫識別方面,我們采用的是基于余弦定理的文本相似判別方法,將所寫筆畫的軌跡信息與訓練的語料庫中所有筆畫訓練的信息進行對比,計算出當前所寫筆畫的軌跡信息知識經過多少步可以變成與當前比較的語料庫中的軌跡信息,最后得出差異化步驟最小的就是相似度最高的那個筆畫軌跡,進而判斷出所寫筆畫。

      1.4 聯(lián)機手寫識別

      藏文聯(lián)機手寫識別則是在用戶進行手寫的同時進行處理和識別,因而可以非常方便的獲得藏文手寫筆畫。由此,藏文聯(lián)機手寫識別流程可以簡化為圖7,即先獲取用戶所寫的當前筆畫,根據語料庫對當前筆畫進行識別,獲得當前書寫的筆畫。然后再計算當前所獲得的筆畫序列和語料庫中藏文字所對應的筆畫序列相似度,計算此相似度的時候,方法為:當前筆畫序列數(shù)與藏文字對應序列中有x個筆畫對應相同,該字共有y個筆畫,相似度則為x/y,若x大于y,則相似度為y/x。然后得出相似度最高的藏文字。

      [獲取當前筆畫][識別出當前筆畫][識別出藏文字][語料庫] [規(guī)則]

      2 結論及展望

      最終,我們采用常用的600多個常用藏文字對其進行測試,在不考慮連筆書寫的情況下,識別的準確率可以達到92%以上,證明基于筆畫的藏文字識別是可行的,可以繼續(xù)研究和探討。

      此方法還有一些需要改進的地方。第一,在筆畫歸類的時候,可以先進行訓練,然后根據訓練的數(shù)據進行分析和聚類,控制一個閾值,使相似度達到這個閾值的筆畫聚為一類,然后將其作為語料庫,這種辦法可以有效解決筆畫聚類方面由于開發(fā)者主觀因素的影響。第二,記錄筆畫軌跡信息的時候,可以通過只錄拐點處的方向碼,以此減少數(shù)據量,進而提高識別速度。

      參考文獻(References):

      [1] 楊峰.聯(lián)機手寫藏文字樣本符采集及分析處理[D].青海師范

      大學碩士學位論文,2014.

      [2] 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊.深度學習在手寫

      漢字識別中的應用綜述[J].自動化學報,2016.8:1125-1141

      [3] 呂新橋.聯(lián)機手寫漢字識別技術研究[D].華中科技大學碩士

      學位論文,2009.

      [4] 柳洪軼,王曉東,王維蘭.藏文聯(lián)機手寫識別的難點及其解決

      方法[J].西北民族大學學報(自然科學版),2005.1:77-80

      [5] 唐松,郭椿標,鄭南寧.基于文字結構特征的快速平滑細化方

      法[J].中文信息學報,1990.2:49-54

      [6] 關白.信息處理用藏文分詞單位研究[J].中文信息學報,

      2010.3:124-128

      [7] 樊慶林.基于筆畫的聯(lián)機手寫漢字識別系統(tǒng)的研究與實現(xiàn)[D].

      安徽大學碩士學位論文,2007.

      安庆市| 嘉义市| 冀州市| 临湘市| 洱源县| 邵阳市| 乐平市| 彭阳县| 渭南市| 洪湖市| 呈贡县| 宿州市| 临高县| 拜泉县| 广平县| 永吉县| 舞阳县| 若尔盖县| 磴口县| 大新县| 德保县| 潢川县| 长武县| 祁连县| 长白| 怀集县| 育儿| 天镇县| 阳西县| 肃南| 手游| 凤阳县| 苏尼特左旗| 汉源县| 邻水| 佛学| 信宜市| 赞皇县| 平湖市| 揭东县| 资阳市|