• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      彝文輸入法形碼編碼的研究與實(shí)現(xiàn)

      2011-01-25 05:39:10寧威林王嘉梅明志遠(yuǎn)
      關(guān)鍵詞:彝文字庫輸入法

      寧威林,王嘉梅,王 輝,明志遠(yuǎn)

      (云南民族大學(xué)電氣信息工程學(xué)院,云南昆明650031)

      彝文合體字少,不似漢字采取形聲結(jié)構(gòu)來多產(chǎn)字[1-6],而是采用字體結(jié)構(gòu)易位、增添筆劃等方法來多產(chǎn)字.結(jié)構(gòu)易位有上下易位、左右易位;增添筆劃則指在已具獨(dú)立形、音、義的獨(dú)體字不同部位增添不同的筆劃,形成另具形、音、義的字.彝文再一特點(diǎn)是異寫繁多,每字的異寫少則二三個(gè),多則四五十個(gè).目前彝文的輸入法方式大體可分為2類:即根據(jù)讀音來輸入和根據(jù)字型來輸入,也就是我們常說的音碼與形碼輸入法.

      彝文的音碼輸入法是目前使用最多的方法,其缺點(diǎn)也顯而易見.使用彝文音碼輸入法,必須是懂彝文的人,局限性很大.然而彝文形碼輸入法的研究在國內(nèi)外仍舊是空白.綜合分析彝文字型的主要特點(diǎn),分類編碼,極大地?cái)U(kuò)大了適用范圍,無論使用者懂不懂彝文,都可以根據(jù)文字的形碼規(guī)則進(jìn)行拆分輸入,相比音碼輸入法而言,適用人群更為廣泛,普遍.

      1 彝文輸入法字型編碼

      本文所研究的彝文輸入法,是一種僅僅使用10個(gè)數(shù)字鍵0到9,最多擊鍵3次便可以輕松輸入彝文的大眾化輸入法.即便在用戶純粹不懂得彝文的情況下,只需根據(jù)字型拆分規(guī)則就能進(jìn)行彝文字符的計(jì)算機(jī)輸入,使用非常方便.它較好地解決了彝文字符輸入過程中的高效性與實(shí)用性的問題.此輸入法可廣泛應(yīng)用于小型設(shè)備,電腦等.

      1.1 編碼方案

      第1位為大體分類,后2位是在此基礎(chǔ)上根據(jù)字形的特點(diǎn)(如:有無曲線,有無封閉等)具體細(xì)化分類.其編碼規(guī)則:針對彝文文字的整體特征,根據(jù)彝文字型是否有曲線,是否有封閉,是否有點(diǎn)進(jìn)行分類.分為8類:用1至8作為代碼,即1代表無曲線,無封閉,無點(diǎn);2代表無曲線,無封閉,有點(diǎn);3代表無曲線,有封閉,無點(diǎn);4代表無曲線,有封閉,有點(diǎn);5代表有曲線,無封閉,無點(diǎn);6代表有曲線,無封閉,有點(diǎn);7代表有曲線,有封閉,無點(diǎn);8代表有曲線,有封閉,有點(diǎn).

      第2位編碼規(guī)則:在有無曲線的基礎(chǔ)上,針對筆畫特征進(jìn)行分類.無曲線9種分類,用代碼1至9表示,即1代表僅含橫豎筆畫;2代表橫斜筆畫,橫筆畫數(shù)大于斜筆畫數(shù);3代表僅橫斜,橫筆畫數(shù)小于斜筆畫數(shù);4代表僅橫斜,橫筆畫數(shù)等于斜筆畫數(shù);5代表僅豎斜;6代表橫豎斜,有交叉且僅左斜;7代表有橫豎斜,有交叉且有其它斜;8代表橫豎斜,無交叉且僅有左斜;9代表橫豎斜,無交叉且有其它斜.有曲6種分類:即1代表僅有上或下曲有交叉;2代表僅有上或下曲且無交叉;3代表僅有左或右曲且有交叉;4代表僅有左或右曲且無交叉;5代表其他的曲且有交叉;6代表其他的曲且無交叉.

      第3位編碼規(guī)則:在有無封閉的基礎(chǔ)上,針對封閉的構(gòu)成分類,無封閉有曲線時(shí),根據(jù)曲線開口方向分類,無封閉無曲線時(shí),筆畫交叉?zhèn)€數(shù)來進(jìn)行分類.封閉提供6種分類:即1代表僅曲線構(gòu)成的封閉,封閉內(nèi)無筆畫;2代表僅曲構(gòu)成封閉,封閉內(nèi)有筆畫;3代表直線加曲構(gòu)成封閉,封閉內(nèi)無筆畫;4代表直線加曲構(gòu)成封閉,封閉內(nèi)有筆畫;5代表直線構(gòu)成封閉,封閉內(nèi)無筆畫;6代表直線構(gòu)成封閉,封閉內(nèi)有筆畫.有曲且無封閉提供4種分類:即1代表僅有左曲;2代表僅有右曲;3代表有左右曲;4代表其它曲線類型.無曲無封閉文字的編碼為:用代碼0表示無交叉,有1處交叉用1表示,依此類推,交叉?zhèn)€數(shù)就是其最后1位代碼.

      綜上所述,便得到一種清晰明確的編碼方案,如圖1所示.

      另外點(diǎn)不作為筆畫.凡文字上部帶弧線的,編碼先以0開頭,去掉上部弧線,之后再編碼2位即可,0代碼表示僅由1種筆畫構(gòu)成的文字,點(diǎn)和曲線除外.

      根據(jù)上述編碼方案,輸入1個(gè)彝文字符最多只需輸入3位數(shù)字代碼,每位代碼有明確的歸類.

      經(jīng)過統(tǒng)計(jì),重碼率如表1所示.

      從圖1可以看出6.99%的重碼率小于10,即輸入編碼后只需在屏幕上選字即可.另外88.76%的字也只需翻6頁之內(nèi),其余的4.25%超過6頁.由此可見,此方案是可行的.

      表1 重碼統(tǒng)計(jì)表

      重碼的范圍是指相同的編碼的文字的統(tǒng)計(jì).比如:1~10指的是,相同的編碼的文字有1~10個(gè)內(nèi)的.重碼的字?jǐn)?shù)是指含有相同編碼文字的個(gè)數(shù).重碼率是指,含有相同編碼的文字在總體中所占的比率.平均擊鍵率如表2所示.

      表2 擊鍵統(tǒng)計(jì)表

      擊鍵率是指輸入1個(gè)文字敲擊鍵盤的次數(shù)在總體敲擊鍵盤次數(shù)中所占的比率.

      1.2 彝文輸入法的實(shí)現(xiàn)過程

      字庫的制作利用計(jì)算機(jī)制作字庫一般要經(jīng)過設(shè)計(jì)字稿、掃描輸入、程序擬合、人工修飾、質(zhì)量檢查、組織字庫、測試字庫、安裝使用等幾個(gè)步驟,彝文字庫也不例外.

      采用造字程序擬合的效率很高,但字的質(zhì)量、結(jié)構(gòu),特別是原設(shè)計(jì)字稿中所包含的鮮明的、人格化的韻味是計(jì)算機(jī)程序無法自動(dòng)表現(xiàn)出來的[7-9],只有靠人工修飾才能做到.

      完成所有字稿上的字以及相應(yīng)修飾工作之后,下一步的就是設(shè)置好字庫的適用平臺(tái)[8].我們使用的是Unicode 1.0/Unicode 1.1/Unicode 2.0和Unicode3.0語義學(xué).之后,由專門人員負(fù)責(zé)裝庫,配上相應(yīng)的符號(hào)及數(shù)字、外文等,然后根據(jù)需要,組織、轉(zhuǎn)換成GBK編碼的標(biāo)準(zhǔn)Windows TrueType字庫.

      彝文字字庫產(chǎn)品的使用要經(jīng)過嚴(yán)格測試.測試字庫的工作包括字形、質(zhì)量、編碼、安裝、使用、顯示、輸出以及產(chǎn)品的完整性、適用性、合理性、兼容性、連續(xù)性等各個(gè)方面.

      經(jīng)過上述幾個(gè)環(huán)節(jié)后,制作好的彝文字字庫就可以安裝到Windows系統(tǒng)中,與我們開發(fā)的彝文輸入法共同使用.

      在彝文輸入法的實(shí)現(xiàn)上,我們采用基于Windows開發(fā)平臺(tái),運(yùn)用imegen.exe輸入法生成器實(shí)現(xiàn)彝文輸入法.彝文字符的編碼段選在Unicode字符集的自定義區(qū),彝文的字體可以兼容宋體.Windows xp/2000下彝文輸入法的使用在Word記事本等文字編輯軟件中測試通過.如圖2所示.

      2 結(jié)語

      本文所介紹的彝文形碼分類輸入法,在使用中僅用到0~9數(shù)字鍵,平均擊鍵率低,重碼率適當(dāng),易學(xué),即使不懂彝文的人也可以正常使用.因此本方法有廣泛的應(yīng)用前景和范圍.

      [1]陳欽梧,郝元禮.漢字筆劃輸入法研究[J].汕頭大學(xué)學(xué)報(bào):自然科學(xué)版,2007,44(3):23 -29.

      [2]武傳坤.信息論、編碼與密碼學(xué)[M].北京:機(jī)械工業(yè)出版社,2004:1 -9.

      [3]郭平欣,張淞芝.漢字信息處理技術(shù)[M].北京:國防工業(yè)出版社,1985.

      [4]陳增武,金連甫.漢字信息處理[M].貴州:貴州人民出版社,1988.

      [5]王頌平.筆順碼和數(shù)字CKE技術(shù)[J].計(jì)算機(jī)世界,1999(44,C):9 -10.

      [6]國家語言文字工作委員會(huì)標(biāo)準(zhǔn)化委員會(huì).現(xiàn)代漢語通用字筆順規(guī)范[M].北京:語文出版社,1997:12-23.

      [7]沙馬拉毅.計(jì)算機(jī)彝文信息處理[M].成都:四川民族出版社,2000.

      [8]吳兵,史軍,劉玉萍,等.基于Linux系統(tǒng)的彝文輸入動(dòng)態(tài)掛接[J].西南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2005,16(4):26 -28.

      [9]李金發(fā).試論計(jì)算機(jī)彝文字符編碼的轉(zhuǎn)換[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2008,17(1):80 -84.

      猜你喜歡
      彝文字庫輸入法
      彝文經(jīng)籍《祭龍經(jīng)·祭彩虹經(jīng)》中的敬畏自然觀研究
      要命的輸入法
      No.2 喜茶聯(lián)合漢儀字庫推出微型書和書簽
      某型號(hào)產(chǎn)品的字庫遷移優(yōu)化設(shè)計(jì)
      電子世界(2018年7期)2018-04-26 08:51:35
      貴州彝文信息技術(shù)研究概述
      中國信息化(2017年8期)2017-11-30 04:02:25
      百度被訴侵犯商標(biāo)權(quán)和不正當(dāng)競爭
      相同字庫條件下激光打印文件特征的變化規(guī)律和特點(diǎn)
      黔西彝文文獻(xiàn)中的孝道故事
      再議字庫知識(shí)產(chǎn)權(quán)保護(hù)
      論彝文假借
      故城县| 朔州市| 荣昌县| 巨鹿县| 南召县| 临猗县| 保靖县| 蒙自县| 宁晋县| 惠安县| 泾源县| 马龙县| 甘孜| 本溪市| 奉化市| 荥阳市| 田东县| 青川县| 南溪县| 中江县| 仁寿县| 湘西| 萨迦县| 绥阳县| 黄冈市| 婺源县| 滁州市| 北宁市| 汽车| 尼勒克县| 股票| 武定县| 衡东县| 六安市| 大关县| 喜德县| 江陵县| 济宁市| 鄂尔多斯市| 斗六市| 武城县|