扎西
一、背景
1997年,我國(guó)的藏文小字符集(基本字符集,簡(jiǎn)稱(chēng)基本集)被收入了國(guó)際標(biāo)準(zhǔn)ISO/IE 10646 《信息技術(shù) 通用多八位編碼字符集》(對(duì)應(yīng)的我國(guó)國(guó)家標(biāo)準(zhǔn)編號(hào)為GB 13000)。同年,我國(guó)發(fā)布了國(guó)家標(biāo)準(zhǔn)GB/T 16959-1997《信息技術(shù)信息交換用藏文編碼字符集基本集》。
由于藏文本身的書(shū)寫(xiě)特點(diǎn)和現(xiàn)階段我國(guó)技術(shù)水平的限制,僅靠藏文基本集,難以徹底解決 藏文信息處理和交換問(wèn)題。為此,我國(guó)專(zhuān)家于2002年向國(guó)際標(biāo)準(zhǔn)化組織提交了藏文編碼字符集擴(kuò)充集提案(“大丁”字符集,本標(biāo)準(zhǔn)草案的前身和技術(shù)基礎(chǔ)),由于非技術(shù)原因,該提案未被采納。但我國(guó)的藏文信息化建設(shè)卻不能因此而停頓,因此,國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)于2002年底下達(dá)了制定藏文編碼字符集擴(kuò)充集的任務(wù)。
二、藏文編碼國(guó)家標(biāo)準(zhǔn)制定的原則
以2004年04月13日藏文編碼標(biāo)準(zhǔn)編制工作組第一次會(huì)議(北京,電子工業(yè)標(biāo)準(zhǔn)化研究所)和2004年6月藏文編碼工作組第二次會(huì)議(拉薩,拉薩飯店)紀(jì)要的內(nèi)容為準(zhǔn),結(jié)合2003年12月成都會(huì)議的決議,確定了藏文編碼國(guó)家標(biāo)準(zhǔn)制定的指導(dǎo)綱要,即“在國(guó)際標(biāo)準(zhǔn)框架下制定藏文大字符集編碼國(guó)家標(biāo)準(zhǔn),定義垂直預(yù)組合的藏文字符,應(yīng)作為我國(guó)藏文信息處理發(fā)展的策略;同時(shí),不排斥小字符集的技術(shù)方案,并積極跟蹤研究動(dòng)態(tài)組合技術(shù)”。
三、藏文大中小字符集及字匯定義
基本藏文字符集(Basic set):已經(jīng)在0F00-0FCF編碼的全部藏文字符(又稱(chēng)小字符集,共有195個(gè)編碼字符和15個(gè)未用的編碼位置)。所收集的字符及各種用符號(hào)分別 由“非組合字符”和“組合字符”組成。
擴(kuò)充字符集A (Extension set A) :由基本字符縱向疊加而成的結(jié)構(gòu)穩(wěn)定的藏文字符和最常用梵音轉(zhuǎn)寫(xiě)字符的集合。
四、擴(kuò)充字符集A的字符確定依據(jù)
1.擴(kuò)充字符集A共有1536個(gè)垂直預(yù)組合字符。
2.現(xiàn)代藏文(三次規(guī)范后的藏文書(shū)寫(xiě)形式)、古藏文(規(guī)范之前藏文書(shū)寫(xiě)形式)和已成 為藏文部分的梵音轉(zhuǎn)寫(xiě)藏文字符,共 962個(gè)字符。
3.最常用梵音轉(zhuǎn)寫(xiě)藏文字符574個(gè)。以西藏收集的大字符集、藏學(xué)中心提供的出現(xiàn)頻率 高的梵音轉(zhuǎn)寫(xiě)藏文字符和其它佛教經(jīng)典中出現(xiàn)的常用梵音轉(zhuǎn)寫(xiě)藏文字符為主要依據(jù), 同時(shí)參考了青海師大、西北民大提供的字頻統(tǒng)計(jì),確定了574個(gè)最常用梵音轉(zhuǎn)寫(xiě)藏文字符。
五、與我國(guó)有關(guān)的現(xiàn)行法律、法規(guī)和相關(guān)強(qiáng)制性標(biāo)準(zhǔn)的關(guān)系
1.藏文擴(kuò)充集A與GB/T 16959-1997(藏文基本集)的關(guān)系
擴(kuò)充集A是基本集的擴(kuò)充集;
擴(kuò)充集A和基本集能表示和交換以現(xiàn)代藏文為載體的所有信息,滿(mǎn)足現(xiàn)代藏文信息處理的需要。
2.藏文擴(kuò)充集A與GB 13000的關(guān)系
GB 13000規(guī)定了通用多八位編碼字符集(UCS)。它可用于世界上各種語(yǔ)言(文字)的書(shū)面形式 以及附加符號(hào)進(jìn)行表示、傳輸、交換、處理、存儲(chǔ)、輸入及顯現(xiàn)。
本標(biāo)準(zhǔn)的編碼字符集與 GB 13000的多八位基本多文種平面的形式一致。適用于藏文的書(shū)面形式 的表示、傳輸、交換、處理、存儲(chǔ)、輸入及顯現(xiàn)。