陳小瑩
(西藏民族大學(xué)信息工程學(xué)院,陜西咸陽712082)
藏文是屬于一種邏輯格語法體系的拼音文字,按照從左到右順序進(jìn)行書寫。書面藏語的音節(jié)字可以只包含一個字母輔音,也可以包含多個字母符號。藏文的音節(jié)字中包含一個主要的輔音字符稱為基字,其余部位的字母符號按照其相對于基字的位置分別命名。其中,上加字位于基字上方,下加字位于基字下方,前加字位于基字的前面,基字后面的字母符號稱為后加字和再后加字。藏文音節(jié)中除了基字不可或缺,其它位置上都可為空。藏文文字以音節(jié)為基本單位,各個音節(jié)之間用音節(jié)符“·”隔開,不同的藏文句子之間一般都有分隔符單垂符“|”的存在,不同的段落用雙垂符“‖”分開[1]。
與漢語拼音和英文字符不同,藏文音節(jié)中的字符并不只是從左到右橫排的,還存在豎排結(jié)構(gòu)。藏文字符同時具有橫向和縱向拼寫的特征也決定了其處理的復(fù)雜性。前加字、基字、后加字與再后加字主要進(jìn)行橫向拼寫,縱向拼寫的主要是基字結(jié)構(gòu),基字部位上下可能存在上加字、下加字和元音的縱向顯示。一般而言,把所有構(gòu)成藏文文字的字符符號統(tǒng)稱為藏文音節(jié)字的部件。藏文音節(jié)結(jié)構(gòu)形式比較多樣化,總體的構(gòu)造規(guī)則相對固定,基字是一個藏文音節(jié)結(jié)構(gòu)中必不可少的一個部件,其它的加字都可以空缺[2]。
在現(xiàn)代藏文文本中,各部件按照藏文正字法組成藏文音節(jié),正字法規(guī)定了一套嚴(yán)格而完整的部件構(gòu)造規(guī)則。但是也存在極少部分不符合藏文正字法的音節(jié),這些音節(jié)可稱為梵音藏文。由于梵音藏文不具備規(guī)律性,且在藏文文本中出現(xiàn)的頻率較低,所以本文的研究主要針對現(xiàn)代藏文。根據(jù)藏文部件構(gòu)造規(guī)則,藏文音節(jié)字橫向上最長為4個字符位置,縱向上可最多存在4層疊加,橫向和縱向以基字為中心,藏文的一個音節(jié)最多可以包含7個部件[3]。藏文音節(jié)結(jié)構(gòu)如圖1所示。
圖1 現(xiàn)代藏文音節(jié)結(jié)構(gòu)圖Fig.1 Modern Tibetan syllable structure diagram
依據(jù)藏文正字法知識,同時結(jié)合藏文部件構(gòu)造規(guī)則,現(xiàn)代藏文音節(jié)字必須滿足以下2個條件:
(1)藏文音節(jié)結(jié)構(gòu)中所有的部件組合形式必須滿足現(xiàn)代藏文音節(jié)的結(jié)構(gòu)。
(2)藏文音節(jié)結(jié)構(gòu)中所有部件的組合搭配要符合藏文音節(jié)部件構(gòu)造規(guī)則。
一般情況下,在對現(xiàn)代藏文音節(jié)分析時,首先要正確判斷出藏文音節(jié)的結(jié)構(gòu)形式,確定出音節(jié)中的基字;其次,再確定出藏文各部件的編碼序列;最后結(jié)合藏文正字法知識以及小字符集編碼特點,判別是否符合現(xiàn)代藏文音節(jié)的組合方式。
藏文中3 0個輔音字母均可以作為基字,其中一些在基字字性分類中原都屬于弱音勢的陰性字(濁音字母)“”可以做前加字,當(dāng)將其改變位置作為前加字與特定的基字組合時,輔音字母的字性會改變,對應(yīng)的也會發(fā)生音變[4-5]。前加字與基字的組合規(guī)則為[6]:陽性前加字“”除同組字母外還能與陽性基字“”和陰性基字結(jié)合,但是不能與中性基字和其它字母結(jié)合;陰性前加字“”能與陰性基字和中性基字結(jié)合,不能與其它基字結(jié)合;中性前加字“”能與陽性基字和陰性基字結(jié)合,不能與其它字母結(jié)合;中性前加字“”能與陽性基字和陰性基字結(jié)合,不能與其它字母結(jié)合;極陰前加字“”能與中性基字和陰性基字結(jié)合,不能與其它字母結(jié)合。1 0個輔音字母可以作為后加字,在1 0個可以作后加字的輔音字母中,有4個后加字后面還可以再加一個輔音字母,作為再后加字。后加字是置于基字所含元音韻母后面做韻尾的,可以與所有的基字橫向組合。此外,還有4個輔音字母可以在藏文音節(jié)中作為下加字存在。藏文輔音字母中有3個輔音字母可以加在一部分基字上作為上加字。
藏文正字法知識規(guī)定了藏文音節(jié)結(jié)構(gòu)中不同位置上的部件組合方式,在具體分析藏文音節(jié)結(jié)構(gòu)時,分別從各位置部件組合時應(yīng)滿足的條件進(jìn)行分析說明[1],對此可做闡釋解析如下。
(1)前加字、上加字和下加字應(yīng)滿足如下條件:
(2)元音、后加字和再后加字應(yīng)滿足如下條件:
①藏文音節(jié)中有可能不顯示元音,但是一般會在發(fā)音時加上/a/音,也可以是中之一;
藏文文字在計算機(jī)中是以編碼的形式顯示的,但是因目前對藏文編碼的研究各不相同,造就了不同的藏文編碼方式,從而藏文編碼形式各異。從目前對藏文的研究來看,藏文的編碼方案可以分為大字符集編碼方案和小字符集編碼方案兩種。其中,大字符集編碼方案將藏文中縱向結(jié)構(gòu)的字丁組合按照一個單元進(jìn)行橫向編碼,小字符集編碼方案通過對藏文基本字符建庫,藏文文字通過藏文基本字符動態(tài)組合形式顯示,不同顯示方式的藏文基本字符對應(yīng)不同的編碼[7]。
小字符集編碼方案中對藏文中前加字、基字、上加字、下加字、后加字與再后加字等部件進(jìn)行編碼。帶有縱向結(jié)構(gòu)的字丁組合在計算機(jī)顯示時只占據(jù)一個字符,字符的寬度由縱向字丁組合中的第一層輔音決定,此時第一層輔音為占位輔音,對應(yīng)的編碼為占位輔音編碼,該占位輔音下方的字符不單獨占寬度,稱為非占位輔音,對應(yīng)的輔音編碼稱為非占位輔音編碼[7]。在藏文文字中,元音都在輔音的上方或下方以疊加方式存在,依附于縱向結(jié)構(gòu)的其它字丁,不單獨占寬度,因而其也為非占位字符。
通過上文的分析,在藏文音節(jié)結(jié)構(gòu)中,輔音有可能是占位輔音、也有可能是非占位輔音,對應(yīng)占位輔音編碼和非占位輔音編碼,元音只能是非占位字符。結(jié)合上文藏文文字特點和拼寫規(guī)律,同時結(jié)合藏文正字法知識,在對藏文音節(jié)結(jié)構(gòu)進(jìn)行判定時,如音節(jié)結(jié)構(gòu)中有占位輔音,則該占位輔音可能為前加字、上加字、基字、后加字或者再后加字;如音節(jié)結(jié)構(gòu)中有非占位輔音,則非占位輔音可能為基字或下加字。由此可以歸納總結(jié)藏文音節(jié)的編碼特點:現(xiàn)代藏文音節(jié)中最多只能存在一個縱向結(jié)構(gòu)的字丁組合;如果該縱向結(jié)構(gòu)字丁組合中僅存在一個占位輔音,那么連同元音在內(nèi)最多包含3個連續(xù)的非占位字符;前加字、后加字和再后加字都是占位輔音[7]。所以,在對藏文音節(jié)進(jìn)行判定過程中,判定的關(guān)鍵是判定出該音節(jié)結(jié)構(gòu)中的占位輔音和非占位輔音,確定基字后,再結(jié)合藏文正字法知識,進(jìn)一步對藏文的音節(jié)結(jié)構(gòu)進(jìn)行判定。
本文主要對現(xiàn)代藏文音節(jié)結(jié)構(gòu)進(jìn)行了分析和研究,通過分析藏文的文字特點和拼寫規(guī)律同時結(jié)合藏文正字法知識,對藏文正確的拼寫結(jié)構(gòu)做出了歸納和總結(jié),接下來則依據(jù)小字符集編碼方案對藏文音節(jié)不同的部件實現(xiàn)劃分和確定,最終達(dá)到對藏文音節(jié)結(jié)構(gòu)進(jìn)行判斷,從而識別藏文音節(jié)結(jié)構(gòu)中不同的部件。但是由于梵文音節(jié)和外來的新造詞的存在,結(jié)果會對藏文音節(jié)結(jié)構(gòu)的判定產(chǎn)生一定的影響,這在未來工作中需要展開后續(xù)的研究和深化。