■ 云南麗江師范高等??茖W校 王兆春
背景:東巴象形文字是一種納西族最原始的圖畫象形文字,以前主要由納西族祭司及東巴經(jīng)師傳授和使用,主要用于撰寫東巴經(jīng)書故稱東巴文。納西話叫“司究魯究”其中“司”為木、“魯”為石、“究”為痕跡,意為“木跡石跡”,見木畫木,見石畫石之意。東巴文共有1500多個單字,詞義豐富,能夠清晰細膩的表達人們的思想情感,能清晰明了的記錄復雜多樣的事件,也能寫詩作文。東巴文被稱之為世界唯一存活著的象形文字,被譽為文字的“活化石”。2003年,東巴古籍被聯(lián)合國教科文組織列入世界記憶名錄。東巴文字的最大特點正如清代余慶遠在《維西見聞錄》中所道:“專象形,人則圖人,物則圖物,以為書契”。這些字形帶有濃厚的圖畫味道。東巴象形文字在歷史、人文等領(lǐng)域已有深入的研究,但東巴文字單純從數(shù)學角度對其進行研究的目前還很少。而且現(xiàn)有的東巴文化數(shù)字化資源內(nèi)容相對淺顯,不利于深入學習?,F(xiàn)有的數(shù)字化資源相似度較高,雖然有不同的偏重點,但是其中有很多內(nèi)容都是相同的。另外,這些資源多為文字、圖片或視頻資料,數(shù)字化形式單一,還停留在靜態(tài)保護的層面,無法全面體現(xiàn)蘊含在東巴文化中的文化內(nèi)涵、民族精神和價值觀。更沒有對東巴文字進行微觀數(shù)字化研究。
研究對象:本文將以方國瑜先生的《納西象形文字譜》、和品正先生的《東巴常用字典》、趙凈修先生的《東巴象形文常用字詞譯注》中的東巴象形文字為研究對象,構(gòu)建東巴象形文字庫,文字庫共計1570個東巴象形文字分成數(shù)詞類、天象類、時令類、地理類、方位類、植物類、畜禽類、鳥類、獸類、蟲魚類、人體器官類、人物稱謂類、勞作類、餐飲類、器物類、形容詞類等16大類。再根據(jù)模型建構(gòu)的難易程度分成簡單文字庫共計1432個東巴象形文字和復雜文字庫共計138個東巴象形文字。
研究方法:下面我們用東巴文字:
“k'? d? dz?r m? ts'?r,bi ho d?i m? guo”譯為“根深樹不倒、林茂水長流”,我們以其中的第一個東巴文字k'?(根)為例進行數(shù)學模型的建構(gòu)。具體操作步驟如下:
第二步:在Getdata Dragh Digitizer軟件中對圖片建立平面直角坐標系。為了方便操作我們將橫縱坐標都統(tǒng)一約定為0-10。并統(tǒng)一規(guī)定x軸的變量為自變量,y軸的變量為因變量。
第三步:根據(jù)x軸自變量的單調(diào)性把圖像分成以下四個部分。具體如圖一的紅線所示:
圖一
第四步:用Point capture mode對四個部分分別進行圖像數(shù)據(jù)化。
第五步:對第四步的數(shù)據(jù)在Excel中進行預處理。
第五步:在Matlab中對第五步的離散數(shù)據(jù)用Savitzky-Golay卷積平滑法對離散數(shù)據(jù)進行去噪處理。
第六步:在Matlab中對第五步中去噪后的數(shù)據(jù)進行合理擬合。
如下圖二所示將圖像的第一部分數(shù)據(jù)化后,再將數(shù)據(jù)去噪處理,最后將處理后的數(shù)據(jù)在Matlab軟件中進行擬合,一般擬合過程中擬合的次數(shù)不超過5次。根據(jù)第一部分圖像的數(shù)學性質(zhì)我們在擬合時選取了2次擬合。圖二右半部分藍線段為擬合的函數(shù)圖像,紅點為我們用Point capture mode對第一部分進行圖像數(shù)據(jù)化的離散數(shù)據(jù),擬合的函數(shù)與離散數(shù)據(jù)基本吻合因此擬合函數(shù)選取合理,具體的擬合函數(shù)為y=-0.3282x2+3.3021x+2.9673。
圖二
同理可將剩余的三部分依次數(shù)據(jù)化后,再將數(shù)據(jù)在Excel中進行預處理,然后將數(shù)據(jù)進行去噪處理,最后將處理后的數(shù)據(jù)在Matlab軟件中選取適當?shù)暮瘮?shù)進行擬合即三次重復上述6個步驟得到三個擬合函數(shù)。擬合的函數(shù)分別為:y=0.0140x4-0.2873x3+2.0059x2-5.2620x+4.7936,y=-0.0951x3+2.0084x2-13.6588x+36.3840,y=-0.2346x2+5.4821x-14.9517。
第七步:根據(jù)第六步的四個分段擬合函數(shù)對每個擬合函數(shù)選取適當?shù)亩x域范圍,k'?(根)就可以由第六步的四個函數(shù)共同擬合而成即構(gòu)建出k'?(根)的數(shù)學模型。
擬合函數(shù)的圖像如圖三的右半部分所示,而圖三的左半部分是我們用Point capture mode對總的四個部分進行圖像數(shù)據(jù)化的離散數(shù)據(jù)構(gòu)成的圖像,擬合的函數(shù)圖像與離散數(shù)據(jù)圖像基本吻合,因此擬合函數(shù)及其定義域范圍選取合理整個東巴文字擬合完畢。
圖三
結(jié)語:根據(jù)上述的方法步驟所有的1570東巴象形文字都可以構(gòu)造出對應的數(shù)學模型及對應的數(shù)據(jù)庫,這為東巴象形文字數(shù)字化和東巴經(jīng)典古籍象形文字智能識別奠定了良好的基礎(chǔ)。也在大數(shù)據(jù)時代為東巴文化遺產(chǎn)系統(tǒng)性、活態(tài)性保護與傳承奠定了結(jié)實的基礎(chǔ)。也為2D或3D建模、場景搭建、人機交互等技術(shù)等使東巴文化數(shù)字化資源得到最大限度地共享和利用,為廣泛傳播東巴文化奠定基礎(chǔ)。