郭曉然
摘要:為實現(xiàn)唐卡數(shù)字資源的共享和重用,建立用計算機語言來表達的唐卡領(lǐng)域知識系統(tǒng),從現(xiàn)有的本體相關(guān)理論出發(fā),使用本體的形式化定義形式,對唐卡的概念進行語義形式化描述,利用七步法構(gòu)建了唐卡領(lǐng)域的核心本體,對唐卡分類、唐卡知識庫構(gòu)建、唐卡信息智能檢索等方面的進一步研究具有重要意義。
關(guān)鍵詞:唐卡;本體;七步法;領(lǐng)域本體
中圖分類號:TP311.5 文獻標識碼 A 文章編號:1009-3044(2014)21-5090-03
唐卡以各種象征性的圖像符號傳達著藏傳佛教神秘又深奧的教義,是千百年來藏民族在文化、歷史的發(fā)展中積累的重要遺產(chǎn),為實現(xiàn)唐卡數(shù)字資源的共享和重用,建立用計算機語言來表達的唐卡領(lǐng)域知識系統(tǒng)顯得尤為重要,不僅有利于唐卡知識的共享和交流,為博物館、圖書館、寺院、藏學研究者、唐卡繪畫者、唐卡收藏愛好者等提供唐卡知識學習和研究鑒賞等服務,而且對唐卡文化遺產(chǎn)的保護具有重要的促進作用。
本體(Ontology)這個概念最初起源于哲學,是關(guān)于存在及其本質(zhì)和規(guī)律的學說,后來被廣泛引入到信息技術(shù)、知識工程、人工智能等領(lǐng)域。目前,本體還沒有一個既準確又公認的定義,廣泛使用的定義是由Gruber在1993年提出的“本體是概念化的明確的規(guī)范說明”,后來Studer等人又作了補充:“本體是共享概念模型的明確的形式化規(guī)范說明”。根據(jù)本體研究的主題及層次,將本體分為:知識表示本體、通用或頂層本體、領(lǐng)域本體、語言學本體、任務本體等五大類,其中領(lǐng)域本體是一種新興的領(lǐng)域知識表示和共享的方法,能詳細描述特定領(lǐng)域的概念及概念間關(guān)系,消除領(lǐng)域內(nèi)部概念和術(shù)語上的分歧,提供對該領(lǐng)域知識的共同理解,實現(xiàn)領(lǐng)域知識的共享和重用 [1-4]。將本體論思想引入唐卡領(lǐng)域,建立唐卡領(lǐng)域的本體模型,實現(xiàn)唐卡領(lǐng)域知識的形式化描述,這對唐卡分類、唐卡知識庫構(gòu)建、唐卡信息智能檢索等方面的進一步研究具有重要意義。
1 唐卡領(lǐng)域本體的構(gòu)建
目前,本體構(gòu)建并沒有統(tǒng)一的方法,常用的方法有:SENSUS法、骨架法、評估法、七步法等等。參考斯坦福大學醫(yī)學院開發(fā)的領(lǐng)域本體構(gòu)建七步法,提出了適合唐卡領(lǐng)域本體的構(gòu)建方法[5-6]。
1.1 確定本體的專業(yè)領(lǐng)域和范疇。
唐卡題材廣泛、種類繁多、形式多樣、顏色復雜。內(nèi)容涉及歷史事件、宗教、人物、風土人情、民間傳說、神話故事、建筑布局、天文歷法和藏醫(yī)藏藥等多個方面。構(gòu)建一個完整或完善的唐卡領(lǐng)域本體是一項極其浩大的工程,其工作量也是非常巨大的。為保證研究工作順利進行,該文嘗試縮小范圍,將宗教肖像類唐卡作為研究對象,進行唐卡領(lǐng)域本體的構(gòu)建。
宗教肖像類唐卡中央一般繪有主尊造像,即信徒供養(yǎng)膜拜的對象,如大日如來佛、四臂觀音、蓮花生大師、白度母、護法神等,主尊是宗教類唐卡的核心內(nèi)容,全面揭示藏傳佛教信仰的主體,代表了藏民族寶貴的精神文明。根據(jù)主尊在西藏佛教文化中的具體地位與身份特點,通常將主尊分類為:佛 —“覺悟者”,佛是指所有修成正果的大覺悟者,如釋迦牟尼佛、阿彌陀佛、藥師佛等;祖師—藏傳佛教徒對自己導師的尊稱;菩薩—“覺悟的眾生”、“有廣大愛心的人”。此外有佛母、羅漢、空行、護法和地方神等類別[7]。
1.2 列出本體中的重要術(shù)語和概念
通過閱讀大量唐卡方面的專業(yè)相關(guān)書籍、畫冊,同唐卡領(lǐng)域研究專家交流等方式獲取唐卡方面的領(lǐng)域知識,列出宗教肖像類唐卡領(lǐng)域涉及到的重要術(shù)語清單,并盡可能詳細地對它們進行含義界定。通過語義分析和概念的合并,匯總整理出核心概念集和術(shù)語如下:
①唐卡主尊名稱
實例:釋迦牟尼佛、燃燈佛、彌勒佛、四臂觀音、獅吼觀音、文殊菩薩、尊勝佛母、大白傘蓋佛母……
②描述主尊的主要畫面元素
實例:面相(憤怒、半怒、寂靜等),面數(shù)(一面、兩面、三面等),膚色(白色、紅色、黃色、藍色、綠色等),手印(無畏印、與愿印、禪定印、說法印等),法器(法輪、缽凈瓶蓮花寶鏡、琵琶等)……
③所屬教派
實例:寧瑪派、薩迦派、噶當派、噶舉派、格魯派……
④制作材料
實例:紙、布、酥油、木料、金屬、石材……
⑤制作方法
實例:繪制、堆繡、刺繡、緙絲、貼花、打籽繡、版印……
此外還有作者、唐卡作品風格或流派、制作時代、收藏地等通用概念。
1.3 定義類和類的等級體系
上一步驟中產(chǎn)生的大量概念是僅僅一張毫無組織結(jié)構(gòu)的詞匯表,還需建立該領(lǐng)域本體的框架。建立一個類的等級體系結(jié)構(gòu)常用的有兩種方法:一是自頂向下法,首先確定一個領(lǐng)域中最大的概念,然后將這些概念逐步細化;二是自底向上法,從底層最小類即最小概念出發(fā),將它們加以組織、概括,放在更加綜合的概念之下。該文結(jié)合兩種辦法,利用綜合法構(gòu)建宗教肖像類唐卡領(lǐng)域本體,期間通過查閱大量資料,向領(lǐng)域?qū)I(yè)請教等方式,對每一個概念的重要性進行評估,篩選出關(guān)鍵性概念,去掉那些不必要或者超出領(lǐng)域范圍的概念,盡可能精簡的表達出領(lǐng)域的知識,最終形成一個系統(tǒng)的框架體系。
本文所開發(fā)的宗教肖像類唐卡領(lǐng)域本體主要包括4個大類:唐卡圖像文本信息類、唐卡主尊名稱類、描述主尊的主要畫面元素類、相關(guān)信息類。每個大類下面繼續(xù)劃分成不同的子類,子類會自動繼承父類的屬性。
唐卡圖像文本信息類用來描述唐卡圖像文件屬性,包括圖像的編號、圖像占用存儲空間的大小、圖像的存儲格式、圖像的存儲位置,創(chuàng)建該類是為了與唐卡的圖像數(shù)據(jù)庫相對應。
按照唐卡中繪制的主尊不同,將唐卡主尊名稱類分為佛、菩薩、佛母、度母、空行、金剛、護法、羅漢、祖師、地方神和歷史人物10個子類。每個子類下面再繼續(xù)細化,例如佛類包括:釋迦牟尼佛、燃燈佛、彌勒佛、不動佛、三世佛、強巴佛、大日如來、五方佛、無量壽佛、藥師佛等[8]。
唐卡圖像構(gòu)圖復雜、組成元素較多,如圖1所示。通常描述和識別中央主尊的主要畫面元素有:面相、面數(shù)、頭飾、膚色、左手印、右手印、姿態(tài)、法器、頭光、背光、座臺等等,因此定義描述主尊的主要畫面元素類與之對應。
此外還有與唐卡有關(guān)的相關(guān)信息類,例如,根據(jù)所屬教派不同將唐卡分為:寧瑪派、薩迦派、噶當派、噶舉派、格魯派;根據(jù)顏色分為:黑唐、紅唐、彩唐、金唐;根據(jù)制作方法可分為:繪制、堆繡、刺繡、緙絲、貼花、打籽繡、版印。還可以按照作者等其他方式進行劃分,以上這些都作為相關(guān)信息類的子類。
1.4 定義類的屬性
在本體中,類僅僅描述了一個框架,還不能確切地描述一個領(lǐng)域。因此,需要繼續(xù)定義這個類的內(nèi)部結(jié)。Protege中常用有兩種類型的屬性:Datatype Properties 和Object Properties 。Datatype Properties(數(shù)據(jù)類型屬性)代表了個體實例和基本數(shù)據(jù)類型的關(guān)系,使用時需賦予一個具體的屬性值,常用有字符型、數(shù)值型、布爾型、日期時間型等。 Object Properties(對象屬性),用于建立兩個類的實例之間的關(guān)系。例如:唐卡主尊名稱和描述主尊的主要畫面元素之間定義一系列的對象來連接,如表1所示。此外,唐卡作者和唐卡之間是繪制和被繪制的關(guān)系,唐卡和唐卡作品風格或流派之間是隸屬關(guān)系。所有屬性都具有繼承性,即父類的子類都具有該父類的所有屬性。
1.5 定義屬性的取值
屬性的取值又稱屬性得分面,用來描述取值的類型、容許的取值以及取值的個數(shù)等其它特征。如描述唐卡主尊的主要畫面元素中的面相取值類型是字符型,取值范圍是憤怒、半怒、寂靜;手印取值類型是字符型,取值范圍是:無畏印、與愿印、禪定印、說法印、觸地印、智拳印、辯法印、禮供印、定地印、期克印、合十印、殊勝三界印、安慰印、拔濟眾生印、彌陀定印等。
1.6 創(chuàng)建實例
創(chuàng)建實例是完成上述定義后的一個階段,即將類進行實例化。方法是先建立一個類,然后創(chuàng)建這個類的實例,添加這個類的屬性值。例如:一幅唐卡名稱為釋迦牟尼佛、面相是慈祥、面數(shù)是1、頭飾是發(fā)髻、膚色是黃色、左手印是禪定印、右手印是觸地印、姿態(tài)是金剛跏趺、持物是缽盂、頭光是圓形、背光是馬蹄形、座臺是蓮花座、所屬教派是同屬四大教派。
通過以上步驟,可不斷豐富和完善宗教肖像類唐卡領(lǐng)域本體庫,使領(lǐng)域中的概念以及概念間的關(guān)系更加規(guī)范描述,為構(gòu)建層次清晰、內(nèi)容豐富、體系完善的唐卡領(lǐng)域知識庫做重要鋪墊。
2 討論
利用本體思想,結(jié)合領(lǐng)域知識,初步構(gòu)建了宗教肖像類唐卡領(lǐng)域本體的模型,闡述了構(gòu)建的方法和步驟,為基于本體的唐卡知識庫構(gòu)建、唐卡語義檢索等其它的應用性研究做有益的嘗試。
在唐卡領(lǐng)域本體開發(fā)過程中,發(fā)現(xiàn)存在以下問題,需要在以后的研究中作更加深入的探討:
1)唐卡堪稱是融會佛教精神、世間技術(shù)和個人創(chuàng)造力的“百科全書”,知識豐富,涉及方面眾多,因此需要不斷完善唐卡方面的領(lǐng)域知識。
2)描述唐卡概念的數(shù)據(jù)模型需進一步完善。每一幅唐卡,除了描述主尊本身的主要畫面元素外,還應考慮其他一些重要信息,如:伴神、貢品、自然界景物、圖案裝飾、主尊上下界的背景等,以及唐卡構(gòu)圖各元素間的空間關(guān)系,這樣才能較全面的描述一副唐卡的詳細語義。
參考文獻:
[1] Gruber T R.A Translation Approach to Portable Ontology Specifications[J].Knowledge Acquisition,1993,5(2):199-200.
[2] 張福男.打印機領(lǐng)域本體的創(chuàng)建及應用研究[D].大連:大連理工大學,2009.
[3] 賈雪峰.基于林業(yè)主題詞表構(gòu)建林業(yè)領(lǐng)域本體的研究[D].北京:北京林業(yè)大學,2010.
[4] 李麗莎,夏利民,王正武.基于本體的圖像自動標注[J].微計算機信息,2012,28(4):150-152.
[5] 彭勃.領(lǐng)域本體構(gòu)建方法研究[J].電腦知識與技術(shù),2009(10):610-611.
[6] 楊海艷.本體的相似性關(guān)系的研究[D].南京:南京航空航天大學,2007.
[7] 楊蔚.宗教類唐卡圖像知識庫的構(gòu)建研究[D].蘭州:西北民族大學,2011.
[8] 吉布.唐卡的故事[M].西安:陜西師范大學出版社,2004.