尤建輝
[摘 要]計(jì)算機(jī)技術(shù)的發(fā)展為解決出土文獻(xiàn)整理難題提供了全新機(jī)遇。短短的二十多年間,國內(nèi)外利用計(jì)算機(jī)技術(shù)編制了大量的出土文獻(xiàn)數(shù)字化資源。雖然數(shù)字化整理取得了很大成就,但仍有一些值得思考的問題亟須我們解決。
[關(guān)鍵詞]出土文獻(xiàn);數(shù)字化;資料庫
出土文獻(xiàn)的整理是一門技術(shù)性、綜合性要求很高的基礎(chǔ)工作,在學(xué)界甚受重視。王國維《古史新證》中說:“吾輩生于今日,幸于紙上之材料外更得地下之新材料。由此種材料,我輩固得據(jù)以補(bǔ)正紙上之材料,亦得證明古書之某部分全為實(shí)錄,即百家不雅馴之言亦不無表示一面之事實(shí)?!保?)以“地下之新材料”補(bǔ)充“紙上之材料”,對(duì)于資料相對(duì)缺乏的先秦兩漢文史哲研究,具有重大作用和重要意義。然而對(duì)散佚的簡牘、文書、碑刻等進(jìn)行的收集工作浩繁,整理研究花費(fèi)時(shí)間長,導(dǎo)致這類“遺產(chǎn)”不被重視人成為“危產(chǎn)”,當(dāng)前對(duì)出土文獻(xiàn)的搶救、保護(hù)、整理和研究,有許多亟待解決的問題,[1]出土文獻(xiàn)的數(shù)字化整理是解決這一難題最有效的方法。
出土文獻(xiàn)數(shù)字化整理就是利用計(jì)算機(jī)技術(shù),將常見的文字或圖形符號(hào)轉(zhuǎn)化為數(shù)字符號(hào)的過程。出土文獻(xiàn)數(shù)字化以其特有的資源特點(diǎn)必將給出土文獻(xiàn)整理帶來全新的機(jī)遇,其重要性和意義在于:一是有利于瀕危出土文獻(xiàn)的搶救和保護(hù);二是出土文獻(xiàn)全文數(shù)據(jù)庫有利于全方位開發(fā)利用出土文獻(xiàn);三是有利于古籍文獻(xiàn)資源的網(wǎng)絡(luò)共享。
一、數(shù)字化整理成果(2)
在短短的二十多年間,國內(nèi)外利用計(jì)算機(jī)技術(shù)編制了大量出土文獻(xiàn)數(shù)字化資源。圖書館和研究機(jī)構(gòu)是出土文獻(xiàn)收藏和研究的主要機(jī)構(gòu),負(fù)有對(duì)出土文獻(xiàn)的保存、利用和研究的重要職責(zé),因此也是出土文獻(xiàn)數(shù)字化資源建設(shè)的主要單位。
日本收藏有大量的中文古籍,隨著古籍?dāng)?shù)字化進(jìn)程的開展,日本各大科研機(jī)構(gòu)也開始將簡帛文獻(xiàn)數(shù)字化,并提供網(wǎng)絡(luò)化服務(wù)。其中在簡帛文獻(xiàn)數(shù)字化資源的開發(fā)與建設(shè)方面,以早稻田大學(xué)和奈良文化財(cái)研究所最具成就。(一)早稻田大學(xué)文學(xué)部工藤研究室開發(fā)的“楚簡數(shù)據(jù)庫”由簡牘資料庫和楚系文字資料庫組成,內(nèi)容包括楚帛書、鄂君啟節(jié)、天星觀楚簡、信陽楚墓竹簡、包山楚簡、郭店楚簡、曾侯乙墓竹簡、望山楚簡等9個(gè)地點(diǎn)新出土的帛書和竹簡,具備良好的檢索功能,使用者可選擇特定文本與篇章或全部文獻(xiàn)進(jìn)行檢索。(二)奈良文化財(cái)研究所制作的“web版木簡數(shù)據(jù)庫”包括木簡數(shù)據(jù)庫、墨書土器數(shù)據(jù)庫、文書數(shù)據(jù)庫、遺跡數(shù)據(jù)庫等,可提供瀏覽檢索、文字檢索和全文影像閱讀。
港臺(tái)地區(qū)已開發(fā)出許多出土文獻(xiàn)數(shù)字化資源,其單位主要為港臺(tái)地區(qū)的研究機(jī)構(gòu)和部分?jǐn)?shù)字化公司,其中以香港中文大學(xué)中國文化研究所和臺(tái)灣“中研院”歷史語言研究所最具特色。(一)香港中文大學(xué)中國文化研究所古文獻(xiàn)數(shù)據(jù)庫中心開發(fā)制作的“漢達(dá)文庫”包括甲骨文資料庫、竹簡帛書資料庫、金文資料庫、先秦兩漢資料庫、魏晉南北朝資料庫、中國傳統(tǒng)類書資料庫及中國古代詞匯資料庫,其中“甲骨文資料庫”收錄當(dāng)今海內(nèi)外七種主要大型甲骨書籍,共計(jì)卜辭53834片,約近100萬字甲骨卜辭,可同時(shí)顯示甲骨文字原字形及隸定釋文,可通過甲骨單字、關(guān)聯(lián)字串以及句式進(jìn)行檢索;“竹簡帛書資料庫”收錄十二種竹簡帛書出土文獻(xiàn),約近140萬字,可同時(shí)顯示簡帛圖片和對(duì)照釋文,可提供單字、字串及句式檢索文獻(xiàn),檢索結(jié)果可直接列印或存檔。(二)由香港中文大學(xué)中國文化研究所與中國社會(huì)科學(xué)院歷史研究所共同開發(fā)的“甲骨文全文資料庫”主要以胡厚宣主持編纂的《甲骨文合集》13冊(cè)釋文為底本輸入所收入的四萬余片甲骨上的近百萬字卜辭。(三)香港中文大學(xué)圖書館與香港中文大學(xué)中國語言及文學(xué)系張光裕教授共同制作的“郭店楚簡資料庫”主要為張光裕教授《郭店楚簡研究第一卷文字編》乙書載錄的《老子》《太一生水》《緇衣》《魯穆公問子思》《五行》《尊德義》等十六篇道家及儒家著作,可按竹簡編號(hào)、篇目名稱或相關(guān)字詞檢索,支持全文檢索,以及于2001年12月新增的“郭店楚簡主要參考論著”檢索系統(tǒng),可按作者、書/篇目或出處項(xiàng)檢索。(四)臺(tái)灣“中研院”歷史語言研究所開發(fā)制作的“簡帛金石資料庫”包括先秦至魏晉的簡牘、帛書、碑刻、官印、鏡銘等,收錄60余種簡帛金石資料及研究書目共3401684字的純文字?jǐn)?shù)據(jù),以及居延漢簡補(bǔ)編(共1324簡)等圖文資料,支持布爾運(yùn)算、多項(xiàng)目查詢、詞組查詢、排除字符及自然語言查詢。(五)臺(tái)灣“中研院”歷史語言研究所開發(fā)制作的“先秦甲骨金文簡牘詞匯資料庫”分為詞匯檢索與全文檢索,收錄甲骨文、金文和簡牘三種文字材料,依詞類、材質(zhì)作為搜尋條件,展示詞匯的詞性、時(shí)代、書目來源、釋文段落,現(xiàn)階段詞匯共收錄約13萬筆,每個(gè)詞匯包括出處、編號(hào)、上下文,便于使用者回查與檢閱,幫助理解詞匯意義。
中國大陸地區(qū)是簡帛文獻(xiàn)收藏最為豐富的地區(qū),在簡帛文獻(xiàn)數(shù)據(jù)庫開發(fā)建設(shè)上雖起步較晚,但仍取得豐碩成果,參與開發(fā)建設(shè)的單位主要為科研機(jī)構(gòu)和數(shù)字化出版企業(yè)。(一)華東師范大學(xué)中國文字研究與應(yīng)用中心研制的“戰(zhàn)國楚簡帛文字典型形體檢索系統(tǒng)”收錄的材料范圍包括《包山楚簡》、《長沙子彈庫戰(zhàn)國楚帛書研究》、《郭店楚墓竹簡》、《九店楚簡》、《曾侯乙墓》、《戰(zhàn)國楚竹簡匯編》、《上海博物館藏戰(zhàn)國楚竹書》一、二、三、四、五及《葛陵新蔡楚墓》等材料,目前可提供GBK編碼范圍內(nèi)通用字頭的檢索。(二)北京時(shí)代瀚堂科技有限公司制作的“瀚堂出土文獻(xiàn)庫”含甲骨文、金文、簡帛、印章、錢幣和石刻等分庫,是目前唯一的集成性的中國出土實(shí)物文獻(xiàn)數(shù)據(jù)庫,數(shù)據(jù)庫圖片清晰,可全文檢索,支持復(fù)制、打印功能,并附有聯(lián)機(jī)字典。此外,國內(nèi)各大博物館還開通了館藏精品數(shù)據(jù)庫查詢,如國家博物館館藏精品查詢、故宮博物院館藏精品查詢均可進(jìn)行甲骨文、銘刻、簡帛、法書、碑帖等圖譜的檢索查詢,并附有圖譜在線功能。
二、數(shù)字化整理存在的難題及解決方法
雖然出土文獻(xiàn)數(shù)字化整理已取得相當(dāng)大的成就,仍存在一些亟須解決的問題。第一,由于沒有統(tǒng)一的組織和機(jī)構(gòu)協(xié)調(diào)出土文獻(xiàn)數(shù)字化資源建設(shè),出現(xiàn)了重復(fù)建設(shè)問題,造成巨大的人力、物力和財(cái)力的浪費(fèi)。第二,由于出土文獻(xiàn)數(shù)字化制作的主體和各自的利益訴求不同,制作的數(shù)據(jù)庫無法兼容。第三,由于資源封閉和利益保護(hù)的弊端,給讀者帶來了諸多不便,導(dǎo)致資源無法有效共享。第四,文獻(xiàn)購置和設(shè)備購置成為制約出土文獻(xiàn)數(shù)字化的兩大難題。第五,人才知識(shí)的不全面性難以適應(yīng)出土文獻(xiàn)數(shù)字化。
針對(duì)現(xiàn)階段出土文獻(xiàn)數(shù)字化建設(shè)中存在的問題,需要做好以下幾個(gè)方面的工作:第一,建立一套包括數(shù)據(jù)庫結(jié)構(gòu)、檢索界面、查詢格式、專業(yè)用表和組織方式在內(nèi)的標(biāo)準(zhǔn)體系以適應(yīng)出土文獻(xiàn)載體多樣、內(nèi)容廣泛、學(xué)科交叉、時(shí)間跨度大的特點(diǎn),有效提高文獻(xiàn)數(shù)字化的質(zhì)量和檢索效率,降低研發(fā)成本。第二,聯(lián)合計(jì)算機(jī)界、科研單位、文物部門及其他相關(guān)部門設(shè)置統(tǒng)一的組織和結(jié)構(gòu),在遵循全局規(guī)劃、整體建設(shè)、統(tǒng)一實(shí)施原則的基礎(chǔ)上負(fù)責(zé)開展出土文獻(xiàn)數(shù)字化的研究工作,避免重復(fù)建設(shè)的弊端。第三,通過申請(qǐng)國家專項(xiàng)資金和吸引社會(huì)力量投資擴(kuò)大資金來源渠道,以滿足數(shù)字化整理所需的巨額資金。第四,在發(fā)揮現(xiàn)有專業(yè)人才骨干作用的基礎(chǔ)上,多渠道、多層次的培養(yǎng)一批既具備一定的計(jì)算機(jī)、圖書館學(xué)等專業(yè)知識(shí),又具有整理出土文獻(xiàn)的基本技能的更好地適應(yīng)出土文獻(xiàn)數(shù)字化建設(shè)的復(fù)合型人才。
三、小結(jié)
出土文獻(xiàn)提供大量有價(jià)值的佚書和傳世古書最早的版本,使我們對(duì)古書真?zhèn)?、時(shí)代源流等謎團(tuán)有了破解,這些都需要多角度考訂審核、多層次檢討反思,涉及文字組合、書寫釋讀、校對(duì)勘誤、詞義訓(xùn)詁、音韻探源、版本目錄以及古代學(xué)術(shù)史、思想史等。而出土文獻(xiàn)數(shù)字化整理是搶救出土文獻(xiàn)于“危產(chǎn)”之中,保護(hù)、整理和研究出土文獻(xiàn)最行之有效的方法;也是適應(yīng)當(dāng)前信息化時(shí)代,學(xué)術(shù)研究所必然面臨的挑戰(zhàn)。只有將出土文獻(xiàn)數(shù)字化整理之后,才能利用網(wǎng)絡(luò)共享提高出土文獻(xiàn)的利用效率,發(fā)揮出土文獻(xiàn)應(yīng)有的貢獻(xiàn)。
參考文獻(xiàn):
[1]葛承雍,《出土文獻(xiàn)整理:請(qǐng)多一些關(guān)懷》,《中國文物報(bào)》2005年1月14日第5版。
[2]梁松濤、趙彥平,《淺析我國出土文獻(xiàn)數(shù)據(jù)庫建設(shè)的制約因素及對(duì)策》,《圖書館工作與研究》2008年第4期總第146期,頁48~51。
[3]毛建軍,《簡帛文獻(xiàn)數(shù)字化述論》,《蘭臺(tái)世界》2011年第8期,頁23~24。
[4]鄭杰文,《論我國古籍整理的幾個(gè)重點(diǎn)》,《陜西師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》2008年第37卷第5期,頁120~123。
注釋:
(1)王國維:《古史新證——王國維最后的講義》,清華大學(xué)出版社1994年12月版,第2頁。
(2)介紹出土文獻(xiàn)數(shù)字化整理成果時(shí),筆者在《淺析我國出土文獻(xiàn)數(shù)據(jù)庫建設(shè)的制約因素及對(duì)策》、《簡帛文獻(xiàn)數(shù)字化論述》和《論我國古籍整理的幾個(gè)重點(diǎn)》基礎(chǔ)上參考相關(guān)數(shù)據(jù)庫介紹而寫就。