陳素美
(河南中醫(yī)學院圖書館,鄭州 450008)
古籍數字化最早始于20世紀70~80年代。我國中醫(yī)藥院校圖書館對古籍文獻的研究開發(fā),不論是基礎保護和數字化加工,還是深層次研究和開發(fā)利用方面,都還有大量的工作要做。
中醫(yī)古籍是我國浩如煙海古籍中重要的組成部分,更是中醫(yī)理論知識的來源,是中醫(yī)傳承發(fā)展的基礎。中醫(yī)古籍以圖文形式記錄了中醫(yī)學數千年來積累的理論知識和臨床經驗,不僅具有珍貴的史學價值,而且具有重要的實用價值[1]。中醫(yī)古籍數字化是借助現代化的技術與手段,充分保護、研究、揭示與利用這些中華民族豐富的、不可再生的醫(yī)學資源,使古老傳統(tǒng)的中醫(yī)學煥發(fā)出新的活力,在中醫(yī)學的繼承與創(chuàng)新、中醫(yī)藥現代化、中醫(yī)走向世界等方面發(fā)揮重要作用[2]。
數字化是保護和利用古籍的手段之一。在保存條件欠佳、自然損耗無法避免的情況下,古籍數字化能最大程度地減少借閱造成的古籍損壞。信息網絡的發(fā)展為數字化信息的快速準確傳播提供了基礎條件,因此高質量的數字化中醫(yī)古籍資源更能適應讀者快速、準確的信息需求。中醫(yī)古籍數字化是中醫(yī)古籍數據庫建設的第一步,也是建立中醫(yī)知識庫的基礎條件。
古籍存放需要良好的環(huán)境。當前各個圖書館的保存條件不一,在這種情況下減少人為翻閱對古籍造成的損傷就顯得尤為重要。而對于已經破損的孤本、善本,利用數字化盡快保存其原貌是刻不容緩的任務。建設中醫(yī)古籍數字化資源,引導讀者利用數據庫來搜索中醫(yī)古籍,通過擴大數字化古籍的數量滿足師生的利用需求,從而達到避免人為利用對古籍造成損傷以及加速古籍老化的目的。
中醫(yī)藥古籍是中華民族幾千年來防病治病寶貴經驗的結晶,是中華民族優(yōu)秀文化遺產的重要組成部分,不僅傳承了中醫(yī)藥學理論知識,而且大量的經驗方直接指導臨床,中醫(yī)藥古籍文獻中所收載的理法方藥、養(yǎng)生保健知識取之不盡、用之不竭,具有極高的實用價值。而中醫(yī)藥古籍的數字化資源建設,為醫(yī)者提供了知識服務和臨床需求,更廣泛地傳播了中醫(yī)文化和信息。
作為大規(guī)模信息集成的數據庫,隨著存儲量的增加必須改進信息組織方式,以滿足讀者不斷增加的需求。此時單純的數字化信息已經難以滿足人們對知識的需求,只有對知識庫進行數據挖掘和知識挖掘,發(fā)現信息間深層次的聯系和新知識,促進中醫(yī)理論和中醫(yī)實踐的發(fā)展,而中醫(yī)古籍數字化將是中醫(yī)知識庫建設的先決條件和基礎。
元數據是建設規(guī)范性古籍數字化的基礎,是共享數據的必要接口。古籍數字化應用范圍有限,規(guī)模相對固定,因此古籍數字化的元數據標準一旦確立,基本變動不大。在制定規(guī)范的古籍數字化元數據標準時,要考慮古籍的特殊性,盡可能包含盡可能完整的信息。一是版本信息。有版本類型、年代、版式特征等;二是收藏信息。該文獻所屬收藏單位;三是作者信息。作者姓名(包括字、號)、朝代、生卒年、籍貫、著作等;四是作品信息。所屬四部分類、所屬類別等;五是古籍定級信息。所屬朝代、所定級別等。
應用統(tǒng)一、規(guī)范的元數據標準,才能使數字化的數據庫、知識庫在以后的使用過程中更好地檢索和知識傳遞,降低不同標準造成的信息孤島現象,提高數字化信息的利用率,最大限度地發(fā)揮數字化古籍的使用價值。
目前參與古籍數字化的機構或公司眾多,但這些機構或公司采用眾多的文件格式,如文本(txt)、超文本(html)、便攜式文檔(pdf)、電子書(CEB)以及超星圖書(PDG)等。在使用不同公司的數字資源時就要求用戶使用各種對應的軟件,造成使用不便,大大降低了數字資源的通用度和使用率,為以后數據共享設下重重障礙。
統(tǒng)一古籍數字資源的文件格式,開發(fā)通用程度更高的軟件,不僅方便使用者,也為參與古籍數字化的諸多機構節(jié)省時間,為建立通用度更高的數據庫打下基礎。
在借閱古籍過程中若用耗時甚久的傳統(tǒng)信息組織和檢索方式,那么將乏人問津,無法充分發(fā)揮其價值。利用數字化技術對其進行二次開發(fā)保護,一方面為使眾多版本、品質精良的古籍原貌能保存下去;另一方面為建設古籍數字資源庫,利用計算機強大的運算能力,提高古籍數字化資源的檢索速度和精度。在數據庫的建設過程中,數字化對象的選擇是基礎,其選取標準如下。
數字化對象選取應著重古籍的學術、文獻價值,要有中醫(yī)文獻專家把關。如品種上應優(yōu)先選擇年代久遠者、中醫(yī)學經典名著、各中醫(yī)流派代表著作或各類中醫(yī)古籍基本文獻;次選具有廣泛應用價值,載有獨特診治疾病和養(yǎng)生保健經驗,對中醫(yī)學理論研究和臨床診療具有指導意義的基本古籍。版本盡量選擇珍本、善本古籍,首選年代久遠者;版本形式按稿本、刻本、抄本、影印本、石印本順序選擇;同一種古籍版本較多者,一般只選完本,按精校本、祖本、通行本順序選擇;孤本或刻印較少、流傳不多的稀見版本選擇要求適當放寬[4]。
在古籍流傳過程中,同一種古籍往往會出現眾多版本,其質量難免參差不齊。在選擇數字化對象時,在版本選擇的基礎上,還要尤其注意內容是否準確,表述是否清晰。要結合文獻專家和醫(yī)學專家的意見,選擇公認的高質量本子進行數字化,避免重復工作。
只有完善的古籍檢索系統(tǒng)才能為古籍數據庫的使用提供良好的平臺,使讀者樂于和便于檢索所需信息。(1)較高的檢全率和檢準率。檢索系統(tǒng)的檢準率和檢全率是保證檢索質量的重要指標。中醫(yī)古籍中各種藥名的不同稱謂,以及通假字、異體字、避諱字的使用,使得提高中醫(yī)古籍數字資源的檢索檢準率和檢全率面對重重困難;(2)較快的檢索速度??斓臋z索響應速度是留住讀者的關鍵;(3)符合中醫(yī)學科特點。要設置針對中醫(yī)學科的專有名詞、著者信息等特有的關鍵詞。
中醫(yī)古籍數字化需要中醫(yī)藥、圖書情報以及信息技術等多方面人才。古籍數字化中,建設數據庫是基礎工程,進一步的提供服務以及更深層次的數據挖掘、知識挖掘才是古籍數字化的意義所在。要建設中醫(yī)古籍數據庫、知識庫,需要各類人才的通力合作。在數據庫建設過程中,標引、著錄、知識挖掘需要計算機專業(yè)、信息專業(yè)和古籍等相關專業(yè)各種人才的合作。要把古籍數據庫建設成為數據挖掘、知識挖掘的源泉,需要多專業(yè)人才實現學科融合。高素質人才隊伍的建設關乎古籍數字化的現在和未來。
古籍數字化是為了減少紙質古籍的使用、保護古籍,并提供高質量的數字資源。目前開展古籍數字化的機構眾多,一擁而上的形勢下重復建設數量眾多,質量良莠不齊,這樣不僅浪費寶貴的人力、物力和時間,也使更多適合數字化、需要保護的古籍得不到及時有效的處理。中醫(yī)古籍更多孤本、抄本等急需數字化,因此古籍數字化進程中,要以建設“準確”、“完整”的古籍資源為前提,聯合各個機構的力量,避免資源的重復建設。
圖片數據庫或全文數據庫是無法完全滿足讀者對知識的需求,故具備較高學術水準的專題化、知識庫類型的數據庫是未來古籍數字化的發(fā)展方向。因此,在古籍數字化規(guī)劃之初,就應該考慮到長遠的發(fā)展趨勢和目標,即數據庫要為建設更高質量的專題數據庫和知識庫做準備。
作為與國人生活和文化息息相關的中醫(yī)在醫(yī)療、保健等領域有著獨特的優(yōu)勢。中醫(yī)古籍數字化是保護中醫(yī)古籍的方法之一,也是適應網絡化、信息化社會發(fā)展趨勢。結合技術變化,優(yōu)化中醫(yī)知識傳播方式和渠道,對傳統(tǒng)中醫(yī)理論知識進行深層次的知識挖掘,加快學科建設,促進中醫(yī)理論知識新發(fā)展的重要方式。各中醫(yī)院校圖書館應結合當前正在進行的全國古籍普查活動,摸清家底,做好定級、定損,規(guī)劃古籍數字化的下一步進程,建設具有館藏特色的中醫(yī)數字資源。
[1]裴麗,曹霞.中醫(yī)古籍數字化多功能閱讀環(huán)境模型構建[J].中醫(yī)藥信息,2010,27(1):118.
[2]楊繼紅.中醫(yī)古籍數字化資源建設概述[J].現代情報,2008,28(5):136.
[3]葉莉.對古籍數字化進程中若干問題的思考[J].圖書館界,2010,31(4):10-11.
[4]李兵,劉國正,符永馳,等.中醫(yī)古籍數字化整理方案探討[J].中國數字醫(yī)學,2010,5(5):35.