程新
安徽中醫(yī)藥大學(xué)圖書館,安徽 合肥 230038
中醫(yī)藥古籍?dāng)?shù)字化若干原則思考
程新
安徽中醫(yī)藥大學(xué)圖書館,安徽 合肥 230038
中醫(yī)藥古籍具有學(xué)術(shù)和歷史文化的雙重價(jià)值,數(shù)字化是保存、整理和利用中醫(yī)藥古籍的有效方法。近年來,中醫(yī)藥發(fā)展受到高度重視,而中醫(yī)藥古籍?dāng)?shù)字化卻進(jìn)入了發(fā)展緩慢的瓶頸期,需要進(jìn)一步深入思考的主要問題即是中醫(yī)藥古籍?dāng)?shù)字化原則問題。本文論述了中醫(yī)藥古籍?dāng)?shù)字化應(yīng)遵從的9個(gè)原則:保護(hù)與利用相結(jié)合、統(tǒng)一規(guī)劃與分步實(shí)施、共建共享、標(biāo)準(zhǔn)化、可持續(xù)發(fā)展、保真、整理、圖文對(duì)照、技術(shù)服務(wù)于內(nèi)容。
中醫(yī)藥古籍;數(shù)字化;原則;思考
中醫(yī)藥是我國獨(dú)具特色的衛(wèi)生資源,大量的中醫(yī)藥古籍承載著中醫(yī)藥學(xué)數(shù)千年來積累的豐富理論知識(shí)和臨床經(jīng)驗(yàn),具有學(xué)術(shù)和歷史文化的雙重價(jià)值。對(duì)中醫(yī)藥古籍既要有效保護(hù),又要便于傳播,更要充分利用;既要保持優(yōu)良傳統(tǒng),又要適應(yīng)信息時(shí)代的發(fā)展潮流。中醫(yī)藥古籍?dāng)?shù)字化是解決上述問題的有效方法,也是保存、整理和利用中醫(yī)藥古籍的必然趨勢(shì)。
近年來,中醫(yī)藥受到黨和國家領(lǐng)導(dǎo)人的高度重視并寄予厚望,中醫(yī)藥事業(yè)發(fā)展一次次被放在黨和國家事業(yè)發(fā)展全局的戰(zhàn)略高度來部署。與此同時(shí),我國大陸地區(qū)包括中醫(yī)藥在內(nèi)的古籍?dāng)?shù)字化經(jīng)過迅猛發(fā)展后,近幾年進(jìn)入了發(fā)展緩慢的瓶頸期,或者說處于化蛹為蝶的關(guān)鍵之期。這需要我們進(jìn)一步審視、認(rèn)真梳理、深入思考,筆者認(rèn)為首先需要考慮的即是中醫(yī)藥古籍?dāng)?shù)字化原則問題。
按照《漢語大詞典》的解釋,“原則”指“說話、行事所依據(jù)的準(zhǔn)則?!敝嗅t(yī)藥古籍?dāng)?shù)字化的原則,即是進(jìn)行中醫(yī)藥古籍?dāng)?shù)字化時(shí)所依據(jù)的準(zhǔn)則。在有關(guān)研究中,學(xué)者從不同側(cè)面提出過實(shí)用性原則、保真原則、整理原則、標(biāo)準(zhǔn)化原則、共建共享原則等,對(duì)古籍?dāng)?shù)字化產(chǎn)生了積極的促進(jìn)作用。筆者以為,對(duì)于中醫(yī)藥古籍?dāng)?shù)字化的原則,我們可著重從以下9個(gè)方面來進(jìn)行思考與探討。
1.1 解決藏與用的矛盾
保護(hù)與利用相結(jié)合原則也可稱為實(shí)用性原則。中醫(yī)藥古籍?dāng)?shù)字化首先要解決的就是古籍“藏”與“用”的突出矛盾,或者說要在中醫(yī)藥古籍保護(hù)與利用這一矛盾中尋求一條合適之路。既能有效地保護(hù)古籍原典,努力使其作為文物“永不消失”;又能使古籍的文獻(xiàn)價(jià)值,即原文圖像、全文文本等能為越來越多的用戶方便利用。
1.2 充分利用現(xiàn)代信息技術(shù)
中醫(yī)藥古籍?dāng)?shù)字化應(yīng)充分利用現(xiàn)代信息技術(shù),其所形成的系列產(chǎn)品,如古籍書目庫、版本圖像庫、全文文本庫、相關(guān)知識(shí)庫等,不僅要具有數(shù)字化的圖文存儲(chǔ),還要具備多種支持功能,如基于超鏈接設(shè)計(jì)的瀏覽閱讀功能、強(qiáng)大的檢索功能、必要的研究輔助工具等,以充分發(fā)揮數(shù)字化的優(yōu)勢(shì),盡可能適應(yīng)古籍管理者、專業(yè)研究者、一般閱讀者等不同類型讀者的多種層次需求。
1.3 注意保護(hù)古籍原典
在數(shù)字化過程中要注意對(duì)古籍原典的保護(hù)。古籍?dāng)?shù)字化產(chǎn)品的質(zhì)量與其所使用的原典或底本是密不可分的,古籍?dāng)?shù)字化產(chǎn)品取代不了原典。作為數(shù)字化的基礎(chǔ),中醫(yī)藥古籍原典具有不可再生性,其中不少是國家珍貴的文物。在數(shù)字化過程中,既要防止因缺乏整體規(guī)劃或操作中考慮不周,對(duì)同一部古籍多次進(jìn)行數(shù)字化掃描;也要防止出于某種利益考慮,追求模數(shù)轉(zhuǎn)換的效率與效益,從而可能在多個(gè)環(huán)節(jié)造成古籍原典永久性傷害[1]。
中醫(yī)藥古籍?dāng)?shù)字化是中醫(yī)藥古籍保護(hù)、中醫(yī)藥文獻(xiàn)利用、中醫(yī)藥文化傳播的一次根本性的變革,也是一項(xiàng)艱巨而龐大的系統(tǒng)工程。中醫(yī)藥古籍?dāng)?shù)字化不僅要符合普通古籍?dāng)?shù)字化的特點(diǎn)與要求,由于其獨(dú)特價(jià)值,其數(shù)字化過程還會(huì)更加復(fù)雜、要求更高。不僅有技術(shù)問題,更多的可能是思想認(rèn)識(shí)、組織協(xié)調(diào)等非技術(shù)問題,需要充分認(rèn)識(shí)到其長期性與復(fù)雜性。理想的數(shù)據(jù)庫建設(shè)不可能一蹴而就,既要做好統(tǒng)一規(guī)劃、整體設(shè)計(jì),又要明確階段任務(wù)、做好分步實(shí)施。
2.1 統(tǒng)一規(guī)劃
這是中醫(yī)藥古籍?dāng)?shù)字化成功的關(guān)鍵與前提條件。對(duì)于全國中醫(yī)藥古籍?dāng)?shù)字化,筆者以為,可由國家中醫(yī)藥管理局牽頭成立全國中醫(yī)藥古籍?dāng)?shù)字化領(lǐng)導(dǎo)小組,協(xié)調(diào)相關(guān)部門和地方,制定相應(yīng)政策,協(xié)調(diào)中醫(yī)藥及相關(guān)古籍資源,保障任務(wù)落實(shí)。同時(shí),成立全國中醫(yī)藥古籍?dāng)?shù)字化專家委員會(huì),可由中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所等專業(yè)機(jī)構(gòu)多方面的相關(guān)專家(如中醫(yī)藥、文獻(xiàn)、信息技術(shù)、圖書情報(bào)等)組成,負(fù)責(zé)制定技術(shù)方案,提供決策支持,明確任務(wù)分工,具體指導(dǎo)數(shù)字化建設(shè)??蓞⒖既珖偶詹楣ぷ?,形成長效發(fā)展機(jī)制與有效實(shí)施模式。在安徽中醫(yī)藥大學(xué)圖書館新安醫(yī)學(xué)古籍?dāng)?shù)據(jù)庫建設(shè)中,專家組就發(fā)揮了重要的作用。
2.2 分步實(shí)施
這是實(shí)現(xiàn)中醫(yī)藥古籍?dāng)?shù)字化的基礎(chǔ)與必然要求。中醫(yī)藥古籍?dāng)?shù)字化既有迫切的要求,又難以在短期內(nèi)全部實(shí)現(xiàn)。為此,必須按照階段任務(wù),分步實(shí)施,保質(zhì)保量穩(wěn)步有序推進(jìn)。例如,先做較簡單的書目庫,再做初步標(biāo)引與分類的圖像庫,然后做進(jìn)行深度標(biāo)引與分類的全文本庫,最后做相關(guān)知識(shí)庫,并豐富數(shù)據(jù)庫的研究與應(yīng)用功能等。也可考慮先做基本中醫(yī)藥古籍,再做其他中醫(yī)藥古籍,再做相關(guān)古籍等。先易后難,逐步推進(jìn),既能較快形成階段性成果滿足當(dāng)前急需,又可作為后續(xù)工作基礎(chǔ),并提供合作經(jīng)驗(yàn)。建設(shè)全國性中醫(yī)藥古籍?dāng)?shù)據(jù)庫,還應(yīng)考慮同一標(biāo)準(zhǔn)與平臺(tái)下異地同步或分步進(jìn)行,分工協(xié)作,并利于發(fā)揮各自優(yōu)勢(shì)。
無論是地方性中醫(yī)藥古籍?dāng)?shù)據(jù)庫,還是全國性專題數(shù)據(jù)庫,均無法涵蓋全面。因?yàn)橹嗅t(yī)藥古籍之理法方藥及多科內(nèi)容等往往融合為一體,很難截然分開。同時(shí),由于中醫(yī)藥古籍種類已基本確定(按《中國中醫(yī)古籍總目》所載,全國150個(gè)圖書館、博物館館藏的1949年以前出版的中醫(yī)藥圖書為13 455種,其中有部分不屬于古籍;若加上港澳臺(tái)及流落國外的中醫(yī)藥古籍,估計(jì)總種類不會(huì)超過此數(shù)),使得建立全國性綜合性古醫(yī)籍平臺(tái)與數(shù)據(jù)庫(可分為若干專題)既十分必要,也完全可行。但由于工作量大、技術(shù)要求高、資源分布不同等原因,使之成為一項(xiàng)長期復(fù)雜的系統(tǒng)工程,不是單個(gè)機(jī)構(gòu)僅憑一己之力就可以勝任的,必須要進(jìn)行全國性協(xié)作,共同參與建設(shè)。
資源過少、規(guī)模過小的數(shù)據(jù)庫作用很有限,費(fèi)效比太低,甚至成為擺設(shè)、為建庫而建設(shè)。整合多庫后作用大大增強(qiáng),功能得以豐富與拓展,從而達(dá)到一加一大于二的效果。因此,各地區(qū)、各系統(tǒng)要統(tǒng)一協(xié)作、共同開發(fā)、資源共建、成果共享,這樣可避免重復(fù)開發(fā),節(jié)約大量的人力、物力和財(cái)力,發(fā)揮綜合優(yōu)勢(shì),建立起良好的資源和服務(wù)保障體系。在共建的基礎(chǔ)上,共享包括書目元數(shù)據(jù)信息、數(shù)字文獻(xiàn)資源(原文圖像、全文文本)、整理與研究成果、檢索軟件與系統(tǒng)平臺(tái)等[2]。共享的前提是共建,而共建的基礎(chǔ)是統(tǒng)一標(biāo)準(zhǔn)。
目前制約古籍?dāng)?shù)字化發(fā)展和資源共享的最大問題就是標(biāo)準(zhǔn)和規(guī)范問題。因此,在數(shù)據(jù)庫規(guī)劃設(shè)計(jì)之初,就應(yīng)重視標(biāo)準(zhǔn)化建設(shè)。要充分利用已有建設(shè)成果,盡可能采用通用或公認(rèn)的標(biāo)準(zhǔn)規(guī)范。中醫(yī)藥古籍?dāng)?shù)字化建設(shè)的協(xié)作與協(xié)調(diào)統(tǒng)一、技術(shù)合作,乃至產(chǎn)品質(zhì)量保障、數(shù)據(jù)資源共享等,均離不開標(biāo)準(zhǔn)化這一基礎(chǔ)。從中醫(yī)藥古籍?dāng)?shù)字化來看,特別要完善以下5個(gè)方面的標(biāo)準(zhǔn)。
4.1 版本選擇標(biāo)準(zhǔn)
這是數(shù)字化的基礎(chǔ)和保障質(zhì)量的關(guān)鍵。要充分利用古籍普查成果,由專家組進(jìn)行選擇和比較,確定公認(rèn)的善本做底本,必要時(shí)同一種古籍可選擇兩個(gè)乃至多個(gè)版本。如,《本草綱目》版本一祖三系,金陵本已入選《世界記憶名錄》,江西本、杭州本、合肥本各具特色。又如,中國古代本草著作中流傳最廣、翻印次數(shù)最多的《本草備要》,既有康熙二十二年汪昂還讀齋初刻本(由鄭金生教授從日本復(fù)制回國),又有康熙三十三年汪昂親自增訂后的還讀齋刻本。要明確標(biāo)示版本來源與依據(jù),以便在此基礎(chǔ)上做好后續(xù)整理等工作。
4.2 元數(shù)據(jù)著錄標(biāo)準(zhǔn)
以元數(shù)據(jù)為基礎(chǔ)進(jìn)行書目著錄,形成相應(yīng)的檢索系統(tǒng)。制定和完善《古籍元數(shù)據(jù)標(biāo)準(zhǔn)》,以元數(shù)據(jù)對(duì)古籍信息進(jìn)行描述,可在更大范圍內(nèi)實(shí)現(xiàn)數(shù)字化產(chǎn)品的互操作及數(shù)據(jù)共享。2003年底正式啟動(dòng)的中國高等教育文獻(xiàn)保障系統(tǒng)(China Academic Library & Information System, CALIS)漢語文古籍聯(lián)機(jī)編目系統(tǒng)在這個(gè)方面進(jìn)行了很好的探索,其古籍聯(lián)合目錄系統(tǒng)是CALIS聯(lián)合目錄建設(shè)的標(biāo)志性成果之一,值得借鑒。
4.3 存儲(chǔ)標(biāo)準(zhǔn)
4.3.1 漢字存儲(chǔ) 采用統(tǒng)一的字符已成為業(yè)界的共識(shí),在古籍?dāng)?shù)字化中最常用的、也是較理想的是Unicode字符集。作為計(jì)算機(jī)科學(xué)領(lǐng)域里的一項(xiàng)業(yè)界標(biāo)準(zhǔn),目前,Unicode的最新版本7.0已收入超過十萬個(gè)字符。通過對(duì)古籍漢字中的異體字、通假字、避諱字、冷僻字、訛字等進(jìn)行規(guī)范統(tǒng)一處理,使不同的語言平臺(tái)之間形成共同的編碼系統(tǒng)[3]。
4.3.2 文件格式 目前數(shù)字化古籍存儲(chǔ)的格式種類繁多,較常見的有doc、html、txt,還有abm、ebk、edb、epub、exe、pdf、pdg、wdl等,難以互相兼容,因此,必須研究建立國家或行業(yè)標(biāo)準(zhǔn),形成統(tǒng)一的文件存儲(chǔ)格式,實(shí)現(xiàn)數(shù)字資源共享。
4.4 系統(tǒng)標(biāo)準(zhǔn)
包括數(shù)據(jù)庫系統(tǒng)可靠性、易用性、存取方便性及系統(tǒng)功能性等方面[4]。必須盡可能采用國際、國內(nèi)通用的標(biāo)準(zhǔn),支持多種軟硬件平臺(tái)與操作系統(tǒng),可構(gòu)成多層次的數(shù)據(jù)集成體系,能聚合多個(gè)內(nèi)容對(duì)象,對(duì)各種不同類型的對(duì)象進(jìn)行靈活組合,并且能兼容多種不同形式的數(shù)據(jù)結(jié)構(gòu)。要具備可擴(kuò)展的靈活存儲(chǔ)機(jī)制和多種發(fā)布形式,在確保安全控制的基礎(chǔ)上,還應(yīng)該充分考慮系統(tǒng)的互操作性和開放性。
4.5 標(biāo)引標(biāo)準(zhǔn)
鑒于中醫(yī)藥古籍在當(dāng)前中醫(yī)藥臨床、教學(xué)和科研中的重要作用,通過智能檢索、數(shù)據(jù)挖掘等技術(shù)充分揭示其潛在的學(xué)術(shù)價(jià)值,既是中醫(yī)藥古籍?dāng)?shù)字化的重點(diǎn),也是發(fā)揮計(jì)算機(jī)與數(shù)據(jù)庫優(yōu)勢(shì)之所在。但其前提是確定標(biāo)引標(biāo)準(zhǔn),做好數(shù)據(jù)標(biāo)引工作。在統(tǒng)一標(biāo)引方面,中醫(yī)藥領(lǐng)域由于前期工作扎實(shí),形成了獨(dú)特的優(yōu)勢(shì)。
4.5.1 分類標(biāo)引 由中國中醫(yī)科學(xué)院薛清錄教授主編的《中國中醫(yī)古籍總目》(2007年版)是在 1958年《中醫(yī)圖書聯(lián)合目錄》和1991年《全國中醫(yī)圖書聯(lián)合目錄》的基礎(chǔ)上,包括中醫(yī)藥高校在內(nèi)的全國各大圖書館(博物館)共同參與形成的。其對(duì)中醫(yī)藥古籍12大類65個(gè)二級(jí)類目及若干三級(jí)類目的分類體系,充分考慮了現(xiàn)存中醫(yī)藥古籍的實(shí)際,為業(yè)界所公認(rèn),可作為中醫(yī)藥古籍分類標(biāo)引之標(biāo)準(zhǔn)。同時(shí),考慮到《中國圖書館分類法》是我國圖書情報(bào)單位普遍使用的一部綜合性的分類法,為更多的人所熟悉,并可有效接軌現(xiàn)代醫(yī)學(xué)乃至現(xiàn)代科學(xué),故可以之作為輔助分類標(biāo)引標(biāo)準(zhǔn),并存互用。
4.5.2 主題標(biāo)引 由中國中醫(yī)科學(xué)院吳蘭成教授主編的《中國中醫(yī)藥學(xué)主題詞表》(2008年版)是在1987年《中醫(yī)藥學(xué)主題詞表》和1996年《中國中醫(yī)藥學(xué)主題詞表》基礎(chǔ)上形成的,為國內(nèi)外第一部被中醫(yī)藥學(xué)及醫(yī)學(xué)信息界廣泛采用的專業(yè)主題詞表,以其科學(xué)性、適用性以及與《醫(yī)學(xué)主題詞表》(MeSH)的兼容性獲得好評(píng),可作為中醫(yī)藥古籍主題標(biāo)引的標(biāo)準(zhǔn)。同時(shí),考慮到MeSH詞表是美國國立醫(yī)學(xué)圖書館編制的目前最權(quán)威最常用的標(biāo)準(zhǔn)醫(yī)學(xué)主題詞表,為便于與現(xiàn)代醫(yī)學(xué)接軌,故可以之作為輔助主題標(biāo)引標(biāo)準(zhǔn),并存互用。
此外,中醫(yī)藥古籍還有一些特殊的標(biāo)引方法,如理法方藥、古籍圖像標(biāo)識(shí)等,也要加強(qiáng)研究并逐步規(guī)范。
中醫(yī)藥古籍?dāng)?shù)字化建設(shè),尤其是數(shù)據(jù)庫的完善與深度開發(fā),是一個(gè)長期的過程。對(duì)于這樣一個(gè)功在當(dāng)代、嘉惠后世的文化工程,必須貫徹可持續(xù)發(fā)展原則,這也是科學(xué)發(fā)展觀的重要內(nèi)容和基本要求。
5.1 政府主導(dǎo)
中醫(yī)藥古籍?dāng)?shù)字化既是一項(xiàng)重要的文化工程,也是文化、教育、衛(wèi)生、科學(xué)研究等多方面受益的公益事業(yè)。其建設(shè)模式最好是國家行為,應(yīng)由政府主導(dǎo),制定政策、投入經(jīng)費(fèi)、協(xié)調(diào)各方,實(shí)行宏觀管理,為其高效實(shí)施、有效運(yùn)行與長遠(yuǎn)發(fā)展提供根本保障。
5.2 多方主體合作
在政府主導(dǎo)下,中醫(yī)藥古籍?dāng)?shù)字化建設(shè)各相關(guān)利益主體之間通過互利互惠、促進(jìn)共同發(fā)展的機(jī)制與制度建設(shè),結(jié)為長期戰(zhàn)略合作伙伴,共同推進(jìn)古籍?dāng)?shù)字化工程的可持續(xù)發(fā)展[1]。即以圖書館為主體的文獻(xiàn)部門提供文獻(xiàn)資源,中醫(yī)藥教學(xué)科研與臨床及文獻(xiàn)研究機(jī)構(gòu)提供內(nèi)容專家,信息技術(shù)公司提供技術(shù)專家,共同組織成立一個(gè)中醫(yī)藥古籍?dāng)?shù)字化聯(lián)合體,聯(lián)合協(xié)作開發(fā)數(shù)字化產(chǎn)品,重點(diǎn)實(shí)施中醫(yī)藥古籍?dāng)?shù)字化公益性項(xiàng)目建設(shè)。這個(gè)多元化主體之間隱含了古籍?dāng)?shù)字化工作的三種性質(zhì),既具有古籍保護(hù)的公益性質(zhì),又有古籍學(xué)術(shù)利用的研究性質(zhì),還具有古籍資源開發(fā)的商業(yè)性質(zhì)[2]。
5.3 引入市場(chǎng)機(jī)制
在上述學(xué)界與業(yè)界各方聯(lián)合開發(fā)中醫(yī)藥數(shù)字化主產(chǎn)品的同時(shí),利用聯(lián)合體的自身優(yōu)勢(shì),引入市場(chǎng)化運(yùn)作機(jī)制,加大商品化的古籍?dāng)?shù)字化衍生產(chǎn)品開發(fā),即進(jìn)行適度商業(yè)化[5],這樣可為古籍?dāng)?shù)字化帶來較大的贏利空間,促使數(shù)字化建設(shè)走上良性發(fā)展的道路,從而充分調(diào)動(dòng)各方工作積極性,為持續(xù)發(fā)展提供更多的動(dòng)力。
5.4 加強(qiáng)境外合作
近年來古籍?dāng)?shù)字化國際合作項(xiàng)目逐步增多,古籍?dāng)?shù)字信息的回流,進(jìn)一步充實(shí)了文獻(xiàn)資源量,特別是給古籍?dāng)?shù)字化工作帶來了先進(jìn)的技術(shù)、超前的理念與豐富的管理經(jīng)驗(yàn),同時(shí)也擴(kuò)大了包括中醫(yī)藥在內(nèi)的中國傳統(tǒng)優(yōu)秀文化的國際影響。通過與港澳臺(tái)地區(qū),日韓、歐美等國的跨境與跨行業(yè)合作,以我們的資源優(yōu)勢(shì),與境外的技術(shù)優(yōu)勢(shì)與管理經(jīng)驗(yàn)形成優(yōu)勢(shì)互補(bǔ),對(duì)古籍?dāng)?shù)字化將起到重要的促進(jìn)作用。當(dāng)然,在合作中要注意文獻(xiàn)資源和知識(shí)產(chǎn)權(quán)的保護(hù)。
5.5 版權(quán)保護(hù)
中醫(yī)藥古籍?dāng)?shù)字化產(chǎn)品不同于一般圖書的數(shù)字出版,不僅要考慮中醫(yī)藥古籍學(xué)術(shù)價(jià)值的發(fā)掘、中醫(yī)藥古籍的普及推廣、中醫(yī)藥文化的傳播,同時(shí)還要認(rèn)真考慮開發(fā)的成本和開發(fā)者的積極性,畢竟這些數(shù)字化產(chǎn)品是大批工作人員對(duì)古籍進(jìn)行篩選、著錄、掃描、錄入、校勘、整理等一系列艱苦工作的成果[6]。2012 年9月中華書局訴某公司“二十五史”侵權(quán)案獲法院支持,對(duì)古籍整理作品的著作權(quán)保護(hù)具有積極意義。2014年10月中央電視臺(tái)新聞聯(lián)播節(jié)目又播出了某網(wǎng)絡(luò)文庫侵權(quán)案。這表明政府加大了對(duì)數(shù)字化中醫(yī)藥古籍市場(chǎng)的監(jiān)管力度,版權(quán)保護(hù)越來越受到重視,從法律上保證了中醫(yī)藥古籍?dāng)?shù)字化事業(yè)的順利開展。
5.6 應(yīng)用推廣與日常運(yùn)維
要加強(qiáng)對(duì)古籍?dāng)?shù)字化產(chǎn)品的宣傳推廣,不僅是衍生產(chǎn)品的商業(yè)推廣,更需要由聯(lián)合主體各方分別著重面對(duì)三類重點(diǎn)讀者(用戶),即大眾用戶、專門讀者、專業(yè)研究者提供使用或試用。這一工作可與專業(yè)數(shù)字圖書館推廣工程密切結(jié)合,與醫(yī)療(臨床)工作、衛(wèi)生事業(yè)及信息化工作相結(jié)合。同時(shí),要成立常設(shè)的專門機(jī)構(gòu),負(fù)責(zé)數(shù)字系統(tǒng)與平臺(tái)持續(xù)穩(wěn)定運(yùn)行與維護(hù),及時(shí)解決日常使用中的各種問題,并注意收集反饋意見,經(jīng)專家組研究后及時(shí)或定期修改完善數(shù)據(jù)庫。
古籍?dāng)?shù)字化從本質(zhì)上說就是對(duì)古籍的一種整理,只不過是整理的手段、成果的形式與傳統(tǒng)有別而已,必須遵循古籍整理的基本原則。中醫(yī)藥古籍不僅具有文獻(xiàn)學(xué)術(shù)價(jià)值,還具有歷史文物價(jià)值,因此在數(shù)字化過程中除了進(jìn)行再生性保護(hù),還應(yīng)注重對(duì)其進(jìn)行原生性保護(hù),這就要求在進(jìn)行再生性保護(hù)的“復(fù)制轉(zhuǎn)移”過程中必須努力保持其原貌,此即保真原則。這一原則要求在對(duì)古籍進(jìn)行圖像處理時(shí),除載體外應(yīng)完整保留全部信息,使數(shù)字化產(chǎn)品在版本特征、刊印形式等方面保持與原典的一致性。同時(shí),對(duì)載體也需作詳細(xì)描述與全面記錄,從而使數(shù)字化中醫(yī)藥古籍產(chǎn)品具有重現(xiàn)作為歷史文物的古籍原貌的功能,其原文圖像可以滿足版本研究、文字???、書史研究、文物鑒賞、原件對(duì)照等特殊需要[6]。
7.1 整理的必要性
保真原則重在保持古籍作為歷史文物的原貌,整理原則則重在發(fā)掘古籍的文獻(xiàn)學(xué)術(shù)價(jià)值。古籍的數(shù)字化并不只是對(duì)其進(jìn)行掃描并存儲(chǔ)在計(jì)算機(jī)中供瀏覽就可以了。數(shù)字化的中醫(yī)藥古籍應(yīng)該經(jīng)過認(rèn)真整理,成為現(xiàn)有較好乃至最好的版本,否則就會(huì)造成謬種流傳,貽誤后世,這對(duì)中醫(yī)藥古籍尤為重要。一方面,中醫(yī)藥古籍是蘊(yùn)含了中華民族幾千年來防病治病寶貴經(jīng)驗(yàn)的知識(shí)寶庫,需要學(xué)者去研究開發(fā);另一方面,中醫(yī)藥直接關(guān)系人的生命與健康,倘若古籍中的醫(yī)理、藥物等文字出現(xiàn)錯(cuò)誤,并且以訛傳訛,將對(duì)百姓健康帶來嚴(yán)重危害。同時(shí),通過對(duì)中醫(yī)藥古籍的文獻(xiàn)整理,結(jié)合現(xiàn)代信息技術(shù)進(jìn)行學(xué)術(shù)價(jià)值發(fā)掘,正是中醫(yī)藥古籍?dāng)?shù)字化巨大價(jià)值與優(yōu)勢(shì)所在。
7.2 文字整理
稗草對(duì)已經(jīng)使用多年的除草劑的敏感性不斷降低,其防效逐年下降,為了有效應(yīng)對(duì)水稻田雜草危害問題,常州市信德農(nóng)業(yè)科技有限公司生產(chǎn)了4%氟嘧啶草醚+2.5%五氟磺草胺可分散油懸浮劑100毫升/畝,該藥劑使用方便,可以直接進(jìn)行甩施,該藥劑擴(kuò)大了殺草譜,不僅可以防治稗草還可以防治野慈姑,本研究對(duì)其安全性和防效進(jìn)行了研究,得出以下結(jié)論:
由于時(shí)間久遠(yuǎn)或保護(hù)不善而導(dǎo)致古籍殘缺或部分文字模糊不清,由于在抄錄、重刻等流傳過程中產(chǎn)生的文字訛誤(諺曰:書三寫,魚成魯,虛成虎),由于少數(shù)書坊粗制濫造或個(gè)別不良書商有意作偽等,都導(dǎo)致古籍需要通過???、輯佚等方法進(jìn)行整理,補(bǔ)其殘缺,糾其錯(cuò)訛,從而去偽存真,正本清源。
7.3 內(nèi)容整理
除對(duì)文字(含圖像)本身進(jìn)行整理外,還應(yīng)重視中醫(yī)藥古籍文字背后的內(nèi)容問題。
7.3.1 古今文字理解問題 由于古今文字差異,可能導(dǎo)致文義(醫(yī)理)理解問題。如《素問·四氣調(diào)神大論》“道者,圣人行之,愚者佩之?!保?]對(duì)其中“佩”字的注釋,楊上善、王冰、張介賓、張志聰四位大家皆有“望文生義之錯(cuò)”[8]。胡澍《內(nèi)經(jīng)素問校義》以漢學(xué)考據(jù)之法,達(dá)其訓(xùn)詁,窮其聲韻,以為“佩”、“倍”古音同聲而通用,成為訓(xùn)詁之公論而傳諸后學(xué)。
7.3.2 醫(yī)家認(rèn)識(shí)與時(shí)代局限問題 由于醫(yī)家個(gè)人認(rèn)識(shí)與所處時(shí)代局限,中醫(yī)藥古籍中不免有些不當(dāng)或與現(xiàn)代認(rèn)識(shí)不符的內(nèi)容,甚至有些具有某種迷信色彩。如孫一奎所撰《赤水玄珠》30卷,博采群書,結(jié)合已驗(yàn),見解獨(dú)到,無論對(duì)理論研究還是臨床實(shí)踐都具有較高參考價(jià)值。但正如《四庫提要》所云:“惟第十卷怯損勞瘵門,附方外還丹,專講以人補(bǔ)人采煉之法,殊非正道。蓋一奎以醫(yī)術(shù)游公卿間,不免以是投其所好。遂為全書之大瑕,是足惜耳?!保?]
7.3.3 今人自己產(chǎn)生的問題 原本無問題,今人自己逐步產(chǎn)生的問題。如《清史稿》有專傳且明確記載為安徽人的三位醫(yī)家,自上世紀(jì)80年代以來,其中的周學(xué)海、余霖兩位分別被大多數(shù)文獻(xiàn)認(rèn)定為浙江人、江蘇人。
以上這些問題就需要通過注釋、標(biāo)點(diǎn)、語譯等方法進(jìn)行整理,必要時(shí)增加導(dǎo)讀,從而去粗取精,古為今用。
7.4 整理屬于再創(chuàng)作
古籍整理不僅是利用的基礎(chǔ)與前提,而且在某種程度上是一種再創(chuàng)作。其實(shí)不少中醫(yī)藥古籍正是通過諸如校訂、注釋、編纂、評(píng)注等方式形成的,如《黃帝內(nèi)經(jīng)素問吳注》《傷寒論條辨》等,這也從另一側(cè)面說明古籍整理作品是具有版權(quán)的。當(dāng)然,古籍整理是個(gè)復(fù)雜的、見仁見智的問題。對(duì)于數(shù)字化的古籍文本,還應(yīng)有原版圖像以便對(duì)照使用。
8.1 保真與整理的統(tǒng)一
保真和整理分別側(cè)重于從古籍作為文物和文獻(xiàn)兩方面對(duì)于數(shù)字化提出的要求,或者說是從形式與內(nèi)容兩方面提出的要求。在實(shí)際工作中他們是統(tǒng)一的,相輔相成的。從工作內(nèi)容上看,一方面,保真形成的原文圖形版可以進(jìn)行適當(dāng)?shù)恼砑庸?,如添加檢索工具和輔助閱讀工具,這正是數(shù)字化古籍的優(yōu)勢(shì)[2]。另一方面,整理形成的數(shù)字文本版追求的是內(nèi)容上的保真。如補(bǔ)其殘缺模糊字、改正訛字、恢復(fù)避諱字、整理異體字等。從工作程序上看,古籍掃描形成原文圖形版(保真)為整理的基礎(chǔ),整理形成的數(shù)字文本版是對(duì)保真的進(jìn)一步完善、補(bǔ)充。
8.2 圖文對(duì)照
保真與整理統(tǒng)一的原則要求數(shù)字化古籍應(yīng)在原文圖形版和數(shù)字文本版之間建立緊密的聯(lián)系,即實(shí)現(xiàn)圖文關(guān)聯(lián),使文本顯示和圖形顯示能夠方便地切換,以便隨時(shí)對(duì)兩個(gè)版本進(jìn)行對(duì)照使用。
8.2.1 原文圖像版 中醫(yī)藥古籍掃描形成的原文圖像既能保持古籍的“原貌”,內(nèi)容又不會(huì)錯(cuò)訛,而且錄入也方便省力。原貌原圖的采集及相應(yīng)的版本掃描等可以最大程度地實(shí)現(xiàn)中醫(yī)藥古籍形式上的完全保真。
8.2.2 數(shù)字文本版 整理后錄入的數(shù)字文本版不僅內(nèi)容更加真實(shí)可靠,而且可發(fā)揮原文圖像版所不具備的獨(dú)特優(yōu)勢(shì)和功能,如全文檢索、內(nèi)容挖掘、深度標(biāo)引、輔助閱讀、統(tǒng)計(jì)等。當(dāng)然,數(shù)字文本版永遠(yuǎn)不可能完全代替原文圖像版,正如后者不能取代古籍原典一樣。通過圖文對(duì)照,可以達(dá)到古籍原貌保護(hù)和文本充分利用的雙重目的。
古籍?dāng)?shù)字化從本質(zhì)上屬于古籍整理和學(xué)術(shù)研究范疇,以??薄?biāo)點(diǎn)、注釋、今譯、輯佚等為手段,綜合運(yùn)用版本、目錄、??薄⑽淖?、音韻、訓(xùn)詁、考古等多種專業(yè)知識(shí)對(duì)古籍進(jìn)行整理加工。數(shù)字化技術(shù)是其形式,是古籍整理的工具與手段,古籍內(nèi)容本身才是本質(zhì)和核心。就中醫(yī)藥古籍來說,古籍不僅是文物、文化遺產(chǎn)和歷史文獻(xiàn),而且具有很高的學(xué)術(shù)價(jià)值,這就需要對(duì)其學(xué)術(shù)內(nèi)涵進(jìn)行深入挖掘。只有充分熟悉古籍內(nèi)容的專家才有能力決定古籍?dāng)?shù)字化的基本思路和總體構(gòu)架[10]。因此,在整個(gè)數(shù)字化過程中,必須以中醫(yī)藥相關(guān)領(lǐng)域的學(xué)者(中醫(yī)藥教學(xué)、科研、臨床及文獻(xiàn)研究專家)即內(nèi)容專家為主導(dǎo),因?yàn)樗麄儾粌H對(duì)古籍內(nèi)容整理最有發(fā)言權(quán),而且還是古籍?dāng)?shù)字化產(chǎn)品的重點(diǎn)用戶。主要由內(nèi)容專家來決定數(shù)字化的內(nèi)容、標(biāo)引的深度、相關(guān)檢索工具的配置等。在這一過程中,還需要認(rèn)真聽取圖書情報(bào)信息專家意見,并與數(shù)字化技術(shù)專家深入溝通。三類專家充分交流,反復(fù)論證,最終形成實(shí)施技術(shù)方案。
在中醫(yī)藥古籍?dāng)?shù)字化的內(nèi)容與技術(shù)問題權(quán)衡上,要明確技術(shù)是為方便利用而服務(wù)于內(nèi)容的。我們既要避免過高估計(jì)和過分依賴計(jì)算機(jī)在古籍整理和研究領(lǐng)域的作用,又要注意技術(shù)優(yōu)勢(shì)的充分發(fā)揮。在學(xué)術(shù)研究中,電腦和人工智能無論如何先進(jìn),都只能是一種輔助工具,而不能替代學(xué)術(shù)本身。對(duì)中醫(yī)藥古籍進(jìn)行數(shù)字化,無疑有助于消除信息鴻溝(即通過網(wǎng)絡(luò)提供的廣泛且方便的利用機(jī)會(huì),消除使用者獲取信息方面的差距),但也要防止學(xué)術(shù)異化及技術(shù)偽裝學(xué)問。
以上諸原則中,從總體看,保護(hù)與利用相結(jié)合原則、統(tǒng)一規(guī)劃與分步實(shí)施原則、共建共享原則、可持續(xù)發(fā)展原則等可屬宏觀原則,為數(shù)字化前期所重點(diǎn)考慮,其中保護(hù)與利用相結(jié)合原則對(duì)于中醫(yī)藥古籍?dāng)?shù)字化尤為重要。保真原則、整理原則、圖文對(duì)照原則等可屬微觀原則,為數(shù)據(jù)庫建設(shè)的前期基礎(chǔ)工作。標(biāo)準(zhǔn)化原則、技術(shù)服務(wù)于內(nèi)容原則介于宏觀、微觀之間,貫穿于數(shù)字化建設(shè)始終。
[1]高娟,劉家真.中國大陸地區(qū)古籍?dāng)?shù)字化問題及對(duì)策[J].中國圖書館學(xué)報(bào),2013,39(4):110-119.
[2]徐金鑄.中文古籍?dāng)?shù)字化建設(shè)理論問題淺論[J].齊齊哈爾大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2012(6):178-180.
[3]肖禹.古籍?dāng)?shù)字化中的集外字處理問題研究[J].圖書館研究,2013,43(5):27-30.
[4]毛建軍.中文古籍全文數(shù)據(jù)庫的類型與規(guī)范[J].中國索引,2008,6(2): 14-18.
[5]毛建軍.古籍?dāng)?shù)字化商業(yè)運(yùn)作研究[J].圖書館學(xué)研究,2011(19):18-22.
[6]李寶金,藍(lán)韶清,張曉旭.中醫(yī)藥古籍?dāng)?shù)字化建設(shè)的探索與實(shí)踐——以廣東中醫(yī)藥博物館為例[J].大學(xué)圖書情報(bào)學(xué)刊,2012,30(1):36-38,73.
[7]王洪圖.內(nèi)經(jīng)選讀[M].上海:上??茖W(xué)技術(shù)出版社,1997:42.
[8]王益軍.中醫(yī)古籍??迸c整理[J].中國中醫(yī)藥現(xiàn)代遠(yuǎn)程教育.2014,12(4):104-105.
[9]傅景華,高兆孚.景印文淵閣四庫全書:目錄索引醫(yī)家類[M].北京:中醫(yī)古籍出版社,1986:45.
[10]朱開忠.安徽省館藏古籍?dāng)?shù)字化工作探析[J].合肥工業(yè)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2012,26(3):145-148.
Thoughts on Some Principles of Digitalization of Ancient Books of Traditional Chinese Medicine
CHENG Xin
(Library of Anhui University of Chinese Medicine, Hefei Anhui 230038, China)
Ancient books of traditional Chinese medicine (TCM) have dual values both in academy and historic culture. Digitalization is an effective way to save, sort, and use TCM ancient books. In recent years, the development of TCM has attached high attention, but there is a “development bottleneck” in digitalization. The main problems, i.e. the principles of digitalization of TCM ancient books need further thoughts. This article discussed 9 principles that digitalization of TCM ancient books should follow:combination of protection and utilization, integrated planning and implementation with step by step, co-construction and sharing,standardization, sustainable development, fidelity, sorting, image-text contrast, and technology serving content.
ancient books of traditional Chinese medicine; digitalization; principle; thought
10.3969/j.issn.2095-5707.2015.01.002
2014-11-05;編輯:魏民)
2014年度安徽省高校人文社會(huì)科學(xué)研究重點(diǎn)項(xiàng)目(SK2014A286)
程新,副研究館員,研究方向?yàn)閳D書資料、古籍整理。E-mail:cxcxtsg@163.com