周樹斌 周宇婷 施州州 李永卉,2
(1. 江蘇大學科技信息研究所 鎮(zhèn)江 212013;2. 江蘇大學圖書館 鎮(zhèn)江 212013)
古籍作為中華文化傳承的重要載體之一,其價值日漸受到重視,作為中華古籍資源重要組成部分的中醫(yī)古籍,是我國重要的文化資源,也是中華文明貢獻給世界醫(yī)學界的璀璨明珠。中醫(yī)古籍是中醫(yī)理論知識的來源[1],是中醫(yī)傳承中不可或缺的載體。雖然國內古籍數(shù)字化的研究與實踐早在上世紀七八十年代就已經開始[2],取得了一定的成就,也推進了傳統(tǒng)中醫(yī)古籍的整理與研究。但是近年來,人們對中醫(yī)古籍文獻資源的加工、組織與服務深度的需求加強,對知識本體數(shù)字化保存和應用的要求越來越高。在文化與科技融合被高度提倡的當下,用文化引領科技發(fā)展,用科技賦能文化前進已然是大勢所趨,大數(shù)據(jù)等新興科學技術手段的廣泛應用,為中醫(yī)古籍文獻的知識挖掘和研究提供了便捷可靠的工具支撐。準確把握中醫(yī)古籍數(shù)字化的現(xiàn)狀和發(fā)展趨勢,對中醫(yī)學、中藥學及古籍數(shù)字化研究都有一定的價值。為理清該領域的發(fā)展現(xiàn)狀,本文基于文獻計量學理論,結合共詞分析方法、聚類分析方法以及知識圖譜方法對中國知網(CNKI)中醫(yī)古籍數(shù)字化相關文獻進行可視化分析,定量把握當前數(shù)字人文環(huán)境下,國內中醫(yī)古籍數(shù)字化的研究現(xiàn)狀和熱點問題,并就今后的發(fā)展作出展望,以期從定性的層面為相關領域研究提供參考。
以CNKI 的中國學術期刊(網絡版)全文數(shù)據(jù)庫為數(shù)據(jù)來源,對中醫(yī)古籍數(shù)字化相關論文進行檢索。以SU=“中醫(yī)古籍”*(“數(shù)據(jù)庫“+”數(shù)字化“+”數(shù)據(jù)”)為檢索式進行專業(yè)檢索,截止2019年11月29日共檢得301 條結果,其中存在一定數(shù)量的無關文獻。為保證數(shù)據(jù)的真實與可靠性對檢索結果進行逐條瀏覽篩選以進行去重和剔除各類無關條目,最終得到246 篇論文作為可靠的數(shù)據(jù)來源文獻。
本研究主要采用共詞分析[3]、聚類分析[4]、知識圖譜[5]等方法,對關鍵詞與發(fā)文機構進行分析,從而把握當前國內中醫(yī)古籍數(shù)字化研究現(xiàn)狀與熱點。首先,對來源文獻的關鍵詞進行統(tǒng)計分析,包括借助文獻題錄信息統(tǒng)計分析工具軟件SATI3.2、統(tǒng)計分析軟件SPSS 并輔以人工的手段來實現(xiàn)提取高頻關鍵詞進行共詞分析和聚類分析,借助科學知識圖譜繪制工具VOS viewer 對總體關鍵詞進行網絡可視化分析和聚類密度分析,將總體關鍵詞統(tǒng)計分析得出的結果與提取分析高頻關鍵詞所得結果進行對比印證;其次,通過可視化文獻分析軟件Citespace 可視化的方法對研究機構進行分析,借助地理信息系統(tǒng)軟件QGIS3.6 對發(fā)文機構的地理信息進行可視化分析。通過多種方法和軟件的結合,多維度全方位的以定量的方法對當前國內中醫(yī)古籍數(shù)字化領域的研究現(xiàn)狀進行呈現(xiàn),最終從定性的角度進行分析并作出展望。
3.1.1 高頻關鍵詞預處理 使用SATI3.2 對確定的246 篇論文的關鍵詞進行詞頻統(tǒng)計,共計關鍵詞507 個,累計詞頻為986 次。中醫(yī)古籍數(shù)字化研究領域尚處發(fā)展階段,還未成熟,故數(shù)據(jù)量較小,根據(jù)Donohue 高低頻詞分界公式不能夠很好的選取本研究領域的高頻關鍵詞[6],本文采用孫清蘭研究的高頻低頻詞分界標準N=(D 是指不同的關鍵詞個數(shù))[7],來篩選高頻關鍵詞。D為507,代入公式后N 約等于23,故可取約23 個關鍵詞作為高頻關鍵詞。由于統(tǒng)計樣本較小,將頻次大于等于2 的關鍵詞設為選詞范圍。對關鍵詞進行處理,刪除與研究熱點不相關的詞,如“發(fā)展、趨勢、述評、應用”等,同時對近義詞進行合并整理,最終確定詞頻大于5 的24 個規(guī)范高頻關鍵詞。這24 個規(guī)范關鍵詞詞頻總和為507占總詞頻的50.4%,超過知識圖譜繪制規(guī)定的27%,滿足統(tǒng)計分析的標準,表1為高頻關鍵詞和詞頻[8]。
表1 高頻關鍵詞
3.1.2 高頻關鍵詞相異矩陣 對上述規(guī)范化的高頻關鍵詞進行統(tǒng)計,使用SATI3.2 可直接生成共現(xiàn)矩陣、相似矩陣、相異矩陣等多種形式的關鍵詞矩陣。為保證研究的嚴謹性與科學性,方便后續(xù)統(tǒng)計,使用SATI3.2 構建24*24 的高頻關鍵詞相異矩陣(表2)進行分析。相異矩陣中高頻詞交叉線的數(shù)值越大,說明高頻詞之間的關聯(lián)性越小,反之關聯(lián)性則越大[9]。
表2 高頻關鍵詞相異矩陣(部分)
聚類分析方法主要是對多變量(關鍵詞)進行分類,在沒有先驗知識的基礎上,以變量間關系遠近為標準,得出分類結果[10]。將獲得的相異矩陣導入SPSS,在“系統(tǒng)聚類”中選擇“Ward 法”和“Euclidean 距離”,通過聚類分析高頻關鍵詞得到樹狀圖如圖1所示。對圖1的聚類結果進行細粒度的劃分,除去“中醫(yī)古籍”及“古籍數(shù)字化”兩個關鍵詞所代表的主體研究領域外,將其余22 個關鍵詞聚類后分為五個類團,第一類團包含:圖書館、古籍保護;第二類團包含:地方醫(yī)籍、數(shù)字化技術;第三類團包含:本體、詞表、知識服務、中醫(yī)、知識庫;第四類團包含:數(shù)據(jù)挖掘、醫(yī)案;余下部分為第五類團,由于其關鍵詞較多,將其進一步細分為四個子類團,分別為:(1)古籍整理、利用;(2)古籍數(shù)據(jù)庫、黃帝內經、中醫(yī)文獻、檢索;(3)癥候、證治規(guī)律;(4)數(shù)字化建設、中醫(yī)信息、元數(shù)據(jù)。通過對五個類團關鍵詞內在屬性的把握將五個類團依次概括為圖書館與古籍保護研究、地方醫(yī)籍與數(shù)字化技術研究、中醫(yī)古籍數(shù)字化領域本體與知識服務研究、中醫(yī)醫(yī)案的數(shù)據(jù)挖掘研究、中醫(yī)古籍整理與數(shù)據(jù)庫構建研究(包括古籍整理與利用研究、中醫(yī)古籍數(shù)據(jù)庫建設研究、癥候與治證規(guī)律研究和元數(shù)據(jù)方法研究)。
圖1 中醫(yī)古籍數(shù)字化領域研究高頻關鍵詞聚類分析樹狀圖
前兩節(jié)主要是基于高頻關鍵詞的分析來把握中醫(yī)古籍數(shù)字化的研究熱點脈絡,本節(jié)則從全局出發(fā)通過對246 篇文獻的總體關鍵詞進行分析,以更全面的角度把握研究熱點和現(xiàn)狀,與共詞分析和聚類分析得出的結果相印證,提高研究結果的準確性和可信度。利用科學知識圖譜繪制工具VOS viewer 構建知識圖譜,VOS viewer 以色彩差異性來表示各聚類的重要性差異,以密度視圖來揭示學科領域研究的重點與熱點。在關鍵詞共現(xiàn)圖中,節(jié)點被分為不同聚類族,各節(jié)點顏色和其所屬聚類族一致,這樣就可以快速地發(fā)現(xiàn)和觀察各聚類族[11]。通過VOS viewer 的關鍵詞密度視圖可直觀地反映各高頻詞間的共現(xiàn)頻次密度,若兩個關鍵詞共現(xiàn)頻次越高,其聯(lián)系則越緊密,相關性更高,這樣具有高度相關性的高頻詞就被聚合起來,從而形成一個類團。在關鍵詞密度視圖里,各節(jié)點大小表示兩關鍵詞間的耦合強度,節(jié)點間距反映對象間的相似度,節(jié)點間距越小說明相似度越高,反之相似性越低[12]。
通過VOS viewer 對中醫(yī)古籍數(shù)字化領域關鍵詞進行統(tǒng)計和聚類分析,設定共現(xiàn)關系強度規(guī)范化方式為LinLog/modularity,分辨參數(shù)、聚類成員最少數(shù)目分別為1 和5,形成中醫(yī)古籍數(shù)字化領域關鍵詞共現(xiàn)網絡可視化圖譜和關鍵詞共現(xiàn)聚類密度可視化圖譜如圖2所示。從圖譜中可以看到,以“中醫(yī)古籍”和“古籍數(shù)字化”即以“中醫(yī)古籍數(shù)字化”為核心形成了多個重要的研究方向,通過歸納發(fā)現(xiàn)其中中醫(yī)古籍數(shù)字化建設、中醫(yī)文獻元數(shù)據(jù)標引與檢索、中醫(yī)領域本體及中醫(yī)古籍知識庫和知識服務、中醫(yī)信息的數(shù)據(jù)管理和數(shù)據(jù)檢索、醫(yī)案數(shù)據(jù)挖掘、地方及特色中醫(yī)典籍的數(shù)字化、圖書館和古籍保護等研究區(qū)域較為矚目,同時,各研究方向也各自形成了相關性的研究熱點,這與3.2 的分析結果基本吻合,這些研究熱點共同深化了對中醫(yī)古籍數(shù)字化領域的相關研究,推進了國內中醫(yī)古籍數(shù)字化領域研究基本范式格局的形成。
圖2 關鍵詞共現(xiàn)網絡及聚類密度知識圖譜
通過分析文獻作者的所屬機構,可了解國內中醫(yī)古籍數(shù)字化領域研究的核心機構[13]。使用Citespace 進行分析,得到國內中醫(yī)古籍數(shù)字化研究的核心機構如圖3所示。通過對圖3進行分析可以看出,中國中醫(yī)科學院是最主要的研究機構,其下屬機構中國中醫(yī)科學院中醫(yī)藥信息研究所在整個核心機構中占據(jù)主導,中國中醫(yī)科學院中醫(yī)醫(yī)史文獻研究所也很突出。此外,國內中醫(yī)藥院校的圖書館或研究所等圖書情報機構也是領域內主要的研究機構,其中南京中醫(yī)藥大學圖書館表現(xiàn)最為突出。通過分析核心機構間的合作,可發(fā)現(xiàn)各機構的合作目前仍停留在地緣性的合作范疇之內,這說明領域內的研究相對缺乏合作,研究相對比較分散。
圖3 核心機構共現(xiàn)網絡圖
對每篇論文的發(fā)文機構進行定位并統(tǒng)計其地理經緯度坐標,將地理數(shù)據(jù)導入QGIS3.6 中進行地理信息可視化展示如圖4所示,左圖為研究機構分布圖,右圖為相應的熱力圖。通過圖4左圖可以較為直觀觀察在全國范圍內各地區(qū)機構在中醫(yī)古籍數(shù)字化領域的發(fā)文情況,不難看出,相關研究機構多是集中在東部地圖,西部地區(qū)明顯遠遠落后于東部地區(qū),而東部地區(qū)經濟發(fā)展水平明顯優(yōu)于西部地區(qū),因此在一定程度上可以認為地區(qū)研究能力與地區(qū)經濟發(fā)展水平是相適應的。以發(fā)文數(shù)量作為熱力的計算依據(jù),通過圖4右側的熱力圖可以更為直觀地看出,北京及江蘇地區(qū)是最主要的研究區(qū)域,其中北京地區(qū)是最重要的核心地區(qū),這是因為領域內的主導機構中國中醫(yī)科學院位于北京,具有其它地區(qū)所不能比擬的發(fā)文量達上百篇,而排名第二的江蘇地區(qū)僅40 篇。
圖4 研究機構地區(qū)分布和熱力圖
中醫(yī)古籍數(shù)字化研究應聚焦中醫(yī)古籍資源本身。中醫(yī)古籍數(shù)字化所面向的古籍資源,從內容上來看,包含了本草醫(yī)藥古籍、養(yǎng)生古籍、中醫(yī)食療古籍、氣功古籍、古天文醫(yī)學古籍、以及針灸古籍等多種內容形式的中醫(yī)古籍;除傳統(tǒng)漢醫(yī)古籍外,還囊括了各少數(shù)民族醫(yī)藥古籍,如藏醫(yī)古籍、回醫(yī)古籍、云南少數(shù)民族醫(yī)藥古籍、傣醫(yī)古籍、維吾爾族醫(yī)藥古籍、蒙醫(yī)藥古籍、貴州民族古籍等;同時兼具地方中醫(yī)古籍研究特色,如巴蜀地區(qū)醫(yī)學古籍、新安醫(yī)學古籍、嶺南醫(yī)學古籍、河東醫(yī)學古籍、漢喃醫(yī)學古籍等。中醫(yī)古籍種類繁多,內涵豐富,尤其地區(qū)醫(yī)籍,當前西部地區(qū)的中醫(yī)古籍發(fā)掘潛力巨大,對中醫(yī)古籍資源本身進行細粒度的研究必然會成為當前的研究熱點。
鑒于中醫(yī)古籍資源的豐富性、多樣性,制定統(tǒng)一的元數(shù)據(jù)標準十分必要。人們要對海量的古籍文獻數(shù)據(jù)進行分析、判別與選取,良好的數(shù)據(jù)規(guī)范是人們可以充分利用數(shù)據(jù)的前提,建立中醫(yī)古籍數(shù)字化產品質量評價標準、文本格式標準和元數(shù)據(jù)規(guī)范在中醫(yī)古籍數(shù)字化領域的重要性也就不言而喻。如何對元數(shù)據(jù)進行標引決定了如何對其進行檢索和利用,越來越多的研究者開始關注文獻元數(shù)據(jù)標引與著錄規(guī)則如何適應數(shù)字化發(fā)展問題[14],如丁侃等探討了中醫(yī)古籍圖像標引的基本方案,分析探討了古籍信息、版本信息和圖像本體三種元數(shù)據(jù)[15];趙陽等探討了中醫(yī)文獻元數(shù)據(jù)的設計前提,對中醫(yī)藥文獻元數(shù)據(jù)的著錄對象進行界定并對中醫(yī)文獻元數(shù)據(jù)的必要性進行了分析[16];劉梨等對中醫(yī)古籍四大經典中醫(yī)護理文獻進行了整理并建立了相應的數(shù)據(jù)庫平臺[17]。
近年來,本體建模、資源描述框架RDF 等語義網技術的研究形成了熱潮[18],這些技術方法可以從知識層面對中醫(yī)古籍資源進行有效地組織,為該領域內的知識組織提供強有力的工具支撐。當前中醫(yī)古籍的知識組織研究多是嘗試構建領域本體,進行中醫(yī)古籍數(shù)字資源語義關聯(lián)方面的探索,如丁侃等提出構建中醫(yī)文獻與人物本體,將中醫(yī)學術傳承的脈絡方案進行關聯(lián),利用本體對異構中醫(yī)藥古籍資源的元數(shù)據(jù)方案統(tǒng)一進行語義化處理,實現(xiàn)平臺間的資源聚合[19];李明等使用領域本體進行中醫(yī)古籍數(shù)據(jù)庫的語義擴展,從而提高中醫(yī)古籍文獻查全率和查準率[20]。這些研究在一定程度上填補了國內中醫(yī)古籍本體構建和語義關聯(lián)研究的空白,拓展了領域內的研究方法,具有一定的現(xiàn)實意義。
利用數(shù)據(jù)挖掘技術對中醫(yī)古籍的價值可以進行充分揭示。隨著大數(shù)據(jù)技術的日漸成熟和廣泛應用,傳統(tǒng)的計算機技術,如數(shù)據(jù)挖掘技術等在人文科學研究領域得到了比較廣泛的應用。一方面,數(shù)據(jù)挖掘技術為中醫(yī)古籍的內容挖掘提供了方法上的拓展和創(chuàng)新,還可以從海量的數(shù)據(jù)中發(fā)掘蘊含的規(guī)律和模式。另一方面,數(shù)據(jù)挖掘技術本身也伴隨著大數(shù)據(jù)技術如機器學習等技術的發(fā)展不斷延伸進步,相關算法日漸成熟。目前相關研究主要包括通過數(shù)據(jù)挖掘技術分析中醫(yī)古籍文獻中的用藥規(guī)律、對病名源流進行考辨、研究藥方組配等。例如,雷亞玲等通過建立古籍文獻及名老中醫(yī)郁病診治數(shù)據(jù)庫,運用數(shù)據(jù)挖掘技術對古籍文獻及名老中醫(yī)經驗的郁病用藥規(guī)律進行挖掘和分析[21];邢益濤使用數(shù)據(jù)挖掘技術對中醫(yī)古籍的不育癥病名源流進行考辨[22];譚子虎等通過對中醫(yī)古籍的數(shù)據(jù)挖掘進行了對痙病病名源流的考辨[23];陳茲滿等運用數(shù)據(jù)挖掘技術對中醫(yī)古籍眼科點眼方劑的用藥規(guī)律進行了分析[24];陳廣坤等基于對中醫(yī)古籍方劑的數(shù)據(jù)挖掘進行了養(yǎng)發(fā)育發(fā)藥物組配研究[25]。
中醫(yī)古籍數(shù)據(jù)庫是中醫(yī)古籍在數(shù)字時代的重要載體,也是當代使用中醫(yī)古籍的重要途徑,已取得一定的成績[26]。當前國內中醫(yī)古籍數(shù)據(jù)庫的規(guī)模種類已較為豐富,有綜合數(shù)據(jù)庫如中國基本古籍庫、龍語翰堂典籍數(shù)據(jù)庫、文淵閣四庫全書電子版、愛如生系列數(shù)據(jù)庫、國學寶典等綜合性數(shù)據(jù)庫;有專門數(shù)據(jù)庫如中華醫(yī)典、中國中醫(yī)古籍總目、金圖國際中醫(yī)藥古籍資料庫、黃帝內經古籍數(shù)據(jù)庫等專門數(shù)據(jù)庫;有以病癥進行分類的病癥專題數(shù)據(jù)庫,如痹癥、腎病、肺病、冠心病等病癥的專題數(shù)據(jù)庫;還有醫(yī)學人物的專題數(shù)據(jù)庫,如華佗、孫思邈等的專門數(shù)據(jù)庫;更有打造民族特色、地方特色的數(shù)據(jù)庫及名老中醫(yī)文獻數(shù)據(jù)庫等。根據(jù)用戶需求的多樣化,已有的數(shù)字平臺大多可以網頁端、移動端、微信端并舉,如經典古籍庫,作為全球首個大型隨身古籍庫,涵蓋經史子集各部1 165 種書,收錄古籍均為經典權威點校本,并提供全文檢索和在線閱讀,以及聯(lián)機字典、紀年換算等工具。如今,中醫(yī)古籍數(shù)據(jù)庫的構建日趨注重對知識服務的提供,由數(shù)據(jù)庫向知識庫方向轉變的趨勢也就越發(fā)凸顯。
美國學者John Unsworth 教授認為,數(shù)字人文改變了人文知識的發(fā)現(xiàn)、標注、比較、引用、取樣、闡述與呈現(xiàn),從而實現(xiàn)人文研究、教學升級和創(chuàng)新發(fā)展[27]。但是,數(shù)字人文的關鍵是以“數(shù)字”輔助“人文”,而不是以“數(shù)字”替代“人文”[28]。因此,必須充分發(fā)揮數(shù)字技術在人文領域研究的工具性作用,從數(shù)字時代出發(fā)考慮重構人文知識脈絡和內容,從全新的技術角度去構建當代中醫(yī)知識系統(tǒng)和認知方式。如今中醫(yī)古籍研究迎來了新的發(fā)展空間,新興的數(shù)字技術可以滿足人們對中醫(yī)古籍文獻資源的加工、組織與服務的深度需求,海量且十分寶貴的中醫(yī)古籍可以得到更好的開發(fā)利用,中醫(yī)學、中藥學研究應用的深度和廣度也必然在此背景下不斷延伸。
盡管學界已對中醫(yī)古籍元數(shù)據(jù)的標準進行了一定探討,但尚未進行有效的分類與標引,各機構間的研究多獨立分散,缺乏真正統(tǒng)一的元數(shù)據(jù)標準和規(guī)范。目前,大多數(shù)中醫(yī)古籍數(shù)據(jù)仍處于非結構化的無組織狀態(tài),導致了豐富的資源不能被很好的利用。因此,結構化的數(shù)據(jù)和統(tǒng)一的標準規(guī)范必然是今后的發(fā)展方向。隨著科學技術的發(fā)展與完善,古籍整理研究范式也在發(fā)生重大變革,版本識別、目錄、???、訓詁等傳統(tǒng)研究方法與手段具有一定的局限性。在當前環(huán)境下,對中醫(yī)古籍進行科學規(guī)范的整理是更好利用中醫(yī)古籍的關鍵所在,今后關于中醫(yī)古籍元數(shù)據(jù)標引和檢索的研究還會不斷發(fā)展,多元化的元數(shù)據(jù)標準規(guī)范逐漸趨于統(tǒng)一,相信最終會形成真正可以為各界所認可和遵循的標準規(guī)范,為構建中醫(yī)古籍資源結構化知識體系提供支撐。
當前中醫(yī)古籍領域內知識組織研究通常是借鑒其他領域內本體和語義關聯(lián)的模型,尚未形成一個較為成熟的中醫(yī)古籍資源語義描述規(guī)范。在語義發(fā)布層面,中醫(yī)古籍關聯(lián)數(shù)據(jù)集和本體建模大多仍是以手工的方式完成,這就給在大數(shù)據(jù)環(huán)境下中醫(yī)古籍數(shù)據(jù)的處理帶來了巨大的挑戰(zhàn);在研究內容層面,仍停留在對中醫(yī)古籍書目進行研究的層面,未能實現(xiàn)對內部知識結構的充分揭示。以語義網技術進一步驅動中醫(yī)古籍領域內的知識組織已成為領域內的迫切需要,今后的發(fā)展方向應是由粗粒度的文獻研究層面向細粒度的知識單元層面轉變,將語義網技術應用到中醫(yī)古籍文獻內容層面的研究與開發(fā)中,對全文內容進行知識關聯(lián)組織,從而充分揭示中醫(yī)古籍的內涵,降低使用門檻。通過語義網技術整合異構中醫(yī)古籍數(shù)字資源,鏈接領域內的數(shù)據(jù)孤島,避免資源的重復建設,實現(xiàn)領域內的知識聚合,為中醫(yī)古籍的知識發(fā)現(xiàn)提供前提和保障,進一步提高資源的開放共享。
現(xiàn)階段的研究對數(shù)據(jù)挖掘技術在中醫(yī)方劑等領域進行了有益的探索,但還存在著一定程度的不足。一方面,中醫(yī)古籍由于年代和地域差異性,導致數(shù)據(jù)中普遍存在詞語混淆現(xiàn)象,面對這樣的情況,有時并不能準確挖掘出所需信息;另一方面,當前數(shù)據(jù)挖掘技術在中醫(yī)古籍研究的應用上多是范圍上的定位,而非真正意義上的精確定位。因此,在中醫(yī)古籍研究中,數(shù)據(jù)挖掘技術在算法層面有待進一步改進,數(shù)據(jù)挖掘技術與中醫(yī)古籍研究也有待進一步融合提高。隨著技術的不斷進步,數(shù)據(jù)挖掘技術參與中醫(yī)古籍數(shù)字化必將拓展研究的深度與廣度,激發(fā)海量數(shù)據(jù)中蘊含的潛在價值,為中醫(yī)古籍數(shù)字資源的智能化變革提供強力的技術支撐,成為今后發(fā)展過程中一項極為重要的輔助技術工具。
目前中醫(yī)古籍數(shù)據(jù)庫開發(fā)種類多樣,但大多仍停留文獻服務層面而非知識服務層面,缺乏深層次的知識挖掘與知識分析,難以形成領域內數(shù)據(jù)和知識的共享,對學科研究與發(fā)展的影響有一定局限性。打造以知識服務為導向的中醫(yī)古籍知識庫已成為領域內的現(xiàn)實所需,對于中醫(yī)古籍數(shù)據(jù)庫的使用,用戶更希望直接實現(xiàn)對中醫(yī)、中藥知識的獲取和利用,而非對中醫(yī)文獻的簡單查找,故今后應以知識服務為導向,使數(shù)據(jù)庫的開發(fā)向知識庫方向發(fā)展。中醫(yī)古籍知識庫的建設需要依托于大數(shù)據(jù)技術,對多元化的資源進行知識挖掘,實現(xiàn)對數(shù)據(jù)從顯性信息到隱形知識的提取和升華,結合本體及語義關聯(lián)技術對文獻內在的知識進行組織關聯(lián),輔以規(guī)范的元數(shù)據(jù)標引與檢索規(guī)則,使得數(shù)據(jù)以結構化的方式呈現(xiàn),從而形成規(guī)范化、系統(tǒng)化的知識網絡體系,實現(xiàn)對中醫(yī)古籍更為深層次的開發(fā)和利用。
中國中醫(yī)古籍數(shù)字化工作經過多年的發(fā)展,取得了令人欣喜的成績,這些成果很大程度上改善和促進了傳統(tǒng)的研究與應用,讓中醫(yī)古籍在文化傳承與學術研究方面獲得了更好的發(fā)展。隨著時代的發(fā)展,通過引入越來越多的數(shù)字人文領域的技術方法如GIS 技術、數(shù)字感知技術、知識圖譜技術、5G 技術等,可以為中醫(yī)古籍研究與開發(fā)帶來全新的生命與活力。