凌天,焦陽(yáng),李露芳,錢(qián)俊文,張永生
1.浙江中醫(yī)藥大學(xué)圖書(shū)館,杭州 310053
2.浙江中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院,杭州 310053
浙江中醫(yī)藥源遠(yuǎn)流長(zhǎng),中醫(yī)醫(yī)林人物眾多,這些醫(yī)家關(guān)于中醫(yī)藥基礎(chǔ)理論、中醫(yī)教育思想以及中醫(yī)科學(xué)化的一些見(jiàn)解,對(duì)當(dāng)代浙江中醫(yī)藥事業(yè)的發(fā)展具有重要參考價(jià)值或借鑒意義;在西方醫(yī)學(xué)傳入、近代醫(yī)療衛(wèi)生體系確立、對(duì)中國(guó)傳統(tǒng)醫(yī)學(xué)進(jìn)行反思的歷史背景下,浙派醫(yī)家學(xué)術(shù)上百家爭(zhēng)鳴,所編撰的醫(yī)籍醫(yī)著也明顯地帶上了時(shí)代的烙印,具有較高的學(xué)術(shù)價(jià)值、應(yīng)用價(jià)值,值得全面整理、繼承,以及精心研究。但明清浙江中醫(yī)醫(yī)家數(shù)據(jù)通常收錄于各類(lèi)中醫(yī)藥文獻(xiàn)典籍中,零散且數(shù)字化程度較低,難以深入研究。隨著計(jì)算機(jī)技術(shù)不斷發(fā)展,通過(guò)數(shù)據(jù)庫(kù)可以有效管理各類(lèi)數(shù)字化數(shù)據(jù)。通過(guò)建立明清浙江中醫(yī)醫(yī)家數(shù)據(jù)集,不僅能夠深入研究浙江中醫(yī)藥文化與發(fā)展史,進(jìn)而研究如何更好地傳承傳統(tǒng)中醫(yī)藥文化,增強(qiáng)中醫(yī)藥文化自信。
目前中醫(yī)醫(yī)家研究主要分為兩類(lèi):傳統(tǒng)內(nèi)容和單一對(duì)象數(shù)據(jù)庫(kù)研究。傳統(tǒng)內(nèi)容以近代浙派中醫(yī)名家研究為主,如1935年名醫(yī)曹炳章先生的《浙江名醫(yī)傳略》[1]和周岐隱先生的《浙江歷代名醫(yī)錄》[2]問(wèn)世。1983-1990年,浙江省中醫(yī)學(xué)會(huì)醫(yī)史分會(huì)、浙江省中醫(yī)藥管理局先后編撰《浙江歷代醫(yī)林人物》[3]。二十世紀(jì)九十年代初,浙江省中醫(yī)藥管理局聯(lián)合中醫(yī)藥系統(tǒng)各單位以及學(xué)者以編撰《浙江省科學(xué)技術(shù)志》[4],所收史料以1990年底為截止時(shí)間,其中“中醫(yī)藥學(xué)”篇章收錄了大量中醫(yī)藥學(xué)有關(guān)的資料,概要介紹了部分浙派中醫(yī)名家和重要醫(yī)籍。單一對(duì)象數(shù)據(jù)庫(kù)研究包括:2010年朱樹(shù)良[5]對(duì)浙江省現(xiàn)存中醫(yī)藥古籍中500多種珍貴孤本進(jìn)行數(shù)碼掃描錄入多媒體數(shù)據(jù)庫(kù)。2021年趙澤鵬[6]等構(gòu)建現(xiàn)代名老中醫(yī)醫(yī)案,歸納和總結(jié)名醫(yī)經(jīng)驗(yàn)。
縱觀已有研究,醫(yī)家作為不同時(shí)期學(xué)者的研究熱點(diǎn),較早年代中浙江歷代名醫(yī)研究?jī)H能以傳統(tǒng)紙質(zhì)媒介為載體而出版,傳播利用率較低;新時(shí)代以來(lái)信息技術(shù)快速發(fā)展,部分學(xué)者對(duì)現(xiàn)存紙質(zhì)古籍?dāng)?shù)字化并存入數(shù)據(jù)庫(kù)中,使古籍得到有效保護(hù)與傳承,但數(shù)字化成品難以以元數(shù)據(jù)形式得到有效檢索與利用。浙江是近代中醫(yī)教育的發(fā)源地之一,在新舊文明和中西文化交匯與沖突的大背景下,中醫(yī)傳承與發(fā)展受到了中西醫(yī)學(xué)的交匯、中醫(yī)學(xué)的存廢討論的沖擊,明清與近代醫(yī)家們主動(dòng)或被動(dòng)地順應(yīng)時(shí)代需求,開(kāi)創(chuàng)了典型的近現(xiàn)代中醫(yī)文化。因此,建立明清浙江中醫(yī)醫(yī)家數(shù)據(jù)集不僅可以通古及今,為近代浙江中醫(yī)藥文化的深入研究提供幫助,更能為現(xiàn)代中醫(yī)藥文化發(fā)展所借鑒。本文以1368-1912年之間的浙江中醫(yī)醫(yī)家為研究對(duì)象,查閱整理收集相關(guān)文獻(xiàn)典籍,將所有資料數(shù)字化存入數(shù)據(jù)庫(kù)中,并根據(jù)醫(yī)家生平考證醫(yī)家學(xué)術(shù)流派與治療特色,同時(shí)提取出Excel與XML兩種便于利用的數(shù)據(jù)集格式,為進(jìn)行更深層次的醫(yī)家、醫(yī)學(xué)著作、學(xué)術(shù)流派和可視化知識(shí)圖譜研究提供數(shù)據(jù)基礎(chǔ)。
本數(shù)據(jù)集的數(shù)據(jù)主要來(lái)源于《中醫(yī)人名大辭典》、《浙江歷代名醫(yī)錄》、《浙江名醫(yī)傳略》(未出版手抄孤本)和《浙江醫(yī)人考》等辭典史料書(shū)籍[7-8]。在此,本數(shù)據(jù)集對(duì)于這些著作的作者的學(xué)術(shù)貢獻(xiàn)與辛勤付出予以深切的敬意和謝忱。這些著作記述了晉、南北朝、唐、五代、宋、金、元、明與清代的各個(gè)時(shí)期的浙江名醫(yī)生平和獨(dú)特治療經(jīng)驗(yàn),并附有提要、索引、作者自序和編輯凡例,極具學(xué)術(shù)研究?jī)r(jià)值。本數(shù)據(jù)集摘取1368-1912年間浙江醫(yī)家本名,以姓氏筆畫(huà)排列,扼要介紹其生平、著作、師承關(guān)系等。
因本數(shù)據(jù)集數(shù)據(jù)源均為非可直接編輯數(shù)字化文本的紙質(zhì)材料,因此需采用漢王高清文本儀進(jìn)行數(shù)字化加工,按照600DPI以上分辨率掃描轉(zhuǎn)化為符合國(guó)家標(biāo)準(zhǔn)GB/T 23286.3-2021、可長(zhǎng)期保存的PDF格式電子文檔文件,并通過(guò)OCR技術(shù)識(shí)別并校對(duì)為RDD彈性分布式集合類(lèi)型的、可機(jī)器識(shí)別編輯的文本數(shù)據(jù)集。此時(shí)文本數(shù)據(jù)集包含歷代不同地域的中醫(yī)醫(yī)家信息,因此通過(guò)python按照年代、所屬市縣鄉(xiāng)等關(guān)鍵詞抽取符合條件的中醫(yī)醫(yī)家,進(jìn)行清洗合并處理。最終生成通用標(biāo)準(zhǔn)數(shù)據(jù)集格式并包含如下字段:姓名、拼音、字、號(hào)、籍貫、居住地、年代、學(xué)派、治療特色、醫(yī)家生平(包含醫(yī)籍)等。共整理出中醫(yī)醫(yī)家807條記錄,其中明確浙派中醫(yī)學(xué)術(shù)流派的醫(yī)家136名,可考證生平年月的醫(yī)家153名。共校對(duì)字?jǐn)?shù)77033個(gè),包括中文字符數(shù)71660個(gè)。
本數(shù)據(jù)集的數(shù)據(jù)采集與處理流程圖如下:
圖1 數(shù)據(jù)采集與處理流程Figure 1 Data collection and processing flow
本數(shù)據(jù)集主要采集的是特定條件下中醫(yī)醫(yī)家所屬信息數(shù)據(jù)。每位醫(yī)家生活社會(huì)環(huán)境不同,生平經(jīng)歷亦不同,因此必然具有個(gè)人特征屬性,如地域?qū)傩?、文化屬性和社?huì)屬性等。將這些屬性綜合一體可以挖掘出人物形象、師承關(guān)系、事跡經(jīng)歷等等,為現(xiàn)代學(xué)者研究提供寶貴的研究資料基礎(chǔ)。因此,本數(shù)據(jù)集主要特征可以分為地域特征、學(xué)術(shù)流派特征、醫(yī)術(shù)特色特征等。如表1所示:
表1 醫(yī)家人物特征與內(nèi)容Table 1 Characteristics and contents of physicians
1.3.1 地域特征
地域特征不僅是醫(yī)家特有的基本屬性,也是中醫(yī)藥文化特征。中醫(yī)歷史悠久,最早可追溯到漢代班固撰寫(xiě)的《漢書(shū)·藝文志》中記載,經(jīng)過(guò)千年發(fā)展與文化沉淀,形成了中華民族特色的醫(yī)藥學(xué)文化;同時(shí)中醫(yī)也是一種地域文化,其與地域空間內(nèi)的文化主體——醫(yī)家的字、號(hào)、籍貫、居住地密切相關(guān)。其中醫(yī)家的字是古人對(duì)名的補(bǔ)充和解釋?zhuān)糠轴t(yī)家以籍貫作為自己的字,如王一仁以新安為字,取自浙江省杭州市新安村,均具有很強(qiáng)的地域?qū)傩浴?/p>
1.3.2 學(xué)術(shù)流派特征
浙江中醫(yī)藥歷史悠久、流派眾多。浙江中醫(yī)學(xué)會(huì)第六屆理事會(huì)將浙江中醫(yī)藥概括為浙派中醫(yī)十大流派,其學(xué)術(shù)流派特征與地域特征具備一定關(guān)聯(lián)性。僅以人名、地域而言,就有永嘉學(xué)派、錢(qián)塘醫(yī)派、紹派傷寒、丹溪學(xué)派[9]等。而基于同一地域內(nèi),全國(guó)首屆名中醫(yī)范永生教授還定義了浙江區(qū)域內(nèi)的其他六大學(xué)派:溫補(bǔ)學(xué)派、溫病學(xué)派、本草學(xué)派、醫(yī)經(jīng)學(xué)派、針灸學(xué)派、傷寒學(xué)派[10]。浙派中醫(yī)學(xué)術(shù)流派包含整個(gè)浙江地域中醫(yī)流派,囊括了內(nèi)科、婦科、傷科、兒科等臨床學(xué)科分類(lèi),對(duì)浙江中醫(yī)藥的社會(huì)影響力具有極大促進(jìn)作用?!罢闩芍嗅t(yī)”為現(xiàn)代稱(chēng)謂,并未由古代中醫(yī)傳承而來(lái),因此需從浙江醫(yī)家生平凝練概括。
1.3.3 醫(yī)術(shù)特色特征
醫(yī)術(shù)特色是古代中醫(yī)擅長(zhǎng)診治的病證范圍和醫(yī)術(shù)水平高低的具體表現(xiàn),也是現(xiàn)代中醫(yī)臨床專(zhuān)業(yè)化分科的重要依據(jù)。醫(yī)術(shù)特色特征作為醫(yī)家特有的重要屬性,在古代官方醫(yī)學(xué)的分科中,元代太醫(yī)院將中醫(yī)分為十三科并沿用到明隆慶年間,清代在此基礎(chǔ)上整頓合并成中醫(yī)五科,一直沿用到民國(guó)時(shí)期。古代醫(yī)學(xué)分科主要以具體證名命名,與現(xiàn)代臨床分科存在一定區(qū)別,同樣需從醫(yī)家生平考證總結(jié)出來(lái)。為確保數(shù)據(jù)準(zhǔn)確性,將其中不少生平不詳?shù)尼t(yī)家其古代醫(yī)學(xué)分科統(tǒng)一歸為不詳,留給后繼學(xué)者考證完善。
本數(shù)據(jù)集主要存儲(chǔ)形式為Excel總表和XML系列文件集。其中Excel總表是以電子表格形式將所有醫(yī)家信息匯總展示,具有瀏覽檢索、分類(lèi)匯總、編輯加工等功能,滿足使用者基本需求??偙碇杏?2個(gè)字段,包含序號(hào)ID、姓名、漢語(yǔ)拼音、字、號(hào)、籍貫、居住地、年代、學(xué)派、古代醫(yī)學(xué)分科、現(xiàn)代臨床分科、醫(yī)家生平(包含醫(yī)籍)。XML文件是數(shù)據(jù)交流的公共標(biāo)準(zhǔn)語(yǔ)言,具有極強(qiáng)的兼容性,可無(wú)縫對(duì)接 Windows、Linux、MacOS等常用桌面系統(tǒng)平臺(tái)的數(shù)據(jù)倉(cāng)儲(chǔ)。因其數(shù)據(jù)結(jié)構(gòu)較為簡(jiǎn)單,可以使用于任意程序之間的信息交換。本數(shù)據(jù)集將每一位醫(yī)家信息單獨(dú)編譯成個(gè)體XML,再匯總成XML系列文件集,便于專(zhuān)業(yè)人士在此基礎(chǔ)上信息調(diào)用與編程加工。數(shù)據(jù)樣本描述如圖2、圖3所示。
圖2 明清浙派中醫(yī)醫(yī)家數(shù)據(jù)集(Excel格式)Figure 2 Dataset of Zhejiang traditional Chinese medicine physicians in Ming and Qing Dynasties (Excel format)
圖3 明清浙派中醫(yī)醫(yī)家數(shù)據(jù)集(XML格式)Figure 3 Dataset of Zhejiang traditional Chinese medicine physicians in Ming and Qing Dynasties (XML format)
為控制數(shù)據(jù)質(zhì)量,保證數(shù)據(jù)的準(zhǔn)確性、真實(shí)性與科學(xué)性,本數(shù)據(jù)集從權(quán)威辭典史料書(shū)籍中采集原始材料加工。其中《中醫(yī)人名大辭典》由北京中醫(yī)藥大學(xué)古文獻(xiàn)專(zhuān)家收集編寫(xiě),《浙江名醫(yī)傳略》由近代浙江著名中醫(yī)學(xué)家曹炳章著述,《浙江歷代名醫(yī)錄》同為近現(xiàn)代浙江中醫(yī)家周岐隱著錄,《浙江醫(yī)人考》由溫州醫(yī)科大學(xué)、全國(guó)名中醫(yī)劉時(shí)覺(jué)教授編著,數(shù)據(jù)權(quán)威性得以保障,可信度較高。
本數(shù)據(jù)集從各類(lèi)權(quán)威學(xué)術(shù)資料中共采集收錄了807名浙派中醫(yī)醫(yī)家數(shù)據(jù),可為了解明清時(shí)期以來(lái)浙派中醫(yī)學(xué)術(shù)流派傳承與西醫(yī)引進(jìn)思想碰撞提供一手資料。隨著國(guó)內(nèi)數(shù)字人文領(lǐng)域研究興起與發(fā)展,用戶可以基于此數(shù)據(jù)集進(jìn)行統(tǒng)計(jì)分析與構(gòu)建可視化圖譜研究。同時(shí)本項(xiàng)目組成員基于此數(shù)據(jù)集構(gòu)建了浙派中醫(yī)文獻(xiàn)數(shù)據(jù)庫(kù),可以提供用戶可視化檢索服務(wù)。其中部分古代醫(yī)學(xué)分科、學(xué)術(shù)流派等字段目前因無(wú)史料支撐處于不詳狀態(tài),可以供感興趣的用戶進(jìn)行考證、補(bǔ)全。同時(shí)任何非商業(yè)目的的個(gè)人用戶可以使用此數(shù)據(jù)集搭建中醫(yī)知識(shí)庫(kù)等。
中國(guó)科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版)2022年3期