宋 瑤,林咸明,王莉莉
(1浙江中醫(yī)藥大學(xué)附屬第二醫(yī)院·浙江 杭州 310000;2浙江中醫(yī)藥大學(xué)附屬第三醫(yī)院·浙江 杭州 310000)
中醫(yī)學(xué)認(rèn)為“神”是生命的本原與本質(zhì),是精神活動的物質(zhì)基礎(chǔ),強(qiáng)調(diào)針灸治療必須以神為根本?!端貑枴毭握摗访鞔_指出“凡刺之真,必先治神”;《靈樞·官能》認(rèn)為“用針之要,無忘其神”,因此“治神”“調(diào)神”成為中醫(yī)針灸療法的核心精髓,并衍生出眾多以“調(diào)神”命名的針法,如通督調(diào)神針法、醒腦調(diào)神針法、調(diào)神益智針法、調(diào)神利咽針法等等[1-4],臨床籠統(tǒng)稱為“調(diào)神”類針法。近年來,與“調(diào)神”相關(guān)針法的文獻(xiàn)發(fā)表量逐年升高,研究內(nèi)容豐富多樣。本研究引入基于機(jī)器學(xué)習(xí)的文本挖掘技術(shù),通過TF-IDF算法自動尋找“調(diào)神”相關(guān)針法文獻(xiàn)中的特征詞匯,結(jié)合原文數(shù)據(jù)回溯、人工閱讀分析降噪等方法,發(fā)掘“調(diào)神”類針法在主治病機(jī)、適用科屬病種、主要選穴歸經(jīng)等方面的特點,以期指導(dǎo)針灸臨床。
1 資料與方法
1.1 數(shù)據(jù)來源及檢索方法 文獻(xiàn)來源中國期刊全文數(shù)據(jù)庫(CNKI)、維普數(shù)據(jù)庫(VIP)、萬方數(shù)據(jù)庫,時間范圍為建庫至2020 年12 月所有與“調(diào)神”針灸法有關(guān)的文獻(xiàn)。主題詞為“針灸”“調(diào)神“治神”,并結(jié)合手工檢索各論文參考文獻(xiàn)目錄。
1.2 文獻(xiàn)納入及排除標(biāo)準(zhǔn) 納入標(biāo)準(zhǔn):選取已經(jīng)正式發(fā)表的包含有“調(diào)神”針灸法具體應(yīng)用、經(jīng)驗總結(jié)等的期刊論文。排除標(biāo)準(zhǔn):①動物實驗研究性論文;②臨床治療中未以“調(diào)神”針灸法為主要治療方法的論文;③重復(fù)發(fā)表的文章。
1.3 文本挖掘
1.3.1 分詞預(yù)處理 將納入文獻(xiàn)利用Jieba中文分詞工具進(jìn)行分詞預(yù)處理。Jieba中文分詞是最常見的中文分詞工具之一,以“最大匹配”作為匹配規(guī)則,完成基于詞典的候選詞挑選和最終結(jié)果的返回[5]。詞表數(shù)據(jù)來源于《中國針灸穴位通鑒》[6]、《中國中醫(yī)藥學(xué)主題詞表》[7]《中醫(yī)病證分類與代碼》(GB/T15657-1995)[8]。
1.3.2 分詞的文本挖掘 將預(yù)處理的單詞于Python3.6環(huán)境中提取頻率-逆向文件頻率(term frequency inverse document frequency, TF-IDF)值。TF-IDF算法是從一組多個文檔中提取具有高重要性的單詞的方法,單詞在特定的文檔中出現(xiàn)的頻率越高,說明它在區(qū)分該文檔內(nèi)容屬性方面的能力越強(qiáng)(TF);單詞在文檔中出現(xiàn)的范圍越廣,說明它區(qū)分文檔內(nèi)容的屬性越低(IDF)[9]。歸一化TF-IDF計算公式為[10]
對于所有“調(diào)神”相關(guān)針法文獻(xiàn),在上述公式中,i代表第i篇文章,j代表特征性詞匯j。N表示與“調(diào)神”針灸法有關(guān)的全部文獻(xiàn)數(shù)量,表示“調(diào)神”針灸法特征性詞匯j在N中出現(xiàn)的次數(shù),s表示“調(diào)神”針灸法中特征性詞匯的總個數(shù)。所有文獻(xiàn)中第j個特征詞匯的TF-IDF均值,某單詞的TF-IDF值越大,則該單詞對于“調(diào)神”針灸法意義越大。結(jié)合TF-IDF值及分詞排序加權(quán)值(加權(quán)關(guān)聯(lián)值),進(jìn)行聚類及可視化。
2 結(jié)果與分析
根據(jù)設(shè)定好的檢索詞,通過計算機(jī)檢索得到“調(diào)神”相關(guān)針法文獻(xiàn)共183 篇,經(jīng)過再次篩選,將其中符合納入條件的168 篇錄入Jieba分詞工具數(shù)據(jù)庫分析,得出16 224 個詞匯,計算各分詞TF-IDF值,剔除對于研究結(jié)果無意義單詞,如“醫(yī)院”“療效”等;對于意義相近單詞,選取TF-IDF值較高者,如“卒中”TF-IDF值0.0450,“腦卒中”TF-IDF值為0.0370,納入詞匯“卒中”,剔除詞匯“腦卒中”,具體結(jié)果如下。
2.1 “調(diào)神”相關(guān)針法主治的病機(jī) 共提取到“調(diào)神”相關(guān)針法主治的病機(jī)54 項,依據(jù)TF-IDF值聚類及可視化處理,可見有兩組分詞連線較多且線條較粗,分別是腦神-安神-心脾兩虛、氣血-疏肝-氣郁,說明“調(diào)神”相關(guān)針法主治病機(jī)與心、腦、脾、肝失調(diào)強(qiáng)相關(guān),著重調(diào)節(jié)腦、心、脾神,與肝氣調(diào)達(dá)、氣血和暢關(guān)系密切。見圖1。
注:“調(diào)神”相關(guān)針法主治的病機(jī)可聚為3 大類,分別位于3個圓圈內(nèi),連線表示分詞之間的相互關(guān)系,相關(guān)性越強(qiáng),連線越多、線條越粗,越處于核心位次。
2.2 “調(diào)神”相關(guān)針法適用的疾病及科屬 “調(diào)神”相關(guān)針法在臨床運(yùn)用中包含內(nèi)科、外科、婦科、皮膚科4 個疾病科屬,共34 種疾病,涵蓋27 種內(nèi)科病、3 種外科病、皮膚病婦科病各2種,其中TF-IDF值前3位疾病依次是抑郁(0.0494)、卒中(0.0450)、失眠(0.0300)。見表1。
表1 “調(diào)神”相關(guān)針法治療疾病的科屬及病種情況
2.3 “調(diào)神”相關(guān)針法主要腧穴及歸經(jīng)分析 “調(diào)神”相關(guān)針法TF-IDF值排名前10 位的腧穴從高到低依次為百會、內(nèi)關(guān)、神門、印堂、太沖、三陰交、風(fēng)府、足三里、合谷;所屬經(jīng)脈為督脈的穴位最多,包括百會、印堂、風(fēng)府。見表2。
表2 “調(diào)神針法”TF-IDF值排名前10位腧穴及所屬經(jīng)脈情況
3 討論
針灸療效的發(fā)揮和提高與針灸“調(diào)神”密切相關(guān),張介賓于《類經(jīng)》中強(qiáng)調(diào)針以治神為首務(wù),曰“醫(yī)必以神,乃見無形;病必以神,血氣乃行”?,F(xiàn)有文獻(xiàn)中,以“調(diào)神”命名、與“調(diào)神”相關(guān)的針灸法報道多達(dá)183 篇,研究角度各有側(cè)重,從眾多文獻(xiàn)中提煉“調(diào)神”相關(guān)針法主治的病機(jī)、適用的科屬病種、主要的選穴歸經(jīng),對系統(tǒng)闡明“調(diào)神”類針法的內(nèi)涵意義重大。
本研究表明:①“調(diào)神”相關(guān)針法所主的病機(jī)與心、腦、脾、肝失調(diào)密切相關(guān)。神明之體藏于腦,神明之用發(fā)于心[11],心、腦二者共主神明,神又有賴于脾胃之精的滋養(yǎng)與肝對氣機(jī)的調(diào)達(dá)?,F(xiàn)代研究認(rèn)為,腦神稟受于先天,涵蓋各種“遺傳信息”如天賦等,其活動不以人的意志為轉(zhuǎn)移,主要表現(xiàn)在管理感覺、記憶、運(yùn)動,維持其相關(guān)的自穩(wěn)調(diào)節(jié)機(jī)制等方面;腦神的功能在心神的統(tǒng)領(lǐng)下,具體操控,搜集信息,從而發(fā)揮其主宰生命活動、主感覺和肢體運(yùn)動的功能[12];同時,針灸對腦與肝脾關(guān)系的干預(yù)可能與腦腸軸理論有關(guān),參與信息傳遞由胃腸道至腦涉及免疫、神經(jīng)、內(nèi)分泌、腸道菌群4 條通路[13]。因此,心、腦、肝、脾任一臟腑有恙皆會令神不得安,誘發(fā)相應(yīng)疾病,包括以髓海不足、神志失養(yǎng)為主要病機(jī)的癡呆、失眠、抑郁、卒中、癔病(癱瘓、失語等),由肝、脾氣血失和所致的腹瀉呃逆,以及因心神失養(yǎng)而出現(xiàn)的“諸痛癢瘡”。②在經(jīng)絡(luò)與腧穴的選擇上,選取與腦關(guān)系密切“上額交巔上,入絡(luò)腦”的督脈,其常用調(diào)神穴位(百會、印堂、風(fēng)府)與心經(jīng)之神門、心包絡(luò)之內(nèi)關(guān)、膽經(jīng)之風(fēng)池、胃經(jīng)之足三里將心、腦、肝、脾等臟腑聯(lián)系起來,既能通達(dá)心腦溫養(yǎng)神氣,又可調(diào)和臟腑,使氣血得脾之化生與肝之疏利,通過調(diào)理經(jīng)絡(luò)、氣血、臟腑,實現(xiàn)針灸之調(diào)神。
文本挖掘技術(shù)是數(shù)據(jù)挖掘技術(shù)的一個分支,相較于人工檢索海量信息數(shù)據(jù)庫,文本挖掘技術(shù)可以更智能、直觀地從信息庫中快速檢索出符合需求的信息,無需用戶逐條目篩查,且研究結(jié)果通常以結(jié)構(gòu)化數(shù)據(jù)呈現(xiàn),便于后期分析,可極大提高臨床科研效率[14]。對于文本挖掘而言,特征計算是最重要和基礎(chǔ)的環(huán)節(jié),目前,數(shù)據(jù)挖掘技術(shù)在針灸領(lǐng)域主要被用于研究針對某一具體疾病的腧穴配伍規(guī)律、名老中醫(yī)經(jīng)驗挖掘、古籍整理等,數(shù)據(jù)偏于結(jié)構(gòu)化,特征不超過幾百。相較之下,“調(diào)神”相關(guān)針法概念相對模糊,尚無確切定義,其相關(guān)文獻(xiàn)的文本數(shù)據(jù)多為非結(jié)構(gòu)或半結(jié)構(gòu)的,轉(zhuǎn)換為特征矢量后特征數(shù)巨大,將達(dá)到幾萬甚至幾十萬。引入TF-IDF這一經(jīng)典的面向向量空間模型的特征權(quán)重計算方法,能有效的表示文本關(guān)鍵詞特征,快速處理海量文獻(xiàn)[15]。本研究在Python3.6環(huán)境下基于分詞算法和TF-IDF特征算法,對關(guān)鍵詞在“調(diào)神”相關(guān)針法主題中的重要程度進(jìn)行表征,并以此進(jìn)行相關(guān)性分析和可視化表達(dá),是對“調(diào)神”相關(guān)針法相對細(xì)致、完整、客觀的總結(jié),對針灸臨床研究具有一定的借鑒意義。
4 小結(jié)本研究引入基于機(jī)器學(xué)習(xí)的文本挖掘技術(shù),通過TF-IDF算法自動尋找文獻(xiàn)的特征詞匯,得出“調(diào)神”類針法主治病機(jī)、適用病種、主要選穴歸經(jīng),三者之間相互聯(lián)系,結(jié)果具有自洽性。