董雪燕 祁爍 姜苗 韓丹陽 董石 崔玉
·綜述·
數(shù)據(jù)挖掘在中醫(yī)藥研究中的應(yīng)用分析
董雪燕 祁爍 姜苗 韓丹陽 董石 崔玉
數(shù)據(jù)挖掘是從大量的、不完整的、復(fù)雜繁瑣的數(shù)據(jù)中發(fā)現(xiàn)隱藏的、有價值的知識的過程。利用數(shù)據(jù)挖掘技術(shù)從中醫(yī)累積的數(shù)據(jù)中探索和發(fā)現(xiàn)其中蘊含的規(guī)律,有利于中醫(yī)學(xué)的繼承、探索與發(fā)展。本文通過檢索、總結(jié)中醫(yī)學(xué)研究中數(shù)據(jù)挖掘技術(shù)相關(guān)文獻(xiàn),發(fā)現(xiàn)此類技術(shù)主要應(yīng)用于中藥方劑配伍規(guī)律、癥狀分析、辨證規(guī)律分析三方面;數(shù)據(jù)挖掘技術(shù)主要包括頻數(shù)統(tǒng)計、聚類分析、因子分析、對應(yīng)分析、關(guān)聯(lián)規(guī)則、分類模型、貝葉斯網(wǎng)絡(luò)、異常點分析等。
中醫(yī); 數(shù)據(jù)挖掘; 配伍規(guī)律
數(shù)據(jù)挖掘[1](Knowledge Discovery in Data-base,KDD)是指從大量的、不完整的、有噪音的數(shù)據(jù)中發(fā)現(xiàn)隱藏的、有價值的知識的過程,是當(dāng)今大數(shù)據(jù)時代最前沿的數(shù)據(jù)處理技術(shù)之一。其主要表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等。目前,數(shù)據(jù)挖掘方法逐漸應(yīng)用于臨床醫(yī)學(xué)研究領(lǐng)域。
中醫(yī)學(xué)具有系統(tǒng)性、整體性、復(fù)雜性、不確定性等特點。中醫(yī)臨床積累的信息頗多,數(shù)據(jù)類型及相互關(guān)系錯綜復(fù)雜,數(shù)據(jù)中隱藏大量有價值的信息。但由于此類數(shù)據(jù)的龐大和復(fù)雜,對有效信息及其相關(guān)性的分析與探索單純依靠人力很難完成。而從大量數(shù)據(jù)中探索和發(fā)現(xiàn)其中蘊含的潛在規(guī)律與價值,正是數(shù)據(jù)挖掘技術(shù)的優(yōu)勢所在。本文通過檢索、總結(jié)中醫(yī)學(xué)研究中數(shù)據(jù)挖掘技術(shù)相關(guān)文獻(xiàn),發(fā)現(xiàn)此類技術(shù)主要應(yīng)用于中藥方劑配伍規(guī)律、癥狀分析、辨證規(guī)律分析三方面;數(shù)據(jù)挖掘技術(shù)主要包括頻數(shù)統(tǒng)計、聚類分析、因子分析、對應(yīng)分析、關(guān)聯(lián)規(guī)則、分類模型、貝葉斯網(wǎng)絡(luò)、異常點分析等,現(xiàn)簡述于下。
在中藥方劑配伍規(guī)律的研究領(lǐng)域,數(shù)據(jù)挖掘主要體現(xiàn)為應(yīng)用頻率統(tǒng)計法總結(jié)復(fù)方中的主要藥物及其功效、藥性,從而歸納復(fù)方的治則;運用聚類分析、因子分析法對復(fù)方及藥物進(jìn)行分類、歸納;通過藥物的藥效,透析病機(jī)病理,探討證治規(guī)律;通過關(guān)聯(lián)規(guī)則挖掘復(fù)方中的藥對和藥組,進(jìn)而發(fā)現(xiàn)藥物的配伍規(guī)律,總結(jié)治則、治法。
劉創(chuàng)[2]基于萬方數(shù)據(jù)庫、中國學(xué)術(shù)期刊全文數(shù)據(jù)庫(2000-2014年)統(tǒng)計關(guān)于肺纖維化中醫(yī)證型的相關(guān)文獻(xiàn)中治療特發(fā)性肺纖維化(idiopathic pulmonary fibrosis,IPF)的中藥復(fù)方,利用數(shù)據(jù)挖掘中的聚類分析和關(guān)聯(lián)分析等方法,分別對復(fù)方和單藥做聚類分析,總結(jié)IPF的中醫(yī)證治規(guī)律、每類復(fù)方及單藥的功效,進(jìn)而歸納復(fù)方的治則;同時使用關(guān)聯(lián)規(guī)則挖掘復(fù)方中的藥對,提出將藥對用于優(yōu)化復(fù)方的思路。
數(shù)據(jù)挖掘技術(shù)也在中藥復(fù)方研究中大放異彩。張?zhí)灬缘萚3]基于中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫中肺纖維化的中藥復(fù)方數(shù)據(jù),對藥物做頻數(shù)統(tǒng)計,提取36種主要藥物;進(jìn)而對主要藥物進(jìn)行聚類分析,共分為補(bǔ)益藥、活血藥、化痰藥等6類;最后經(jīng)關(guān)聯(lián)規(guī)則分析發(fā)現(xiàn)藥對19條、藥組25條,主要為益氣藥與活血藥的配伍組合。通過對有趣的藥組關(guān)聯(lián)規(guī)則判讀發(fā)現(xiàn),大多數(shù)醫(yī)家喜用益氣藥黃芪配伍丹參、當(dāng)歸、川芎等活血通絡(luò)藥;而藥對關(guān)聯(lián)規(guī)則中,益氣藥黃芪與黨參配伍,益氣藥黃芪分別與丹參、當(dāng)歸、川芎等活血藥配伍,而活血藥丹參、當(dāng)歸、川芎兩兩配伍,說明益氣活血通絡(luò)法是眾多醫(yī)家治療肺纖維化的共識。陳擎文[4]采用頻數(shù)統(tǒng)計和關(guān)聯(lián)規(guī)則方法分析古代中醫(yī)古籍有關(guān)中風(fēng)的醫(yī)案,找出古籍背后隱藏的信息,從而分析出治療中風(fēng)的特有數(shù)據(jù)規(guī)則與規(guī)律;提出了一個萃取古代各家名醫(yī)治療各種病癥經(jīng)驗的方法與模式,并經(jīng)由中風(fēng)病癥的驗證,證明本模式的可行性。研究結(jié)果顯示:發(fā)掘出古代名醫(yī)治療中風(fēng)最常用的7種中藥,9個藥對,3個藥組。因此,本研究證明經(jīng)由古代中醫(yī)醫(yī)案的數(shù)據(jù)挖掘的確可以有效萃取古代名醫(yī)的治療經(jīng)驗,其探勘后的知識不但可行,而且具有顯著的臨床應(yīng)用價值。焦秋粉[5]基于張艷萍教授門診中特發(fā)性肺纖維化的113條病例數(shù)據(jù),使用頻數(shù)統(tǒng)計方法分析了復(fù)方的主要藥物,并使用均值法計算了不同藥物的劑量,結(jié)果顯示劑量會根據(jù)具體病情輕重緩急變化;使用Apriori算法對藥物做關(guān)聯(lián)規(guī)則分析,通過對藥對進(jìn)行分析發(fā)現(xiàn):在用藥規(guī)律方面,其多以破血、益氣、養(yǎng)陰、通絡(luò)、化痰、軟堅散結(jié)之品配伍;最后,通過對用藥做異常點分析發(fā)現(xiàn):異常點藥物多是針對合并癥的藥物。
數(shù)據(jù)挖掘技術(shù)的優(yōu)勢在古籍醫(yī)案的研究中更為顯著。古籍醫(yī)案歷史悠久,言語晦澀,后世醫(yī)家繼承時多加用自己的觀點,很難客觀、真實、全面地的反應(yīng)作者當(dāng)時的辨證思路。而數(shù)據(jù)挖掘技術(shù)則可以拋開局限的辨證思維,對整個古籍醫(yī)案進(jìn)行分析。馬君[6]收集清末以前中醫(yī)古籍文獻(xiàn)中治療肺痿的方藥資料,對方藥進(jìn)行頻數(shù)分析、因子分析、聚類分析,探討證治規(guī)律。通過頻數(shù)分析法對治療肺痿各類藥物的使用頻率進(jìn)行比較發(fā)現(xiàn):治療肺痿的主要藥類為補(bǔ)益、清熱、止咳等7類,并統(tǒng)計了主要藥類中的常用藥物。通過對方藥的因子分析得到7個方藥潛在因子,分別反映了肺痿的不同病機(jī)變化,結(jié)果提示燥熱傷肺、氣陰兩虛、痰熱蘊結(jié)為肺痿的主要病理機(jī)制。以藥物作為變量聚類,得到5類配伍關(guān)系密切的藥物組成的聚類方。結(jié)合藥物頻數(shù)統(tǒng)計和因子分析發(fā)現(xiàn):古代肺痿的治療原則以補(bǔ)益為主,益氣養(yǎng)陰、清熱化痰、止咳平喘為主要治法,這與現(xiàn)代肺纖維化治療有相同之處。蔣永光等[7]從《中醫(yī)大辭典·方劑分冊》中篩選出1355首脾胃方,選用聚類分析、對應(yīng)分析和頻繁集方法,分析了核心藥物、方劑結(jié)構(gòu)、藥對藥組。結(jié)合聚類分析和核心藥物分析結(jié)果發(fā)現(xiàn):以四君子湯為代表的補(bǔ)氣健脾方劑是脾胃方最基本的用方;復(fù)方主要結(jié)構(gòu)有補(bǔ)氣藥配伍理氣藥、補(bǔ)氣藥配伍溫里藥、補(bǔ)氣藥配伍理氣藥及化痰藥(或化濕藥)。使用關(guān)聯(lián)規(guī)則方法對藥對、藥組進(jìn)行分析,為配伍規(guī)律研究提供了線索,如白術(shù)與茯苓、人參與生姜的配伍等。
古今醫(yī)集醫(yī)案數(shù)量之多,所用處方、中藥數(shù)量之繁,僅僅依靠人力很難進(jìn)行全面總結(jié)。再者,單純的人力并不能發(fā)現(xiàn)多種藥物之間潛在的規(guī)律,而數(shù)據(jù)挖掘恰好彌補(bǔ)了這一不足。中醫(yī)歷來有“醫(yī)者意也”的說法。中醫(yī)藥知識體系中大量的隱性知識,無法通過文字或語言進(jìn)行表達(dá),這就是很多療效顯著的名醫(yī)卻很難把醫(yī)術(shù)傳承下來的原因。在中醫(yī)藥領(lǐng)域引入數(shù)據(jù)挖掘技術(shù)就是為了從大量中醫(yī)病案中提取隱性知識,為理論研究和臨床實施提供科學(xué)依據(jù)[8]。
在癥狀分析方面,通過對癥狀、舌象、脈象的頻率統(tǒng)計,發(fā)現(xiàn)相應(yīng)疾病的主要癥狀和伴隨癥狀;對癥狀、舌象、脈象建立貝葉斯網(wǎng)絡(luò),構(gòu)建癥狀、舌象、脈象間的因果關(guān)系網(wǎng)絡(luò),總結(jié)概括病機(jī)病位等證候要素。
焦秋粉[5]基于張艷萍教授門診中特發(fā)性肺纖維化的113條病例數(shù)據(jù),對病例中的臨床癥狀做頻率統(tǒng)計分析發(fā)現(xiàn),發(fā)病人群常見癥狀以活動后喘息、氣短,咳嗽、咳痰,胸悶、疲倦乏力、進(jìn)行性呼吸困難為主,伴或不伴有口唇紫紺、杵狀指及聽診聞及爆裂音等;對舌象、脈象做類似的頻率統(tǒng)計分析,舌黯紅、舌下脈絡(luò)瘀滯、脈澀為主要舌象和脈象,表明血瘀證在IPF患者中所占比例較大。曲淼等[9]基于611例抑郁癥患者的資料,對86項癥狀建立貝葉斯網(wǎng)絡(luò),發(fā)現(xiàn)其中的39個癥狀、舌象、脈象之間有較強(qiáng)的關(guān)聯(lián)性,再由專家組概括出病機(jī)、病位等證候要素。病機(jī)要素包括:精虧、氣虛、血虛、陰虛、陽虛、氣郁(滯)、血瘀、痰濕、火熱;病位要素包括:心、腎、肝、脾。龐博[10]使用基于貝葉斯的分類分析、基于支持向量的SMO分類分析、關(guān)聯(lián)規(guī)則分析、聚類分析法分別對施今墨、祝諶予、呂仁和、趙進(jìn)喜4位醫(yī)家處方中藥量、藥性、藥味、歸經(jīng)、方劑功效、癥狀、證素、證候進(jìn)行分析,得到許多相互關(guān)聯(lián)的癥狀,如口渴多飲與疲乏、淡白舌與紫舌、弦脈與細(xì)脈,分別提示了陰虛與氣虛、氣虛與血瘀、氣滯與血虛之間的關(guān)系,即常說的氣陰兩虛證候、氣虛血瘀證候和肝郁脾虛證候,進(jìn)一步總結(jié)了四位醫(yī)家的臨床經(jīng)驗。陳為[11]采用數(shù)據(jù)挖掘的方法,以慢性腎炎的文獻(xiàn)資料和臨床患者為研究對象,歸納常見臨床表現(xiàn),探討慢性腎炎腎陽虛證的癥狀規(guī)律和特點,提煉慢性腎炎腎陽虛證的主癥、次癥和一般癥狀,探索建立慢性腎炎腎陽虛證的診斷標(biāo)準(zhǔn)。結(jié)果得出歷代醫(yī)論中慢性腎炎腎陽虛證的常見癥狀有16個;進(jìn)行相關(guān)性分析發(fā)現(xiàn)水腫和腰膝酸痛之間存在正相關(guān)性,畏寒肢冷和腰膝酸痛之間存在正相關(guān)性,氣喘和咳嗽、咯痰之間存在正相關(guān)性,小便不利和氣喘之間存在正相關(guān)性。李園白[12]采用數(shù)據(jù)挖掘的方法對中醫(yī)婦科常見病(崩漏、閉經(jīng)、不孕、痛經(jīng))進(jìn)行研究,把中藥藥物與患者出現(xiàn)的共同癥狀中次數(shù)比較多的組合篩選出來,得出癥狀-中藥之間的配伍關(guān)系。此項數(shù)據(jù)挖掘中共包含“癥狀-藥物”100組,例如“經(jīng)血量少-當(dāng)歸”。這部分結(jié)果非常容易被接受而使用,且與中藥的功效主治理論相吻合。
中醫(yī)臨床癥狀看似繁瑣而散亂,但是舌脈、癥狀之間卻有內(nèi)在規(guī)律。中醫(yī)臨床是在整體觀念指導(dǎo)下的辨證論治,不能管中窺豹,否則,很有可能陷入“頭痛醫(yī)頭,腳痛醫(yī)腳”的境地。但是大量的醫(yī)案、醫(yī)集單純?nèi)肆茈y完整分析出醫(yī)者的用藥規(guī)律,不能囊括所有的臨床癥狀,而數(shù)據(jù)挖掘技術(shù)則可以更全面地、系統(tǒng)地分析各種看似毫無關(guān)聯(lián)的癥狀之間、癥狀與藥物之間的潛在規(guī)律。
在辨證規(guī)律方面,數(shù)據(jù)挖掘方面的研究主要集中在:通過頻率統(tǒng)計、關(guān)聯(lián)規(guī)則探討證候、證素、證型及其組合間的分布特點和規(guī)律;建立證候要素間的貝葉斯網(wǎng)絡(luò),獲得各證候要素間的關(guān)系,結(jié)合中醫(yī)理論提取證型;運用關(guān)聯(lián)規(guī)則,對應(yīng)分析癥狀與處方、辨證與處方、癥狀與辨證之間的關(guān)系;通過決策樹等分類算法建立由癥狀到證型的分類模型。在目前中醫(yī)證候標(biāo)準(zhǔn)化并未取得令人信服結(jié)果的背景下,數(shù)種挖掘方法的綜合運用,更好地反映了中醫(yī)證候、癥狀及證型間的關(guān)系[13]。
滑振等[14]通過萬方數(shù)據(jù)庫、CNKI檢索2000-2014年肺纖維化現(xiàn)代文獻(xiàn),運用數(shù)據(jù)挖掘方法探討肺纖維化證素、證型及其組合間的分布特點和規(guī)律。通過主要病位的頻率統(tǒng)計,發(fā)現(xiàn)肺纖維化病位主要在肺、腎,涉及脾、肝。統(tǒng)計單證素、雙證素、三證素、四證素的頻率,對證素做深入分析后得出:在具體臨證時當(dāng)側(cè)重“補(bǔ)肺腎之氣”和“補(bǔ)肺腎之陰”,兼以“活血化瘀祛痰”。在證素分析的基礎(chǔ)上,使用關(guān)聯(lián)規(guī)則挖掘證素組合,進(jìn)一步說明肺纖維化病機(jī)“虛”和“瘀”的特性,也反映出中醫(yī)“久病多虛多瘀”的理論特征。最終綜合分析得出:肺纖維化的證素以氣虛、血瘀、陰虛最為常見,其證型以多證素相互組合為主。肖光磊[15]將關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘方法應(yīng)用于中醫(yī)臨床診斷發(fā)現(xiàn):不僅可以從臨床診斷數(shù)據(jù)中辨析癥狀與處方之間、辨證與處方之間、癥狀與辨證之間的關(guān)聯(lián)關(guān)系,總結(jié)歸納名老中醫(yī)的辨證規(guī)律并模擬其診斷、推理過程,還可以發(fā)現(xiàn)客觀有用的新知識,以進(jìn)一步促進(jìn)專家經(jīng)驗的傳承及其理論的完善。研究者收集了某位名老中醫(yī)慢性胃炎診治醫(yī)案數(shù)據(jù)庫,采用FP-Growth算法進(jìn)行了挖掘,分別挖掘了癥狀與處方之間、辨證與處方之間、癥狀與辨證之間的關(guān)聯(lián)規(guī)則,獲取了該名老中醫(yī)在中醫(yī)診療中的經(jīng)驗。吳榮等[16]從證候要素應(yīng)證組合規(guī)律兩方面入手,建立冠心病心絞痛名老中醫(yī)診療數(shù)據(jù)庫,通過頻率統(tǒng)計的方法進(jìn)行研究探索常見證候要素應(yīng)證組合特征,進(jìn)一步將其分為實證、虛證和虛實夾雜證;運用貝葉斯網(wǎng)絡(luò)構(gòu)建證候要素與癥狀間的因果關(guān)系網(wǎng)絡(luò),發(fā)現(xiàn)與證候相關(guān)聯(lián)的癥狀,并以條件概率0.5為界,判定證候要素的主要癥狀和次要癥狀。江麗杰等[17]以379例缺血性中風(fēng)病臨床數(shù)據(jù)為基礎(chǔ),在5個不同時點(0天、3天、14天、28天、3個月)采集《中風(fēng)病辨證診斷標(biāo)準(zhǔn)》中“風(fēng)、火、痰、瘀、氣虛、陰虛陽亢”6個證候要素的評分和《美國國立衛(wèi)生院卒中量表》(NIHSS)評分,運用貝葉斯網(wǎng)絡(luò)分析其相關(guān)性。結(jié)果表明:NIHSS評分與中醫(yī)證候要素評分之間存在相關(guān)性,其相關(guān)程度隨時間呈動態(tài)變化。
4.1 數(shù)據(jù)挖掘在中醫(yī)藥研究中的現(xiàn)狀
一般而言,數(shù)據(jù)挖掘主要應(yīng)用在上述三個方面。其他如中藥復(fù)方開發(fā)、中藥產(chǎn)業(yè)化、國際化進(jìn)程也都需要數(shù)據(jù)挖掘技術(shù)。目前常用的數(shù)據(jù)挖掘方法主要包括:多元線性回歸分析、Logistic回歸分析、判別分析、聚類分析、因子分析、關(guān)聯(lián)規(guī)則、粗糙集理論、決策樹、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)、信息熵等[18]。數(shù)據(jù)挖掘從應(yīng)用角度可分為描述、預(yù)測、評估;從所用算法角度可分為預(yù)測類、非預(yù)測類、數(shù)據(jù)降維。常用的線性回歸、非線性回歸、決策樹、貝葉斯網(wǎng)絡(luò)、Logistic回歸屬于預(yù)測類模型;聚類分析、關(guān)聯(lián)分析則屬于非預(yù)測類模型;因子分析、主成分分析屬于數(shù)據(jù)降維。在具體的方法選擇上,中藥方劑配伍規(guī)律的研究常用聚類分析、因子分析、相關(guān)性研究等;對中醫(yī)的癥狀分析以及辨證規(guī)律分析上常選用貝葉斯網(wǎng)絡(luò)、異常點分析、決策樹、Logistic回歸等。面對龐大而復(fù)雜的中醫(yī)藥數(shù)據(jù),單一的數(shù)據(jù)挖掘方法難以揭示中醫(yī)藥的全貌,聯(lián)合應(yīng)用多種方法可以起到取長補(bǔ)短的效果,能夠更深刻地反映中醫(yī)證候的本質(zhì)。
目前,無論在臨床治療方面還是科學(xué)研究方面,數(shù)據(jù)挖掘工作仍處于初級階段,雖然有很多挖掘結(jié)果與臨床吻合性較高,但仍有部分結(jié)論與臨床實踐有明顯的出入,需要數(shù)據(jù)挖掘和中醫(yī)學(xué)相關(guān)領(lǐng)域的專家深入研究與探索,不斷改進(jìn)數(shù)據(jù)挖掘的技術(shù)[19]。
4.2 大數(shù)據(jù)助力中醫(yī)臨床研究
繼承名老中醫(yī)學(xué)術(shù)思想是中醫(yī)藥發(fā)展的迫切需要,要在采用合理的科研方法上多下功夫。而數(shù)據(jù)挖掘在中醫(yī)藥信息化領(lǐng)域的重要地位日益突顯,在名老中醫(yī)經(jīng)驗傳承方面尤為突出[20]。但是直至目前,對名老中醫(yī)經(jīng)驗的數(shù)據(jù)挖掘仍存在許多問題:第一、信息采集的結(jié)構(gòu)化、規(guī)范化問題。第二、門診病歷系統(tǒng)不利于病例保存,且各家醫(yī)院門診系統(tǒng)不統(tǒng)一,使科研仍局限在少數(shù)三級甲等大型醫(yī)院,不能人人參與到其中。第三、數(shù)據(jù)挖掘技術(shù)的發(fā)展水平與中醫(yī)藥相結(jié)合的深度還未能改變中醫(yī)藥數(shù)據(jù)難處理的大格局。第四、人才問題。數(shù)據(jù)挖掘?qū)I(yè)與中醫(yī)藥專業(yè)交流少,行業(yè)信息不能互通。隨著計算機(jī)技術(shù)的快速發(fā)展和廣泛應(yīng)用,現(xiàn)代中醫(yī)學(xué)研究者正在探索新的名老中醫(yī)經(jīng)驗繼承模式,通過數(shù)據(jù)挖掘得出的名家經(jīng)驗必定會得到越來越多專家認(rèn)可。在國家的大力支持下,信息化助力中醫(yī)藥事業(yè)發(fā)展,為中醫(yī)電子病歷的發(fā)展提供廣闊空間,也有利于利用中醫(yī)電子病歷實現(xiàn)名老中醫(yī)臨床診療經(jīng)驗數(shù)據(jù)采集、挖掘[21]。眾所周之,名老中醫(yī)治療經(jīng)驗主要以隱性知識的形式存在,而對于挖掘出的隱形知識如何判讀是一個更重要的問題,這也是進(jìn)行數(shù)據(jù)挖掘的目的,單純的計算機(jī)算法得出的信息不能稱之為中醫(yī)理論,只有在把握中醫(yī)特有理論和思維規(guī)律的前提下,保證研究方向合理的同時借鑒數(shù)據(jù)挖掘所得到的結(jié)果,最終提煉出大量中醫(yī)處方背后蘊藏的新理論、新方法、新知識。
只有把每一位患者的有效信息都記錄在大數(shù)據(jù)倉庫中,人人貢獻(xiàn)數(shù)據(jù),未來就可以憑借海量的病人信息,借鑒各派名家經(jīng)驗,模擬處方,探索人工智能,人人分享成果。這項艱巨的任務(wù),需要幾代人不懈的努力。設(shè)想如果全國所有的中醫(yī)學(xué)者共享大數(shù)據(jù),不論是從業(yè)幾十年的老專家,還是剛剛畢業(yè)的青年醫(yī)生,人人都可以挖掘出自己渴望的中醫(yī)精華。
數(shù)據(jù)挖掘作為一個在海量數(shù)據(jù)中獲取知識的有力工具,必將對帶動中醫(yī)藥學(xué)術(shù)水平的提高、拓展中醫(yī)藥的生存空間產(chǎn)生巨大的啟迪和促進(jìn)作用[22]。大數(shù)據(jù)時代無疑是中醫(yī)藥發(fā)展的機(jī)遇,中醫(yī)藥研究者當(dāng)抓住機(jī)遇,順勢而生,卓然而立,應(yīng)世而壯[23]。
[1] Helma C. Data mining and knowledge discovery in predictive toxicology[J].SAR QSAR Environ Res, 2004,15(5-6):367-83.
[2] 劉創(chuàng).基于數(shù)據(jù)挖掘和導(dǎo)師經(jīng)驗的特發(fā)性肺纖維化中醫(yī)證治研究[D].沈陽:遼寧中醫(yī)藥大學(xué),2014.
[3] 張?zhí)灬?,張素,李秀娟,?治療肺纖維化中藥復(fù)方用藥規(guī)律的數(shù)據(jù)挖掘[J].中國中醫(yī)藥信息雜志,2011,18(2):31-34.
[4] 陳擎文.數(shù)據(jù)挖掘技術(shù)在古代名中醫(yī)中風(fēng)醫(yī)案之應(yīng)用研究[J].中華中醫(yī)藥學(xué)刊,2008,(10):2254-2257.
[5] 焦秋粉.張燕萍教授診治特發(fā)性肺纖維化經(jīng)驗的數(shù)據(jù)挖掘[D].北京:中國中醫(yī)科學(xué)院,2014.
[6] 馬君.基于文獻(xiàn)整理的肺痿方藥證治規(guī)律探析[J].山東中醫(yī)藥大學(xué)學(xué)報,2012,(6):474-476.
[7] 蔣永光,李力,李認(rèn)書,等.中醫(yī)脾胃方配伍規(guī)律的數(shù)據(jù)挖掘試驗[J].世界科學(xué)技術(shù),2003,(3):33-37,78.
[8] 王琦,金玉琴,周金海,等.基于WPF的中醫(yī)電子病歷系統(tǒng)設(shè)計與實現(xiàn)[J].醫(yī)學(xué)信息學(xué)雜志,2015,36(12):26-30.
[9] 曲淼,唐啟盛,包祖曉,等.貝葉斯網(wǎng)絡(luò)模型在中醫(yī)證候研究中的應(yīng)用[J]. 中華中醫(yī)藥學(xué)刊,2008,26(7):1497-1498.
[10] 龐博.施今墨學(xué)派名老中醫(yī)診治糖尿病學(xué)術(shù)思想與經(jīng)驗傳承研究[D].北京:北京中醫(yī)藥大學(xué),2012.
[11] 陳為.基于數(shù)據(jù)挖掘的慢性腎炎腎陽虛證候診斷標(biāo)準(zhǔn)研究[D].成都:成都中醫(yī)藥大學(xué),2011.
[12] 李園白.中醫(yī)婦科常見病醫(yī)案數(shù)據(jù)挖掘方法研究[D].中國中醫(yī)科學(xué)院,2006.
[13] 賈運濱,魏江磊.數(shù)據(jù)挖掘技術(shù)在中醫(yī)證候研究中的應(yīng)用述評[J]. 中國中醫(yī)急癥,2010,19(7):1184-1186.
[14] 滑振,呂曉東,龐立健,等.基于現(xiàn)代文獻(xiàn)的肺纖維化中醫(yī)證候及證素特征數(shù)據(jù)挖掘[J].世界中西醫(yī)結(jié)合雜志,2015,(9):1188-1191.
[15] 肖光磊.名老中醫(yī)經(jīng)驗傳承中的數(shù)據(jù)挖掘技術(shù)研究[D].南京:南京理工大學(xué),2008.
[16] 吳榮,聶曉燕,王階,等.基于貝葉斯網(wǎng)絡(luò)的名老中醫(yī)治療冠心病辨證規(guī)律研究[J].中國中醫(yī)藥信息雜志,2010,17(5):98-99.
[17] 江麗杰,胡鏡清,易丹輝,等.缺血性中風(fēng)病中醫(yī)證候要素動態(tài)變化與NIHSS評分變化相關(guān)性的貝葉斯網(wǎng)絡(luò)分析[J].世界中醫(yī)藥,2013,8(6):613-617.
[18] 黃粵,高穎,馬斌.中醫(yī)證候研究常用數(shù)據(jù)挖掘方法述評[J].中醫(yī)藥學(xué)報,2010,38(3):6-10.
[19] 王倩,生慧,金衛(wèi).中醫(yī)藥領(lǐng)域數(shù)據(jù)挖掘技術(shù)的研究與應(yīng)用概況[J]. 湖南中醫(yī)雜志,2015,31(3):186-188.
[20] 沈春鋒,王彩華,陸煒青.名老中醫(yī)學(xué)術(shù)思想的傳承[J]. 實用中醫(yī)內(nèi)科雜志,2015,(12):184-185.
[21] 劉鴻燕,胡紅濮,張越.基于電子病歷結(jié)構(gòu)化的名老中醫(yī)經(jīng)驗數(shù)據(jù)挖掘研究[J]. 醫(yī)學(xué)信息學(xué)雜志,2015,36(12):13-18.
[22] 姚美村,袁月梅,艾路,等.數(shù)據(jù)挖掘及其在中醫(yī)藥現(xiàn)代化研究中的應(yīng)用[J].北京中醫(yī)藥大學(xué)學(xué)報,2002,25(5):20-23.
[23] 孟慶云.順勢而生 卓然而立 應(yīng)世而生——當(dāng)代中醫(yī)藥發(fā)展的大數(shù)據(jù)、網(wǎng)絡(luò)化機(jī)遇[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2016,(1):1.
(本文編輯: 董歷華)
Application of data mining in the research of traditional Chinese medicine
DONGXueyan,QIShuo,JIANGMiao,etal.
Dongzhimenhospital,BeijingUniversityofChineseMcdicine,Beijing100700,China
Correspondingauthor:QIShuo,E-mail:qishuo1202@163.com
Data mining is a process of discovering hidden and valuable knowledge from a large number of incomplete and complicated data. Using data mining techniques to explore and discover the law in the cumulative data of TCM, which is conducive to the inheritance, exploration and development of traditional Chinese medicine. The article summarizes the literature of using data mining techniques for traditional Chinese medicine research, or found the technology is mainly used in the law of compatibility of Chinese medical research, symptoms, syndrome differentiation regularity analysis; Data mining technology mainly include the frequency statistics, cluster analysis, factor analysis and correspondence analysis, association rules, classification model, Bayesian networks, abnormal point analysis, etc.
Traditional Chinese medicine; Data mining; Law of concerted application compatibility regularity
2016年北京中醫(yī)藥大學(xué)優(yōu)秀青年骨干教師專項計劃(2016-JYB-QNJSZX019)
100700 北京中醫(yī)藥大學(xué)東直門醫(yī)院血液腫瘤科[董雪燕(碩士研究生)、祁爍、姜苗、韓丹陽(碩士研究生)、董石(碩士研究生)、崔玉(碩士研究生)]
董雪燕(1990- ),女,2014級在讀碩士研究生。研究方向:中西醫(yī)結(jié)合治療血液腫瘤病。E-mail:675140504@qq.com
祁爍(1985- ),碩士,主治醫(yī)師。研究方向:中西醫(yī)結(jié)合治療血液腫瘤病。E-mail:qishuo1202@163.com
R2-03
A
10.3969/j.issn.1674-1749.2017.03.034
2016-01-06)