李遠(yuǎn),劉盼英,李海濱,李濤
(河北大學(xué)中醫(yī)學(xué)院,河北 保定 071002)
運(yùn)用數(shù)據(jù)處理技術(shù)探討原發(fā)性血小板增多癥的中醫(yī)辨證和用藥規(guī)律
李遠(yuǎn),劉盼英,李海濱,李濤
(河北大學(xué)中醫(yī)學(xué)院,河北 保定 071002)
目的 探討原發(fā)性血小板增多癥的中醫(yī)辨證和用藥立方規(guī)律。方法 收集中醫(yī)治療原發(fā)性血小板增多癥的醫(yī)案,運(yùn)用數(shù)據(jù)挖掘軟件,采用頻數(shù)統(tǒng)計(jì)、關(guān)聯(lián)規(guī)則分析、熵聚類等數(shù)據(jù)挖掘技術(shù),分析中醫(yī)治療原發(fā)性血小板增多癥的辨證和用藥規(guī)律。結(jié)果 通過對(duì)57個(gè)相關(guān)醫(yī)案進(jìn)行分析,統(tǒng)計(jì)發(fā)現(xiàn)了醫(yī)案中的基本證候、主要治法、常用藥物出現(xiàn)頻次,挖掘出主要藥物之間的關(guān)聯(lián)規(guī)則,發(fā)現(xiàn)了治療本病的35個(gè)核心組合和6個(gè)新處方等新數(shù)據(jù)。結(jié)論 中醫(yī)治療原發(fā)性血小板增多癥經(jīng)驗(yàn)豐富并有規(guī)律可循,證型主要分為瘀血型、血熱型、肝火型,常用清熱、涼血、活血等類中藥,具有較強(qiáng)的規(guī)律性。
原發(fā)性血小板增多癥;關(guān)聯(lián)規(guī)則;聚類算法;中醫(yī)辨證用藥規(guī)律
原發(fā)性血小板增多癥系骨髓增生性疾患,其特征為出血傾向及血栓形成,骨髓中巨核細(xì)胞過度增生,血液中血小板數(shù)量異常增多[1]。中醫(yī)對(duì)本病的研究尚處于探索階段,主要以個(gè)案的形式報(bào)道,通過對(duì)治療原發(fā)性血小板增多癥醫(yī)案的研究來認(rèn)識(shí)本病的辨證用藥立方規(guī)律有重要意義。本研究通過收集、整理中醫(yī)治療原發(fā)性血小板增多癥醫(yī)案,運(yùn)用統(tǒng)計(jì)方法,分析醫(yī)案中常見證型、主要治法以及常用藥物的頻次,在此基礎(chǔ)上,采用關(guān)聯(lián)規(guī)則和熵聚類方法等現(xiàn)代數(shù)據(jù)處理技術(shù),挖掘藥物之間的關(guān)聯(lián)規(guī)則和治療本病的潛在處方規(guī)律,為闡明中醫(yī)對(duì)原發(fā)性血小板增多癥辨證與用藥規(guī)律提供參考。
1.1 醫(yī)案來源
本研究以“血小板增多癥”、“醫(yī)案”、“病案”為檢索詞,以“全文”為檢索條件,從中國知網(wǎng)逐一檢索、下載1949年至2014年間所有中醫(yī)文獻(xiàn),建立本病中醫(yī)文獻(xiàn)數(shù)據(jù)庫。
1.2 納入標(biāo)準(zhǔn)
(1)病例為中醫(yī)診療;(2)原發(fā)性血小板增多癥診斷明確;(3)醫(yī)案理法方藥記錄完整,療效判斷有效。符合以上3條者,即可納入本研究。
1.3 排除標(biāo)準(zhǔn)
不符合納入標(biāo)準(zhǔn)之一者,即不納入本研究。
通過逐篇閱讀,從建立的中醫(yī)文獻(xiàn)數(shù)據(jù)庫中選取符合納入標(biāo)準(zhǔn)的醫(yī)案57份。
1.4 統(tǒng)計(jì)與數(shù)據(jù)挖掘軟件
“中醫(yī)傳承輔助系統(tǒng)(V2.5)”軟件,由中國中醫(yī)科學(xué)院中藥研究所提供。
1.5 中醫(yī)名詞的規(guī)范化處理
依據(jù)《中醫(yī)證候鑒別診斷學(xué)》[2]、《中藥學(xué)》[3]等相關(guān)參考書,對(duì)本研究收集的57份醫(yī)案中相關(guān)術(shù)語進(jìn)行規(guī)范化處理。
1.6 醫(yī)案的錄入和核對(duì)
將上述篩選后的醫(yī)案中與“診斷”、“證候”、“ 治法”、“用藥”相關(guān)信息逐個(gè)輸入軟件,信息輸入完成后,由兩人分別審核數(shù)據(jù),以保證數(shù)據(jù)的準(zhǔn)確性。數(shù)據(jù)錄完進(jìn)行數(shù)據(jù)整理,確認(rèn)無誤后,鎖定備用。
1.7 數(shù)據(jù)分析
包括數(shù)據(jù)統(tǒng)計(jì)和數(shù)據(jù)挖掘兩部分。
1.7.1 提取數(shù)據(jù)源
在“西醫(yī)疾病”項(xiàng)中輸入“原發(fā)性血小板增多癥”,提取出原發(fā)性血小板增多癥的醫(yī)案。
1.7.2 證型、治法與用藥統(tǒng)計(jì)分析
通過軟件中“統(tǒng)計(jì)報(bào)表系統(tǒng)”進(jìn)行辨證、治法、用藥頻次的統(tǒng)計(jì)分析,并將“頻次統(tǒng)計(jì)”結(jié)果導(dǎo)出。
1.7.3 組方規(guī)律分析
根據(jù)預(yù)判結(jié)果,在關(guān)聯(lián)規(guī)則分析中,支持度設(shè)為12,置信度設(shè)為 0.8,通過“數(shù)據(jù)分析”模塊中的“醫(yī)案分析” 挖掘主要藥物之間的關(guān)聯(lián)規(guī)則。
1.7.4 藥物核心組合與新方發(fā)現(xiàn)
通過“數(shù)據(jù)分析”模塊中的“方劑分析”模塊挖掘核心組合和發(fā)現(xiàn)新方。在分析前,根據(jù)預(yù)判結(jié)果,把“相關(guān)度”設(shè)為8,“懲罰度”設(shè)為2,然后點(diǎn)擊“提取組合”按鈕,即可發(fā)現(xiàn)治療本病的藥物之間的關(guān)聯(lián)度、核心組合和新組方。
2.1 中醫(yī)辨證原發(fā)性血小板增多癥證型頻次
根據(jù)57份醫(yī)案辨證的統(tǒng)計(jì)分析結(jié)果,共有32種證型,證候頻次前5位分別是瘀血證、肝郁化火證、氣滯血瘀證、血熱妄行證、瘀毒互結(jié)證。從表1可見,中醫(yī)對(duì)原發(fā)性血小板增多癥的多種證型相互重疊,以瘀血證、血熱證、肝火(熱)證等為多見。
表1 原發(fā)性血小板增多癥醫(yī)案中證候頻次2次以上的分布情況
2.2 中醫(yī)治療原發(fā)性血小板增多癥治法頻次
根據(jù)統(tǒng)計(jì)分析結(jié)果,中醫(yī)治療原發(fā)性血小板增多癥醫(yī)案中,共有32種治法,治法頻次前5位分別是活血化瘀法、清肝泄火法、清熱涼血法、清熱解毒法、補(bǔ)氣活血法。從表2可見,中醫(yī)對(duì)原發(fā)性血小板增多癥的多種治法相互重疊,本病的治法主要集中在活血化瘀、清肝泄火、清熱涼血三方面。
表2 原發(fā)性血小板增多癥醫(yī)案中治法頻次2次以上的分布情況
2.3 中醫(yī)治療原發(fā)性血小板增多癥用藥頻次
根據(jù)統(tǒng)計(jì)分析結(jié)果,中醫(yī)治療原發(fā)性血小板增多癥醫(yī)案中,共用藥171種。從表3可見,原發(fā)性血小板增多癥的用藥主要是清熱、涼血、活血等功效的中藥。
表3 原發(fā)性血小板增多癥醫(yī)案中用藥頻次8次以上的分布情況
2.4 關(guān)聯(lián)規(guī)則的組方規(guī)律分析
支持度個(gè)數(shù)指的是藥物組合在所選處方中出現(xiàn)的頻次(本參數(shù)≤處方總數(shù))。置信度的含義為左邊為A藥物,右邊為B藥物,當(dāng)A藥物為主,B藥物出現(xiàn)的概率。按設(shè)定的支持度和置信度,共獲取18條組方規(guī)則,見表4。從表4和圖1可見,用于治療原發(fā)性血小板增多癥的中藥關(guān)聯(lián)最為密切的藥集中在赤芍、生地黃、牡丹皮、桃仁、紅花、甘草等中藥。
表4 原發(fā)性血小板增多癥醫(yī)案常用藥物關(guān)聯(lián)分析(支持度≥12,置信度≥0.8)
圖1 關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)展示(支持度≥12,置信度≥0.8)
2.5 基于熵聚類的醫(yī)案組方規(guī)律分析
2.5.1 改進(jìn)的互信息法的藥物間關(guān)聯(lián)度分析
按設(shè)定的相關(guān)度與懲罰度,進(jìn)行聚類分析,得到醫(yī)案中兩兩藥物間的關(guān)聯(lián)度,將關(guān)聯(lián)系數(shù)0.03以上的藥對(duì)列表,見表5。由表5可見,基于改進(jìn)的互信息法的關(guān)聯(lián)度較大的組合有:鉤藤-茺蔚子、鉤藤-金銀花、澤蘭-桂枝、澤蘭-大腹皮、黃芩-白豆蔻等。
表5 改進(jìn)的互信息法的藥物間關(guān)聯(lián)度分析結(jié)果
2.5.2 復(fù)雜系統(tǒng)熵聚類的藥物核心組合分析
方劑或處方是由若干個(gè)藥物組成的,藥物之間必然存在一定的關(guān)聯(lián)性,本文中相關(guān)度是根據(jù)改進(jìn)的互信息算法的藥物與藥物之間的關(guān)聯(lián)進(jìn)行定量描述的一個(gè)參數(shù)。如相關(guān)度設(shè)置為“8”,表示僅取排序在前面的1~7(設(shè)計(jì)藥物8味)的藥物之間的關(guān)聯(lián)度,然后進(jìn)行聚類挖掘。懲罰度是為了減少負(fù)面數(shù)據(jù)信息干擾的一個(gè)參數(shù)。藥物之間的關(guān)聯(lián)有正相關(guān)和負(fù)相關(guān)。懲罰度就是將藥物之間的負(fù)相關(guān)排除。如懲罰度為“2”,表示2個(gè)藥物至少在已有的方劑或處方中同時(shí)出現(xiàn),這樣對(duì)于那些在所有處方中都沒有同時(shí)出現(xiàn)的藥物進(jìn)行了排除。以藥物間關(guān)聯(lián)度分析結(jié)果為基礎(chǔ),按照設(shè)定的相關(guān)度與懲罰度,基于復(fù)雜系統(tǒng)熵聚類方法,得到3味藥核心組合35組,見表6。由表6可見,通過聚類分析挖掘出了多組核心組合,如清肝涼血的青黛-赤芍-龍膽,補(bǔ)氣活血的黃芪-水牛角-紅花,涼血活血的水牛角-桃仁-牡丹皮等。每組核心組合都有其所治的病機(jī),在臨床上要求醫(yī)者辨證論治,選擇適合的藥對(duì)。
表6 基于復(fù)雜系統(tǒng)熵聚類的核心組合
2.5.3 基于無監(jiān)督熵層次聚類的新處方分析
在上述35組核心配伍的基礎(chǔ)上,運(yùn)用無監(jiān)督熵層次聚類算法,得到6個(gè)新處方,見表7。由表7可見,6個(gè)新處方各有其相對(duì)應(yīng)的證型。如方1、方5針對(duì)血熱證和瘀血證者;方4、方6針對(duì)熱毒偏甚者;方2針對(duì)肝火夾瘀者;方3針對(duì)熱毒夾瘀夾虛者。
表7 基于熵層次聚類的新處方
原發(fā)性血小板增多癥臨床較為少見,中醫(yī)少有對(duì)本病進(jìn)行系統(tǒng)研究。本研究將不同醫(yī)家對(duì)本病診療散在的個(gè)案報(bào)道進(jìn)行“系統(tǒng)集成”,采用關(guān)聯(lián)規(guī)則 Apriori 算法和復(fù)雜系統(tǒng)熵聚類方法系統(tǒng)分析了原發(fā)性血小板增多癥的中醫(yī)診療規(guī)律,對(duì)原發(fā)性血小板增多癥的臨床研究提供新的思路。
3.1 辨證與治法規(guī)律分析
研究顯示中醫(yī)對(duì)原發(fā)性血小板增多癥的辨證具有一定規(guī)律性。經(jīng)統(tǒng)計(jì)分析,中醫(yī)對(duì)本病辨證的主要證型有瘀血證、肝郁化火證、氣滯血瘀證、血熱妄行證、瘀毒互結(jié)證等,基本揭示了原發(fā)性血小板增多癥的證型分布規(guī)律,對(duì)于指導(dǎo)本病辨證有較好的參考價(jià)值。另外,經(jīng)統(tǒng)計(jì),本病的治法主要為活血化瘀法、清肝泄火法、清熱涼血法、清熱解毒法、補(bǔ)氣活血法,與證型有較好的一致性,符合中醫(yī)“法隨證立”的觀點(diǎn)。
3.2 用藥規(guī)律分析
本研究較好地揭示了中醫(yī)治療原發(fā)性血小板增多癥臨床用藥經(jīng)驗(yàn)的規(guī)律性。研究顯示中醫(yī)治療原發(fā)性血小板增多癥常用的藥物有赤芍、生地黃、丹參、牡丹皮、甘草、桃仁、當(dāng)歸、紅花、牛膝、水蛭、川芎、黃芪等。這些藥多數(shù)具有清熱涼血、活血化瘀、補(bǔ)氣等功效。本研究運(yùn)用基于熵聚類的醫(yī)案組方規(guī)律分析發(fā)現(xiàn)了中醫(yī)治療本病的核心藥物組合,并得到6個(gè)新的處方。當(dāng)然,從方法學(xué)層面來看,支持度、置信度、相關(guān)度和懲罰度等參數(shù)設(shè)為多大,需要結(jié)合相關(guān)的專業(yè)知識(shí),否則很難得到理想的結(jié)果,新發(fā)現(xiàn)的核心藥物組合與新處方還需進(jìn)一步臨床驗(yàn)證,醫(yī)學(xué)數(shù)據(jù)挖掘結(jié)果能在一定程度上揭示用藥規(guī)律,由于臨床實(shí)踐中的個(gè)體化差異,數(shù)據(jù)挖掘結(jié)果需要在臨床實(shí)踐中謹(jǐn)慎應(yīng)用[4]。
3.3 研究方法評(píng)價(jià)
原發(fā)性血小板增多癥是一種較為少見的病種,中醫(yī)目前尚無規(guī)范的診療方案,本病散在的病案報(bào)道具有客觀可信的特點(diǎn),??砂l(fā)現(xiàn)顯性經(jīng)驗(yàn),但單純個(gè)案很難有創(chuàng)新性的發(fā)現(xiàn)和認(rèn)識(shí)。關(guān)聯(lián)規(guī)則分析可從大量的數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間有價(jià)值的關(guān)聯(lián),關(guān)聯(lián)規(guī)則用于研究藥物使用規(guī)律,可以在不同層次發(fā)現(xiàn)藥物的組合使用情況[5]。復(fù)雜系統(tǒng)的熵方法能自組織地從大量的數(shù)據(jù)中提取出信息量最大的組合,此方法特別適用于高度離散性類型的數(shù)據(jù)。中醫(yī)個(gè)案報(bào)道的數(shù)據(jù)具有離散型,又有非線性和混合型的特點(diǎn),因此,基于復(fù)雜系統(tǒng)的熵方法非常適合作為中醫(yī)個(gè)案分析的研究[6]。中醫(yī)傳承輔助系統(tǒng)數(shù)據(jù)挖掘和統(tǒng)計(jì)功能強(qiáng)大,不僅有常規(guī)的頻數(shù)統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則分析等發(fā)現(xiàn)顯性辨證用藥經(jīng)驗(yàn)分析,還運(yùn)用復(fù)雜系統(tǒng)的熵方法,發(fā)現(xiàn)隱性的組方規(guī)律分析[7-8]。當(dāng)然,運(yùn)用中醫(yī)傳承輔助系統(tǒng)平臺(tái)研究中醫(yī)群體經(jīng)驗(yàn),并不否認(rèn)中醫(yī)個(gè)人用藥特點(diǎn)的價(jià)值,相反,某些中醫(yī)的獨(dú)特認(rèn)識(shí)疾病經(jīng)驗(yàn)也并非數(shù)據(jù)挖掘技術(shù)所能替代,如國醫(yī)大師郭子光教授認(rèn)為,原發(fā)性血小板增多癥多為肝疏泄太過,肝火偏旺,常以清肝涼血藥青黛作為治療本病的主藥[9],而這些獨(dú)特用藥經(jīng)驗(yàn)容易被數(shù)據(jù)分析遺漏。因此,將中醫(yī)傳承輔助系統(tǒng)平臺(tái)對(duì)中醫(yī)群體經(jīng)驗(yàn)的規(guī)律研究和個(gè)別中醫(yī)獨(dú)特經(jīng)驗(yàn)結(jié)合起來,將更有利于全面深刻地從中醫(yī)角度認(rèn)識(shí)疾病的本質(zhì),更好地辨證用藥。
[1] 莊靜麗, 王寶珍. 骨髓增殖性腫瘤[M]∥陳灝珠, 林果為. 實(shí)用內(nèi)科學(xué). 13 版. 北京: 人民衛(wèi)生出版社, 2009: 2531-2533.
[2] 姚乃禮. 中醫(yī)證候鑒別診斷學(xué)[M]. 2 版. 北京: 人民衛(wèi)生出版社, 2002.
[3] 陳蔚文. 中藥學(xué)[M]. 2 版. 北京: 人民衛(wèi)生出版社, 2012.
[4] 李文林, 趙國平, 陸建峰, 等. 關(guān)聯(lián)規(guī)則在名醫(yī)臨證經(jīng)驗(yàn)分析挖掘中的應(yīng)用[J]. 南京中醫(yī)藥大學(xué)學(xué)報(bào), 2008, 24(1): 21-24.
[5] 吳榮, 劉晛, 王階, 等. 基于關(guān)聯(lián)規(guī)則的名老中醫(yī)冠心病用藥規(guī)律研究[J]. 中國中藥雜志, 2007, 32(17): 1786-1788.
[6] 劉鐵鋼, 陳建新, 張望, 等. 基于復(fù)雜系統(tǒng)熵方法的孔光一教授治療月經(jīng)病經(jīng)驗(yàn)數(shù)據(jù)挖掘研究[J]. 中醫(yī)雜志, 2013, 54(6): 481-483.
[7] 盧笑暉, 單崎瑋. 基于中醫(yī)傳承輔助系統(tǒng)分析盧尚嶺教授治療頭風(fēng)病用藥經(jīng)驗(yàn)[J]. 中國實(shí)驗(yàn)方劑學(xué)雜志, 2012, 18 (9): 5.
[8] 吳嘉瑞, 張冰, 楊冰, 等. 基于關(guān)聯(lián)規(guī)則和復(fù)雜系統(tǒng)熵聚類的顏正華教授治療呃逆用藥規(guī)律研究[J]. 中華中醫(yī)藥雜志, 2013, 28(11): 3416-3419.
[9] 常名空, 侯德健. 郭子光教授發(fā)揮肝主疏泄學(xué)說治療血小板疾病[J]. 四川中醫(yī), 2007, 25(12): 3-4.
(責(zé)任編輯:劉俊華)
Analysis on traditional Chinese medicine’s medication rule in prescriptions for the primary thrombocytosis based on data mining
LI Yuan, LIU Panying, LI Haibin, LI Tao
(College of Traditional Chinese Medicine, Hebei University, Baoding 071002, China)
Objective To explore the traditional Chinese medicine for primary thrombocytosis evidence. Methods Collect the medical record of TCM treatment of primary thrombocytosis, based on the data mining software , such as frequency analysis,the rules of using the software integration analysis, improved mutual information method, the complex system entropy and entropy of unsupervised clustering hierarchy clustering data mining methods were used to analyze TCM syndromes and herbs for the treatment of primary thrombocytosis. Results Based on the 57 selected medical records, the appearance frequency of symptoms, treatment and the frequency of each herb and association rules among the herbs were computed, 35 core combinations and 6 new prescriptions were also mined from the database. Conclusion Chinese medicine has been accumulated experiences in the treatment of primary thrombocytosis and has rules to follow, mainly for the blood stasis syndrome differentiation of syndrome, blood heat, something the effect such as clear heat, cooling blood, invigorating the circulation,which has strong regularity.
primary thrombocytosis disease; apriori; clustering algorithm; traditional Chinese medicine’s medication rule
10.3969/j.issn.1674-490X.2015.05.008
R249
A
1674-490X(2015)05-0029-06
本文引用:李遠(yuǎn), 劉盼英, 李海濱, 等. 運(yùn)用數(shù)據(jù)處理技術(shù)探討原發(fā)性血小板增多癥的中醫(yī)辨證和用藥規(guī)律[J]. 醫(yī)學(xué)研究與教育, 2015, 32(5): 29-34.
2015-09-21
李遠(yuǎn)(1975—),男,重慶人,副教授,博士,主要從事中醫(yī)臨床經(jīng)驗(yàn)的系統(tǒng)研究。E-mail: liyuancdutcm@126.com