史琦 陳建新 趙慧輝 王偉
摘要 目的:建立冠心病不穩(wěn)定性心絞痛患者臨床常規(guī)檢測指標對痰熱互結(jié)證的識別模式。方法:選取2010年4月至2011年4月多中心收集的冠心病不穩(wěn)定性心絞痛患者411例的基本資料、中醫(yī)四診信息及臨床常規(guī)檢測指標進行歸一化處理后,采用CHAID決策樹方法從90個臨床常規(guī)檢測指標中自動提取痰熱互結(jié)證的識別規(guī)律。對其中212例患者進行痰熱互結(jié)證識別模式的外驗證。結(jié)果:Cl離子、縮短分數(shù)、RDW-CV、血常規(guī)RBC、D-Ⅱ聚體、CK-MB、PTA和BUN共8個屬性指標經(jīng)篩選后進入決策樹識別模型。該模型對411例患者的測試結(jié)果顯示:敏感度為75.0%,特異度為86.9%,檢驗準確率為86.1%。外驗證模型缺失RDW-CV,模型識別準確率為85.8%,敏感度為89.5%,特異度為85.5%。結(jié)論:臨床常規(guī)檢測指標經(jīng)CHAID決策樹方法篩選后,可以直觀、清晰的進行冠心病不穩(wěn)定性心絞痛患者痰熱互結(jié)證的識別,自動歸納識別規(guī)律,在中醫(yī)證型-生物學(xué)指標對應(yīng)模式的數(shù)據(jù)挖掘中具備一定的優(yōu)勢。
關(guān)鍵詞 識別模式;CHAID決策樹;痰熱互結(jié)證;冠心?。徊环€(wěn)定性心絞痛
Abstract Objective:To build a recognition mode of phlegm-heat stasis syndrome according to indexes of clinical routine examinations of patients with unstable angina (UA).Methods:From April 2010 to April 2011,the clinical basic data,TCM four-diagnosis information and clinical routine examination indexes of 411 patients with UA were collected and normalized,and the recognition rules of phlegm-heat stasis syndrome was automatically extracted from 90 clinical examination indexes by applying CHAID decision tree method.The verification of recognition mode of phlegm-heat stasis syndrome in 212 patients was conducted.Results:A total of 8 indicators,including Cl ion,shortening fraction,RDW-CV,blood RBC,D-II mer,CK-MB,PTA and BUN were indexed into the decision tree model.The test results of 411 patients of the model showed that the sensitivity was 75.0%,the specificity was 86.9%,and the correct rate was 86.1%.The verification of association patterns lacked RDW-CV,and its correct rate was 85.8%.The sensitivity was 89.5%,and the specificity was 85.5%.Conclusion:The CHAID decision tree model can clearly and directly conduct recognition of phlegm-heat stasis syndrome with the basis of clinical routine examination indexes,and automatically summarize recognition rules,which has certain advantages in data mining of syndrome-physiochemistry model.
Key Words Recognition mode; CHAID decision tree; Phlegm-heat stasis syndrome; Coronary heart disease; Unstable angina
中圖分類號:R2-03文獻標識碼:Adoi:10.3969/j.issn.1673-7202.2018.09.001
冠狀動脈粥樣硬化性心臟病指冠狀動脈(冠脈)發(fā)生粥樣硬化引起管腔狹窄或閉塞,導(dǎo)致心肌缺血、缺氧或壞死而引起的心臟病,簡稱冠心?。–oronary Heart Disease,CHD),又稱缺血性心臟?。↖schemic Heart Disease)。中醫(yī)學(xué)注重整體觀念和辨證論治,在冠心病的防御和治療方面已逐步顯示出其優(yōu)勢和特色。近年來,冠心病中醫(yī)證候?qū)W的研究多采用冠脈造影金標準作為疾病診斷標準,在以往文獻研究、回顧性研究基礎(chǔ)上采用臨床流行病學(xué)前瞻性研究,同時在系統(tǒng)論思想的指導(dǎo)下不斷引入系統(tǒng)生物學(xué)方法,使得其研究在客觀化、標準化方面取得了一定的成果和進展。中醫(yī)“證”本質(zhì)的研究在現(xiàn)代醫(yī)學(xué)“實證主義”及“還原論”思想的引領(lǐng)下成為研究熱點。但由于“證”不是對人體某個局部的反應(yīng),而是涉及到多個系統(tǒng)、多個器官、多個層次的整體反應(yīng),因此單系統(tǒng)、單層面的證候?qū)W研究顯然難以全面揭示其科學(xué)內(nèi)涵。
數(shù)據(jù)挖掘(Data Mining,DM)為解決“數(shù)據(jù)豐富,知識貧乏”狀況而誕生,是數(shù)據(jù)庫研究中極具應(yīng)用前景的信息技術(shù)研究領(lǐng)域,融合了統(tǒng)計學(xué)、機器學(xué)習、人工智能、神經(jīng)網(wǎng)絡(luò)、信息檢索、模式識別和數(shù)據(jù)可視化等多個領(lǐng)域的理論和技術(shù)[1]。中醫(yī)證候具有相對規(guī)律性、非單一趨向性改變的特點,其研究數(shù)據(jù)屬于大量、隨機、模糊性數(shù)據(jù),涵蓋了人體多方面、多層次、多指標的病理生理過程。數(shù)據(jù)挖掘技術(shù)正是一種從大量、有噪聲、不完全的實際數(shù)據(jù)中,提取隱含規(guī)則、挖掘潛在信息的過程。決策樹(Decision Tree,DT)是通過一系列規(guī)則對復(fù)雜數(shù)據(jù)進行分類的過程[2]。中醫(yī)四診信息數(shù)量龐雜,在現(xiàn)代醫(yī)學(xué)看來并非疾病的臨床特異性表現(xiàn),在西醫(yī)臨床診斷和療效評價過程中的作用微乎其微。應(yīng)用決策樹的數(shù)據(jù)挖掘方法可以提取出與相應(yīng)證型相關(guān)度最大的中醫(yī)四診信息要素,從而形成證候診斷模型。中醫(yī)辨證過程以四診信息為基礎(chǔ),臨床常規(guī)生物學(xué)指標在辨證過程中常被忽視,然而我們前期的研究發(fā)現(xiàn)宏觀層面的中醫(yī)證候與微觀層面的病理生理進程之間的互通可能正是以這些檢測指標為基礎(chǔ)[3-4]。
本研究采用卡方自動交互檢測(Chi-squared Automatic Interaction Detector,CHAID)決策樹方法對冠心病不穩(wěn)定性心絞痛(Unstable Angina,UA)痰熱互結(jié)證患者的臨床檢驗、檢查指標群進行了分析處理,提取關(guān)聯(lián)要素,旨在探討臨床常規(guī)生物學(xué)指標的組合模式在UA患者中醫(yī)證候/證候要素識別中的作用和意義。
1 資料與方法
1.1 一般資料 選取2010年4月至2011年4月中日友好醫(yī)院、東直門醫(yī)院、北京安貞醫(yī)院、鄭州市中醫(yī)院、武漢市中醫(yī)醫(yī)院及湖北省中醫(yī)院收治的冠心病不穩(wěn)定性心絞痛住院患者共計411例。
1.2 診斷標準 疾病診斷參照《慢性穩(wěn)定型心絞痛診療指南》(美國心臟病學(xué)院/美國心臟學(xué)會/美國醫(yī)師學(xué)院及美國內(nèi)科學(xué)會聯(lián)合議定,1999年)[5]及《不穩(wěn)定性心絞痛診斷和治療建議》(中華醫(yī)學(xué)會心血管病學(xué)分會制訂,2000年)[6]。中醫(yī)證候、證型診斷參照《中醫(yī)臨床診療術(shù)語·證候部分》(國家技術(shù)監(jiān)督管理局,1997年)[7]及《中藥新藥臨床研究指導(dǎo)原則》(2002年)[8]。
1.3 納入標準 1)符合冠心病不穩(wěn)定性心絞痛診斷標準;2)年齡符合35~75歲之間;3)自愿簽訂知情同意書。
1.4 排除標準 1)急性心肌梗死、心包疾病、心肌疾病、心臟神經(jīng)官能癥、肋間神經(jīng)痛、帶狀皰疹等疾病引起胸痛的患者;2)非冠心病引起心絞痛的患者,如風濕熱、先天性冠脈畸形、主動脈瓣狹窄或關(guān)閉不全等;3)合并重度心律失常、腦中風、腎衰、肺部感染、腫瘤及其他嚴重原發(fā)性疾病患者;4)合并高血壓患者血壓未經(jīng)控制或控制不佳者(收縮壓≥180 mmHg和/或舒張壓≥110 mmHg);5)妊娠期、哺乳期患者;精神疾病患者;過敏體質(zhì)患者。
1.5 研究方法
1.5.1 臨床辨證及資料采集 入院24 h內(nèi)對患者進行現(xiàn)病史、既往史、個人史、中醫(yī)四診信息等內(nèi)容的全面采集和記錄。疾病診斷及中醫(yī)辨證由3名副主任醫(yī)師及以上資格并具有相關(guān)臨床工作經(jīng)驗5年及以上的臨床醫(yī)生完成。入院1周內(nèi)完成血、尿、便常規(guī)、生化指標(肝功能、腎功能、血糖、血脂、心肌酶、尿酸、電解質(zhì)等)、血清胰島素、糖化血紅蛋白、B型尿鈉肽等指標的檢驗及胸片、心電圖、心臟彩超等的檢查。
1.5.2 指標預(yù)處理方法 1)本研究中臨床常規(guī)理化指標具有如下特點:指標數(shù)量龐雜;2)計數(shù)資料和計量資料混雜;3)部分指標存在缺失值;4)各臨床分中心的檢測方法及參考范圍存在差異性。
1.5.3 數(shù)據(jù)預(yù)處理方法 1)缺省值>30%的指標予以剔除;2)經(jīng)臨床醫(yī)師判斷無實際意義的指標予以剔除;3)與冠心病心絞痛病理生理過程明確不相關(guān)的指標予以剔除;4)采用歸一化方法對最終入選的指標進行處理,最終用于CHAID決策樹模型篩選的臨床理化指標共計90項。
1.5.4 數(shù)據(jù)挖掘及模型驗證 篩選過程為:將經(jīng)過預(yù)處理的90項臨床常規(guī)檢測指標作為自變量,將是否具有“痰熱互結(jié)證”作為因變量,其中“痰熱互結(jié)證”以“1”代表,“非痰熱互結(jié)證”以“0”代表。適度調(diào)節(jié)父節(jié)點和子節(jié)點數(shù)以保證決策樹模型的良好生長。采用分層10倍交叉驗證法,以判斷準確率、特異度及敏感度均達到70%以上作為“痰熱互結(jié)證”決策樹分類模型成立。選取上述識別模式中已篩選出的屬性指標作為自變量,以“痰熱互結(jié)證”作為因變量,對來自于北京安貞醫(yī)院的212例病例進行已建立模型的外驗證,計算模型的判斷準確率、敏感度及特異度。
1.6 統(tǒng)計學(xué)方法 采用SPSS 17.0 CHAID決策樹方法進行證候識別規(guī)律的挖掘。
2 結(jié)果
2.1 2組患者基線情況比較 411例UA患者中,男占60.3%,女占39.7%,平均年齡(60.93±8.70)歲。經(jīng)臨床辨證為痰熱互結(jié)證的患者28例(6.8%),非痰熱互結(jié)證患者383例(93.2%)。2組患者在體重指數(shù)方面比較,差異有統(tǒng)計學(xué)意義(P<0.05),在吸煙史方面比較,差異有統(tǒng)計學(xué)意義(P<0.01)。在年齡、性別比例、飲酒史、冠心病病程、合并病以及用藥方面比較,差異無統(tǒng)計學(xué)意義(P>0.05)。見表1。
2.2 痰熱互結(jié)證CHAID決策樹模型結(jié)果 基于90項臨床常規(guī)檢測指標建立的CHAID決策樹識別模型結(jié)果顯示:共篩選出8個用于決策樹判斷的屬性指標,分別是氯離子(Cl)、縮短分數(shù)、D-Ⅱ聚體、紅細胞分布寬度-CV值(RDW-CV)、血常規(guī)紅細胞(RBC)、肌酸激酶同工酶(CK-MB)、凝血酶原活動度(PTA)和尿毒氮(BUN)。該模型包括了18個節(jié)點和10個終節(jié)點,形成了10條判斷是否“痰熱互結(jié)證”的識別路線。比如,Cl離子≤0.367 23,縮短分數(shù)>0.493 51,RBC>0.621 00,則判斷為痰熱互結(jié)證的比例為72.7%,非痰熱互結(jié)證的比例為27.3%,見圖1。
2.3 決策樹識別模型的驗證 10倍交叉驗證結(jié)果顯示:該決策樹模型對是否“痰熱互結(jié)證”的識別敏感度為75.0%,特異度為86.9%,準確率為86.1%。見表2。
2.4 痰熱互結(jié)證決策樹的外驗證模型 痰熱互結(jié)證決策樹外驗證模型包括7個屬性指標:Cl離子、縮短分數(shù)、RBC、D-Ⅱ聚體、CK-MB、PTA及BUN,原模型中的RDW-CV缺失。該模型形成了17條對判斷是否“痰熱互結(jié)證”的識別路徑。見圖2。
2.5 痰熱互結(jié)證決策樹外驗證模型的10倍交叉驗證 采用212例UA患者建立的痰熱互結(jié)證外驗證模型經(jīng)10倍交叉方法驗證后結(jié)果顯示:識別準確率為85.8%,敏感度為89.5%,特異度為85.5%。見表3。
3 討論
痰濁和熱毒是冠心病心絞痛患者較為常見的病因病機?!疤禎帷焙汀盁岫尽睂?dǎo)致冠心病發(fā)生發(fā)展的理論和臨床研究經(jīng)歷了3個時期。萌芽期以《黃帝內(nèi)經(jīng)》和《金匱要略》為代表?!鹅`樞·邪客》:“心者,五臟之大主,精神之所舍也”。心神對機體津液代謝具有重要的調(diào)節(jié)作用。心能溫肺助脾,如果脾為濕困,精微不運,凝結(jié)成痰,流于經(jīng)脈,則滯阻于心脈;心陽可下暖腎水,化氣行津。如心陽虛弱,陰陽氣血不得接續(xù),津液輸布失度,日久則累聚成痰。張仲景在《金匾要略·胸痹心痛短氣病脈證治》中提出“陽微陰弦”是胸痹心痛的主要病機,由此制定的瓜蔞薤白白酒湯、瓜蔞薤白半夏湯等方開創(chuàng)了豁痰寬胸、開痹散結(jié),從痰濁論治冠心病心絞痛的大法?!端貑枴ぶ琳嬉笳摗罚骸帮L、寒、濕、火、熱諸邪,皆能致病心痛”,《素問·刺熱篇》:“熱爭則卒心痛,煩悶善嘔,頭痛面赤,無汗”等論述初步提出了“熱毒”致病理論。在發(fā)展期,諸多后世醫(yī)家對“痰熱”理論加以發(fā)揮。如《諸病源候論》:“……邪迫于陽氣,不得宣暢,壅瘀生熱,故心如懸而急煩懊痛也”?!豆沤襻t(yī)鑒》中指出心痛病由實熱引發(fā):“凡痛在心,連兩脅至兩乳下,牽引背板匙骨下而痛者,實熱也”。張元素主張“久痛無寒而暴痛非熱”是對“熱厥心痛”的闡述。“有熱厥心痛者,身熱足寒,痛甚則煩躁而吐,額汗出,知為熱也”?!栋Y因脈治·胸痛論》中“內(nèi)傷胸痛之因,七情六欲,動其心火……;或怫郁氣逆,傷其肺道,則痰凝氣結(jié)”,體現(xiàn)了痰熱互因。隨著現(xiàn)代醫(yī)學(xué)的不斷發(fā)展,冠心病中醫(yī)“痰”“熱”研究日臻成熟。冠心病證候要素的相關(guān)研究發(fā)現(xiàn),建立的2 029例冠心病心絞痛患者的證候數(shù)據(jù)庫中痰濁偏熱證在心絞痛證候分布特點上具有重要的位置[9]。采用西雅圖心絞痛量表(SAQ)評價了233例冠心病心絞痛患者的生命質(zhì)量(軀體活動受限程度、心絞痛穩(wěn)定狀態(tài)、發(fā)作情況、治療滿意度及疾病認識程度5個維度)發(fā)現(xiàn),其中對于生命質(zhì)量的影響結(jié)果顯示痰濁證呈現(xiàn)負相關(guān),而熱蘊證呈現(xiàn)正相關(guān);熱蘊證可以保護心絞痛發(fā)作并影響心絞痛的穩(wěn)定狀態(tài),痰濁證對治療滿意度呈負向影響[10]。
中醫(yī)學(xué)的證候是在西醫(yī)學(xué)疾病概念的基礎(chǔ)上,對獨立的病理、生理進程的整體概括和反應(yīng)。若將現(xiàn)代醫(yī)學(xué)中以“金標準”診斷疾病的思路方法套用至中醫(yī)證候?qū)W研究中,則必將導(dǎo)致中醫(yī)“證”的泛濫。生物學(xué)指標與“證”的相關(guān)性研究曾一度成為中醫(yī)證候?qū)W研究的范式,但線性相關(guān)性結(jié)果難以揭示“證”的整體性。比如在冠心病中醫(yī)證候與冠脈造影結(jié)果相關(guān)性研究中,有學(xué)者認為,冠心病實證(心血瘀阻型、痰濁內(nèi)阻型)患者冠狀動脈病變較虛證(心氣虛弱型、心腎陰虛型)重,實證以多支病變?yōu)橹?,虛證以單支病變?yōu)橹?;冠脈病變積分由高到低依次為心血瘀阻型>痰濁內(nèi)阻型>心氣虛弱型>心腎陰虛型。另有學(xué)者通過比較分析中醫(yī)證候與冠狀動脈Gensini積分、病變支數(shù)的關(guān)系發(fā)現(xiàn)冠心病患者中醫(yī)實證組以單支病變?yōu)橹鳎?1.3%),高于虛證組(25.0%)和虛實夾雜證組(23.6%);虛證組患者的冠狀動脈病變累及支數(shù)大于虛實夾雜證組和實證組;虛證組的Gensini積分亦高于虛實夾雜證和實證組[11]。上述相互矛盾的研究結(jié)果提示我們線性研究方法無法解決“證”的模糊性和不確定性,只有復(fù)雜性科學(xué)和非線性科學(xué)研究方法的恰當引入,才能實現(xiàn)對“證”這一復(fù)雜系統(tǒng)的實質(zhì)闡述。
決策樹法是通過確定一系列的if-then邏輯(分枝)關(guān)系,形成分層規(guī)則,從而達到對研究數(shù)據(jù)進行精確預(yù)測或正確分類的目的。決策樹學(xué)習屬于機器學(xué)習的范疇,是一種類似于判別分析的有監(jiān)督的學(xué)習方法,其分類結(jié)果簡單明確、結(jié)構(gòu)直觀,適用于較大規(guī)模的數(shù)據(jù)集研究[12]。近年來,決策樹在中醫(yī)藥研究中主要應(yīng)用于證候特征及診斷的規(guī)范化、建立中醫(yī)辨證識別模型、證候演變規(guī)律及其影響因素研究等方面[13-14]。Kass于1980年提出了CHAID即卡方自動交互檢測應(yīng)用于分類及等級數(shù)據(jù)的分析[15]。其學(xué)習過程為選定結(jié)果變量即目標變量,分類指標與目標變量進行交叉分類,產(chǎn)生二維分類表;計算一系列二維分類表的卡方值,以P值最小者作為最佳初始分類表,在此基礎(chǔ)上繼續(xù)應(yīng)用分類指標對目標變量進行分類,不斷重復(fù)上述過程直至P值大于設(shè)定的有統(tǒng)計學(xué)意義的α值,分類停止,產(chǎn)生決策樹模型。CHAID的優(yōu)勢在于:分析過程能夠顯示出各個變量之間的相互作用關(guān)系;分析結(jié)果以樹圖形顯示,分析過程及結(jié)果清晰直觀;不會因自變量之間的共線性而遺漏有意義的變量[16]。
本研究的痰熱互結(jié)證決策樹模型包括Cl離子、縮短分數(shù)、RDW-CV、血常規(guī)RBC、D-Ⅱ聚體、CK-MB、PTA及BUN共8個屬性指標。CHD患者特別是發(fā)生心力衰竭的患者可能出現(xiàn)低氯血癥[17],本研究痰熱互結(jié)證患者的Cl離子水平顯著低于非痰熱互結(jié)證,說明痰熱互結(jié)證患者的電解質(zhì)紊亂情況更加明顯。冠心病心力衰竭陽虛水泛證、心陽虛脫證患者與心氣陰虛證、心氣陽虛證、氣虛血瘀證患者比較,其左室短軸縮短率(FS)有降低趨勢[18]。本研究中,痰熱互結(jié)患者的FS水平無明顯降低,說明痰熱互結(jié)證患者的心室功能尚可。痰熱互結(jié)證患者與非痰熱互結(jié)證患者的RDW水平并無顯著的統(tǒng)計學(xué)線性差異,但在決策樹模型中,RDW水平升高則痰熱互結(jié)證患者的比例上升,說明CHD痰熱證患者中RDW的升高趨勢明顯。研究顯示不穩(wěn)定性心絞痛患者氣虛血瘀證與外周血RBC、MCV、MCHC、DBIL等相關(guān);Logistic回歸結(jié)果顯示:氣虛血瘀證影響因素依次為膽紅素、RBC、MCH、HCT等[19]。本研究中,痰熱互結(jié)證患者RBC計數(shù)增高提示了其血液流變學(xué)的異常情況。D-Ⅱ聚體是交聯(lián)纖維蛋白的降解產(chǎn)物,同時反應(yīng)體內(nèi)的纖溶活性和凝血活動,D-Ⅱ聚體濃度升高是血栓形成和繼發(fā)性纖溶的重要標記物。實驗證實血漿D-Ⅱ聚體和AS密切相關(guān)[20]。研究發(fā)現(xiàn)AMI和UAP患者的血漿D-Ⅱ聚體水平明顯高于SAP患者,且AMI患者升高更加明顯,同時D-Ⅱ聚體還可能與冠脈病變的嚴重程度相關(guān)[21]。本次研究的識別模型及驗證模型中,隨著D-Ⅱ聚體的升高,痰熱互結(jié)證患者的比例增多。CK-MB屬于診斷急性心肌梗死的傳統(tǒng)心肌酶學(xué)指標。心肌急性缺血缺氧導(dǎo)致壞死時,細胞膜通透性改變,心肌細胞內(nèi)的CK-MB釋放入血清。CK-MB的增高程度能較準確地反映心肌梗死的范圍,但敏感性不足,與骨骼肌有交叉[22]。痰熱互結(jié)證模型中,CK-MB被篩選為屬性指標,但其變化趨勢與該證型的關(guān)系需要進一步探討。本研究結(jié)果顯示在決策樹模型中,隨著PTA水平的升高,診斷痰熱互結(jié)證的比例也隨之升高,提示痰熱證患者的凝血傾向更加明顯。研究認為BUN可能是高血壓等傳統(tǒng)因素之外的冠心病不可忽視的危險因素之一[23]。本研究中,痰熱互結(jié)證患者的BUN水平明顯低于非痰熱互阻證,提示BUN可能不是識別痰熱互結(jié)證的主要屬性指標。
中醫(yī)證候?qū)W的研究,其重點在于辨證的客觀化和標準化。目前對于冠心病中醫(yī)證候?qū)W研究已經(jīng)取得了較為豐碩的成果,亟待解決的問題是如何為中醫(yī)辨證提供同時具備良好特異性及敏感性的依據(jù),將辨證指標定量化、標準化,進而形成獨特的辨證體系,實現(xiàn)現(xiàn)代醫(yī)學(xué)病理、生理進程與中醫(yī)證候?qū)W病因、病機之間的良好溝通,最終闡明冠心病中醫(yī)“證”的實質(zhì)和本質(zhì)。方法學(xué)一直以來都是中醫(yī)證候?qū)W研究的最大瓶頸,中醫(yī)辨證過程具有模糊性、復(fù)雜性、非線性及非定量性等特點。分子生物學(xué)研究方法的介入使得中醫(yī)的“證”向?qū)嵸|(zhì)化邁進了一大步,但“證”的本質(zhì)往往不是僅涉及到一種分子,而是由多種分子相互作用而引發(fā)的證候群。針對單一分子的研究只能反應(yīng)辨證實質(zhì)的一個側(cè)面,缺乏特異性和敏感性。缺乏多層次、多角度及高通量信息特點的“證”的研究也無法對證候進行全面闡釋,無法揭示人體作為一個有機整體的“證”變化規(guī)律。隨著系統(tǒng)論思想和系統(tǒng)生物學(xué)方法的不斷引入,中醫(yī)證候?qū)W的研究已經(jīng)進入了立足于復(fù)雜科學(xué)和理論方法的全新階段。數(shù)據(jù)挖掘技術(shù)憑借其特點和優(yōu)勢,逐步實現(xiàn)了對龐雜的中醫(yī)證候數(shù)據(jù)的綜合考量。數(shù)據(jù)挖掘方法可以有效的對中醫(yī)證候數(shù)據(jù)進行分類預(yù)判,獲得證候相關(guān)預(yù)測因子或核心證候,實現(xiàn)“即時辨證”[24]。中醫(yī)藥信息化的發(fā)展促進了多數(shù)研究采用中醫(yī)藥數(shù)據(jù)庫系統(tǒng),實現(xiàn)了中醫(yī)數(shù)據(jù)的規(guī)范性和高效應(yīng)用,但目前研究大多屬于小樣本范疇,并沒有真正實現(xiàn)中醫(yī)“大數(shù)據(jù)”概念,研究的真實性、可重復(fù)性差,眾多研究結(jié)果之間缺乏可比性,甚至篩選出的“核心指標”出現(xiàn)相互矛盾,難以指導(dǎo)臨床應(yīng)用。臨床情況的復(fù)雜性和多樣性決定了數(shù)據(jù)挖掘方法建立的證候識別模型實現(xiàn)“即時準確辨證”尚待深入研究。我們在前期對冠心病不穩(wěn)定性心絞痛患者血瘀證、氣虛證、痰瘀互阻證等多種證型決策樹模型構(gòu)建及驗證的基礎(chǔ)之上[25-27],建立了冠心病患者痰熱互結(jié)證決策樹模型,識別模型的準確率、特異度及敏感度均達到75%以上,外驗證模型的準確率、特異度及敏感度均達到了85%以上。但研究中部分臨床常規(guī)檢測指標存在缺失值,CHAID算法不能在樹的增長過程中排除缺失值;病例數(shù)特別是外驗證病例數(shù)相對較少,不適宜采用分割驗證法對該模型進行進一步的驗證。后續(xù)研究中,我們將把應(yīng)用決策樹方法形成的“網(wǎng)絡(luò)”判斷模型與其他數(shù)據(jù)挖掘方法的識別模式進一步比較,從而篩選出用于冠心病不穩(wěn)定性心絞痛患者證候判別的“核心因素”。
參考文獻
[1]姚美村,袁月梅,艾路,等.數(shù)據(jù)挖掘及其在中醫(yī)藥現(xiàn)代化研究中的應(yīng)用[J].北京中醫(yī)藥大學(xué)學(xué)報,2002,9(5):20-23.
[2]羅林英,陳金雄.基于決策樹的外科手術(shù)信息挖掘與研究[J].醫(yī)學(xué)信息,2008,21(11):1936-1939.
[3]呂愛平,李梢,王永炎.從主觀癥狀的客觀規(guī)律探索中醫(yī)證候分類的科學(xué)基礎(chǔ)[J].中醫(yī)雜志,2005,46(1):5-7.
[4]Zhao HH,Guo S,Chen J,et al.Characteristic Pattern Study of Coronary Heart Disease with Blood Stasis Syndrome Based on Decision Tree[J].International Conference on Bioinformatics&Biom,2010,4(4):1-3.
[5]Gibbons RJ,Chatterjee K,Dale J,et al.ACC/AHA/ACP-ASIM guidelines for the management of patients with chronic stable angina[J].J Am Coll Cardiol,1999,33(7):2092-2197.
[6]中華醫(yī)學(xué)會心血管病學(xué)分會.不穩(wěn)定性心絞痛診斷和治療建議[J].中華心血管病雜志,2000,28(6):409-412.
[7]朱文峰,王永炎.中醫(yī)臨床診療術(shù)語-證候部分[M].北京:中國標準出版社,1997:17-20.
[8]國家食品藥品監(jiān)督管理局.中藥新藥臨床研究指導(dǎo)原則[M].北京:中國醫(yī)藥科技出版社,2002:41.
[9]周景想,唐明,李潔,等.2029例冠心病心絞痛中醫(yī)證候特點及組合規(guī)律分析[J].中國中西醫(yī)結(jié)合雜志,2011,31(6):753-755.
[10]王階,湯艷莉,何慶勇.冠心病心絞痛患者證候要素與生存質(zhì)量的相關(guān)性[J].中醫(yī)雜志,2010,51(2):154-163.
[11]王振裕,時亮,陳嘉興.冠心病患者中醫(yī)證候與冠狀動脈造影相關(guān)性研究[J].中華中醫(yī)藥雜志,2009,24(9):1194-1197.
[12]徐蕾,賀佳,孟虹,等.決策樹技術(shù)及其在醫(yī)學(xué)中的應(yīng)用[J].數(shù)理醫(yī)藥學(xué)雜志,2004,17(2):161-164.
[13]李鋒剛.數(shù)據(jù)挖掘技術(shù)在新安醫(yī)學(xué)研究中的應(yīng)用[J].安徽中醫(yī)學(xué)院學(xué)報,2005,24(6):12-14.
[14]李梢,張寧波,李志紅,等.慢性乙型肝炎患者肝膽濕熱證和肝郁脾虛證的決策樹診斷模型初探[J].中國中西醫(yī)結(jié)合雜志,2009,29(11):993-996.
[15]Kass GV.An exploratory technique for investigating large quantities of categorical data[J].Journal of the Royal Statistical Society,1980,29(2):119-127.
[16]石玲,王燕.嬰幼兒死亡危險因素的研究——兼論CHAID方法的原理及應(yīng)用[J].中國衛(wèi)生統(tǒng)計,2002,19(5):283-285.
[17]趙琛,王敏,范茜,等.老年冠心病慢性心力衰竭并發(fā)電解質(zhì)紊亂的臨床特點[J].齊魯醫(yī)學(xué)雜志,2008,23(5):398-402.
[18]杜柏,商秀洋,胡元會,等.冠心病心力衰竭患者中醫(yī)證型與心率變異性、醛固酮及心功能關(guān)系的研究[J].中西醫(yī)結(jié)合心腦血管病雜志,2010,8(8):906-908.
[19]其其格,李耀揚,張鵬,等.冠心病不穩(wěn)定性心絞痛氣虛血瘀證與血清理化指標間相關(guān)性研究[J].中華中醫(yī)藥雜志,2011,26(2):380-383.
[20]Salomaa V,Stinson V,Kark JD,et al.Association of fibrionlytic parameters with early ather osclerosis The ARIC study.Therosis Risk in Communities Study[J].Circulation,1995,91(2):284-290.
[21]董琦,牛凡,楊涓.D-二聚體、纖維蛋白原與冠狀動脈病變程度及左心功能的關(guān)系[J].中國醫(yī)療前沿,2011,6(2):3-4.
[22]何德化,李衛(wèi)華,謝強,等.冠心病患者分泌型磷脂酶A2與高敏C反應(yīng)蛋白、肌酸激酶的檢測及其臨床價值[J].醫(yī)學(xué)臨床研究,2008,25(3):515-517.
[23]金春梅,金基永.血清白蛋白尿素氮肌酐水平與冠心病的相關(guān)性初探[J].現(xiàn)代醫(yī)藥衛(wèi)生,2010,26(19):2912-2914.
[24]陳克龍,樊永平.數(shù)據(jù)挖掘中的分類算法及其在中醫(yī)證候?qū)W中的應(yīng)用[J].中華中醫(yī)藥雜志,2011,26(3):469-473.
[25]史琦,王偉,陳建新,等.基于決策樹的冠心病痰瘀互阻證識別模式研究[J].中華中醫(yī)藥雜志,2013,28(12):3523-3526.
[26]史琦,陳建新,趙慧輝,等.冠心病病人血瘀證的決策樹模型研究[J].中西醫(yī)結(jié)合心腦血管病雜志,2013,11(8):897-900.
[27]Shi Q,Zhao HH,Chen JX,et al.Study on Qi Deficiency Syndrome Identification Modes of Coronary Heart Disease Based on Metabolomic Biomarkers[J].Evidence-Based Complementary and Alternative Medicine,2014,2014(3):281829.
(2018-04-24收稿 責任編輯:張文婷)