張世君,齊冬梅*,李運(yùn)倫,2,聶文婷,朱麗娟
(1.山東中醫(yī)藥大學(xué),濟(jì)南 250355;2.山東中醫(yī)藥大學(xué)附屬醫(yī)院 高血壓國家中醫(yī)臨床研究基地,濟(jì)南 250014)
?
論著
中醫(yī)證候規(guī)范化研究中無監(jiān)督方法探討
張世君1,齊冬梅1*,李運(yùn)倫1,2,聶文婷1,朱麗娟1
(1.山東中醫(yī)藥大學(xué),濟(jì)南 250355;2.山東中醫(yī)藥大學(xué)附屬醫(yī)院 高血壓國家中醫(yī)臨床研究基地,濟(jì)南 250014)
摘要:中醫(yī)證候規(guī)范化研究應(yīng)用的方法主要包括有監(jiān)督數(shù)據(jù)分析方法和無監(jiān)督數(shù)據(jù)分析方法,中醫(yī)證候規(guī)范化研究中常見的無監(jiān)督數(shù)據(jù)分析方法主要包括多維尺度分析、主成分分析、因子分析、聚類分析、關(guān)聯(lián)規(guī)則、隱結(jié)構(gòu)模型、結(jié)構(gòu)方程模型和信息熵,不同的無監(jiān)督數(shù)據(jù)分析方法根據(jù)不同的分析思想和原理,解釋的癥狀關(guān)系的方向不同,反映不同的問題。在進(jìn)行中醫(yī)證候的規(guī)范化研究中需要注意嚴(yán)格控制數(shù)據(jù)質(zhì)量,選擇合適的分析方法,并由專業(yè)研究人員對(duì)數(shù)據(jù)結(jié)果進(jìn)行提煉和詮釋。
關(guān)鍵詞:中醫(yī)證候;規(guī)范化研究;無監(jiān)督數(shù)據(jù)分析方法;分類
中醫(yī)證候體系是一個(gè)繁瑣的非線性系統(tǒng)[1],因具有大量非量化的數(shù)據(jù)變量,從而區(qū)別于其他觀測數(shù)據(jù)[2]。此種特點(diǎn)提示了在進(jìn)行中醫(yī)證候研究時(shí),在單純應(yīng)用線性的、單一化的統(tǒng)計(jì)分析方法的基礎(chǔ)之上,需特別重視非量化數(shù)據(jù)的分析處理。近年來,許多學(xué)者對(duì)證候研究進(jìn)行了深入探討,但始終沒有取得重大突破,隨著現(xiàn)代科學(xué)技術(shù)的發(fā)展,多學(xué)科的交叉滲透,信息技術(shù)的不斷改革、更新,為中醫(yī)證候的規(guī)范化進(jìn)一步的深入研究提供了技術(shù)支撐。盡管中醫(yī)證候規(guī)范化研究的分析方法日趨增多,仍未找到完全適合中醫(yī)證候復(fù)雜化特點(diǎn)的特異性研究方法[3]。
目前常用中醫(yī)證候規(guī)范化研究的數(shù)據(jù)分析方法分為兩類,即無監(jiān)督方法(unsupervised method)和有監(jiān)督方法(supervised method)[4]:無監(jiān)督方法[5]是通過將含有相似特征的原始數(shù)據(jù)信息分門別類,再經(jīng)可視化技術(shù)進(jìn)行直觀展現(xiàn),以進(jìn)一步探索未知數(shù)據(jù)特征的研究方法;有監(jiān)督方法[5]則是依據(jù)已有知識(shí)體系創(chuàng)建信息組,并通過信息組對(duì)未知數(shù)據(jù)的特征進(jìn)行辨識(shí)、歸類和預(yù)測。中醫(yī)臨床四診信息存在多維度、相互關(guān)聯(lián)廣泛、個(gè)體化強(qiáng)、主觀性高等特點(diǎn),數(shù)據(jù)分析的結(jié)果是對(duì)癥狀的組合,而證候規(guī)范化研究的目標(biāo)是建立證候的辨證標(biāo)準(zhǔn),二者間尚存在一個(gè)提煉、轉(zhuǎn)化、詮釋的過程[6]。相較之下,無監(jiān)督方法的分析原理及方法角度更符合當(dāng)前證候研究需要[4],故此進(jìn)行專題探討以滿足證候研究的需要。
1中醫(yī)證候規(guī)范化研究中常見的無監(jiān)督數(shù)據(jù)分析方法
常見的中醫(yī)證候規(guī)范化研究的無監(jiān)督數(shù)據(jù)分析方法主要有以下幾種[6-9]:多維尺度分析、主成分分析和因子分析、聚類分析、關(guān)聯(lián)規(guī)則、隱結(jié)構(gòu)模型、結(jié)構(gòu)方程模型、信息熵等。
1.1多維尺度分析多維尺度分析(multidimensional scaling)[10]是通過對(duì)研究對(duì)象在一個(gè)低維空間形象表示出的多相似性或距離進(jìn)行聚類或唯獨(dú)內(nèi)含分析,并用圖示表達(dá)的一種方法。各癥狀在二維平面圖中分布特點(diǎn)可以通過多維尺度分析進(jìn)行形象的描述,根據(jù)癥狀二維分布的歐氏型距離陣,為辨證分析提供一定的數(shù)據(jù)分析依據(jù)。
1.2主成分分析與因子分析主成分分析(principal components analysis)是運(yùn)用降維思想分析多個(gè)數(shù)值變量之間的相互關(guān)系,將多個(gè)變量/指標(biāo)化為幾個(gè)不相關(guān)的綜合變量/指標(biāo)的統(tǒng)計(jì)方法[11],以便對(duì)數(shù)據(jù)進(jìn)行精簡及詮釋。因子分析(factor analysis)則是探索多個(gè)原始變量/指標(biāo)的相關(guān)關(guān)系之間的潛在變量,以闡釋原始變量/指標(biāo)間的相關(guān)性或協(xié)方差關(guān)系的多元統(tǒng)計(jì)分析方法[11]。
上述兩種分析方法之間雖有密切聯(lián)系[12-13],均可以對(duì)證候進(jìn)行降維分析,從而消除證候的多元共線性,但兩者各有所偏重:主成分分析是綜合原始變量的信息,重在討論原始變量的信息;因子分析是解釋原始變量(公因子與特殊因子的線性組合)之間的關(guān)系,重在研究原始變量之間的關(guān)系,此外,主成分分析能夠準(zhǔn)確得出各主成分的得分,而因子分析只能估計(jì)各公因子得分。
1.3聚類分析聚類分析(clustering analysis)又稱集群分析,是對(duì)尚未明確分類方法的數(shù)據(jù)信息,嘗試依靠數(shù)理統(tǒng)計(jì)尋找適用于現(xiàn)有集資料中研究對(duì)象的一種歸類方法[14]。該方法利用研究個(gè)體/變量之間的親疏關(guān)系,通過盡可能降低類間相似性,并提高類內(nèi)相似性,以達(dá)到聚集數(shù)據(jù)成類的目的[15],在對(duì)已按相似程度分為幾大類別的基礎(chǔ)之上,再將各大類中關(guān)系相近的對(duì)象聚合成一個(gè)較小的分類單位,直至將所有的對(duì)象都聚合完畢,從而形成一個(gè)由小到大的聚類系統(tǒng),并用譜系圖的形式直觀展現(xiàn)所有對(duì)象的親疏關(guān)系。
1.4關(guān)聯(lián)規(guī)則關(guān)聯(lián)是指兩個(gè)或兩個(gè)以上變量之間存在的一定的潛在的規(guī)律,關(guān)聯(lián)分析則是由數(shù)據(jù)庫中找出表或?qū)傩蚤g隱藏的關(guān)聯(lián)網(wǎng),在此基礎(chǔ)上,依靠關(guān)聯(lián)規(guī)則(association rule)尋找數(shù)據(jù)庫中一組事物之間的某種相互關(guān)聯(lián)的關(guān)系,進(jìn)而揭示一個(gè)事物與其他事物之間的存在的關(guān)聯(lián)性和相互依存性,由于中醫(yī)證候數(shù)據(jù)庫數(shù)據(jù)繁瑣,可采用關(guān)聯(lián)規(guī)則尋找相關(guān)聯(lián)的數(shù)據(jù),對(duì)未知問題進(jìn)行推理分析[16],從而根據(jù)某類癥狀同步出現(xiàn)頻率,反映某種證型規(guī)律[17]。
1.5隱結(jié)構(gòu)模型隱結(jié)構(gòu)模型(latent structure models)根據(jù)某病的流行病學(xué)調(diào)查資料,將收集到的患者的癥狀或體征信息進(jìn)行量化處理,利用隱結(jié)構(gòu)模型分析數(shù)據(jù),以挖掘癥狀或體征的同步出現(xiàn)規(guī)律,并依據(jù)同組數(shù)據(jù)同步出現(xiàn)頻率的高低劃分?jǐn)?shù)據(jù),每組劃分分別反映患者在該病情某側(cè)面的客觀分布情況。
1.6結(jié)構(gòu)方程模型結(jié)構(gòu)方程模型(structural equation model)是利用引入潛在變量,通過估計(jì)、檢驗(yàn)因果關(guān)系模型,以此探討多個(gè)抽象變量間因果結(jié)構(gòu)關(guān)系的研究方法[18]。結(jié)構(gòu)方程模型能夠分析隱變量與顯變量、隱變量與隱變量之間可能存在的因果關(guān)系[19],是分析隱變量的有力工具。
1.7信息熵信息熵(information entropy)作為信息論中對(duì)“不確定性”的一種度量指標(biāo)[20],是根據(jù)信息熵的關(guān)聯(lián)度進(jìn)行基于熵的復(fù)雜系統(tǒng)分化方法。因本法無需對(duì)數(shù)據(jù)作剛性先行分割,而是遵循數(shù)據(jù)的內(nèi)在聯(lián)系進(jìn)行自主聚類,是信息論中有關(guān)熵方法及熵語言在非線性相關(guān)模式識(shí)別領(lǐng)域的應(yīng)用形式。
2無監(jiān)督分析方法在中醫(yī)證候研究中的應(yīng)用
2.1多維尺度分析研究者利用多維尺度分析所得的癥狀二維空間距離分類圖,描述性地將變量或樣本進(jìn)行分類,可對(duì)隱藏在原始數(shù)據(jù)背后的維度做出相應(yīng)的判斷,多維尺度分析僅作為對(duì)數(shù)據(jù)形象描述的工具,其分類、結(jié)果尚需與其他數(shù)據(jù)分析的結(jié)果進(jìn)行比較討論[6]。周萍等[21]采用頻數(shù)分析法對(duì)古代情志心身疾病醫(yī)案數(shù)據(jù)庫開展研究,利用多維尺度分析對(duì)使用頻次大于50次以上的54種藥物進(jìn)行分析,總結(jié)了心身疾病的用藥特點(diǎn)。陳濤等[22]薈萃4 400例當(dāng)代名醫(yī)醫(yī)案,分析其中有關(guān)舌象、脈象的分布頻數(shù),挖掘出如霉醬苔最多見于情志病等數(shù)據(jù)信息以指導(dǎo)臨床診療。
2.2主成分分析和因子分析在中醫(yī)證候研究的實(shí)踐中,主成分分析多作為一種中間手段用于數(shù)據(jù)預(yù)處理,隨后再配合其他統(tǒng)計(jì)方法深入分析。王佳笑等[23]運(yùn)用因子分析法探索2型糖尿病合并高血壓病的證候要素主要有陰虛、陽虛、氣虛、熱盛、陽亢、血瘀、痰濕等7個(gè)基本證候要素,為中醫(yī)的客觀化研究提供了有效途徑。劉玥等[24]運(yùn)用因子分析法對(duì)腦梗死后認(rèn)知障礙患者癥狀進(jìn)行分析,得出腦梗死后認(rèn)知障礙的中醫(yī)證候要素為陰虛、陽虛、氣虛、火、痰、血瘀。
2.3聚類分析因聚類分析可在缺少先驗(yàn)知識(shí)的前提下對(duì)數(shù)據(jù)資料分類,故此種方法對(duì)研究中醫(yī)證候的癥狀組合規(guī)律及證候規(guī)律等具有一定的推動(dòng)作用。盧焯明等[25]為分析廣州地區(qū)106例兒童中間型β地中海貧血患者情況,通過觀察表收集信息,運(yùn)用聚類分析等研究方法,發(fā)現(xiàn)此類患兒的中醫(yī)證候分布特點(diǎn)以氣血兩虛證為最多,其余為肝腎陰虛證、脾腎陽虛證、陰陽兩虛證。李毅等[26]運(yùn)用系統(tǒng)聚類法,分析乙肝后肝硬化的癥狀、體征,得出濕熱內(nèi)蘊(yùn)證、脾虛濕盛證、血瘀證、脾腎陽虛證、氣(陽)虛證、肝腎陰虛證、肝郁脾虛證等7類基本證候。
2.4關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則主要應(yīng)用于探討多因素對(duì)特定疾病癥狀的影響規(guī)律以及研究中醫(yī)的“證“與疾病診斷的關(guān)系。黃文金等[27]采用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則的Apriori算法對(duì)證素之間、證素及證候之間進(jìn)行關(guān)聯(lián)規(guī)則,發(fā)現(xiàn)證素之間有9條規(guī)則,證候和證素之間有25條診斷關(guān)聯(lián)規(guī)則,為中醫(yī)兒科臨床診療提供參考。車立娟等[28]利用關(guān)聯(lián)規(guī)則算法進(jìn)行分析,找到證素對(duì)證候的貢獻(xiàn)權(quán)重,形成了“證素—證型”診斷量表,為慢性乙型肝炎的中醫(yī)證型診斷提供了參考。
2.5隱結(jié)構(gòu)模型在證候研究領(lǐng)域,隱結(jié)構(gòu)模型用于研究癥狀之間及癥狀與證候間的復(fù)雜關(guān)系,挖掘證候的主癥與次癥,定量評(píng)估各癥狀的診斷價(jià)值[29]。王天芳等[30]運(yùn)用隱結(jié)構(gòu)模型分析法,對(duì)抑郁癥證候進(jìn)行了探索,根據(jù)統(tǒng)計(jì)分析顯性證候發(fā)生的概率,對(duì)隱變量的狀態(tài)進(jìn)行分類,依據(jù)中醫(yī)傳統(tǒng)理論對(duì)隱變量進(jìn)行解釋與性質(zhì)分類。張連文等[31]為研究中醫(yī)腎虛證辨證標(biāo)準(zhǔn),使用隱結(jié)構(gòu)模型篩取67個(gè)變量,并深入分析其中35個(gè)重要癥狀以指導(dǎo)辨證。
2.6結(jié)構(gòu)方程模型結(jié)構(gòu)方程模型作為檢驗(yàn)四診信息與證候間的因果關(guān)系以及證候間的內(nèi)在結(jié)構(gòu)關(guān)系的統(tǒng)計(jì)學(xué)方法,是進(jìn)行證候診斷標(biāo)準(zhǔn)建立及證候量化診斷等研究的重要方法學(xué)參考。施學(xué)忠等[32]為研究艾滋病中醫(yī)證候與四診信息、中醫(yī)證候與臨床分型歸屬性問題,構(gòu)建結(jié)構(gòu)方程模型,為該病的辨證論治提供了理論及數(shù)據(jù)支持。王利敏等[33]借助結(jié)構(gòu)方程模型,根據(jù)通徑系數(shù)反映不同證候間的影響差異,并依據(jù)載荷系數(shù)展現(xiàn)亞健康狀態(tài)下各證候中不同癥狀的權(quán)重程度,為分析亞健康狀態(tài)各維度及不同中醫(yī)證候間的關(guān)系提供了一定的理論指導(dǎo)。
2.7信息熵信息熵是研究代表證候要素的癥狀,并分析這些癥狀間的非線性關(guān)系的主要方法,在中醫(yī)證候規(guī)范化應(yīng)用中有極高價(jià)值。王階等[34]經(jīng)由復(fù)雜系統(tǒng)熵聚堆法,從冠心病心絞痛患者的癥狀中提取出9種常見組合形式,以此推測冠心病、心絞痛的核心病機(jī)是氣虛、血瘀、痰濁。王天芳等[35]對(duì)601例慢性腎衰竭患者進(jìn)行臨床癥狀采集,采用信息熵關(guān)聯(lián)度系數(shù)法分析所得的108個(gè)癥狀,通過詮釋癥狀的組合規(guī)律,挖掘出心氣虛、脾氣虛、脾胃氣虛、腎陽虛、氣陰兩虛、肝氣郁結(jié)等常見中醫(yī)證候類型,確定可通過信息熵關(guān)聯(lián)度系數(shù)分析方法為該病的常見證候及證候要素研究提供證據(jù)。
3無監(jiān)督數(shù)據(jù)方法在中醫(yī)證候規(guī)范化研究中應(yīng)用的注意事項(xiàng)
3.1選擇合適的無監(jiān)督數(shù)據(jù)分析方法目前中醫(yī)證候規(guī)范化研究中使用不同的無監(jiān)督數(shù)據(jù)分析方法,是根據(jù)不同的分析原理與指導(dǎo)思想對(duì)數(shù)據(jù)進(jìn)行分析,各有利弊,因此正確選擇分析方法是數(shù)據(jù)分析成功的前提與基礎(chǔ)。在進(jìn)行證候研究數(shù)據(jù)分析前必須明確研究方向以及研究目的,結(jié)合數(shù)據(jù)特點(diǎn),選取合適的分析方法進(jìn)行處理、分析,必要時(shí)可聯(lián)合應(yīng)用統(tǒng)計(jì)分析方法以充分發(fā)揮各方法的優(yōu)點(diǎn),使數(shù)據(jù)分析結(jié)果更加準(zhǔn)確、恰當(dāng)。
3.2嚴(yán)格控制數(shù)據(jù)的質(zhì)量數(shù)據(jù)處理和分析過程中會(huì)涉及到重要數(shù)據(jù)的設(shè)置問題,不同的數(shù)據(jù)經(jīng)過同樣的處理、分析會(huì)得出不同的結(jié)果。因此,在進(jìn)行處理和分析時(shí),要對(duì)數(shù)據(jù)質(zhì)量進(jìn)行嚴(yán)格控制。必要時(shí)可將臨床研究的盲法原則引入到數(shù)據(jù)分析中,如委托專業(yè)信息學(xué)研究人員進(jìn)行分析,中醫(yī)學(xué)專業(yè)研究人員負(fù)責(zé)詮釋數(shù)據(jù)結(jié)果,分析過程中由兩方人員共同協(xié)商,以保證數(shù)據(jù)分析結(jié)果的客觀性與真實(shí)性,提高研究的質(zhì)量與可信度。
3.3對(duì)分析結(jié)果的提煉與詮釋進(jìn)行證候規(guī)范化研究的目的就是將辨證進(jìn)行信息學(xué)語言的提煉、重現(xiàn)。從四診收集到數(shù)據(jù)處理,運(yùn)用現(xiàn)代數(shù)據(jù)挖掘方法,尋找潛在的聯(lián)系和規(guī)律,建立并探討各個(gè)癥狀間的相互組合關(guān)系,并與中醫(yī)基礎(chǔ)理論相結(jié)合,形成證候要素及證候的診斷模型標(biāo)準(zhǔn)(數(shù)學(xué)模型)。由于中醫(yī)臨床四診信息存在獨(dú)立性強(qiáng)、主觀性高、關(guān)聯(lián)廣泛、多維度等特點(diǎn),臨床癥狀間的關(guān)系具有高度復(fù)雜化、組合隨機(jī)化的特征,不同的無監(jiān)督數(shù)據(jù)分析方法的分析原理不同,故解釋的癥狀信息間的相互關(guān)系的方向不同,建立癥狀組合的意義不同,反映出問題的不同方面[6]。因此,合理使用無監(jiān)督數(shù)據(jù)分析方法,對(duì)癥狀關(guān)聯(lián)模型的評(píng)價(jià)以及對(duì)各種結(jié)果的異同點(diǎn)系統(tǒng)詮釋,是證候規(guī)范化研究中的重要環(huán)節(jié)。
參考文獻(xiàn):
[1]王永炎.完善中醫(yī)辨證方法體系的建議[J].中醫(yī)雜志,2004,45(10):729-731.
[2]史希來.屬性數(shù)據(jù)分析引論[M].北京:北京大學(xué)出版社,2006:237.
[3]戴霞,郭偉星.中醫(yī)證候診斷標(biāo)準(zhǔn)規(guī)范化研究概況[J].中醫(yī)雜志,2011,52(2):168-171.
[4]趙燕,薛曉林,吳秀艷,等.無監(jiān)督數(shù)據(jù)分析方法在證候研究中的應(yīng)用[C]//中華中醫(yī)藥學(xué)會(huì)中醫(yī)診斷學(xué)分會(huì)2007年會(huì)論文集,2007.
[5]邱德紅,陳傳波.融合無監(jiān)督和監(jiān)督學(xué)習(xí)策略生成的多分類決策樹[J].小型微型計(jì)算機(jī)系統(tǒng),2004,25(4):555-559.
[6]趙燕.基于多種無監(jiān)督數(shù)據(jù)分析方法的抑郁癥證候要素研究[D].北京:北京中醫(yī)藥大學(xué),2007.
[7]于春光.基于多種數(shù)據(jù)分析方法的慢性乙型肝炎證候要素的研究[D].北京:北京中醫(yī)藥大學(xué),2007.
[8]李志更.基于多種數(shù)據(jù)分析方法的慢性腎功能衰竭證候要素研究[D].北京:北京中醫(yī)藥大學(xué),2007.
[9]TREVOR H,ROBERT T,J E J.統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ)-數(shù)據(jù)挖掘,推測與預(yù)測[M].北京:電子工業(yè)出版社,2004.
[10]張凡帆.下肢動(dòng)脈硬化閉塞癥證候要素診斷量表的研制[D].北京:北京中醫(yī)藥大學(xué),2012.
[11]孫振球,徐勇勇.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].北京:人民衛(wèi)生出版社,2002.
[12]黃粵,高穎,馬斌.中醫(yī)證候研究常用數(shù)據(jù)挖掘方法述評(píng)[J].中醫(yī)藥學(xué)報(bào),2010,38(3):6-10.
[13]張琳婷,張明雪.多元分析法在中醫(yī)證候研究中的應(yīng)用[J].實(shí)用中醫(yī)內(nèi)科雜志,2012(12):91-93.
[14]查青林,林色奇,呂愛平.多元統(tǒng)計(jì)分析在中醫(yī)證候研究中的應(yīng)用探析[J].江西中醫(yī)學(xué)院學(xué)報(bào),2004,16(6):79-80.
[15]鄭舞,劉國萍.常見數(shù)據(jù)挖掘方法在中醫(yī)診斷領(lǐng)域的應(yīng)用概況[J].中國中醫(yī)藥信息雜志,2013,20(4):103-107.
[16]黃山,郭立瑋.數(shù)據(jù)挖掘技術(shù)在中醫(yī)藥研究中的應(yīng)用[J].中華中醫(yī)藥學(xué)刊,2008,26(2):357-359.
[17]龔燕冰,倪青,王永炎.中醫(yī)證候研究的現(xiàn)代方法學(xué)述評(píng)(一)[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2006,29(12):797-801.
[18]宇文亞,謝雁鳴,耿直,等.基于因果模型的中醫(yī)證候研究探討[J].世界科學(xué)技術(shù):中醫(yī)藥現(xiàn)代化,2007,9(5):30-33,44.
[19]黃粵,高穎.數(shù)據(jù)挖掘技術(shù)在中醫(yī)證候研究中的應(yīng)用概述[J].上海中醫(yī)藥大學(xué)學(xué)報(bào),2010,30(1):85-87.
[20]王瑞祥,崔利銳.基于貝葉斯網(wǎng)絡(luò)的中醫(yī)專家系統(tǒng)構(gòu)建方法[J].中國醫(yī)藥導(dǎo)報(bào),2007,4(7):58,73.
[21]周萍,肖小燕,王斌.計(jì)算機(jī)輔助心身疾病相關(guān)醫(yī)案的用藥規(guī)律研究[J].中醫(yī)藥臨床雜志,2008,20(3):254-256.
[22]陳濤,李克乾,陳茂華,等.4 400例當(dāng)代名醫(yī)醫(yī)案的舌象分布頻數(shù)分析[J].遼寧中醫(yī)雜志,2007,34(9):1217-1220.
[23]王佳笑,趙時(shí)鵬,倪青,等.運(yùn)用因子分析法探索2型糖尿病合并高血壓病中醫(yī)證候要素分布特點(diǎn)[J].陜西中醫(yī),2015,36(2):155-157.
[24]劉玥,金香蘭,薛斐然,等.基于因子分析腦梗死后認(rèn)知障礙中醫(yī)證候要素研究[J].北京中醫(yī)藥,2015,42(2):83-87.
[25]盧焯明,錢新華.以聚類分析法研究兒童中間型β地中海貧血的中醫(yī)證候分布規(guī)律[J].中華中醫(yī)藥雜志,2012,27(3):607-611.
[26]李毅,劉艷,寇小妮,等.乙肝后肝硬化癥狀學(xué)聚類研究[J].中醫(yī)藥導(dǎo)報(bào),2012,18(2):14-16.
[27]黃文金,姚明龍,葉云金,等.關(guān)聯(lián)規(guī)則在中醫(yī)兒科學(xué)證素診斷中的應(yīng)用[J].中醫(yī)藥臨床雜志,2015,13(3):329-331.
[28]車立娟,馬利莊,胡義揚(yáng).基于關(guān)聯(lián)規(guī)則算法的慢性乙型肝炎證型診斷量表多中心研究[J].上海中醫(yī)藥雜志,2014,35(5):11-14.
[29]李海霞,王階,胡元會(huì),等.基于信息熵的關(guān)聯(lián)度的血瘀證量化研究[J].世界科學(xué)技術(shù):中醫(yī)藥現(xiàn)代化,2007,9(4):18-21.
[30]王天芳,張連文,趙燕,等.隱結(jié)構(gòu)模型及其在中醫(yī)證候研究中的應(yīng)用[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2009,32(8):519-526.
[31]張連文,袁世宏,陳弢,等.隱結(jié)構(gòu)模型與中醫(yī)辨證研究(Ⅱ)——腎虛數(shù)據(jù)分析[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2008,31(9):584-587.
[32]施學(xué)忠,楊永利,時(shí)松和,等.HIV/AIDS中醫(yī)實(shí)證與四診信息的結(jié)構(gòu)方程建模[J].中國衛(wèi)生統(tǒng)計(jì),2011,28(5):495-496.
[33]王利敏,曲彬彬,趙歆,等.基于結(jié)構(gòu)方程模型的亞健康狀態(tài)中醫(yī)證候量化分析研究[J].中華中醫(yī)藥雜志,2011,26(5):1033-1036.
[34]王階,邢雁偉,陳建新,等.復(fù)雜系統(tǒng)熵聚堆方法對(duì)1 069例冠心病心絞痛證候要素提取和應(yīng)證組合規(guī)律研究[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2008,14(3):211-213.
[35]王天芳,李志更,吳秀艷,等.基于信息熵關(guān)聯(lián)度系數(shù)法的慢性腎衰竭中醫(yī)癥狀組合的探索[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2010,33(7):493-495.
Unsupervised methods in TCM syndrome standardization study
ZHANG Shijun1,QI Dongmei1*,LI Yunlun1,2,NIE Wenting1,ZHU Lijuan1
(1.Shangdong University of TCM,Jinan 250355,China;2.The Hospital Affiliated to Shandong University of TCM,Jinan 250014,China)
Abstract:The methods of TCM Syndrome Standardization Study include the Supervised method and the Unsupervised method.The common Unsupervised methods in the study of TCM syndrome standardization include Multidimensional Scaling,Principal Components Analysis,Factor Analysis,Clustering Analysis,Association Rule,Latent Structure Models,Structural Equation Model and Information Entropy,the explanation of the relationship between the symptoms have a different direction since different unsupervised method based on the different thought and principle,so the different results can reflecting the different problems.During the study of the standardization of TCM syndrome study,there are three aspects need to pay attention:the quality of the data should be strictly controlled,the analysis method should be selected properly and the data results should be refined and interpreted by professional researchers.
Keywords:TCM syndrome standardization;unsupervised methods;classification;application
(收稿日期:2015-06-06)
文章編號(hào):2095-6258(2016)01-0001-05
中圖分類號(hào):R241.2
文獻(xiàn)標(biāo)志碼:A
*通信作者:齊冬梅,女,博士,教授,電話-(0531)89628063,電子信箱-qidm119@163.com
作者簡介:張世君(1988-),女,碩士研究生,主要從事中醫(yī)內(nèi)科學(xué)(中醫(yī)治療心系疾病)研究。
基金項(xiàng)目:國家自然科學(xué)基金“正常高值血壓中醫(yī)證候宏觀量化診斷標(biāo)準(zhǔn)的建立及其代謝機(jī)制”(81373515)。
DOI:10.13463/j.cnki.cczyy.2016.01.001
·學(xué)術(shù)探討·