王元茂+楊松濤
摘要:中醫(yī)證侯規(guī)范化是中醫(yī)向科學化和國際化邁進的先決條件,而證侯與癥狀的關聯(lián)度分析對證侯規(guī)范化具有至關重要的作用。針對證侯及癥狀數(shù)據(jù)量龐大且多呈現(xiàn)非線性復雜結構的特點,通過引入復雜系統(tǒng)中的“信息熵”分劃理論,對三個實際應用案例進行綜合分析,以“證癥”關聯(lián)度作為證侯規(guī)范化的研究重點,對熵分劃在“證癥”關聯(lián)分析中的作用和意義進行了深入探討。
關鍵詞:復雜系統(tǒng);證癥關聯(lián);信息熵
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)27-0229-03
Abstract:Syndrome standardization is prerequisite for the internationalization of Chinese Medicine, meanwhile, the association analysis of syndrome and symptom plays critical role in syndrome standardization. Information in Chinese Medicine usually present complexity and nonlinear, in order to normalize the complicate system, introducing a dividing theory of information entropy by three case studies, analyzed the association of “Syndrome & Symptom” by how information entropy works in this process.
Key words:Complex System; Syndrome&Symptom Association;Information Entropy
中醫(yī)是我國傳統(tǒng)文化的優(yōu)秀組成部分,它以“整體觀念”和“辨證論治”的獨特思想,在醫(yī)學界中產(chǎn)生了深遠影響。中醫(yī)理論博大精深,相對于西醫(yī)單一的“還原論”而言,中醫(yī)思想更具有整體性、動態(tài)性以及建立在辨證論治基礎上的個體化診療方法等特點,受到人們越來越廣泛的關注[1]。在傳統(tǒng)中醫(yī)診療過程中,“證”是立法立方的基礎,醫(yī)者將通過四診收集得到的臨床信息進行綜合分析以用來對證候進行判斷,這種非線性的思維方式使得中醫(yī)相較于西醫(yī)能夠更全面的觀察疾病的發(fā)展和機體的狀態(tài),從而在診斷和治療的思路上更為廣闊。然而,正是由于中醫(yī)的特殊思維模式使其具有復雜性、整體性和不確定性等特點,也導致辨證的過程具有模糊性和不確定性,缺乏客觀的生化指標,阻礙了中醫(yī)與國際醫(yī)學學術接軌的進程。因此,證候的規(guī)范化研究是中醫(yī)學從主觀到客觀,從非線性到線性,從定性到定量研究的重要步驟,是將中醫(yī)診療技術向世界推廣的必經(jīng)途徑。
1 影響中醫(yī)證侯規(guī)范化的要素及本文研究方法
中醫(yī)證侯規(guī)范化包括“癥狀規(guī)范”和“證侯規(guī)范”兩部分,其中四診收集到的“癥狀”、“體征”、“舌脈”等信息是綜合判斷證侯的基礎,因此,癥狀的規(guī)范是證侯規(guī)范的前提,如癥狀名稱以及癥狀程度等。與之相比,證侯規(guī)范包括“證侯分類規(guī)范”、“證侯名稱規(guī)范”以及“證侯診斷標準規(guī)范”三大模塊[2],涉及的研究范圍也相當廣泛。在此過程中,很難寄希望于以一種“萬能”的模型或者算法適用于證侯量化工作的所有模塊或進程。因此,對證侯規(guī)范量化的不同步驟、不同變量、不用關系,應該對應采用適應性強的更具有相對性的方法,使得整個規(guī)范化過程由繁到易、由整到零、各個擊破。通過對證侯規(guī)范化三大模塊進行分析不難發(fā)現(xiàn),每一個模塊都要求將證侯和與其對應的癥狀集進行關聯(lián),通過將較易量化的癥狀變量與較難量化的證侯信息進行聯(lián)結作為證侯量化的引線。如張春和[3]在提及證侯名稱規(guī)范化的研究重點時指出“證侯是疾病發(fā)生過程中某一階段機體對內(nèi)外致病因素的綜合反映,在宏觀上表現(xiàn)為特定的癥狀、體征(舌象、脈象)的有機組合”,以及在討論證侯診斷規(guī)范化時認為“主癥”、“次癥”以及“舌象、脈象”是中醫(yī)證侯構成的三大要素。由此可見,證侯的規(guī)范化離不開癥狀,而中醫(yī)癥狀與證侯是多對多的關系,即多個癥狀組合對應一個證侯,同時多個證侯也可能包含同一個癥狀,加之不同患者的體征體質的不同,使得通過預先設定模型的方式進行證癥關聯(lián)分析變得困難。另外,根據(jù)中醫(yī)對疾病和證侯的關系認識,同一種疾病也可表現(xiàn)為不同的證侯,每一個證侯又可能出現(xiàn)于不同疾病的發(fā)展過程。因此,不同于傳統(tǒng)的線性研究方法,本文將證候以及與之相關的癥狀、體征等數(shù)據(jù)看作離散變量,通過引入復雜系統(tǒng)中的“信息熵”分類方法將中醫(yī)復雜系統(tǒng)看做若干離散的變量,從中研究證侯變量及癥狀變量之間的非線性復雜關系,并結合已有的三例以熵分劃方法為研究方式對具體中醫(yī)病癥證候分析的應用案例,總結出熵分類在研究證癥關系中的作用。
2 信息熵分劃方法
在關于生物、醫(yī)學、人腦等研究領域中,復雜系統(tǒng)是由任意多個子系統(tǒng)組成的具有任意結構的系統(tǒng),其中以“熵”定義的關聯(lián)度是復雜系統(tǒng)的核心概念,同時也是研究中醫(yī)證候復雜系統(tǒng)的子系統(tǒng)相關性的主要衡量度。在我們的世界中,有包括長度、質量、溫度等諸多對客觀事物的度量單位,而“熵”可以看作是信息的一種度量,是隨機變量不確定性的測度。以熵定義復雜系統(tǒng)中子系統(tǒng)間的關聯(lián)度,對于一個復雜系統(tǒng),若將其看做由離散隨機變量構成的離散信息源,并組成了若干子系統(tǒng),則可以將其表示為一個矢量[4]:
S = (S1,S2,…,Si,…,Sp)
其中Si={Sia ,i=1,2,…,p ;a=1,2,…,q}是描述系統(tǒng)特性的變量。我們令Ci(i=1,2,…,p)為Si分類的集合,其中Ci的第a個元素Cia=a,即Ci={1,2,…,a,…,k},k≦q,并令na為Si屬于Ci第a類的數(shù)量,則在S中,Si的熵H(Si)為
H(Si,Sj)為Si與Sj的聯(lián)合熵,nab表示Si屬于Ci的第a類且Sj屬于Cj的第b類的數(shù)量。若S中任意兩個子系統(tǒng),則為Si和Sj之間的關聯(lián)度。在此基礎上,西廣成[5]又提出了對于復雜系統(tǒng)分劃要求的最低準則:
并引入關聯(lián)度系數(shù)從而消除Si與Sj的分類數(shù)或量級對于的影響,取值0和1之間。結合關聯(lián)度矩陣畫出信息連通圖,通過寬度正比于的有向線,將大的Si和Sj進行連線,從而得關聯(lián)度較高的變量集,即關聯(lián)度較高的子系統(tǒng)。依照該方法將原系統(tǒng)S進行處理,使原本離散的變量通過關聯(lián)度相互之間產(chǎn)生了聯(lián)系并形成一個子系統(tǒng),子系統(tǒng)與子系統(tǒng)間繼續(xù)進行關聯(lián)度測算,得出子系統(tǒng)間的關聯(lián)分析,最后以此為依據(jù)分劃整個復雜系統(tǒng)S。
3熵分劃方法在證癥關聯(lián)分析中的應用
在中醫(yī)證侯數(shù)據(jù)系統(tǒng)中,“證”與“癥”數(shù)據(jù)離散混雜在一起,若采用信息熵分劃算法應用其中,則無需提前設計分劃模型,只需計算各數(shù)據(jù)變量Xi的H(Xi)以及H(Xi,Xj),其中(i,j=1,2...n),通過關聯(lián)程度形成對應子系統(tǒng),如某個癥狀集S1,以此為基礎對應分析與其關聯(lián)度最高的另一個子系統(tǒng),如某個證侯或兼證集Sj,從而可以得到癥狀與證侯的關聯(lián)。本章將以此為研究方向,對三例已有研究成果進行分析,并最終討論熵分劃方法在證癥關聯(lián)分析中的作用。
3.1 熵分劃方法在抑郁癥癥狀與證侯關聯(lián)分析中的應用
西廣成[6]等在熵分劃算法的基礎上,采用分級定量的方法,對604例采集到的抑郁癥病例進行癥狀關聯(lián)分析實驗。在該實驗中,共收集癥狀變量100個,包括精神癥狀如“悲觀”、“膽怯易驚”等18個,軀體癥狀如“手足心熱”、“自汗”、“烘熱”等52個,舌象癥狀如“白苔”、“少苔”等19個和脈象癥狀如“脈浮”等11個。通過綜合分析,對抑郁癥數(shù)據(jù)中的兩個癥狀變量進行關聯(lián)度系數(shù)的運算,得到兩兩癥狀間的關聯(lián)度系數(shù)矩陣。以自汗、烘熱癥狀為例,得出自汗癥狀屬于烘熱癥狀的關聯(lián)集合且關聯(lián)度排位第二,同樣烘熱癥狀也排在自汗癥狀的關聯(lián)集合第三位。根據(jù)N級變量的進一步分析,發(fā)現(xiàn)手足心熱癥狀同自汗及烘熱癥狀關聯(lián)度也很高,從而認定這三類癥狀是抑郁癥癥狀系統(tǒng)的一個有效分劃,并屬于證侯中的熱證。依照該模式,將所分劃的大部分集合對應連線至中醫(yī)證侯中的相關證,從而將分劃結果與中醫(yī)理論的辯證意義聯(lián)系起來。
3.2 熵分劃方法在慢性腎功能衰竭癥狀與證侯關聯(lián)分析中的應用
王天芳[7]等人在研究慢性腎功能衰竭“證癥”關聯(lián)分析時同樣采用信息熵關聯(lián)度系數(shù)法,從證侯要素入手對提取的患者四診癥狀進行分析。在該研究中,共選取病例樣本601例,涉及“乏力”、“胸悶”、“腰膝酸軟”等16個癥狀變量,采取兩兩變量及多變量之間的關聯(lián)度系數(shù)的大小比較,將關聯(lián)度程度最高的變量聚成一個集合,從而得出關于慢性腎功能衰竭癥狀的簇集并對應至相關的病位及可能所屬的證侯。例如癥狀:“胃寒”、“乏力”、“腰膝酸軟”,病位:“腎”,病性:陽虛,可能的證侯:“腎陽虛證”,并以此將數(shù)據(jù)集中的癥狀與證侯進行分類。
3.3 熵分劃方法在血瘀證癥狀體征規(guī)范化中的研究
王階[8]等人將中醫(yī)診斷與復雜系統(tǒng)熵分劃算法相結合,以血瘀證為研究對象,通過探索復雜算法研究中醫(yī)證侯診斷的新思路,提升中醫(yī)診斷方法的客觀性和規(guī)范性。在本研究中,共提取血瘀證460例,疾病分類有“心絞痛”、“類風濕”、“腦梗死”、“肝硬化”、“月經(jīng)病”等5類常見病,血瘀兼型有“氣虛血瘀”、“氣滯血瘀”、“陰虛血瘀”和“痰濁血瘀”4型。通過對癥狀與血瘀兼證證型的關聯(lián)度數(shù)據(jù)統(tǒng)計,發(fā)現(xiàn)氣虛血瘀癥狀的總體貢獻度要明顯高于其他3類血瘀兼型,氣虛證的貢獻度也大于其他三類亞型,因此判斷氣虛證是伴隨血瘀證的主要證侯,在臨床用藥治療血瘀證的同時,可以適當添加補氣藥會提高療效。另外,不同的血瘀兼證有各自的特點,也有公共的病癥和體征,然而即使如“舌質紫暗”此類公共癥狀,在各自不同的血瘀部位所占的權重也不同。因此,在治療過程中需注意不同部位血瘀證的不同癥狀,從而針對性的用藥治療。此研究不僅發(fā)現(xiàn)了證候與癥狀的關聯(lián)度,同時將疾病、部位、以及兼證證型作為子系統(tǒng)進行熵分劃研究,使得熵分劃方法在證侯規(guī)范化研究中的應用更加全面,也進一步驗證了熵分劃在面對多維離散數(shù)據(jù)時的分劃準確度。
3.4 研究結果
數(shù)據(jù)挖掘與中醫(yī)藥結合是近年來的研究熱門,在一般的數(shù)據(jù)挖掘辦法中,一個變量往往只能隸屬于一個變量集,反映到證侯變量中即一個中醫(yī)臨床癥狀只能屬于一組癥狀群,通過證侯與癥狀群的聯(lián)系,這就意味著一個癥狀只可以對應一個可能的證侯。中醫(yī)證侯與癥狀以及體征之間不是簡單的一對一關系,而是一種多對多,集合對集合的非線性關系。在這種情況下,引入信息熵分劃方法可以有效地分析疾病、證侯、癥狀之間的復雜關系,原因在于使用該方法對原系統(tǒng)進行的劃分是完全按照離散變量之間的關聯(lián)度系數(shù)大小劃分,沒有固定的線性公式,分劃算法與數(shù)據(jù)的適應性良好。如案例一中將三種癥狀變量通過熵關聯(lián)度分析集合為某一個癥狀集(子系統(tǒng)),并通過癥狀集和對應聯(lián)結度較高的證侯系統(tǒng)進行比較,得到關聯(lián)度較高的證侯集,從而達到癥狀與證侯的多對多關聯(lián)比對;在案例二中,通過多變量間的關聯(lián)度分析,不僅得到了癥狀與證侯的關聯(lián)度分析,同時在熵分劃過程中產(chǎn)生了表示病位的子系統(tǒng),并得到了該系統(tǒng)與證侯間的關系;案例三則將兼證作為新的子系統(tǒng)加入分析,通過提取貢獻度最高的子系統(tǒng),發(fā)現(xiàn)氣虛證是伴隨血瘀證的主要證侯,從而達到證侯與證侯之間的關聯(lián)分析,使臨床用藥治療更加全面。
4 結束語
綜上所述,如圖1左所示,在信息離散度和復雜度較高的中醫(yī)證侯系統(tǒng)中,癥狀變量與證侯信息混雜在一起,而熵分劃的作用是將左圖的離散轉化成右圖的關聯(lián),即將癥狀變量通過關聯(lián)度集合成多個癥狀集合,并將癥狀集合與關聯(lián)度較高的證侯要素進行聯(lián)結。在疾病發(fā)展的不同階段,以及患者體質的不同,同一個證侯可能對應不同的癥狀集,而同一個癥狀集又可能是不同的證侯的癥狀集的一部分,另外根據(jù)原始數(shù)據(jù)集信息維度的不同,通過熵分劃也可分劃出如病位、體征等不同的子系統(tǒng),使之與病癥和證侯相互作用,進一步精確某種證侯所包含的量化要素,為中醫(yī)證侯的規(guī)范化起到至關重要的作用。
參考文獻:
[1] 鐘濤.基于復雜系統(tǒng)方法的慢性胃炎中醫(yī)問診證侯建模研究[D].上海:華東理工大學,2014.
[2] 李方玲,梁嶸.對中醫(yī)證侯規(guī)范化研究的探討[J].遼寧中醫(yī)雜志,2006,33(4):386-387.
[3] 張春和.證侯研究規(guī)范化與中醫(yī)全球化[J].云南中醫(yī)學院學報,2011,24(5):4-7.
[4] Pal N, Pal S. Object-background segmentation using new definitions of entropy.IEEE proceedings on Computers and Digital Techniques,1989,136(4):284-295.
[5] 西廣成.復雜系統(tǒng)分劃的熵方法[J].自動化學報,1987,13(3):216-220.
[6] 西廣成.復雜系統(tǒng)方法學與中醫(yī)證侯建模[M].北京:科學出版社,2010:91-95
[7] 王天芳,吳秀艷,陳建新,等.基于信息熵關聯(lián)度系數(shù)法的證侯要素提取研[J].天津中醫(yī)藥,2009,26(4):274-276.
[8] 王階,李海霞,孫占全,等.基于復雜算法的中醫(yī)證侯研究[J].北京中醫(yī)藥大學學報,2006,29(9):581-585.