陳桂芬(福建中醫(yī)藥大學(xué)管理學(xué)院,福建 福州 350122)
周常恩(福建中醫(yī)藥大學(xué)中醫(yī)學(xué)院,福建 福州 350122)
李德森(福建中醫(yī)藥大學(xué)藥學(xué)院,福建 福州 350122)
《千金方》是中國(guó)唐朝孫思邈的臨床醫(yī)學(xué)著作,記載了大量的中醫(yī)養(yǎng)生方劑。作為中國(guó)最早臨床醫(yī)學(xué)百科全書,擁有豐富的中藥信息資源,一直為中醫(yī)界所推崇。雖然有學(xué)者對(duì)《千金方》養(yǎng)生規(guī)律進(jìn)行研究,但目前還沒有利用現(xiàn)代信息技術(shù)篩選整理養(yǎng)生方劑的成果報(bào)道。數(shù)據(jù)挖掘是近些年隨著數(shù)據(jù)庫(kù)和人工智能發(fā)展起來的一門新興技術(shù),是從大量數(shù)據(jù)中發(fā)現(xiàn)有效的、新穎的、潛在有用并且最終可理解的知識(shí)的過程。通過篩選整理養(yǎng)生方劑、構(gòu)建數(shù)據(jù)庫(kù)、運(yùn)用數(shù)據(jù)挖掘方法,可以發(fā)現(xiàn)《千金方》中養(yǎng)生方劑配伍規(guī)律。
本研究篩選整理《千金方》[1]中629首養(yǎng)生方劑,用藥總頻數(shù)達(dá)2157次,涉及中藥共300味。在此基礎(chǔ)上構(gòu)建包含藥物、方名、主治組成等字段的方劑數(shù)據(jù)庫(kù),分別作藥物頻數(shù)分析、用藥關(guān)聯(lián)規(guī)則和分類關(guān)聯(lián)規(guī)則挖掘等研究。本文利用數(shù)據(jù)挖掘方法從多角度探討?zhàn)B生方用藥規(guī)律,最后經(jīng)關(guān)聯(lián)規(guī)則挖掘后給出了所發(fā)現(xiàn)的養(yǎng)生方常用藥對(duì)和藥組。
關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系,從大量事務(wù)記錄中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,幫助我們更好地分析事務(wù)。
在關(guān)聯(lián)規(guī)則中,設(shè)I=(I1,I2,…,In)是項(xiàng)的集合。任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫(kù)事務(wù)的集合,其中每個(gè)事務(wù)T是項(xiàng)的集合,T?I。每個(gè)事務(wù)有一個(gè)標(biāo)識(shí)符,稱為TID。設(shè)A是一個(gè)項(xiàng)集,事務(wù)T包含A且僅當(dāng)A?T。關(guān)聯(lián)規(guī)則是形如A?B的蘊(yùn)含式,其中A?I,B?I,A∩B=Φ。規(guī)則A?B在事務(wù)中成立,具有支持度S為:support(A?B)=P(A∪B)。其中P(A∪B)表示A,B同時(shí)出現(xiàn)的概率,既為(A,B同時(shí)出現(xiàn)的次數(shù))/事務(wù)的總數(shù)。包含k個(gè)項(xiàng)的項(xiàng)集稱為k—項(xiàng)集。支持計(jì)數(shù)supportNumber是包含項(xiàng)集的事務(wù)數(shù);滿足最小支持度的項(xiàng)集稱為頻繁項(xiàng)集[2]。
Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法[3]。其核心是基于兩階段頻集思想的遞推算法。該關(guān)聯(lián)規(guī)則在分類上屬于單維、單層、布爾關(guān)聯(lián)規(guī)則。在這里,所有支持度大于最小支持度的項(xiàng)集稱為頻繁項(xiàng)集,簡(jiǎn)稱頻集。該算法的基本思想是:首先找出所有的頻集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣。然后由頻集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿足最小支持度和最小可信度。然后使用第1步找到的頻集產(chǎn)生期望的規(guī)則,產(chǎn)生只包含集合的項(xiàng)的所有規(guī)則,其中每一條規(guī)則的右部只有一項(xiàng),這里采用的是中規(guī)則的定義。一旦這些規(guī)則被生成,那么只有那些大于用戶給定的最小可信度的規(guī)則才被留下來。為了生成所有頻集,使用了遞歸的方法[4]。
基于方證分析的準(zhǔn)確性,首先對(duì)《千金方》中的養(yǎng)生方劑進(jìn)行臟腑分類,分為補(bǔ)肺、補(bǔ)脾、補(bǔ)心、補(bǔ)肝腎四類養(yǎng)生方劑,通過對(duì)中藥性、味進(jìn)行聚類分析共篩選出具有完整組成養(yǎng)生方劑共629首,其中補(bǔ)肺方劑127首、補(bǔ)脾方劑177首、補(bǔ)心方劑119首和補(bǔ)肝腎方劑206首。然后對(duì)挑出的方劑進(jìn)行規(guī)范化處理:依據(jù)《中國(guó)藥典》、《中藥大辭典》和《中華本草》對(duì)所選方劑藥名及功效進(jìn)行處理[5-7]。629首方劑共涉及300味中藥,考察各藥物的出現(xiàn)頻數(shù),刪除藥物支持度小于2%的藥物,僅對(duì)較高支持度藥物做關(guān)聯(lián)規(guī)則挖掘。其次建立補(bǔ)肺、補(bǔ)脾、補(bǔ)心、補(bǔ)肝腎四類養(yǎng)生方劑數(shù)據(jù)倉(cāng)庫(kù)。研究中構(gòu)建了方劑庫(kù)、藥物庫(kù)、主治庫(kù)等,各數(shù)據(jù)庫(kù)依其自身關(guān)聯(lián)建立相應(yīng)數(shù)據(jù)鏈接,同時(shí)應(yīng)用SPSS軟件進(jìn)行中藥的頻數(shù)分析。
在中醫(yī)觀點(diǎn)中,很多癥狀的診斷之間是存在著關(guān)聯(lián)性。而在藥方的搭配上,也同樣存在著很多關(guān)聯(lián)性。以關(guān)聯(lián)規(guī)則為主要算法的數(shù)據(jù)挖掘,是分析中藥關(guān)聯(lián)性的有效方法。關(guān)聯(lián)規(guī)則(R)是形如R:A?B的規(guī)則,滿足A∩B=Φ&sup(R)≥min_sup &conf(R)≥min_conf。其中,A、B為項(xiàng)目(或?qū)傩裕┘?;sup(R)為規(guī)則R的支持度;min_sup為最小支持度閾值;conf(R)為規(guī)則R的置信度;min_conf為最小置信度閾值[8]。規(guī)則R的支持度(support)和置信度(confidence)定義如下:
支持度和置信度是描述關(guān)聯(lián)規(guī)則關(guān)聯(lián)性的兩項(xiàng)重要指標(biāo),支持度反映規(guī)則的普遍性,置信度反映規(guī)則的可靠性,通常選擇支持度和置信度均較高的規(guī)則作為發(fā)現(xiàn)有意義的模式。
其中,“菟絲子 五味子 巴戟天”為規(guī)則前件;“肉蓯蓉”為規(guī)則后件。規(guī)則前件頻數(shù)為菟絲子、五味子、巴戟天三味中藥同時(shí)出現(xiàn)在206首肝腎養(yǎng)生方中的頻數(shù);規(guī)則頻數(shù)指菟絲子、五味子、巴戟天、肉蓯蓉四味中藥同時(shí)出現(xiàn)在206首肝腎養(yǎng)生方中的頻數(shù)。因206首肝腎養(yǎng)生方中有32首方劑同時(shí)出現(xiàn)菟絲子、五味子、巴戟天、肉蓯蓉四味中藥,故規(guī)則(3)的支持度為0.1553;因32首同時(shí)出現(xiàn)菟絲子、五味子、巴戟天三味中藥的肝腎養(yǎng)生方中有32首方劑同時(shí)出現(xiàn)肉蓯蓉這味藥,故規(guī)則(3)的置信度為1。
本研究運(yùn)用挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的Apriori算法建立關(guān)聯(lián)關(guān)系研究中藥配伍規(guī)律,經(jīng)C++編程實(shí)現(xiàn),最小支持度閾值取10%,最小置信度閾值取60%。
2.3.1 頻數(shù)分析結(jié)果 見表1~4。
表1 高頻補(bǔ)肺中藥
表3 高頻補(bǔ)心中藥
表2 高頻補(bǔ)脾中藥
表4 高頻補(bǔ)肝腎中藥
2.3.2 數(shù)據(jù)挖掘結(jié)果 見表5~8。
表5 補(bǔ)肺中藥配伍規(guī)則集
表6 補(bǔ)脾中藥配伍規(guī)則集
補(bǔ)肺藥中如表1所示出現(xiàn)頻次最高的是:溫里、益氣、收斂、養(yǎng)陰、止咳平喘藥,如表5所示補(bǔ)肺藥的規(guī)則集中出現(xiàn)最多的是五味子、桂心、干姜、人參配伍。如《素問·咳論篇》中提到“其寒飲食入胃,從肺脈上至于肺,則肺寒,肺寒則內(nèi)外合邪,因而客之,則為肺咳”,“五臟六腑皆令人咳,非獨(dú)肺也”。從挖掘結(jié)果說明,《千金方》在補(bǔ)肺方劑中重視如下方面:①溫中散寒,溫肺化飲,如五味子、桂心配伍;五味子、干姜配伍;細(xì)辛、桂心、干姜、附子配伍。②益氣健脾而間接達(dá)到補(bǔ)肺效果,即培土生金法,體現(xiàn)在配伍中加入人參、茯苓、大棗、甘草、桂心;③養(yǎng)陰益肺,如人參、麥冬、五味子配伍。
補(bǔ)脾藥中如表2所示出現(xiàn)頻次最高的是:溫里、益氣藥,部分有清熱燥濕藥物。如表6所示補(bǔ)脾藥的規(guī)則集中出現(xiàn)最多的是附子、干姜、桂心、人參配伍,說明《千金方》注重溫陽健脾,上能溫心陽,下能補(bǔ)命火,中暖脾土而散寒。人參、茯苓配伍,桂心、人參配伍,人參、附子配伍,白術(shù)、干姜配伍,體現(xiàn)《千金方》重視益氣健脾溫中。黃連、干姜配伍,出自《傷寒論》,辛開苦降,主治因寒熱互結(jié)而致心下痞滿疼痛癥。
表7 補(bǔ)心中藥配伍規(guī)則集
表8 補(bǔ)肝腎中藥配伍規(guī)則集
補(bǔ)心藥中如表3所示出現(xiàn)頻次最高的是:溫中、益氣、養(yǎng)血、化痰安神藥,如表7所示補(bǔ)心藥的規(guī)則集中出現(xiàn)最多的是人參、茯苓、甘草、干姜、桂心之間配伍。心臟的主要功能是:主血脈、主神志。如《素問·靈蘭秘典論》中提到“心者,君主之官,神明出焉。”體現(xiàn)心臟的重要性?!肚Ы鸱健分腥藚ⅰ④蜍?、甘草、干姜、桂心、麥冬這些藥物的配伍,旨在達(dá)到溫中益氣、養(yǎng)血,使氣血生化有源,心的氣血充足,運(yùn)行順暢,則神有所養(yǎng),五臟六腑精氣皆能充盈的功效。遠(yuǎn)志、人參配伍,益氣化痰安神,神養(yǎng)痰化則神志清明,心神充足則能統(tǒng)御精與氣。
在補(bǔ)肝腎藥中如表4所示出現(xiàn)頻次最高的是:溫陽、養(yǎng)陰、溫中、益氣藥。在《素問·陰陽應(yīng)象大論》提到“腎生骨髓,髓生肝”。在傳統(tǒng)中醫(yī)理論中肝藏血,腎藏精,精血同生,肝腎同源。臨床上肝與腎虛實(shí)密切相關(guān),相互制約,治療上多兼顧二臟。如《千金要方》指出下焦病的治療應(yīng)“熱則瀉于肝,寒則補(bǔ)于腎”。如表8所示補(bǔ)肝腎的規(guī)則集中巴戟天、肉蓯蓉、菟絲子為基本配伍,體現(xiàn)《千金方》重視溫補(bǔ)肝腎。在藥物配伍中加上山茱萸既能益精,又可助陽,能增加其補(bǔ)益肝腎作用;加上石斛則平胃氣而補(bǔ)腎虛,養(yǎng)陰清熱;加上當(dāng)歸、干地黃則補(bǔ)血養(yǎng)肝,益精填髓;加上五味子、人參、甘草則大補(bǔ)元?dú)?,又有補(bǔ)腎寧心之功。桂心、附子、白術(shù)、人參、茯苓等配伍,重在使氣血生化有源,后天補(bǔ)先天。
綜合以上補(bǔ)肺、脾、心、肝、腎藥物,出現(xiàn)頻次最高的為桂心、人參、甘草和茯苓。在《神農(nóng)本草經(jīng)》中這四味藥均列為上品,且均能久服輕身延年,各自藥性介紹如下。牡桂(一名桂心):味辛溫,主上氣咳逆,結(jié)氣喉痹,利關(guān)節(jié),補(bǔ)中益氣;人參:主補(bǔ)五臟,安精神,定魂魄,止驚悸,除邪氣,明目,開心益智;甘草:主五臟六腑寒熱邪氣,堅(jiān)筋骨,長(zhǎng)肌肉,倍力,金創(chuàng),解毒;茯苓:主胸脅逆氣,憂恚,驚邪,恐悸,心下結(jié)痛,寒熱煩滿,咳逆,口焦舌干,利小便。這四味藥配伍重在健脾養(yǎng)心,補(bǔ)中益氣。如《素問·玉機(jī)真臟論》提到“脾脈者土也,孤臟以溉四傍者也。”體現(xiàn)《千金方》重視補(bǔ)脾土。如《素問·太陰陽明論》提到“四肢皆稟氣于胃而不得至經(jīng),必因于脾乃得稟也”。意思為五臟六腑不能得到脾的運(yùn)化水液之精微充養(yǎng),則人體臟腑氣血就虧虛,心、肝、肺、腎后天乏源必欠滋養(yǎng)而致虛損。因此,從《千金方》補(bǔ)五臟藥中這四味藥配伍出現(xiàn)的概率最高可以看出,孫氏重視補(bǔ)脾,脾不足,百病乃因之變化而生,補(bǔ)五臟應(yīng)重視健脾。
基于關(guān)聯(lián)規(guī)則挖掘技術(shù)分析《千金方》中養(yǎng)生方劑配伍規(guī)律,揭示方劑與中藥(包括食物)交叉錯(cuò)綜關(guān)聯(lián)與對(duì)應(yīng)的模式性和規(guī)律性,發(fā)現(xiàn)中醫(yī)養(yǎng)生規(guī)律知識(shí)、學(xué)術(shù)思想,不僅對(duì)豐富和發(fā)展養(yǎng)生方劑學(xué)理論具有重要的意義,同時(shí)也為有效指導(dǎo)臨床遣藥組方和中藥養(yǎng)生新藥的研發(fā)提供重要依據(jù)。
[1]高文柱.藥王千金方[M].北京:華夏出版社,2004.
[2]Oladipupo OO,Oyelade OJ.Knowledge Discovery from Students’Result Repository:Association Rule Mining Approach[J].International Journal of Computer Science and Security,2010,4(2):199-207.
[3]Wilhelmiina H?m?l?inen.StatApriori:an efficient algorithm for searching statistically significant association rules[J].Knowledge and Information Systems,2010,23(3):373-399.
[4]Sandeep Singh Rawat,Lakshmi Rajamani.Discovering Rare Association Rules Using Probability Apriori in Grid Environments[J].Advances in Intelligent and Soft Computing,2012 ,131:527-539.
[5]中國(guó)藥典委員會(huì).中華人民共和國(guó)藥典[M].北京:電子工業(yè)出版社,2009.
[6]江蘇新醫(yī)學(xué)院.中藥大辭典[M].上海:上??茖W(xué)技術(shù)出版社,2002.
[7]國(guó)家中醫(yī)藥管理局《中華本草》編委會(huì).中華本草[M].上海:上??茖W(xué)技術(shù)出版社,1999.
[8]Somboon Anekritmongkol,ML.Kulthon KasamsanBoolean Algebra and Compression Technique for Association Rule Mining[J].Advanced Data Mining and Applications,2010,6441:150-157.