• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘的中醫(yī)處方分析方法研究進展

      2022-03-23 15:59:16王俊宏
      世界中醫(yī)藥 2022年23期
      關鍵詞:數(shù)據(jù)挖掘關聯(lián)處方

      馮 梅 王 穎 柏 冬,2 王俊宏

      (1 陜西中醫(yī)藥大學基礎醫(yī)學院,咸陽,712046;2 中國中醫(yī)科學院中醫(yī)基礎理論研究所,北京,100700;3 北京中醫(yī)藥大學東直門醫(yī)院,北京,100700)

      處方是應用于中醫(yī)臨床診療的主要形式和方法。對方劑的組方規(guī)律、配伍規(guī)律進行探索和總結,是對名老中醫(yī)經驗的總結和傳承,疾病的預防和治療,臨床給藥的關鍵性舉措[1]。處方分析旨在運用現(xiàn)代科學技術從浩如煙海的方劑中進行分析并挖掘其具有潛在價值的信息,找到潛在的用藥規(guī)律、處方配伍規(guī)律、名老中醫(yī)診療用藥特點等信息,以期對臨床診療、臨床給藥以及新藥的研發(fā)提供新的思路和途徑。通過對名老中醫(yī)學術經驗和處方配伍規(guī)律等進行總結分析,有利于豐富中醫(yī)藥理論體系,推動中醫(yī)藥學術的進展,是實現(xiàn)中醫(yī)藥傳承的客觀要求[2]。處方的分析對新藥的研發(fā)起著重要作用,而且有效的處方分析可以降低新藥的開發(fā)風險、揭示核心藥物群、闡明藥物之間的關系、總結不同證型用藥規(guī)則,為相關治療提供依據(jù)[3]。

      中醫(yī)辨證論治的思維決定了其臨床用藥具有明顯的個體化特點,且中醫(yī)學本身具有很強的主觀性和復雜性,在一定程度上缺乏客觀、定量的標準。中醫(yī)通過望、聞、問、切4種診斷方法共同參與來獲取有用信息并進行診斷,在治療上強調“辨證施治”。數(shù)據(jù)挖掘技術可以有效地分析中醫(yī)臨床用藥規(guī)律和潛在作用機制[5],很好地總結中醫(yī)治療中的共性規(guī)律,為臨床治療疾病提供客觀依據(jù)[6]。

      1 數(shù)據(jù)挖掘技術

      數(shù)據(jù)挖掘技術是從大量隨機、模糊且不完整的數(shù)據(jù)中提取的有潛在價值的信息,進而完成對中醫(yī)藥關鍵信息的提取和整合,實現(xiàn)對處方用藥規(guī)律的研究分析[7-9]。目前主要應用于中醫(yī)領域的挖掘方法有:關聯(lián)分析、聚類分析、因子分析、遺傳算法、人工神經網絡、復雜網絡等方法,可對中醫(yī)藥治療某一疾病的證型、配伍規(guī)律進行分析,為疾病的臨床治療提供方法和思路[10-11]。數(shù)據(jù)挖掘對檢索到的數(shù)據(jù)進行深入分析,能揭示不同數(shù)據(jù)之間隱含的關系,發(fā)現(xiàn)未知的規(guī)律或模式,為中醫(yī)相關領域的發(fā)展提供指導和幫助。因其能夠解決復雜的、非線性的問題,揭示中藥治療疾病過程中的特點及規(guī)律,故在中醫(yī)臨床分析中得到廣泛應用。

      1.1 關聯(lián)規(guī)則分析 關聯(lián)規(guī)則是從數(shù)據(jù)庫中挖掘項與項之間隱藏的關聯(lián)關系[12-13]。購物籃分析是其最經典的應用。通過分析顧客所購買物品之間的聯(lián)系,了解顧客購買物品的習慣及頻率,從而制定出具有引導性的營銷策略[14]。目前關聯(lián)規(guī)則的常用算法有Apriori和FP-growth等算法,可應用于探究配伍規(guī)律、用藥規(guī)律和名老中醫(yī)醫(yī)案挖掘等方面[15]。由于目前的數(shù)據(jù)庫只能提供檢索、統(tǒng)計等服務,不能深入探析其包含的大量隱藏規(guī)則[16],故通過關聯(lián)規(guī)則對相關數(shù)據(jù)進行分析,可得到治療某疾病不同證型的常用藥對或藥物配伍規(guī)律及他們之間的潛在聯(lián)系,總結出治療該疾病的基本用藥規(guī)律及核心處方[17]。例如,卓小媛等[18]利用關聯(lián)規(guī)則分析中醫(yī)藥治療冠心病支架術后的用藥規(guī)律,通過對治療該病的藥物組合進行挖掘分析,發(fā)現(xiàn)最常用的活血化瘀類藥、補氣理氣類藥物與冠心病術后多寒多瘀的病證相吻合。董琳等[19]基于該算法對含黃芪的方劑進行研究,得到黃芪的主要組方應用規(guī)律以活血補氣、托毒生肌為主。

      1.2 聚類分析 聚類分析是按照各數(shù)據(jù)在性質上的親疏程度進行自動分組、分門別類的一個過程,使同一類中的對象之間有很大的相似性,而不同類別之間存在很大的差異性[20]。將中醫(yī)所研究事物的集合進行分類,按照個體的相似性將大數(shù)據(jù)庫中記錄的數(shù)據(jù)分化為若干系列,使其各自成為有意義的部分[21]。例如通過探討藥物的藥性、藥味、歸經等之間的相似性,從而明確疾病的根本病因、病位等信息。目前主要用于中醫(yī)的聚類方法有分層聚類和K-means聚類等,通過對疾病治法方藥、病因、病機、證候等方面的規(guī)律性探究,以實現(xiàn)對中醫(yī)診療經驗的挖掘[22]。例如,唐雪純等[23]運用統(tǒng)計分析、聚類分析等方法,分析當代著名醫(yī)家在治療斑禿的處方用藥規(guī)律,得到了藥物的使用頻次、性味、歸經、主治等方面的信息,從而推斷出該病的根本病因、核心病位及主要病機,進而獲得了治療該病的用藥處方規(guī)律。馬金輝等[24]在用聚類算法分析人工流產術后用藥的特點時,總結出名老中醫(yī)治療此病的用藥特點以調理肝腎為主,藥物組方以四物湯為基礎加減化裁。

      1.3 因子分析 因子分析的目的在于實現(xiàn)降維[25],即用幾個少數(shù)因子去描述許多因素之間的聯(lián)系,根據(jù)數(shù)據(jù)之間的相關性,將聯(lián)系密切的幾個變量歸為一類,每一類變量用一個因子表示。在進行因子分析之前需要對數(shù)據(jù)進行KMO和Bartlett檢驗,看是否滿足因子分析的條件[26]。通過因子分析得到幾種藥物都同歸于某一類藥物中,以發(fā)現(xiàn)臨床用藥規(guī)律,并可對疾病的癥狀、用藥特點和規(guī)律進行研究[27]。例如,莫朵朵等[28]對中醫(yī)藥治療大腸癌的方劑用藥進行藥物因子分析,得到不同因子下的中藥對大腸癌具有不同的作用方式,明確了在大腸癌的治療過程中治氣的關鍵性。石慧生等[29]基于該算法分析全膝關節(jié)置換術后中醫(yī)證候的分布規(guī)律中得出此病以本虛為主,兼有瘀證。

      1.4 人工神經網絡 人工神經網絡對于復雜系統(tǒng)和非線性數(shù)據(jù)具有很強的分析能力[30]。該系統(tǒng)可以按不同的連接方式組成不同的網絡,并能根據(jù)現(xiàn)有信息主動更改并完善自身結構[31]。目前,常用于中醫(yī)研究的人工神經網絡有反向傳播神經網絡、徑向基神經網絡、模糊神經網絡等。由于中醫(yī)藥領域數(shù)據(jù)龐大、結構復雜、非線性等特點突出,而人工神經網絡所具有的自學習、自組織、并行分布式處理、容錯性良好等優(yōu)點,在處理多樣性、模糊性等特點的數(shù)據(jù)方面有更好的效果[32]。利用人工神經網絡對方劑中藥物不同劑量和藥味作用于受體的不同反應可以找到最適配伍規(guī)律[33],被廣泛應用于中醫(yī)證候的研究、中藥學研究以及中醫(yī)診斷的各個層面。例如,吳純偉等[34]在研究腦脈通治療缺血性腦中風藥物配伍過程中,通過人工神經網絡對實驗數(shù)據(jù)的模擬預測,最終得出了治療該疾病的最優(yōu)組分配伍藥物。宮文浩等[35]在利用該算法建立小兒肺炎痰熱閉肺證診斷模型,明確了此證型的病機為“痰”“熱”,診斷要素為痰多黏稠、痰色黃、脈滑等。

      1.5 復雜網絡分析 復雜網絡是由大量結點和結點之間的關系所組成的大型網絡結構圖,通過網絡建模的形式研究復雜現(xiàn)象,描述復雜系統(tǒng)各要素之間關系的一種方法[36-37]。復雜網絡用于中醫(yī)核心處方、核心藥物、證型規(guī)律等的數(shù)控挖掘,可以更清楚、直觀地發(fā)現(xiàn)隱藏在大數(shù)據(jù)之下的規(guī)律性特征[38]。根據(jù)處方配伍網絡中的節(jié)點度和節(jié)點配伍的權重分布,發(fā)現(xiàn)處方配伍過程中存在無標度的復雜網絡現(xiàn)象,可以找到處方配伍網絡的核心節(jié)點及其相容性[39]。例如,何美瑩等[40]用復雜網絡分析系統(tǒng)性紅斑狼瘡陰虛證,構建對SLE陰虛證臨床癥狀與用藥的復雜網絡,分析網絡結構的節(jié)點度及權重值的大小進而分析其核心癥狀、方劑、配伍規(guī)則和方藥特點,得到治療該病的常用方劑、核心藥物和核心癥狀等相關信息。宋石林等[41]則利用該算法挖掘出名中醫(yī)治療泄瀉的核心藥味有白術、甘草、茯苓、木香、白芍、陳皮及此病的病機以脾虛濕盛為主。

      1.6 遺傳算法 遺傳算法作為一種隨機搜索算法,它為解決復雜的系統(tǒng)優(yōu)化問題提供了一種通用格式,能夠解決傳統(tǒng)搜索算法難以解決的復雜非線性優(yōu)化問題[42]。一些數(shù)據(jù)挖掘技術的挖掘結果與療效缺少相關性,在處方篩選求解復雜的組合優(yōu)化問題時,基于遺傳算法的相關規(guī)則通常能快速得到更好的優(yōu)化結果。以基于遺傳算法的正相關關聯(lián)規(guī)則的挖掘方法為例,它運用其自適應尋優(yōu)和智能搜索技術進行數(shù)據(jù)的搜索、規(guī)則的評價和選取過程,進而得到最優(yōu)規(guī)則,與傳統(tǒng)挖掘相比更能體現(xiàn)數(shù)據(jù)挖掘的個體化特征。此方法可以有效發(fā)現(xiàn)名老中醫(yī)治療疾病處方的用藥特點,為名老中醫(yī)經驗的總結與傳承提供了很大的幫助[43]。如李嘉旗等[44]在探討中醫(yī)藥治療肺癌的處方規(guī)律時,利用遺傳算法獲得4張有效處方,并且4號處方在動物實驗中初步驗證了療效。

      2 常用軟件平臺

      可靠的平臺軟件是開展中醫(yī)藥數(shù)據(jù)挖掘研究的先決條件。目前常用的平臺有:古今醫(yī)案云平臺、中醫(yī)傳承輔助系統(tǒng)軟件等;常用的軟件有:CiteSpace軟件、中醫(yī)藥關聯(lián)規(guī)則挖掘軟件、SPSS(Clementine/Modeler)、SQL Server(Analysis Services)、SAS、Matlab和Weka等[45]。此類軟件集合了數(shù)理統(tǒng)計和文本挖掘、關聯(lián)規(guī)則、復雜系統(tǒng)熵聚類等數(shù)據(jù)挖掘技術,通過對數(shù)據(jù)錄入、管理、查詢、分析和網絡可視化展示等功能[46],以實現(xiàn)對疾病、證候、方劑等相關數(shù)據(jù)的深層次挖掘,實現(xiàn)一站式服務。

      2.1 中醫(yī)傳承輔助系統(tǒng)軟件 中醫(yī)傳承輔助系統(tǒng)是依附于人工智能、數(shù)據(jù)挖掘等方法和技術,根據(jù)中醫(yī)藥繼承、發(fā)展和創(chuàng)新的核心需求,分別構建相關功能模塊,很好地解決了中醫(yī)藥在傳承過程中的不規(guī)范和個性化問題[47-48]。該系統(tǒng)豐富了中醫(yī)藥的傳承模式,有效地滿足了中醫(yī)藥傳承與發(fā)展的需要,對挖掘名醫(yī)用藥規(guī)律和理論思想具有較高的參考價值和臨床指導意義[49]。目前主要應用于對名老中醫(yī)經驗的總結、文獻醫(yī)案的整理與分析、疾病的用藥規(guī)律以及新藥的研發(fā)等方面[50]。例如在探討王俊宏治療兒童多動癥又稱注意力缺陷多動癥的用藥規(guī)律中,基于中醫(yī)傳承輔助平臺將收集到的處方進行藥物間和藥物核心組合分析,結果得到13個核心組合和6首新處方,可提高臨床用藥療效[51]。

      2.2 古今醫(yī)案云平臺 古今醫(yī)案云平臺是中國醫(yī)學科學院中醫(yī)信息研究所在數(shù)十年病案研究和數(shù)據(jù)積累的基礎上,應用大數(shù)據(jù)、云計算等智能技術,為名醫(yī)傳承和經驗總結提供的科學、智能、高效、便捷的工具。該平臺為30萬份古今病歷和4 000名名醫(yī)提供檢索和信息獲取服務,提供多種病案采集模式,如多表單結構化錄入、批量病案自動導入、語音錄入等,為工作組提供病案分類管理和數(shù)據(jù)共享服務。它集成各種數(shù)據(jù)挖掘算法,如關聯(lián)規(guī)則分析、聚類分析等[52],設計了9個分析模塊,為臨床需求提供一站式數(shù)據(jù)挖掘服務。例如,王依等[53]基于古今醫(yī)案云平臺將李軍祥教授治療潰瘍性結腸炎的處方進行標準化處理后,通過分析藥物的性味、歸經、使用頻率等相關信息明確了李教授治療該病的核心思路。

      2.3 CiteSpace CiteSpace是基于大量文獻數(shù)據(jù)對其進行分析處理,并通過相關工具繪制成信息可視圖、表的一款引文可視化分析軟件,它可以很好地反應某一階段某領域的研究熱點、前言主題和發(fā)展趨勢等信息[54]。例如,張小寧等[55]通過該軟件對中醫(yī)藥治療膝關節(jié)炎相關研究文獻的可視化分析中,對文獻作者、機構、關鍵詞等信息進行共現(xiàn)分析、聚類分析以及凸顯性分析分別得到了該領域的治療熱點集中在針灸和中藥熏蒸、熱敷等,研究熱點體現(xiàn)在白細胞介素1β、臭氧、膝關節(jié)功能等。阮蓓蓓等[56]通過該軟件對金匱腎氣丸相關文獻進行可視化分析,得到了當前臨床研究的熱點以中西醫(yī)結合治療糖尿病、骨質疏松等為主,實驗研究熱點以抗氧化、抗衰老為主。

      3 討論

      在信息數(shù)字化時代,各種處方分析方法層出不窮,如頻數(shù)分析、關聯(lián)規(guī)則分析、決策樹分析、多維度挖掘與分析等均可對名老中醫(yī)的臨床經驗、用藥規(guī)則、學術思維進行多方面、多角度的分析研究,這些挖掘方法正被逐步應用于中醫(yī)藥的研究工作中[57-58]。目前處方篩選主要是以計算機軟件分析為主,輔以計算頻率和關聯(lián)規(guī)則或復雜系統(tǒng)熵聚類,構建藥物關系網絡進行處方篩選和挖掘。但由于數(shù)字化的計算方法仍無法與臨床醫(yī)療實踐中醫(yī)師的辨證處方思路相結合,故在分析關鍵的處方篩選方面仍存在不足。一方面,數(shù)據(jù)挖掘技術適用于從大量數(shù)據(jù)中挖掘共性規(guī)律,其研究結果往往與中醫(yī)普適性理論吻合,而對發(fā)掘中醫(yī)藥個體化診療規(guī)律作用有限。另一方面,一些發(fā)病率不高的疾病較難從文獻中獲得全面的信息,因此數(shù)據(jù)挖掘技術不能適用于此類信息的分析與總結[39]。另外數(shù)據(jù)樣本的獲取不夠完整、樣本數(shù)據(jù)的準確性存在偏差等問題也導致挖掘結果產生偏差。如何進一步改進,使其在中醫(yī)藥領域發(fā)揮更大的作用無疑十分關鍵。

      數(shù)據(jù)挖掘技術以其獨特的優(yōu)勢被廣泛應用于中醫(yī)處方研究,但技術本身存在局限性。如關聯(lián)規(guī)則技術在對大量數(shù)據(jù)的挖掘過程中會產生很多關聯(lián)規(guī)則,其中有些大多無意義且存在誤導性,從中選取符合要求的關聯(lián)規(guī)則可能存在不準確性[59]。聚類分析顯示頻次較多的數(shù)據(jù),可能會忽略低頻次數(shù)據(jù)對結果的影響,從而導致結果出現(xiàn)偏差;此外,聚類分析具有多結果性,它不能根據(jù)數(shù)據(jù)內部特點來確定分為幾類,故存在很大的主觀性[60]。因子分析的因子值雖然相對比較可靠,但它實際上是一種觀測變量,與潛在變量或有不相符。因此,利用因子值進行數(shù)據(jù)挖掘時就會產生隨機誤差[61]。人工神經網絡中所確定的權重和隱藏的知識難以得到解釋,不能從模型中提取規(guī)則[62];而且該軟件仍處于實驗階段,還沒有達到以硬件的方式實現(xiàn)對該系統(tǒng)的應用,在其操作過程中所采用的樣本規(guī)模小且樣例量化方法簡單,也成為制約該軟件的一個因素[63]。復雜網絡在網絡構建上大多從單方面考慮而忽略了整體綜合性,在分析網絡結構時只能從網絡的局部或全局出發(fā),未能將二者相結合進行分析[64]。中醫(yī)傳承輔助系統(tǒng)、古今醫(yī)案云平臺等可實現(xiàn)中醫(yī)藥之間關聯(lián)關系的定量表述、核心藥對的演變以及新處方的衍生,對隱性經驗的挖掘尤為適用[65],但此類平臺的研究范圍主要是基于疾病,無法涉及具體的證候實現(xiàn)辨證論治,難以總結關鍵藥物;而且在數(shù)據(jù)收集和整理方面,需要考慮收集到的數(shù)據(jù)的真實性,故數(shù)據(jù)質量一般不高且有重復,從而影響進一步的分析和判斷。

      某些疾病在辨證方面未得到統(tǒng)一且存在醫(yī)案信息的主觀干擾是數(shù)據(jù)自身存在的問題[66]。在研究過程中可能會存在樣本量小且缺少統(tǒng)一性和規(guī)范性等問題,導致結果缺乏相應準確性且仍需要專業(yè)人員的測評[67]。樣本量較少以及在處理相關因素時出現(xiàn)技術和人為的誤差等,都會在中醫(yī)數(shù)據(jù)挖掘應用和分析中產生阻礙[68-70]。在對數(shù)據(jù)進行分析的過程中需要以大量的樣本資料為基礎,要求樣本量要遠大于變量。而且中醫(yī)存在明顯的復雜性、多樣性、差異性等特點[71],中醫(yī)藥實體間關系難以度量、中醫(yī)藥網絡結構難以分析、中醫(yī)藥數(shù)據(jù)分類缺乏有效標準等,使得在數(shù)據(jù)樣本、網絡構建方法、網絡分析等方法上也存在一定的局限性[72]。此外,中醫(yī)數(shù)據(jù)資料時間跨度大、來源廣泛、數(shù)據(jù)不全或存在冗余、信息缺乏統(tǒng)一的標準與規(guī)范等問題,都給數(shù)據(jù)挖掘與分析帶來了難度。

      4 小結

      數(shù)據(jù)挖掘技術被廣泛應用于中醫(yī)藥研究的各個領域,以獲取更有價值的學術思想和經驗,使其得到更好地傳承、學習和發(fā)展。名老中醫(yī)在臨床辨證論治的過程中積累了大量的經驗有效方,在治療某類疾病的有效方中出現(xiàn)頻次較多的藥物構成了治療此類疾病的核心藥物配伍規(guī)律,此類核心藥物配伍規(guī)律值得我們深入研究[73]。掌握相應的分析方法對中醫(yī)藥的研究、實踐和傳承具有指導意義[74],本文通過對處方分析方法進行分類、歸納、整理,并對方法的使用范圍、優(yōu)缺點進行分析,以求在實際應用中為研究者提供思路和借鑒。分析后發(fā)現(xiàn),關聯(lián)規(guī)則分析、聚類分析、因子分析、復雜網絡、人工神經網絡是目前處方分析最常用的方法,此類方法可用于挖掘處方用藥之間的規(guī)律,方證之間的應用特點,單藥的應用規(guī)律等等。但在實際的應用過程中也表現(xiàn)出一些局限性,一方面,中醫(yī)方劑大多來源于一些醫(yī)學書籍或期刊,資料收集不夠全面,而且中醫(yī)藥文獻的復雜性和詞語模糊性突出,在處理原始信息的過程中容易丟失大量信息,難以獲得準確的結果,目前的研究大多對收集到的數(shù)據(jù)缺乏相應的標準,如病名、證型、癥狀、方劑名稱、歷代藥物用量、療效表現(xiàn)等[75];另一方面,應用于中醫(yī)藥領域的現(xiàn)代挖掘技術其自身發(fā)展還不夠成熟完善并且本身具有局限性,在挖掘過程中可能會出現(xiàn)偏差或者不準確性等問題,這就給后續(xù)的研究工作帶來了難度,故相關技術的進一步發(fā)展和創(chuàng)新是進行處方探索分析的重要舉措。

      猜你喜歡
      數(shù)據(jù)挖掘關聯(lián)處方
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      人間處方
      文苑(2020年6期)2020-06-22 08:41:34
      “一帶一路”遞進,關聯(lián)民生更緊
      當代陜西(2019年15期)2019-09-02 01:52:00
      奇趣搭配
      基于并行計算的大數(shù)據(jù)挖掘在電網中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      解決因病致貧 大小“處方”共用
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      處方
      小說月刊(2015年1期)2015-04-19 02:04:16
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      天门市| 荔浦县| 西乡县| 开江县| 宜阳县| 广南县| 苏尼特右旗| 泌阳县| 定日县| 大悟县| 横峰县| 手游| 遵化市| 黔西| 全椒县| 沾化县| 麻栗坡县| 利辛县| 光泽县| 宾阳县| 溧水县| 罗源县| 梁平县| 成安县| 金湖县| 都匀市| 吉安县| 千阳县| 离岛区| 杭锦后旗| 本溪市| 合川市| 屏东县| 定安县| 邵阳县| 外汇| 高雄市| 绵阳市| 扶风县| 柳州市| 威远县|