• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于Neo4j桂枝湯類方知識圖譜的研究與實現(xiàn)

      2019-09-10 22:13:03趙凱王華星施娜
      世界中醫(yī)藥 2019年10期
      關鍵詞:類方方證桂枝湯

      趙凱 王華星 施娜

      摘要 知識圖譜與自然語言處理技術和搜索技術的結(jié)合越來越廣,成為了近年知識服務領域研究的新熱點。目前知識圖譜在中醫(yī)藥領域的應用主要集中在可視化分析,尚無能夠支持自然語言處理領域和知識服務領域的中醫(yī)知識圖譜。本研究使用了Neo4j圖數(shù)據(jù)庫構(gòu)建了基于《傷寒論》桂枝湯類方的小型知識圖譜,可以實現(xiàn)對桂枝湯類方的證、方、藥的可視化分析以及檢索等功能。研究結(jié)果證明了這種方法的可行性,并為今后將中醫(yī)類知識圖譜與深度學習技術相結(jié)合應用的開發(fā)奠定了基礎。

      關鍵詞 知識圖譜;圖數(shù)據(jù)庫;傷寒論;桂枝湯;自然語言處理;Neo4j;中醫(yī)類方;方證

      Abstract In recent years,the increasingly wide combination of knowledge graph,natural language processing as well as search technique has become a new hotspot in the field of knowledge service.Nowadays,the application of knowledge graph in the field of traditional Chinese medicine(TCM)is mainly focused on visual analysis.There is still no TCM knowledge graph that can support the fields of natural language processing and knowledge service.In this paper,Neo4j graph database is used to construct a small knowledge graph based on Guizhi Decoction associated formulas in Treatise on Cold Damage,which can realize functions of visual analysis and searching on syndromes,formulas and medicines of Guizhi Decoction associated formulas.Results of the study prove the feasibility of this method,and lay the foundation for future development of the combination of TCM knowledge graph and deep learning technology.

      Key Words Knowledge graph; graph database; Treatise on Cold Damage; Guizhi Decoction; Natural language processing; Neo4j; Chinese medicine formula; Formula and syndrome

      中圖分類號:R222 文獻標識碼:A doi:10.3969/j.issn.1673-7202.2019.10.019

      傳統(tǒng)AI技術如深度學習,如果沒有預先標定好的高質(zhì)量的大規(guī)模數(shù)據(jù)集,在面對錯綜復雜的臨床醫(yī)學決策時往往也束手無策,這時候,來自現(xiàn)實世界的經(jīng)驗和知識就顯得格外重要。各種機器學習算法雖然在數(shù)據(jù)的預測能力上很好,但是在描述能力上非常弱,而知識圖譜對于數(shù)據(jù)的描述能力非常強大,恰好填補了這部分的空白。知識圖譜在國內(nèi)還屬于一個比較新興的概念,是2012年由谷歌公司首次提出。知識圖譜本質(zhì)上是一種語義網(wǎng)絡的知識庫,是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點和邊組成,主要用來描述真實世界中存在的各種實體概念以及之間的關系。在知識圖譜里,每個節(jié)點表示現(xiàn)實世界中存在的“實體”,每條邊為實體與實體之間的“關系”。知識圖譜是關系的最有效表示方式。知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關系網(wǎng)絡,提供了從“關系”的角度去分析問題的能力。這種表示方式非常適合用于表示中醫(yī)領域里的各種概念。前人曾有用知識圖譜來分析中醫(yī)電子病例的研究,從文獻計量學的角度分析中醫(yī)領域研究現(xiàn)狀[1]。

      《傷寒論》是中醫(yī)辨證論治理論的奠基之作。傷寒論中對疾病的描述和記載,不同于現(xiàn)代對疾病的定義和分類,是一部總結(jié)臨床實踐經(jīng)驗的著作,在實踐中揭示疾病的發(fā)生發(fā)展變化規(guī)律,并融入了完備的理法方藥內(nèi)容。書中記載的疾病治療方法大多經(jīng)過中國古代數(shù)千年的臨床觀察確有療效。六經(jīng)辨證是對《傷寒論》辨證方法的一種普遍的提法,但是對于六經(jīng)的認識至今沒有一種十分確切的解釋[2]。而方證辨證是存在于《傷寒論》中的一種基本辨證方法[3]。方證辨證的主要方法“方證對應”和“有是證,用是方”,是直接來源于《傷寒論》條文的敘述模式。從“方證相應”的角度理解《傷寒論》的處方和治病原則,是一種簡單高效的方法。根據(jù)由多個證組合成的證候群,患者出現(xiàn)哪些臨床癥狀,就能處以相應的方劑來對癥治療,不同的癥狀對應不同的方劑。如果將《傷寒論》中的方證辨證信息轉(zhuǎn)化為計算機可以讀取的形式存儲起來,之后再與現(xiàn)代AI技術結(jié)合,將大大提高臨床上使用《傷寒論》診病的效率和精確度。

      桂枝湯被稱為群方之冠、眾方之祖,是《傷寒論》開篇第一方[4],是書中使用頻次最高的一首方子,其所演化出的類方數(shù)量也最多。桂枝湯的臨床應用十分廣泛,從呼吸系統(tǒng)到心腦血管系統(tǒng)疾病,都有應用桂枝湯及其加減方。

      因此本文提出了通過建立《傷寒論》中的桂枝類方知識圖譜數(shù)據(jù)庫,以期實現(xiàn)桂枝湯類方的快速辨證分型與選方,探索未來將圖數(shù)據(jù)庫技術與人工智能技術相結(jié)合,進一步實現(xiàn)人工智能輔助辨證開方的可能性。

      1 資料與方法

      1.1 文獻來源 本文數(shù)據(jù)全部來源于宋本趙開美版《傷寒論》[5]。

      1.2 檢索策略 使用word關鍵詞查找,篩選出原文中所有包含桂枝湯的條文以及含有屬于桂枝湯類方的條文。

      1.3 納入標準 選定《傷寒論》中的桂枝湯類方的主要依據(jù)是方劑名中含有“桂枝”或方劑組成中以“桂枝”為主藥,同時需要結(jié)合歷代醫(yī)家經(jīng)驗[6-9]。

      1.4 排除標準 1)方劑名和組成中均不含有“桂枝”;2)方劑名或者組成中雖然出現(xiàn)“桂枝”,但桂枝不是方子組成中的主要藥物,如柴胡桂枝湯應劃為柴胡類方。

      由于歷代對《傷寒論》的學術研究出現(xiàn)百家爭鳴,不同醫(yī)家對《傷寒論》的解讀都稍有不同,部分學術觀點很難達成一致,對類方的劃分并不完全相同。本文主要參考了部分醫(yī)家經(jīng)驗,本著從實際臨床應用的角度出發(fā),結(jié)果共納入了27首桂枝湯類方。

      1.5 知識圖譜的建立

      1.5.1 桂枝湯類方命名實體的提取 本文使用了Python軟件對《傷寒論》中的桂枝類條文做詞頻統(tǒng)計分析[10]?!秱摗分猩婕暗健肮鹬钡挠蟹綏l文共有19條,從這19條中人工挑選出所有描述“癥狀”的關鍵詞。然后利用這些關鍵詞構(gòu)造了分詞詞典[11-12],Python加載分詞詞典后對文本進行分詞并統(tǒng)計詞頻。將提取出的癥狀關鍵詞用Python軟件進行詞頻統(tǒng)計和去重處理后,即獲得癥狀實體。將每首方子中包含的草藥名稱匯總?cè)ブ睾螅吹玫讲菟帉嶓w。將27首桂枝湯類方的方名作為湯方實體。

      1.5.2 桂枝湯癥狀權(quán)重計算 《傷寒論》中對于每首湯方記載的癥狀可以分為主癥、特異性主癥、兼癥、或然癥等,顯然每個癥狀的對各個湯方的貢獻度是不一樣的。不同的湯方之間還往往存在多個共同癥狀。為了提高系統(tǒng)判斷湯方的準確率,分析每個癥狀對包含該癥狀的湯方的權(quán)重是十分關鍵的。詞頻高的癥狀不一定就是主癥,但是本文主要是通過詞頻統(tǒng)計這一手段來找主癥,所以將詞頻高的前3個證狀即作為主證。中醫(yī)在使用《傷寒論》“方證辨證”的方法來診病時,可以看成一種對癥狀的分類過程。首先通過詢問和觀察一個患者前來就診時的癥狀,同時在記憶中搜索《傷寒論》的條文內(nèi)容,看患者出現(xiàn)的癥狀和哪個條文的記載最相符合,從而判斷這個患者最適于用哪首湯方來治療,即完成了“方證相應”的過程,臨床中通過使用這種方證辨證的方法往往能做到效如浮鼓。但是方證辨證的方法使用的好壞取決于中醫(yī)師對《傷寒論》條文的熟悉和理解程度。

      所以,就可以將癥狀看作特征用來訓練分類器。鑒于貝葉斯分類器是自然語言處理領域中簡單且強大的模型,所以本文采用貝葉斯分類算法[13]。使用貝葉斯定理來計算癥狀對于某首湯方的影響程度。貝葉斯定理[14-15]如下:

      P(B|A)=P(B)P(A|B)P(A)

      上式中P(A)為證狀A出現(xiàn)的概率,P(B)為使用湯方B的概率,為湯方B中出現(xiàn)證狀A的概率,我們希望求得的是P(B|A),即出現(xiàn)癥狀A會使用湯方B治療的概率。將P(B|A)的計算結(jié)果作為連接癥狀和湯方權(quán)值。

      由桂枝湯癥狀權(quán)值的計算結(jié)果可見,某個癥狀出現(xiàn)的頻次高,不一定權(quán)值就越大,而是某癥狀在桂枝湯中出現(xiàn)的頻次越高,并且同時該癥狀在其他方劑中出現(xiàn)的頻次越低,連接癥狀和湯方的邊權(quán)值設置才會越大。例如,“發(fā)熱”雖然在桂枝湯條文中出現(xiàn)的頻次最高,但是在其他條文中也多次出現(xiàn)。而“鼻鳴”的頻次很低,但只出現(xiàn)在了桂枝湯的癥狀中,在其他類方條文中沒有出現(xiàn),因此權(quán)值最大,說明癥狀“鼻鳴”與桂枝湯的對應具有唯一性。權(quán)值衡量了癥狀與湯方之間關聯(lián)的唯一性程度。之后將權(quán)值“weight”通過Cypher語句輸入到知識圖譜“邊”的屬性中。

      1.5.3 用Neo4j構(gòu)建知識圖譜 Neo4j是基于Java的一種開源非關系型圖數(shù)據(jù)庫,可以將數(shù)據(jù)存儲在靈活的網(wǎng)絡結(jié)構(gòu)中而不是表格中,具備了完整的數(shù)據(jù)庫特性,實現(xiàn)了專業(yè)數(shù)據(jù)庫級別的圖數(shù)據(jù)模型的存儲,現(xiàn)如今已經(jīng)被各個行業(yè)的許多公司和組織所采用。Neo4j的優(yōu)點主要有:1)采用具有自由鄰接的圖存儲結(jié)構(gòu),提供更快的事務處理和數(shù)據(jù)關系處理能力;2)隨時隨意添加更改數(shù)據(jù),從而縮短開發(fā)時間;3)Neo4j使用Cypher查詢語言提供了一種非常人性化的有效的表達方式;4)能很容易的表示半結(jié)構(gòu)化的數(shù)據(jù);5)數(shù)據(jù)之間的關系附加在節(jié)點之上,無論關系的數(shù)量或深度如何,都能確保零延遲和實時性能?;谏鲜鰞?yōu)點,本文使用了Neo4j圖數(shù)據(jù)庫來構(gòu)建桂枝湯類方的知識圖譜。

      將提取出的“癥狀實體”“草藥實體”“湯方實體”以及彼此之間的“關系”信息先全部整理成結(jié)構(gòu)化數(shù)據(jù),并賦予相應的標簽,用CSV格式文件存儲,如表1至表4所示。然后將整理好的CSV文件通過使用Cypher語言導入到Neo4j數(shù)據(jù)庫中,即完成了桂枝湯類方知識圖譜的構(gòu)建。

      1.6 數(shù)據(jù)分析 通過對桂枝類方條文中的77個癥狀詞匯進行詞頻統(tǒng)計發(fā)現(xiàn),如圖2所示,“發(fā)熱”“汗出”“惡寒”3個癥狀出現(xiàn)的頻次最多,且此3個癥狀的頻次幾乎相同,說明此3個癥狀往往同時相伴出現(xiàn);還可以發(fā)現(xiàn)前3個癥狀的頻次分別是第4個癥狀的兩倍,即在很大程度上說明了“發(fā)熱”“汗出”“惡寒”3個癥狀是桂枝湯類方的主癥。其次是表征疼痛類的癥狀,如頭痛、項痛和身痛,說明桂枝湯類方的使用指征是經(jīng)常伴有身體某些部位的疼痛。除了頻次最高的主癥之外,其他大部分癥狀只出現(xiàn)1至2次,而且這些頻次極低的癥狀主要集中分布在除桂枝湯外的其他桂枝湯類方中,說明這些癥狀很可能是應用相應的桂枝湯類方的特異性癥狀。特異性癥狀即某一個證狀只會跟某一首特定方劑相關聯(lián)或者呈高度相關,因此可以將這些特異性癥狀作為快速篩選方劑的指標。

      此外特別值得注意的是,只在桂枝湯的條文中,“發(fā)熱”這個癥狀出現(xiàn)了9次,“惡寒”出現(xiàn)了7次,“汗出”出現(xiàn)了9次,可見這3個癥狀同時也是桂枝湯的主癥,說明了桂枝湯的主癥就是桂枝湯類方的主證。換句話說,桂枝湯類方的出現(xiàn),是因為在桂枝湯主癥的基礎上,又同時出現(xiàn)了其他癥狀,所以需要對桂枝湯進行加減,以滿足對癥治療的需要,才演化出了許多其他的桂枝湯類方。桂枝湯類方均是對桂枝湯原方的加減變化,在功能主治上,是對桂枝湯原方臨床治療范圍的擴大應用。

      2 結(jié)果

      將數(shù)據(jù)導入到Neo4j中之后,我們可以得到如圖3所示的桂枝湯類方的知識圖譜,其中藍色節(jié)點表示湯方實體,粉色節(jié)點表示癥狀實體,紅色節(jié)點表示草藥實體。連接癥狀實體與湯方實體之間的邊表示這些癥狀可以用相應的湯方治療,也就是在一定程度上模擬了“方證相應”的過程。Neo4j數(shù)據(jù)庫提供了Cypher語言可以對數(shù)據(jù)庫進行CRUD(Create,Read,Update,Delete)操作,從而方便的實現(xiàn)對方-證-藥的檢索、遍歷和導航功能。

      圖3可視化展示了用Cypyher語句查詢到的27首桂枝湯類方節(jié)點和26味中草藥節(jié)點之間的關系。桂枝湯類方之間藥物組成的不同點,最低程度僅僅是藥量上的改變,如桂枝加桂湯;大多數(shù)是僅有1至2味藥的加減變化,說明了《傷寒論》中制方組方的嚴謹性,也同時說明了藥物劑量的變化是影響方劑功效的一個重要因素。

      圖4展示了用Cypyher語句查詢到跟“桂枝湯”這一癥狀節(jié)點直接相連的所有關系及其節(jié)點,包括《傷寒論》中記載所有桂枝湯可能會出現(xiàn)的癥狀和桂枝湯的藥物組成。

      3 討論

      本文提出了一種新的構(gòu)建中醫(yī)類知識圖譜的方法,不是簡單的將文獻中的粗顆粒信息進行關聯(lián),而是從《傷寒論》文本中先逐條提取出各種證、方、藥的實體,再將這些知識實體進行關聯(lián);從文本中挖掘出的信息,沒有停留在僅僅能用知識圖譜做可視化展示的層面,而是將這些實體知識用圖數(shù)據(jù)庫存儲了起來,并設置了權(quán)值屬性,可以實現(xiàn)多種查詢檢索和調(diào)用的功能。本文研究的不足之處在于,《傷寒論》知識圖譜的構(gòu)建尚需要大量人工輔助,由于缺少訓練語料,命名實體識別的任務還無法自動完成。要解決這個問題,后期需要先建立基于中醫(yī)文獻類文本標注好的訓練語料庫。基于圖數(shù)據(jù)庫構(gòu)建中醫(yī)藥領域的知識圖譜,可以實現(xiàn)中醫(yī)知識的關聯(lián)和共享[16],進一步整合和利用中醫(yī)藥文獻資源,不僅可以為臨床醫(yī)生提高診療效率,也可以為普通百姓提供全面準確的中醫(yī)藥知識搜索服務。本文工作的意義在于,可為今后與深度學習技術相結(jié)合的人工智能輔助開方系統(tǒng)的開發(fā)奠定了一定的基礎。

      參考文獻

      [1]榮光,謝晴宇,孟慶剛.中醫(yī)電子病歷研究領域科學知識圖譜分析[J].中國中醫(yī)藥信息雜志,2017,24(1):99-104.

      [2]王慶國,李宇航,王震.《傷寒論》六經(jīng)研究41說[J].北京中醫(yī)藥大學學報,1997,20(4):23-30.

      [3]卞慶來,邱文琪,宋美芳,等.從《傷寒論》探討方證辨證的思路[J].中華中醫(yī)藥雜志,2018,33(9):3809-3811.

      [4]孟康,朱華剛,宋現(xiàn)濤,等.三七總皂苷聯(lián)合雙重抗血小板藥物治療對冠狀動脈支架術后患者心血管事件的影響[J].中國醫(yī)藥,2013,8(4):445-447.

      [5]錢超塵.宋本《傷寒論》版本簡考[J].河南中醫(yī),2010,30(1):1-9.

      [6]方騰鐸,崔云,方躍坤,等.崔云教授運用桂枝類方治療男科病經(jīng)驗探賾[J].浙江中醫(yī)藥大學學報,2019,43(8):729-733.

      [7]郎睿,張瀟彤,關文卓,等.《傷寒論》桂枝湯類方應用劑量探討[J].醫(yī)學爭鳴,2018,9(4):41-43.

      [8]趙昌林,李敏瑤.桂枝湯及其類方的運用探討[J].中醫(yī)學報,2019,34(8):1605-1608.

      [9]郝世毫,李燕寧.桂枝湯類方與汗證[J].世界最新醫(yī)學信息文摘,2018,18(38):210.

      [10]閻令海.分析Python語言的中文文本處理[J].中國新通信,2019,21(2):147.

      [11]成于思,施云濤.面向?qū)I(yè)領域的中文分詞方法[J].計算機工程與應用,2018,54(17):30-34,109.

      [12]方婷婷.中文分詞中詞典分詞和模型分詞融合的實證研究[D].桂林:廣西師范大學,2019.

      [13]藍鋆,王晶,尤圣富,等.貝葉斯網(wǎng)絡技術在中醫(yī)證候研究中的運用[J].中國中醫(yī)骨傷科雜志,2015,23(2):70-72.

      [14]張彥凈.基于貝葉斯方法進行中醫(yī)證候診斷的研究[D].蘭州:蘭州大學,2017.

      [15]藍鋆,王晶,尤圣富,等.貝葉斯網(wǎng)絡技術在中醫(yī)證候研究中的運用[J].中國中醫(yī)骨傷科雜志,2015,23(2):70-72.

      [16]劉凱,周雪忠,于劍,等.基于條件隨機場的中醫(yī)臨床病歷命名實體抽取[J].計算機工程,2014,40(9):312-316.

      (2019-03-20收稿 責任編輯:徐穎)

      猜你喜歡
      類方方證桂枝湯
      桂苓味甘湯及加減方證條文辨析
      柴胡類方治療慢性乙型肝炎的研究進展
      四逆散方證分析及臨床運用舉隅
      桂枝湯煎服法對臨床中藥學實踐的啟示
      苓甘五味姜辛湯及其類方治療痰飲病的探討
      HPLC法同時測定柴胡桂枝湯中6種成分
      中成藥(2018年10期)2018-10-26 03:41:02
      從脾胃論桂枝湯的解肌思想
      基于屬性偏序表示原理的經(jīng)方方證研究
      基于屬性偏序理論的李賽美教授運用柴胡類方思路探析
      從桂枝湯論經(jīng)方活用的思路
      罗山县| 广东省| 东辽县| 南郑县| 禹城市| 视频| 滨海县| 巴马| 休宁县| 兴业县| 深水埗区| 嵊州市| 武夷山市| 监利县| 夹江县| 佳木斯市| 社会| 福海县| 尼勒克县| 津南区| 肇庆市| 株洲县| 兴安县| 湖南省| 莱州市| 巴东县| 盐津县| 麦盖提县| 木兰县| 永城市| 吉木乃县| 镇平县| 冕宁县| 巴楚县| 荔浦县| 西贡区| 化州市| 洪洞县| 万州区| 朝阳市| 安西县|