聶曉霞 趙佳
(石家莊理工職業(yè)學(xué)院,河北 石家莊 050081)
中醫(yī)是我國(guó)的傳統(tǒng)醫(yī)學(xué),隨著中醫(yī)技術(shù)的發(fā)展,其在治療一些疑難雜癥上起到的作用越來(lái)越大。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,利用機(jī)器學(xué)習(xí)技術(shù)開(kāi)發(fā)中藥推薦模型,即根據(jù)患者的癥狀表現(xiàn),快速的推薦出一組中藥組合,能夠幫助臨床中醫(yī)快速的對(duì)癥治療,提高了治療的效率。目前中藥推薦技術(shù)主要以主題模型為主,僅利用患者癥狀和中間藥的共享信息,并不能建立合理的推薦模型。因此,將中醫(yī)實(shí)體表示學(xué)習(xí)引入中藥推薦技術(shù)中,能夠很好地建模癥狀與中藥之間的關(guān)系,從而優(yōu)化中藥推薦模型的相關(guān)性能。
將豐富的中醫(yī)領(lǐng)域的知識(shí)以知識(shí)圖譜的形式進(jìn)行呈現(xiàn),可以為中醫(yī)醫(yī)生提供治療的便利,方便他們進(jìn)行查詢和利用醫(yī)學(xué)知識(shí),同時(shí)也能為中藥推薦技術(shù)提供數(shù)據(jù)的支持。中醫(yī)知識(shí)圖譜的建構(gòu)過(guò)程一般為選擇中醫(yī)知識(shí)—本體建構(gòu)—實(shí)體學(xué)習(xí)、實(shí)體抽取、實(shí)體填充—知識(shí)圖譜。中醫(yī)領(lǐng)域的數(shù)據(jù)獲取主要以“中藥”“疾病”為中心開(kāi)展,包含了結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化類型等幾種。結(jié)構(gòu)化類型數(shù)據(jù)包含各種形式的草藥、基因、疾病、基因-疾病關(guān)聯(lián)、基因相互作用、藥物副作用記錄以及毒性記錄等,建立了中藥與疾病之間的關(guān)系網(wǎng)絡(luò);半結(jié)構(gòu)化類型數(shù)據(jù)囊括了動(dòng)植物的具體類型,每一種中藥都包含了具體的使用方法、性味歸經(jīng)、化學(xué)成分、用法用量以及臨床應(yīng)用等信息;非結(jié)構(gòu)化類型數(shù)據(jù)包含了疾病部分、候證部分和治法部分,對(duì)于每個(gè)癥狀的病因、治療與康復(fù)過(guò)程等都進(jìn)行了詳細(xì)的說(shuō)明。只有對(duì)中醫(yī)知識(shí)圖譜中的中醫(yī)數(shù)據(jù)進(jìn)行充分的了解,才能在數(shù)據(jù)抽取、統(tǒng)計(jì)、查詢中獲取中醫(yī)實(shí)體的具體表示學(xué)習(xí)內(nèi)容,這對(duì)于中藥推薦技術(shù)的發(fā)展有很大的幫助作用。
對(duì)于中醫(yī)知識(shí)圖譜來(lái)講,圖是信息的重要載體,是機(jī)器學(xué)習(xí)模型最常用的數(shù)據(jù)類型之一。但是很多中醫(yī)知識(shí)圖譜不具有歐式的結(jié)構(gòu),很難被模型直接利用。在中醫(yī)實(shí)體表示學(xué)習(xí)中,可以對(duì)異質(zhì)的節(jié)點(diǎn)和邊采用不同的處理方式,讓中醫(yī)實(shí)體向量表示的質(zhì)量更高一些;也可以將“癥狀”與“中藥”實(shí)體進(jìn)行直接的相連,在關(guān)注實(shí)體間淺層關(guān)系的同時(shí),也要充分建模他們之間的高階聯(lián)通性。比如在中醫(yī)異質(zhì)圖的構(gòu)建中,可以以癥狀和重要為關(guān)聯(lián)點(diǎn),構(gòu)建中醫(yī)異質(zhì)信息圖,將中醫(yī)知識(shí)的相關(guān)內(nèi)容與已經(jīng)構(gòu)建的知識(shí)圖譜進(jìn)行融合,連接相關(guān)的癥狀實(shí)體,最終打造具有多個(gè)節(jié)點(diǎn)和邊的中醫(yī)異質(zhì)圖。在模型目標(biāo)函數(shù)的構(gòu)建中,中醫(yī)推薦的實(shí)現(xiàn)依賴于中醫(yī)實(shí)體關(guān)聯(lián)的挖掘,比如將癥狀與中藥進(jìn)行關(guān)聯(lián)。在構(gòu)建目標(biāo)函數(shù)的過(guò)程中,一定要將不同的節(jié)點(diǎn)與邊進(jìn)行相互關(guān)聯(lián),同時(shí)構(gòu)建性能完善的激活函數(shù),設(shè)計(jì)針對(duì)節(jié)點(diǎn)的權(quán)重?cái)?shù)據(jù),將向量逐元素相乘,最終形成中醫(yī)實(shí)體表示的學(xué)習(xí)模型。
我們都知道在中藥材推薦任務(wù)上,中醫(yī)學(xué)仍面臨一些挑戰(zhàn),比如中藥配伍原則很難準(zhǔn)確的利用模型刻畫(huà)治療的過(guò)程;與西醫(yī)不同,中醫(yī)認(rèn)為患者的一系列臨床癥狀都是相互依存的,獨(dú)立對(duì)患者建立某種癥狀與中藥的模型是不恰當(dāng)?shù)?,同時(shí)中醫(yī)藥方大都篇幅極少,包含的單詞量不多,在信息共享上做得不到位,不利于利用模型挖掘信息。為了解決上述問(wèn)題,可以將中醫(yī)領(lǐng)域知識(shí)的主題模型用于中藥推薦中,避免傳統(tǒng)主題模型的缺點(diǎn)。在這種模式下,中醫(yī)實(shí)體向量表示之間是有彼此關(guān)聯(lián)的,模型在進(jìn)行中藥推薦時(shí),不僅僅是依靠共現(xiàn)信息進(jìn)行建模,在很大程度上提升了模型的性能。也可以將中藥配伍信息引入所構(gòu)建的模型中,進(jìn)一步加強(qiáng)對(duì)重要的建模,使得中藥的推薦結(jié)果更符合配伍的原則,為中醫(yī)治療疑難雜癥提供更多途徑和方法,豐富臨床治療的體系。
在這類模型中,主要包含“單次-主題”兩個(gè)模型,分別對(duì)應(yīng)了藥方中的“癥狀”和“中藥”兩個(gè)部分。在“癥狀部分”,可以將其中一種癥狀當(dāng)作觀察變量,將其中一種“疾病”當(dāng)作隱變量,采用一定的參數(shù)實(shí)現(xiàn)對(duì)“疾病”主題的S維“疾病-癥狀”多項(xiàng)分布。同樣,在“中藥部分”,可以將其中一種中藥作為觀察變量,將其中一種“適應(yīng)癥”當(dāng)作隱變量,采用另外一種參數(shù)實(shí)現(xiàn)對(duì)“中藥”主題的H維“適應(yīng)癥-中藥”多項(xiàng)分布。也可以將癥狀與中藥的向量表示融入到各個(gè)主題模型中,從而形成疾病模型的多種流程算法,實(shí)現(xiàn)對(duì)疾病的精準(zhǔn)中藥推薦。因此,在利用中醫(yī)實(shí)體表示學(xué)習(xí)進(jìn)行中藥推薦選擇時(shí),要融合中醫(yī)藥的多種知識(shí),強(qiáng)調(diào)藥物組合之間的注意事項(xiàng),使得模型邏輯更符合中醫(yī)領(lǐng)域的知識(shí)要求,推薦結(jié)果更符合實(shí)際治療的要求。在設(shè)計(jì)好推薦模型之后,也要驗(yàn)證所提出模型的有效性,對(duì)實(shí)驗(yàn)進(jìn)行精心的設(shè)計(jì),充分考慮各個(gè)向量之間的關(guān)系,保證模型的實(shí)際效果,為中醫(yī)發(fā)展提供數(shù)據(jù)的支持。
綜上所述,基于中醫(yī)實(shí)體表示學(xué)習(xí)的中藥推薦技術(shù)是一種新型的臨床用藥技術(shù),可以根據(jù)患者的疾病類型和癥狀幫助他們選擇相關(guān)的中藥組合進(jìn)行治療。在構(gòu)建推薦模型的過(guò)程中,要利用中醫(yī)數(shù)據(jù),深刻挖掘癥狀與中藥材的潛在關(guān)系,以基于知識(shí)圖譜的向量表示的方式支撐中藥推薦任務(wù)。為了更加貼合中醫(yī)理論的需要,也可以將中藥配伍知識(shí)融入到推薦模型中,采用多元化的模型提出中藥的推薦算法,從而保證臨床中醫(yī)用藥的準(zhǔn)確性和安全性。