文/管飛詩
困難性描述、客觀的判斷指標(biāo)少在傳統(tǒng)中醫(yī)藥理論及操作技能中存在原因,中醫(yī)藥的全面發(fā)展受到了影響。近年來的中醫(yī)藥信息化,使現(xiàn)代計(jì)算機(jī)科學(xué)重要技術(shù)運(yùn)用到中醫(yī)藥研究中,促進(jìn)了我們傳統(tǒng)中醫(yī)藥事業(yè)的發(fā)展。大數(shù)據(jù)和機(jī)器學(xué)習(xí)是近些年來運(yùn)用中醫(yī)藥研究應(yīng)用比較廣泛的技術(shù),根據(jù)機(jī)器學(xué)習(xí)的發(fā)展歷程,可將機(jī)器學(xué)習(xí)分為大致兩個(gè)階段:傳統(tǒng)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)階段。傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)在中醫(yī)藥研究應(yīng)用中取得良好的效果,但總有有些不盡人意的之處。近些年興起的深度學(xué)習(xí)因其高可用性,也引發(fā)中醫(yī)藥研究人員研究熱潮。
本文先對(duì)傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)在中醫(yī)藥研究應(yīng)用進(jìn)行總結(jié),然后介紹神經(jīng)網(wǎng)絡(luò)進(jìn)而引出深度學(xué)習(xí)的概念,然后介紹深度學(xué)習(xí)在中醫(yī)藥領(lǐng)域研究應(yīng)用,提出深度學(xué)習(xí)在中醫(yī)藥領(lǐng)域的一些應(yīng)用及挑戰(zhàn),以期待深度學(xué)習(xí)技術(shù)在中醫(yī)藥研究應(yīng)用方面提供新的思路。
機(jī)器學(xué)習(xí)總體設(shè)計(jì)是想通過簡(jiǎn)單的程序能夠賦予計(jì)算機(jī)學(xué)習(xí)的能力。為人工智能的一個(gè)應(yīng)用,使得計(jì)算機(jī)可以使用現(xiàn)有數(shù)據(jù)對(duì)內(nèi)部機(jī)制無法判斷或無效定義的問題進(jìn)行有效的預(yù)測(cè)。在醫(yī)學(xué)診斷中,機(jī)器學(xué)習(xí)算法中的聚類算法、分類算法、回歸算法以及關(guān)聯(lián)規(guī)則算法均得到了應(yīng)用。
中醫(yī)病癥原始數(shù)據(jù)的采集方法可能混雜有不規(guī)范數(shù)據(jù)或噪聲數(shù)據(jù),影響了統(tǒng)計(jì)分析的結(jié)果,而這是中醫(yī)病癥數(shù)據(jù)的特點(diǎn)之一。如何從眾多的數(shù)據(jù)中,尋找規(guī)律性,提取出潛在有價(jià)值的信息,機(jī)器學(xué)習(xí)在該方面發(fā)揮了很好了作用。機(jī)器學(xué)習(xí)聯(lián)合統(tǒng)計(jì)分析形成數(shù)據(jù)挖掘技術(shù),該技術(shù)為銀行、電信、保險(xiǎn)、交通、醫(yī)學(xué)等很多領(lǐng)域解決許多問題,發(fā)揮著積極作用。數(shù)據(jù)挖掘的方法包括決策樹、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、多元統(tǒng)計(jì)、聚類、關(guān)聯(lián)規(guī)則、時(shí)間序列等。國(guó)內(nèi)許多學(xué)者在中醫(yī)癥候方面運(yùn)用數(shù)據(jù)挖掘中聚類分析、關(guān)聯(lián)規(guī)則分析、決策樹分析、人工神經(jīng)網(wǎng)絡(luò)等方法進(jìn)行研究,并取得良好的效果。在中醫(yī)藥領(lǐng)域除了癥候方面,其他方面也涉獵。其他學(xué)者運(yùn)用關(guān)聯(lián)規(guī)則分析、頻數(shù)分析、文本挖掘、聚類分析等方法在中醫(yī)藥文獻(xiàn)方面進(jìn)行研究;中醫(yī)藥方劑研究應(yīng)用中運(yùn)用k-均值值聚類算法對(duì)中藥葉片顯微圖像進(jìn)行分割研究。
機(jī)器學(xué)習(xí)在中醫(yī)藥研究應(yīng)用的成就是值得肯定的,但也存在這一些不盡人意的地方。主要問題是:
1.2.1 結(jié)果準(zhǔn)確性
圖1:人工神經(jīng)元模型
圖2:簡(jiǎn)單神經(jīng)網(wǎng)絡(luò)模型
很多系統(tǒng)是基于某些專家的系統(tǒng),領(lǐng)域比較單一,專家對(duì)于自己領(lǐng)域的東西不容置疑,對(duì)于其他方面就顯得力不從心,中醫(yī)藥知識(shí)廣度不夠。
1.2.2 數(shù)據(jù)采集的質(zhì)量和數(shù)量難以保證
基于以上問題,機(jī)器學(xué)習(xí)的深層學(xué)習(xí)的特點(diǎn)可以避免一些傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)在中醫(yī)藥研究應(yīng)用中的弊端。
深度學(xué)習(xí)是一種深層的機(jī)器學(xué)習(xí)模型,主要體現(xiàn)在對(duì)特征的多次變換上。常見的深度學(xué)習(xí)模型為多層神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)的各個(gè)層都將輸入非線性映射,通過多層非線性映射的堆疊,可以在深層神經(jīng)網(wǎng)絡(luò)中歸納出比較抽象的特征來支持分類。深度學(xué)習(xí)的基礎(chǔ)是人工神經(jīng)網(wǎng)絡(luò),其廣泛使用在20世紀(jì)80年代,簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò)。80年代中期反向傳播BP算法被應(yīng)用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),解決了多層感知器無法訓(xùn)練的問題,以訓(xùn)練多層感知器ML平為代表的神經(jīng)網(wǎng)絡(luò)模型最為成功。后來又提出限制性玻耳茲曼機(jī)RBM等。
人工神經(jīng)網(wǎng)絡(luò)不要求精度高的數(shù)學(xué)建模,不對(duì)任何變量做假設(shè)要求,能通過模擬人的智 能行為處理非簡(jiǎn)單的,模糊的、非線性問題。
人工神經(jīng)元模型如圖1,圖中X1~Xn是從其它神經(jīng)元傳入的輸入信號(hào)。神經(jīng)元綜合的輸入信號(hào)和偏置相加之后產(chǎn)生當(dāng)前神經(jīng)元最終的處理信號(hào)net,該信號(hào)定義為凈激活,它作為圖1中圓圈的右半部分f(*)函數(shù)的輸入,即f(net),f叫做激活函數(shù)。圖1中y是該神經(jīng)元的輸出。
圖3:多隱藏層神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)模型如圖2、圖3。所說的神經(jīng)網(wǎng)絡(luò)就是將許多個(gè)一“神經(jīng)元”聯(lián)合在一起,這樣一個(gè)“神經(jīng)元”的輸出就可以是別的“神經(jīng)元”的輸入。例如,圖2是一個(gè)只有一個(gè)隱藏層的簡(jiǎn)單神經(jīng)網(wǎng)絡(luò),而圖是有多個(gè)隱藏層及多個(gè)輸出單元的神經(jīng)網(wǎng)絡(luò)。
相同的核心學(xué)習(xí)算法是深度學(xué)習(xí)模型和算法基礎(chǔ)。深度神經(jīng)網(wǎng)絡(luò)包括輸入層、多個(gè)隱含層以及輸出層。深度學(xué)習(xí)的優(yōu)勢(shì)是:突出了模型結(jié)構(gòu)的深度,大多數(shù)情況下有多于5層的隱層節(jié)點(diǎn);強(qiáng)調(diào)了特征學(xué)習(xí)的重要性,每層的特征變換,學(xué)習(xí)到的知識(shí)傳遞,使下一次特征更加優(yōu)化,原空間的樣本特征通過變換,促成新的樣本特征空間,以便使分類或預(yù)測(cè)更快更準(zhǔn)確,接近人類的判斷結(jié)論。
深度學(xué)習(xí)與傳統(tǒng)的機(jī)器學(xué)習(xí)算法區(qū)別比較明顯,深度學(xué)習(xí)不要求對(duì)特殊的知識(shí)進(jìn)行全面掌握就可以勝任特征構(gòu)造與提取,于此,和傳統(tǒng)的三層人工神經(jīng)相比較,模型在輸入層和輸出層之間添加了多個(gè)隱含層。這使更多的學(xué)者能參與到中醫(yī)藥研究應(yīng)用中來。目前國(guó)內(nèi)對(duì)于深度學(xué)習(xí)在中醫(yī)藥研究應(yīng)用中還是處于個(gè)別的領(lǐng)域。邵尤偉將深度學(xué)習(xí)運(yùn)用在中醫(yī)診斷中的舌診中;溫川飆等通過深度學(xué)習(xí)對(duì)中醫(yī)藥中的穴位敏化進(jìn)行研究;曹繼忠等通過機(jī)器學(xué)習(xí)從癥候延伸到方劑方面的研究。
中醫(yī)及中藥各項(xiàng)特征的復(fù)雜性,以及之間的大量的線性和協(xié)同關(guān)系,就目前的機(jī)器學(xué)習(xí),即淺層學(xué)習(xí)很難準(zhǔn)確的找出其中之間的關(guān)系。深度學(xué)習(xí)的興起與進(jìn)一步發(fā)展,使中醫(yī)藥研究應(yīng)用發(fā)展看到了新的希望,深度學(xué)習(xí)應(yīng)用在中醫(yī)藥研究應(yīng)用中應(yīng)該是比較一個(gè)有前景的研究方向,希望本篇文章能給中醫(yī)藥研究者帶來新的思路。