• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      人工神經(jīng)網(wǎng)絡(luò)在肺癌風(fēng)險(xiǎn)預(yù)測(cè)中的研究與應(yīng)用

      2018-01-04 11:35:20陳國(guó)旺蔣進(jìn)李帆王大龍
      計(jì)算機(jī)時(shí)代 2018年11期
      關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)

      陳國(guó)旺 蔣進(jìn) 李帆 王大龍

      摘 要: 在現(xiàn)代醫(yī)療衛(wèi)生系統(tǒng)中,主要從預(yù)防、診斷、治療三個(gè)方面對(duì)疾病進(jìn)行處理。尤其對(duì)于癌癥這類疾病,早期預(yù)防的效果遠(yuǎn)大于治療。隨著算法研究的深入與技術(shù)領(lǐng)域的拓展,機(jī)器學(xué)習(xí)在預(yù)測(cè)領(lǐng)域卓有成效。文章旨在以一種科學(xué)的方法,實(shí)現(xiàn)對(duì)肺癌患病風(fēng)險(xiǎn)的預(yù)測(cè)。以肺癌為例,利用已有的醫(yī)療數(shù)據(jù),設(shè)計(jì)合適的預(yù)測(cè)算法并用實(shí)驗(yàn)加以驗(yàn)證。最終的結(jié)果顯示了基于神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)患癌風(fēng)險(xiǎn)的可行性。

      關(guān)鍵詞: 癌癥預(yù)測(cè); 機(jī)器學(xué)習(xí); 人工神經(jīng)網(wǎng)絡(luò); 標(biāo)準(zhǔn)化處理

      中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2018)11-56-04

      Abstract: In the modern medical and health system, the disease is treated mainly from three aspects of prevention, diagnosis and treatment. Early prevention is more effective than treatment especially for diseases such as cancer. With the deepening of algorithm research and the expansion of technology, machine learning has been effective in the field of prediction. This article is aimed at succeeding in predicting the risk of lung cancer by means of a scientific method. It takes lung cancer as an example, uses existing medical data, designs appropriate prediction algorithms and demonstrate it with experiments. The final result reflects the feasibility of predicting cancer risk based on neural network algorithms.

      Key words: cancer prediction; machine learning; artificial neural networks; standardized processing

      0 引言

      肺癌是發(fā)病率最高,死亡率增速最快的惡性腫瘤之一,對(duì)人類身體健康構(gòu)成了極大的威脅。醫(yī)學(xué)類研究表明:肺癌的發(fā)病與種族、家屬史、吸煙情況等因素有很大關(guān)聯(lián)。再者,肺癌患者痊愈的幾率很低,這表明人們對(duì)于肺癌這一惡性疾病,應(yīng)該持有預(yù)防大于救治的態(tài)度。提及預(yù)防,人們亟需一種簡(jiǎn)單方便、科學(xué)精準(zhǔn)的工具來(lái)預(yù)測(cè)患癌風(fēng)險(xiǎn),進(jìn)一步自身調(diào)整,達(dá)到預(yù)防的效果。近年來(lái)APP的普及,加上機(jī)器學(xué)習(xí)在輔助預(yù)測(cè)中的顯著效果,使筆者聯(lián)想到將機(jī)器學(xué)習(xí)應(yīng)用于肺癌的風(fēng)險(xiǎn)預(yù)測(cè)中,通過(guò)建模并制作成相應(yīng)的軟件,投入民用。

      經(jīng)過(guò)研究,筆者采用人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)本質(zhì)就是模擬人類的思維[1],具有自學(xué)習(xí)、自操作、自應(yīng)用的表現(xiàn)形式[2]。信息的分布式存儲(chǔ)和并行處理是它最主要的特點(diǎn)[3]。其中,按照科學(xué)正確的原則進(jìn)行學(xué)習(xí)是核心關(guān)鍵點(diǎn),也是人工神經(jīng)網(wǎng)絡(luò)的工作前提。

      1 人工神經(jīng)網(wǎng)絡(luò)算法數(shù)據(jù)模型簡(jiǎn)介

      人工神經(jīng)網(wǎng)絡(luò)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,分布式信息處理的一種數(shù)學(xué)模型。這種算法憑借復(fù)雜的系統(tǒng)結(jié)構(gòu)對(duì)內(nèi)部節(jié)點(diǎn)之間的權(quán)重進(jìn)行修正,從而達(dá)到處理信息的目的[4]。人工神經(jīng)網(wǎng)絡(luò)可以通過(guò)預(yù)先提供的一批正確的數(shù)據(jù),分析其潛在規(guī)律。此過(guò)程稱為“訓(xùn)練”[5]。反向傳播(Back Propagation,簡(jiǎn)稱BP)算法提出后,其非線性映射和泛化能力解決了許多非線性問(wèn)題,比如在臨床輔助決策和波形分析等方向都取得了較好的成效[6]。

      BP神經(jīng)網(wǎng)絡(luò)共分為三層:輸入層、隱藏層、輸出層。下圖1展示具有兩層隱藏層的神經(jīng)網(wǎng)絡(luò)。感知器是神經(jīng)網(wǎng)絡(luò)的基本組成單位。它是由權(quán)值w,偏置b以及傳遞函數(shù)g(x)組成。其中b為偏置,bi為上一個(gè)感知器“釋放”的輸入信號(hào),x為經(jīng)過(guò)線性處理獲得值,f(x)為經(jīng)過(guò)傳遞函數(shù)處理后的最終值。即:

      其中傳遞函數(shù)是對(duì)所求出來(lái)的值進(jìn)行一個(gè)非線性變換。例如、等。通俗來(lái)講,傳遞函數(shù)就是將上一層傳入的信號(hào)進(jìn)行選擇性的通過(guò)。若不添加傳遞函數(shù),對(duì)于多隱藏層的學(xué)習(xí)跟只有一層的隱藏函數(shù)效果是一樣的。例如:

      因此每次處理都必須要經(jīng)過(guò)傳遞函數(shù)。

      一個(gè)感知器的值是由前一層所有感知器加權(quán)求和后,經(jīng)過(guò)傳遞函數(shù)的處理而得出的[7]。通過(guò)層層處理后,從而獲得輸出值。緊接著進(jìn)行反向傳播,修正權(quán)值。多次迭代后,當(dāng)訓(xùn)練集訓(xùn)練完畢后,算法會(huì)更新學(xué)習(xí)次數(shù),當(dāng)學(xué)習(xí)次數(shù)在閾值內(nèi),訓(xùn)練過(guò)程便全部完成[8]。此時(shí)從輸入層輸入信號(hào),經(jīng)過(guò)層層計(jì)算,便可得出最終的預(yù)測(cè)結(jié)果。

      2 神經(jīng)網(wǎng)絡(luò)在肺癌風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用與研究

      2.1 標(biāo)準(zhǔn)化處理

      搜集到的數(shù)據(jù)由于量綱不同,所以需要將數(shù)據(jù)做標(biāo)準(zhǔn)化處理。

      屬性類型可分為效益型、成本型、區(qū)間型等。其中,效益型為屬性值越大越好的屬性,區(qū)間型屬性為在某一區(qū)間內(nèi)越好的屬性[13]。每種屬性標(biāo)準(zhǔn)化處理的方式不同。

      將數(shù)據(jù)代入到公式中,即可完成。

      2.2 算法推導(dǎo)

      設(shè)輸入層為a1,隱藏層為b2、b3…bn-1,輸出層為cn。設(shè)輸入層每個(gè)感知器的值為a1n(n=1,2,3…),其余各層類似。設(shè)權(quán)重為第k層第a個(gè)感知單元與第k+1層第b個(gè)感知單元間的權(quán)重。偏置為b',由感知器原理可知,偏置可作為上一層的一個(gè)權(quán)重為1,信號(hào)為b'的感知器,故以下推導(dǎo)不額外考慮偏置b'。

      BP神經(jīng)網(wǎng)絡(luò)有前置輸出、反向傳播、更新權(quán)值以及其他參數(shù)[9],簡(jiǎn)要步驟如下。

      步驟1 設(shè)輸入層的各個(gè)單元接收的輸入信號(hào)為x1、x2、x3…xn,并對(duì)w進(jìn)行隨機(jī)賦值。按上述過(guò)程計(jì)算,最后在輸出層可得出一組計(jì)算結(jié)果。

      步驟2 求出預(yù)測(cè)值以及真實(shí)值之間的誤差并反向進(jìn)行計(jì)算,求出最終誤差與初始權(quán)值之間的關(guān)系。

      步驟3 使用隨機(jī)梯度下降算法(Stochastic gradient descent,SGD)求誤差E最小值。

      步驟4 通過(guò)迭代并更新w,訓(xùn)練完成[10],獲得預(yù)測(cè)結(jié)果。

      針對(duì)步驟1,輸入值經(jīng)過(guò)權(quán)值計(jì)算到達(dá)隱藏層b2的第一個(gè)神經(jīng)單元b21的值為,經(jīng)過(guò)傳遞函數(shù)g(x)可得b21的輸入信號(hào)值為。

      針對(duì)步驟2,設(shè)標(biāo)簽為,可以求單個(gè)輸出層誤差Ei為,總誤差為。將隱藏層的單元代入:,可得總誤差E為:

      2.3 實(shí)驗(yàn)過(guò)程以及結(jié)果

      肺癌高危人群為長(zhǎng)期吸煙的中老年人群、慢性肺部疾病患者以及家族遺傳者等[11]。筆者進(jìn)一步研究得出導(dǎo)致肺癌的因素主要包括出生年月、BMI、呼吸系統(tǒng)狀況、是否患有其他癌癥、近親患癌、慢性肺部疾病、是否吸煙、日均吸煙量、吸煙年數(shù)、二手煙狀況、油煙狀況等[12]。由于篇幅所限,我們僅列出部分?jǐn)?shù)據(jù)。

      設(shè)出生年份為Y1,BMI為Y2,慢性肺部疾病為Y3,日均吸煙數(shù)量為Y4,吸煙年數(shù)為Y5,患癌真實(shí)值為P1,預(yù)測(cè)值為P2。其中BMI是用于衡量人體胖瘦程度以及健康狀況的國(guó)際標(biāo)準(zhǔn)。設(shè)身高為h,體重為w,則BMI指數(shù)a為:

      由于量綱不同,需對(duì)所有搜索數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。根據(jù)查詢相關(guān)資料可得,BMI在[18.5,23.9]處于正常狀態(tài)。年齡越小,即出生年份數(shù)值越大,患有癌癥的可能性越小,因此出生年份屬于效益型,其余屬性同理分析。將各屬性做如上標(biāo)準(zhǔn)化處理,現(xiàn)展示部分?jǐn)?shù)據(jù)。

      將數(shù)據(jù)代入算法中,得出最終預(yù)測(cè)結(jié)果。將數(shù)據(jù)源部分用于訓(xùn)練,部分用于預(yù)測(cè)。通過(guò)部分?jǐn)?shù)據(jù)集的訓(xùn)練之后,可得預(yù)測(cè)結(jié)果。

      由表中數(shù)據(jù)可得,大多數(shù)預(yù)測(cè)值與真實(shí)值相差較小,說(shuō)明該算法具有較大潛力。但少數(shù)預(yù)測(cè)數(shù)據(jù)與真實(shí)值相差較大,說(shuō)明在該算法中,如何選擇傳遞函數(shù),選擇有效的訓(xùn)練數(shù)據(jù)及次數(shù)等還有待研究。

      2.4 實(shí)驗(yàn)在APP中的應(yīng)用

      將神經(jīng)網(wǎng)絡(luò)算法與APP進(jìn)行結(jié)合,便成為可以為用戶服務(wù)的一個(gè)工具。用戶安裝后,回復(fù)有大量科學(xué)研究作為基礎(chǔ)的問(wèn)題,通過(guò)輸入個(gè)人數(shù)據(jù),便可得出預(yù)測(cè)結(jié)果。APP接受用戶提交的數(shù)據(jù)后,通過(guò)計(jì)算,可得最終的預(yù)測(cè)結(jié)果。

      圖4、圖5為制作完成的APP界面。

      3 結(jié)束語(yǔ)

      本文將機(jī)器學(xué)習(xí)領(lǐng)域中的經(jīng)典算法應(yīng)用于肺癌發(fā)病風(fēng)險(xiǎn)的預(yù)測(cè)。在提取各種特征的基礎(chǔ)上,搜集了大量數(shù)據(jù)并將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,選取部分?jǐn)?shù)據(jù)作為訓(xùn)練集,其余數(shù)據(jù)用于預(yù)測(cè)。通過(guò)對(duì)預(yù)測(cè)結(jié)果的分析,可以得出兩個(gè)重要結(jié)論:一推導(dǎo)出高幾率患病人群,比如長(zhǎng)期吸煙的中老年人群、慢性肺部疾病患者等,確定的影響因素包括吸煙情況、身高體重指數(shù)、慢性疾病與肺病史、油煙暴露狀況等。二是該算法的預(yù)測(cè)準(zhǔn)確率大致符合真實(shí)情況,可以作為神經(jīng)網(wǎng)絡(luò)在肺癌預(yù)測(cè)中的成功應(yīng)用。但是該算法預(yù)測(cè)中,也存在部分記錄預(yù)測(cè)值與真實(shí)值有一定誤差的問(wèn)題,可見(jiàn)該算法在數(shù)據(jù)集、傳遞函數(shù)選取等細(xì)節(jié)方面還有待進(jìn)一步研究,準(zhǔn)確性仍有提升的空間。

      現(xiàn)實(shí)使用中,用戶只需下載APP應(yīng)用,輸入個(gè)人數(shù)據(jù),即可得知自身患肺癌風(fēng)險(xiǎn),發(fā)病誘因等,非常方便,實(shí)用性強(qiáng),免去實(shí)體醫(yī)院的檢查流程,省時(shí)省力,還節(jié)省可觀的財(cái)產(chǎn)支出。正因?yàn)槠浜?jiǎn)便易用,平民大眾,迎合“互聯(lián)網(wǎng)+”浪潮,可以預(yù)見(jiàn)其會(huì)在市場(chǎng)、社會(huì)中的廣泛應(yīng)用,可以說(shuō)前景十分廣闊。

      雖然當(dāng)前的算法仍存在一些問(wèn)題,應(yīng)用系統(tǒng)還不夠完善,但是筆者相信經(jīng)過(guò)算法的再研究、再改進(jìn),以及日后神經(jīng)網(wǎng)絡(luò)算法的必然優(yōu)化與發(fā)展,利用神經(jīng)網(wǎng)絡(luò)精準(zhǔn)預(yù)測(cè)肺癌風(fēng)險(xiǎn)將會(huì)有很大的概率實(shí)現(xiàn)和普及,并且在其他領(lǐng)域,神經(jīng)網(wǎng)絡(luò)也將“大放光彩”。

      參考文獻(xiàn)(References):

      [1] Mitchell T. Machine learning[M]. Beijing: China MachinePress,2003.

      [2] Ganesan K, Acharya U R,Chua C K,et al.Computer-aided breast cancer detection using mammograms:A review[J].IEEE Reviews in Biomdical Engineering,2013.6(77):98

      [3] Orozco H M,Villegas O V,Maynez L O,et al. Lung noduleclassification in frequency domain using support vector machines[C]//Proc of 2012 llth International Conference on Information Science,Signal Processing and their Applications (ISSPA),2012:870-875

      [4] Pinheiro F M R,kuo M H.Poster:Applying data miningalgorithms to early detection of liver cancer[C]//Proc of 2012 IEEE 2nd International Conference on Computational Advances in Bio and Medical Sciences (ICCABS),2012:1

      [5] Cruz JA, Wishart DS. Applications of Machine Learning in Cancer Prediction and Prognosis[J]. Cancer Informatics,2007.2(1):59-77

      [6] Fakoor R, Ladhak F, Nazi A, et al. Using Deep Learning to Enhance Cancer Diagnosis and Classification[C].Atlanta:The International Conference on Machine Learning,2013.

      [7] Mitchell T M. Machine learning [M]. Burr Ridge, IL:MC Graw Hill,1977.

      [8] Graves A, Mohamed A, Hinton CE. Speech recognition with deep recurrent neural networks [C]. IEEE International Conference on Acoustics, Speech and Signal Processing,2013:6645-6649

      [9] Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks[C]. Advances in Neural Information Processing Systems,2012:1097-1105

      [10] 倪然.人工神經(jīng)網(wǎng)絡(luò)聯(lián)合腫瘤標(biāo)志對(duì)肺癌和大腸癌的預(yù)警 [D].鄭州大學(xué),2009.

      [11]馬莉,高曉虹,王猛,李曉楓.肺癌影響因素病例對(duì)照研究[J].中國(guó)公共衛(wèi)生,2012.28(1):90-91

      [12] Crippa A, Salvatore C, Perego P, et al.Use of machine learning to identity children with autism and their motor abnormalities [J]. J Autism Dev Disord,2015.45:2146-2156

      猜你喜歡
      人工神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)
      利用人工神經(jīng)網(wǎng)絡(luò)快速計(jì)算木星系磁坐標(biāo)
      人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)簡(jiǎn)單字母的識(shí)別
      電子制作(2019年10期)2019-06-17 11:45:10
      滑動(dòng)電接觸摩擦力的BP與RBF人工神經(jīng)網(wǎng)絡(luò)建模
      基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
      前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
      人工神經(jīng)網(wǎng)絡(luò)和安時(shí)法電池SOC估計(jì)
      绥滨县| 蒲江县| 鄂州市| 磴口县| 抚宁县| 长汀县| 玉田县| 昌图县| 茶陵县| 盘山县| 四会市| 青岛市| 大足县| 山丹县| 闽清县| 西乌珠穆沁旗| 余姚市| 宁晋县| 榆林市| 迁安市| 江孜县| 乃东县| 松滋市| 青神县| 商都县| 安远县| 澄江县| 郸城县| 海盐县| 聂荣县| 安泽县| 仙桃市| 晋中市| 衡南县| 阿拉善盟| 梁山县| 灵台县| 宁河县| 鄂尔多斯市| 东安县| 峡江县|