• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于超聲特征集成學(xué)習(xí)的甲狀腺結(jié)節(jié)分類方法研究

      2017-05-08 10:36:19陳德華吳迪潘喬
      智能計算機與應(yīng)用 2016年6期
      關(guān)鍵詞:甲狀腺結(jié)節(jié)

      陳德華++吳迪++潘喬

      摘要:甲狀腺結(jié)節(jié)是一種比較常見的疾病,并且發(fā)病率有逐年上升的趨勢。如何及時并準確地鑒別出結(jié)節(jié)的良惡性,采取相應(yīng)的治療措施,是甲狀腺結(jié)節(jié)治療過程中的核心問題。超聲作為甲狀腺結(jié)節(jié)初步診斷的主要檢查方式,其特征數(shù)據(jù)對于鑒別結(jié)節(jié)良惡性具有指導(dǎo)意義。本文針對甲狀腺結(jié)節(jié)超聲特征數(shù)據(jù)存在稀疏和不平衡的問題,通過在目標函數(shù)中加入自定義項對集成學(xué)習(xí)算法進行改進,提出一種基于改進集成學(xué)習(xí)的甲狀腺結(jié)節(jié)良惡性鑒別方法。實驗在真實醫(yī)療數(shù)據(jù)集和UCI標準數(shù)據(jù)集上分別對比了本算法與隨機森林、支持向量機、神經(jīng)網(wǎng)絡(luò)算法,結(jié)果表明該方法具有最高的準確率,分別達到92.43%和94%。

      關(guān)鍵詞: [甲狀腺結(jié)節(jié); 超聲特征; 不平衡性; 改進的集成學(xué)習(xí)

      中圖分類號: TP391

      文獻標志碼: A

      文章編號: 2095-2163(2016)06-0012-05

      0引言

      在甲狀腺結(jié)節(jié)的臨床治療過程中,醫(yī)生的首要內(nèi)置目標即是判別結(jié)節(jié)的良惡性,而對于惡性結(jié)節(jié)患者需及時采取有效重要的手術(shù)治療。但是在臨床實踐中,為了準確判別患者結(jié)節(jié)的良惡性特征屬性,醫(yī)生首先對疑似或確診為甲狀腺結(jié)節(jié)的患者設(shè)計指定超聲檢查,然后根據(jù)超聲檢查的各項指標,對疑似惡性結(jié)節(jié)患者增加細針穿刺活檢,由此方可初步確定患者的良惡屬性,最后才會得出推薦手術(shù)治療的終診論斷[1]。不難看出,患者診斷結(jié)果的準確性主要依賴于醫(yī)生的主觀判斷。由于不同醫(yī)生的臨床經(jīng)驗和醫(yī)院醫(yī)療設(shè)施等存在差異,勢必會造成不同程度的結(jié)果誤診。如此一來,將不僅嚴重影響患者正確治療的展開推進,危及患者身體健康,而且也將對醫(yī)療資源造成一定的損失和可觀浪費。

      為了幫助提高醫(yī)生臨床診斷的準確性,同時降低患者誤診率,簡化患者前期檢測的定制流程。近年來,越來越多的學(xué)者試圖通過機器學(xué)習(xí)、專家系統(tǒng)等人工智能方法進行甲狀腺結(jié)節(jié)良惡性鑒別。其中,集成學(xué)習(xí)作為使用上具備廣闊領(lǐng)域的機器學(xué)習(xí)算法之一,設(shè)計思路就是在對新的實例進行分類的時候,把若干個單一分類器集成起來,通過對多個分類器的分類結(jié)果構(gòu)建某種組合來確定最終的分類,以取得比單個分類器更好的性能。因此在一般情況下,集成學(xué)習(xí)預(yù)測效果均要優(yōu)勝于絕大多數(shù)機器學(xué)習(xí)算法。

      但是目前大多數(shù)研究都是基于甲狀腺超聲圖像數(shù)據(jù),或者經(jīng)過挑選之后比較完整的文本特征數(shù)據(jù),再采用已有的機器學(xué)習(xí)方法直接送入模型訓(xùn)練,而卻未曾考慮到真實醫(yī)療數(shù)據(jù)的稀疏性和不平衡性問題,因此得到的結(jié)果都存在一定的改進余地與完善空間。進一步研究可知,醫(yī)療數(shù)據(jù)的稀疏性主要體現(xiàn)在數(shù)據(jù)提取的缺失性上,由于患者病癥的不同,提取的規(guī)則不同,難免會導(dǎo)致許多缺失數(shù)據(jù),也即稀疏數(shù)據(jù)。而不平衡性則體現(xiàn)在患者的實際診斷結(jié)果上,由于大部分結(jié)節(jié)都是良性結(jié)節(jié),造成數(shù)據(jù)中良惡性樣本失衡。

      為此,本文通過在目標函數(shù)中加入自定義項對集成學(xué)習(xí)算法來設(shè)計實現(xiàn)改進,提出一種基于改進集成學(xué)習(xí)的甲狀腺結(jié)節(jié)良惡性鑒別方法,最大程度上消除數(shù)據(jù)的稀疏性和不平衡性對實驗結(jié)果造成的影響,同時提高預(yù)測結(jié)果準確率。具體而言,該方法主要包括:在真實醫(yī)療數(shù)據(jù)集上,先通過有放回的抽樣方法獨立地從數(shù)據(jù)集大類樣本集中隨機抽取多個樣本子集,使每次隨機抽取的樣本數(shù)量與小類樣本數(shù)量一致,再將各抽取的樣本子集分別與小類樣本集組合成多個新的訓(xùn)練樣本集。對多個新樣本集的特征子集以集成學(xué)習(xí)的方式采用投票機制進行投票,數(shù)據(jù)集的最終特征子集以得票數(shù)目超過半數(shù)的特征共同組合而成[2]。然后利用改進的Boosting算法,在節(jié)點分裂過程中自動利用特征的稀疏性,加快模型訓(xùn)練速度。實驗結(jié)果表明,本算法相對于已有的機器學(xué)習(xí)方法具有更高的準確率,在真實醫(yī)療數(shù)據(jù)集和UCI標準數(shù)據(jù)集上分別達到92.43%和94%。

      文章第1節(jié)概述了在甲狀腺結(jié)節(jié)判別方面的相關(guān)研究;第2節(jié)展現(xiàn)了對數(shù)據(jù)的基礎(chǔ)預(yù)處理設(shè)計;第3節(jié)具體描述了改進的Boosting算法;第4節(jié)通過與傳統(tǒng)機器學(xué)習(xí)方法的實驗對比,論證本算法的優(yōu)異性;第5節(jié)給出本文的結(jié)論并對未來工作做出展望。

      [BT4]1相關(guān)工作

      通過機器學(xué)習(xí)方法提高對疾病的診斷預(yù)測準確率已經(jīng)成為智慧醫(yī)療的一個重要實現(xiàn)途徑,當(dāng)下則有很多學(xué)者在甲狀腺結(jié)節(jié)的診斷分類方面開啟、并推進了相關(guān)研究。具體展開如下。

      在數(shù)據(jù)的不平衡性處理上,David Masko對正例樣本進行過抽樣處理,人工注入樣本使得正例樣本的數(shù)目增加,使得正負樣本達到平衡[3];Rok Blagus對少數(shù)類數(shù)據(jù)集規(guī)劃執(zhí)行數(shù)據(jù)預(yù)處理后,即運用過抽樣和欠抽樣相結(jié)合的改進方法,再利用交叉驗證的方法來得到效果驗證,改進效果明顯[4]。

      在甲狀腺結(jié)節(jié)的預(yù)測鑒別研究上,熊偉等人提出了一種利用局部紋理特征與多示例學(xué)習(xí)相結(jié)合的方法,從感興趣區(qū)域提取其局部紋理特征,將感興趣區(qū)域看作由所有局部特征構(gòu)成的示例包,最后利用KNN算法來實現(xiàn)對甲狀腺結(jié)節(jié)的分類,準確率達85.59%[5];Jieming Ma等人提出一種基于SVM的甲狀腺結(jié)節(jié)預(yù)測方法,并且為了防止模型的過擬合,在普通SVM模型的代價函數(shù)中加入懲罰項生成設(shè)計優(yōu)化,準確率達86.6%[6];李前程等人將結(jié)節(jié)的良惡性作為因變量,以超聲表現(xiàn)作為自變量,采用二分類logistic 回歸分析篩選出對甲狀腺結(jié)節(jié)良惡性有顯著鑒別作用的超聲指標并建立回歸模型,準確率可達89.91%[7];張振宇等人對基于k-means聚類的動態(tài)集成算法研究了創(chuàng)新改進,提出了一種選擇加權(quán)動態(tài)集成方法,采用多個分類器進行并聯(lián)集成,以此來增加分類模型的穩(wěn)定性,準確率則達到了90.2%[8]。

      [BT4]2數(shù)據(jù)預(yù)處理

      針對甲狀腺結(jié)節(jié)患者治療的臨床經(jīng)驗以及某三甲醫(yī)院患者的實際超聲指標特征,實驗前先將非結(jié)構(gòu)化的醫(yī)療數(shù)據(jù)進行結(jié)構(gòu)化處理[9],提取出研究需要的指標以及對應(yīng)的文本描述。然后將表示特征指標程度的文本變量轉(zhuǎn)換為算法能夠處理的數(shù)值型變量[10]。

      為了降低信息重疊造成的結(jié)果失真,研究中利用主成分分析法對諸多的特征作出選擇,在最大化保留原始數(shù)據(jù)信息的前提下,去除不必要的特征,提升模型訓(xùn)練速度和結(jié)果準確度。首先對原始數(shù)據(jù)設(shè)定修正達到標準化,計算其相關(guān)系數(shù)矩陣,求出特征值與特征向量,然后選取累計貢獻率達到85%以上的特征值對應(yīng)的主成分,替換原始特征變量[11]。[JP2]經(jīng)過主成分分析后,選擇使用血流模式、血供程度、回聲分布、包膜接觸面積、甲狀腺實質(zhì)血供、結(jié)節(jié)邊界等16項指標作為輸入特征變量,以其對應(yīng)的結(jié)節(jié)病理診斷結(jié)果作為預(yù)測輸出變量。[JP]

      在數(shù)據(jù)平衡性方面,研究則利用改進的SMOTE算法對惡性結(jié)節(jié)樣本進行過抽樣處理,人工注入樣本使得樣本數(shù)量增加;對良性結(jié)節(jié)樣本進行欠抽樣處理,將譜聚類算法引入其中,選取樣本的子集即可使數(shù)據(jù)集在良惡性樣本的數(shù)目上趨于平衡,提高試驗結(jié)果的準確性。

      4實驗結(jié)果與模型評估

      [BT5]4.1參數(shù)確定

      為了找到算法的最優(yōu)結(jié)果,需要通過實驗確定各參數(shù)的最佳值。一般情況下,各參數(shù)需要同時考慮,才能得到全局最優(yōu)值,但是考慮到此處的特殊性,當(dāng)?shù)螖?shù)足夠大時,模型的分類準確率趨于穩(wěn)定,因此實際調(diào)參過程中通過設(shè)置足夠大的迭代次數(shù)、如1 000次,可以得到最優(yōu)的樹深度,然后在此最優(yōu)深度下選擇最優(yōu)的迭代次數(shù),避免不必要的空間和時間浪費。在此,將給出預(yù)測準確率與樹深度間的對應(yīng)關(guān)系,如圖1所示。

      從圖1中可看出,當(dāng)樹深度為3時,模型的預(yù)測準確率達到最大,具體為92.43%。分析原因在于:原則上當(dāng)樹深度增加時,模型復(fù)雜度也隨之增加,對數(shù)據(jù)的分類也就越準確,但當(dāng)樹深度達到一定數(shù)量(在這里是3)后,再增加樹深度只會造成過擬合,在測試集上的準確率反而會出現(xiàn)下降。

      接下來,研究中進一步給出了預(yù)測準確率與迭代次數(shù)之間的統(tǒng)計關(guān)系,結(jié)果示意如圖2所示。

      從圖2可以看出,當(dāng)?shù)螖?shù)達到400次以后,預(yù)測準確率達到最大,具體為92.43%。至此,本模型參數(shù)確定為樹深度為3,迭代次數(shù)為400次。

      [BT5]4.2模型評估

      模型評估是檢驗設(shè)計模型是否具有使用價值的重要依據(jù),是模型建立過程中必不可少的基礎(chǔ)有益環(huán)節(jié)。本文擬將從混淆矩陣和ROC圖像兩個方面進行模型評估。

      4.2.1混淆矩陣

      混淆矩陣主要用于比較模型預(yù)測值同實際真實值之間的差別,是一種常用且有效的模型評估方法[13]。實驗以297名患者的數(shù)據(jù)作為測試集,對比預(yù)測值與實際值之間的差別。實驗結(jié)果如表1所示。

      從表1可以看出,算法預(yù)測準確率達到92%。其中惡性結(jié)節(jié)預(yù)測準確率達到86%,召回率達到96%,也就是說幾乎所有的惡性結(jié)節(jié)患者都能獲得正確識別。作為對比,該醫(yī)院的真實臨床數(shù)據(jù)卻清晰地顯示出,被醫(yī)生診斷為惡性結(jié)節(jié)并實施相應(yīng)手術(shù)治療的患者中,實際惡性患者占比僅為63%。

      4.2.2ROC圖

      ROC(受試者工作特征)曲線常常用來檢查在找出真陽性和避免假陽性之間的權(quán)衡,曲線上的點表示不同假陽性閾值上的真陽性的比例。簡單來說,ROC曲線下面積越大,模型效果越好[14]。本次研究模型的ROC曲線則如圖3所示。

      從圖3可以看出,ROC曲線距離完美情況比較接近,經(jīng)計算也可得出AUC(ROC曲線下面積)為0.935,說明模型預(yù)測性能非常好。

      4.3算法對比

      為了驗證本算法的實際性能,本文選擇了3種常用的數(shù)據(jù)挖掘模型展開對比測試。實驗采用真實臨床醫(yī)療數(shù)據(jù)和UCI標準數(shù)據(jù)集new-thyroid分別進行分類預(yù)測效果對比,且各模型都選取最佳參數(shù)下的效果,對比結(jié)果如表2、表3所示。

      從表2、表3中可以看出,本文提出的方法預(yù)測準確率較之前已有的研究方法均呈現(xiàn)有一定程度的提高,證明了本文算法的優(yōu)異之處,對于疾病的診斷預(yù)測研究有一定的幫助。

      [BT4]5結(jié)束語

      近年來,甲狀腺疾病、尤其是甲狀腺結(jié)節(jié)的診治醫(yī)療已然成為研究學(xué)界的一個重點課題。如何在臨床施診過程中能夠有效提高良惡性結(jié)節(jié)的診斷準確率,正確及時制定、推薦治療方案,無論對患者的病情進展控制還是對醫(yī)療資源的合理配置都將具有重要的意義。本文提出的改進的Boosting算法,在真實醫(yī)療數(shù)據(jù)集和UCI標準數(shù)據(jù)集上都呈現(xiàn)出一定的優(yōu)異性,具有較高的預(yù)測正確率。并且考慮到實際醫(yī)療數(shù)據(jù)的不平衡性和稀疏性,使結(jié)果更具說服力、及優(yōu)良可行性。

      未來的工作主要從3個方向入手:首先,在更趨宏觀科學(xué)的指導(dǎo)下確定鑒別結(jié)節(jié)良惡性的特征屬性;考慮其他忽略的特征屬性對鑒別結(jié)果的影響。其次,提升特征屬性的質(zhì)量;包括特征屬性的提取、轉(zhuǎn)換和選擇。最后,要重視算法的優(yōu)化,針對醫(yī)療數(shù)據(jù)的特征作出相應(yīng)的模型優(yōu)化,讓算法對數(shù)據(jù)集分類的結(jié)果更具普適性和高效實用性。

      [HS1*2][HT5H]參考文獻:[HT]

      [WTBZ][ST6BZ][HT6SS][1] [ZK(#〗

      [HJ*2]

      [JP3]HAUGEN B R, ALEXANDER E K, BIBLE K C, et al. 2015 American Thyroid Association[JP] Management Guidelines for adult patients with Thyroid Nodules and Differentiated Thyroid Cancer[J]. Thyroid, 2016, 26(1): 1-133.

      [2]鄒權(quán),郭茂祖,劉揚,等. 類別不平衡的分類方法及在生物信息學(xué)中的應(yīng)用[J]. 計算機研究與發(fā)展, 2010,47(8):1407-1414.

      [3] Masko D, Hensman P. The impact of imbalanced training data for convolutional neural networks[D]. Stockholm:KTH Royal Institute of Technology, 2015.

      [4] LUSA L. Joint use of overand undersampling techniques and crossvalidation for the development and assessment of prediction models[J]. BMC bioinformatics, 2015, 16(1): 1-10.

      [5]熊偉,龔勛,羅俊,等.基于局部紋理特征的超聲甲狀腺結(jié)節(jié)良惡性識別[J]. 數(shù)據(jù)采集與處理, 2015,30(1):186-191.

      [6] MA J, LUO S, DIGHE M, et al. Differential diagnosis of thyroid nodules with ultrasound elastography based on support vector machines[C]// Ultrasonics Symposium (IUS), 2010 IEEE. San Diego, California, USA: IEEE, 2010:1372-1375.

      [7] 李前程,孫麗娜,吳雙,等. 高頻超聲及彈性成像對甲狀腺結(jié)節(jié)性質(zhì)鑒別診斷的logistic 回歸分析[J]. 中國地方病防治雜志, 2015,30(4):291-293.

      [8] 張振宇. 改進集成技術(shù)在甲狀腺超聲圖像分類中的應(yīng)用研究[D]. 保定:河北大學(xué), 2014.

      [9] 陳德華,馮潔瑩,樂嘉錦,等. 中文病理文本的結(jié)構(gòu)化處理方法研究[J]. 計算機科學(xué),2016,43(10):272-276.

      [10] 戚湧,陳俊,李千目. 基于冗余消除和屬性數(shù)值化的XACML策略優(yōu)化方法[J]. 計算機科學(xué),2016,43(2):163-168.

      [11]Furuya S, Tominaga K, Miyazaki F, et al. Losing dexterity: patterns of impaired coordination of finger movements in musician's dystonia[EB/OL]. [2015-08-20]. http://sci Rep.2015;5:13360.

      [12]Chen T, Guestrin C. XGBoost: A Scalable Tree Boosting System[EB/OL]. [2016-03-09].https://arxiv.org/pdf/1603.02754v1.pdf.

      [13]DENG X, LIU Q, DENG Y, et al. An improved method to construct basic probability assignment based on the confusion matrix for classification problem[J]. Information Sciences, 2016, s340/341:250-261.

      [14]FAWCETT T. An introduction to ROC analysis[J]. Pattern Recognition Letters, 2006, 27(8):861-874.

      猜你喜歡
      甲狀腺結(jié)節(jié)
      傳統(tǒng)甲狀腺切除術(shù)與小切口甲狀腺切除術(shù)治療甲狀腺結(jié)節(jié)的臨床探討
      蒙古族與漢族甲狀腺結(jié)節(jié)患病情況對比調(diào)查
      研究不同甲狀腺切除術(shù)在甲狀腺結(jié)節(jié)治療中的臨床效果
      甲狀腺結(jié)節(jié)的超聲診斷及治療
      健康體檢中超聲診斷甲狀腺結(jié)節(jié)的應(yīng)用價值
      甲狀腺結(jié)節(jié)與甲狀腺癌的臨床評估和處理
      超聲彈性成像與常規(guī)超聲診斷甲狀腺良惡性結(jié)節(jié)的對照研究
      超聲彈性應(yīng)變率與常規(guī)超聲鑒別甲狀腺結(jié)節(jié)的價值分析
      甲狀腺良惡性結(jié)節(jié)的超聲診斷與分析
      手術(shù)治療甲狀腺結(jié)節(jié)246例回顧分析
      贡嘎县| 儋州市| 新乐市| 慈利县| 顺义区| 谷城县| 石林| 旌德县| 鹰潭市| 新巴尔虎右旗| 靖边县| 普兰店市| 东兴市| 浮山县| 南召县| 百色市| 金昌市| 勃利县| 闽清县| 昆山市| 临沂市| 兴仁县| 冕宁县| 广汉市| 雷波县| 余庆县| 剑河县| 谢通门县| 张掖市| 广安市| 东方市| 东港市| 石柱| 云南省| 虎林市| 满洲里市| 安新县| 昭觉县| 芜湖县| 鲜城| 延庆县|