• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      深度學習在影像中的算法研究

      2021-08-09 11:50:30肖行
      智能計算機與應用 2021年3期
      關鍵詞:深度學習

      肖行

      摘 要: 深度學習技術的運用正日趨廣泛,深度學習自身的高效性和智能性受到研究者的青睞。通過對深度學習影像分類的剖析,進一步探究深度學習在影像識別方向的應用,介紹了主要用于影像分類識別的基于深度學習的醫(yī)療影像檢測算法,可作為開展深度學習技術運用于醫(yī)學影像檢測研究工作的有益參考。

      關鍵詞: 深度學習; 影像分類; 影像識別

      文章編號: 2095-2163(2021)03-0215-03 中圖分類號: TP391.41 文獻標志碼:A

      【Abstract】The use of deep learning technology is becoming more widespread, and the efficiency and intelligence of deep learning itself are favored by researchers.Through the analysis of deep learning image classification, the paper further explores the application of deep learning in the direction of image recognition, introduces the medical image detection algorithm based on deep learning, which is mainly used for image classification and recognition. The fruits could be used as a beneficial reference for the application of deep learning technology to medical imaging detection research work.

      【Key words】 deep learning; image classification; image recognition

      0 引 言

      在復雜的背景中,一幅圖像會具有許多對象。如何識別這些對象,辨識其中的主要對象,并理解主對象與其他對象之間的關系已然成為目前的研究熱點。對象識別有多種方法,但大部分都不能標記圖像的主要對象。研究可知,可以運用改進的RCNN[1]網絡來檢測和識別圖像中的多個對象,由此即提出了增強型的目標評分系統(tǒng)來標記圖像的主要對象。實驗結果表明,該算法不僅保持了RCNN的優(yōu)越性,而且能檢測到圖像的主要對象。

      近年來,基于計算機的圖像識別技術獲得迅猛的發(fā)展。與之相適應,在醫(yī)學領域就已對人工神經網絡的影像學識別展開大量研究。例如,在糖尿病視網膜病變的診斷中,有較高的診斷預測能力。在乳腺癌的診斷中,在乳腺癌中淋巴結轉移的病理診斷中,在胸部X射線的分類中,在食管胃十二指腸鏡檢查中分類等[2],均取得了可觀成果。需要指出的是,盡管人工智能技術被應用于預測manikins的氣道圖像的glottic開放,但在臨床實踐中獲得的患者的喉部圖像的語言開放或語言位置的研究卻仍不多見。

      氣管插管是一項重要的醫(yī)療程序,在自發(fā)性呼吸、氣道維護上存在困難,究其原因就是麻醉、全身麻醉和心肺問題。氣管插管是一種生命保存的程序,可在心臟、呼吸阻塞等情況下進行,具體來說就是當病患處于高危的呼吸、缺氧、通風不足、氣道阻塞的情況下。glottis是2個聲帶間的一個開口。在執(zhí)行插管時,應將塑料插管插入氣管中。然而,氣管導管有時插入不適當?shù)慕Y構,如食道,而不是glottis。如果氣管插管插入結構出現(xiàn)錯誤,就會導致嚴重的并發(fā)癥,如低氧血癥和心臟驟停[3]。因此,在插管時準確地識別glottis的位置是非常重要的。

      視頻喉鏡是一種將相機插入刀片的較為尖端的技術方法。視頻喉鏡可提高glottic的視覺化,減少食管插管突發(fā)事件的發(fā)生概率。關于視頻喉鏡檢查是否會增加第一次嘗試成功率,不同的研究結果仍存在差異。當前的一項研究中顯示,在視頻喉鏡檢查時,使用前醫(yī)院插管的成功率較低。此外,即使在視頻喉鏡檢查時,食管插管也會發(fā)生。單食管插管增加了脫氣、吸氣和心臟驟停的風險。

      1 ANNs的深度學習算法與反向傳播的區(qū)別

      在使用ANNs的臨床實踐中,嘗試探究了在此應用中去獲得氣道圖像的理論位置的預測模型。一個模仿動物神經元結構的ANN可應用于實現(xiàn)類似于大腦的功能。動物的實際學習過程永遠不會是非自然的數(shù)學理論,即如在反向傳播方法中一樣,也會有類似基于trial-and-error過程的生物進化的技術內容。因此,在本次研究中開發(fā)并應用了基于蒙特卡羅模擬的ANNs的一種新的深度學習算法。ANN包含了成千上萬個或更多的未知變量、權重因子和偏置值。這個新的深度學習算法是應用蒙特卡羅模擬的優(yōu)化過程,用來確定權重因子和偏差值,使學習數(shù)據的平均訓練誤差最小化[4]。

      對于反向傳播方法,采用梯度下降方法,通過多次使用全部或部分學習數(shù)據來確定結果數(shù)值,直到根據給定的學習速率訓練誤差達到最小為止。在此條件下,節(jié)點的偏壓值作為節(jié)點的附加權重因子,將其輸入值設定為1.0,而并不考慮偏差值是否為負的變化機制。本次研究的新算法具有與反向傳播方法完全不同的結構。在新的深度學習算法的情況下,當前ANN的所有學習數(shù)據的平均訓練誤差都是在訓練誤差達到最小的情況下反復計算的結果,而隨機選擇的權重因子和ANN的偏差值正在根據給定范圍內隨機選擇的delts值進行調整。當然,該算法無需計算訓練錯誤的梯度,或者在訓練階段使用所有或一部分學習數(shù)據的權重因素和偏差值來做調整,按小隨機量調整一個ANN的權重因子和偏壓值,而不是通過計算密集型梯度下降法分別應用于所有權重因子,是與反向傳播方法中在訓練期間的主要差異。因此,該算法簡單而高效,對計算資源的要求也不高。

      2 算法原理與實現(xiàn)

      ANN是一個連接的簡單計算元素集,稱為節(jié)點。通常,是一個多層的組織??偟貋碚f,可分為:一個輸入層、多個隱藏層和一個輸出層。對于深度學習方法而言,就代表著有些ANNs可能還會包括數(shù)百個或更多的隱藏層。輸入層中的每個節(jié)點,即輸入節(jié)點,將接收來自外部的輸入,并將其傳送給第一個隱藏層的所有節(jié)點。在本次研究中,考慮到氣道圖像大小和縱橫比的不同,先把圖像轉換成正方形,再將其分辨率降到100 × 100、70 × 70、50 × 50、45 × 45、40 × 40、35 × 35、30 × 30和 25 × 25像素,并且每組應用于ANN模型的輸入結構。ANN的輸入節(jié)點的數(shù)量就等于原始氣道圖像減少分辨率后的總數(shù)。每個輸入節(jié)點的輸入值是相應的像素值,即減少分辨率的氣道圖像??梢酝ㄟ^計算來獲得黑白彩色轉換過程中的像素值,此處會用到的數(shù)學公式可寫為:

      在此基礎上,將該值除以最大值255,即將其轉換為0~1.0之間的值。相同的過程應用于標記氣道的圖像,以獲得像素值,再將圖像分為7個橫截面和7個垂直截面。該分區(qū)共生成了49個具有標記氣道圖像的單元格。這些圖像被分為49個單元格,用來預測在氣道圖像中49個glottic的位置。

      3 實驗結果

      通過將訓練集和測試集劃分為2種類型的視圖:好視圖和差視圖,以預測選擇模型的氣道位置的訓練和測試精度,實驗結果見表1。

      表1中,準確預測率表示被預測的位置與glottis重疊;相鄰預測率表示8個相鄰的相等大小的正方形,被預測的位置與glottis重疊;不準確預測率表示被預測的位置與glottis不相鄰。

      對于訓練集,好視圖圖像數(shù)量是813,占81.3%;差視圖的圖像數(shù)量是187,占18.7%。對于測試集,好視圖的圖像數(shù)量為168,占84.0%;差視圖的圖像數(shù)量為32,占16.0%。對于好視圖而言,仿真得到的測試集的精確預測率為83.3%,測試集的預測率為78.6%。對于差視圖來說,測試集的準確預測率為55.6%,測試集的準確預測率為53.1%。

      4 結束語

      提出了一種新的基于人工神經網絡(ANNs)的深度學習算法。該方法與反向傳播方法完全不同。研究中隨機選擇一個ANN的權重因子和偏置值,并在訓練期間通過小隨機數(shù)來調整相應數(shù)值,不需要計算訓練誤差的梯度來調整權重因子。該算法應用于通過視頻氣道裝置獲得的氣道圖像中glottis的位置。在1 200個氣道圖像中,使用GlideScope R和纖維鏡檢查。對于隨機選取的1 000個訓練集數(shù)據, 利用上述算法訓練了84個ANN模型。尋求一個ANN模型,通過減少輸入圖像分辨率,將所有訓練設置的平均訓練誤差最小化。隨著分辨率的降低,平均訓練誤差降低到30×30像素的最低水平。最終,研究得到9-98-49 ANN有著最低訓練誤差,將其作為glottis位置的預測模型,得到了最高的學習速率。選定預測模型應用于剩余200個測試集數(shù)據,以獲取測試精度,仿真后得到的準確預測和相鄰預測率分別為74.5%和21.5%。將輸入圖像分辨率降低到適當水平,能更好地預測氣道圖像中的glottis位置。本文研發(fā)的ANN模型可以幫助臨床醫(yī)生通過顯示glottis的預測位置來進行插管。

      參考文獻

      [1]GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA:IEEE,2014:580-587.

      [2] 段琳琳. 基于深度學習的遙感影像分類研究[D]. 開封:河南大學,2018.

      [3] 左艷,黃鋼,聶生東. 深度學習在醫(yī)學影像智能處理中的應用與挑戰(zhàn)[J]. 中國圖象圖形學報,2021,26(2):305-315.

      [4] 張卡,宿東,王蓬勃,等. 深度學習技術在影像密集匹配方面的進展與應用[J]. 科學技術與工程,2020,20(30):12268-12278.

      猜你喜歡
      深度學習
      從合坐走向合學:淺議新學習模式的構建
      面向大數(shù)據遠程開放實驗平臺構建研究
      基于自動智能分類器的圖書館亂架圖書檢測
      搭建深度學習的三級階梯
      有體驗的學習才是有意義的學習
      電子商務中基于深度學習的虛假交易識別研究
      利用網絡技術促進學生深度學習的幾大策略
      考試周刊(2016年94期)2016-12-12 12:15:04
      MOOC與翻轉課堂融合的深度學習場域建構
      大數(shù)據技術在反恐怖主義中的應用展望
      深度學習算法應用于巖石圖像處理的可行性研究
      軟件導刊(2016年9期)2016-11-07 22:20:49
      双流县| 会宁县| 新巴尔虎右旗| 庆安县| 大兴区| 芒康县| 武安市| 名山县| 富宁县| 新宾| 板桥市| 大城县| 韶山市| 常熟市| 梅河口市| 平山县| 肥城市| 龙州县| 吐鲁番市| 陕西省| 榕江县| 阳江市| 凯里市| 富民县| 凤台县| 阿图什市| 溧水县| 固安县| 灵宝市| 鹿邑县| 商河县| 靖宇县| 海丰县| 定南县| 民丰县| 定陶县| 高邮市| 雅江县| 公主岭市| 长岛县| 南丹县|