• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      深度學習分類網(wǎng)絡(luò)研究及其在計算機視覺中的應用

      2022-07-16 08:18:10馬驥
      科學與財富 2022年4期
      關(guān)鍵詞:視覺深度學習計算機

      摘? 要:在通用人工智能中計算機視覺具有重要作用,主要表現(xiàn)在自動駕駛,智慧醫(yī)療和交通等方面。相比于傳統(tǒng)機器學習算法在計算機視覺中的應用效果,近年所研究的新型深度學習方法在計算機視覺研究領(lǐng)域取得新發(fā)展。本文主要是探討深度學習分類網(wǎng)絡(luò)研究及其在計算機視覺中的應用,希望能夠?qū)ο嚓P(guān)人員起到參考性價值。

      關(guān)鍵詞:深度學習;人工智能;計算機;視覺

      計算機視覺簡言之即是依靠電子設(shè)備成像來代替生物視覺系統(tǒng),隨后依靠提前寫好的程序?qū)Λ@取的圖像信息實施處理。該技術(shù)的短期應用目的在于完成相對簡單的智能視覺工作,而深度學習技術(shù)在計算機視覺領(lǐng)域的應用,在很大程度上豐富了其功能,提高了識別效率,讓其能夠在更多行業(yè)發(fā)揮出自身價值。

      1 深度學習分類網(wǎng)絡(luò)分析

      1.1 LeNet

      該分類網(wǎng)絡(luò)是由卷積神經(jīng)網(wǎng)絡(luò)發(fā)明人員所提出的第一個分類網(wǎng)絡(luò),主要可以識別支票上的手寫數(shù)字、整個網(wǎng)絡(luò)主要包含七層結(jié)構(gòu),下采樣為池化層,由于池化層不具備權(quán)值參數(shù),所以無法將其確定為計算層,這樣就導致網(wǎng)絡(luò)具有五層計算層。從某種程度上看,該網(wǎng)絡(luò)存在數(shù)個隱層。

      LeNet最后一層主要采用歐式徑向基函數(shù)單元,可以對前一層激活函數(shù)的飽和問題進行限制,減少梯度消失效應。所以從某種程度上看,LeNet是首個被成功訓練的深層神經(jīng)網(wǎng)絡(luò),然而由于此種方法代表性比較弱,因此多數(shù)學者不認可。

      1.2 AleNet

      該深度學習分類網(wǎng)絡(luò)主要包含激活函數(shù),局部響應歸一化和抑制過擬合、其中研究人員己經(jīng)發(fā)現(xiàn)激活函數(shù)的應用優(yōu)勢,在使用激活函數(shù)的同時能夠避免梯度消失,全面提升訓練速度、局部響應歸一化特性不需要處理海量數(shù)據(jù),以免其進入飽和區(qū)、抑制過擬合主要是對訓練數(shù)據(jù)進行擴增,平移和反轉(zhuǎn)線有訓練圖像,并且對訓練數(shù)據(jù)集進行擴充、對于后續(xù)連接中神經(jīng)元連接過多以及加劇過擬合問題,可以利用隨機丟棄方式減少過擬合。

      1.3 GoogLeNet

      GoogLeNet設(shè)計思路是將所有連接轉(zhuǎn)化為稀疏結(jié)構(gòu),此處所提及的稀疏結(jié)構(gòu)是基于Hebbin原理、該種深度學習分類網(wǎng)絡(luò)主要是使用龐大且稀疏的網(wǎng)絡(luò)表達數(shù)據(jù)集的分布情況,因此建立稀疏網(wǎng)絡(luò)的最佳方式在于將較高關(guān)聯(lián)性的節(jié)點進行聚類,之后將所有聚類節(jié)點連接在一起、按照此種原理展開設(shè)計就會產(chǎn)生GoogLeNet基礎(chǔ)結(jié)構(gòu)。

      在圖像中索選取的區(qū)域具備較高相關(guān)性的是區(qū)域周圍的像素,卷積操作可以有效連接像素。對于不同卷積核來說,其數(shù)對應的空間位置不同通道信息具有相關(guān)性、卷積核尺寸越小.不同通道信息相關(guān)性越高.能夠代表不同的感受視野。

      2 深度學習在計算機視覺中的應用

      2.1 深度學習在圖像分類中的應用

      現(xiàn)階段比較常見的用于圖像分類的數(shù)據(jù)集是 Image Net,它包含的素材十分豐富,大約有一千五百萬張高分辨率圖像,所有的圖像又被分為兩萬多個類別。Image Net 歷年舉行圖像分類比賽,在比賽中圖像分類的算法和技術(shù)也得到逐漸的進步和提高,提高圖像分類的正確率、準確率。

      具體的過程是卷積核中任一元素均可以成為權(quán)值參數(shù),乘以輸入圖像相應區(qū)域的像素值,再將得到的每一個乘積相加,利用激活函數(shù)最終得到輸出的像素。卷積神經(jīng)網(wǎng)絡(luò)的形式上通常表現(xiàn)為多通道特征圖的三階張量卷積操作,實際上卻是多個輸入的信號加權(quán)求和再作用于一個神經(jīng)元,最后實現(xiàn)激活輸出數(shù)據(jù)的過程。

      第 l 層的第 個特征圖矩陣 可能由前一層若干個特征圖卷積加權(quán)得到,一般可以表示為

      其中 , 為 神 經(jīng) 元 激 活 函 數(shù) ; 代 表 輸 入 特 征 圖 的組合, 表示卷積運算, 為卷積核矩陣, 偏置矩陣。經(jīng)常用到的神經(jīng)元激活函數(shù)有 sigmoid 函數(shù)、tanh 函數(shù)、ReLU函數(shù)等。

      2.2 深度學習在無人駕駛領(lǐng)域的應用

      對于無人駕駛領(lǐng)域來說,選擇激光或雷達這類傳感器的成本更高,基于深度學習的計算機視覺技術(shù)也能夠提供新的解決方案。依靠攝像機對視頻畫面進行采集,對獲取到的圖像實施分析,提供類似于前車碰撞預警等功能。

      在這一過程中,計算機視覺技術(shù)可以實現(xiàn)對目標的檢測識別、對目標車輛的跟蹤分析、對車道線是否偏離進行檢測等?;谏疃葘W習技術(shù)的檢測識別表現(xiàn)出更加強大的優(yōu)勢,現(xiàn)階段深度學習芯片日益增多,對于無人駕駛技術(shù)的發(fā)展也帶來了更加有力的支持。

      2.3 深度學習在面部識別中的應用

      隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,面部識別被廣泛運用到各個領(lǐng)域,企業(yè)、小區(qū)在安裝面部識別系統(tǒng)后,可通過人員面部的識別以此打開大門,在一定程度上確保安全;在醫(yī)院、學校、超市等安裝攝像監(jiān)視系統(tǒng)對過往的人群進行監(jiān)視,為公安破案工作提高了效率;通過人臉自動支付識別系統(tǒng),可在安裝有人臉識別自動支付的銀行、商場等為人們帶來便捷的支付功能。

      由于生理學與心理學特征與人們臉部存在變化性具有密切的聯(lián)系,所以,將人類視覺的特點與彈性建模進行相互的結(jié)合是十分有必要的,這不僅能為建立模型帶來良好的效果,而且還能在建立模型中突破剛體特性的特征帶來一定的效果。

      3 深度學習在計算機視覺領(lǐng)域未來發(fā)展趨勢

      深度學習在計算機視覺領(lǐng)域的應用研究已經(jīng)越來越廣泛和成熟,并在更多方面取得實際的價值,其中最主要的是體現(xiàn)在商用方面,比如人臉識別技術(shù),不僅可以用于手機等智能設(shè)備,也能用于門鎖等安全設(shè)置。

      在之后的發(fā)展中,其還將被應用到工業(yè)、軍事、航空航天等高精密度的領(lǐng)域內(nèi),當然,只要在進步過程中成本得以下降,它也更能造福百姓的日常生活,促進生活水平的提高。

      結(jié) 語

      深度學習技術(shù)在計算機視覺領(lǐng)域中應用的終極目標是為了讓機器可以和人類一樣,觀察并讀懂世界。近年來AI技術(shù)的不斷發(fā)展與普及應用,深度學習技術(shù)必然會在計算機視覺領(lǐng)域中發(fā)揮出更大的價值,為現(xiàn)代人的生活和工作帶來更多便利。

      參考文獻

      [1]龔方生. 基于深度學習的計算機網(wǎng)絡(luò)數(shù)據(jù)包路由策略[J]. 網(wǎng)絡(luò)安全技術(shù)與應用, 2021,12(5):3-5.

      [2]陳旭, 孟朝暉. 基于深度學習的目標視頻跟蹤算法綜述[J]. 計算機系統(tǒng)應用, 2019,45(6):14-16.

      [3]仇秋飛, 周武源, 雷良育,等. 深度學習在機器人領(lǐng)域的應用進展[J]. 計算機技術(shù)與發(fā)展, 2021, 31(11):8-10.

      作者簡介:馬驥、男、2001.02.08、安徽省滁州市瑯琊區(qū)、本科、西北工業(yè)大學、無,深度學習、計算機視覺。

      猜你喜歡
      視覺深度學習計算機
      計算機操作系統(tǒng)
      基于計算機自然語言處理的機器翻譯技術(shù)應用與簡介
      科技傳播(2019年22期)2020-01-14 03:06:34
      信息系統(tǒng)審計中計算機審計的應用
      消費導刊(2017年20期)2018-01-03 06:26:40
      MOOC與翻轉(zhuǎn)課堂融合的深度學習場域建構(gòu)
      大數(shù)據(jù)技術(shù)在反恐怖主義中的應用展望
      馬修·伯恩的舞蹈劇場美學:走向哥特之美
      演藝科技(2016年10期)2016-11-26 22:12:27
      深度學習算法應用于巖石圖像處理的可行性研究
      軟件導刊(2016年9期)2016-11-07 22:20:49
      淺析油畫色彩表現(xiàn)的理性化方式
      試論舞蹈與雜技的“跨界”現(xiàn)象
      戲劇之家(2016年19期)2016-10-31 18:51:06
      基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
      軟件工程(2016年8期)2016-10-25 15:47:34
      拉萨市| 陵水| 诸城市| 宜宾市| 广灵县| 山阴县| 高邮市| 瑞安市| 宁德市| 江陵县| 宜城市| 合水县| 门源| 蒲城县| 洛浦县| 慈溪市| 陇西县| 衡南县| 遂宁市| 台安县| 吴旗县| 高台县| 鄂州市| 专栏| 邵东县| 应城市| 潢川县| 庆城县| 鹤壁市| 宣威市| 澄江县| 大新县| 精河县| 乌苏市| 涪陵区| 北流市| 东城区| 图木舒克市| 泸州市| 库伦旗| 西昌市|