陳建 許青云 姚宜昌 郭慧林
摘要:隨著大數(shù)據(jù)時代的到來,一系列深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)已在圖像處理領(lǐng)域展現(xiàn)出巨大的優(yōu)勢,為了能夠及時跟蹤深度學(xué)習(xí)在圖像領(lǐng)域的最新發(fā)展,文章針對深度學(xué)習(xí)在圖像處理領(lǐng)域的相關(guān)研究。
關(guān)鍵詞:深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò);算法模型;圖像處理
中圖分類號:G4 文獻標識碼:A
一、概述
在當今信息飛速發(fā)展,數(shù)字圖像已滲透到社會生活的各角落,因此對圖像處理的需求也日益增長。同時身處于大數(shù)據(jù)時代,數(shù)字圖像產(chǎn)生的速度快和規(guī)模大,所以針對圖像信息處理任務(wù)也相應(yīng)地被要求具有高效率,高性能和智能化的特點。
深度學(xué)習(xí)是機器學(xué)習(xí)研究領(lǐng)域的重要途徑,旨在研究如何從數(shù)據(jù)中自動地提取多層次特征表示,核心思想是通過數(shù)據(jù)驅(qū)動的方式,采用一系列的非線性變換,從原始數(shù)據(jù)中提取多層次多角度特征,從而使獲得的特征具有更強的泛化能力和表達能力,滿足了高效圖像處理的需求。
為滿足圖像處理問題的各類需求,以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)理論不斷取得突破,本文結(jié)合深度學(xué)習(xí)基本原理,對其在圖像處理領(lǐng)域的算法,模型甚至方法的演化和創(chuàng)新進行重點論述。
二、深度學(xué)習(xí)
(一)深度學(xué)習(xí)的背景
神經(jīng)網(wǎng)絡(luò)在二十20世紀50年代被提出,因當時網(wǎng)絡(luò)訓(xùn)練算法理論欠缺、訓(xùn)練樣本不足和電腦的計算能力不足,神經(jīng)網(wǎng)絡(luò)發(fā)展遇到瓶頸。隨著云計算、大數(shù)據(jù)時代的到來,計算能力的大幅提高可緩解訓(xùn)練的低效性,訓(xùn)練數(shù)據(jù)過擬合的風(fēng)險降低,再結(jié)合無監(jiān)督逐層訓(xùn)練策略和BP算法,使得訓(xùn)練很深層的神經(jīng)網(wǎng)絡(luò)變得可能,深度學(xué)習(xí)開始被廣泛關(guān)注。典型深度學(xué)習(xí)模型就是深層的神經(jīng)網(wǎng)絡(luò)。多隱層堆疊,每一層都對上一層的輸出進行處理,從而把最初始的輸入與輸出目標之間不太密切的聯(lián)系,轉(zhuǎn)化為更為密切的表示,使得原來僅基于最后一層輸出映射難以完成的任務(wù)變?yōu)榭赡?,這種學(xué)習(xí)模式即為自動的“特征學(xué)習(xí)”。
(二)卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
圖像識別是深度學(xué)習(xí)最早嘗試的領(lǐng)域,其中卷積神經(jīng)網(wǎng)絡(luò)發(fā)揮了巨大的作用。一般卷積神經(jīng)網(wǎng)絡(luò)由卷積層,池化層,全連接層這三種類型的層堆疊組成,每個層都有其獨有的特點和作用:
1. 卷積層:提取特征,輸入特征圖 X 與 K 個二位濾波器進行卷積運算輸出 K 個二維特征圖。采用卷積運算有兩點好處:提取相鄰像素之間的局部關(guān)系;對圖像上的平移、旋轉(zhuǎn)和尺度等變換具有一定的魯棒性。
2. 池化層:處理卷積層輸出的結(jié)果,對輸入的特征圖進行壓縮,一方面使特征圖變小,簡化網(wǎng)絡(luò)計算復(fù)雜度;另一方面精簡特征圖,提取主要特征,降低特征表達維度的同時,也對平移和扭曲等較小形變具有魯棒性。
3. 全連接層:連接所有特征,將輸出值送給分類器。
三、深度學(xué)習(xí)在圖像領(lǐng)域的應(yīng)用
(一)圖像識別
深度學(xué)習(xí)技術(shù)最先是被應(yīng)用到圖像識別方向,并取得了引人矚目的效果。Alex 等人提出的 Alex Net 網(wǎng)絡(luò)是第一個用于圖像識別的深層卷積神經(jīng)網(wǎng)絡(luò),后續(xù)一系列圖像識別方面的深度學(xué)習(xí)發(fā)展都是以此為基礎(chǔ),相比于傳統(tǒng)的CNN 結(jié)構(gòu),Alex Net 網(wǎng)絡(luò)變得更深更寬,該網(wǎng)絡(luò)由 5 個卷積層和 3 個全連接層依次疊加組成。Alex Net 網(wǎng)絡(luò)確立了深度學(xué)習(xí)(深度卷積網(wǎng)絡(luò))在圖像識別的統(tǒng)治地位,也定義了深度學(xué)習(xí)模型在圖像處理領(lǐng)域的一般性主體架構(gòu)———前饋卷積神經(jīng)網(wǎng)絡(luò):卷積層與池化層多樣化相互堆疊作為特征提取器,隨后連接多層全連接層,作為分類器,信息流方向固定而單一。
(二)圖像取證
圖像的完整周期包含三個部分:圖像獲取、圖像編碼、圖像編輯。
圖像取證的出發(fā)點是通過提取圖像在上述三周期中留下的固有痕跡(指紋特性)來分析和理解圖像的操作歷史。
1.深度學(xué)習(xí)的簡單遷移
目前深度學(xué)習(xí)在圖像取證方向研究還很少。Baroffio等人直接將圖像識別方向的深度學(xué)習(xí)模型應(yīng)用到相機源取證問題中,因為圖像在獲取過程中由不同相機拍攝都會留下相應(yīng)相機的指紋特性,所以他們采用類 Alex Net 網(wǎng)絡(luò)結(jié)構(gòu)的簡單深度學(xué)習(xí)模型來提取相機的指紋特性并加以分類,取得了 94%以上的相機模式分類的準確率。
2. 網(wǎng)絡(luò)輸入
圖像取證不同于圖像識別的地方在于識別是區(qū)分圖像內(nèi)容里的差異,肉眼可以察覺到,而取證則是區(qū)分圖像中以微弱信號存在的操作指紋,類間形態(tài)的差異微乎其微,所以對于圖像取證問題一般的深度學(xué)習(xí)模型不能勝任。因此 Chen 等人對深度學(xué)習(xí)模型做出了一些改變,在類 Alex Net 網(wǎng)絡(luò)結(jié)構(gòu)前添加了一個預(yù)處理層,放大了取證想要的指紋特征。相比沒有預(yù)處理層,實驗結(jié)果準確率提升了 7.22%。圖像取證的性質(zhì)必然決定了網(wǎng)絡(luò)輸入的改變,只有放大了想要提取的指紋特征,深度學(xué)習(xí)模型才能更好地充當一個特征提取和分類器。
3.適應(yīng)取證的結(jié)構(gòu)
針對一般取證問題,圖像的預(yù)處理顯然是必不可少的,但額外添加一個預(yù)處理層又顯累贅,所以Ni等人u提出了一種針對隱寫分析取證的深度學(xué)習(xí)模型,將預(yù)處理整合進網(wǎng)絡(luò)結(jié)構(gòu)中。Ni等人用30個空間富模型濾波器初始化第一層卷積核,使得第一層卷積操作兼顧預(yù)處理功能。僅管取證問題不同于識別問題,但學(xué)習(xí)模型由繁到簡是個必然的趨勢,相比于圖像識別,深度學(xué)習(xí)在圖像取證上的研究才剛剛開始,越來越多適應(yīng)取證的深度學(xué)習(xí)模型結(jié)構(gòu)將會被提出,簡化圖像取證的流程。
(三)圖像檢測
圖像檢測相比于圖像識別,不僅要識別出圖片中的物體,還要定位物體處于圖片中什么位置。
1.多模塊堆疊
RCNN模型n是利用深度學(xué)習(xí)進行圖像檢測的第一個深度學(xué)習(xí)網(wǎng)絡(luò)模型,和圖像取證一樣,在研究的初期,單純的深度學(xué)習(xí)模型并不能實現(xiàn)檢測的目的。RCNN模型由四個模塊組成:Cv用Selective Search算法使每張圖像生成1K}2K個候選區(qū)域;C2J對每個候選區(qū)域,使用深度學(xué)習(xí)技術(shù)提取特征;C3)將特征送入每一類的SVM分類器,判別是否屬于該類;C4)使用線性回歸器精細修正候選框位置。從中可以看出深度學(xué)習(xí)模塊只起到了特征提取器的作用,這也是一開始各個領(lǐng)域應(yīng)用深度學(xué)習(xí)的出發(fā)點,雖然是簡單的運用,但仍然在目標檢測競賽上取得突破性進展。
2.模塊合并
緊接著RCNN模型,Girshick相繼提出了fast RCNN模型和faster? RC NN模型。后續(xù)模型充分運用了深度學(xué)習(xí)知識,將所有模塊逐步整合進深度學(xué)習(xí)模型中,原本各自單獨的模型整合到一體后可以在網(wǎng)絡(luò)訓(xùn)練時相互約束,共同最小化整個網(wǎng)絡(luò)的損失函數(shù),推動整個深度學(xué)習(xí)網(wǎng)絡(luò)朝更好的方向發(fā)展。
四、小結(jié)
深度學(xué)習(xí)在圖像領(lǐng)域主要以卷積神經(jīng)網(wǎng)絡(luò)研究為主,但卷積運算注定整個網(wǎng)絡(luò)將會有很大的計算量,導(dǎo)致網(wǎng)絡(luò)訓(xùn)練花費時間非常長,改變卷積運算形式簡化計算復(fù)雜度也將會成為一大發(fā)展方向。
江西教育廳科技項目:大數(shù)據(jù)時代基于深度學(xué)習(xí)的車型識別研究與應(yīng)用(GJJ191193)
參考文獻
[1]丁美昆,徐星琳,蔣財軍.深度信念網(wǎng)絡(luò)研究綜述[J].工業(yè)控制計算機,2016
[2]常甜甜.支持向量機學(xué)習(xí)算法若干問題的研究[D].西安:西安電子科技大學(xué),2010.
文章編號:(2021)-16-