黃斌+盧金金+王建華+吳星明+陳偉海
摘 要:針對傳統(tǒng)物體識別算法中人工設(shè)計(jì)出來的特征易受物體形態(tài)多樣性、光照和背景的影響,提出了一種基于深度卷神經(jīng)網(wǎng)絡(luò)的物體識別算法。該算法基于NYU Depth V2場景數(shù)據(jù)庫,首先將單通道深度信息轉(zhuǎn)換為三通道;再用訓(xùn)練集中的彩色圖片和轉(zhuǎn)換后的三通道深度圖片分別微調(diào)兩個深度卷積神經(jīng)網(wǎng)絡(luò)模型;然后用訓(xùn)練好的模型對重采樣訓(xùn)練集中的彩色和深度圖片提取模型第一個全連接層的特征,并將兩種模態(tài)的特征串聯(lián)起來,訓(xùn)練線性支持向量機(jī)(LinSVM);最后將所提算法應(yīng)用到場景理解任務(wù)中的超像素特征提取。所提方法在測試集上的物體分類準(zhǔn)確度可達(dá)到91.4%,比SAE-RNN方法提高4.1個百分點(diǎn)。實(shí)驗(yàn)結(jié)果表明所提方法可提取彩色和深度圖片高層特征,有效提高物體分類準(zhǔn)確度。
關(guān)鍵詞:計(jì)算機(jī)視覺;卷積神經(jīng)網(wǎng)絡(luò);特征提取;線性支持向量機(jī);物體識別;場景理解
中圖分類號:TP391.4
文獻(xiàn)標(biāo)志碼:A
文章編號:1001-9081(2016)12-3333-08