• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      LSTM—RBM—NMS模型下的視頻人臉檢測方法研究

      2019-05-24 14:11:40田桂謝凱
      電腦知識與技術(shù) 2019年4期
      關(guān)鍵詞:長短期記憶網(wǎng)絡(luò)

      田桂 謝凱

      摘要:為提高視頻人臉檢測的準確性,我們提出了LSTM-RBM-NMS模型下的視頻人臉檢測方法。該模型首先利用公開的視頻人臉數(shù)據(jù)集輸入長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)網(wǎng)絡(luò)中,在 LSTM網(wǎng)絡(luò)中加入批量歸一化(Batch Normalization, BN)算法,在預訓練的模型中,采用受限玻爾茲曼機代替全連接層。然后將預訓練好的模型去除softmax分類器,使用支持向量機(Support Vector Machine, SVM)分類器進行代替,最后采用非極大值抑制算法消除多余的窗口,最后得到視頻人臉檢測結(jié)果。實驗結(jié)果表明,通過使用本文提出的LSTM-RBM-NMS模型,與傳統(tǒng)的視頻人臉檢測方法OpenCV和Viola Jones(VJ)相比,在相同閾值的情況下,視頻人臉檢測準確率提高了3.3%~10.4%。

      關(guān)鍵詞:視頻人臉檢測;長短期記憶網(wǎng)絡(luò);批量歸一化算法;受限玻爾茲曼機;非最大抑制算法

      中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2019)04-0176-02

      目前用戶進行身份驗證的方法主要是基于PIN模式的,這只在初始登錄期間提供身份驗證。用戶在注冊時設(shè)定的密碼,很容易被網(wǎng)絡(luò)攔截,進而被黑客破解,因此使用密碼進行用戶身份認證是極其不安全的。近年來,使用生物特征進行用戶認證已經(jīng)成為主流,例如基于觸摸手勢的系統(tǒng)、基于人臉的系統(tǒng)[1]和基于語音系統(tǒng)。近年來,隨著硬件設(shè)備更新地越來越快,對機器學習領(lǐng)域中的深度學習的探討已經(jīng)成了一種潮流。目前圖像處理最好的算法就是深度學習。與之相比,深度學習則能自動地對特征進行提取和表示,而且一個高效的神經(jīng)網(wǎng)絡(luò)框架可以對抽象物體進行解釋和分析。近十年來,許多學者對深度學習[2]的算法性能進行了優(yōu)化,設(shè)計了卷積神經(jīng)網(wǎng)絡(luò)的最優(yōu)結(jié)構(gòu)框架。例如,Matthew Zeiler和Rob Fergus在神經(jīng)網(wǎng)絡(luò)中加入了批量歸一化算法[3],它是一種非常有效的深度學習技術(shù),極大地加快網(wǎng)絡(luò)收斂的速度。然而,近年來一些研究學者逐漸從圖像處理領(lǐng)域研究到視頻處理領(lǐng)域,與靜態(tài)圖像人臉檢測相比,視頻中的人臉具有更多的空間信息,包括無約束的姿態(tài)變化、光照變化、對象遮擋等。一些傳統(tǒng)的視頻處理方法可以在受限場景下工作,但無法處理各種變化的復雜場景。視頻人臉的處理非常復雜。而長短期記憶網(wǎng)絡(luò)[4]是針對視頻處理提出的。根據(jù)以往的研究證明,深度學習在語音識別、人臉識別、圖像分類、目標檢測[5]等領(lǐng)域取得了重大進步。

      1 本文模型

      針對視頻中的人臉檢測,本文采用長短期記憶網(wǎng)絡(luò)進行特征提取,本文的模型如圖1所示。

      我們將公開視頻數(shù)據(jù)集分為訓練集和測試集,采用訓練集進行訓練LSTM網(wǎng)絡(luò),在訓練的過程中,加入歸一化層,加快訓網(wǎng)絡(luò)的收斂速度,同時使用隨機池化層進行降維。我們采用RBM代替全連接層,進一步對提取的特征向量進行降維,這樣就可以減少計算代價。我們將預訓練好的模型,移除softmax分類器用于視頻人臉的測試集上進行提取人臉的深度特征,將這些特征采用SVM分類器進行分類,SVM分類器泛化能力強,精度高。最后采用非最大抑制算法去除交叉重復,最后得到視頻人臉檢測的結(jié)果。

      2 實驗結(jié)果和分析

      本文采用兩個公開的數(shù)據(jù)集,即YouTube視頻人臉數(shù)據(jù)集和IJB-A視頻人臉數(shù)據(jù)集。我們知道人臉檢測,閾值的選擇是非常重要的。因為閾值的大小將會影響人臉檢測的準確性,所以分別選擇不同的閾值來進行實驗。根據(jù)圖2,我們可以看出,準確率與人臉檢測閾值成反比,即隨著人臉檢測閾值的增大,準確率反而呈現(xiàn)下降趨勢。

      從圖中可以看出,值得注意的是閾值在0.1處時,人臉檢測的準確率最高,而在0.3到0.5之間,可以看出準確率下降的最快。在相同的閾值條件下,本文方法比其他方法具有更高的準確性。

      3 結(jié)論

      本文提出的LSTM-RBM-NMS模型下的視頻人臉檢測方法,我們采用公開的兩個數(shù)據(jù)集預訓練的LSTM網(wǎng)絡(luò),同時加入歸一化算法,加快了網(wǎng)絡(luò)的收斂速度,采用RBM替換全連接層,降低了特征維度,即減少了計算代價,將預訓練好的模型去除softmax分類器,采用SVM分類器替代用于檢測的視頻人臉幀上,,采用非最大抑制算法,獲得最好的人臉檢測區(qū)域,與傳統(tǒng)的方法相比,該模型極大地減少了網(wǎng)絡(luò)參數(shù),加快了視頻人臉檢測的速度,同時提高了視頻人臉檢測的準確率。

      參考文獻:

      [1] 廖延娜,馬超.基于稀疏表示的人臉識別系統(tǒng)設(shè)計與實現(xiàn)[J].電子設(shè)計工程,2016,24(17):153-155.

      [2] 丁冬兵.TL-CNN-GAP模型下的小樣本聲紋識別方法研究[J].電腦知識與技術(shù),2018(24).

      [3] 張杰,陳懷新.基于歸一化詞頻貝葉斯模型的文本分類方法[J].計算機工程與設(shè)計,2016, 37(3):799-802.

      [4] 陳斌,周勇,劉兵.基于卷積長短期記憶網(wǎng)絡(luò)的事件觸發(fā)詞抽取方法[J].計算機工程,2018(9).

      [5] 李旭冬,葉茂,李濤.基于卷積神經(jīng)網(wǎng)絡(luò)的目標檢測研究綜述[J].計算機應用研究,2017, 34(10):2881-2886.

      【通聯(lián)編輯:唐一東】

      猜你喜歡
      長短期記憶網(wǎng)絡(luò)
      基于注意力機制的卷積 雙向長短期記憶模型跨領(lǐng)域情感分類方法
      計算機應用(2019年8期)2019-10-23 12:23:56
      基于深度學習的電子病歷實體標準化
      軟件導刊(2019年8期)2019-10-15 02:21:53
      基于深度學習的電子病歷命名實體識別的研究與實現(xiàn)
      軟件(2019年8期)2019-10-08 11:55:52
      基于長短期記憶的車輛行為動態(tài)識別網(wǎng)絡(luò)
      計算機應用(2019年7期)2019-09-04 10:14:27
      基于層次注意力機制神經(jīng)網(wǎng)絡(luò)模型的虛假評論識別
      計算機應用(2019年7期)2019-09-04 10:14:27
      基于多注意力多尺度特征融合的圖像描述生成算法
      計算機應用(2019年2期)2019-08-01 01:57:38
      基于注意力機制的行人軌跡預測生成模型
      計算機應用(2019年3期)2019-07-31 12:14:01
      從餐館評論中提取方面術(shù)語
      多種算法對不同中文文本分類效果比較研究
      軟件導刊(2019年5期)2019-05-24 14:17:58
      餐飲業(yè)客流預測的深度聯(lián)合模型
      商情(2018年47期)2018-11-26 09:12:38
      防城港市| 罗源县| 乌拉特中旗| 宁陵县| 民丰县| 阳高县| 肇州县| 南城县| 齐河县| 富平县| 荣昌县| 汉沽区| 凤山市| 山阳县| 鹤山市| 辉县市| 南宁市| 霞浦县| 博野县| 石嘴山市| 金秀| 亚东县| 横峰县| 栖霞市| 侯马市| 罗城| 北流市| 安岳县| 康定县| 囊谦县| 延川县| 朝阳市| 诸城市| 四会市| 金溪县| 景宁| 三都| 古交市| 尉氏县| 洛南县| 城固县|