• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      訓練樣本數(shù)量選擇對圖像特征提取的影響分析

      2017-11-04 03:45:12靜,閆
      重慶理工大學學報(自然科學) 2017年10期
      關鍵詞:玻爾茲曼隱層個數(shù)

      尹 靜,閆 河

      (重慶理工大學 計算機科學與工程學院, 重慶 400054)

      訓練樣本數(shù)量選擇對圖像特征提取的影響分析

      尹 靜,閆 河

      (重慶理工大學 計算機科學與工程學院, 重慶 400054)

      圖像特征提取是圖像處理的重要內(nèi)容之一,特征提取的質(zhì)量直接影響圖像分類、圖像識別、圖像檢索等工作的效果??紤]到影響圖像特征提取的因素有多種,以受限玻爾茲曼機為例,探討訓練樣本數(shù)量選擇對圖像特征提取的影響。實驗結(jié)果表明:隨著樣本數(shù)量的增加,具有相同參數(shù)的受限玻爾茲曼機提取的圖像特征的概括性會增強。因此,當樣本數(shù)量大時,增加RBM的隱層神經(jīng)元個數(shù)并不總是有價值的。

      圖像特征提取;受限玻爾茲曼機;CD算法

      1 背景

      圖像特征提取是圖像處理過程中非常重要的環(huán)節(jié),特征提取的質(zhì)量直接影響后續(xù)工作的開展。圖像特征提取方法包括Fourier變換法[1]、小波變換法[2]、最小二乘法[3]、直方圖法[4]、信號處理法[5]和模型法[6]等。模型法是用模型參數(shù)作為圖像特征,典型方法有卷積神經(jīng)網(wǎng)絡[6]、馬爾科夫隨機場[7]、受限玻爾茲曼機[8]等。其中,受限玻爾茲曼機作為特征提取器被廣泛研究應用。

      受限玻爾茲曼機(restricted Boltzmann machine,RBM)[9-10]是基于能量函數(shù)的無向圖模型,它是一個2層隨機神經(jīng)網(wǎng)絡模型,第1層由多個神經(jīng)元組成,接收訓練數(shù)據(jù),通常稱為可見層;第2層同樣由多個神經(jīng)元組成,作為訓練數(shù)據(jù)的表達,通常稱為隱層??梢妼痈魃窠?jīng)元與隱層各神經(jīng)元之間無向連接,而層內(nèi)神經(jīng)元之間無連接。RBM已經(jīng)成功應用于機器學習的許多任務中,包括特征提取[11]、協(xié)同過濾[12]、降維[13]、物體識別[14]等。文獻[8]使用卷積受限玻爾茲曼機直接從乳腺的X光片中自主學習圖像特征,并利用這些特征完成X光片的分類; 文獻[11]在RBM的隱層中使用線性判別分析、邊界判別分析和熱核邊界判別分析方法提取數(shù)據(jù)的判別特征;文獻[15]使用判別式受限玻爾茲曼機自動地從乳腺X光圖像中學習特征,并使用學到的特征完成圖像分類;文獻[16]在受限玻爾茲曼機的可見層引入二值轉(zhuǎn)換單元,對隱藏層神經(jīng)元進行分組,構(gòu)造了一個二元混合式去噪玻爾茲曼機模型,實現(xiàn)在復雜背景的圖像中提取有用特征;文獻[17]利用BP神經(jīng)網(wǎng)絡識別圖像中的人臉,并實現(xiàn)對圖像中人臉朝向的判別。目前,這些文章更多的是應用受限玻爾茲曼機提取的圖像特征去解決實際問題。本文主要討論受限玻爾茲曼機在圖像特征提取時,訓練樣本數(shù)量的選擇對特征提取的影響。實驗在數(shù)字手寫體和人臉兩個數(shù)據(jù)集上開展,主要從固定隱層神經(jīng)元個數(shù)選擇不同數(shù)量的訓練樣本的特征提取和固定數(shù)量的訓練樣本設置不同隱層神經(jīng)元個數(shù)的特征提取兩個方向進行。實驗結(jié)果表明:樣本數(shù)量越小,模型學到的特征越具體;樣本數(shù)量越大,模型學到的特征越抽象。

      2 受限玻爾茲曼機概述

      2.1 模型簡介

      受限玻爾茲曼機可以看作是一個2層的隨機神經(jīng)網(wǎng)絡模型,第1層是由m個神經(jīng)元組成用以表示輸入數(shù)據(jù)v,通常稱為可見層;第2層是由n個神經(jīng)元組成用以表示數(shù)據(jù)的表達h,通常稱為隱層。其網(wǎng)絡結(jié)構(gòu)如圖1所示??梢妼优c隱層之間的全連接權(quán)重用W表示,每層各神經(jīng)元之間沒有連接。

      圖1 RBM模型

      為了表述簡潔,這里僅考慮當模型采用二值單元的情況,也可以采用高斯單元、多項式單元、可矯正線性單元等[18]。二值RBM能量函數(shù)為

      (1)

      其中:θ是實數(shù)型參數(shù)bi、cj和wij的集合;vi、hj∈{0,1},i∈{1,2,…,m},j∈{1,2,…,n}。wij是神經(jīng)元vi和hj之間的連接權(quán)重,bi是第i個可見單元的偏置,cj是第j個隱單元的偏置。根據(jù)該能量函數(shù),RBM的聯(lián)合概率分布有如下形式:

      (2)

      (3)

      (4)

      (5)

      式(5)中的第1項較易計算,但第2項計算由于配分函數(shù)Z(θ)的存在,該項梯度計算復雜度較高。為了降低計算復雜度,目前有很多算法對梯度進行近似計算,例如:CD算法[19]、PCD算法[20]、PT算法[21]等。這里采用CD算法完成RBM的訓練。

      2.2 模型訓練

      RBM采用CD-k算法對模型進行訓練,CD-k的執(zhí)行過程:算法采用訓練數(shù)據(jù)作為馬爾科夫鏈的初始狀態(tài),計算式(3),在該概率分布下采樣得到h;根據(jù)h的值,計算式(4),在這個概率分布下采樣得到v′;再次計算式(3),采樣得到h′,以此類推,不斷計算概率,并在此概率分布下采樣,這樣交替執(zhí)行k步。當步數(shù)k足夠大時,就可以采樣得到滿足訓練數(shù)據(jù)分布的樣本。通常情況下,k=1就可以得到足夠好的近似[19]。

      因此,采用CD-1算法進行訓練,這樣關于模型參數(shù)的梯度有:

      (6)

      (7)

      (8)

      利用梯度對模型參數(shù)進行更新,直到梯度不再變化或者達到指定訓練次數(shù),結(jié)束RBM的訓練,獲得數(shù)據(jù)特征。RBM模型的訓練步驟見圖2。

      圖2 RBM訓練流程

      3 RBM圖像特征提取

      為了分析訓練樣本數(shù)量選擇對圖像特征提取的影響,在數(shù)字手寫體和人臉2個數(shù)據(jù)集上進行驗證實驗。實驗從兩方面進行:1) 模型隱層神經(jīng)元個數(shù)固定,分析不同訓練樣本數(shù)量對特征提取的影響;2) 訓練樣本數(shù)量固定,分析不同隱層神經(jīng)元個數(shù)對特征提取的影響。

      3.1 數(shù)字手寫體特征提取

      手寫體數(shù)據(jù)集MNIST是手寫0~9的數(shù)字圖片組成黑底白字的標準數(shù)據(jù)集,共 60 000 條數(shù)據(jù)。首先固定模型隱層神經(jīng)元個數(shù),選擇MNIST中不同數(shù)量的訓練數(shù)據(jù)對RBM進行訓練,數(shù)量分別設置為100、1 000、5 000、10 000和 60 000條,數(shù)量大的訓練數(shù)據(jù)集包含了數(shù)量小的數(shù)據(jù)集。在模型訓練時,固定訓練次數(shù)為100,學習率設置為0.1,模型權(quán)重初始化為[-0.1,0.1]的隨機數(shù),可見層和隱層偏置初始化為0。圖3顯示了隱層神經(jīng)元個數(shù)為100的RBM所提取的數(shù)字手寫體特征。圖4顯示了隱層神經(jīng)元個數(shù)為1 024的RBM所提取的數(shù)字手寫體特征。由于參數(shù)過多,這里僅截取了部分特征用于顯示。圖3、4中的(a)是100條訓練數(shù)據(jù)學習后的特征;(b)是1 000條訓練數(shù)據(jù)學習后的特征;(c)是5 000條訓練數(shù)據(jù)學習后的特征;(d)是10 000條訓練數(shù)據(jù)學習后的特征;(e)是60 000條訓練數(shù)據(jù)學習后的特征。然后,固定訓練數(shù)據(jù)的數(shù)量,設置不同隱層神經(jīng)元個數(shù)對RBM進行訓練,隱層神經(jīng)元個數(shù)分別為100,256,512,1 024和1 600。參數(shù)設置與前面實驗設置相同。圖5顯示了10 000條訓練數(shù)據(jù)時,不同隱層神經(jīng)元個數(shù)的設置下RBM所提取的數(shù)字手寫體部分特征。其中:(a)是隱層神經(jīng)元個數(shù)為100的RBM學到的特征;(b)是隱層神經(jīng)元個數(shù)為256的RBM學到的部分特征;(c)是隱層神經(jīng)元個數(shù)為512的RBM學到的部分特征;(d)是隱層神經(jīng)元個數(shù)為1 024的RBM學到的部分特征;(e)是隱層神經(jīng)元個數(shù)為1 600的RBM學到的部分特征。從圖3、4來看,在相同隱層神經(jīng)元個數(shù)的前提下,RBM從100條訓練數(shù)據(jù)中學習到的數(shù)據(jù)特征比60 000條訓練數(shù)據(jù)時學習到的數(shù)據(jù)特征更具體。隨著訓練數(shù)據(jù)數(shù)量的不斷增加,RBM學習到了訓練數(shù)據(jù)的全局特征,從而提取到更抽象的特征。當隱層神經(jīng)元個數(shù)較多時,這些特征會集中在部分權(quán)重中,圖4、5顯示的數(shù)據(jù)特征就說明了這一點。雖然隱層的神經(jīng)元數(shù)量增加可以表達更多的數(shù)據(jù),但模型會對學習的數(shù)據(jù)不斷抽象,從而融合訓練數(shù)據(jù)之間的共同特征,得到抽象特征。因此,圖4(c)~(e)和圖5(b)~(e)中有的權(quán)重是沒有作用的。

      圖3 隱層神經(jīng)元個數(shù)為100的RBM在不同數(shù)量的訓練集中提取的特征

      圖4 隱層神經(jīng)元個數(shù)為1 024的RBM在不同數(shù)量的訓練集中提取的部分特征

      圖5 不同隱層神經(jīng)元個數(shù)的RBM在10 000條訓練集中提取的部分特征

      3.2人臉特征提取

      圖6 隱層神經(jīng)元個數(shù)為256的RBM在不同數(shù)量的訓練集中提取的人臉特征

      4 結(jié)束語

      受限玻爾茲曼機在圖像特征提取方面應用效果較好。作為特征提取器,RBM提取圖像特征的質(zhì)量與隱層神經(jīng)元個數(shù)、模型參數(shù)的初始化、學習率、訓練模型的樣本數(shù)量等有關。其中,訓練樣本數(shù)量的選擇不僅影響RBM隱層神經(jīng)元個數(shù)的設置,同時影響RBM提取的特征。實驗結(jié)果表明:相同個數(shù)的隱層神經(jīng)元,隨著樣本數(shù)量的增加,模型提取的圖像特征將越概括;相同數(shù)量的訓練樣本,隨著神經(jīng)元個數(shù)的增加,提取的圖像特征不會因為參數(shù)數(shù)量的增加而有更好的質(zhì)量,因此增加隱層神經(jīng)元個數(shù)對于特征提取不總是有價值的。下一步研究將繼續(xù)分析其他因素對RBM提取圖像特征的影響,以便更好地設置RBM的參數(shù),提高圖像特征的質(zhì)量。

      [1] 徐貴力,毛罕平.利用傅里葉變換提取圖像紋理特征新方法[J].光電工程,2004,31(11):55-58.

      [2] 李亞標,王寶光,李溫溫.基于小波變換的圖像紋理特征提取方法及其應用[J].傳感技術學報,2009,22(9):1308-1311.

      [3] 趙鑫,宋廣軍,張宏烈.遙感圖像特征提取算法仿真[J].計算機仿真,2013,30(6):222-225.

      [4] 傅明,萬勵,劉國英.一種新的圖像特征提取算法——DCDSH[J].儀器儀表學報,2004,25(z1):538-539.

      [5] 張建勛,李濤,孫權(quán),等.豬眼肌B超圖像紋理特征提取與分類[J].重慶理工大學學報(自然科學),2013,27(2):74-78.

      [6] 李欽,游雄,李科,等.圖像深度層次特征提取算法[J].模式識別與人工智能,2017,30(2):127-136.

      [7] 岑杰,趙杰煜.基于馬爾可夫隨機場的嘴唇特征提取方法[J].計算機應用研究,2007,24(7):300-302.

      [8] 張娟,蔣蕓,胡學偉,等.基于卷積受限玻爾茲曼機的醫(yī)學圖像分類新方法[J].計算機工程與科學,2017,39(2):323-329.

      [9] SMOLENSKY P.Information processing in dynamical systems:foundations of harmony theory[M].Cambridge:MIT Press,1986:194-281.

      [10] HINTON G E,OSINDERO S,TEH Y W.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(7):1527-1554.

      [11] XIE G S,ZHANG X Y,ZHANG Y M,et al.Integrating supervised subspace criteria with restricted Boltzmann Machine for feature extraction[C]//International Joint Conference on Neural Networks.Beijing,China,2014:1622-1629.

      [12] SALAKHUTDINOV R,MNIH A,HINTON G.Restricted Boltzmann machines for collaborative filtering[C] //Proceedings of the Twenty-Fourth International Conference on Machine Learning.USA:[s.n.],2007:791-798.

      [13] ZHANG K,LIU J,CHAI Y,et al.An optimized dimensionality reduction model for high-dimensional data based on Restricted Boltzmann Machines[C]//Chinese Control & Decision Conference.China:[s.n.],2015:2939-2944.

      [14] WU Y,JI Q.Learning the Face Shape Models for Facial Landmark Detection in the Wild[M]//Germany: Springer International Publishing,2015:33-45.

      [15] 陳娜,蔣蕓,鄒麗,等.基于判別式受限玻爾茲曼機的醫(yī)學圖像分類法[J].計算機科學,2015,42(5):315-319.

      [16] 楊杰,孫亞東,張良俊,等.基于弱監(jiān)督學習的去噪受限玻爾茲曼機特征提取算法[J].電子學報,2014,42(12):2365-2370.

      [17] 張彤,盧雯雯,肖南峰.基于BP網(wǎng)絡的人臉朝向識別方法[J].重慶理工大學學報(自然科學),2010(6):61-65.

      [18] HINTON G E.A Practical Guide to Training Restricted Boltzmann Machines[J].Momentum,2010,9(1):599-619.

      [19] HINTON G E.Training products of experts by minimizing contrastive divergence[J].Neural Computation,2002,14(8):1771-1800.

      [20] TIELEMAN T.Training restricted Boltzmann machines using approximations to the likelihood gradient[C]//International Conference on Machine Learning.USA:ACM,2008:1064-1071.

      [21] CHO K H,RAIKO T,ILIN A.Parallel tempering is efficient for learning restricted Boltzmann machines[C]//International Joint Conference on Neural Networks.USA:IEEE,2010:1-8.

      (責任編輯楊黎麗)

      InfluenceoftheNumberofTrainingSampleonImageFeatureExtraction

      YIN Jing, YAN He

      (College of Computer Science and Technology, Chongqing University of Technology, Chongqing 400054, China)

      Image feature extraction is one of the important contents of image processing. The quality of feature extraction directly affects the effect of image classification, image recognition and image retrieval. There are many factors that affect image feature extraction. The restricted Boltzmann machine is took as an example to discuss the influence of the number of training samples on image feature extraction. The experimental results show that the generality of the image features extracted by the restricted Boltzmann machine with the same parameters will be enhanced as the number of samples increases. Therefore, when the number of samples is large, increasing the number of hidden layer neurons in RBM is not always valuable.

      image feature extraction; restricted Boltzmann machine; CD algorithm

      2017-03-26

      國家自然科學基金資助項目(61173184)

      尹靜(1980—),女,重慶人,講師, 主要從事機器學習、深度學習、神經(jīng)網(wǎng)絡等方面研究,E-mail:yinjing@cqut.edu.cn;閆河(1972—),男,陜西勉縣人,教授,主要從事多尺度幾何分析、目標跟蹤、模式識別、人工智能等方面研究,E-mail:cqyanhe@163.com。

      尹靜,閆河.訓練樣本數(shù)量選擇對圖像特征提取的影響分析[J].重慶理工大學學報(自然科學),2017(10):192-197.

      formatYIN Jing, YAN He.Influence of the Number of Training Sample on Image Feature Extraction[J].Journal of Chongqing University of Technology(Natural Science),2017(10):192-197.

      10.3969/j.issn.1674-8425(z).2017.10.031

      TP181

      A

      1674-8425(2017)10-0192-06

      猜你喜歡
      玻爾茲曼隱層個數(shù)
      基于格子玻爾茲曼方法的流固耦合問題模擬
      怎樣數(shù)出小正方體的個數(shù)
      非對稱彎道粒子慣性遷移行為的格子玻爾茲曼模擬
      等腰三角形個數(shù)探索
      怎樣數(shù)出小木塊的個數(shù)
      基于RDPSO結(jié)構(gòu)優(yōu)化的三隱層BP神經(jīng)網(wǎng)絡水質(zhì)預測模型及應用
      人民珠江(2019年4期)2019-04-20 02:32:00
      怎樣數(shù)出小正方體的個數(shù)
      淺談玻爾茲曼分布的微小偏離量所引起的微觀狀態(tài)數(shù)的變化
      基于近似結(jié)構(gòu)風險的ELM隱層節(jié)點數(shù)優(yōu)化
      計算機工程(2014年9期)2014-06-06 10:46:47
      最優(yōu)隱層BP神經(jīng)網(wǎng)絡的滾動軸承故障診斷
      凤冈县| 福清市| 延长县| 乃东县| 海南省| 和林格尔县| 确山县| 华池县| 石门县| 德令哈市| 平凉市| 台江县| 县级市| 长兴县| 无极县| 兰考县| 昌邑市| 常州市| 黄冈市| 凤阳县| 沧州市| 固始县| 清水河县| 屏东县| 海伦市| 德庆县| 应用必备| 含山县| 天门市| 元江| 萝北县| 长兴县| 赣榆县| 福鼎市| 遂平县| 长宁县| 玉环县| 萍乡市| 来宾市| 大化| 从化市|