• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      深度學(xué)習(xí)的模型搭建及過擬合問題的研究

      2018-02-27 20:13:22陶礫楊朔楊威
      計算機(jī)時代 2018年2期
      關(guān)鍵詞:深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

      陶礫+楊朔+楊威

      摘 要: 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個新的領(lǐng)域,它模仿人腦的機(jī)制來解釋數(shù)據(jù),例如圖像,聲音和文本。文章介紹了一種多層感知器結(jié)構(gòu)的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型,并推導(dǎo)了其實現(xiàn)的算法。用數(shù)字識別實驗驗證了該模型及其算法的可靠性;驗證了過擬合的發(fā)生與訓(xùn)練集的大小以及神經(jīng)網(wǎng)絡(luò)的復(fù)雜度之間的重要關(guān)系。過擬合問題的研究對降低誤差有重要的意義。

      關(guān)鍵詞: 深度學(xué)習(xí); 神經(jīng)網(wǎng)絡(luò); 隱藏層; 過擬合

      中圖分類號:TP391.9 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2018)02-14-04

      Abstract: Deep learning is a new field in machine learning research. It simulates the mechanism of human brain to interpret data, such as image, voice and text. In this paper, a deep learning neural network model of multilayer perceptron structure is introduced and its implementation algorithm is derived. The reliability of the model and its algorithm are also verified by some digital recognition experiments, and find that the size of the training set and the complexity of neural networks are highly related with the over-fitting. It is of great significance to study the problem of over-fitting to reduce the error.

      Key words: deep learning; neural networks; hidden layer; over-fitting

      0 引言

      深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究[3]。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層來表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。在深度學(xué)習(xí)泛化(generalization)過程中,主要存在兩個挑戰(zhàn):欠擬合和過擬合(overfitting)。欠擬合是指模型不能在訓(xùn)練集上獲得足夠小的誤差,而過擬合是指訓(xùn)練誤差和測試誤差之間的差距太大。

      1 模型設(shè)計

      1.1 多層感知器結(jié)構(gòu)[1]

      本文采用多層感知器(MLP)作為訓(xùn)練模型,它是一種前饋人工神經(jīng)網(wǎng)絡(luò)模型。它包括至少一個隱藏層(除了一個輸入層和一個輸出層以外)本文采用的多層感知器模型中的信號流傳播如下:

      ⑴ 輸入:yi(n)為i神經(jīng)元的輸出,為下一個神經(jīng)元j的輸入。

      ⑵ 誘導(dǎo)局部區(qū)域:神經(jīng)元j被它左邊的yi(n)神經(jīng)元產(chǎn)生的一組函數(shù)信號所饋,神經(jīng)元j產(chǎn)生誘導(dǎo)局部區(qū)域。

      ⑶ 激活函數(shù):神經(jīng)元j輸出處的函數(shù)信號yi(n)為,其中為j層神經(jīng)元的激活函數(shù)。采用激活函數(shù)的一個好處是引入非線性因素,使神經(jīng)網(wǎng)絡(luò)變成非線性系統(tǒng)。本文采用Sigmoid函數(shù)作為激活函數(shù),其定義為:,導(dǎo)數(shù)可用自身表示:

      ⑷ 誤差:k為輸出神經(jīng)元,則誤差ek(n)=dk(n)-yk(n),其中dk(n)為信號輸出。

      1.2 代價函數(shù)

      代價函數(shù)是用來反映/度量預(yù)測結(jié)果yk(n)與實際結(jié)果dk(n)的偏差,本文采用最小平方(LMS)算法來構(gòu)造代價函數(shù):

      1.3 隨機(jī)梯度下降算法[4]

      本文采用隨機(jī)梯度下降算法(SGD)進(jìn)行迭代,在此算法中,對的連續(xù)調(diào)整是在最速的方向進(jìn)行的,即它是與梯度向量方向相反的。記為,因此,梯度下降算法一般表示為:。其中這里η是一個常數(shù),稱為學(xué)習(xí)率參數(shù),是梯度向量值。

      1.4 反向傳播算法[5]

      本文采用的反向傳播算法以與1.3節(jié)類似的方式對突觸權(quán)值應(yīng)用一個修正值,它正比于偏導(dǎo)數(shù),即:

      1.4.1 神經(jīng)元j是輸出節(jié)點(diǎn)

      圖1為輸出神經(jīng)元j細(xì)節(jié)的信號流圖。

      根據(jù)微分的鏈?zhǔn)揭?guī)則,可以將這個梯度表示為:

      本文采用Sigmoid函數(shù)作為激活函數(shù),即:

      為了方便,我們定義:

      1.4.2 神經(jīng)元j是隱藏層節(jié)點(diǎn)

      見圖1,我們對式中通過鏈?zhǔn)揭?guī)則后的偏導(dǎo)數(shù)可以看到:,神經(jīng)元k是輸出節(jié)點(diǎn),故:

      以上為倒數(shù)第一個隱藏層的傳播公式,得出了δj的反向傳播遞推公式(k為j正向傳播的下一個神經(jīng)元),并用Sigmoid函數(shù)作為激活函數(shù):

      于是我們得出了遞歸的校正值的定義:

      2 實驗

      本模型以識別手寫數(shù)字為例,測試深度學(xué)習(xí)模型。本文采用的數(shù)據(jù)集為著名的“MNIST數(shù)據(jù)集”。這個數(shù)據(jù)集有60000個訓(xùn)練樣本和10000個測試用例。我們首先對該模型進(jìn)行驗證,然后通過調(diào)整訓(xùn)練集的大小和神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)來觀察其對正確率的影響。

      2.1 模型算法

      學(xué)習(xí)階段:本文采用mini-batch 梯度下降算法:假設(shè)總樣本數(shù)為Sn,將Sn隨機(jī)按每組N個樣本分為(Sn/N)組。多層感知器的突觸權(quán)值的調(diào)整在訓(xùn)練樣本集合的所有N個樣本例都出現(xiàn)后進(jìn)行。(Sn/N)次完成整個樣本集的訓(xùn)練,構(gòu)成了一個訓(xùn)練的回合(epoch)。學(xué)習(xí)需經(jīng)過多個回合,不斷完善。具體步驟如下。endprint

      猜你喜歡
      深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
      電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
      MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
      大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
      深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
      基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
      軟件工程(2016年8期)2016-10-25 15:47:34
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
      芜湖市| 新沂市| 通辽市| 临朐县| 伊通| 昌都县| 健康| 广宗县| 鄂州市| 延长县| 安泽县| 丰县| 古田县| 聂荣县| 宁南县| 靖州| 介休市| 梅河口市| 谷城县| 偏关县| 乌海市| 鱼台县| 荥经县| 安乡县| 会泽县| 桂林市| 林芝县| 盐亭县| 北流市| 岐山县| 布拖县| 青海省| 巴塘县| 铜梁县| 武冈市| 扶沟县| 鄢陵县| 江源县| 德阳市| 长岭县| 织金县|