• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于深度學(xué)習(xí)的智能移動(dòng)邊緣網(wǎng)絡(luò)緩存*

      2020-01-15 06:40:22宋旭鳴沈逸飛石遠(yuǎn)明
      關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò)深度記憶

      宋旭鳴,沈逸飛,石遠(yuǎn)明

      (1 中國(guó)科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所,上海 200050; 2 中國(guó)科學(xué)學(xué)院大學(xué),北京 100049; 3 上??萍即髮W(xué)信息科學(xué)與技術(shù)學(xué)院,上海 201210)

      近年來(lái),隨著智能手機(jī)和移動(dòng)設(shè)備的大規(guī)模普及和隨之而來(lái)爆炸性增長(zhǎng)的富媒體應(yīng)用,海量的數(shù)據(jù)產(chǎn)生在通信系統(tǒng)中[1]。根據(jù)思科的預(yù)測(cè),視頻等多媒體數(shù)據(jù)的通信量將在2021年占據(jù)78%的全世界所有移動(dòng)數(shù)據(jù)的通信量[2]。此外,移動(dòng)通信網(wǎng)絡(luò)通信量隨時(shí)間高度變化的特性使網(wǎng)絡(luò)在通信量的高峰期發(fā)生嚴(yán)重的系統(tǒng)擁塞,在通信量的低谷期發(fā)生極低的系統(tǒng)資源利用率,嚴(yán)重降低通信系統(tǒng)的效率[3]。因此,日益增長(zhǎng)的海量數(shù)據(jù)通信需求給現(xiàn)有的移動(dòng)蜂窩網(wǎng)絡(luò)帶來(lái)極大的壓力,例如:回傳鏈路負(fù)載不均衡、回傳鏈路信令過(guò)載和高網(wǎng)絡(luò)延遲等問(wèn)題。

      通過(guò)把儲(chǔ)存資源推送到移動(dòng)網(wǎng)絡(luò)邊緣,充分利用數(shù)據(jù)和用戶的空間局部特性、用戶作息規(guī)律的時(shí)間局部特性,移動(dòng)邊緣網(wǎng)絡(luò)緩存被認(rèn)為是一種極為有效的均衡回傳鏈路負(fù)載、降低網(wǎng)絡(luò)延遲和提高用戶體驗(yàn)的技術(shù)[4-5]。學(xué)術(shù)界和工業(yè)界在緩存系統(tǒng)算法領(lǐng)域做了大量的研究和探索。網(wǎng)絡(luò)內(nèi)容分發(fā)提供商通常在緩存內(nèi)容文件部署階段使用傳統(tǒng)的緩存策略,例如:最久使用策略(least recently used, LRU)[6]、使用頻率最少策略(least frequently used, LFU)[7]和這些算法的變體。根據(jù)不同時(shí)間不同用戶可能有不同內(nèi)容文件喜好的事實(shí),再考慮到移動(dòng)邊緣網(wǎng)絡(luò)中用戶的移動(dòng)特性,某一特定區(qū)域的內(nèi)容文件流行度常表現(xiàn)出很強(qiáng)的時(shí)變特性[8]。因此緩存策略只有能夠動(dòng)態(tài)適應(yīng)內(nèi)容文件未來(lái)流行度分布才能最大限度發(fā)揮出移動(dòng)邊緣緩存技術(shù)的優(yōu)勢(shì)[9]。在緩存內(nèi)容文件部署階段對(duì)緩存內(nèi)容文件未來(lái)流行度的精確預(yù)測(cè)是進(jìn)一步提升移動(dòng)邊緣緩存系統(tǒng)性能的重要突破口[10-11]。

      目前,已經(jīng)有一些文獻(xiàn)研究如何預(yù)測(cè)內(nèi)容文件的流行度[12-13],但是大多數(shù)的研究工作都只局限于內(nèi)容文件流行度本身。在綜合考慮內(nèi)容文件流行度預(yù)測(cè)和緩存系統(tǒng)設(shè)計(jì)的研究中,Bastug等[4]研究如何通過(guò)協(xié)同濾波的方式預(yù)測(cè)每個(gè)用戶對(duì)每個(gè)內(nèi)容文件的喜好程度并且把這個(gè)反映內(nèi)容文件流行程度的矩陣應(yīng)用于蜂窩網(wǎng)絡(luò)的緩存策略中,但用戶的移動(dòng)特性讓這個(gè)方法很難在實(shí)際系統(tǒng)中實(shí)施。此外,Müller等[8]和Li等[9]使用在線學(xué)習(xí)的方法進(jìn)行內(nèi)容文件的主動(dòng)緩存。但是基于在線算法的緩存系統(tǒng)會(huì)因?yàn)檫^(guò)于頻繁地執(zhí)行緩存內(nèi)容文件的部署更新,造成過(guò)度的回傳鏈路開(kāi)銷,給系統(tǒng)帶來(lái)額外的負(fù)載壓力。另外,由于在線算法收斂速度緩慢,可能無(wú)法應(yīng)對(duì)內(nèi)容文件流行度快速變化的場(chǎng)景。另一方面,基于深度學(xué)習(xí)的方法給移動(dòng)邊緣網(wǎng)絡(luò)的性能優(yōu)化帶來(lái)了新的思路和更大的性能提升。Wang等[14]將深度強(qiáng)化學(xué)習(xí)和聯(lián)合學(xué)習(xí)的思想用于移動(dòng)邊緣網(wǎng)絡(luò)中計(jì)算、緩存和通信資源的聯(lián)合優(yōu)化。Lei等[15]則使用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)緩存內(nèi)容分發(fā)優(yōu)化算法,使移動(dòng)邊緣網(wǎng)絡(luò)以最低的能量消耗實(shí)現(xiàn)緩存內(nèi)容分發(fā)。

      為了應(yīng)對(duì)目前移動(dòng)邊緣網(wǎng)絡(luò)緩存研究工作存在的不足,并受啟發(fā)于深度學(xué)習(xí)帶來(lái)的數(shù)據(jù)分析新思路。本文除把儲(chǔ)存資源推送到網(wǎng)絡(luò)邊緣,還把計(jì)算資源推送到網(wǎng)絡(luò)邊緣,讓網(wǎng)絡(luò)中的每一個(gè)接入熱點(diǎn)擁有較強(qiáng)的本地?cái)?shù)據(jù)分析能力,成為智能接入熱點(diǎn),使之可以進(jìn)行內(nèi)容文件流行度預(yù)測(cè)。本文提出一種基于堆疊長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)精確預(yù)測(cè)內(nèi)容文件流行度的方法。預(yù)測(cè)得到的內(nèi)容文件流行度信息緊接著被應(yīng)用于移動(dòng)邊緣網(wǎng)絡(luò)緩存系統(tǒng)中,提升緩存系統(tǒng)性能,構(gòu)成完整的深度緩存策略?;谠搩?nèi)容文件流行度預(yù)測(cè)方法構(gòu)建的深度緩存策略可以根據(jù)不同場(chǎng)景調(diào)整緩存系統(tǒng)的緩存內(nèi)容文件更新頻率,靈活高效?;谡鎸?shí)數(shù)據(jù)集的仿真實(shí)驗(yàn)表明,本文提出的內(nèi)容文件流行度預(yù)測(cè)方法勝于目前最優(yōu)的預(yù)測(cè)方法。依靠深度神經(jīng)網(wǎng)絡(luò)精準(zhǔn)的內(nèi)容文件流行度預(yù)測(cè)信息,移動(dòng)邊緣網(wǎng)絡(luò)緩存系統(tǒng)的性能得到大幅提升。

      1 系統(tǒng)模型與問(wèn)題分析

      1.1 移動(dòng)邊緣網(wǎng)絡(luò)緩存框架

      本文考慮一個(gè)由多個(gè)緩存賦能智能接入熱點(diǎn)組成的移動(dòng)邊緣網(wǎng)絡(luò)緩存架構(gòu)。如圖1所示,每一個(gè)智能接入熱點(diǎn)通過(guò)回傳鏈路網(wǎng)絡(luò)與云數(shù)據(jù)中心(即內(nèi)容文件服務(wù)器)相連接。本文假設(shè)內(nèi)容文件服務(wù)器中有一個(gè)有限大的內(nèi)容文件庫(kù)F,它的大小為F=|F|。內(nèi)容文件i∈F的大小為ωi。定義智能接入熱點(diǎn)的集合為M={1,2,…,M}。為了進(jìn)行高效的緩存內(nèi)容文件交付,每一個(gè)智能接入熱點(diǎn)m∈M配備一個(gè)大小為Cm的緩存存儲(chǔ)器,它可以存儲(chǔ)內(nèi)容文件庫(kù)中的部分文件Fm?F。假設(shè)每一個(gè)移動(dòng)用戶(mobile user, MU)同時(shí)只能與一個(gè)智能接入熱點(diǎn)連接并且被它服務(wù)。如果移動(dòng)用戶所請(qǐng)求的內(nèi)容文件已經(jīng)被提前緩存在與之連接的智能接入熱點(diǎn)中,那么該內(nèi)容文件會(huì)被立即從本地智能接入熱點(diǎn)直接發(fā)送至移動(dòng)用戶(即該用戶請(qǐng)求直接被本地智能接入熱點(diǎn)服務(wù))。反之則需要本地智能接入熱點(diǎn)通過(guò)回傳鏈路網(wǎng)絡(luò)從云數(shù)據(jù)中心獲得該文件。這樣,一方面移動(dòng)用戶會(huì)遭受較長(zhǎng)的傳輸時(shí)延,另一方面系統(tǒng)會(huì)承擔(dān)更大的回傳鏈路負(fù)載。

      圖1 移動(dòng)邊緣網(wǎng)絡(luò)緩存架構(gòu)Fig.1 Mobile edge caching network

      本文通過(guò)把計(jì)算資源推送到移動(dòng)網(wǎng)絡(luò)邊緣的方式使接入熱點(diǎn)擁有執(zhí)行深度學(xué)習(xí)任務(wù)進(jìn)行本地?cái)?shù)據(jù)分析的能力(即動(dòng)態(tài)地預(yù)測(cè)內(nèi)容文件未來(lái)的流行度),使其成為智能接入熱點(diǎn)。進(jìn)而使得網(wǎng)絡(luò)邊緣可以執(zhí)行深度緩存策略,降低傳輸時(shí)延。

      基于深度學(xué)習(xí)的內(nèi)容文件流行度預(yù)測(cè)的主要好處如下:1)由此構(gòu)建的移動(dòng)邊緣網(wǎng)絡(luò)緩存系統(tǒng)可以很靈活地控制何時(shí)更新緩存、何時(shí)預(yù)測(cè),有效降低由于頻繁執(zhí)行緩存內(nèi)容文件部署所造成的回傳鏈路負(fù)載;2)深度學(xué)習(xí)可以提供相對(duì)較長(zhǎng)一段時(shí)間內(nèi)精確的內(nèi)容文件流行度預(yù)測(cè),進(jìn)一步提高緩存內(nèi)容文件交付階段的緩存命中率,降低傳輸時(shí)延,保證用戶體驗(yàn)。這里定義的緩存命中率指的是移動(dòng)用戶的內(nèi)容文件請(qǐng)求直接被本地智能接入熱點(diǎn)服務(wù)的次數(shù)占所有用戶內(nèi)容文件請(qǐng)求次數(shù)的百分比。

      1.2 問(wèn)題分析

      假設(shè)移動(dòng)邊緣緩存網(wǎng)絡(luò)工作在離散時(shí)間tz∈{t1,t2,…,tZ}上。在tz時(shí)刻,智能接入熱點(diǎn)m根據(jù)預(yù)測(cè)的每一個(gè)內(nèi)容文件在該智能接入熱點(diǎn)處的本地流行度和緩存空間Cm更新該智能接入熱點(diǎn)的緩存內(nèi)容。本文定義內(nèi)容文件i的本地流行度為pi(m,[tz,tz+1)),它表示在未來(lái)時(shí)間間隔[tz,tz+1)內(nèi),內(nèi)容文件i在智能接入熱點(diǎn)m處被請(qǐng)求的次數(shù)。K(m,[tz,tz+1))被定義為智能接入熱點(diǎn)m處,在時(shí)間間隔[tz,tz+1)內(nèi)總計(jì)收到的用戶內(nèi)容文件請(qǐng)求次數(shù),其中第k次被請(qǐng)求的內(nèi)容文件用i(k)表示,其中1≤k≤K(m,[tz,tz+1))。此外,本文定義智能接入熱點(diǎn)m處的緩存狀態(tài)向量為

      s(m,[tz,tz+1))=[s1(m,[tz,tz+1)),…,sF(m,[tz,tz+1))]T,其中si(m,[tz,tz+1))=

      (1)

      本文的目標(biāo)是通過(guò)為智能接入熱點(diǎn)m找到最優(yōu)的本地內(nèi)容文件緩存狀態(tài)向量s(m,[tz,tz+1))以最大化系統(tǒng)整體的平均緩存命中率。顯然,在時(shí)間間隔[tz,tz+1)內(nèi),智能接入熱點(diǎn)m處的平均緩存命中率可以表示為

      Hr(s(m,[tz,tz+1)))=

      (2)

      式中:Is(m,[tz,tz+1))(i(k))為指示函數(shù),若內(nèi)容文件i(k)在被請(qǐng)求時(shí)已被事先緩存至本地智能接入熱點(diǎn)m處,函數(shù)返回值1,否則為0。本文求解的移動(dòng)邊緣網(wǎng)絡(luò)緩存系統(tǒng)平均緩存命中率最大化問(wèn)題可以進(jìn)一步表示為

      s.t.ωT·s(m,[tz,tz+1))≤Cm,?z=1,…,Z,m∈M,

      (3)

      式中:{s(m,[tz,tz+1))}是優(yōu)化變量,ω=[ω1,…,ωF]T表示整個(gè)內(nèi)容文件庫(kù)F中各個(gè)內(nèi)容文件的大小,約束條件用于保證各智能接入熱點(diǎn)處緩存不會(huì)溢出。

      在tz時(shí)刻,假設(shè)每一個(gè)智能接入熱點(diǎn)m都可以到未來(lái)的tz+1時(shí)刻,事先得到其本地每一個(gè)內(nèi)容文件i在未來(lái)時(shí)間間隔[tz,tz+1)內(nèi)的流行度信息pi(m,[tz,tz+1)),那么原問(wèn)題(3)可以等價(jià)轉(zhuǎn)換為如下線性規(guī)劃問(wèn)題:

      s.t.ωT·s(m,[tz,tz+1))≤Cm,?z=1,…,Z,m∈M,

      (4)

      式中:{s(m,[tz,tz+1))}是優(yōu)化變量。問(wèn)題(4)可以針對(duì)每一個(gè)時(shí)間間隔[tz,tz+1)和每一個(gè)智能接入熱點(diǎn)m更進(jìn)一步解耦合為Z·M個(gè)獨(dú)立的子問(wèn)題。每一個(gè)子問(wèn)題都是一個(gè)背包容量為Cm、物品數(shù)為F的0-1背包問(wèn)題。一般形式的0-1背包問(wèn)題是一個(gè)典型的NP完全問(wèn)題,對(duì)于一個(gè)有n個(gè)物品的0-1背包問(wèn)題,給定解的精確度ε,總可以在時(shí)間復(fù)雜度Ο(nlog(1/ε)+1/ε4)和空間復(fù)雜度Ο(n+1/ε3)解出該問(wèn)題。此外,一些針對(duì)背包問(wèn)題精巧設(shè)計(jì)的搜索算法可以找到問(wèn)題的精確全局最優(yōu)解[16]。

      特別地,若每一個(gè)內(nèi)容文件i都有相同大小(都?xì)w一化為單位大小),問(wèn)題(4)的最優(yōu)解可以簡(jiǎn)單地通過(guò)時(shí)間復(fù)雜度Ο(Flog(F))計(jì)算得到。也就是根據(jù)本地內(nèi)容文件的流行度pi(m,[tz,tz+1))對(duì)內(nèi)容文件進(jìn)行排序,選出最受歡迎的Cm個(gè)內(nèi)容文件進(jìn)行緩存。每個(gè)內(nèi)容文件大小相同的情況在現(xiàn)實(shí)系統(tǒng)中常被運(yùn)用,例如被廣泛采用的HTTP(DASH)協(xié)議。在這個(gè)協(xié)議中,每一個(gè)內(nèi)容文件被拆分成相同大小的塊,每一塊可以認(rèn)為是一個(gè)內(nèi)容文件。因此,根據(jù)本地內(nèi)容文件的流行度,在緩存內(nèi)容文件部署階段可以直接通過(guò)對(duì)內(nèi)容文件的流行度排序,選擇最受歡迎的Cm個(gè)內(nèi)容文件緩存。在緩存內(nèi)容文件交付階段,對(duì)于與智能接入熱點(diǎn)m相連接的移動(dòng)用戶u的內(nèi)容文件請(qǐng)求,智能接入熱點(diǎn)m先確認(rèn)用戶請(qǐng)求的內(nèi)容文件是否已經(jīng)事先被緩存。如果該文件已經(jīng)被提前緩存,那么該用戶的請(qǐng)求會(huì)被智能接入熱點(diǎn)從本地緩存存儲(chǔ)器直接快速響應(yīng)。反之,用戶請(qǐng)求的內(nèi)容文件會(huì)從遠(yuǎn)程的內(nèi)容服務(wù)器經(jīng)過(guò)回傳鏈路網(wǎng)絡(luò)回傳至本地,然后服務(wù)該用戶請(qǐng)求。這種情況在通信量高峰時(shí)期會(huì)造成很高的網(wǎng)絡(luò)時(shí)延,給系統(tǒng)帶來(lái)很大的回傳鏈路負(fù)載。因此,根據(jù)內(nèi)容文件未來(lái)的流行度信息,在有限的緩存空間中緩存最受歡迎的內(nèi)容文件是提升系統(tǒng)性能的關(guān)鍵。不幸的是內(nèi)容文件未來(lái)的流行度信息無(wú)法在現(xiàn)有移動(dòng)邊緣網(wǎng)絡(luò)中提前獲得,需要移動(dòng)邊緣網(wǎng)絡(luò)根據(jù)觀測(cè)到的信息來(lái)預(yù)測(cè)。本文受到深度學(xué)習(xí)在數(shù)據(jù)分析上優(yōu)良表現(xiàn)的啟發(fā)[17],提出一種使用深度神經(jīng)網(wǎng)絡(luò)精確預(yù)測(cè)內(nèi)容文件流行度的方法。

      2 基于深度學(xué)習(xí)的內(nèi)容文件流行度預(yù)測(cè)

      根據(jù)深度學(xué)習(xí)的框架預(yù)測(cè)內(nèi)容文件的流行度包括模型訓(xùn)練和預(yù)測(cè)兩個(gè)階段。在本文所提的深度緩存策略中,內(nèi)容文件流行度預(yù)測(cè)模型的訓(xùn)練采用離線訓(xùn)練的方式進(jìn)行。訓(xùn)練完成后的模型參數(shù)被存儲(chǔ)在各個(gè)智能接入熱點(diǎn)中,用于本地內(nèi)容文件流行度預(yù)測(cè)。在模型預(yù)測(cè)階段,智能接入熱點(diǎn)根據(jù)收集的本地內(nèi)容文件歷史信息周期性地預(yù)測(cè)內(nèi)容文件未來(lái)流行度,用于深度緩存策略決策。下面將詳細(xì)介紹本文提出的堆疊長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)內(nèi)容文件流行度預(yù)測(cè)模型。

      2.1 長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)

      與標(biāo)準(zhǔn)形式的循環(huán)神經(jīng)網(wǎng)絡(luò)相比,長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)上多了一系列門(mén)單元。具體來(lái)說(shuō),每一個(gè)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)單元在t時(shí)刻由一系列門(mén)單元組成,包含:輸入門(mén)et,輸出門(mén)ot和遺忘門(mén)at。每一個(gè)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)單元可以如下表示:

      (5)

      式中:xt和ht分別為t時(shí)刻的輸入與輸出向量;Wa、We、Wo和Wc分別表示與之對(duì)應(yīng)的門(mén)的權(quán)重矩陣和記憶狀態(tài)權(quán)重矩陣;ba、be、bo和bc分別為對(duì)應(yīng)的偏置向量;σ()是門(mén)單元的Sigmoid激活函數(shù);tanh()是記憶狀態(tài)的激活函數(shù);*和·分別是Hadamard乘法和矩陣乘法。因?yàn)殚T(mén)單元引入,使門(mén)單元的輸出限制在1以下,可以很好地避免梯度的爆炸增長(zhǎng)問(wèn)題,增加模型訓(xùn)練的穩(wěn)定性。此外,門(mén)單元的引入使得長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可以更長(zhǎng)時(shí)間地保存過(guò)去的信息。

      2.2 內(nèi)容文件流行度預(yù)測(cè)模型

      在長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,本文提出一種3層堆疊的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)用于內(nèi)容文件流行度預(yù)測(cè)。輸入預(yù)測(cè)模型的內(nèi)容文件流行度特征序列先后通過(guò)特征提取層、非線性映射層和流行度預(yù)測(cè)層,最后得到內(nèi)容文件流行度預(yù)測(cè)模型的預(yù)測(cè)輸出。因?yàn)閮?nèi)容文件的歷史訪問(wèn)次數(shù)與內(nèi)容文件未來(lái)流行度之間有較大的關(guān)聯(lián)性[18],所以移動(dòng)邊緣網(wǎng)絡(luò)中的每一個(gè)智能接入熱點(diǎn)m每隔r小時(shí),為每一個(gè)內(nèi)容文件i∈F記錄對(duì)應(yīng)的請(qǐng)求次數(shù)pi(m,[t-r,t))。為了更好地運(yùn)用數(shù)據(jù)和減少數(shù)值優(yōu)化問(wèn)題,本文對(duì)內(nèi)容文件的歷史請(qǐng)求次數(shù)做對(duì)數(shù)變換后作為預(yù)測(cè)模型的輸入值,即

      xi(m,t:r)=log(pi(m,[t-r,t))+1).

      (6)

      為了能夠自適應(yīng)地預(yù)測(cè)隨時(shí)間不斷變化的內(nèi)容文件流行度,本文使用一個(gè)長(zhǎng)度為R的滑動(dòng)窗為每個(gè)內(nèi)容文件i∈F保存時(shí)間最近的R個(gè)輸入值。這R個(gè)輸入值被組成內(nèi)容文件流行度預(yù)測(cè)模型的輸入特征序列。即,在tz時(shí)刻,內(nèi)容文件流行度預(yù)測(cè)模型的輸入特征序列可表示為xi(m,tz:r)=[xi(m,tz-r·(R-1):r),…,xi(m,tz:r)]。 也就是說(shuō),內(nèi)容文件流行度預(yù)測(cè)模型根據(jù)輸入的特征序列xi(m,tz:r)預(yù)測(cè)內(nèi)容文件i在未來(lái)時(shí)間間隔[tz,tz+1)內(nèi)的流行度pi(m,[tz,tz+1))。

      圖2展示本文所提內(nèi)容文件流行度預(yù)測(cè)模型的結(jié)構(gòu)。在輸入層,輸入特征序列xi(m,tz:r)中的R個(gè)值按時(shí)間順序被先后輸入到內(nèi)容文件流行度預(yù)測(cè)模型。水平方向表示時(shí)間軸,每一層上的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)單元在不同時(shí)刻相互分享參數(shù)。3層不同作用的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)在垂直方向上堆疊,不同層的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)單元參數(shù)不同。低層長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的輸出被直接作為高層長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的輸入。最底層的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)用于提取輸入特征序列的抽象特征,稱為特征提取層。預(yù)測(cè)模型的輸入序列是不同時(shí)刻經(jīng)過(guò)對(duì)數(shù)變換的內(nèi)容文件歷史訪問(wèn)次數(shù),這些不同時(shí)刻的歷史訪問(wèn)次數(shù)與未來(lái)內(nèi)容文件流行度的相關(guān)程度是不同的。我們利用特征提取層學(xué)習(xí)不同時(shí)刻歷史訪問(wèn)次數(shù)與未來(lái)內(nèi)容文件流行度的相關(guān)聯(lián)程度,即學(xué)習(xí)輸入特征序列的特征表示。第二層長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)把第一層學(xué)習(xí)到的特征表示進(jìn)一步進(jìn)行非線性映射,組合成更加復(fù)雜的內(nèi)容文件歷史訪問(wèn)模式表示。我們稱第二層長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)為非線性映射層。在預(yù)測(cè)模型的最后一層(流行度預(yù)測(cè)層),內(nèi)容文件歷史訪問(wèn)模式表示被進(jìn)一步映射表示成為內(nèi)容文件未來(lái)流行度信息。

      圖2 堆疊LSTM神經(jīng)網(wǎng)絡(luò)內(nèi)容文件流行度預(yù)測(cè)模型Fig.2 Popularity prediction model via stacked LSTM

      這種堆疊結(jié)構(gòu)的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)每一層都有不同的作用。與單層的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)相比,堆疊的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)可以增加模型容量,學(xué)習(xí)到更加復(fù)雜的特征表示,由此提高內(nèi)容文件流行度的預(yù)測(cè)準(zhǔn)確性。在輸出層,本文使用線性回歸的方式預(yù)測(cè)時(shí)間間隔[tz,tz+1)內(nèi)的內(nèi)容文件受歡迎程度。堆疊長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)內(nèi)容文件流行度預(yù)測(cè)模型中不同層長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的維度從特征提取層到流行度預(yù)測(cè)層依次分別設(shè)定為:60,120,40。該堆疊長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)整體的參數(shù)個(gè)數(shù)約為W=127 000。此外,因?yàn)閮?nèi)容文件受歡迎程度的數(shù)值區(qū)間范圍很大(大約為100~109),為避免數(shù)值優(yōu)化問(wèn)題,這里同樣使用對(duì)數(shù)變換獲得模型訓(xùn)練時(shí)對(duì)應(yīng)的標(biāo)簽,即

      Qi(m,[tz,tz+1))=log(pi(m,[tz,tz+1))+1).

      (7)

      圖2預(yù)測(cè)模型中的參數(shù)可以通過(guò)解下面的優(yōu)化問(wèn)題(8)獲得:

      (8)

      求解優(yōu)化問(wèn)題(8)的過(guò)程就是本文所提的堆疊長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)內(nèi)容文件流行度預(yù)測(cè)模型的訓(xùn)練過(guò)程。對(duì)于深度神經(jīng)網(wǎng)絡(luò),通常無(wú)法直接計(jì)算得到對(duì)應(yīng)優(yōu)化問(wèn)題的全局最優(yōu)解,但是優(yōu)化目標(biāo)函數(shù)對(duì)神經(jīng)網(wǎng)絡(luò)參數(shù)的導(dǎo)數(shù)可以求得。因此本文使用深度學(xué)習(xí)中最常使用的隨機(jī)梯度下降法(stochastic gradient descent, SGD)和時(shí)間反向傳播算法[19](back propagation through Time)對(duì)問(wèn)題(8)迭代求解,逐步逼近最優(yōu)解[17]。單次預(yù)測(cè)模型參數(shù)迭代更新的復(fù)雜度為Ο(W)[20],其中W為模型參數(shù)個(gè)數(shù)。因?yàn)楸疚乃岬纳疃染彺娌呗圆捎秒x線訓(xùn)練的方式進(jìn)行內(nèi)容文件流行度預(yù)測(cè)模型,所以模型訓(xùn)練帶來(lái)的時(shí)間消耗可忽略不記。

      3 仿真實(shí)驗(yàn)

      3.1 仿真設(shè)置

      本文使用從Facebook網(wǎng)站收集的真實(shí)視頻數(shù)據(jù)集[13],數(shù)據(jù)集中包含總共1 820個(gè)上傳在Facebook網(wǎng)站的視頻和其3個(gè)月間每個(gè)小時(shí)被訪問(wèn)的次數(shù)。根據(jù)實(shí)際情況下,午夜時(shí)刻移動(dòng)網(wǎng)絡(luò)通常處于通信量低谷期的事實(shí),本文設(shè)置預(yù)測(cè)模型參數(shù)為:R=32,r=1,tz時(shí)刻到tz+1時(shí)刻的時(shí)間間隔為24 h。即,移動(dòng)邊緣網(wǎng)絡(luò)中的每一個(gè)智能接入熱點(diǎn)每隔1 h記錄一次本地所有內(nèi)容文件在此期間的被請(qǐng)求次數(shù),每隔24 h根據(jù)最新預(yù)測(cè)的本地內(nèi)容文件未來(lái)流行度更新一次緩存內(nèi)容。內(nèi)容文件未來(lái)流行度預(yù)測(cè)結(jié)果由最近32 h的內(nèi)容文件歷史請(qǐng)求特征序列通過(guò)本文提出的堆疊長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)模型給出。移動(dòng)邊緣網(wǎng)絡(luò)緩存系統(tǒng)這種運(yùn)行方式一方面可以動(dòng)態(tài)跟蹤內(nèi)容文件流行度的變化,從而提高系統(tǒng)的緩存命中率、提升用戶體驗(yàn);另一方面可以在移動(dòng)邊緣網(wǎng)絡(luò)通信量的低谷時(shí)期進(jìn)行緩存更新任務(wù),從而減少對(duì)系統(tǒng)回傳鏈路網(wǎng)絡(luò)的負(fù)載、平衡通信量高峰期和低谷期之間的回傳鏈路上的負(fù)載,提高系統(tǒng)效能。

      此外,本文使用深度學(xué)習(xí)中經(jīng)常使用的數(shù)據(jù)增強(qiáng)操作[21]。真實(shí)數(shù)據(jù)集先被分成訓(xùn)練數(shù)據(jù)集(820個(gè)視頻)和測(cè)試數(shù)據(jù)集(1 000個(gè)視頻)。然后對(duì)訓(xùn)練數(shù)據(jù)集執(zhí)行數(shù)據(jù)增強(qiáng)操作。對(duì)每一個(gè)訓(xùn)練樣本,劃分并選擇5個(gè)相互不重疊的窗口,每個(gè)窗口中包含56 h的數(shù)據(jù),總共獲得4 100個(gè)訓(xùn)練樣本(即D=4 100)。在訓(xùn)練階段,10折交叉驗(yàn)證技術(shù)被用于設(shè)置超參數(shù)。同時(shí),Dropout技術(shù)[22]被應(yīng)用在訓(xùn)練過(guò)程,用于防止預(yù)測(cè)模型的過(guò)擬合。我們連續(xù)在一個(gè)智能接入熱點(diǎn)上仿真運(yùn)行本文提出的移動(dòng)邊緣緩存策略7天。進(jìn)而驗(yàn)證本文提出的基于深度學(xué)習(xí)的內(nèi)容文件流行度預(yù)測(cè)模型的有效性和深度緩存策略在移動(dòng)邊緣緩存網(wǎng)絡(luò)中的性能。

      3.2 性能比較

      仿真實(shí)驗(yàn)首先對(duì)本文提出的基于深度學(xué)習(xí)的堆疊長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)內(nèi)容文件流行度預(yù)測(cè)方法和目前性能最優(yōu)的流行度SVR(support vector regression)[13]預(yù)測(cè)方法進(jìn)行比較。為了進(jìn)一步驗(yàn)證本文提出的3層堆疊長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)(簡(jiǎn)稱:堆疊LSTM)的有效性,還與單層長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)(簡(jiǎn)稱:?jiǎn)螌覮STM)進(jìn)行了比較。內(nèi)容文件流行度預(yù)測(cè)精確度對(duì)比結(jié)果如表1所示。3種不同的預(yù)測(cè)方法得到的Spearman rank(斯皮爾曼等級(jí))系數(shù)均值和95%置信區(qū)間如表1所示。雖然流行度SVR方法通過(guò)核函數(shù)的應(yīng)用,增加了模型的容量,已經(jīng)得到了較高的預(yù)測(cè)精度。但是基于深度學(xué)習(xí)的循環(huán)神經(jīng)網(wǎng)絡(luò)框架的兩種方法無(wú)論是從預(yù)測(cè)精確度還是預(yù)測(cè)魯棒性的角度都超越了目前最優(yōu)的流行度SVR預(yù)測(cè)方法。通過(guò)比較單層LSTM和堆疊LSTM兩種基于深度學(xué)習(xí)的方法,發(fā)現(xiàn)堆疊LSTM結(jié)構(gòu)給出了更高的預(yù)測(cè)精確度和預(yù)測(cè)穩(wěn)定性。這意味著本文提出的3層不同作用的LSTM神經(jīng)網(wǎng)絡(luò)堆疊結(jié)構(gòu)有效提高了模型對(duì)于內(nèi)容文件流行度預(yù)測(cè)的表達(dá)能力。在仿真中注意到,如果要把流行度預(yù)測(cè)系統(tǒng)整合入緩存系統(tǒng)中,Spearman rank系數(shù)可能并不能很好地評(píng)價(jià)流行度預(yù)測(cè)系統(tǒng)對(duì)于緩存系統(tǒng)而言的優(yōu)劣。針對(duì)本文提出的緩存系統(tǒng),在表1中比較了Top 50和Top 100兩個(gè)指標(biāo)。其中Top 50指標(biāo)指的是流行度最高的50個(gè)視頻中排列順序正確的視頻占比,依此類推。依據(jù)這兩個(gè)指標(biāo),本文提出的基于深度學(xué)習(xí)的兩種預(yù)測(cè)方法均優(yōu)于流行度SVR預(yù)測(cè)方法。我們還發(fā)現(xiàn),針對(duì)流行度預(yù)測(cè)這一任務(wù),深度學(xué)習(xí)的損失函數(shù)可以進(jìn)一步設(shè)計(jì),而不是簡(jiǎn)單地使用MSE。通過(guò)進(jìn)一步設(shè)計(jì)深度學(xué)習(xí)的損失函數(shù),可以使模型能夠更好應(yīng)對(duì)流行度預(yù)測(cè)任務(wù)的需求。

      表1 內(nèi)容文件流行度預(yù)測(cè)準(zhǔn)確度比較Table 1 File popularity prediction accuracy comparison

      在仿真實(shí)驗(yàn)中,我們測(cè)試了本文所提的堆疊長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)內(nèi)容文件流行度預(yù)測(cè)模型在執(zhí)行模型預(yù)測(cè)時(shí)的時(shí)間消耗,并與流行度SVR方法進(jìn)行比較,如表2 所示。雖然本文所提的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型從性能上優(yōu)于流行SVR方法,但是因?yàn)樵撋窠?jīng)網(wǎng)絡(luò)模型的規(guī)模不是很大,因此執(zhí)行模型預(yù)測(cè)所需消耗的時(shí)間與流行度SVR方法相當(dāng)。在實(shí)際系統(tǒng)中,神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和流行度SVR方法的預(yù)測(cè)復(fù)雜度與待預(yù)測(cè)內(nèi)容文件個(gè)數(shù)F均成線性關(guān)系。與傳統(tǒng)緩存算法相比,本文所提的基于流行度預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)模型的深度緩存策略需要額外進(jìn)行模型預(yù)測(cè),但是執(zhí)行模型預(yù)測(cè)的耗時(shí)并不是很大。本文所提的深度緩存策略僅在移動(dòng)邊緣網(wǎng)絡(luò)運(yùn)行的空閑時(shí)期進(jìn)行緩存內(nèi)容文件的部署,適當(dāng)使用一些計(jì)算資源換取緩存系統(tǒng)更高的運(yùn)行效率。

      表2 內(nèi)容文件流行度預(yù)測(cè)耗時(shí)比較Table 2 File popularity prediction time cost comparison

      仿真實(shí)驗(yàn)還比較了本文提出的深度緩存策略與下列其他緩存策略,用于進(jìn)一步驗(yàn)證基于堆疊長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測(cè)模型設(shè)計(jì)的深度緩存系統(tǒng)的有效性。其中前3種是傳統(tǒng)的緩存策略,SVR緩存策略是基于目前性能最佳的流行度SVR預(yù)測(cè)方法的緩存策略。具體如下:1)先入先出(first in first out, FIFO)緩存策略[23];2)最久使用(LRU)緩存策略[6];3)頻率最少(LFU)緩存策略[7];4)流行度SVR緩存策略(簡(jiǎn)稱:SVR緩存策略):流行度SVR這個(gè)預(yù)測(cè)方法被集成到本文的緩存系統(tǒng)中,代替本文提出的基于深度學(xué)習(xí)的預(yù)測(cè)方法;5)最優(yōu)緩存策略:最優(yōu)緩存策略使用真實(shí)系統(tǒng)無(wú)法得知的內(nèi)容文件未來(lái)流行度信息進(jìn)行緩存決策,是緩存系統(tǒng)能達(dá)到的最優(yōu)性能。平均緩存命中率性能比較結(jié)果如圖3所示,平均包時(shí)延性能比較結(jié)果如圖4所示。

      圖3 平均緩存命中率性能比較圖Fig.3 Average cache hit rate comparison

      圖4 平均包時(shí)延性能比較圖Fig.4 Average packet delay comparison

      我們使用與文獻(xiàn)[24]相同的通信系統(tǒng)參數(shù)進(jìn)行包時(shí)延性能仿真。緩存容量被定義為緩存文件數(shù)相對(duì)于文件庫(kù)中文件數(shù)總數(shù)的占比。如圖3、圖4,在所有緩存容量上,本文提出的深度緩存策略性能不僅優(yōu)于傳統(tǒng)的緩存策略還優(yōu)于基于目前最優(yōu)內(nèi)容文件流行度預(yù)測(cè)方法的緩存策略。相比于傳統(tǒng)緩存策略,本文提出的深度緩存策略有很大的性能提升。例如:當(dāng)需要80%的平均緩存命中時(shí),傳統(tǒng)緩存策略中最好的LRU緩存策略與本文提出的深度緩存略差相比還需要額外50%的緩存容量;當(dāng)緩存容量較小時(shí),平均包時(shí)延可以降低約40%。傳統(tǒng)緩存算法雖然也有考慮歷史內(nèi)容文件流行度信息,如LFU、LRU,但是這些緩存算法無(wú)法充分利用這些有限的歷史流行度信息來(lái)預(yù)測(cè)內(nèi)容文件未來(lái)的流行度。LFU很容易一直緩存過(guò)去點(diǎn)擊次數(shù)非常多的內(nèi)容文件,造成歷史信息污染。LRU算法則會(huì)因一些偶發(fā)性的,周期性的內(nèi)容文件需求而引發(fā)緩存污染。

      本文提出的基于深度學(xué)習(xí)的內(nèi)容文件流行度預(yù)測(cè)方法借助于深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的模式表示能力,學(xué)習(xí)到歷史數(shù)據(jù)中不同增長(zhǎng)、衰減方式的內(nèi)容文件流行度變化的趨勢(shì)?;瑒?dòng)窗的設(shè)計(jì)使得深度緩存策略可以實(shí)時(shí)跟蹤內(nèi)容文件歷史流行度信息,從而動(dòng)態(tài)地跟蹤本地內(nèi)容文件的流行度變化。仿真實(shí)驗(yàn)證明,把內(nèi)容文件未來(lái)流行度信息考慮到緩存策略的制定中有助于提升緩存系統(tǒng)的性能,特別是遇到緩存容量因?yàn)橛布蚴艿较拗频那闆r時(shí)。深度學(xué)習(xí)方法的引入使得內(nèi)容文件未來(lái)流行度的預(yù)測(cè)可以更加精確,進(jìn)一步提升移動(dòng)邊緣緩存系統(tǒng)的性能。此外,與最優(yōu)緩存策略比較發(fā)現(xiàn),深度緩存策略的性能已經(jīng)達(dá)到近似最優(yōu)。

      4 結(jié)論

      本文基于深度學(xué)習(xí)提出一種內(nèi)容文件流行度預(yù)測(cè)方法,并依此設(shè)計(jì)一個(gè)最大化緩存命中率的深度緩存策略。因?yàn)楸疚奶岢龅亩询B長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)可以很好地發(fā)掘內(nèi)容文件歷史訪問(wèn)模式和內(nèi)容文件未來(lái)流行度之間隱藏的關(guān)系,所以本文的內(nèi)容文件流行度預(yù)測(cè)方法可以精確地預(yù)測(cè)內(nèi)容文件未來(lái)的流行度。來(lái)自Facebook真實(shí)的視頻數(shù)據(jù)集被用來(lái)驗(yàn)證本文提出的內(nèi)容文件流行度預(yù)測(cè)方法和基于此的深度緩存策略。仿真結(jié)果證明本文提出的內(nèi)容文件流行度預(yù)測(cè)方法性能優(yōu)于目前最優(yōu)的流行度SVR方法。依靠精準(zhǔn)的內(nèi)容文件流行度預(yù)測(cè)信息,本文提出的深度緩存策略的性能遠(yuǎn)超傳統(tǒng)緩存策略,達(dá)到近似最優(yōu)。

      猜你喜歡
      神經(jīng)網(wǎng)絡(luò)深度記憶
      深度理解一元一次方程
      神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      深度觀察
      深度觀察
      深度觀察
      記憶中的他們
      兒時(shí)的記憶(四)
      兒時(shí)的記憶(四)
      記憶翻新
      海外文摘(2016年4期)2016-04-15 22:28:55
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      封丘县| 延吉市| 海丰县| 平安县| 盐边县| 郑州市| 桂平市| 公主岭市| 洛南县| 道孚县| 梁山县| 泗洪县| 泽州县| 会理县| 虹口区| 景泰县| 绿春县| 绩溪县| 濮阳市| 阳城县| 陆川县| 秭归县| 西乌珠穆沁旗| 类乌齐县| 林西县| 微山县| 青浦区| 井研县| 顺义区| 南宁市| 巴林左旗| 郧西县| 临泽县| 静乐县| 友谊县| 仪陇县| 象州县| 历史| 舟曲县| 竹北市| 五台县|