任語(yǔ)錚+謝人超+黃韜
摘要:提出了一種基于增強(qiáng)學(xué)習(xí)的網(wǎng)絡(luò)切片資源動(dòng)態(tài)優(yōu)化方案。使用該方案動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)切片資源時(shí),通過(guò)考慮未來(lái)網(wǎng)絡(luò)切片中的業(yè)務(wù)流量變化情況,對(duì)業(yè)務(wù)流量進(jìn)行預(yù)測(cè),從而推斷出未來(lái)網(wǎng)絡(luò)資源的劃分情況;再通過(guò)增強(qiáng)學(xué)習(xí)算法,使得未來(lái)時(shí)刻的網(wǎng)絡(luò)資源劃分狀態(tài)對(duì)當(dāng)前劃分策略做出影響,從而得到當(dāng)前的最佳策略?;谠撍惴?,可以保證在資源分配過(guò)程中對(duì)網(wǎng)絡(luò)需求變化做出快速響應(yīng),并通過(guò)仿真進(jìn)行了驗(yàn)證。
關(guān)鍵詞: 5G;網(wǎng)絡(luò)切片;增強(qiáng)學(xué)習(xí);動(dòng)態(tài)優(yōu)化
Abstract: In this paper, a dynamic optimization algorithm based on reinforcement learning for network slicing division is proposed. Network resources can be dynamically allocated in the following ways: the traffic flow can be predicted by considering the changes of flow, then the division of future network resources can be deduced; based on reinforcement learning algorithm, the current partition strategy will be affected by the state of network resource partitioning in the future, and the best division strategy can be got. Based on this algorithm, the change of network requirements can be rapidly responded in the process of resource allocation, and verified by simulation.
Key words: 5G; network slicing; reinforcement learning; dynamic optimization
1 5G網(wǎng)絡(luò)架構(gòu)與網(wǎng)絡(luò)切片
的概念
為了能對(duì)各業(yè)務(wù)提供獨(dú)立的網(wǎng)絡(luò)服務(wù)而又不鋪設(shè)專(zhuān)用網(wǎng)絡(luò),5G網(wǎng)絡(luò)引入了網(wǎng)絡(luò)切片技術(shù)[1-2],即使用軟件網(wǎng)絡(luò)定義(SDN)/網(wǎng)絡(luò)功能虛擬化(NFV)技術(shù),將物理基礎(chǔ)設(shè)施資源虛擬化為多個(gè)相互獨(dú)立的平行的網(wǎng)絡(luò)切片,每個(gè)網(wǎng)絡(luò)切片服務(wù)于某一具體的業(yè)務(wù)場(chǎng)景,以滿足不同業(yè)務(wù)場(chǎng)景對(duì)帶寬、時(shí)延、服務(wù)質(zhì)量等差異化要求,從而滿足各種垂直行業(yè)多樣化需求,以增強(qiáng)網(wǎng)絡(luò)彈性和自適應(yīng)性。網(wǎng)絡(luò)切片技術(shù)提升了網(wǎng)絡(luò)資源利用率,節(jié)省了運(yùn)營(yíng)商的花費(fèi)。
下一代移動(dòng)通信網(wǎng)(NGMN)5G白皮書(shū)中的網(wǎng)絡(luò)切片如圖1[3]所示。目前NGMN對(duì)不同的應(yīng)用場(chǎng)景進(jìn)行了劃分,并為每個(gè)應(yīng)用場(chǎng)景設(shè)計(jì)了相應(yīng)的網(wǎng)絡(luò)切片,總共定義了8個(gè)系列,覆蓋了現(xiàn)今業(yè)務(wù)的大部分場(chǎng)景[3]。
然而網(wǎng)絡(luò)切片資源的劃分并非是一成不變的,而應(yīng)隨各業(yè)務(wù)流量的變化進(jìn)行動(dòng)態(tài)調(diào)整。首先,由于部分用戶在不斷移動(dòng),且用戶需求往往會(huì)隨著時(shí)間的改變發(fā)生改變,所以網(wǎng)絡(luò)中各業(yè)務(wù)流量也是動(dòng)態(tài)變化的。此外,第三方服務(wù)提供商可能會(huì)開(kāi)發(fā)不同的網(wǎng)絡(luò)業(yè)務(wù),形成不同的應(yīng)用需求,從而要求一個(gè)不同的網(wǎng)絡(luò)切片實(shí)例。這都導(dǎo)致了網(wǎng)絡(luò)切片的劃分要隨需求的改變發(fā)生變動(dòng)。在基于切片的網(wǎng)絡(luò)架構(gòu)中,切片劃分的優(yōu)劣程度直接影響了網(wǎng)絡(luò)性能,所以如何對(duì)切片資源進(jìn)行動(dòng)態(tài)優(yōu)化至關(guān)重要。
針對(duì)網(wǎng)絡(luò)切片資源的動(dòng)態(tài)優(yōu)化,有學(xué)者提出了一種基于比例公平算法的半靜態(tài)資源分配方案。該方案使各網(wǎng)絡(luò)切片之間能實(shí)現(xiàn)更公平地資源分配[4]。然而該算法更著眼于公平性而不是性能,所以其資源利用率還有提升空間。還有學(xué)者認(rèn)為可以通過(guò)對(duì)流量進(jìn)行統(tǒng)計(jì)分析,從而得到全網(wǎng)的流量分布特征,再根據(jù)流量分布預(yù)先構(gòu)造好基本切片。之后通過(guò)分析實(shí)時(shí)流量的負(fù)載和需求構(gòu)造切片,并將構(gòu)造結(jié)果通過(guò) OpenFlow 協(xié)議下發(fā)到交換節(jié)點(diǎn)上[5]。
然而,以上的切片劃分算法都是依據(jù)當(dāng)前時(shí)刻流量進(jìn)行優(yōu)化,而未考慮未來(lái)網(wǎng)絡(luò)流量變化的影響。事實(shí)上,在動(dòng)態(tài)優(yōu)化網(wǎng)絡(luò)切片資源時(shí)需要將未來(lái)網(wǎng)絡(luò)流量的情況一并考慮進(jìn)來(lái),因?yàn)槿绻跊Q策時(shí)考慮了未來(lái)網(wǎng)絡(luò)的流量變化,則相當(dāng)于在切片劃分策略中引入了預(yù)測(cè)功能。使得劃分結(jié)果可以更快地對(duì)未來(lái)網(wǎng)絡(luò)的需求變化作出響應(yīng)。
為了解決這一問(wèn)題,我們提出了一種基于增強(qiáng)學(xué)習(xí)的動(dòng)態(tài)優(yōu)化網(wǎng)絡(luò)切片資源方案。
2 基于增強(qiáng)學(xué)習(xí)的網(wǎng)絡(luò)
切片動(dòng)態(tài)優(yōu)化方案
2.1 增強(qiáng)學(xué)習(xí)
增強(qiáng)學(xué)習(xí)(RL)是近些年機(jī)器學(xué)習(xí)和智能控制領(lǐng)域的主要方法之一。RL通過(guò)使累積效用最大化,從而確定智能體在環(huán)境中應(yīng)該采取的一組行為。RL累積效用的計(jì)算方式并不取決于過(guò)去的行為,而取決于未來(lái)的狀態(tài),也就是說(shuō)未來(lái)所處的狀態(tài)會(huì)影響到當(dāng)前的狀態(tài)選擇。通過(guò)增強(qiáng)學(xué)習(xí),一個(gè)智能體可以知道在某個(gè)特定狀態(tài)下應(yīng)該采取什么行動(dòng)。
RL的思想很像馬爾可夫過(guò)程(MDP)。它定義了四元組{S,A,[Psa],R}。其中,S是智能體當(dāng)前所處的狀態(tài),A是智能體采取的行為,[Psa]是智能體在狀態(tài)S下做出動(dòng)作A之后轉(zhuǎn)移到其它狀態(tài)的概率分布,R是每個(gè)狀態(tài)的效用函數(shù)。此外,RL還定義了狀態(tài)到行為的映射,[π:S→A],被稱(chēng)為策略。
如圖2所示,狀態(tài)[S00]在動(dòng)作[a00]下,以一定的轉(zhuǎn)移概率轉(zhuǎn)移到了[S10],狀態(tài)[S00]的效用函數(shù)是[r00],狀態(tài)[S10]的效用函數(shù)是[r10]。
增強(qiáng)學(xué)習(xí)通過(guò)定義和最優(yōu)化值函數(shù)來(lái)得到最優(yōu)策略,最常見(jiàn)的值函數(shù)形式如式(1):
[Vπ(s)=Eπ(i=0∞γiri|s0=s)] (1)endprint
可以看到:這是對(duì)一組效用函數(shù)的加權(quán)和求期望,其中[γ]被稱(chēng)為折合因子,描述了未來(lái)效用對(duì)當(dāng)前效用的重要程度。
有了值函數(shù)的定義之后,求最優(yōu)策略就變成了最大化值函數(shù),即:
[π*=argmaxπVπ(s),?s∈S] (2)
我們可以依據(jù)以下原則來(lái)對(duì)已有策略進(jìn)行改進(jìn):若保持策略[π]的其他行為不變,僅將狀態(tài)s下的動(dòng)作a改變?yōu)閇a],由此得到了新策略[π]。若值函數(shù)[V>V],則說(shuō)明策略[π]好于策略[π]。我們可以通過(guò)動(dòng)態(tài)規(guī)劃的算法來(lái)得到最優(yōu)策略[π*]。
2.2 基于增強(qiáng)學(xué)習(xí)的網(wǎng)絡(luò)切片動(dòng)態(tài)
優(yōu)化方案
2.2.1 算法的基本思想
端到端的網(wǎng)絡(luò)切片主要包括無(wú)線接入網(wǎng)(RAN)側(cè)切片、核心網(wǎng)(CN)切片,以及連接兩者的傳輸網(wǎng)絡(luò)切片。本算法主要針對(duì)CN切片。在5G網(wǎng)絡(luò)中,核心網(wǎng)節(jié)點(diǎn)分布式協(xié)作,以擁有更優(yōu)的網(wǎng)絡(luò)性能。
算法的基本思想是:通過(guò)定義鏈路狀態(tài)矩陣和節(jié)點(diǎn)狀態(tài)矩陣來(lái)描述CN切片的不同劃分方式,則切片在不同劃分方式間的改變就映射成了一張狀態(tài)轉(zhuǎn)移圖,再通過(guò)定義各狀態(tài)下的效用函數(shù)和搜索最大化效用函數(shù)的方式,得到下一個(gè)最佳轉(zhuǎn)移狀態(tài),也就得到了CN切片的最優(yōu)化分方式。
2.2.2 算法中幾個(gè)重要定義
(1)定義鏈路狀態(tài)和節(jié)點(diǎn)狀態(tài)。首先需要對(duì)CN資源進(jìn)行離散化,即對(duì)核心網(wǎng)鏈路與核心網(wǎng)節(jié)點(diǎn)資源劃分資源片。在動(dòng)態(tài)優(yōu)化時(shí),以一個(gè)資源片為最小的變動(dòng)單位。鏈路和節(jié)點(diǎn)在劃分切片時(shí)的不同劃分方式對(duì)應(yīng)著不同的狀態(tài)向量。
(2)預(yù)測(cè)未來(lái)鏈路和節(jié)點(diǎn)所處的狀態(tài)。如果動(dòng)態(tài)優(yōu)化算法具有一定的預(yù)測(cè)功能,那么CN的劃分結(jié)果則能更快地對(duì)網(wǎng)絡(luò)需求變化作出響應(yīng),所以在決策時(shí)需要考慮將來(lái)時(shí)刻核心網(wǎng)可能處于的劃分狀態(tài)。由此我們還需要進(jìn)行流量分析,從而預(yù)測(cè)出未來(lái)各時(shí)刻CN所處的狀態(tài)。
(3)鏈路效用函數(shù)、節(jié)點(diǎn)效用函數(shù)與總效用函數(shù)。效用函數(shù)描述了關(guān)心的若干指標(biāo)。由于對(duì)鏈路和節(jié)點(diǎn)往往關(guān)心不同的指標(biāo),需要分別定義鏈路效用函數(shù)和節(jié)點(diǎn)效用函數(shù)。
以鏈路效用函數(shù)為例,假設(shè)在一個(gè)網(wǎng)絡(luò)中有n類(lèi)業(yè)務(wù),則可以定義某狀態(tài)下的鏈路效用函數(shù)為:[Vl=i=0nVli],其中[Vli]為該鏈路的第i個(gè)網(wǎng)絡(luò)切片的效用函數(shù)。第i個(gè)網(wǎng)絡(luò)切片的子效用函數(shù)可以按照如下的思路定義:首先,鏈路的利用率應(yīng)該為一個(gè)合適的值,因?yàn)殒溌防寐蔬^(guò)高會(huì)帶來(lái)?yè)砣?、丟包;鏈路利用率過(guò)低會(huì)帶來(lái)資源的浪費(fèi),所以在定義效用函數(shù)時(shí),可以給定一個(gè)參考鏈路利用率[α],當(dāng)鏈路的實(shí)際利用率偏離[α]的程度越小時(shí),該網(wǎng)絡(luò)切片的子效用函數(shù)越高。另外,對(duì)某一業(yè)務(wù)而言,不同切片的重要性可能不同,所以可以定義越重要的切片對(duì)應(yīng)的效用函數(shù)越高等等。
同理,可以定義節(jié)點(diǎn)的效用函數(shù)[Vn]。于是,在某時(shí)刻t下,可以定義總的效用函數(shù)[Vt=Vl+Vn],則[t0]時(shí)刻的最大化目標(biāo)函數(shù)為:
其中,[γ]為折合因子,描述了未來(lái)狀態(tài)對(duì)當(dāng)前決策的重要程度。
2.3 算法的具體步驟
算法包括輸入和輸出。輸入指各鏈路、節(jié)點(diǎn)在一段時(shí)間內(nèi)的歷史數(shù)據(jù)包,數(shù)據(jù)包信息主要包括:數(shù)據(jù)的業(yè)務(wù)類(lèi)型及其對(duì)應(yīng)的網(wǎng)絡(luò)切片號(hào)、數(shù)據(jù)包長(zhǎng)度、時(shí)間戳等。
輸出指此時(shí)應(yīng)該對(duì)網(wǎng)絡(luò)鏈路和網(wǎng)絡(luò)節(jié)點(diǎn)做出怎樣的劃分。
算法的流程如下:
(1)內(nèi)容預(yù)測(cè)?;谶^(guò)去一段時(shí)間內(nèi)核心網(wǎng)中的數(shù)據(jù)請(qǐng)求情況,預(yù)測(cè)未來(lái)各離散時(shí)刻下每條鏈路中各類(lèi)業(yè)務(wù)包的流量情況。
(2)資源離散化。將各鏈路和網(wǎng)絡(luò)節(jié)點(diǎn)的資源劃分資源片,日后在進(jìn)行資源配置時(shí)都以一個(gè)資源片為最小的劃分單位。
(3)維護(hù)兩個(gè)狀態(tài)矩陣,分別描述核心網(wǎng)的鏈路狀態(tài)和節(jié)點(diǎn)狀態(tài)。假設(shè)網(wǎng)絡(luò)中共有n類(lèi)切片,給定鏈路初始狀態(tài)[Sl]。此時(shí)第i條鏈路的資源劃分情況為[li=(a1,a2,…,an)],其中,[ak]是第k個(gè)網(wǎng)絡(luò)切片分得的資源片數(shù),[i=0nai]為該條鏈路的資源片總數(shù),則可得到整個(gè)網(wǎng)絡(luò)的鏈路資源劃分矩陣[Am×n],其中每個(gè)行向量描述了各條鏈路的資源劃分情況。定義[Sl=Am×n](m條鏈路)。
給定節(jié)點(diǎn)初始狀態(tài)[Sn],此時(shí)對(duì)第j個(gè)節(jié)點(diǎn)的資源劃分情況為[nj=(b1,b2,…,bn)],其中[bk]是第k個(gè)網(wǎng)絡(luò)切片分得的資源片數(shù),[i=0nbi]為該網(wǎng)絡(luò)節(jié)點(diǎn)的資源片總數(shù),則可得到整個(gè)網(wǎng)絡(luò)的節(jié)點(diǎn)資源劃分矩陣[Bk×n],其中每個(gè)行向量描述了各節(jié)點(diǎn)的資源劃分情況。定義[Sn=Bk×n](k個(gè)節(jié)點(diǎn))。
(4)定義效用函數(shù)。根據(jù)關(guān)心的指標(biāo)定義鏈路效用函數(shù)[Vl]和網(wǎng)絡(luò)節(jié)點(diǎn)效用函數(shù)[Vn];從而得到總的效用函數(shù)[Vt=Vl+Vn]。假設(shè)關(guān)心未來(lái)T個(gè)時(shí)刻網(wǎng)絡(luò)狀態(tài)對(duì)當(dāng)前決策的影響,則需要最大化的目標(biāo)函數(shù)為:
[V總=Vt0+γ1?Vt1+γ2?Vt2+…+γT?VtT=k=0Tγk?Vtk] (4)
(5)假設(shè)需要優(yōu)化的為[t0]時(shí)刻,此時(shí)的鏈路狀態(tài)為[Sl]、節(jié)點(diǎn)狀態(tài)為[Sn],則可求得其相應(yīng)的鏈路效用函數(shù)和節(jié)點(diǎn)效用函數(shù)。在某一action下,鏈路狀態(tài)和節(jié)點(diǎn)狀態(tài)在[t1]時(shí)刻將轉(zhuǎn)移到其相鄰狀態(tài)[Sl′]和[Sn′]。[Sl′]和[Sn′]均為集合,里面的元素是當(dāng)前狀態(tài)的相鄰狀態(tài)。
由于核心網(wǎng)的鏈路資源往往比節(jié)點(diǎn)資源更為豐富,且不同的業(yè)務(wù)對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)的資源需求不同,例如:有的CN切片需要較大的計(jì)算資源,有的切片則需要更大的存儲(chǔ)資源,所以每次轉(zhuǎn)移到新的一組狀態(tài)[Sl′]和[Sn′]之后需要將[Sl′]代入[Sn′]內(nèi)進(jìn)行檢驗(yàn),考查新的鏈路資源劃分是否滿足此時(shí)的節(jié)點(diǎn)劃分需求,若滿足,則可求得新?tīng)顟B(tài)下[Sl′]和[Sn′]的效用函數(shù),然后繼續(xù)進(jìn)行下一次狀態(tài)轉(zhuǎn)移;若不滿足,則將該狀態(tài)對(duì)標(biāo)記為無(wú)效狀態(tài),即從狀態(tài)轉(zhuǎn)移圖中將該轉(zhuǎn)移節(jié)點(diǎn)刪除。鏈路狀態(tài)[Sl′]回退到狀態(tài)[Sl],重新轉(zhuǎn)移到[Sl′]集合中的其他狀態(tài),再繼續(xù)進(jìn)行驗(yàn)證,于是可以得到未來(lái)T個(gè)時(shí)刻的網(wǎng)絡(luò)狀態(tài),再根據(jù)預(yù)測(cè)的數(shù)據(jù)包流量情況算出其各自的效用函數(shù),并以一定的折合率影響當(dāng)前決策,得到了該組策略對(duì)應(yīng)的效應(yīng)值:endprint
[V總=Vt0+γ1?Vt1+γ2?Vt2+…+γT?VtT=k=0Tγk?Vtk] (5)
(6)最大化目標(biāo)函數(shù)[V總]。使用動(dòng)態(tài)規(guī)劃算法進(jìn)行策略改進(jìn),從而收斂到最優(yōu)策略,即可得到當(dāng)前時(shí)刻與未來(lái)時(shí)刻的鏈路和節(jié)點(diǎn)的資源劃分。
3 仿真結(jié)果分析
我們對(duì)比考察了3種算法的性能:方法1是基于比例的網(wǎng)絡(luò)切片動(dòng)態(tài)優(yōu)化方案,該方案會(huì)依據(jù)當(dāng)前各業(yè)務(wù)流量按比例劃分切片資源;方法2是基于公平的靜態(tài)網(wǎng)絡(luò)切片分配方案,該方案將網(wǎng)絡(luò)資源公平地分配到各切片上,且不根據(jù)網(wǎng)絡(luò)流量變化進(jìn)行調(diào)整;方法3是基于增強(qiáng)學(xué)習(xí)的5G網(wǎng)絡(luò)切片資源動(dòng)態(tài)優(yōu)化方案,即文中第3部分所述方案。下面的實(shí)驗(yàn)?zāi)M5G核心網(wǎng),其中的核心網(wǎng)節(jié)點(diǎn)假設(shè)采用分布式協(xié)作。首先保證核心網(wǎng)的網(wǎng)絡(luò)資源不變,通過(guò)提升網(wǎng)絡(luò)中請(qǐng)求數(shù)據(jù)量,比較3種算法的資源利用率;再保證核心網(wǎng)資源和請(qǐng)求數(shù)據(jù)量不變,通過(guò)改變折合因子[γ]的取值,考察網(wǎng)絡(luò)資源的利用率。
假設(shè)有4個(gè)核心網(wǎng)網(wǎng)關(guān)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)可提供的資源數(shù)按照以40為中心的均勻分布生成,CN節(jié)點(diǎn)的資源包括計(jì)算資源、存儲(chǔ)資源等,兩個(gè)CN節(jié)點(diǎn)間的鏈路以一定的概率P生成,每條鏈路的資源數(shù)按照以55為中心的均勻分布生成。假設(shè)運(yùn)營(yíng)商同時(shí)構(gòu)建了2個(gè)CN切片,各切片的請(qǐng)求數(shù)據(jù)包數(shù)量在一定的范圍內(nèi)隨機(jī)生成,例如:當(dāng)各切片的最大內(nèi)容請(qǐng)求數(shù)為N,則每條鏈路各切片請(qǐng)求數(shù)均為0~N內(nèi)的隨機(jī)數(shù),依次可以得到每條鏈路的數(shù)據(jù)包請(qǐng)求數(shù),進(jìn)而可得到通過(guò)每個(gè)節(jié)點(diǎn)的數(shù)據(jù)包請(qǐng)求數(shù),其值為連接在該節(jié)點(diǎn)上的各鏈路數(shù)據(jù)量之和的1/2,總共可以生成T組數(shù)據(jù),用以模擬未來(lái)T時(shí)間內(nèi)各切片的需求情況。
3.1 網(wǎng)絡(luò)中數(shù)據(jù)量的影響
圖3、圖4描述了5G核心網(wǎng)中,當(dāng)前時(shí)刻各算法的節(jié)點(diǎn)平均資源利用率和鏈路平均資源利用率。節(jié)點(diǎn)平均資源利用率依據(jù)以下方式得到:首先考察一個(gè)CN節(jié)點(diǎn),并根據(jù)當(dāng)前時(shí)刻的流量情況算出該節(jié)點(diǎn)各切片的節(jié)點(diǎn)資源利用率,再根據(jù)各切片的資源利用率算出該節(jié)點(diǎn)的資源利用率。同理可得到每個(gè)CN節(jié)點(diǎn)的資源利用率,進(jìn)而可得到節(jié)點(diǎn)的平均資源利用率,以及鏈路平均資源利用率。圖3、圖4主要用于考察3種算法對(duì)網(wǎng)絡(luò)資源的利用情況。
圖5、圖6描述了5G核心網(wǎng)中,未來(lái)時(shí)刻各算法的節(jié)點(diǎn)平均資源利用率和鏈路平均資源利用率。節(jié)點(diǎn)平均資源利用率按照以下方式得到:保持網(wǎng)絡(luò)劃分結(jié)果不變,首先考察一個(gè)CN節(jié)點(diǎn),根據(jù)未來(lái)時(shí)刻的流量情況算出該節(jié)點(diǎn)各切片的資源利用率;再根據(jù)各切片的資源利用率算出該節(jié)點(diǎn)的平均資源利用率;同理可得到每個(gè)CN節(jié)點(diǎn)的資源利用率,進(jìn)而可得到節(jié)點(diǎn)的平均資源利用率,以及鏈路平均資源利用率。圖5、圖6主要用于考察各算法的網(wǎng)絡(luò)劃分結(jié)果對(duì)未來(lái)時(shí)刻數(shù)據(jù)流量的匹配程度。
由圖3、圖4可以看到:當(dāng)各CN切片的最大內(nèi)容請(qǐng)求數(shù)上升,即核心網(wǎng)中的數(shù)據(jù)總量上升時(shí),3種算法的資源利用率隨之上升,并且兩種動(dòng)態(tài)調(diào)整算法的資源利用率提升幅度要高于靜態(tài)劃分算法。這主要是因?yàn)閯?dòng)態(tài)的資源分配結(jié)果與網(wǎng)絡(luò)需求更為匹配,所以讓核心網(wǎng)資源被更好地利用。
由圖5、圖6可以看到:基于增強(qiáng)學(xué)習(xí)的5G網(wǎng)絡(luò)切片資源動(dòng)態(tài)優(yōu)化方案的平均資源利用率最高,基于公平的靜態(tài)劃分算法其次,基于比例的劃分算法最后,其中基于比例的網(wǎng)絡(luò)切片動(dòng)態(tài)優(yōu)化方案最不穩(wěn)定。直觀地,各CN切片的最大內(nèi)容請(qǐng)求數(shù)增加主要會(huì)帶來(lái)兩方面的變化:第一,使得核心網(wǎng)中的數(shù)據(jù)總量上升,從而資源被更充分的利用;第二,各CN切片流量需求的變動(dòng)幅度加大。這意味著當(dāng)網(wǎng)絡(luò)中流量變動(dòng)時(shí),基于比例的劃分算法需要反復(fù)調(diào)整網(wǎng)絡(luò)劃分結(jié)果,而核心網(wǎng)資源的不斷調(diào)整會(huì)消耗大量時(shí)間和資源,所以其資源劃分結(jié)果對(duì)未來(lái)網(wǎng)絡(luò)的需求變化響應(yīng)較慢,且不具有穩(wěn)定性。因此當(dāng)網(wǎng)絡(luò)劃分結(jié)果與未來(lái)時(shí)刻流量不匹配時(shí),會(huì)導(dǎo)致資源利用率很低。
3.2 [γ]取值的影響
折合因子[γ]描述了未來(lái)效用對(duì)當(dāng)前效用的重要程度。下面我們考察其對(duì)基于增強(qiáng)學(xué)習(xí)的5G網(wǎng)絡(luò)切片動(dòng)態(tài)優(yōu)化方案性能的影響。
假設(shè)運(yùn)營(yíng)商同時(shí)構(gòu)建了2個(gè)CN切片,拓?fù)浼昂诵木W(wǎng)資源的生成方式與3.1中一致,各切片最大內(nèi)容請(qǐng)求數(shù)為18。共生成T組數(shù)據(jù),用以模擬未來(lái)T時(shí)間內(nèi)各切片的需求情況。固定以上參數(shù)不變,通過(guò)改變折合因子[γ]的取值,考察其對(duì)資源利用率的影響,結(jié)果如圖7、圖8所示。節(jié)點(diǎn)資源利用率根據(jù)以下方式得到:先考察一個(gè)CN節(jié)點(diǎn)。分別根據(jù)當(dāng)前時(shí)刻、未來(lái)時(shí)刻的流量情況算出該節(jié)點(diǎn)各切片資源利用率;再根據(jù)各切片的資源利用率算出該節(jié)點(diǎn)的平均資源利用率;同理可得到每個(gè)CN節(jié)點(diǎn)的資源利用率,進(jìn)而可得到節(jié)點(diǎn)的平均資源利用率,同理可得到鏈路平均資源利用率。[t0]為當(dāng)前時(shí)刻的資源利用率,[t1]為未來(lái)時(shí)刻的資源利用率。
隨著折合因子[γ]的增加,當(dāng)前時(shí)刻的資源利用率略有下降,未來(lái)時(shí)刻的資源利用率大幅提升。
4 算法的簡(jiǎn)化與參數(shù)選擇
從前文我們可以看到:增強(qiáng)學(xué)習(xí)得到的是5G核心網(wǎng)在未來(lái)一段時(shí)間內(nèi)的一組劃分策略。這組策略除了包括當(dāng)前策略及未來(lái)策略,這意味我們可以通過(guò)檢測(cè)核心網(wǎng)中數(shù)據(jù)包的實(shí)際情況來(lái)簡(jiǎn)化計(jì)算量。如果未來(lái)時(shí)刻核心網(wǎng)數(shù)據(jù)包的實(shí)際流量情況與預(yù)測(cè)的結(jié)果相差不大,那么只需要在計(jì)算好的未來(lái)策略的基礎(chǔ)上做演近式微調(diào),就可以得到新的策略?;谶@種方式,我們可以大大簡(jiǎn)化該算法的計(jì)算量。
另外,我們還可以通過(guò)5G核心網(wǎng)中的鏈路與節(jié)點(diǎn)資源的約束來(lái)定義無(wú)效狀態(tài),并以此來(lái)簡(jiǎn)化計(jì)算量。因?yàn)閷?shí)際的5G網(wǎng)絡(luò)中往往會(huì)存在鏈路和節(jié)點(diǎn)資源不匹配的問(wèn)題,所以鏈路和網(wǎng)絡(luò)節(jié)點(diǎn)則存在著一系列的約束關(guān)系。在劃網(wǎng)絡(luò)資源時(shí),移動(dòng)運(yùn)營(yíng)商往往需要根據(jù)網(wǎng)絡(luò)切片類(lèi)型和網(wǎng)絡(luò)負(fù)載情況為各個(gè)網(wǎng)絡(luò)切片分配固定的資源以滿足其最低要求,這說(shuō)明有些狀態(tài)是不能被轉(zhuǎn)移的。所以,我們可以定義無(wú)效狀態(tài),并且在實(shí)際計(jì)算的過(guò)程中不斷標(biāo)注無(wú)效狀態(tài),刪除不符合資源約束條件的狀態(tài)組合,不斷縮小狀態(tài)轉(zhuǎn)移圖的規(guī)模,以此來(lái)簡(jiǎn)化計(jì)算量。
我們需要考慮的另一個(gè)問(wèn)題是如何對(duì)核心網(wǎng)資源進(jìn)行離散化。網(wǎng)絡(luò)資源的離散化粒度決定了計(jì)算量的大小,如果離散化粒度過(guò)小,則狀態(tài)矩陣維度太高,計(jì)算時(shí)間太長(zhǎng);如果離散化粒度過(guò)大,雖然可以簡(jiǎn)化計(jì)算,但計(jì)算結(jié)果卻很難逼近最優(yōu)解。另外,每一條鏈路和網(wǎng)絡(luò)節(jié)點(diǎn)的離散化粒度可以不同。endprint
此外,我們還需要找到合適的折合因子[γ],它表明了未來(lái)效用對(duì)當(dāng)前效用的影響,并據(jù)此來(lái)影響當(dāng)前的決策。[γ]的值不可過(guò)大或者過(guò)小,如果[γ]過(guò)大,而對(duì)數(shù)據(jù)包的情況預(yù)測(cè)與事實(shí)相差很大,則會(huì)導(dǎo)致對(duì)將來(lái)時(shí)刻的效用計(jì)算不夠準(zhǔn)確,進(jìn)而影響當(dāng)前策略的選擇;如果[γ]過(guò)小,則將來(lái)時(shí)刻的狀態(tài)對(duì)此刻選擇的策略影響不夠,就可能達(dá)不到我們的目的,無(wú)法更好地反應(yīng)各切片對(duì)資源的需求變化。
最后我們還需要選擇合適的時(shí)間窗T,它描述了我們需要考慮將來(lái)多長(zhǎng)一段時(shí)間內(nèi)的狀態(tài)與效用函數(shù)??梢钥吹剑篢不可以過(guò)大,一方面T值的選擇直接決定了本文算法的計(jì)算量大??;另一方面,如果T值過(guò)大,而對(duì)數(shù)據(jù)包的情況預(yù)測(cè)與事實(shí)相差很大,則會(huì)導(dǎo)致對(duì)將來(lái)時(shí)刻的效用計(jì)算不夠準(zhǔn)確,進(jìn)而影響當(dāng)前策略的選擇。但T也不可以過(guò)小,如果T太小則對(duì)未來(lái)狀態(tài)考慮得不夠,同樣不能更好地實(shí)現(xiàn)我們的目的。
5 結(jié)束語(yǔ)
針對(duì)如何動(dòng)態(tài)調(diào)整5G核心網(wǎng)網(wǎng)絡(luò)切片資源,我們提出了一種基于增強(qiáng)學(xué)習(xí)的5G網(wǎng)絡(luò)切片資源動(dòng)態(tài)優(yōu)化方案。該算法首先對(duì)未來(lái)時(shí)刻的核心網(wǎng)狀態(tài)進(jìn)行預(yù)測(cè),再依據(jù)核心網(wǎng)未來(lái)時(shí)刻所處的狀態(tài)對(duì)當(dāng)前決策做出影響,以使切片劃分結(jié)果更快地對(duì)網(wǎng)絡(luò)的需求變化做出響應(yīng)、改善網(wǎng)絡(luò)整體性能。
該算法中的一些參數(shù)會(huì)較大地影響性能,如何對(duì)這些參數(shù)進(jìn)行選取在日后還值得更多的研究。
參考文獻(xiàn)
[1] ITRI. Updates to Solution 6.1.3:Introducing Network Instance ID:S2-162666[R/OL].(2016-08-30)[2016-08-30].http://www.3gpp.org/ftp/tsg_sa/wg2_arch/tsgs2_115_Nanjing_China/Docs/
[2] IMT-2020 (5G)推進(jìn)組.5G網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)白皮書(shū)[R/OL].(2016-08-30)[2016-08-30].http://www.catr.cn/kxyj/qwfb/bps/201606/t2016024_2173031.html
[3] NGMN Alliance. 5G White Paper[R]. 2015
[4] 粟欣,龔金金,曾捷.面向5G網(wǎng)絡(luò)切片無(wú)線資源分配[J].電子產(chǎn)品世界,2017,24(04):30-32+40
[5] 周恒,暢志賢,楊武軍,郭娟.一種5G網(wǎng)絡(luò)切片的編排算法[J].電信科學(xué),2017,33(08):130-137endprint