潘 晨,孫有銘 , , 段焱磊 , 楊正舉 , 張玉立
(1.陸軍工程大學(xué) 通信工程學(xué)院,江蘇 南京 210000;2.中國人民解放軍61062部隊(duì),北京 100089;3.中國人民解放軍92247部隊(duì),云南 昆明 650000)
隨著無線局域網(wǎng)(Wireless Local Area Network,WLAN)技術(shù)的日趨成熟,IEEE 802.11b已經(jīng)成為WLAN的主流接入標(biāo)準(zhǔn),其最高數(shù)據(jù)速率可達(dá)11 Mb/s,得到了廣大設(shè)備生產(chǎn)廠家的支持。IEEE 802.11b中所規(guī)定的無線信道模型中共劃分11條信道,每條信道帶寬為22 MHz,相鄰信道只有5 MHz帶寬不重疊。因此,完全正交(信道不重疊)的信道最多只有3個(gè),即信道1、6和11[1]。信道間有重疊的信道稱為部分重疊信道(Partially Overlapped Channel,POC)。起初,802.11b無線網(wǎng)絡(luò)中的信道資源分配問題主要聚焦在小規(guī)模無線網(wǎng)絡(luò),面臨的最主要挑戰(zhàn)來自于相鄰鏈路間共信道干擾引起的網(wǎng)絡(luò)容量惡化問題。隨著網(wǎng)絡(luò)規(guī)模增加和頻譜資源稀缺問題日益凸顯,相關(guān)研究者開始考慮為網(wǎng)絡(luò)中的通信鏈路分配POC[2]。但是,如何有效抑制鄰信道干擾(Adjacent Channel Interference)的影響成為POC分配方案的技術(shù)難點(diǎn)。802.11無線網(wǎng)絡(luò)中的POC分配引起了學(xué)術(shù)界的廣泛關(guān)注[1]。
Mishraa等人率先提出使用POC增加802.11無線網(wǎng)絡(luò)容量[2-3],并聯(lián)合考慮相鄰鏈路間的物理距離和信道間隔來分配POC,通過增加信道空間復(fù)用,顯著提升了頻譜利用率。但是,現(xiàn)有關(guān)于POC分配方案大多基于集中式優(yōu)化方法,如圖著色方法[3],遺傳算法[4]等。其中,Ding等人在文獻(xiàn)[4]中提出利用加權(quán)干擾圖來建模POC干擾。加權(quán)圖中任意兩條鏈路的權(quán)重為相互無干擾傳輸時(shí)的最小信道間隔,并分別設(shè)計(jì)了基于貪婪算法和遺傳算法兩種POC分配方案來最小化全網(wǎng)受干擾鏈路數(shù)量。Duarte等人在文獻(xiàn)[5]中利用博弈論研究了802.11無線Mesh網(wǎng)絡(luò)中的POC分配問題,將其建模為合作信道分配博弈,并能夠獲得近似最優(yōu)解。合作博弈中需要大量的信息交互,為了減小優(yōu)化中的信息交互量,Xu等人在文獻(xiàn)[6]提出了一種面向802.11網(wǎng)絡(luò)POC的非合作干擾消除博弈,并證明其為精確勢能博弈,提出了一種無需信息交互同步對數(shù)學(xué)習(xí)方案,可漸近收斂到MAC層干擾博弈的最優(yōu)解。值得注意的是,上述工作均面向干擾對稱網(wǎng)絡(luò)場景,并多基于無向加權(quán)干擾圖(沖突圖)進(jìn)行信道資源分配優(yōu)化,忽視了實(shí)際網(wǎng)絡(luò)中由于各鏈路傳輸功率和接收機(jī)靈敏度等因素導(dǎo)致的干擾不對稱性問題[7-8]。
為了刻畫802.11非對稱無線網(wǎng)絡(luò)中不同鏈路間干擾模式的不對稱性和異構(gòu)性,文本將現(xiàn)有無向加權(quán)圖模型擴(kuò)展到有向加權(quán)圖干擾模型;基于構(gòu)建的有向加權(quán)圖,以優(yōu)化全網(wǎng)鏈路容量為目標(biāo),將網(wǎng)絡(luò)中POC分配問題建模為局部互利博弈模型;每條鏈路均為博弈中參與者,效用函數(shù)設(shè)計(jì)為自身鏈路容量和潛在被干擾鄰居鏈路的容量和;證明所提博弈模型為勢能博弈,存在至少一個(gè)純策略納什均衡點(diǎn),且滿足最優(yōu)純策略納什均衡為全網(wǎng)容量最優(yōu)化的解;最后,設(shè)計(jì)了一個(gè)基于鄰域合作的分布式多用戶學(xué)習(xí)方案實(shí)現(xiàn)最優(yōu)納什均衡點(diǎn)的搜索。仿真表明,所提分布式學(xué)習(xí)方案可以近似收斂到最優(yōu)解,相比于現(xiàn)有其他算法可以顯著提高全網(wǎng)容量。
IEEE 802.11b無線網(wǎng)絡(luò)中鏈路間干擾主要由鏈路間的物理距離和信道間隔決定。為了研究網(wǎng)絡(luò)中鏈路間信道選擇碰撞對網(wǎng)絡(luò)吞吐量的影響,文獻(xiàn)[2]定義了吞吐量歸一化因子:
其中,S1和S2分別表示網(wǎng)絡(luò)中鏈路1和鏈路2在單獨(dú)通信且無干擾時(shí)的吞吐量,S*1和S*2表示兩條鏈路同時(shí)傳輸?shù)耐掏铝?。研究結(jié)果表明,吞吐量歸一化因子η和物理距離呈現(xiàn)出二元門限效應(yīng)。當(dāng)物理距離小于某一閾值時(shí),η近似為0.5,表明兩條鏈路之間存在相互干擾;當(dāng)物理距離超過某一閾值時(shí),η增加到1,表明兩條鏈路之間不存在相互干擾。
令a1和a2分別表示兩條鏈路選擇信道的編號,則兩條鏈路的信道間隔表示為:
若兩條鏈路選擇的信道3和7,則δ=4。文獻(xiàn)[2]的研究表明,吞吐量的門限閾值和鏈路間的信道距離存在內(nèi)在關(guān)系。對于給定的傳輸速率,記有效傳輸距離為R。對于特定傳輸速率,不同信道間隔對應(yīng)干擾距離為R1(δ),如表1所示。以傳輸速率2 Mb/s為例,當(dāng)δ=0時(shí),即兩條鏈路選擇同一信道時(shí),干擾距離為傳輸距離2倍,即RI(0)=2R;當(dāng)δ=5時(shí),即兩條鏈路選擇正交信道時(shí),干擾距離為RI(5)=0,也就是說無論它們之間距離如何都不會產(chǎn)生互干擾;當(dāng)δ從0增加到5時(shí),相應(yīng)的干擾距離單調(diào)減小。對于其他的傳輸速率,如5.5 Mb/s和11 Mb/s,干擾距離呈現(xiàn)同樣的趨勢,具體值略有差異。
表1 不同信道間隔條件下的干擾距離
文獻(xiàn)[2]定義了加權(quán)干擾圖來建模網(wǎng)中鏈路間物理距離和信道間隔的關(guān)系。加權(quán)圖中的頂點(diǎn)指代對應(yīng)的通信鏈路,兩條鏈路間的權(quán)重l表明兩條鏈路相互無干擾通信時(shí)分配信道的最小信道間隔。如圖1中鏈路A和鏈路B間的權(quán)重為lAB=2,表明干擾距離RI(2)<dAB、RI(1)≥dAB,其中dAB為鏈路A和鏈路B的物理距離。
圖1 加權(quán)干擾模型
在多用戶場景中,記鏈路A和鏈路B的信道間隔為δAB,鏈路A和鏈路B間的MAC層干擾為αAB:
式(3)可以等價(jià)為:
目前,現(xiàn)有的基于POC的資源分配方案大多都是面向基于對稱干擾網(wǎng)絡(luò),即假設(shè)網(wǎng)絡(luò)中任意兩條鏈路A到鏈路B的無干擾最小信道間隔和鏈路B到鏈路A的無干擾最小信道間隔一致,即lAB=lBA。但實(shí)際網(wǎng)絡(luò)中,由于鏈路間通信節(jié)點(diǎn)發(fā)射功率、接收機(jī)靈敏度以及接收濾波器等性能存在差異,鏈路間的相互影響通常呈現(xiàn)不對稱性。因此,本文將傳統(tǒng)的加權(quán)干擾圖擴(kuò)展到非對稱加權(quán)干擾圖,研究非對稱Mesh網(wǎng)絡(luò)中部分重疊信道資源分配問題。圖2給出了有向加權(quán)干擾圖,記鏈路A不影響鏈路B傳輸?shù)淖钚⌒诺篱g隔lA→B。類似地,鏈路B不影響鏈路A傳輸?shù)淖钚⌒诺篱g隔lB→A。通常,lB→A≠lA→B。鏈路A對鏈路B產(chǎn)生的MAC層干擾為 αA→B:
鏈路k的鄰居鏈路分為以下兩種:
第一,潛在干擾鄰居鏈路。在有向加權(quán)圖中與鏈路(節(jié)點(diǎn))k存在邊,并且邊的方向由該鏈路(節(jié)點(diǎn))指向節(jié)點(diǎn)k的鏈路(節(jié)點(diǎn))。圖2中,鏈路A的潛在干擾鏈路為C、B。
第二,潛在被干擾鄰居鏈路。在有向加權(quán)圖中與鏈路(節(jié)點(diǎn))k存在邊,且邊的方向由節(jié)點(diǎn)k指向該節(jié)點(diǎn)。圖2中,鏈路A的潛在被干擾鏈路為B。
圖2 有向加權(quán)干擾模型
令鏈路k的潛在干擾鏈路集合和潛在被干擾鏈路集合分別為Ψk和Ψk-1,上述兩個(gè)集合允許為空集。圖1中,ΨA={B,C},={B,C}。
非對稱無線網(wǎng)絡(luò)中鏈路A的歸一化吞吐量與對稱無線網(wǎng)絡(luò)形式一致,但鏈路A的MAC層干擾為:
假設(shè)網(wǎng)絡(luò)中的鏈路集合為Γ={1,2,3,…,K},對于鏈路k∈{1,2,3,…,K},其受到的MAC層干擾由它本身的信道選擇和其他相鄰鏈路的信道選擇共同決定。令信道選擇集合為Ξ={1,2,3,…,M},假定鏈路k選擇的接入信道為ak∈{1,2,3,…,M},令sk表示與鏈路k產(chǎn)生接入干擾的鏈路數(shù)量:
類似地,網(wǎng)絡(luò)中鏈路k的歸一化吞吐量為:
優(yōu)化目標(biāo)是尋找最優(yōu)的信道選擇組合,使得網(wǎng)絡(luò)中總?cè)萘孔畲蠡?/p>
分布式無線網(wǎng)絡(luò)中,由于沒有中心控制器,所有鏈路自發(fā)地選擇接入信道。可將上述信道選擇問題建模為一個(gè)非合作博弈,每一條鏈路都是博弈的參與者(Player)。
該非合作博弈可以表示為:
其中Γ為鏈路(參與者)集合,Ak代表鏈路k的信道選擇策略空間。所有鏈路都可以選擇網(wǎng)絡(luò)中的信道,因此Ak=Ξ,表示鏈路k的效用函數(shù)為:
其中ak∈Ak代表當(dāng)前鏈路k的信道選擇,a-k代表其他鏈路的信道選擇組合。對于給定的加權(quán)干擾圖(如圖1所示),網(wǎng)絡(luò)的干擾呈現(xiàn)局部特性,即鏈路k只受到其在加權(quán)圖中鄰居鏈路的干擾。因此,本文中定義的博弈模型為加權(quán)的圖(如圖2所示)博弈。
由于傳統(tǒng)博弈模型中,參與者的“完全利己主義式”策略選擇可能會導(dǎo)致低效的均衡結(jié)果,即出現(xiàn)“公地悲劇”現(xiàn)象。受局部互利博弈[9]思想的啟發(fā),期望通過鄰域間的互利策略選擇來改善性能實(shí)現(xiàn)全局最優(yōu)。定義網(wǎng)絡(luò)中鏈路k的效用函數(shù)為:
定義的效用函數(shù)包含鏈路k的吞吐量和潛在被鏈路k干擾的鏈路的吞吐量之和。本文定義博弈模型與經(jīng)典局部合作博弈不同之處在于縮小了節(jié)點(diǎn)的合作域。具體而言,經(jīng)典局部合作博弈中任意節(jié)點(diǎn)k需要在其效用函數(shù)中考慮干擾圖(沖突)中與它存在邊的所有節(jié)點(diǎn)的效用;而本文定義的模型中只考慮了節(jié)點(diǎn)k的鄰居集合中被其影響的鄰居集合,縮小了合作域,為后續(xù)算法設(shè)計(jì)減小了鄰域交互開銷?;谏鲜鲂в煤瘮?shù),本文定義的博弈模型中每個(gè)參與者都將獨(dú)立決策,最大化自身效用為:
對于非合作博弈模型而言,純策略納什均衡是一類非常重要的均衡解概念,下面給出純策略納什均衡的定義。
定義1(純策略納什均衡,Pure Nash Equilibrium,PNE):非合作博弈 G={Γ,(Ak)k∈Γ,{Uk}k∈Γ},(Ak)k∈Γ=A1×A2×…×Ak中的任何一組策略 a*=(,,…,)∈(Ak)k∈Γ被稱為PNE,如果滿足式(16)的條件:
由PNE定義可知,PNE具有策略穩(wěn)定性。當(dāng)博弈處于PNE時(shí),任何一個(gè)參與者都不能通過單方面策略改變獲得效用提升。值得注意的是,對于任一非合作博弈而言,并非總是存在PNE。
定義2:精確勢能博弈(Exact Potential Game):如果存在勢能函數(shù)Φ: A1×A2×…×Ak→R,對于任意的博弈參與者k和他的任意兩個(gè)策略∈Ak,式(17)恒成立:
該類博弈被稱為精確勢能博弈。
由精確勢能博弈的定義可知,任意博弈參與者單方面策略改變帶來的效用函數(shù)值的變化與勢能函數(shù)值的變化一致。
精確勢能博弈具有如下兩個(gè)非常重要的特性[10]:
(1)精確勢能博弈至少存在一個(gè)PNE;
(2)勢能函數(shù)Φ的全局最優(yōu)解或者局部最優(yōu)解是PNE。
定理1:基于有向加權(quán)圖的POC信道選擇博弈G是一個(gè)精確勢能博弈,該博弈至少有一個(gè)純策略納什均衡點(diǎn)。
證明:構(gòu)造如下勢能函數(shù):
鏈路k單方面改變信道選擇策略,選擇信道由ak切換到,其他鏈路保持信道選擇策略不變。鏈路k效用函數(shù)變化可表示為:
相應(yīng)地,勢能函數(shù)的變化可表示為:
其中,Ψk∪表示有向圖中與鏈路k存在邊的鏈路集合,Ψk∪-表示圖中與鏈路k僅存單向邊,且方向由該鏈路指向鏈路k的鏈路集合,該集合中的鏈路不受鏈路k干擾。因此,有:
可進(jìn)一步簡化:
結(jié)合式(19)和式(22),可驗(yàn)證式(23)成立。
因此,所提的博弈模型為勢能博弈,存在至少一個(gè)純策略納什均衡點(diǎn),證畢。
定理1表明,本文定義的基于有向加權(quán)圖的POC信道選擇博弈G是一個(gè)精確勢能博弈,同時(shí)相應(yīng)的勢能函數(shù)為:
其物理意義為全網(wǎng)鏈路歸一化容量和。
根據(jù)精確勢能博弈性質(zhì)可知,勢能函數(shù)Φ(a1,a2,…,aK)的全局最優(yōu)或者局部最優(yōu)為PNE。
由于該博弈中可能存在多個(gè)納什均衡點(diǎn),下面簡要分析系統(tǒng)處于納什均衡的最差性能界。系統(tǒng)狀態(tài)處于納什均衡時(shí),根據(jù)均衡的定義,對于Mesh網(wǎng)中的任一鏈路k∈Γ都滿足不等式:
鏈路k的吞吐和承受的MAC層干擾水平的關(guān)系由式(10)給出。對于加權(quán)有向圖,sk≤|Ψk|,其中|·|表示集合元素個(gè)數(shù)。因此,對于任意網(wǎng)絡(luò)拓?fù)洌剑?6)、式(27)恒成立:
代入式(25)可得:
勢能函數(shù)Φ在均衡狀態(tài)下滿足:
目前,有很多學(xué)習(xí)算法可以用來進(jìn)行勢能博弈均衡點(diǎn)的搜索,如最佳響應(yīng)動態(tài)(Best Response Dynamic,BR)、空間自適應(yīng)行動(Spatial Adaptive Play,SAP)和虛擬行動(Fictitious Play)等。但是,這些算法并不都能確保收斂到最優(yōu)的PNE。本節(jié)中,基于SAP算法設(shè)計(jì)了一種基于有向加權(quán)圖的多鏈路并發(fā)學(xué)習(xí)機(jī)制(Multi-Link Concurrent Learning,MLCL)來收斂到最優(yōu)PNE。同時(shí),相比于SAP的每次迭代過程只允許單個(gè)用戶學(xué)習(xí),所提算法在每次迭代過程中同時(shí)選擇多個(gè)圖中不相鄰的鏈路進(jìn)行策略更新,可以明顯加快學(xué)習(xí)收斂速度。具體而言,MLCL在每次迭代中首先隨機(jī)選擇一條更新策略的鏈路,并將其狀態(tài)標(biāo)注為“更新”狀態(tài),然后將其鄰居鏈路狀態(tài)標(biāo)記為“不更新”狀態(tài),再將其鄰居鏈路的鄰居鏈路中未被標(biāo)記的鏈路標(biāo)記為“不更新”,在剩余未被標(biāo)記狀態(tài)的鏈路中重復(fù)上述操作,直到所有鏈路都被標(biāo)記狀態(tài)。在第m次迭代中,令ΛAk(m)表示鏈路k的動作選擇概率分布,其中qakk(m)∈ΛAk(m)表示第m次迭代時(shí)選擇動作ak的概率。選中更新的鏈路根據(jù)Boltzmann-Gibbs準(zhǔn)則進(jìn)行動作選擇概率的更新:
第2步:隨機(jī)選中一個(gè)更新鏈路,標(biāo)記狀態(tài)為“更新”,將其鄰居鏈路標(biāo)記為“不更新”;然后將其鄰居鏈路的鄰居鏈路中未被標(biāo)記的鏈路標(biāo)記為“不更新”,最后在剩余未被標(biāo)記狀態(tài)的鏈路中重復(fù)上述操作,直到所有鏈路都被標(biāo)記狀態(tài)。
第3步:標(biāo)記為更新狀態(tài)的鏈路按照動作概率分布ΛAk(m)隨機(jī)進(jìn)行動作選擇,然后按照式(30)中規(guī)則進(jìn)行動作選擇概率更新。
第4步:更新m=m+1,轉(zhuǎn)到第2步,直到m=mmax停止。
定理2:如果所提MLCL算法中學(xué)習(xí)參數(shù)β足夠大,MLCL能夠以近似1的概率最優(yōu)化網(wǎng)絡(luò)容量。
證明:文獻(xiàn)[9]中定理4證明,SAP算法在學(xué)習(xí)參數(shù)足夠大的條件下能夠以近似1的概率收斂到勢能函數(shù)的全局最優(yōu)點(diǎn)。在所提學(xué)習(xí)算法MLCL中,每次迭代選擇的鏈路都是有向加權(quán)圖中的非鄰居鏈路。因此,同時(shí)更新鏈路的動作策略更新并不會影響相互的效用。所以,MLCL并不改變SAP算法的收斂特性,可以滿足在學(xué)習(xí)參數(shù)β足夠大的條件下,以近似1的概率最大化勢能函數(shù)。在本文定義的博弈模型中,勢能函數(shù)Φ(a1,a2,…,aK)等于全網(wǎng)鏈路容量和,等價(jià)于以近似1的概率最優(yōu)化網(wǎng)絡(luò)容量。證畢。
其中,β表示學(xué)習(xí)速率,滿足β>0,物理含義表示學(xué)習(xí)過程中博弈參與者的理性水平。
算法1:基于鄰域合作學(xué)習(xí)的MLCL算法
第1步:設(shè)置最大迭代次數(shù)為mmax。在迭代次數(shù)m=0時(shí),初始化所有鏈路的信道選擇概率為等概率分布,
考慮基于IEEE 802.11b的無線接入網(wǎng),信道傳輸速率均為2 Mb/s,采用表1中參數(shù)。考慮干擾的非對稱性,網(wǎng)絡(luò)中存在兩種不同的傳輸鏈路,即傳輸距離分別為R=100 m和R=150 m。研究規(guī)則網(wǎng)狀網(wǎng)和隨機(jī)網(wǎng)絡(luò)兩種不同網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)條件下的算法性能,選取的對比算法包括窮搜算法、BR算法以及SAP算法。
網(wǎng)絡(luò)中干擾圖為標(biāo)準(zhǔn)網(wǎng)狀結(jié)構(gòu),如圖3所示,每行每列均分布L條鏈路,具有不同傳輸距離的兩種鏈路交替分布,相鄰鏈路間距離為d=100 m,網(wǎng)絡(luò)中共L2條鏈路。圖4給出了L=4時(shí)各種算法的性能圖,圖中的最優(yōu)解曲線(標(biāo)識為Optimal solution)是通過窮搜法得到的。同時(shí),它分別考慮了兩種不同信道使用場景:一是重疊信道場景,即11個(gè)信道均可使用;二是完全正交信道場景,即僅使用完全正交的信道,即集合中標(biāo)號1、6、11信道。圖4所提出的MLCL算法在小規(guī)模網(wǎng)絡(luò)條件下可以快速收斂到最優(yōu)解。由于一次迭代過程允許多個(gè)鏈路同時(shí)更新動作,相比于SAP算法收斂速度更快。傳統(tǒng)BR算法的收斂速度較快,容易陷入局部最優(yōu),相比于MLCL和SAP的算法性能較低。此外,使用非重疊信道的方案可以明顯獲得比重疊信道更高的網(wǎng)絡(luò)吞吐。在當(dāng)前非對稱干擾網(wǎng)絡(luò)仿真中,使用非重疊信道的MLCL可以比使用重疊信道的BR和SAP方案全網(wǎng)性能提升114%。
圖3 規(guī)則網(wǎng)狀網(wǎng)
圖5 給出了提出的MLCL中部分鏈路信道更新策略圖??梢?,鏈路1、2、4和5迅速收斂到穩(wěn)定狀態(tài),鏈路3的策略選擇存在震蕩,原因在于這幾個(gè)震蕩狀態(tài)對應(yīng)的效用值一樣,其中任意一個(gè)信道都是最優(yōu)策略,MLCL以近概率1收斂到其中一個(gè)最優(yōu)的PNE。圖6研究了正則網(wǎng)絡(luò)條件下,鏈路間距離對于網(wǎng)絡(luò)性能的影響,分別設(shè)置鏈路距離d=100 m、70 m、50 m。隨著鏈路距離的減小,網(wǎng)絡(luò)中局部干擾加劇,MLCL收斂時(shí)對應(yīng)的網(wǎng)絡(luò)歸一化吞吐量明顯下降。d=50 m時(shí),全網(wǎng)歸一化吞吐相比d=100 m時(shí)對應(yīng)值下降了約73%。
參考文獻(xiàn)[6],定義歸一化容量增益(Normalized Capacity Gain)為:
其中TPOC表示使用POC的全網(wǎng)歸一化吞吐,TNOC表示使用正交信道的全網(wǎng)歸一化吞吐。圖7研究了干擾非對程正則網(wǎng)絡(luò)條件下,固定相鄰鏈路間距離為d=100 m,調(diào)整網(wǎng)絡(luò)中的鏈路數(shù)量,使用POC獲得的性能增益。由圖7可見,非對稱干擾條件下使用POC可以明顯改善全網(wǎng)性能。
圖4 學(xué)習(xí)算法收斂(L=4,d=100 m)
圖5 部分鏈路的信道選擇策略學(xué)習(xí)更新
下面研究非對稱干擾圖為隨機(jī)干擾網(wǎng)絡(luò)下的算法性能對比。設(shè)置邊長為(L-1)×d的正方形區(qū)域內(nèi)隨機(jī)布設(shè)K=L2條鏈路,其中前述兩種類型的鏈路數(shù)量均為K/2,固定d=100 m。圖8中給出了隨機(jī)生成500次非對稱干擾網(wǎng)絡(luò),給出了平均歸一化容量隨學(xué)習(xí)算法迭代次數(shù)的變化曲線。可見,在給定的網(wǎng)絡(luò)場景下,SAP算法和所提出的MLCL算法性能優(yōu)于BR算法;BR算法的收斂速率是三種算法中最快的,而MLCL算法的收斂速率優(yōu)于SAP算法,原因在于一次迭代中允許多個(gè)用戶同時(shí)更新策略,加快了算法的收斂速度。
圖6 不同鏈路間距下MCLC學(xué)習(xí)收斂曲線(L=4)
圖7 規(guī)則網(wǎng)狀網(wǎng)使用非正交信道增益(d=100 m)
圖8 隨機(jī)網(wǎng)絡(luò)下學(xué)習(xí)算法收斂圖(K=16)
面向802.11b非對稱無線網(wǎng)絡(luò),提出了一種基于博弈學(xué)習(xí)POC分配方案優(yōu)化全網(wǎng)容量?;谟邢蚣訖?quán)干擾圖,將面向無線網(wǎng)絡(luò)容量最優(yōu)化的POC分配方案建模為局部互利博弈模型,網(wǎng)絡(luò)中的每條鏈路是博弈的參與者,且效用函數(shù)設(shè)計(jì)為自身鏈路容量和潛在被干擾鄰居鏈路的容量和。證明所提博弈模型為勢能博弈,存在至少一個(gè)純策略納什均衡點(diǎn),同時(shí)最優(yōu)純策略納什均衡為全網(wǎng)容量最優(yōu)化的解。同時(shí),設(shè)計(jì)了一個(gè)基于鄰域合作的分布式學(xué)習(xí)方案,實(shí)現(xiàn)了最優(yōu)納什均衡點(diǎn)的搜索實(shí)現(xiàn)全網(wǎng)容量最優(yōu)化。仿真表明,所提分布式學(xué)習(xí)方案可以近似收斂到最優(yōu)解,相比于現(xiàn)有其他算法可以顯著優(yōu)化全網(wǎng)容量。