• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      采用DDPG的聯(lián)合波束成形和功率控制算法

      2022-08-09 07:16:14李中捷熊吉源李江虹
      西安電子科技大學學報 2022年4期
      關鍵詞:發(fā)射功率波束成形

      李中捷,高 偉,熊吉源,李江虹

      (1.中南民族大學 電子信息工程學院,湖北 武漢 430074;2.中南民族大學 智能無線通信湖北重點實驗室,湖北 武漢 430074)

      大數(shù)據(jù)、物聯(lián)網(wǎng)和人工智能的發(fā)展,對移動通信的傳輸速率、信道容量等要求日漸提升。未來十年之內(nèi),移動數(shù)據(jù)需求量預計會增加上千倍。為滿足需求,主流的電信公司以及全球標準化組織都在積極推動第五代無線通信(5th-Generation,5G)的研發(fā)。毫米波通信比傳統(tǒng)的微波通信具有更高的頻段,但毫米波通信具有路徑損耗高的問題。目前,采用大規(guī)模天線陣列以構建多輸入多輸出(Multiple-Input Multiple-Output,MIMO)通信系統(tǒng),并結合波束成形技術來增強接收端的信噪比,可有效彌補毫米波通信路徑損耗高的問題。因此,毫米波和大規(guī)模多輸入多輸出技術結合被認為是5G通信的前景技術之一。大量未利用的毫米波頻譜資源以及與波束成形技術的結合,可顯著提高通信系統(tǒng)的性能。

      毫米波通信采用波束成形技術來彌補路徑損耗而造成的鏈路預算差距[1-4]。文獻[1]研究了在固定波束模式下的功率控制問題,致力于在保證最小用戶速率的情況下最大化總速率。文獻[2]通過固定發(fā)射功率的隨機波束成形來分析毫米波通信的性能。文獻[3]采用大數(shù)據(jù)分析技術,在高速移動的通信環(huán)境下借助用戶的位置信息,提出了兩種波束成形設計方案來獲得較高的頻譜效率,表明最佳傳輸策略的設計與用戶位置之間的映射關系十分重要。

      目前已有一些工作專注于功率控制以提高通信中的頻譜效率[5-8],例如分式規(guī)劃算法[5]和加權最小均方誤差算法[6]。上述算法均根據(jù)完整信道狀態(tài)信息構建精確的數(shù)學模型,并通過迭代的方式進行計算。因此兩種算法會造成大量的計算消耗,且現(xiàn)實中完整的信道狀態(tài)信息并不易于獲取。為解決上述問題,文獻[7]提出了基于深度Q網(wǎng)絡(Deep Q Network,DQN)的功率控制算法,將深度Q網(wǎng)絡應用于發(fā)射功率控制問題,提出了基于深度Q網(wǎng)絡的動態(tài)功率控制方案。深度Q網(wǎng)絡只適用于離散的動作空間,發(fā)射功率必須進行量化。將發(fā)射功率進行量化成若干個等級,然后使用深度Q網(wǎng)絡進行等級選取。因此量化器的設計和功率級別數(shù)量的設定都會對性能產(chǎn)生影響。

      上述研究僅考慮了通信中的波束成形設計或功率控制問題,從而導致傳輸速率的損失。為進一步提高數(shù)據(jù)傳輸速率,已有大量工作針對聯(lián)合功率控制和波束成形問題進行研究[9-11]。文獻[9]研究了在毫米波多用戶場景下聯(lián)合功率控制和波束成形問題,對具有恒模約束的波束成形矩陣進行設計。文獻[11]研究了在高速移動時通信的聯(lián)合混合波束形成和功率控制設計問題。然而上述文獻對波束成形矩陣進行設計時均需要完整的信道狀態(tài)信息。

      針對上述問題,筆者提出了基于強化學習的聯(lián)合波束成形和功率控制算法,在無需完整信道狀態(tài)信息的情況下,對聯(lián)合波束成形和功率控制問題進行求解。聯(lián)合波束成形和功率控制問題是非凸的,因此將原始問題分為波束成形設計和功率控制兩個子問題,并提出了基于強化學習的雙模型系統(tǒng)進行求解。模型采用集中式訓練分布式執(zhí)行結構。首先設計信息交互協(xié)議助于基站了解環(huán)境信息,每個基站與環(huán)境交互后將經(jīng)驗上傳至云端進行訓練。云端采用深度Q網(wǎng)絡對波束成形矩陣進行設計。深度Q網(wǎng)絡只適用于離散的動作空間,而發(fā)射功率為連續(xù)變量,故采用深度確定性策略梯度(Deep Deterministic Policy Gradient,DDPG)[12]算法來代替深度Q網(wǎng)絡對功率控制問題進行求解,最后云端將訓練完成的網(wǎng)絡權重廣播給每一個基站。

      1 系統(tǒng)模型

      如圖1所示,筆者采用K個單元組成的蜂窩網(wǎng)絡,其中每個小區(qū)中均含有一個多天線發(fā)射基站(Base Stalion,BS)和M個單天線接收用戶(User Equipnent,UE)。所有基站配備N(N≥1)根天線的均勻線性線陣。t時刻小區(qū)k中UEm接收的信號可表示為

      (1)

      (2)

      (3)

      基于毫米波頻率的稀疏散射特性,采用幾何信道模型來捕獲毫米波信道的特性。t時刻,BSk和UEm之間的信道向量可表示為

      (4)

      A(N,θk,k,m,Δ)=[a1(N,φ1),a2(N,φ2),…,aL(N,φL)]∈CN×L,

      (5)

      其中,θk,k,m為BSk和UEm的下行信道的發(fā)射角(Direction of Departure,DoD);Δ指代一個小的角度范圍,稱為角擴展[14];al(N,φl)∈CN×1,?l∈{1,2,…,L},表示第l條路徑的陣列響應向量,可表示為

      (6)

      (7)

      (8)

      2 問題提出

      筆者的目的是聯(lián)合優(yōu)化基站處的波束成形矢量和發(fā)射功率以最大化頻譜效率,將聯(lián)合波束成形和功率控制的優(yōu)化問題表述為

      (9)

      其中,C1表示每個基站的發(fā)射功率在0和Pmax之間;C2表示每個基站的波束成形向量將在碼本F中選出;C3表示最小速率約束,即要求每個通信鏈路的SINR將不能低于最低標準γmin。前兩個約束的非凸性使得該問題是一個非凸優(yōu)化問題,因此直接對式(9)進行求解十分困難。將求解式(9)分為兩個子問題,首先對波束成形矩陣F(t)進行設計,然后對功率控制問題進行求解。

      3 基于深度強化學習的聯(lián)合功率控制和波束成形算法

      3.1 信息交換議定

      深度強化學習中基站通過與環(huán)境交互采取行動并獲得獎勵[16],故設計信息交換議定使基站有效獲取環(huán)境信息。

      如圖2所示,BSk與UEk進行通信時,周邊的BS分為兩個集合:干擾者和受干擾者。干擾者定義為:BSi的通信使BSk在通信時受到干擾,當BSk收到干擾信號的SINR大于一定閾值,基站i被定義為干擾者,可表示為

      (10)

      與此相似,當BSk通信時也會對周邊BSo的通信產(chǎn)生干擾。故受干擾者定義為:BSk在通信時對BSo的通信產(chǎn)生干擾,且BSo收到干擾信號SINR大于一定閾值,BSo被定義為受干擾者,可表示為

      (11)

      3.2 聯(lián)合功率和波束算法

      筆者提出的模型如圖3所示,采用集中式訓練分布式執(zhí)行的結構。模型分為頂層和底層兩部分。頂層設定波束向量,底層設定發(fā)射功率。接下來介紹方案的3個主要部分。

      (1) 動作空間。動作集分為波束選擇和功率選擇兩個動作空間。波束向量通過選取碼本中最佳的波束向量索引進行設計,故頂層動作集由波束向量索引構成。采用文獻[17]所提出的方案進行碼本設計,表示為C=[c0,c1,…,cQcode-1]∈CN×Qcode。碼本C的列表示波束方向,第n行q列的元素C[n,q]表示波束在方向第n根天線在方向q上的相位,可表示為

      (12)

      (13)

      其中,第1項表示BSk在t時刻的頻譜效率;第2項表示懲罰項,即對周邊通信鏈路的干擾。換句話說,獎勵函數(shù)可以被認為是動作對式(9)中目標函數(shù)影響的凈增益。BSk的懲罰定義為受BSk干擾的受干擾者o的頻譜效率損耗之和,即

      (14)

      每個基站視為一個代理,并視其周邊基站為環(huán)境的一部分,使每個代理視為獨立的個體。避免環(huán)境變化造成的影響,將所有代理的經(jīng)驗收集發(fā)送至云端并訓練網(wǎng)絡,然后將網(wǎng)絡權重廣播給所有代理。流程分為執(zhí)行和訓練兩個步驟:

      (15)

      (16)

      (17)

      (18)

      其中,θ表示網(wǎng)絡權重。每隔Tu次訓練將Critic和Actor網(wǎng)絡權重覆蓋目標Critic和目標Actor網(wǎng)絡的網(wǎng)絡權重:

      (19)

      (20)

      算法偽代碼如算法1所示。

      算法1基于強化學習的聯(lián)合波束成形和功率控制算法。

      ① 初始化模型參數(shù)。

      ② 基站k與環(huán)境交互獲取經(jīng)驗eBeam和ePower,并上傳至云端。

      ③ 開始迭代:

      ⑥ 采用式(15)對評估網(wǎng)絡權重進行更新;

      ⑦ DDPG:

      ⑨ 采用式(17)、式(18)分別更新Critic和Actor網(wǎng)絡權重;

      4 仿真分析

      4.1 參數(shù)設置

      通過計算機仿真分析了算法的平均頻譜效率,即總頻譜效率除以通信鏈路的數(shù)目。文中采用了5個六角形的均勻蜂窩網(wǎng)絡,每個蜂窩中心處放置基站,用戶隨機分布在網(wǎng)絡內(nèi)部。如圖4所示,圓點表示UE,三角表示基站。系統(tǒng)詳細參數(shù)如表1所示。此外,設定以基站為中心,半徑r=10 m的小區(qū)域不放置用戶。將路徑損耗設為128.1+37.6 lgd,式中d表示發(fā)送端到接收端的直接距離。與文獻[18]相似,計算頻譜效率(3)時將其上限設為30 dB。

      DDPG和DQN中采用的參數(shù)如表1和表2所示。

      使用相對較小的網(wǎng)絡進行訓練,防止模型復雜化后導致計算時間較長。文獻[19]表明,單層隱藏層的神經(jīng)網(wǎng)絡足以表征任何函數(shù),然而該層的神經(jīng)元必須足夠大。巨大的單層網(wǎng)絡無法更新權重至最優(yōu),采用3層隱藏層的神經(jīng)網(wǎng)絡訓練效果更好。故算法中所有的神經(jīng)網(wǎng)絡均采用4層網(wǎng)絡:輸入層、輸出層和兩層隱藏層。輸入層的神經(jīng)元個數(shù)與代理的狀態(tài)集中元素個數(shù)相等。采用ε貪心算法,探索值ε初始化為ε(0)=0.2,并隨著迭代次數(shù)逐漸減小,ε(t+1)=max{εmin,(1-λε)ε(t)},λε=10-4。

      表1 系統(tǒng)參數(shù)

      表2 模型參數(shù)

      4.2 性能分析

      在多用戶mmWave通信場景下,與以下3種算法進行性能對比與分析。

      基線1算法:基線算法文獻[12]提出的基于深度Q網(wǎng)絡的聯(lián)合波束成形和功率控制算法。

      基線2算法:BS的發(fā)射功率均設為最大時文獻[4]提出的基于SVD分解波束成形算法。

      基線3算法:基站的發(fā)射功率隨時選取,基于SVD的波束成形算法BS的發(fā)射功率均設為最大時文獻[4]提出的。

      圖5為毫米波通信環(huán)境中每個小區(qū)內(nèi)用戶數(shù)量為1時各算法的頻譜效率性能。從圖中可以看出,大約在訓練3 500次后,筆者所提的基于深度學習的聯(lián)合波束成形和功率控制算法收斂且取得最優(yōu)的頻譜效率。深度Q網(wǎng)絡輸出功率為量化的離散值使精度受到限制,故性能低于筆者所提算法?;镜陌l(fā)射功率設為最大時,對周邊的通信鏈路干擾增強,故頻譜效率性能較差。從仿真結果可以看出,提出的基于強化學習的聯(lián)合波束成形和功率控制算法的頻譜效率隨著訓練過程逐漸提高,即隨著訓練深度Q網(wǎng)絡權重的不斷更新,決策策略得到了優(yōu)化。

      圖6為毫米波通信環(huán)境中不同用戶數(shù)量時的頻譜效率。從圖中可知,當蜂窩網(wǎng)絡中的通信鏈路數(shù)量增加時,筆者所提算法仍能夠在大約3 500次迭代后收斂。結合圖5可知,隨著小區(qū)內(nèi)通信鏈路的增加,小區(qū)間干擾程度提升,故算法的頻譜效率降低,但筆者所提算法的頻譜效率仍然為最優(yōu)。

      圖7展示小區(qū)內(nèi)用戶數(shù)為3時不同天線數(shù)量下所提算法的頻譜效率。由圖7可知,天線數(shù)量為N=8時算法在大約5 000次迭代后收斂,N=64時算法在大約7 500次迭代后收斂。這是由于隨著天線數(shù)量增加使計算復雜度增高,從而導致收斂速度的變慢。但隨著天線數(shù)量的增加,算法的頻譜效率隨著天線數(shù)量的增大而提升。這是由于在天線數(shù)量較少時,波束主瓣較寬,不能精確地對準接收端,使得傳輸路徑上的增益較小。當天線數(shù)量增大時,波束主瓣較窄,可以有效地指向信號路徑。

      5 結束語

      筆者提出了一種基于強化學習的聯(lián)合波束成形和功率控制算法,旨在無需CSI情況下最大化通信鏈路的頻譜效率。問題為非凸,故將問題分為波束成形和功率控制兩個子問題。首先提出信息交互協(xié)議助于基站進行信息交互了解環(huán)境信息,并設計基于深度強化學習的雙模型系統(tǒng)求解聯(lián)合優(yōu)化問題。然后采用深度Q網(wǎng)絡設計波束成形矩陣,并用DDPG根據(jù)波束成形矩陣對功率控制問題進行求解。仿真結果表明,在多用戶通信環(huán)境,該算法的頻譜效率優(yōu)于傳統(tǒng)波束成形算法和基于深度Q學習的聯(lián)合波束成形和功率控制算法。

      猜你喜歡
      發(fā)射功率波束成形
      無線電波發(fā)射功率防爆要求與檢測方法
      工礦自動化(2024年6期)2024-08-22 00:00:00
      MFC2019首屆汽車冷彎(滾壓與拉彎)成形技術論壇成功舉辦
      模具制造(2019年4期)2019-12-29 05:18:58
      CR1 500HF熱成形鋼開發(fā)及應用
      山東冶金(2019年5期)2019-11-16 09:09:08
      毫米波大規(guī)模陣列天線波束掃描研究*
      通信技術(2019年3期)2019-05-31 03:19:08
      法蘭軸零件的冷擠鐓成形工藝及模具設計
      圓陣多波束測角探究
      電子測試(2018年6期)2018-05-09 07:31:54
      放大轉發(fā)中繼器降低發(fā)射功率的選擇策略研究
      淺談AC在WLAN系統(tǒng)中的應用
      Helix陣匹配場三維波束形成
      人生若只如初見
      滇池(2017年5期)2017-05-19 03:23:19
      武陟县| 伊春市| 罗定市| 垣曲县| 榆林市| 福安市| 佛山市| 西丰县| 西和县| 观塘区| 沈阳市| 蒙自县| 天等县| 进贤县| 嘉禾县| 彰化县| 衡东县| 乐业县| 吴旗县| 新丰县| 满城县| 图木舒克市| 玉田县| 沛县| 通江县| 清河县| 诸暨市| 剑川县| 株洲县| 德兴市| 罗田县| 京山县| 当阳市| 眉山市| 临漳县| 晋州市| 什邡市| 页游| 卢湾区| 江孜县| 霍城县|