何丹萍 徐卓成 曹惠云 殷玥 吳麗娜 官科
(1. 北京交通大學 軌道交通控制與安全國家重點實驗室,北京 100044;2. 北京高速鐵路寬帶移動通信工程研究中心,北京
100044;3. 北京交通大學電子信息工程學院,北京 100044)
無線信道特性研究對于通信網絡系統性能的優(yōu)化具有重要意義. 傳統的信道建模方法分為統計性信道建模、確定性信道建模和半確定性信道建模三類. 目前確定性信道建模方法中的射線跟蹤(raytracing,RT)法運用最為廣泛,但其缺陷在于高度依賴場景的詳細模型和材質參數,并且計算復雜度高.因此尚待解決的問題是:缺少三維電子地圖或場景規(guī)模大、環(huán)境復雜時,如何兼顧路徑損耗預測的準確性和高效性. 尤其自5G 通信系統提出以來,信道數據海量、多樣,上述問題更加亟待解決.
機器學習[1]具有學習能力,可在復雜環(huán)境中自動學習數據間的非線性結構關系. 隨著人工智能技術的迅速發(fā)展,相繼有學者將機器學習應用于無線信道建模,并取得了一些成果:文獻[2]將收發(fā)天線距離和繞射損耗作為輸入,構建了多層前饋感知器(multilayer perceptron,MLP)模型預測接收信號強度;文獻[3]利用神經網絡改善了對城市環(huán)境中超高頻(ultra high frequency,UHF)頻段(300~3 000 MHz)室外信號強度的預測;文獻[4]通過神經網絡研究了在甚高頻(very high frequency,VHF)頻段(30~300 MHz)下,路徑損耗與傳播距離之間的關系;文獻[5]在線性對數距離路徑損耗模型的基礎上,將頻率、發(fā)射天線高度、接收天線高度等可測量特征進行主成分分析(principle component analysis,PCA),從而構建了基于人工神經網絡(artificial neural network,ANN)的路損模型. 另外一些研究在信道基本特征參數的基礎上,綜合了地理因素:文獻[6]構建雙層徑向基函數神經網絡(radial basis function neural network,RBFNN),并將地形地貌數據、收發(fā)天線的高度、距離與載頻作為網絡輸入預測路徑損耗;文獻[7]將道路寬度和建筑物之間的距離等參數作為ANN 的輸入預測路損,結果優(yōu)于COST-231-WI 模型;文獻[8]構建了前饋神經網絡(feed-forward neural network,FFNN),利用歸一化地形剖面數據和距離預測路徑損耗;文獻[9]研究了無線通信信道中最優(yōu)路徑損耗預測所需的輸入特征,包括緯度、經度、海拔和距離;文獻[10]提出了一種基于卷積神經網絡(convolutional neural network,CNN) 的毫米波路徑損耗模型,將三維地圖根據建筑物、發(fā)射機和地平面的高度轉化成二維紅、綠、藍(red, green and blue,RGB)圖,并以此作為輸入,利用三維RT 法來生成毫米波信道的路徑損耗指數. 然而,當前國內外有關機器學習與無線通信信道建模相結合的研究中,對于傳播場景環(huán)境特征的表征方法大多基于復雜精細的測量數據與大規(guī)模計算[11-13],如何在保證準確率的前提下,簡化模型、提高效率和實用性,是亟需研究并解決的.
本文基于衛(wèi)星圖像的RGB 信息提出了表征無線通信電波傳播場景的新方法,結合距離特征構建反向傳播神經網絡(back propagation neural network,BPNN). 衛(wèi)星圖像相對易于獲取,能在缺少三維場景數據的情況下對無線通信電波的傳播路徑損耗做出較精確、高效的預測,從而為無線通信網絡系統的優(yōu)化給出參考建議. 此外,使用本文建模方法和傳統信道建模方法仿真同一區(qū)域的路徑損耗,并對兩種方法的準確率和復雜度進行了對比.
本文選取典型的城區(qū)作為測量區(qū)域,測量場景中包含3 個基站:BS1 高 度62 m,BS2 高 度30 m,BS3 高度42 m,發(fā)射功率均為42 W. 分別在3 個基站附近一定范圍的區(qū)域內進行測量,接收機部署于高度為2 m 的車輛上,測量頻段為2.565 GHz. 根據測量數據中路測點經緯度的最大值和最小值確定測量區(qū)域的經緯度范圍,下載對應范圍的谷歌衛(wèi)星圖像.
為了能從衛(wèi)星圖像上獲取電波傳播場景的環(huán)境特征,需要確定路測點在圖像上的位置. 衛(wèi)星圖像的空間分辨率為0.54 m,受其限制,圖像的經緯度范圍和實際測量區(qū)域的經緯度范圍不完美匹配,因此本文通過選取參考點并計算采樣間隔的方式來確定路測點在衛(wèi)星圖像上的像素坐標. 具體方法是:在衛(wèi)星圖像上根據道路特征和電子地圖上的測量軌跡確定參考點,參考點的經緯度坐標已知并且在衛(wèi)星圖像上的像素坐標可通過測量得到. 由路測點與參考點的經緯度坐標差、采樣間隔和參考點的像素,即可在衛(wèi)星圖像中定位路測點.
一般測量軌跡的邊界點容易從衛(wèi)星圖像上區(qū)分,故選擇邊界點作為參考點并計算采樣間隔. 設左、右、上、下四個邊界點經緯度坐標分別為(Clon1,Clat1)、 (Clon2,Clat2)、 (Clon3,Clat3)、 (Clon4,Clat4),在衛(wèi)星圖像中的 像 素 坐 標 為 (X1,Y1)、 (X2,Y2)、 (X3,Y3)、 (X4,Y4). 由 于在衛(wèi)星圖像上橫向和縱向的采樣間隔存在一定差異,所以需要利用邊界點的經緯度坐標和像素坐標分別計算. 定義橫向采樣間隔為dlon和縱向采樣間隔為dlat,表示衛(wèi)星圖像中每個像素值在經度方向(橫向)對應實際場景中的dlon,在緯度方向(縱向)對應實際場景中的dlat. 則
經過測算,BS1 衛(wèi)星圖像的橫向采樣間隔dlon=2.67×106, 縱向采樣間隔dlat=2.31×106. 像素坐標以圖像左上角為原點,向右為X軸正方向,向下為Y軸正方向,所以選擇左邊界點和上邊界點作為參考點. 結合上述獲取的空間采樣間隔、參考點像素位置以及路測點的經緯度坐標 (Clon,Clat),可確定路測點在衛(wèi)星圖像上的像素坐標 (X,Y):
圖1 所示為所繪制的路測軌跡,為了清晰顯示,將衛(wèi)星圖像上以路測點為中心的正方形區(qū)域內的全部像素點標紅.
圖1 衛(wèi)星圖像上3 個基站的測量軌跡Fig. 1 Measurement track of 3 base stations on the satellite map
本文定義兩種傳播場景的表征方法.
第一種是基于RGB 數值的傳播場景表征方法.將從基站到路測點Rx的傳播路徑n等分,以全部等分點和路測點Rx共n個特征點為中心,分別選取一個適當大小的正方形區(qū)域. 由實驗結果確定,正方形區(qū)域的邊長取為7 m 左右時表征效果最好. 依次求出其中所有像素的R,G,B平均數值來表示這個特征點的環(huán)境特征,表示為 fRi,Gi,Big(i=1,2,···,n). 用特征點的環(huán)境特征近似表示整條傳播路徑的環(huán)境特征,得到該方法對傳播場景的表征結果:
fR1,G1,B1,R2,G2,B2,···,Rn,Gn,Bng.
第二種是基于RGB 聚類算法的傳播場景表征方法. 為了便于更全面有效地描述電波傳播環(huán)境,需要從衛(wèi)星圖像中識別出各種地物類型. 本文采用無監(jiān)督學習中的K-means 聚類方法,將像素的RGB 數值映射為地物類型,用直射徑上各種地物類型的比例來表征傳播場景的地物分布.
統計每個基站關聯區(qū)域包含的地物,主要包括植被、道路、河流和建筑物,建筑物按顏色深淺分為兩類. 此外受日光照射的影響,衛(wèi)星圖像中建筑物等地物會留下陰影,陰影覆蓋了該位置原本的地物顏色,所以將陰影劃為一類. 綜上,聚類的個數共有6 種. 在3 個基站關聯區(qū)域的衛(wèi)星圖像中,BS3 的圖像亮度統一,所以以此為樣本,每個像素的R,G,B三維數值作為一組輸入. 表1 所示為聚類算法求出的6 個RGB 聚類中心及對應的顏色.
根據聚類中心可實現衛(wèi)星圖像像素級分類,并將分類后的每個像素繪制為所屬類別對應的地物顏色,再將該聚類方法應用到其他兩個基站的圖像上.處理后的衛(wèi)星圖像如圖2 所示,圖中為增加區(qū)分度,繪制各種地物類型時所用的顏色相對表1 中聚類中心的顏色做了調整.
圖2 K-means 聚類后的3 個基站關聯區(qū)域衛(wèi)星圖像Fig. 2 Satellite image of the region associated with 3 base stations after K-means clustering
表1 聚類算法結果Tab. 1 Results of clustering
圖3 環(huán)境特征示意圖Fig. 3 Environmental features schematic
BPNN 的結構簡單、狀態(tài)穩(wěn)定且易于實現,是最為經典、應用最為廣泛的神經網絡模型之一. 其基本思想是通過計算輸出值與期望值間的誤差來調整網絡參數以減小誤差,具有很強的非線性映射能力和柔性的網絡結構. 它依靠自身強大的學習能力和計算能力,可以從有限的數據中挖掘到信道的隱含特征,進而實現對信道所處場景的識別. 此外CNN 在處理圖像數據領域有著廣泛的應用,對于多通道數據也能夠實現有效的特征提取,但由于直接下載的衛(wèi)星圖像不攜帶分類標簽,且與現有開源數據集采集設備有較大區(qū)別,難以直接利用現有CNN 算法進行語義分割和特征提取. 因此,本文選擇BPNN 建立路徑損耗預測模型.
BPNN 作為數據驅動型的數學模型,網絡數據集的構建將直接影響模型的預測結果. 本節(jié)結合處理后的測量數據和根據第1 節(jié)兩種方法在衛(wèi)星圖像中提取的環(huán)境特征信息定義網絡數據集,如表2 所示.
表2 網絡數據集Tab. 2 Data sets for the network
將構建的網絡數據集劃分為訓練集和驗證集輸入BPNN. 訓練集的作用是訓練網絡,通過BP 算法對神經網絡各節(jié)點的權重與偏置進行多次更新迭代,使預測誤差減小以提高神經網絡的預測精度;而驗證集的作用是檢驗訓練完成后神經網絡的預測能力和泛化性是否達到要求,即神經網絡能否精確預測訓練集之外路測點的傳播路徑損耗.
本節(jié)首先給出模型預測結果的評價指標,據此選取BPNN 的超參數和結構,從而建立預測模型.
2.2.1 模型預測結果的評價指標
本文以絕對平均誤差(absolute mean error,AME)、標準差(standard deviation,STD)和預測值與測量值之間的相關系數(correlation coefficient,CC)評價神經網絡模型的預測性能. 三者的表達式如下所示:
2.2.2 不同網絡架構的模型預測性能對比
BPNN 架構中的超參數主要包括激活函數、隱藏層層數、隱藏層神經元數目、學習率、損失函數、訓練樣本量以及訓練次數等,超參數的選擇直接影響神經網絡的性能與預測的效果.
關于如何選取隱藏層層數和隱藏層神經元數目,目前還沒有明確的理論與方法. 理論上隱藏層層數越深,擬合能力越強,但同時可能會帶來過擬合的問題,增加訓練難度,使模型難以收斂. 經過實驗,本文設定隱藏層層數為兩層.
對于隱藏層神經元,數目少將導致欠擬合,網絡的學習能力和信息處理能力弱;而數目多則會降低網絡的收斂速度,且容易導致過擬合,降低網絡的泛化能力. 一般地,確定BPNN 隱藏層神經元數目有如下兩個經驗公式:取2~10. 本節(jié)選取第二個經驗公式計算隱藏層神經元的數目. 在本文的測量場景中,3 個基站的樣本量分別等于16 646,16 142,5 963,總量為38 751,將其按照70%∶30%隨機劃分為訓練集和驗證集,則訓練集樣本量Ns=27 125,結合兩種傳播場景表征方法的輸入數據集維數,最終確定以直射徑上等分點的RGB 平均值表示傳播路徑環(huán)境特征的神經網絡隱藏層的神經元數目Nh2[3,15],以直射徑上聚類的比例表示傳播路徑環(huán)境特征的神經網絡隱藏層的神經元數目Nh2[7,35]. 通過大量實驗,發(fā)現當采用適應性矩估計(adaptive moment estimation,Adam)參數優(yōu)化算法、設置學習率為0.1、批處理樣本量為780 時,BPNN 的預測效果最好.
圖4 BPNN 結構示意圖Fig. 4 BPNN structure
根據實驗結果,最終確定兩種環(huán)境特征表征方法有效性最高的網絡架構:含雙隱層的四層BPNN 架構{25,13,13,1}和{10,35,35,1},分別限定訓練次數為2 500 和1 700 以減少訓練時間. 訓練完成的BPNN 對驗證集的預測結果如表3 和圖5 所示.
圖5 不同網絡架構下驗證集的實測數據與預測結果Fig. 5 Measurement and predicition results under different network structures
表3 不同網絡架構下模型對驗證集的預測誤差數據Tab. 3 Predicition errors of validation set under different network structures
由表3 可知,在設置的網絡架構下,BPNN 隨機預測模型在兩種不同的環(huán)境特征表征方法的輸入數據集下均滿足AME<1 dB,STD<6 dB,CC 接近0.9,可以實現較精確的路徑損耗預測. 故本文后續(xù)工作沿用{25,13,13,1}和{10,35,35,1}兩種BPNN 架構,分別作為兩種不同表征方法下預測模型的網絡架構.
在前文中已經使用兩種傳播場景的表征方法分別建立起了兩個以BPNN 為基本架構的預測模型,下面評估模型泛化能力的過程也就是評估這兩種表征方法有效性的過程:如果從衛(wèi)星地圖上提取出的環(huán)境表征信息有效性高,那么預測模型對某一基站關聯區(qū)域中訓練樣本完成訓練后,也應當充分學習該區(qū)域中的環(huán)境特征對電波傳播的影響方式和程度,當應用到對其他基站關聯區(qū)域中訓練樣本的預測上時該預測模型應當可以做出精確的預測,即模型的泛化能力強,該過程就是跨基站預測的測試過程. 本文選取BS2 和BS3 的關聯區(qū)域中的全部樣本作為訓練集,BS1 的關聯區(qū)域中的全部樣本作為驗證集,當訓練中神經網絡對訓練集的預測精度較高時,再使其對驗證集進行預測. 分別以基于RGB 數值(等分數n=7)和基于RGB 聚類算法的方法表示環(huán)境特征并構建數據集輸入對應架構的BPNN,當BPNN 完成訓練后,對于訓練集和驗證集的預測結果如圖6~7 和表4 所示.
表4 基于兩種不同方法的BPNN 跨基站預測誤差Tab. 4 BPNN error prediction across different base stations by two methods
圖6 基于RGB 數值的跨基站預測結果Fig. 6 Results of prediction across different base stations based on RGB values
對比以上兩組測試結果發(fā)現:對于訓練集,基于RGB 數值的BPNN 預測性能更好;對于驗證集,基于RGB 聚類算法的BPNN 預測性能更好,即以各種地物類型比例表示環(huán)境特征能夠更好地協助BPNN 學習地物類型與電波多種傳播路徑之間的映射關系,訓練的模型泛化能力更強. 分析原因有兩方面:基于RGB 數值表征的環(huán)境特征維數為24,較高的輸入特征維數容易造成神經網絡過擬合;基于RGB 數值提取的環(huán)境信息更詳細,但其中可能缺少一般化特征的維度,而存在較多的場景獨有的個性化特征,引入的干擾信息降低了神經網絡的穩(wěn)定性和泛化性.
分析基于RGB 聚類算法的模型預測結果發(fā)現,某些路測點浮動變化較大,即距離增大很小時,路損預測結果變化較大,如圖7 所示,說明這些點在所提取的環(huán)境特征差異較大. 此外由于模型輸入的特征數量相對較少,同時更具有一般性,導致一定范圍內路測點的預測結果相對集中,在圖中形成了線狀分布.
圖7 基于RGB 聚類算法的跨基站預測結果Fig. 7 Results of prediction across different base stations based on RGB clustering algorithm
本節(jié)對兩種預測模型的測試結論是:基于RGB 聚類算法的預測模型的泛化能力更強,即表明基于RGB 聚類算法的傳播場景環(huán)境特征表征方法的有效性更好. 后文中選用基于RGB 聚類算法的傳播場景表征方法的BPNN 進行分析.
傳統信道建模方法中的確定性信道建模的基本思想是利用傳播環(huán)境的幾何和電磁信息,依據幾何光學理論和電磁傳播理論建立無線信道模型. RT 法是目前運用最廣泛的確定性建模方法,其通過準確的環(huán)境建模、天線的建模以及射線傳播的建模,并基于幾何繞射理論和一致性幾何繞射理論進行RT 計算,實現對無線信道特性的準確刻畫. 近年來不少學者為提升RT 法的仿真效率提出了多種加速方法,卓有成效,RT 法如今已經成為了一種較為普及而高效的信道建模方法而在無線通信的研究中廣泛使用.
本節(jié)以基于鏡像法的RT 法作為傳統信道建模方法的代表,通過可以模擬移動場景和多輸入多輸出(multiple-input multiple-output,MIMO)信道的高性能RT 法仿真平臺下的仿真程序實現[15]. 在相同計算資源(僅單核CPU 運行,無加速)的條件下,分別運行RT 法仿真模型和BPNN 預測模型對上一節(jié)中的驗證數據集(BS1)進行預測,對比結果來分析兩種方法的準確性和復雜度.
使用RT 法時首先需要傳播場景的電子地圖,其中包括地物類型和建筑物材質參數等相關信息,并運用相關的仿真軟件和編寫的應用程序對導入的數據進行RT 計算,得出仿真結果. 因此RT 法仿真模型不需要經過訓練,且在環(huán)境特征相差較大的不同場景中均適用,預測結果較穩(wěn)定,泛化能力較強. 導入BS1 關聯區(qū)域的樣本數據,計算仿真結果,并將誤差的各項評價指標數值和運行時間與BPNN 模型對比,如表5 所示. 此外同時繪制實測數據、RT 法仿真預測數據、BPNN 預測數據如圖8 所示.
表5 BPNN 和RT 的性能對比Tab. 5 Comparison of BPNN and RT performance
圖8 BPNN 和RT 的預測結果對比Fig. 8 Comparison of BPNN and RT prediction
由圖8 可知,RT 法的仿真數據更加分散,在數據點的分布上更加接近于實測數據,BPNN 的仿真數據則相對更集中,存在個別路測點的預測數據誤差很大的情況;在運行時間方面,BPNN 遠遠優(yōu)于RT法. 綜上所述,基于衛(wèi)星圖像RGB 信息的BPNN 能在保證準確率的基礎上,大幅度提高仿真效率.
此外,經過測試發(fā)現,RT 法的預測精度和仿真速率之間存在較大沖突. 例如當考慮電波傳播機制中的反射時,RT 法的仿真速率將大大降低,這時對數以萬計的路測點計算路損需要大量時間,雖然在如今RT 法所具備的加速方法的幫助下所需時間已經大大縮短,但在時間緊迫或者計算資源匱乏的情況下依然很難在限定時間內完成運算. 而不考慮反射因素則使得預測精度降低,例如當對上一節(jié)的訓練數據集和驗證數據集中的全部路測點做出預測時,各項評價指標數值分別是:預測數據與實測數據之間的CC 等于0.84,AME 等于0.04 dB,STD 等于6.69 dB. 該測試結果相比此前BPNN 分別對訓練數據集和驗證數據集進行預測的結果總體稍差一些,并沒有顯現RT 法具有的基于復雜運算而仿真能力更強的優(yōu)勢. 而基于本文提出的信道場景表征方法構建的BPNN 由于算法所需的運算量小,當計算資源受限時也可以在很短的時間內實現較高預測精度,這正是其相對傳統信道建模方法的優(yōu)勢所在.
本文提出了基于機器學習和衛(wèi)星地圖的電波傳播路徑損耗預測模型. 基于衛(wèi)星圖像的RGB 顏色信息提出了兩種表征電波傳播場景的方法,在此基礎上利用BPNN 實現路徑損耗的預測. 本方法的預測結果與實測數值之間的CC 達到了0.83,AME 控制在0.66 dB,STD 控制在6.65 dB. 結果表明,本文模型的準確度較高,相比于依賴高精度場景參數的傳統信道建模方法,實現了實用性和高效性等方面的提升. 這對于電波傳播特性和無線信道特性的研究提供了新思路和新方案,對于無線通信系統的優(yōu)化具有指導意義.
本文尚未解決的問題是BPNN 跨基站預測的精確度不夠穩(wěn)定,即如果更換研究場景,模型難做出同等精確度的預測. 解決該問題需要進一步優(yōu)化對電波傳播場景的表征方法,改善基于衛(wèi)星圖像的信道特征提取方式,例如利用RGB 信息表征建筑物高度等場景特征[16],從而實現對不同場景更加穩(wěn)定和準確的電波傳播路徑損耗預測.