張捷,楊麗花,王增浩,呼博,聶倩
(南京郵電大學江蘇省無線通信重點實驗室,江蘇 南京 210003)
近年來無線通信技術發(fā)展迅速,與無線信道相關的成果層出不窮[1-2]。隨著運行速度超過300 km/h 的高速鐵路(high speed railway,HSR)的大規(guī)模部署,HSR 環(huán)境下的無線通信在全球引起了越來越多的關注[3-5]。在HSR 環(huán)境下,列車的高速運行會引起大的多普勒頻移,而大的多普勒頻移會使得信道發(fā)生快速時變,在此場景下高精度地獲取信道狀態(tài)信息(channel state information,CSI)是關鍵。通過信道估計雖可以獲得CSI,但是信道的快速時變以及信道估計的處理時延,使得獲取的CSI 已經(jīng)過時,不能反映當前時刻的信道狀況。然而,信道預測可以根據(jù)過時的信道狀態(tài)信息,預測未來發(fā)送時刻的信道狀況,能夠顯著提高系統(tǒng)性能。
目前時變信道預測問題已經(jīng)引起了廣泛的關注,傳統(tǒng)的時變信道預測方法是使用線性預測模型,通過對當前時刻CSI 和過去時刻CSI 的線性組合,獲取未來時刻的CSI。其中,參考文獻[6]給出了一種基于二階自回歸(auto regressive,AR)模型的瑞利信道預測方法;參考文獻[7]給出了一種基于線性最小均方誤差(linear minimum mean square error,LMMSE)的信道預測方法。由于基于AR 模型的預測方法求解AR 系數(shù)需要基于已知的信道時域相關性信息,而在非平穩(wěn)狀態(tài)下,信道的時域相關特性隨時間變化,導致AR 模型中依賴時域相關性的待定系數(shù)的計算非常復雜。為此,參考文獻[8]與參考文獻[9]提出了一種基于一階泰勒展開的信道預測方法,由于待擬合的多項式的最高階數(shù)為1,故該多項式的擬合問題可等價于線性回歸問題,通過多元函數(shù)極值的必要條件,將問題轉(zhuǎn)化為求解線性方程組,從而得到一階泰勒展開模型的系數(shù)。與AR 模型相比,該方法以較低的復雜度實現(xiàn)信道預測,更適用于復雜的信道環(huán)境。然而這些線性預測方法雖具有較好的預測性能,但是不適用于非線性特性的快速時變信道。因此,實現(xiàn)時變信道預測的另一有效途徑是建立非線性預測模型,通過非線性預測來提高信道預測的精度。
典型的非線性預測方法有支持向量機(support vector machine,SVM)方法和深度學習方法,其中參考文獻[10]給出了一種HSR 場景下基于SVM 的信道預測方法,該方法通過使用遺傳算法(genetic algorithm,GA)優(yōu)化SVM 模型的懲罰系數(shù)和高斯核寬度,可以獲得優(yōu)于傳統(tǒng)線性模型的預測性能,但是該方法需要從低維空間映射到高維空間,復雜度較高。深度學習的方法由于可以進一步地提高預測精度和降低復雜度,因此近年來受到了越來越多的重視。其中,參考文獻[11]提出了一種基于復值神經(jīng)網(wǎng)絡的信道預測方法,該方法主要利用線性調(diào)頻Z 變換獲取的信道估計訓練復值神經(jīng)網(wǎng)絡,從而實現(xiàn)時變信道的預測。與傳統(tǒng)的信道預測方法相比,該方法具有更高的預測精度,但是基于復值神經(jīng)網(wǎng)絡的預測方法的計算量比基于實值神經(jīng)網(wǎng)絡要高得多,因此具有較高的計算復雜度。參考文獻[12]給出了一種基于回聲狀態(tài)網(wǎng)絡的信道預測方法,該方法使用具有自反饋環(huán)的雙向環(huán)形內(nèi)部結(jié)構降低計算復雜度,實現(xiàn)快速信道預測。但是由于該方法權重矩陣初始化過于隨機,且不進行權重矩陣的更新,因此具有較低的信道預測精度。參考文獻[13]給出了一種基于反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡的信道預測方法,該方法利用稀疏樣本訓練BP 神經(jīng)網(wǎng)絡,并采用了早期停止策略防止過擬合,因此該方法具有較高的預測性能。但是,該方法采用隨機初始化方式訓練網(wǎng)絡,沒有考慮初始參數(shù)對預測性能的影響,故其預測精度有待進一步提高。
為了解決以上問題,本文提出了一種適用于高速移動場景的基于深度學習的時變信道預測方法,該方法基于BP 神經(jīng)網(wǎng)絡進行線下訓練與線上預測。在線下訓練階段,為了降低BP 神經(jīng)網(wǎng)絡隨機初始化引起的性能損失,本文方法設計了一個預訓練方法來獲取期望的網(wǎng)絡初始值,然后基于該初始值對BP 網(wǎng)絡進行再次訓練。在線上預測階段,本文方法充分利用多輸入多輸出BP 神經(jīng)網(wǎng)絡,基于訓練網(wǎng)絡,實現(xiàn)未來單個以及多個時刻信道的預測。仿真結(jié)果表明,本文方法既具有較高的預測精度,又具有較低的計算復雜度。
考慮一個單輸入單輸出(SISO)的高速移動正交頻分復用(orthogonal frequency division multiplexing,OFDM)系統(tǒng)(即SISO-OFDM 系統(tǒng)),假設Sm為頻域第m個發(fā)送的OFDM 符號,且Sm=[S(m,0),S(m,1), …,S(m,N?1)]T,其中,S(m,k)表示第m個OFDM 符號第k個子載波上的發(fā)送信號,N是OFDM 符號長度。對Sm進行N點IFFT 得到時域發(fā)送信號為:
在HSR 通信環(huán)境中,由于基站均沿鐵軌附近建立,所以將存在一個很強的直射(line of sight,LOS)分量,因此在HSR 環(huán)境中通常采用萊斯信道作為信道模型[14-16],即:
其中,α0(m,n)為信道的 LOS 徑分量,αl(m,n),l=1, …,L?1為散射分量徑,其服從瑞利分布,L為多徑萊斯信道的徑數(shù),τl是第l徑的歸一化時延,萊斯因子定義為
假設循環(huán)前綴的長度大于無線傳輸信道的最大時延,且接收端考慮理想定時同步,則第m個OFDM 符號第n個采樣點的接收信號為:
其中,z(m,n) 是均值為0、方差為的加性高斯白噪聲(AWGN)。由于在此考慮的每個OFDM符號的信道預測方法是一樣的,因此,下面的論述中將省略符號的序號標識m。
本文方法主要分為預訓練、訓練與線上預測3 個部分。由于BP 神經(jīng)網(wǎng)絡是一種按照誤差逆向傳播算法訓練的多層前饋神經(jīng)網(wǎng)絡,具有非線性映射能力強、網(wǎng)絡結(jié)構簡單的特點[17],因此本文方法采用了BP 神經(jīng)網(wǎng)絡來進行時變信道預測。下面將對BP 神經(jīng)網(wǎng)絡及本文方法進行詳細的介紹。
一個多輸入多輸出的三層BP 網(wǎng)絡如圖1 所示,其包括一個輸入層、一個隱藏層和一個輸出層。假設該BP 神經(jīng)網(wǎng)絡的輸入層有D個神經(jīng)元,隱藏層有Q個神經(jīng)元,輸出層有P個神經(jīng)元。在此,定義該網(wǎng)絡的訓練樣本集合為:
其中,U表示訓練樣本的個數(shù),是第u個輸入樣本向量,是第u個輸入樣本向量中的第d個元素,即第d個輸入神經(jīng)元上的值。表示第u個輸出樣本向量,是第u個輸出樣本向量中的第p個元素,即第p個輸出神經(jīng)元上的值。
由于神經(jīng)網(wǎng)絡中任何節(jié)點的輸入值是前一層的神經(jīng)元的輸出乘以權重再加上閾值,然后由激活函數(shù)激活得到該節(jié)點的輸出值[18],因此,對于任意訓練樣本而言,第q個隱藏神經(jīng)元的輸出為:
其中,g1(?)為隱藏層激活函數(shù),在此選擇Sigmoid函數(shù),即:
為第q個隱藏神經(jīng)元的輸入:
圖1 三層BP 神經(jīng)網(wǎng)絡示意圖
其中,dx表示第d個輸入神經(jīng)元,Wd,q表示第q個隱藏神經(jīng)元與第d個輸入神經(jīng)元之間的權重,qξ為第q個隱藏神經(jīng)元的閾值。
在BP 網(wǎng)絡的輸出層,第p個輸出神經(jīng)元的輸出為:
其中,g2()?為輸出層激活函數(shù),在此選擇ReLU 函數(shù),即:
是第p個輸出神經(jīng)元的輸入:
其中,Vq,p為第q個隱藏層神經(jīng)元和第p個輸出層神經(jīng)元之間的權重,pθ為第p個輸出神經(jīng)元的閾值。
本文將BP 網(wǎng)絡輸出與理想信道值h(n) 的均方誤差(MSE)作為損失函數(shù),采用梯度下降法更新權值與閾值矩陣,通過樣本訓練網(wǎng)絡,以使誤差滿足設定精度。
由于復值神經(jīng)網(wǎng)絡的復雜度遠高于實值神經(jīng)網(wǎng)絡,因此本文將采用實值神經(jīng)網(wǎng)絡,即將復數(shù)樣本數(shù)據(jù)的實部與虛部進行分離,并進行樣本重塑以提高網(wǎng)絡預測的效率。本文方法主要分成預訓練、訓練和線上預測3 個階段,通過線下的預訓練與訓練處理獲取真實的信道預測模型,再利用線上預測實時獲取信道預測值。
(1)預訓練階段
為了降低BP 神經(jīng)網(wǎng)絡隨機初始化引起的性能損失,本文方法中引入了預訓練處理以獲取較優(yōu)的網(wǎng)絡權值與閾值。假設預訓練階段的訓練樣本集為Cp,即:
其中,U表示預訓練樣本數(shù),表示預訓練階段第u個輸入輸出樣本集,其中,為輸入樣本,其表示估計信道參數(shù)h?(n) 中第u個采樣時刻和接下來的(D?1) 個采樣時刻的信道狀態(tài)信息;為輸出樣本,其表示理想信道參數(shù)h(n)中第(u+D)個采樣時刻以及之后的(P? 1)個采樣時刻的信道狀態(tài)信息,即:
在預訓練階段,基于隨機初始化的網(wǎng)絡參數(shù),本文方法利用訓練樣本集Cp對BP 網(wǎng)絡進行訓練,得到具有權值參數(shù)為Wpre、Vpre和閾值參數(shù)為ξpre、θpre的神經(jīng)網(wǎng)絡。參考文獻[13]中也是基于BP 網(wǎng)絡實現(xiàn)信道預測,然而參考文獻[13]只有一次訓練迭代過程,且在訓練過程中隨機初始化網(wǎng)絡參數(shù),而本文方法中的預訓練方法使用了基于數(shù)據(jù)與導頻均已知情況下獲取的較理想的信道估計值進行網(wǎng)絡訓練,因此通過該方法獲得的BP 網(wǎng)絡參數(shù)可以作為訓練階段網(wǎng)絡的初始參數(shù),以避免網(wǎng)絡參數(shù)隨機初始化,使網(wǎng)絡收斂的更快。
(2)訓練階段
本文方法中訓練階段是在預訓練得到的BP網(wǎng)絡的基礎上繼續(xù)訓練網(wǎng)絡。假設訓練階段的訓練樣本集為CT,即:
其中,U表示訓練樣本數(shù),表示訓練階段第u個輸入輸出樣本集,構造為:
在訓練階段,采用預訓練階段獲得的權值參數(shù)Wpre、Vpre和閾值參數(shù)ξpre、θpre作為本階段BP網(wǎng)絡的初始參數(shù),利用訓練樣本集CT訓練該網(wǎng)絡,獲得最終的具有權值參數(shù)為Wtrain、Vtrain和閾值參數(shù)為ξtrain、θtrain的信道預測網(wǎng)絡模型。與預訓練階段不同的是,訓練階段的樣本是僅利用導頻和線性內(nèi)插得到的信道參數(shù),因為這種情況更符合真實的系統(tǒng);而預訓練階段是在數(shù)據(jù)和導頻均已知的情況下獲得的信道估計參數(shù),用準確性更高的數(shù)據(jù)進行預訓練,并作為訓練網(wǎng)絡的初始參數(shù),避免了網(wǎng)絡隨機初始化帶來的影響,同時也提高了預測的準確性。
(3)線上預測階段
本文方法中預測階段是利用訓練階段獲得的信道預測網(wǎng)絡模型,進行線上的信道預測的過程。在此,只需要給該網(wǎng)絡輸入前D個時刻的信道參數(shù)估計值xE,即可獲得之后P個時刻的信道預測值yE。其中:
最終得到的信道預測值為:
其中,Γ?1()?為Γ()? 的反操作,即將實數(shù)轉(zhuǎn)化為復數(shù)的操作。
為驗證本文方法的性能,本節(jié)將對該方法進行仿真與分析??紤]一個OFDM 系統(tǒng),其中FFT/IFFT 長度為128,循環(huán)前綴長度為16,采用梳狀導頻結(jié)構,導頻數(shù)目為32,且均勻分布。假設列車移動速度為500 km/h,信道采用多徑萊斯信道,萊斯因子為5。載波頻率考慮3.5 GHz,子載波間隔為15 kHz。樣本的采樣間隔Ts=0.72 ×10?4s 。網(wǎng)絡的輸入神經(jīng)元數(shù)目D= 20,隱藏層神經(jīng)元數(shù)目Q= 5。網(wǎng)絡的學習速率η=0.001,訓練的目標誤差εgoal= 1 ×10?4,最大迭代次數(shù)設置為1 000。仿真中,考慮的訓練樣本數(shù)U=5 000。為了比較本文方法的性能,仿真中還給出了參考文獻[6]、參考文獻[12]和參考文獻[13]中方法的性能,其中參考文獻[6]為基于AR模型的線性預測方法,參考文獻[12]為基于回聲狀態(tài)網(wǎng)絡的信道預測方法以及參考文獻[13]為傳統(tǒng)的基于BP神經(jīng)網(wǎng)絡的信道預測方法。
不同訓練樣本數(shù)下本文方法與參考文獻[13]所需訓練時間的對比見表1。從表1 中可以看出,隨著樣本數(shù)的增加,兩種預測方法訓練網(wǎng)絡所需時間都會增加,且在同一樣本數(shù)量下,本文方法訓練網(wǎng)絡所需時間始終比參考文獻[13]要少,這是因為本文方法加入了預訓練處理,并將預訓練獲得的網(wǎng)絡參數(shù)作為BP 網(wǎng)絡訓練的初始參數(shù),促使訓練階段快速收斂。
表1 本文方法與參考文獻[13]訓練不同數(shù)量樣本所需時間(單位:s)
不同信噪比下各種信道預測方法的MSE 性能曲線如圖2 所示。從圖2 中可以看出,隨著信噪比的增大,各種預測方法的預測性能將得到改善,且與傳統(tǒng)的信道預測方法相比,參考文獻[13]方法和本文方法可以取得更好的預測性能,更加接近理想值。然而,由于本文方法加入了預訓練處理,其為訓練階段提供了較為理想的網(wǎng)絡初始參數(shù),避免了參數(shù)的隨機初始化,因此本文方法較參考文獻[13]方法具有更好的性能。
圖2 各種信道預測方法的MSE 性能
在不同多普勒頻移下各種預測方法的MSE性能曲線如圖3 所示。從圖3 中可以看出,隨著多普勒頻移的增大,各種方法的MSE 性能均會變差,但本文方法的MSE 性能始終要優(yōu)于其他文獻的方法,這是因為本文方法增加了預訓練階段,充分利用了信道狀態(tài)信息,使用了基于數(shù)據(jù)與導頻均已知情況下獲取的較理想的信道估計值進行網(wǎng)絡訓練,對時變信道進行了二次訓練,增強了預測網(wǎng)絡的準確性和魯棒性,與參考文獻[13]相比,能更好地適應時變信道狀態(tài)特征,因此,本文方法能更好地適應多普勒頻移的變化,具有更強的適用性。
在不同信噪比下本文方法與參考文獻[13]實現(xiàn)多時刻預測的MSE 性能曲線如圖4 所示。從圖4中可以看出,無論是單時刻預測還是多時刻預測,隨著信噪比的增加,本文方法與參考文獻[13]方法的MSE 性能均會變好,且當信噪比增加到一定程度,本文方法的預測性能趨于穩(wěn)定,利用本文方法進行信道預測的MSE 性能曲線在誤差可允許的范圍內(nèi)略微浮動,但總體保持在穩(wěn)定水平。但是,隨著預測時刻數(shù)的增加,兩種方法的MSE 性能均會變差,這是因為隨著時間間隔的增大,信道的相關性逐漸減弱[19],因而多時刻預測的MSE 性能將隨著預測時刻數(shù)的增加而變差。然而,本文方法的性能始終要優(yōu)于參考文獻[13]方法,這也說明與現(xiàn)有方法相比,本文方法可以更好地實現(xiàn)信道的多時刻預測功能。
在不同信噪比下本文方法與參考文獻[13]方法基于不同隱藏層結(jié)構實現(xiàn)信道預測的MSE 性能曲線如圖5 所示。從圖5 中可以看出,無論基于何種隱藏層結(jié)構,隨著信噪比的增加,本文方法與參考文獻[13]方法的MSE 性能均會變好。但是,增加隱藏層的層數(shù)對信道預測性能的改善效果不及增加隱藏層神經(jīng)元數(shù),因此,可通過適當增加隱藏層神經(jīng)元數(shù)改善預測性能。然而,在相同隱藏層結(jié)構下,本文方法的MSE 性能始終要優(yōu)于參考文獻[13]的方法,這說明本文方法對實現(xiàn)信道預測具有優(yōu)越性。
圖3 不同多普勒頻移下各種信道預測方法的MSE 性能
圖5 不同隱層結(jié)構下本文方法與參考文獻[13]方法的MSE 性能
本節(jié)將主要對第4.1 節(jié)中仿真的幾種信道預測方法的計算復雜度進行分析。參考文獻[6]中傳統(tǒng)的基于AR 模型的預測方法的計算復雜度是O(NAR),其中,NAR表示AR 的迭代次數(shù)。由于基于深度學習的信道預測方法線下訓練完網(wǎng)絡后,網(wǎng)絡模型就確定了,網(wǎng)絡參數(shù)不再改變,為此基于深度學習的信道預測方法只考慮線上實時預測的計算復雜度。因此,參考文獻[12]的計算復雜度是O(max(M,Nnz,N)),其中,M表示輸入變量數(shù),Nnz表示中間層權重矩陣的非零元素的個數(shù),N表示中間層的變量數(shù);本文方法和參考文獻[13]方法線上預測階段的計算復雜度均是O(max(D×Q,Q×P)),其中,D、P、Q分別是神經(jīng)網(wǎng)絡的輸入層、隱藏層和輸出層的神經(jīng)元數(shù)目。參考文獻[13]的線下訓練階段的計算復雜度是其中,表示網(wǎng)絡訓練過程中的迭代次數(shù)。本文方法在線下預訓練階段和訓練階段的計算復雜度均為這是因為本文方法在預訓練階段與訓練階段共經(jīng)歷兩次訓練迭代過程,參考文獻[13]方法線下只經(jīng)歷一次訓練迭代過程,因此線下過程本文方法復雜度較參考文獻[13]有所增加。但兩種方法在線上實時預測階段的復雜度是相當?shù)?,因此,在只考慮線上階段復雜度的情況下,本文方法較參考文獻[13]方法在性能方面提升了,而復雜度卻沒有增加。
根據(jù)上述分析,不同信道預測方法復雜度的比較見表2。從表2 中可以看出:參考文獻[6]方法的計算復雜度最低,但是其預測性能最差;參考文獻[12]方法計算復雜度次之,參考文獻[13]方法與本文方法的計算復雜度最高,但本文方法與參考文獻[13]的預測性能遠遠優(yōu)于參考文獻[6]與參考文獻[12]。雖然本文方法的計算復雜度與參考文獻[13]的相同,但是本文方法具有更優(yōu)的預測性能。另外,由于本文方法考慮的神經(jīng)元的數(shù)目非常少(例如,D=10,Q=5,P=1),因此本文方法的計算復雜度在實際運用中也是可以接受的。
表2 不同信道預測方法的復雜度比較
針對高速移動場景,本文提出了一種適用于OFDM 系統(tǒng)的基于深度學習的時變信道預測方法。本文方法在BP 神經(jīng)網(wǎng)絡的基礎上,通過預訓練、訓練和線上預測處理,實現(xiàn)了時變信道的高精度預測。另外,本文方法通過改變輸出神經(jīng)元的個數(shù)重新訓練網(wǎng)絡,可以實現(xiàn)時變信道的多時刻預測,這不僅提高了信道預測的精度,降低了計算的復雜度,同時還提高了系統(tǒng)的預測效率,有效地節(jié)約了系統(tǒng)資源,是一種具有高有效性和可靠性的時變信道預測方法。