王華華, 李延山, 張志豪, 梁家敏
(重慶郵電大學(xué)通信與信息工程學(xué)院, 重慶 400065)
大規(guī)模多輸入多輸出正交頻分復(fù)用(multiple input multiple output orthogonal frequency division multiplexing, MIMO-OFDM)技術(shù)憑借其高效的頻譜效率已經(jīng)成為了第5代移動(dòng)通信系統(tǒng)中的一項(xiàng)關(guān)鍵技術(shù)[1]。通過(guò)在發(fā)送端和接收端使用多個(gè)天線,MIMO-OFDM系統(tǒng)能夠充分地利用分集與多路復(fù)用的優(yōu)勢(shì),同時(shí)極大地提升抗頻率選擇性衰落的能力。而使用大天線陣列,又可以使毫米波系統(tǒng)實(shí)現(xiàn)高波束賦形增益及接收信噪比(signal to noise ratio, SNR)。然而,由于大量的射頻鏈路被使用在天線陣列中,因此也給系統(tǒng)帶來(lái)了硬件成本和功率消耗高的問題。為了降低毫米波MIMO-OFDM系統(tǒng)的硬件成本以及功耗問題,多種方法被提出,其中在接收端使用低分辨率模數(shù)轉(zhuǎn)換器(analog-to-digital converter, ADC)的方案最為普遍[2-4]。
低分辨率ADC的引入將標(biāo)準(zhǔn)線性模型擴(kuò)展為廣義線性模型,而適用于廣義線性模型下的信號(hào)檢測(cè)算法研究具有重要的理論和實(shí)際意義。目前學(xué)術(shù)界的研究方向主要有兩類,文獻(xiàn)[5-6]中提出的廣義近似消息傳遞信號(hào)重構(gòu)(generalized approximate message passing, GAMP)算法,該算法用于從非線性的觀測(cè)信號(hào)中重構(gòu)發(fā)送信號(hào);文獻(xiàn)[7]中提出的廣義期望一致(generalized expectation consistent signal recovery, GEC-SR)算法,該算法是一種基于貝葉斯最優(yōu)檢測(cè)器的算法,能夠完美匹配MIMO-OFDM系統(tǒng)。上述算法均是基于傳統(tǒng)的集中式處理結(jié)構(gòu),具有較高的矩陣運(yùn)算復(fù)雜度。另一類則是基于分布式處理結(jié)構(gòu)的算法,文獻(xiàn)[8-10]中提出了分布式期望傳播(expectation propagation, EP)算法,但只考慮了在標(biāo)準(zhǔn)線性模型中的應(yīng)用,并不能直接擴(kuò)展到廣義線性模型。考慮到EP算法在標(biāo)準(zhǔn)線性模型中良好的檢測(cè)性能,本文嘗試將EP算法應(yīng)用到分布式的廣義線性系統(tǒng)模型。
本文考慮了EP算法在帶有低分辨率ADC的寬帶系統(tǒng)中的應(yīng)用問題,將接收端的天線均分為多個(gè)天線數(shù)量相等的子陣列,在每個(gè)子陣列中獨(dú)立、迭代地執(zhí)行消息更新規(guī)則,再由一個(gè)集中處理模塊對(duì)所有子陣列的處理結(jié)果進(jìn)行匯總計(jì)算,直至滿足預(yù)設(shè)的迭代結(jié)束條件。基于此,提出了一種基于分布式EP算法(decentralized EP algorithm, de-EPA)的信號(hào)檢測(cè)方案,與原始EP算法比較,分布式算法能夠有效地降低矩陣運(yùn)算的復(fù)雜度并維持檢測(cè)性能。本文首先對(duì)分布式廣義線性系統(tǒng)模型進(jìn)行了詳細(xì)的描述,并將系統(tǒng)模型與因子圖表示的方式聯(lián)系起來(lái),然后對(duì)EP算法的理論與消息更新方式進(jìn)行了概述,提出了適用于分布式廣義線性模型下的EP檢測(cè)方案,并對(duì)算法進(jìn)行了推導(dǎo),最終通過(guò)復(fù)雜度分析與仿真結(jié)果表明了所提算法在計(jì)算復(fù)雜度、誤比特率(bit error ratio, BER)性能方面良好的表現(xiàn)。
考慮一個(gè)上行量化MIMO-OFDM分布式系統(tǒng),該系統(tǒng)由Nt個(gè)單天線用戶和Nr根接收天線組成,且每根接收天線均配備有一個(gè)低分辨率復(fù)值量化器。同時(shí),假設(shè)OFDM系統(tǒng)具有Nc個(gè)正交子載波。為了降低數(shù)據(jù)處理的復(fù)雜度,在接收端將天線陣列分解為C個(gè)獨(dú)立的子陣列,每個(gè)子陣列表示為一個(gè)局部檢測(cè)模塊,各子陣列之間的檢測(cè)過(guò)程獨(dú)立進(jìn)行,然后再由一個(gè)集中處理模塊對(duì)每個(gè)局部檢測(cè)模塊的處理結(jié)果進(jìn)行融合處理,再反饋給每個(gè)局部模塊。模型圖如圖1所示,其中包含快速傅里葉逆變換(inverse fast Fourier transform, IFFT)和無(wú)線射頻(radio frequency, RF)。
圖1 上行量化MIMO-OFDM分布式系統(tǒng)模型Fig.1 Uplink quantized MIMO-OFDM decentralized system model
用xi=[xi,1,xi,2,…,xi,Nc]T∈XNc×1表示第i個(gè)單天線用戶待發(fā)送的頻域信號(hào),X 表示采用不同調(diào)制方式時(shí)對(duì)應(yīng)的星座符號(hào)點(diǎn)集。每個(gè)天線對(duì)之間存在帶有L個(gè)抽頭的延遲多徑信道,例如,在第nt∈{1,2,…,Nt}根發(fā)送天線與第nr∈{1,2,…,Nr}根接收天線之間,信道表示為hnrnt∈CL×1,通過(guò)循環(huán)卷積技術(shù),天線對(duì)之間的等效信道卷積矩陣表示為Hnrnt∈CNc×Nc。經(jīng)過(guò)逆傅里葉變換,頻域信號(hào)被轉(zhuǎn)換為時(shí)域信號(hào),時(shí)域信號(hào)在添加循環(huán)前綴之后通過(guò)天線對(duì)之間的多徑信道傳輸?shù)竭_(dá)接收端。
在接收端,每根接收天線上的未量化信號(hào)表示為
(1)
(2)
式中:Qc(·)表示對(duì)實(shí)部和虛部逐元素映射的復(fù)值量化器,量化的具體規(guī)則可見文獻(xiàn)[11]。利用傅里葉變換矩陣將信道卷積矩陣Hnrnt對(duì)角化,對(duì)角矩陣中的每個(gè)元素為信道的頻域沖擊響應(yīng),即Λnrnt=FHnrntFH。
基于上述關(guān)系式,式(2)可表示為
(3)
通過(guò)堆疊所有接收天線上的量化信號(hào),可以得到:
q=Qc(Ax+n)
(4)
式(4)中整體的信道矩陣表示為
(5)
式(4)中發(fā)送信號(hào)和量化信號(hào)表示為
q=[q1,q2,…,qNr]T∈CNrNc×1
(6)
x=[x1,x2,…,xNt]T∈CNcNt×1
(7)
為了便于表述和計(jì)算,令M=NcNr和N=NcNt,因此q、x和A的維度又可以分別表示為M×1、N×1和M×N。在大規(guī)模MIMO系統(tǒng)中,例如M×N=4 000×1 000時(shí),傳統(tǒng)的信號(hào)檢測(cè)方案往往涉及到復(fù)數(shù)矩陣求逆,導(dǎo)致計(jì)算量非常龐大。為了提高檢測(cè)算法的效率和性能,分布式的系統(tǒng)模型應(yīng)運(yùn)而生。
將基站端的接收端天線陣列劃分為天線數(shù)量相等的C個(gè)子陣列,每個(gè)子陣列包含Nr/C根接收天線,對(duì)于第c∈C={1,2,…,C}個(gè)子陣列,式(4)可被寫為
yc=Qc(Acx+nc)
(8)
定義中間變量zc=Acx和Mc=NrNc/C便于后續(xù)計(jì)算。
在式(8)中,Ac由A的Mc行組成,且:
(9)
從式(8)可以看出,如果有一種檢測(cè)算法能夠使得某個(gè)子陣列獨(dú)立于其他子陣列完成信號(hào)檢測(cè),那么基于分布式系統(tǒng)的計(jì)算復(fù)雜度將大大減小,文獻(xiàn)[10]中的EP算法提供了一種可行的思路。
EP算法在因子圖[12]的基礎(chǔ)上,通過(guò)投影的方式將復(fù)雜分布p(x)(常常是待求解的)投影到某個(gè)指數(shù)分布集Φ上的簡(jiǎn)單分布q(x),來(lái)計(jì)算復(fù)雜分布p(x)的近似后驗(yàn)概率。由于高斯分布具有乘、除易于計(jì)算的特點(diǎn),因此將復(fù)雜分布投影到高斯分布集上是EP的關(guān)鍵點(diǎn),即q(x)服從高斯分布[13]。投影的具體方式下所示:
(10)
式中:KL(·)表示KL (kullback-leibler)散度。
基于貝葉斯推理的框架,首先利用觀測(cè)信號(hào)y、信道矩陣A和發(fā)送信號(hào)的先驗(yàn)分布p(x)來(lái)計(jì)算后驗(yàn)分布p(x|y),再將分布p(x|y)投影到高斯分布集上的簡(jiǎn)單分布q(x),最后容易求得發(fā)送信號(hào)x的后驗(yàn)期望值。
根據(jù)式(8)和文獻(xiàn)[14]中的廣義線性模型,得到發(fā)送信號(hào)x的后驗(yàn)概率密度函數(shù)表示為
(11)
式中:p(x)表示信號(hào)的先驗(yàn)分布;δ(·)表示一個(gè)線性模塊,p(yc|zc)表示似然函數(shù),即:
(12)
引入中間變量zc和因子節(jié)點(diǎn)δ(zc-Acx),式(11)的矢量因子圖表示如圖2所示。
圖2 廣義線性模型的矢量因子圖Fig.2 Vector factor graph of generalized linear model
將圖2中第c個(gè)子陣列的矢量因子圖模型展開,得到第c個(gè)子陣列的標(biāo)量因子圖模型如圖3所示。圖3中,箭頭所指表示消息在不同節(jié)點(diǎn)之間傳遞更新的方向。
圖3 第c個(gè)子陣列的標(biāo)量因子圖Fig.3 Scalar factor graph of the cth subarray
以圖3為例,結(jié)合文獻(xiàn)[6],得到基于EP消息更新方式如下所示:
(13)
(14)
(15)
(16)
(17)
圖4 de-EPA算法框圖Fig.4 de-EPA algorithm block diagram
算法的詳細(xì)過(guò)程推導(dǎo)如下。
步驟 1初始化。將因子節(jié)點(diǎn)δc和p(yc|zc)的外部輸入初始化為復(fù)高斯分布,即:
(18)
期望對(duì)下式所表示的后驗(yàn)分布取。
(19)
式(19)的逐分量表示方式可參見文獻(xiàn)[15]。模塊A的外部信息即是變量節(jié)點(diǎn)zc傳遞的消息。
接下來(lái)給出后續(xù)推導(dǎo)過(guò)程中使用到的矢量高斯相乘公式[6]:
CN(x;a,A)·CN(x;b,B)=CN(0;a-b,A+B)·CN(x;c,C)
(20)
式中:C=(A-1+B-1);c=C·(A-1a+B-1b)。式(20)表示兩個(gè)矢量高斯分布的乘積仍服從高斯分布。
(21)
步驟 3計(jì)算模塊B的后驗(yàn)信息以及外部消息。模塊B表示的是一個(gè)線性空間,首先計(jì)算線性空間的逆向輸出,由式(14)和式(17),得到:
(22)
(23)
將式(23)代入到式(22)中,利用式(20),得到線性空間的后驗(yàn)信息為
(24)
模塊B的外部信息即是因子節(jié)點(diǎn)的輸出,由式(18)和式(24),得到
(25)
利用式(20),得到:
(26)
步驟 4對(duì)x進(jìn)行匯總。當(dāng)觀測(cè)矢量經(jīng)過(guò)模塊A和B之后,我們得到x[c]的先驗(yàn)信息,在進(jìn)入模塊C之前,添加限定條件x=x[1]=x[2]=…=x[C],用于構(gòu)造新的復(fù)高斯分布[16],利用限定條件和x[c]的先驗(yàn)信息,得到
CN(x;u1x,diag(v1x))∝
(27)
利用式(20),得到:
(28)
步驟 5計(jì)算模塊C的后驗(yàn)信息和外部信息。模塊C的后驗(yàn)信息即是因子節(jié)點(diǎn)p(x)的后驗(yàn)均值估計(jì),由式(15)有:
式中:
(29)
模塊C的外部信息即是變量節(jié)點(diǎn)x傳遞的消息量,由式(15)和式(29)得到:
(30)
利用式(20),有
(31)
步驟 6計(jì)算模塊B的后驗(yàn)信息和外部信息。首先計(jì)算線性空間的正向輸出,由式(17)和式(31)得到
(32)
化簡(jiǎn)方式同式(23),且
(33)
根據(jù)線性關(guān)系z(mì)c=Acx,有
(34)
模塊B的外部信息即是變量節(jié)點(diǎn)zc傳遞的消息,由式(16)、式(34)得到
(35)
利用式(20)得到:
(36)
根據(jù)上述詳細(xì)推導(dǎo)過(guò)程,de-EPA步驟如算法1所示。
算法 1 De-EPA輸入:p(x)、Ac、yc、p(yc|zc),c=1,2,…,C輸出:x^=u^1x步驟 1 初始化。因子節(jié)點(diǎn)δc和p(yc|zc)的外部輸入為u[c]2x、v[c]2x、u[c]1z和v[c]1z與初始迭代次數(shù)t=1。步驟 2 計(jì)算因子節(jié)點(diǎn)p(yc|zc)的后驗(yàn)信息u^[c]1z、v^[c]1z。步驟 3 計(jì)算變量節(jié)點(diǎn)zc的外部消息u[c]2z、v[c]2z。步驟 4 計(jì)算線性模塊的后驗(yàn)信息u^[c]2x、V^[c]2x。步驟 5 計(jì)算變量節(jié)點(diǎn)x[c]的外部消息u[c]1x、v[c]1x。步驟 6 融合匯總x[c],計(jì)算x的均值u1x與方差v1x。步驟 7 計(jì)算因子節(jié)點(diǎn)p(x)的后驗(yàn)均值u^[c]1x與方差v^[c]1x。步驟 8 計(jì)算變量節(jié)點(diǎn)x[c]的外部消息u[c]2x與v[c]2x。步驟 9 計(jì)算線性模塊的后驗(yàn)信息u^[c]2x、V^[c]2x。步驟 10 根據(jù)線性關(guān)系z(mì)c=Acx,計(jì)算變量節(jié)點(diǎn)zc的后驗(yàn)信息u^[c]2z、V^[c]2z。步驟 11 計(jì)算變量節(jié)點(diǎn)zc外部消息u[c]1z、v[c]1z。步驟 12 循環(huán)步驟2~步驟11,直至t=Tmax,得到發(fā)送信號(hào)的估計(jì)值u^1x=u^[c]1x。
算法的整體復(fù)雜度主要由矩陣求逆和矩陣乘法的次數(shù)決定,本節(jié)分別用實(shí)數(shù)乘法的次數(shù)和矩陣求逆的復(fù)雜度來(lái)衡量算法整體的復(fù)雜度情況。
(A+UCV)-1=A-1-A-1U(C-1+VA-1U)-1VA-1
(37)
首先計(jì)算矩陣求逆的復(fù)雜度,根據(jù)式(37)所示的伍德伯里矩陣恒等式性質(zhì),式(24)可以被簡(jiǎn)化為
(38)
接下來(lái)計(jì)算單次迭代過(guò)程中每個(gè)子模塊所需實(shí)數(shù)乘法的次數(shù)。算法1中,步驟2所需的實(shí)數(shù)乘法次數(shù)為16Mc;步驟3、步驟5、步驟8、步驟11為24Mc;步驟4為4(Mc+3NMc);步驟7為16M,步驟9、步驟10為4(Mc+3NMc+N)。de-EPA與傳統(tǒng)的集中式EP算法(EP algorithm, EPA)[17]的計(jì)算復(fù)雜度對(duì)比如表1所示。
表1 復(fù)雜度比較Table 1 Complexity comparison
從表1得知,分布式檢測(cè)方案可以極大地降低矩陣求逆的復(fù)雜度。對(duì)于多載波的大規(guī)模MIMO-OFDM系統(tǒng),檢測(cè)算法整體性能往往取決于矩陣求逆運(yùn)算的復(fù)雜度。
圖5是在Nr×Nt=32×4、SNR=0 dB和量化精度為3 bit的條件下,兩種分布式檢測(cè)方案(C=2、C=4)與集中式檢測(cè)方案(C=1)的均方誤差(mean square error, MSE)性能比較。仿真表明當(dāng)算法收斂后,與集中式檢測(cè)方案相比,C=2時(shí)多損失約1.5 dB,而C=4時(shí)多損失約2 dB。仿真表明分布式方案能夠維持良好的檢測(cè)性能。
圖5 分布式與集中式檢測(cè)方案性能比較Fig.5 Performance comparison between decentralized and centralized detection schemes
圖6是在Nr×Nt=32×4、SNR=0 dB和C=2條件下,分布式檢測(cè)方案的MSE性能與迭代次數(shù)T的關(guān)系,量化精度分別為1 bit、2 bit和3 bit。從圖5和圖6的仿真結(jié)果來(lái)看,算法在迭代次數(shù)達(dá)到7次左右收斂。在收斂時(shí),1 bit量化的MSE約為-14 dB,2 bit量化的MSE約為-18.3 dB,3 bit量化的MSE約為-21.8 dB。結(jié)果表明隨量化精度的提高,算法的檢測(cè)性能也顯著提升。
圖6 不同量化精度的MSE性能比較Fig.6 MSE performance comparison of different quantization accuracy
圖7是在Nr×Nt=64×8和T=10的條件下,分布式檢測(cè)方案(C=2、C=4)的BER性能與量化精度的關(guān)系。仿真表明,算法的檢測(cè)性能隨量化精度的提升而提升,且隨SNR的增加,3種量化方式之間的差距也在逐步增加。當(dāng)BER=10-3時(shí),3 bit量化與2 bit量化的SNR性能僅相差1.8 dB,而BER=10-5時(shí),二者之間的差距擴(kuò)大到4.2 dB。仿真表明,分布式算法的檢測(cè)性能在MIMO-OFDM系統(tǒng)中是可以接受的,同時(shí)也說(shuō)明了在MIMO-OFDM系統(tǒng)中使用低分辨率ADC是合理且可行的。
圖7 不同量化精度和子陣列數(shù)量下的性能比較Fig.7 Performance comparison under different quantization accuracy and number of subarrays
本文研究了基于EP算法的分布式信號(hào)檢測(cè)方案。該方案在維持檢測(cè)性能的同時(shí)降低了算法復(fù)雜度,尤其是矩陣求逆運(yùn)算的復(fù)雜度。當(dāng)天線數(shù)量增加時(shí),可以通過(guò)增加子陣列的數(shù)量來(lái)降低算法整體的復(fù)雜度,因此算法的適用場(chǎng)景可以不受天線數(shù)量的限制。同時(shí),量化精度的增加也能夠改善算法的檢測(cè)性能,3 bit的量化精度可以滿足大多數(shù)場(chǎng)景的使用,為降低大規(guī)模天線陣列系統(tǒng)的硬件成本提供了可行性。未來(lái)的研究方向是將算法擴(kuò)展到稀疏信號(hào)或稀疏信道矩陣的大規(guī)模系統(tǒng)。