暢田田, 王威, 高婧潔, 申曉紅, 姜蘇英, 謝景麗
(1.長安大學(xué) 信息工程學(xué)院, 陜西 西安 710064; 2.西北工業(yè)大學(xué) 航海學(xué)院, 陜西 西安 710072)
隨著定位技術(shù)應(yīng)用范圍的不斷擴大,新興應(yīng)用對定位的需求已不局限于單純的室外場景。 據(jù)調(diào)查數(shù)據(jù)顯示,人們在室內(nèi)的時間是室外的4倍,室內(nèi)定位的需求變得日益迫切。在室外場景中,目前常用的定位系統(tǒng)是全球?qū)Ш叫l(wèi)星系統(tǒng)(global navigation satellite system,GNSS),包括美國全球定位系統(tǒng)、俄羅斯格洛納斯、中國北斗導(dǎo)航系統(tǒng)、歐盟伽利略系統(tǒng)。民用GNSS設(shè)備的定位精度在幾米到幾十米,使用差分技術(shù)的情況下定位精度可以進(jìn)一步提高。但是衛(wèi)星定位系統(tǒng)的功率在室內(nèi)環(huán)境下會產(chǎn)生嚴(yán)重衰減,同時室內(nèi)定位還受到多徑效應(yīng)的影響,導(dǎo)致GNSS定位系統(tǒng)在室內(nèi)會產(chǎn)生較大的定位誤差,甚至不能實現(xiàn)定位。另外,室內(nèi)定位屬于短距離小范圍定位,定位精度要求較高,僅使用GNSS定位無法滿足定位精度要求。
目前,常見的室內(nèi)定位技術(shù)主要包括無線傳感器網(wǎng)絡(luò)、聲音、紅外線、藍(lán)牙和超寬帶[1]。其中,超寬帶具有能耗低、時間分辨率高、抗多徑等優(yōu)點,被認(rèn)為是實現(xiàn)高精度室內(nèi)定位的重要技術(shù)之一。然而,在實際情況下,超寬帶定位仍存在許多挑戰(zhàn)。這些挑戰(zhàn)包括信道衰落、低信噪比、多用戶干擾、多徑效應(yīng)和非視距(non-line-of-sight,NLOS)傳播[2]。 其中,NLOS傳播對室內(nèi)定位的影響最為重要。室內(nèi)環(huán)境下,信號的視距(line-of-sight,LOS)傳播經(jīng)常被障礙物遮擋,即無線發(fā)射機和接收機之間的直接路徑被阻塞,導(dǎo)致信號形成NLOS傳播。在這種情況下,信號傳輸只能通過散射、反射或衍射等路徑到達(dá)接收端,直接使用基于到達(dá)時間(time-of-arrival,TOA)[3]和接收信號強度(received signal strength indication,RSSI)[4]的測距算法會出現(xiàn)較大偏差,嚴(yán)重影響定位的性能。因此,NLOS誤差消除對提高室內(nèi)定位精度具有重要的實際意義。
在NLOS傳播條件下,NLOS識別和誤差消除是提高定位精度的有效方法。最簡單的方法是進(jìn)行NLOS識別后,放棄NLOS條件下的測量點,直接使用LOS條件下的測量點進(jìn)行測距。但該方法會導(dǎo)致有用信息的丟失。因此,NLOS識別后,需要進(jìn)行NLOS誤差消除,以提高定位精度。Xiao等[5]提出了一個融合了假設(shè)檢驗和對數(shù)正態(tài)傳播的模型來估計NLOS條件下的收發(fā)距離。然而NLOS條件下該模型會產(chǎn)生非常大的測距誤差。近年來,一些研究人員將機器學(xué)習(xí)算法引入到NLOS定位誤差的消除,機器學(xué)習(xí)算法具有優(yōu)越的性能。盡管現(xiàn)有許多機器學(xué)習(xí)算法,但文獻(xiàn)主要關(guān)注支持向量機(support vector machine,SVM)[6-8]或高斯過程回歸(Gaussian process regression,GPR)[9]。這些方法主要研究了NLOS條件下墻壁[10]、人體[11]等障礙物及不同輸入特征[12]對測距或定位的影響。上述文獻(xiàn)沒有對同一數(shù)據(jù)集上不同機器學(xué)習(xí)模型及神經(jīng)網(wǎng)絡(luò)模型的性能進(jìn)行比較,也沒有考慮不同帶寬和不同頻帶對NLOS定位誤差消除的影響。因此,本研究的主要目的是:①比較不同機器學(xué)習(xí)算法及神經(jīng)網(wǎng)絡(luò)模型的NLOS定位誤差消除方面的性能;②研究不同帶寬和不同頻帶對NLOS定位誤差消除的影響。
本文基于信道狀態(tài)信息(channel state information,CSI)提取出多種特征,建立最小二乘法支持向量機回歸(least square-support vector machine regression,LS-SVMR)、GPR與BP神經(jīng)網(wǎng)絡(luò)模型,并采用均方根誤差(root mean square error,RMSE)、平均絕對誤差(mean absolute error, MAE)和累積分布函數(shù)(cumulative distribution function,CDF) 3個分析指標(biāo)對不同帶寬、不同頻帶下的誤差消除性能進(jìn)行了對比與評價。實驗結(jié)果表明提取的CSI多特征作為輸入可以顯著提高誤差消除性能且GPR模型的距離估計誤差最小;隨著帶寬的增大,NLOS傳播引起的測距誤差不斷減小,因此可通過增大帶寬來有效改善輸入特征較少時的NLOS定位誤差;在多特征輸入下,低頻帶的NLOS測距精度小于高頻帶,因此將可用的頻帶結(jié)合可以比單頻帶更好地消除NLOS定位誤差。
在無線通信中,CSI提供了發(fā)射機和接收機之間通信鏈路的傳播信道特征屬性[13-14],具體包含每條傳輸路徑的幅值、相位衰落,時延等特征信息。CSI是信道頻率響應(yīng)(channel frequency response,CFR)的采樣值,其描述了頻域內(nèi)每個子載波的幅值和相位
H(fk)=‖H(fk)‖eisin(∠H(fk))
(1)
式中:fk是第k個子載波的頻率;H(fk)是頻率為f的子載波的CSI;‖H(fk)‖和∠H(fk)分別為其幅值和相位。
因此接收端的CSI信息可表示為H=[H(f1),H(f2),…,H(fk),…H(fn)]T。
通過快速傅里葉逆變換(inverse fast Fourier transform,IFFT)將CSI轉(zhuǎn)換為時域信道沖激響應(yīng)(channel impulse response,CIR),進(jìn)而利用信號處理方法可提取出無線信道的諸多特征。
CIR可表示為
(2)
式中:N代表多徑分量的總數(shù);ai,θi,τi分別表示第i條路徑的幅值、相位和時延;δ(τ)是狄克拉脈沖函數(shù)。
在進(jìn)行特征提取之前,需要對CIR中的噪聲進(jìn)行濾波處理,獲得CIR中的有效信息。從濾波后的CIR中可以提取用來減小NLOS測距誤差的5個關(guān)鍵特征:均值、均方根延遲擴展(root mean square delay spread,RMS-DS)、偏度(skewness)、峰度(kurtosis)和峰均比(peak-to-average ratio,PAR)。
1) 均值μ:將CIR的幅值取樣本平均值得到μ。
2) 均方根延遲擴展:RMS-DS是功率延遲分布的第二中心矩[15]。RMS-DS的計算公式為:
(3)
3) 偏度S:定義為樣本三階標(biāo)準(zhǔn)化矩,表達(dá)式為
(4)
式中:|h(τ)|表示CIR;μ|h|和σ|h|分別代表|h(τ)|的均值和標(biāo)準(zhǔn)差。
4) 峰度K:定義為CIR幅值的四階中心矩和二階中心矩的比值[7]。K可以表示為
(5)
5) 峰均比PAR: 定義為功率最大值與功率平均值的比,可以表示為
(6)
式中:RPA表示峰均比PAR;Pmax和Pmean分別表示功率的最大值和平均值。
為了將預(yù)測距離與真實距離進(jìn)行比較,首先在地面標(biāo)注出發(fā)射機和接收機的位置,然后利用TOPCON@全站經(jīng)緯儀測量收發(fā)機的真實坐標(biāo),從而獲得收發(fā)機之間的真實距離。一般情況下,NLOS傳播將導(dǎo)致無法獲得原始收發(fā)機之間的真實距離,故采用TOA算法進(jìn)行估計。估計距離取對數(shù)主要是因為距離和接收功率之間存在線性關(guān)系,模型的預(yù)測效果好。
對數(shù)估計距離:利用TOA算法可估計出發(fā)射機和接收機間的距離,最后將基于TOA估計的發(fā)射機和接收機之間的距離轉(zhuǎn)化為其對數(shù)值。
(7)
式中:dTOA表示利用TOA算法估計得到的收發(fā)機間的距離。
(8)
為了提高NLOS環(huán)境下的定位精度,在基于TOA的NLOS估計距離基礎(chǔ)上,綜合CSI中的多特征提取,分別引入LS-SVMR、GPR、BP神經(jīng)網(wǎng)絡(luò)對發(fā)射機和接收機間的距離進(jìn)行估計,實現(xiàn)NLOS環(huán)境下的誤差消除,提高定位精度。
SVM是一種監(jiān)督機器學(xué)習(xí)算法,可以用于回歸問題。LS-SVM是SVM的一種變體,它降低了SVM算法的復(fù)雜度[16]。在NLOS定位誤差消除中,輸出是發(fā)射機和接收機之間的距離d(d∈R),它依賴于輸入的特征向量x(x∈Rn)。
d(x)=wTφ(x)+w0
(9)
式中:φ(·)是一個映射函數(shù);w和w0是該回歸器的參數(shù),這些參數(shù)值是根據(jù)訓(xùn)練集確定的。
LS-SVM回歸通過求解下面的凸優(yōu)化問題得到
(10)
式中:c是平衡因子,用來控制訓(xùn)練誤差和模型復(fù)雜度[17];ek為松弛因子。(10)式可以通過引入拉格朗日乘子和卡魯什-庫恩-塔克條件進(jìn)行求解。最終,LS-SVM回歸的表達(dá)式為
(11)
式中:αk是拉格朗日乘子;k(x,xk)為核函數(shù),本文中選擇的核函數(shù)為徑向基函數(shù)。
(12)
式中:xk為核函數(shù)中心;σ為核函數(shù)的寬度參數(shù)。
高斯過程是指一組服從高斯分布的隨機變量集合,它的性質(zhì)完全由均值函數(shù)和協(xié)方差函數(shù)確定[18]。高斯過程回歸模型是將高斯過程用到了回歸問題,GPR模型如下
d(x)=wTφ(x)+n
(13)
根據(jù)回歸模型以及高斯過程的定義,可以得到訓(xùn)練集的輸出d和測試集的輸出d*的聯(lián)合先驗分布
(14)
式中:(x,d)和(x*,d*)分別表示訓(xùn)練集和測試集的輸入和輸出。對(14)式的聯(lián)合先驗分布取d*的邊緣分布可以得到d*最大概率的預(yù)測后驗分布
(15)
式中,估計距離d*的均值和協(xié)方差分別為:
GPR核函數(shù)選擇的是平方指數(shù)協(xié)方差函數(shù)
k(x,x*)=φ(x)T·φ(x*)=
(18)
BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差反向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)[20]。該算法的基本思想是利用梯度下降法,使真實值與網(wǎng)絡(luò)預(yù)測值誤差的均方差達(dá)到最小[21]。BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層組成,BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
圖1中,X1,X2,…,Xn和Y1,Y2,…,Ym分別代表網(wǎng)絡(luò)的輸入值和預(yù)測輸出值,wij表示輸入層和隱含層的權(quán)值矩陣,wjk表示隱含層和輸出層的權(quán)值矩陣。
在本節(jié)中,利用CSI中提取的多特征向量,結(jié)合基于TOA的NLOS距離估計,分別使用LS-SVMR、BP神經(jīng)網(wǎng)絡(luò)和GPR模型實現(xiàn)NLOS定位誤差的消除,完成真實環(huán)境下的實驗測量。根據(jù)實驗結(jié)果對LS-SVMR、BP神經(jīng)網(wǎng)絡(luò)和GPR不同帶寬、不同頻帶和輸入特征的NLOS誤差消除性能進(jìn)行比較和分析。
為了獲得LOS和NLOS場景下的信道傳播特征,在一個8 m×4 m的會議室開展了2.4~5.4 GHz頻段的信道測量活動,環(huán)境參數(shù)配置如表1所示。無線信道測量活動采用了P5008A型矢量網(wǎng)絡(luò)分析儀來測量多組收發(fā)機組合的信道傳遞函數(shù)。會議室內(nèi)設(shè)置了88個接收天線組成的網(wǎng)絡(luò),相鄰點間距0.5 m。此外,在測量活動中使用了5個發(fā)射天線,其中3個位于會議室內(nèi),屬于LOS環(huán)境,剩余2個位于會議室外的走廊,屬于NLOS環(huán)境。在測量過程中,發(fā)射和接收天線的高度均保持在1.15 m,發(fā)射和接收天線的位置由TOPCON@全站經(jīng)緯儀測量,可以根據(jù)位置測量得到發(fā)射機與接收機之間距離的真實值。圖2展示了室內(nèi)信道測量的環(huán)境。
圖2 信道測量環(huán)境
表1 信道測量參數(shù)
在測量過程中,收集了405個樣本,每個樣本由3 201個CSI頻率采樣點組成,其中,LOS傳播條件下共獲得264個樣本,剩余的141個樣本為NLOS傳播條件。NLOS條件下的樣本被劃分為訓(xùn)練集和測試集,其占總樣本的比例分別為70%和30%。
3.3.1 TOA測距誤差
圖3給出了LOS和NLOS條件下基于TOA距離估計誤差的CDF圖。由圖可知,LOS條件下,95%測量結(jié)果的測距誤差在0.2 m范圍內(nèi);NLOS條件下,僅20%測量點的測距誤差在0.2 m范圍內(nèi)。 因此,在LOS條件下,TOA測距可以獲得精確的位置信息,但在NLOS條件下,TOA算法會產(chǎn)生較大的測距誤差,降低無線定位的精度。NLOS條件下的測距誤差遠(yuǎn)遠(yuǎn)大于LOS條件是因為發(fā)射機和接收機之間的直視路徑被障礙物遮擋,導(dǎo)致無線電信號從發(fā)射機到達(dá)接收機的時延增大。因此,需要消除NLOS條件下的測距誤差來提高測距精度。
圖3 LOS和NLOS測距誤差的CDF
3.3.2 不同模型下的測距誤差
為了對不同模型下的NLOS定位誤差消除性能進(jìn)行比較,選取了RMSE、MAE和CDF 3個評估指標(biāo)。
1) RMSE:發(fā)射機與接收機間距離的真實值和估計值差值的平方與測量次數(shù)n比值的平方根[22]。RMSE的計算公式為
(19)
式中:di表示第i個收發(fā)機真實距離與估計距離的差值。
2) MAE:各次測距誤差絕對值取平均[23],MAE可以表示為
(20)
3) CDF:定位誤差在某個精度門限以下的概率[24]。
F(x)=P(di (21) 實驗分別針對LS-SVMR、BP神經(jīng)網(wǎng)絡(luò)、GPR模型以及基于對數(shù)距離路徑損耗的NLOS距離估計和基于TOA的NLOS距離估計進(jìn)行NLOS定位誤差消除性能比較。 各模型的絕對距離估計誤差如圖4所示。從圖中可看出,對數(shù)路徑損耗模型的距離估計誤差是最大的。LS-SVMR和BP神經(jīng)網(wǎng)絡(luò)模型的距離估計誤差小于TOA。GPR模型的距離估計誤差最小,因此該實驗環(huán)境下,不同模型的距離估計誤差精度不同,且基于GPR模型的誤差消除效果最好。 圖4 不同索引點的測距誤差 表2給出了不同模型的MAE和RMSE值,進(jìn)一步對不同模型的距離估計誤差進(jìn)行驗證。其中GPR模型可將距離估計的MAE減小到0.110 8 m,比TOA的距離估計的MAE減小0.146 6 m,誤差消除性能高達(dá)71.12%;分別比LS-SVMR和BP神經(jīng)網(wǎng)絡(luò)的MAE小0.087 5和0.043 8 m。同樣,GPR的RMSE也均小于對數(shù)距離路徑損耗模型、LS-SVMR和BP神經(jīng)網(wǎng)絡(luò),與TOA相比,誤差消除性能提高了81.36%。因此,GPR模型比LS-SVMR和BP神經(jīng)網(wǎng)絡(luò)有更小的MAE和RMSE值,即GPR模型定位誤差消除性能優(yōu)于LS-SVMR和BP神經(jīng)網(wǎng)絡(luò)模型。 表2 不同模型的測距誤差 不同模型距離估計誤差的CDF如圖5所示。從圖中可以發(fā)現(xiàn),在NLOS條件下,基于GPR模型98%的索引點測距誤差小于0.5 m。由于BP神經(jīng)網(wǎng)絡(luò)精度受訓(xùn)練數(shù)據(jù)量的影響較大,LS-SVMR模型由懲罰參數(shù)和核函數(shù)參數(shù)的選取決定,因此在相同實驗環(huán)境下,LS-SVMR和BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測中95%的索引點距離估計誤差在0.5 m范圍內(nèi),測距誤差偏大。TOA模型與對數(shù)路徑損耗模型下的估計誤差最大,其中TOA模型下僅有80%的索引點距離估計誤差在0.5 m范圍內(nèi)。因此,由實驗結(jié)果可得,對于相同的測試集,GPR模型的誤差消除性能優(yōu)于神經(jīng)網(wǎng)絡(luò),而且具有容易實現(xiàn)、超參數(shù)自適應(yīng)獲取和輸出具有概率意義等優(yōu)點。 圖5 不同模型距離估計誤差的CDF 3.3.3 不同輸入特征的測距誤差 表3 不同特征向量的測距誤差 3.3.4 不同帶寬下的測距誤差 為了評估不同帶寬對NLOS誤差消除的影響,利用不同模型對不同帶寬下發(fā)射機與接收機間的距離進(jìn)行估計。實驗共考慮五種不同的帶寬(包括20 MHz,100 MHz,500 MHz,1 GHz和3 GHz),由于對數(shù)路徑損耗模型下的估計誤差最大,實驗考慮4種不同模型(包括TOA,LS-SVMR,BP神經(jīng)網(wǎng)絡(luò)和GPR模型)。不同帶寬下,TOA,LS-SVMR,GPR和BP神模型的MAE和RMSE值如表4~7所示。通過對比可看出5種不同的帶寬下,TOA模型的測距誤差最大,而LS-SVMR,BP神經(jīng)網(wǎng)絡(luò)和GPR模型都可以用于消除TOA模型在NLOS條件下的測距誤差;隨著帶寬增大,TOA,LS-SVMR, GPR,BP神經(jīng)網(wǎng)絡(luò)模型的MAE和RMSE值減小,3 GHz帶寬下,4種模型的MAE和RMSE均達(dá)到最小值。此外,還可發(fā)現(xiàn)不同帶寬下GPR模型的測距誤差最小,誤差消除性能最好。 表4 TOA模型中不同帶寬的測距誤差 表5 LS-SVMR模型中不同帶寬的測距誤差 表6 GPR模型中不同帶寬的測距誤差 表7 BP模型中不同帶寬的測距誤差 不同帶寬測距誤差的CDF結(jié)果如圖6~9所示。從圖可知,隨著帶寬增加,TOA,LS-SVMR,BP神經(jīng)網(wǎng)絡(luò)和GPR模型的NLOS測距誤差均不斷減小。以圖8中 GPR模型不同帶寬距離估計誤差的CDF圖為例,當(dāng)帶寬從100 MHz增加至500 MHz時,測距誤差顯著減小,而當(dāng)帶寬從1 GHz增加至3 GHz時,NLOS條件下的測距誤差減小不顯著。因此,帶寬越大,測距誤差越小,然而,當(dāng)帶寬足夠大時,繼續(xù)增大帶寬不會顯著提高測距的精度。 圖6 TOA模型中不同帶寬 圖7 LS-SVMR模型中不同帶寬 圖8 GPR模型中不同帶寬 距離估計誤差的CDF 距離估計誤差的CDF 距離估計誤差的CDF 圖9 BP模型中不同帶寬距離估計誤差的CDF 圖10顯示了GPR模型在不同帶寬和不同輸入特征集下NLOS距離估計誤差的CDF。圖中紅色實線表示在帶寬為3 GHz,輸入向量為特征集C2(3個特征)時的NLOS誤差消除結(jié)果,藍(lán)色虛線表示在帶寬為500 MHz,輸入向量為特征集C4(4個特征)時的NLOS測距誤差,綠色虛線表示在帶寬為100 MHz,輸入向量為特征集C6(5個特征)時的NLOS誤差消除結(jié)果。從圖中可以發(fā)現(xiàn)大帶寬、輸入特征少時可以獲得比小帶寬、多輸入特征更好的NLOS誤差消除結(jié)果,即可通過增大帶寬來彌補輸入特征較少對NLOS誤差消除產(chǎn)生的不利影響。 圖10 GPR模型中不同帶寬和不同特征 集距離估計誤差的CDF 3.3.5 不同頻帶下的測距誤差 為了比較不同頻帶的性能,將3 GHz帶寬劃分為6個不同頻帶,即每個頻帶的帶寬為500 MHz。圖11給出了詳細(xì)的頻帶劃分圖,從圖中可看出,取出3個頻帶,各頻帶的MAE和RMSE值如表8所示,不同頻帶測距誤差的CDF如圖12所示。首先,由表8和圖11可以看出使用不同頻帶的測距誤差不同。其次,使用頻帶6的測距誤差最大,頻帶1的測距誤差最小。因為頻帶6的頻率高意味著測距信號的直徑分量被高概率阻塞。因此,多特征下低頻帶可以有效減小GPR模型在NLOS條件下的定位誤差。通過對表6和表8的比較可以得出另一個重要結(jié)論,所有可用的頻帶結(jié)合可以比單頻帶更好地消除NLOS定位誤差。 圖11 不同頻帶的劃分 表8 GPR模型中不同頻帶的測距誤差 圖12 不同頻帶距離估計誤差的CDF 圖13給出了GPR模型不同輸入特征集和不同頻帶下NLOS誤差消除的結(jié)果。從圖中可看出,頻帶1(低頻帶)在輸入向量為特征集C2時的測距誤差最小,特征集C2僅包含前3個特征。盡管頻帶6(高頻帶)的輸入特征包含了5個特征,但測距誤差是最大的。因此,在輸入特征少時,可以通過使用低頻帶來補償輸入特征較少帶來的NLOS測距誤差。另一方面,較高的輸入特征可能會導(dǎo)致不同特征間具有相關(guān)性,而且還會增加計算的復(fù)雜度,延長程序的運行時間。 圖13 不同頻帶和不同特征集距離估計誤差的CDF 本文以實際測量的典型室內(nèi)辦公環(huán)境中2.4~5.4 GHz頻段的信道CSI為原始數(shù)據(jù),建立了LS-SVMR、GPR和BP神經(jīng)網(wǎng)絡(luò)3種不同模型,并利用CSI提取出均值、RMS-DS、偏度、峰度、PAR結(jié)合基于TOA估計距離等特征進(jìn)行性能評估實驗。實驗評估了不同特征、不同帶寬和不同頻帶下的NLOS定位誤差消除結(jié)果,并進(jìn)行了性能比較。 從實驗結(jié)果可知:GPR模型表現(xiàn)出最好的NLOS定位誤差消除性能且將CSI特征與對數(shù)估計距離結(jié)合形成的特征輸入可以顯著消除NLOS條件下的定位誤差;隨著帶寬的增加,NLOS誤差消除性能逐漸優(yōu)化,即可通過增大帶寬有效地改善輸入特征較少時的NLOS定位誤差;多特征作為輸入時,低頻帶可以有效減小GPR模型在NLOS條件下的定位誤差,因此在輸入特征少時,可使用低頻帶來減小輸入特征較少帶來的NLOS測距誤差,且將所有可用的頻帶結(jié)合可以比單頻帶更好地消除NLOS定位誤差。4 結(jié) 論