摘? 要:傳統(tǒng)基于指紋庫構(gòu)建的無線地圖沒有考慮室內(nèi)環(huán)境中指紋會隨著接收信號強(qiáng)度的變化而變化這一因素,所以系統(tǒng)魯棒性較差。為了解決這一問題,提出了一種基于特征遷移的室內(nèi)定位算法,采用最小化最大均值差異算法來減小離線與在線兩個階段所收集數(shù)據(jù)的分布差異。通過多次應(yīng)用算法的實(shí)驗(yàn)研究,結(jié)果表明,在復(fù)雜多變的室內(nèi)環(huán)境中定位準(zhǔn)確率得到大幅提升,有效地克服了兩個階段指紋特征分布差異帶來的影響。
關(guān)鍵詞:室內(nèi)定位;特征遷移;最大均值差異
中圖分類號:TN92 ? ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2021)02-0044-05
Abstract:The traditional wireless map constructed based on fingerprint database does not consider that fingerprint in the indoor environment will change with the change of the received signal strength,so the system has poor robustness. In order to solve this problem,an indoor positioning algorithm based on characteristics migration is proposed,using minimization the maximum mean discrepancy algorithm to reduce the distribution difference of the collected data between the offline and online stages. By means of several times of experimental study on application of algorithm,the experimental results show that the positioning accuracy in the complex indoor environments has greatly improved,and it effectively overcomes the influence of the distribution difference on fingerprint characteristics between the two stages.
Keywords:indoor positioning;characteristics migration;maximum mean discrepancy
0? 引? 言
基于指紋的室內(nèi)定位一般包含兩個階段:離線階段和在線階段[1]。在離線階段,將定位區(qū)域劃分為具有已知標(biāo)簽的小區(qū)域,各個接收點(diǎn)(Receiving Point,RP)在各個采集區(qū)內(nèi)的固定位置收集接收信號強(qiáng)度(Received Signal Strength,RSS)值以構(gòu)建指紋數(shù)據(jù)庫。在在線階段,一旦收集到一條待定位的RSS樣本,系統(tǒng)則通過匹配算法從指紋數(shù)據(jù)庫中找到與待定位樣本最相似的點(diǎn)進(jìn)行位置估計。很多科研團(tuán)隊已經(jīng)陸續(xù)將很多不同算法運(yùn)用到室內(nèi)定位領(lǐng)域,文獻(xiàn)[2,3]采用了K近鄰法(K Nearest Neighbor,KNN)和加權(quán)K近鄰法(Weighted K Nearest Neighbor,WKNN),但是這兩種算法只對距離敏感,對所收集數(shù)據(jù)中其他有用信息的運(yùn)用較少,所以很難提升室內(nèi)定位的精度;文獻(xiàn)[4]運(yùn)用了支持向量機(jī)(Support Vector Machine,SVM),由于室內(nèi)定位是多分類的問題,SVM是一個二分類器,所以當(dāng)數(shù)據(jù)較多時,訓(xùn)練起來比較耗時;為應(yīng)對室內(nèi)接入點(diǎn)(Access Point,AP)的不斷增多,文獻(xiàn)[5]采用了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN),因?yàn)镃NN可有效處理高維數(shù)據(jù),且對特征有更好的學(xué)習(xí)能力。雖然這些室內(nèi)定位算法在定位性能上表現(xiàn)優(yōu)異,但都是建立在默認(rèn)離線收集的指紋和在線測試的指紋遵循相同的分布規(guī)律這一前提下。然而,在實(shí)際的定位中,RSS指紋的分布會隨著周圍環(huán)境的變化而發(fā)生偏移,這往往會導(dǎo)致定位性能下降[6],重新收集數(shù)據(jù)訓(xùn)練模型又耗時耗力,縮小離線階段與在線階段RSS指紋分布差異是提升系統(tǒng)性能的關(guān)鍵,事實(shí)證明,遷移學(xué)習(xí)是該問題的有效解決方案[7,8]。
為解決這個問題,本文提出了基于特征遷移的室內(nèi)定位算法,在離線階段,通過大量的源域帶標(biāo)簽和少量目標(biāo)域帶標(biāo)簽的指紋構(gòu)造最優(yōu)遷移矩陣,以最小化最大均值差異并利用遷移后的源域RSS指紋對分類器進(jìn)行訓(xùn)練;在在線階段,對遷移后的目標(biāo)域RSS指紋進(jìn)行預(yù)測。實(shí)驗(yàn)結(jié)果表明該算法使系統(tǒng)魯棒性在一定程度上得到增強(qiáng)。
1? 室內(nèi)定位影響因素分析
1.1? RSS的波動性
由于受非視距傳播、多徑效應(yīng)和陰影效應(yīng)的影響[9-11],RSS值在復(fù)雜的室內(nèi)環(huán)境中并非是一成不變的。為驗(yàn)證RSS的波動性,本小節(jié)采用同一智能手機(jī)在固定位置進(jìn)行測試,實(shí)驗(yàn)所用設(shè)備為MEIZU,所用系統(tǒng)為Android 5.0,用該手機(jī)收集兩個AP的RSSI值在半個小時內(nèi)的變化情況,其結(jié)果如圖1所示??梢钥闯觯谠撉闆r下兩個AP的RSS值分別在某一固定值附近上下波動,較為穩(wěn)定,可以在短期定位中獲得滿意的結(jié)果,但是在實(shí)際定位中,定位時長遠(yuǎn)遠(yuǎn)不止半個小時,如圖2所示,反映了之后15天所采集的RSS變化盒圖。RSS的樣本分布每一天都有較大的不同。所以傳統(tǒng)基于指紋定位方法的魯棒性較差,需要及時更新訓(xùn)練模型。
1.2? 接入點(diǎn)的不穩(wěn)定性
本小節(jié)利用文獻(xiàn)[12]提供的公共數(shù)據(jù)集UJI-DB進(jìn)行相關(guān)的測試和仿真。圖3給出了每個月份檢測到的所有AP,其中黑色圓點(diǎn)表示該AP被檢測到。AP的出現(xiàn)和消失并沒有呈現(xiàn)出明顯的規(guī)律,例如前100個AP出現(xiàn)頻率很高,中間部分的AP則呈現(xiàn)出間斷性消失的現(xiàn)象,還有部分AP在前幾個月并沒有出現(xiàn),但是在后續(xù)的月份卻被頻繁地檢測到。表1展示了第一個月采集到的訓(xùn)練數(shù)據(jù)的AP數(shù)量統(tǒng)計信息,第一月僅過了20天,新增和消失的AP數(shù)量就已經(jīng)十分可觀。隨著時間的推移,在后續(xù)月份的在線定位過程中,第一月采集的訓(xùn)練指紋庫有效性會降低。
2? 基于特征遷移的室內(nèi)定位系統(tǒng)
2.1? 源域與目標(biāo)域
從上文可知,由于RSS的波動性和AP的不穩(wěn)定性,源域和目標(biāo)域中同一地點(diǎn)所得到的RSS特征分布并不一致,從而導(dǎo)致定位系統(tǒng)魯棒性較差,因此選擇一種合適的度量方法來減小兩域之間RSS特征分布的差異,這也是提高定位系統(tǒng)精確度和魯棒性的關(guān)鍵。在WiFi指紋定位中,采集到所有RSS值RSSI={,…,,…,,…,,…,}。i為第i個定位RP,i=1,2,…,N,N為RP總個數(shù),k為采集的第k條指紋,k=1,2,…,K,K為指紋樣本總數(shù),其中帶標(biāo)簽的指紋數(shù)量為L,j為第j個AP,j=1,2,…,M,M為在環(huán)境中可測AP總個數(shù)。將每條指紋樣本表示為xk={,…,},則可將RSS指紋庫表示為X={x1,…,xL}。假設(shè)第z個區(qū)域的采集點(diǎn)采集到了第k條測量指紋,則在該條指紋上貼標(biāo)簽yk=z,其中z=1,2,…,Z,Z為定位區(qū)域的總個數(shù)。通過該方式獲得了標(biāo)簽集Y={y1,…,yL}。我們將離線階段收集的RSS指紋庫和標(biāo)簽集作為源域 ,相反,將在線定位階段收集的RSS指紋庫作為目標(biāo)域DT,在線階段數(shù)據(jù)一般不包含標(biāo)簽集,即。Ls和LT分別為源域和目標(biāo)域的指紋樣本總數(shù)。
2.2? 最小化最大均值差異算法
本文采用最大均值差異(Maximum Mean Discrepancy,MMD)算法[13,14],假設(shè)源域和目標(biāo)域的RSS數(shù)據(jù)的邊緣分布為P(Xs)和P(XT),當(dāng)P(Xs)=P(XT)時,兩個分布的條件概率Q(Ys|Xs)=(YS|XT)?;诖藯l件,當(dāng)P(Xs)≠
P(XT)時,MMD可以表示為:
表示將源域與目標(biāo)域數(shù)據(jù)映射到再生核希爾伯特空間(Reproducing Kernel Hilbert Space,RKHS),再通過計算RKHS中映射過來的兩域數(shù)據(jù)距離均值來判斷兩域之間的差異。Φ(·)為將兩域RSS數(shù)據(jù)映射到RKHS的映射函數(shù)。由式(1)可知,MMD的關(guān)鍵在于找到一個合適的Φ(·)作為映射函數(shù)。但是這個映射函數(shù)隨著任務(wù)的不同而不同,難以直接求出。將式(1)展開:
結(jié)合支持向量機(jī)(SVM)中的核函數(shù)k(·),不需要顯式的表達(dá)Φ(·),所以MMD又可以表示為:
為使式(3)取值最小化,可將其表示為:
其中,tr代表矩陣求秩運(yùn)算,Gram矩陣K∈?(Ls+Lt)×(Ls+Lt),需要注意的是KST=(KTS)′,核函數(shù)k(·)采用的是高斯核k(x,y)=,帶寬γ為源域與目標(biāo)域成對距離的平均值,,將K分解為 ,令,,v≤NM,w為本文所求的特征遷移矩陣,為中間變換矩陣,v為RSS指紋映射到RKHS之后的維度,所以式(4)可寫作:
其中,tr(wTw)為正則項(xiàng),加入的原因是考慮到實(shí)際環(huán)境里RSS長時間分布不穩(wěn)定,其方差往往大于噪聲方差,希望減小MMD算法保留較多的噪聲成分帶來的影響。C為中心矩陣,E為單位矩陣。
2.3? 矩陣優(yōu)化
為了讓式(5)取得最小值,需要得到最優(yōu)遷移矩陣w,因此,由拉格朗日乘數(shù)法可得:
其中,λ為參數(shù)對角矩陣,對式(6)關(guān)于w求偏導(dǎo),并令其等于0,則有:
左右兩邊同乘wT:
由式(8)可知,(KMK+αE)-1KCK的v個最小非零廣義特征值對應(yīng)的特征向量構(gòu)成的最優(yōu)遷移矩陣W即為所求,通過該遷移矩陣可以使源域和目標(biāo)域分布差異縮小,使其在在線定位階段獲得更可靠的定位結(jié)果。
3? 實(shí)驗(yàn)結(jié)果與分析
3.1? 實(shí)驗(yàn)數(shù)據(jù)集
本文利用2.2節(jié)提及的UJI-DB數(shù)據(jù)集進(jìn)行相關(guān)測試和仿真。該數(shù)據(jù)集在西班牙Jaume I大學(xué)圖書館樓的兩層(第3層和第5層)收集了長達(dá)25個月的RSS值,在這段測量時間內(nèi)總共檢測到620個AP,因此十分適合用于RSS時變特性的研究。整個實(shí)驗(yàn)區(qū)域占地308.4 m2,分為48個網(wǎng)格點(diǎn)(每層24個),定位實(shí)驗(yàn)中將該區(qū)域劃分成18個子區(qū)域(每層9個),采集區(qū)域、參考格點(diǎn)和子區(qū)域設(shè)置如圖4所示。數(shù)據(jù)采集人員在第一個月采集了15組訓(xùn)練數(shù)據(jù)集和5組測試數(shù)據(jù)集,并在接下來的24個月采集了一定數(shù)量的補(bǔ)充訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。
3.2? 結(jié)果與分析
圖5(a)、圖5(b)、圖5(c)分別表示KNN、SVM、CNN在使用MMD算法和不使用MMD算法情況下每個月的定位準(zhǔn)確率,可以看出,文中提出基于特征遷移的定位算法的方法使三種算法的準(zhǔn)確率均得到提升,可以有效地減少源域與目標(biāo)域分布不同帶來的不良影響,使系統(tǒng)在較長時間的定位中依然可以做出較為精準(zhǔn)的預(yù)測。
表2展示了使用MMD后三種算法25個月的平均準(zhǔn)確率,可以發(fā)現(xiàn)對KNN算法的提升較為明顯,因?yàn)樵撍惴ㄔ陬A(yù)測過程中對距離較為敏感,傳統(tǒng)的長時間定位下離線階段的指紋庫和在線收集到的樣本分布不一致,使KNN無法得到令人滿意的結(jié)果。
4? 結(jié)? 論
為解決離線階段和在線階段RSS指紋分布不一致的問題,本文提出了一種基于特征遷移的方法,通過尋找一個最優(yōu)遷移矩陣將兩個階段RSS指紋分布映射到同一空間,使兩個階段的特征差異具有最小MMD,總之,所提出的方法在一定程度上抵制了環(huán)境變化對定位準(zhǔn)確性帶來的影響,并增強(qiáng)了系統(tǒng)的魯棒性。同時定位設(shè)備的差異和核函數(shù)選擇方式也會影響到定位系統(tǒng)的性能,這將作為后續(xù)研究的方向。
參考文獻(xiàn):
[1] 張明華.基于WLAN的室內(nèi)定位技術(shù)研究 [D].上海:上海交通大學(xué),2009.
[2] ADEGE A B,YAYEH Y,BERIE G,et al. Indoor localization using K-nearest neighbor and artificial neural network back propagation algorithms [C]//2018 27th Wireless and Optical Communication Conference (WOCC).Hualien:IEEE,2018:1-2.
[3] YEN L,YAN C H,RENU S,et al. A modified WKNN indoor Wi-Fi localization method with differential coordinates [C]//2017 International Conference on Applied System Innovation (ICASI).Sapporo:IEEE,2017:1822-1824.
[4] CHRIKI A,TOUATI H,SNOUSSI H. SVM-based indoor localization in Wireless Sensor Networks [C]//2017 13th International Wireless Communications and Mobile Computing Conference (IWCMC).Valencia:IEEE,2017:1144-1149.
[5] IBRAHIM M,TORKI M,ELNAINAY M. CNN based Indoor Localization using RSS Time-Series [C]//2018 IEEE Symposium on Computers and Communications (ISCC).Natal:IEEE,2018:1044-1049.
[6] LIU Z Y,DAI B,WAN X,et al. Hybrid Wireless Fingerprint Indoor Localization Method Based on a Convolutional Neural Network [J].Sensors,2019(20):4597.
[7] 莊福振,羅平,何清,等.遷移學(xué)習(xí)研究進(jìn)展 [J].軟件學(xué)報,2015,26(1):26-39.
[8] DAY O,KHOSHGOFTAAR T M. A survey on heterogeneous transfer learning [J].Journal of Big Data,2017,4(1):29.
[9] 高威,王可東.基于WiFi的RSSI指紋定位方法 [C]//第十一屆中國衛(wèi)星導(dǎo)航年會.成都:中國衛(wèi)星導(dǎo)航系統(tǒng)管理辦公室學(xué)術(shù)交流中心,2020:5.
[10] 張明華,張申生,曹健.無線局域網(wǎng)中基于信號強(qiáng)度的室內(nèi)定位 [J].計算機(jī)科學(xué),2007(6):68-71+75.
[11] 甘露,楊君,郭婭婷.基于室內(nèi)指紋定位的優(yōu)化算法 [J].數(shù)據(jù)采集與處理,2020,35(5):903-909.
[12] MENDOZA-SILVA G R,RICHTER P,JOAQU?N T,et al. Long-Term WiFi Fingerprinting Dataset for Research on Robust Indoor Positioning [J].Data,2018,3(1):3.
[13] SMOLA A,GRETTON A,SONG L,et al. A Hilbert Space Embedding for Distributions [C]//10th International Conference Discovery Science.Sendai:Springer,2007:40-41.
[14] GRETTON A,BORGWARDT K M,RASCH M, et al.A Kernel Two-Sample Test [J].Journal of Machine Learning Research,2012,13(25),723-773.
作者簡介:萬祥(1996—),男,漢族,湖南岳陽人,碩士在讀,研究方向:室內(nèi)定位。