文 璐 張琰祥 王 鵬 惠 鏸 姚俊良
(1.中鐵第一勘察設(shè)計(jì)院集團(tuán)有限公司,710043,西安; 2.西安理工大學(xué)自動(dòng)化與信息工程學(xué)院,710048,西安∥第一作者,高級工程師)
現(xiàn)有城市軌道交通列車運(yùn)行控制系統(tǒng)主要依賴于無線通信,而其通信環(huán)境中存在大量外部干擾信號,對列車運(yùn)行安全產(chǎn)生嚴(yán)重威脅。2012年11月乘客攜帶的便攜式Wi-Fi(無線保真)路由器產(chǎn)生了干擾,導(dǎo)致深圳地鐵2、5號線多次中斷運(yùn)行。對此,可利用無線通信設(shè)備的RFF(射頻指紋)對城市軌道交通環(huán)境中的無線發(fā)射設(shè)備進(jìn)行身份識(shí)別,進(jìn)而及時(shí)發(fā)現(xiàn)外部干擾源。這對保障城市軌道交通安全具有重要意義[1]。
RFF的概念由Hall等人首次提出[2],指由無線設(shè)備硬件差異所導(dǎo)致的射頻信號細(xì)微差異。隨后涌現(xiàn)出大量通過RFF對無線發(fā)射設(shè)備進(jìn)行身份識(shí)別的研究[3-5]。研究表明,有效提取能夠表征設(shè)備本質(zhì)特征的RFF對提高識(shí)別準(zhǔn)確率起到關(guān)鍵作用。VMD(變分模態(tài)分解)算法[6]可將信號自適應(yīng)地分解為不同中心頻率的窄帶分量,從而獲得設(shè)備的RFF特征。2019年文獻(xiàn)[4]首次將VMD算法應(yīng)用于RFF識(shí)別領(lǐng)域。之后文獻(xiàn)[5]探究了該算法在不同信噪比下識(shí)別準(zhǔn)確率的性能邊界。文獻(xiàn)[7]利用VMD算法提取信號時(shí)頻譜中的定向梯度直方圖作為RFF,其識(shí)別準(zhǔn)確率較文獻(xiàn)[4]的算法準(zhǔn)確率得到了進(jìn)一步提升。
根據(jù)上述研究,在IMF(本征模態(tài)函數(shù))個(gè)數(shù)K和懲罰因子α較為準(zhǔn)確的前提下,VMD算法具有良好的RFF提取能力。然而,如果K和α不準(zhǔn)確,則可能出現(xiàn)模態(tài)混疊現(xiàn)象和過分解等問題。對此,文獻(xiàn)[8]提出了S-VMD(連續(xù)變分模態(tài)分解)算法,采取逐次分解的方式尋找合適的K值;文獻(xiàn)[9]則以分解后各模態(tài)分量與原信號之間的相關(guān)系數(shù)為依據(jù)選定K值??傮w來說VMD算法中分解參數(shù)的選取尚處于探索階段,且現(xiàn)有研究主要集中于K值的選取,鮮有對α值的選取研究。
對此,本文提出了一種改進(jìn)的VMD算法——自適應(yīng)VMD算法。該算法利用分解后各模態(tài)之間的相關(guān)系數(shù)及各模態(tài)能量在信號總能量中的占比來判斷分解中是否出現(xiàn)了頻率混疊現(xiàn)象和過分解問題,并通過迭代方式選取合適的K和α,可有效提高設(shè)備的識(shí)別準(zhǔn)確率。
(1)
假設(shè)信號f(t)的幅值A(chǔ)=0.25 mV,其頻率fn分別為50 Hz、100 Hz、150 Hz、400 Hz等4個(gè)不同頻率,則當(dāng)信號受到了噪聲污染時(shí)有:
(2)
式中:
n0——加性高斯白噪聲。
在理想情況下,VMD算法能夠還原出原始的4個(gè)頻率分量,即K的理想值應(yīng)為4。本文基于此,分析K和α取值不同時(shí),cij及pi受到的影響。
1.1.1K小于理想值
設(shè)K=3、α=100,對f(t)進(jìn)行VMD算法分解,得到各本征模態(tài)函數(shù)的頻譜圖如圖1所示,cij和pi如表1所示。觀察圖1發(fā)現(xiàn),模態(tài)u1(t)與u2(t)在100 Hz左右出現(xiàn)了明顯的頻率混疊現(xiàn)象。進(jìn)一步觀察表1發(fā)現(xiàn),與之對應(yīng)的c21=0.064較高。這說明K值設(shè)置過小會(huì)造成模態(tài)混疊,且cij能較好地反映是否出現(xiàn)了模態(tài)混疊。因此,定義cmax=max(cij),i≠j;且cmax值應(yīng)小于某混疊門限τc。cmax≥τc說明出現(xiàn)了模態(tài)混疊現(xiàn)象,需要增大K值。
圖1 K=3、α=100時(shí)的本征模態(tài)函數(shù)頻譜圖
表1 K=3、α=100時(shí)的cij和pi
1.1.2K取理想值,α偏小
取K=4、α=100,得到本征模態(tài)函數(shù)頻譜圖如圖2所示,cij和pi如表2所示。觀察圖2發(fā)現(xiàn),模態(tài)1與模態(tài)2的混疊現(xiàn)象并沒有消失。表2中c21仍然較高,且圖2在300 Hz左右出現(xiàn)了實(shí)際信號中并不存在的頻率分量——偽模態(tài)u3(t),說明出現(xiàn)了過分解問題。相比于其他模態(tài),u3(t)的能量占比p3=0.126顯然偏小。結(jié)合K的理想取值為4進(jìn)一步分析可發(fā)現(xiàn):①K的設(shè)置合理但α的設(shè)置不合適,仍然無法獲得良好的分解結(jié)果;② 通過pi可以發(fā)現(xiàn)過分解問題。為防止過分解,定義pmin=min(pi)應(yīng)大于某占比門限τe,pmin≤τe說明出現(xiàn)了過分解。在本試驗(yàn)中,既出現(xiàn)了模態(tài)混疊又出現(xiàn)了過分解,不是因?yàn)镵設(shè)置不合適,而是需要增大α,在更小的尺度上進(jìn)行模態(tài)提取。
圖2 K=4、α=100時(shí)的本征模態(tài)函數(shù)頻譜圖
表2 K=4、α=100時(shí)的cij和pi
1.1.3K取理想值,α增大
取K=4、α=600,得到本征模態(tài)函數(shù)頻譜圖如圖3所示,cij和pi如表3所示。由圖3可見,模態(tài)混疊和過分解現(xiàn)象消失了,說明準(zhǔn)確分解出了信號的4個(gè)本征模態(tài)函數(shù)。由表3可見,此時(shí)各模態(tài)之間的相關(guān)系數(shù)普遍較低且各模態(tài)能量占比無明顯差別。由此可知,只要cmax<τc且pmin>τe,就可以認(rèn)為分解結(jié)果滿足要求。大量仿真試驗(yàn)還表明,α只要大于一定值就能滿足分解要求。本文限于篇幅未將仿真結(jié)果一一列出。
圖3 K=4、α=600時(shí)的本征模態(tài)函數(shù)頻譜圖
表3 K=4、α=600時(shí)的cij和pi
1.1.4K大于理想值
取K=5、α=600,得到本征模態(tài)函數(shù)頻譜圖如圖4所示,cij和pi見表4。觀察圖4可知,K值過大導(dǎo)致出現(xiàn)偽模態(tài)4。由表4可見,p4明顯偏小。由此判斷,當(dāng)pmin≤τe單獨(dú)出現(xiàn)時(shí)應(yīng)減小K。
圖4 K=5、α=600時(shí)的本征模態(tài)函數(shù)頻譜圖
表4 K=5、α=600時(shí)的cij和pi
結(jié)合K及α取值情況,自適應(yīng)VMD算法流程如圖5所示。對信號f(t)進(jìn)行K階VMD處理并求得cmax和pmin,以此判斷分解過程中是否出現(xiàn)了模態(tài)混疊或過分解現(xiàn)象,并以迭代方式不斷調(diào)整分解參數(shù),最終輸出合適的K和α。
注:Δ為α的遞增量。
采用自適應(yīng)VMD算法對式(2)中的f(t)進(jìn)行分解,得到K=4、α=600。分解前后信號的時(shí)域和頻譜波形如圖6所示。由圖6可見,重構(gòu)信號與原始信號的4個(gè)本征模態(tài)函數(shù)構(gòu)成一致,說明分解結(jié)果準(zhǔn)確可靠。與原信號相比,重構(gòu)信號不但信號特征,即RFF保留完整,且噪聲得到了一定程度的抑制,說明本文算法具有較強(qiáng)的RFF提取能力。
a) 原始信號時(shí)域波形
為進(jìn)一步驗(yàn)證自適應(yīng)VMD算法對實(shí)際設(shè)備的識(shí)別性能,本文對WiSig數(shù)據(jù)集[10]中來自20臺(tái)不同Wi-Fi設(shè)備的信號進(jìn)行識(shí)別。每臺(tái)設(shè)備取200幀,每幀取前256位,將數(shù)據(jù)集劃分為70%的訓(xùn)練集、10%的驗(yàn)證集和20%的測試集。構(gòu)建LSTM(長短期記憶網(wǎng)絡(luò))對設(shè)備進(jìn)行分類識(shí)別。LSTM由LSTM層、全連接層和輸出層組成。其中:LSTM層有256個(gè)神經(jīng)元;全連接層采用Leaky ReLU函數(shù)作為激勵(lì)函數(shù),并采用Softmax進(jìn)行分類。選用Adam優(yōu)化器,批量大小為64,初始學(xué)習(xí)率為0.001,輪次設(shè)置為400。試驗(yàn)使用Matlab R2020b軟件,CPU(中央處理器)為Intel酷睿i7-11800H,GPU(圖形處理器)為NVIDIA GeForce RTX 3060。
為驗(yàn)證識(shí)別準(zhǔn)確性,本文應(yīng)用自適應(yīng)VMD算法進(jìn)行信號分解識(shí)別,并同原始VMD算法及S-VMD算法識(shí)別結(jié)果進(jìn)行比較。其中,自適應(yīng)VMD算法和S-VMD算法的分解參數(shù)由算法自動(dòng)求取,原始VMD算法的分解參數(shù)分別為K=9、α=900和K=3、α=300。識(shí)別準(zhǔn)確率曲線如圖7所示。
圖7 識(shí)別準(zhǔn)確率曲線
由圖7可見,與S-VMD算法及原始VMD算法相比,自適應(yīng)VMD算法的識(shí)別準(zhǔn)確率明顯最高,特別是在信噪比較低時(shí),自適應(yīng)VMD算法的識(shí)別準(zhǔn)確率仍表現(xiàn)較好;在不同分解參數(shù)下,原始VMD算法的識(shí)別準(zhǔn)確率差別較大,說明分解參數(shù)的選擇對原始VMD算法的分解結(jié)果及識(shí)別準(zhǔn)確率有很大的影響。對于原始VMD算法,其參數(shù)固定,很難根據(jù)不同設(shè)備的特性來靈活調(diào)整K和α。自適應(yīng)VMD算法可按不同設(shè)備特性來自適應(yīng)選取不同的分解參數(shù),故具有較強(qiáng)的適應(yīng)性和較高的識(shí)別準(zhǔn)確率。
當(dāng)信噪比為10 dB時(shí),采用自適應(yīng)VMD算法與S-VMD算法得到的分類混淆矩陣如圖8所示。
a) 自適應(yīng)VMD分類混淆矩陣
由圖8可以看出,在噪聲影響下,S-VMD算法對設(shè)備的誤識(shí)別率較高,自適應(yīng)VMD算法對設(shè)備的誤識(shí)別率較低,說明其受噪聲影響程度較輕。由此可見,自適應(yīng)VMD算法提取的RFF更能反映設(shè)備本身的特性。
本文提出自適應(yīng)VMD算法提取無線發(fā)射設(shè)備的RFF,對城市軌道交通無線通信環(huán)境中的發(fā)射設(shè)備進(jìn)行識(shí)別。算法利用不同模態(tài)之間的相關(guān)系數(shù)判斷分解過程是否出現(xiàn)了模態(tài)混疊現(xiàn)象,利用各模態(tài)與原信號的能量占比判斷是否出現(xiàn)了過分解,并通過迭代方式確定合適的模態(tài)分解數(shù)和懲罰因子。該算法可針對不同設(shè)備自適應(yīng)獲取合適的分解參數(shù),有效避免了模態(tài)混疊及過分解問題對RFF提取的影響,具有良好的自適應(yīng)性和噪聲魯棒性,可有效提高設(shè)備的識(shí)別準(zhǔn)確率。