王兆霖 漆亞江 王月 沈玉 王睿
摘要:現(xiàn)代通信手段中衛(wèi)星通信憑借其覆蓋范圍廣、通信質(zhì)量高、網(wǎng)絡(luò)建設(shè)速度快等優(yōu)點(diǎn)在戰(zhàn)場(chǎng)環(huán)境中有著舉足輕重的戰(zhàn)略地位,但是由于其通信信道裸露的特點(diǎn),也易于被攻擊、干擾或入侵,尤其是非法站點(diǎn)偽裝成合法通信方進(jìn)行非法接入,對(duì)軍事通信安全和信息保密有著致命威脅,從物理層識(shí)別接入設(shè)備特征是解決此安全問(wèn)題的一個(gè)有效途徑。自編碼器作為一種無(wú)監(jiān)督神經(jīng)網(wǎng)絡(luò),能有效地進(jìn)行特征提取,并通過(guò)閾值設(shè)置,區(qū)分正常和異常信號(hào)。針對(duì)DVB-S2協(xié)議物理幀起始標(biāo)志字(Start of Frame,SOF)內(nèi)容固定、調(diào)制方式固定等特點(diǎn),提出了利用自編碼器對(duì)重復(fù)的SOF段功率譜進(jìn)行無(wú)監(jiān)督學(xué)習(xí),設(shè)計(jì)了基于SOF功率譜的卷積自編碼網(wǎng)絡(luò),并對(duì)比了不同采樣點(diǎn)數(shù)和信噪比下檢測(cè)的正確率。
關(guān)鍵詞:衛(wèi)星通信;卷積自編碼;特征提取;異常檢測(cè)
中圖分類號(hào):TN927文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2023)01-64-6
隨著通信系統(tǒng)的不斷發(fā)展,衛(wèi)星通信頻帶寬、傳輸容量大、架設(shè)環(huán)境要求寬松等特點(diǎn)成為戰(zhàn)時(shí)必要的通信手段之一,但是與眾多無(wú)線通信一樣,用戶假冒身份、設(shè)備克隆等問(wèn)題亟待解決。傳統(tǒng)的安全認(rèn)證機(jī)制大都采取后端密碼學(xué)設(shè)備,這種機(jī)制并不完美,存在秘鑰泄露和協(xié)議漏洞的風(fēng)險(xiǎn)。
為解決此問(wèn)題,基于物理層的入侵檢測(cè)變得尤為重要。由于設(shè)備電子元件的差異,各種細(xì)微的畸變使得發(fā)出的電磁波包含獨(dú)特的特征,這種特征稱為射頻指紋(Radio Frequency Fingerprinting,RFF)[1]。本文基于這一特性,設(shè)計(jì)了對(duì)接收信號(hào)進(jìn)行處理、提取出RFF特征并進(jìn)行異常檢測(cè)的方法,實(shí)現(xiàn)對(duì)非法衛(wèi)星信號(hào)的有效識(shí)別,對(duì)衛(wèi)星通信系統(tǒng)防入侵具有重要意義。
現(xiàn)今,大多文獻(xiàn)的重點(diǎn)研究?jī)?nèi)容為個(gè)體識(shí)別,即一種有監(jiān)督的分類學(xué)習(xí)。通常,分類樣本是有限的,但通信異常檢測(cè)[2-4]的任務(wù)樣本通常不能窮舉,是一種無(wú)監(jiān)督的分類,本文將功率譜作為待識(shí)別樣本,利用卷積自編碼器(參考)對(duì)樣本進(jìn)行識(shí)別。
本文首先分析了畸變信號(hào),然后對(duì)信號(hào)進(jìn)行功率譜估計(jì),最后利用卷積自編碼網(wǎng)絡(luò)對(duì)畸變信號(hào)進(jìn)行異常檢測(cè)。
衛(wèi)星通信的射頻指紋僅由設(shè)備的自身硬件差異所決定,即使是同一設(shè)備制造商生產(chǎn)的同一型號(hào)的設(shè)備,也會(huì)存在一些因元器件容差而產(chǎn)生的不同畸變。通過(guò)對(duì)接收信號(hào)的分析,可以提取出衛(wèi)星通信設(shè)備獨(dú)一無(wú)二的RFF特征。因此利用該特性,就可以為有效識(shí)別合法和非法設(shè)備,防止非法用戶進(jìn)行設(shè)備仿冒,實(shí)施下一步破壞活動(dòng)提供數(shù)據(jù)支持。
在基帶信號(hào)通過(guò)各種設(shè)備直至發(fā)射的整個(gè)過(guò)程中,每個(gè)中間設(shè)備的元器件容差都會(huì)對(duì)信號(hào)造成相應(yīng)的變化。圖1展示了一種數(shù)字基帶信號(hào)的發(fā)射過(guò)程,發(fā)射信號(hào)通過(guò)I/Q調(diào)制器、濾波器、功放、振蕩器等電路完成畸變,RFF就來(lái)源于這些畸變[5]。
現(xiàn)階段,國(guó)內(nèi)使用的多數(shù)衛(wèi)星通信調(diào)制解調(diào)器是基于DVB-S2標(biāo)準(zhǔn)設(shè)計(jì)的。依據(jù)DVB-S2標(biāo)準(zhǔn)[6],系統(tǒng)在信號(hào)傳輸時(shí)會(huì)形成3幀,首先是基帶幀,然后是糾錯(cuò)幀,最后是物理幀。本文主要研究對(duì)象是物理幀的幀頭部分(前同步碼)的SOF段,圖2是DVB-S2物理幀格式。其中XFECFRAM為映射后的基帶信號(hào),物理成幀時(shí),將XFECFRAM每90個(gè)符號(hào)分一組,組成一個(gè)SLOT,然后每16個(gè)SLOT中間插入一個(gè)未經(jīng)調(diào)制的導(dǎo)頻部分,最后加入幀頭PLHEADER,即為物理幀前導(dǎo)碼部分。該部分又由兩部分組成:
①SOF(26符號(hào)),定義幀的開(kāi)始;
②PLSCODE(64符號(hào)),定義XFECFRAME部分的調(diào)制方式,長(zhǎng)度等信息。
前導(dǎo)碼部分固定使用π/2 BPSK進(jìn)行調(diào)制,其中SOF部分為固定不變序列,18D2E82HEX(01-1000-…-0010),其不受發(fā)射端調(diào)制方式、編碼方式等參數(shù)的改變而改變,利用信號(hào)的前同步碼SOF部分作為網(wǎng)絡(luò)輸入能夠有效避免信號(hào)負(fù)載對(duì)RFF識(shí)別結(jié)果帶來(lái)的不利影響,因此SOF段數(shù)據(jù)可以選做RFF特征進(jìn)行異常檢測(cè)的使用。
2.1自編碼網(wǎng)絡(luò)
自編碼器[7]是無(wú)監(jiān)督神經(jīng)網(wǎng)絡(luò)的一種,利用高維特征向量對(duì)自己進(jìn)行編碼,輸出入與輸出均為無(wú)標(biāo)簽的樣本。本質(zhì)上,自編碼器是接收輸入樣本,將其轉(zhuǎn)換成高維特征向量(隱含層)。然后再利用隱含層的信息重構(gòu)出輸入樣本,最終目的是希望輸入、輸出保持一致。自編碼器包含兩部分:編碼器和解碼器。解碼器的輸出嘗試復(fù)制編碼器的輸入。
2.2基于卷積自編碼器的異常檢測(cè)方法
卷積自編碼器將輸入樣本“映射”到低維空間,通過(guò)對(duì)其進(jìn)行重建來(lái)學(xué)習(xí)樣本的數(shù)據(jù)規(guī)律和內(nèi)在通用特性,而異常樣本由于與正常樣本存在的內(nèi)在特性差異較大,因此重建誤差較大??梢曰谏鲜隼碚撛O(shè)計(jì)基于卷積自編碼器的異常檢測(cè)方法,基本流程如圖3所示。
訓(xùn)練時(shí),首先對(duì)輸入信號(hào)樣本進(jìn)行歸一化,然后通過(guò)編碼器進(jìn)行特征提取得到信號(hào)的低維特征表示,接著解碼器將低維特征表示進(jìn)行重建,得到重建樣本,通過(guò)降低重建樣本和原有樣本之間的誤差來(lái)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
測(cè)試時(shí),將待測(cè)樣本集輸入至如圖3所示的結(jié)構(gòu)中得到待測(cè)樣本的重建誤差,根據(jù)重建誤差的大小來(lái)判斷該樣本是否異常樣本,如果重建誤差明顯大于訓(xùn)練集的重建誤差,那么該樣本有很大概率為異常樣本。
由此可以將功率譜數(shù)據(jù)當(dāng)做單通道進(jìn)行輸入,形成基于SOF功率譜數(shù)據(jù)的自編碼異常檢測(cè)方法,其流程如圖4所示。
在功率譜估計(jì)過(guò)程中有很多種評(píng)價(jià)功率譜估計(jì)好壞的標(biāo)準(zhǔn)[8],但是由于大部分入侵行為都是在正常通信的環(huán)境中進(jìn)行的,即雙方正在通信,非法方通過(guò)功率壓制強(qiáng)行接入,此時(shí)非法方的信噪比不會(huì)很高,要進(jìn)行異常檢測(cè),需要尋求一種對(duì)噪聲不敏感且分辨率較高的功率譜估計(jì)方法。頻譜分辨率是功率譜上相鄰兩頻點(diǎn)的最小區(qū)分量級(jí),類似于頻譜儀上的帶寬分辨率(Resolution Bandwidth,RBW),分辨率越高,顯示的頻率成分越精細(xì),能觀察到的頻率成分越清晰。頻譜的方差大小反映的是頻譜波動(dòng)性的大小,方差過(guò)大時(shí),頻譜的細(xì)節(jié)就不容易表現(xiàn)出來(lái)。導(dǎo)致不易被觀察或捕獲到。在異常檢測(cè)時(shí),往往是一些細(xì)微差別決定了檢測(cè)結(jié)果,因此選擇一個(gè)正確的功率譜估計(jì)方法非常重要。
此方法應(yīng)用窗函數(shù)對(duì)周期圖進(jìn)行了平滑處理,同時(shí)為了避免分段帶來(lái)的頻譜分辨率降低,Welch法將每段數(shù)據(jù)與前一段數(shù)據(jù)進(jìn)行一定長(zhǎng)度的疊加,進(jìn)一步改善了估計(jì)性能。
Welch算法分段法如圖5所示。
3.1實(shí)驗(yàn)設(shè)置
參數(shù)設(shè)置:批處理(batch size)大小為100,迭代周期(epochs)為150,學(xué)習(xí)率初始設(shè)置為0.01,設(shè)置學(xué)習(xí)率在第30,60次迭代時(shí)分別下降10倍的動(dòng)態(tài)學(xué)習(xí)率調(diào)整策略(MultiStepLR)。實(shí)驗(yàn)采用的網(wǎng)絡(luò)結(jié)構(gòu)主要由編碼塊和解碼塊組成,每個(gè)編碼塊和解碼塊中又由多個(gè)卷積層、批歸一化層等基本網(wǎng)絡(luò)層組成,網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示。
異常檢測(cè)是一種無(wú)監(jiān)督學(xué)習(xí),在評(píng)價(jià)時(shí)可以當(dāng)做一種特殊的二分類問(wèn)題。通常,將正常數(shù)據(jù)定義為正類,異常數(shù)據(jù)定義為負(fù)類。TP表示真實(shí)為正,預(yù)測(cè)為正,TN表示真實(shí)為負(fù),預(yù)測(cè)為負(fù),F(xiàn)P表示真實(shí)為正,預(yù)測(cè)為負(fù),F(xiàn)N表示真實(shí)為負(fù),預(yù)測(cè)為正。用于評(píng)價(jià)指標(biāo)的混淆矩陣如表5所示。
本文主要使用真正例率(TPR),也叫漏警率;假正例率(FPR),也叫虛警率繪制ROC曲線,以及計(jì)算AUC來(lái)評(píng)判分類器的好壞。
ROC曲線[9]能對(duì)分類器進(jìn)行準(zhǔn)確地評(píng)估,且不需要特定的決策閾值,因?yàn)镽OC曲線遍歷了所有閾值,ROC曲線橫軸為FPR,縱軸為T(mén)PR。AUC為ROC曲線下面積,能夠作為一種ROC的量化標(biāo)準(zhǔn),該指標(biāo)廣泛地作為ROC的比較準(zhǔn)則,AUC可以取0~1,但是通常為0.5~1。
3.2實(shí)驗(yàn)結(jié)果
首先研究FFT點(diǎn)數(shù)對(duì)異常檢測(cè)的影響,固定信噪比為5 dB,分別對(duì)512,1 024,2 048,5 120個(gè)FFT點(diǎn)進(jìn)行檢測(cè)。圖7為不同采樣點(diǎn)數(shù)生成的ROC曲線,信噪比同樣設(shè)置為5dB。
從ROC曲線來(lái)看,點(diǎn)數(shù)越高,AUC值越高。可見(jiàn)FFT點(diǎn)數(shù)越高,頻譜分辨率越高,學(xué)習(xí)到的特征越多,越容易分辨。表6為各點(diǎn)數(shù)的虛警數(shù)、漏警數(shù)以及總正確率,閾值設(shè)置為1.2倍均方誤差的均值。
由表6可以看出,閾值為1.2倍均方誤差的均值時(shí),5120點(diǎn)正確率達(dá)到了98.46%,結(jié)合上述ROC曲線同樣可以看出,采樣點(diǎn)數(shù)越高性能越好。
研究信噪比對(duì)檢測(cè)結(jié)果的影響,選取FFT點(diǎn)數(shù)為2048,信噪比分別設(shè)置為1,3,5dB。圖8為不同信噪比生成的ROC曲線。
信噪比對(duì)檢測(cè)性能的影響比較直觀,呈正比關(guān)系。信噪比越高,AUC曲線越接近于直角。表7為各信噪比的虛警數(shù)、漏警數(shù)以及總正確率。
可以看出,信噪比為5 dB時(shí),PSD-AE方法的虛警和漏警低,正確率高。雖然從ROC曲線上觀察到3,5 dB的AUC曲線相差不大,但正確率卻有很大差異,主要是因?yàn)榈托旁氡葧r(shí)正常數(shù)據(jù)與異常數(shù)據(jù)的均方誤差間差距不夠大,閾值較難調(diào)整,造成正確率差異較大。
為了更直觀地觀察PSD-AE的網(wǎng)絡(luò)運(yùn)行效果,給出t-distributed Stochastic Neighbor Embedding(TSEN)圖。TSEN是一種常用的非線性降維算法,一般用于高維數(shù)據(jù)降低至二維或者三維,并進(jìn)行可視化。
圖9為3 dB時(shí)PSD-AE分別采用FFT為512,1 024點(diǎn)的TSEN圖??梢灾庇^看出,點(diǎn)數(shù)越高,區(qū)分效果越好。
本文提出了基于卷積自編碼的衛(wèi)星通信入侵檢測(cè)方法,該方法對(duì)衛(wèi)星通信物理幀頭SOF段的功率譜進(jìn)行檢測(cè),相較于傳統(tǒng)聚類方法在低信噪比時(shí)的識(shí)別率有了較大的提高。自編碼檢測(cè)法僅對(duì)主要特征進(jìn)行提取,對(duì)噪聲不是很敏感,因此抗噪聲能力強(qiáng),準(zhǔn)確率很高,能夠適用于復(fù)雜電磁環(huán)境。但在整個(gè)仿真過(guò)程中,也存在一些問(wèn)題,比如各個(gè)畸變參數(shù)是否切合實(shí)際、符合規(guī)定,神經(jīng)超參數(shù)的設(shè)置能否優(yōu)化,使得網(wǎng)絡(luò)運(yùn)行速度更快、響應(yīng)更及時(shí)。
[1] HALL J,BARBEAU M, KRANAKSI E.Detection of Transient in Radio FrequencyFingerprinting Using Signal Phase[J/OL].[2022-09-20].https://static.aminer. org/pdf/PDF/000/274/667/robust_detection_of_signals_ with_unknown_frequency_and_phase.pdf.
[2] LIU Y,LI R,BAO J,et al.A Statistical Study of the Ionospheric Anomalies Affecting SBAS Safety Detected over China Area in 2015[C]//第十一屆中國(guó)衛(wèi)星導(dǎo)航年會(huì)論文集-S07衛(wèi)星導(dǎo)航增強(qiáng)技術(shù).成都:中國(guó)衛(wèi)星導(dǎo)航系統(tǒng)管理辦公室學(xué)術(shù)交流中心,2020:18.
[3]金文進(jìn),楊武.異常檢測(cè)技術(shù)研究綜述[J].軟件導(dǎo)刊,2008(1): 10-13.
[4]徐菁.頻譜異常檢測(cè)技術(shù)綜述[J].信息與電腦(理論版), 2020,32(23):214-216.
[5]潘一葦.通信輻射源個(gè)體識(shí)別關(guān)鍵技術(shù)研究[D].鄭州:戰(zhàn)略支援部隊(duì)信息工程大學(xué),2019.
[6]藍(lán)常源.基于DVB-S2的寬帶衛(wèi)星通信技術(shù)應(yīng)用研究[D].西安:西安電子科技大學(xué),2015.
[7]袁非牛,章琳,史勁亭,等.自編碼神經(jīng)網(wǎng)絡(luò)理論及應(yīng)用綜述[J].計(jì)算機(jī)學(xué)報(bào),2019,42(1):203-230.
[8]何霜寧.多窗口譜估計(jì)方法的研究[D].杭州:浙江工商大學(xué), 2020.
[9]王彥光,朱鴻斌,徐維超. ROC曲線及其分析方法綜述[J].廣東工業(yè)大學(xué)學(xué)報(bào), 2021, 38(1): 46-53.