王 檢,張邦寧,魏國峰,郭道省
(中國人民解放軍陸軍工程大學(xué) 通信工程學(xué)院,南京 210007)
隨著無線通信技術(shù)和物聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,智能無線終端和物聯(lián)網(wǎng)設(shè)備為人們帶來了豐富的生活體驗(yàn),同時(shí)也為非法用戶的入侵提供了可乘之機(jī)。非法用戶和網(wǎng)絡(luò)攻擊通常利用截獲的身份信息,如密碼和MAC地址等來進(jìn)行設(shè)備欺騙,從而造成嚴(yán)重的安全隱患。射頻指紋(Radio Frequency Fingerprint,RFF)[1]是輻射源設(shè)備發(fā)射電磁波所形成的獨(dú)特特征,無法被截獲和模仿。因此,基于射頻指紋的輻射源個(gè)體識(shí)別技術(shù)應(yīng)運(yùn)而生。
輻射源個(gè)體識(shí)別研究中,射頻指紋的提取方法主要有基于基本參數(shù)信息[2]、調(diào)制域信息[3-4]、變換域信息、基于信號(hào)特征圖像信息[5]、神經(jīng)網(wǎng)絡(luò)提取[6]等,射頻信號(hào)的選擇通常為輻射源工作功率恒定時(shí)的穩(wěn)態(tài)信號(hào)。近年來,變換域信息常被作為射頻指紋特征在輻射源識(shí)別領(lǐng)域的應(yīng)用較為廣泛,與其他提取特征的方法相比,此類方法保留了信號(hào)在變換域內(nèi)的全部特征,而不是提取某個(gè)單一特征,不存在因關(guān)鍵特征選擇不佳而影響識(shí)別性能的問題,同時(shí)此類方法不需知曉調(diào)制方式等一些先驗(yàn)信息,應(yīng)用范圍更加廣泛。變換域信息主要包括時(shí)頻分析[7]、高階譜[8]、循環(huán)譜等[9-10],但是此類方法中,時(shí)頻譜分析受制于分析工具性能,自適應(yīng)性能較差;高階譜分析往往維度較高,帶來的運(yùn)算壓力較大,往往采取切片的手段進(jìn)行降維處理;循環(huán)譜同樣維度較高,且十分依賴信號(hào)本身的完整性,在信號(hào)完整性差或信噪比低時(shí),識(shí)別效果不佳。信號(hào)的功率譜也是一種變換域特征,它描述了信號(hào)功率隨著頻率變化的情況。相比于其他變換域特征,功率譜具有提取難度小、維度較低且在低信噪比下方差性能良好的優(yōu)勢(shì)。
近幾年,深度學(xué)習(xí)理論快速發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域取得了令人矚目的成果。鑒于卷積神經(jīng)網(wǎng)絡(luò)在細(xì)微特征提取的卓越性能,許多研究也將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到輻射源感知[11]和識(shí)別[12]的場(chǎng)景中,取得了同樣不錯(cuò)的分類性能。Wong等人[13]基于I/Q不平衡理論,直接將原始I/Q數(shù)據(jù)作為輻射源的指紋特征送入神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別。對(duì)與未經(jīng)挖掘或人為提取特征的原始I/Q數(shù)據(jù)而言,數(shù)據(jù)中包含著輻射源的全部微特征信息,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)對(duì)輻射源進(jìn)行了有效的分類。然而I/Q數(shù)據(jù)在低信噪比情況下,其包含的細(xì)微特征往往會(huì)被噪聲湮沒,致使卷積神經(jīng)網(wǎng)絡(luò)很難提取特征影響分類結(jié)果,在全頻段功率信噪比為0 dB條件下對(duì)10組輻射源設(shè)備的識(shí)別率僅為64%[12]。
為解決在低信噪比條件下輻射源個(gè)體識(shí)別率低的問題,本文選用信號(hào)的功率譜作為指紋特征,它不僅包含了頻域內(nèi)的所有特征,且比頻譜在低信噪比下有更好的方差性能。Welch功率譜算法是一種改進(jìn)的功率譜算法,相較其他功率譜算法性能更優(yōu),結(jié)合卷積神經(jīng)網(wǎng)絡(luò)可在低信噪比下對(duì)輻射源進(jìn)行有效的分類。本文構(gòu)建了由20個(gè)ZigBee協(xié)議的CC2530物聯(lián)網(wǎng)設(shè)備組成的測(cè)試平臺(tái),CC2530也是目前常用物聯(lián)網(wǎng)設(shè)備。為了避免因調(diào)制信息不同帶來的影響,截取了信號(hào)前同步碼(preamble)部分的信號(hào)用于特征提取,將輻射源前同步碼部分的Welch功率譜數(shù)據(jù)送入卷積神經(jīng)網(wǎng)絡(luò),在瑞利信道全頻段功率信噪比為25 dB信噪比條件下對(duì)20個(gè)CC2530設(shè)備的識(shí)別率達(dá)到了98.88%,信噪比為0 dB時(shí)識(shí)別率為92.78%。經(jīng)過實(shí)驗(yàn)對(duì)比,本文方法在低信噪比條件下的識(shí)別效果明顯優(yōu)于其他方法。
本文設(shè)計(jì)了基于Welch功率譜和卷積神經(jīng)網(wǎng)絡(luò)特征提取的通用模型,共分為5個(gè)部分,如圖1所示。
圖1 基于Welch功率譜和卷積神經(jīng)網(wǎng)絡(luò)特征提取模型
在實(shí)際場(chǎng)景中,非法用戶或網(wǎng)絡(luò)攻擊往往會(huì)采用和主用戶來自同一廠家相同型號(hào)的設(shè)備,因此在輻射源識(shí)別過程中,易獲得輻射源的中心頻率、碼率、通信協(xié)議等部分先驗(yàn)知識(shí)。基于上文所述的先驗(yàn)知識(shí),可對(duì)輻射源信號(hào)進(jìn)行良好的采集、保存,并將輻射源數(shù)據(jù)進(jìn)預(yù)處理,去除冗余保留輻射源關(guān)鍵部分信息。將Welch功率譜算法得到的信號(hào)功率譜數(shù)據(jù)作為輻射源的指紋特征,送入卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,最后將測(cè)試數(shù)據(jù)集送入網(wǎng)絡(luò)得到最終分類結(jié)果。
當(dāng)下廣泛采用的智能終端和物聯(lián)網(wǎng)設(shè)備,其通信協(xié)議多基于IEEE 802框架,因此本文選用基于ZigBee協(xié)議的20個(gè)CC2530發(fā)射器作為輻射源驗(yàn)證模型性能,信號(hào)采集設(shè)備為Signal-Hound BB60C實(shí)時(shí)頻譜分析儀,采集的輻射源信號(hào)保存在PC端,并利用相關(guān)軟件進(jìn)行數(shù)據(jù)處理。
本文研究的輻射源設(shè)備是來自同一廠家相同型號(hào)不同序列號(hào)的20個(gè)ZigBee CC2530設(shè)備。ZigBee協(xié)議使用IEEE 802.15.4規(guī)范作為物理層標(biāo)準(zhǔn),其物理層協(xié)議數(shù)據(jù)單元包括同步頭、物理層報(bào)頭和載荷,如圖2所示。
4 B1 B1 B可變長度前同步碼(preamble)幀定界符(SFD)幀長度(7 b)保留(1 b)物理層數(shù)據(jù)(PSDU)同步頭(SHR)物理層報(bào)頭(PHR)物理層載荷(PHY payload)
圖2ZigBee物理層協(xié)議數(shù)據(jù)單元
圖3展示了整個(gè)采集系統(tǒng),包括20個(gè)CC2530發(fā)射器、采集設(shè)備和存儲(chǔ)設(shè)備。信號(hào)的采集都是基于Signal-Hound BB60C實(shí)時(shí)頻譜分析儀完成的。由于ZigBee設(shè)備的I/Q信道碼片速率為1 Mb/s,我們以40 Msample/s的采樣率通過有線的方式對(duì)每個(gè)ZigBee設(shè)備的1 000次數(shù)據(jù)傳輸進(jìn)行采集,采集的信號(hào)經(jīng)過BB60C下變頻至基帶,最終以復(fù)數(shù)I/Q數(shù)據(jù)的方式儲(chǔ)存至PC,如圖4(a)所示。
圖3 數(shù)據(jù)采集系統(tǒng)
(a)一次完整通信的I/Q數(shù)據(jù)
(b)前同步碼的標(biāo)準(zhǔn)化I/Q數(shù)據(jù)
2.2.1 數(shù)據(jù)截取
基于IEEE 802相同協(xié)議規(guī)范的前同步碼(preamble)中包含的數(shù)據(jù)成分相同,因此將信號(hào)前同步碼部分的信號(hào)特征作為輻射源的指紋特征,能夠避免調(diào)制信息不同帶來的影響,且相較其他特征更加穩(wěn)健,十分適用于無線網(wǎng)絡(luò)設(shè)備的識(shí)別。在先前的研究中,無線信號(hào)前同步碼的射頻特性已被證明能夠可靠地區(qū)分IEEE 802.11a無線電[14]。鑒于前同步碼的射頻特性,本文截取ZigBee信號(hào)前同步碼部分,將其射頻特征作為指紋特征用于輻射源識(shí)別,同時(shí)可以避免數(shù)據(jù)量龐大帶來的運(yùn)算壓力。IEEE 802.15.4協(xié)議根據(jù)輻射源的頻帶和調(diào)制方案,要求使用基于30~40位的前同步碼,本文選用中心頻率為2.405 GHz的CC2530發(fā)射器,其前同步碼長度為4 B共128 μs。因此我們截取每次傳輸數(shù)據(jù)前128 μs的前同步碼I/Q數(shù)據(jù),共計(jì)5 120個(gè)樣本點(diǎn)用于特征提取,并將信號(hào)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。標(biāo)準(zhǔn)化處理數(shù)據(jù)不僅利于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和分類,還可以避免信號(hào)幅度值不同引入的非指紋特征,如圖4(b)所示。
2.2.2 數(shù)據(jù)去噪
在低信噪比情況下,輻射源的細(xì)微特征往往會(huì)被噪聲湮沒,導(dǎo)致特征提取難度加大,進(jìn)而影響對(duì)輻射源的識(shí)別。因此,本文設(shè)計(jì)了低通濾波器對(duì)保存的I/Q信號(hào)進(jìn)行去噪處理。Toeplitz矩陣類似于隨機(jī)矩,大概率地滿足了受限等距性質(zhì)(Restricted Isometry Property,RIP),被廣泛用作度量核[15-16]。采取窗函數(shù)的方法設(shè)計(jì)數(shù)字低通濾波器,利用Toeplitz矩陣的循環(huán)特性實(shí)現(xiàn)接收信號(hào)與低通濾波器系數(shù)的卷積。假設(shè)濾波器階數(shù)為K,并且數(shù)字濾波器系數(shù)由FC表示,則Toeplitz濾波器矩陣為
(1)
式中:Ki=「K/2?,「·?表示四舍五入,且K< (2) 式中:r表示接收到的信號(hào)。因此,濾波后的信號(hào)可以矩陣乘法的形式表示為 Sfilter(nrow)=Tr=T(s+n)。 (3) 顯然,Sfilter是一個(gè)N階向量。測(cè)量值由下式給出: y=XSfilter=XT(s+n)=φ(s+n)。 (4) 式中:X表示信號(hào)序列。濾噪核表示為 φM×N=XM×NTN×N。 (5) Toeplitz矩陣去噪能夠較好地減小噪聲對(duì)輻射源射頻特征的影響,為提升低信噪比下輻射源識(shí)別性能起到了關(guān)鍵作用。 Welch功率譜算法是一種改進(jìn)的周期圖法,在Bartlett法的基礎(chǔ)上進(jìn)行了兩方面改進(jìn)。首先,當(dāng)信號(hào)序列分段時(shí),該算法可將相鄰兩段重疊以提高方差性能,同時(shí)使用非矩形窗函數(shù)提升譜估計(jì)的分辨率,達(dá)到進(jìn)一步減小方差的目的。Welch功率譜算法如下: xi(n)=x[n+(i-1)k],0≤n≤M-1,1≤i≤L。 (6) 式中:0 圖5 Welch算法分段方法 第i段信號(hào)的功率譜為 (7) 式中:U為歸一化因子,w(n)為非矩形窗函數(shù)。則信號(hào)的Welch功率譜定義為 (8) Welch功率譜估計(jì)在信號(hào)含有高噪聲的情況下方差性能依然良好,Welch法定義的譜估計(jì)方差為 (9) 如果含有噪聲x(n)的信號(hào)是平穩(wěn)隨機(jī)過程,則式(4)的協(xié)方差僅取決于r=i-j。公式(4)可以寫成簡單的求和表達(dá)式,即 (10) (11) 根據(jù)公式(11),Welch功率譜的方差減少到每段方差的1/L。然而,這些分段實(shí)際上是相關(guān)的,因此Welch功率譜的真方差大于公式(11)。在下文的結(jié)果驗(yàn)證中,也能夠得出Welch功率譜對(duì)噪聲的敏感度較低。這是因?yàn)轭l譜是直接對(duì)信號(hào)進(jìn)行傅里葉變換,而Welch功率譜對(duì)信號(hào)序列進(jìn)行每段的傅里葉變換,分割后再計(jì)算均值。 我們利用Welch功率譜算法得到了前同步碼的功率譜,并用歸一化幅度表示相對(duì)功率的大小。將功率譜與采用相同點(diǎn)數(shù)快速傅里葉變換(Fast Fourier Transform,FFT)的頻譜進(jìn)行對(duì)比(全頻段功率信噪比0 dB時(shí)),如圖6所示。對(duì)比結(jié)果表明分割信號(hào)序列可以明顯改善方差性能,證明了公式(11)的結(jié)論,因此Welch功率譜相較頻譜在低信噪比環(huán)境下能更夠更好地提取信號(hào)特征。 (a)0 dB信噪比前同步碼功率譜 (b)0 dB信噪比前同步碼頻譜 由于本文的特征數(shù)據(jù)為一維功率譜數(shù)據(jù),因此我們構(gòu)建一維卷積神經(jīng)網(wǎng)絡(luò)(1-Dimensional Convolutional Neural Network,1-DCNN)用于輻射源的個(gè)體識(shí)別。典型的卷積神經(jīng)網(wǎng)絡(luò)由卷積層、池化層、全連接層和輸出層組成,1-DCNN與CNN的區(qū)別在于其特征的維度是一維,因此1-DCNN由一維卷積層、一維池化層、全連接層和輸出層構(gòu)成。本文所使用的網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示。 圖7 1-DCNN網(wǎng)絡(luò)架構(gòu) 設(shè)S是由輻射源功率譜數(shù)據(jù)組成輸入,Sl是第l層卷積層的輸出,卷積計(jì)算方法為 (12) 在池化層中我們選用最大池化算法,對(duì)經(jīng)過卷積層的數(shù)據(jù)進(jìn)行降采樣操作,從而降低運(yùn)算的復(fù)雜度,提升學(xué)習(xí)效率。 全連接層的目的是將經(jīng)過卷積層和池化層提取的特征重新組成一組,并輸出為 δi=f(wipi+bi),i=1,2,…,k。 (13) 式中:δi表示第i個(gè)輸出(共k個(gè)輸出),pi為上一層的輸出,wi和bi分別是第i個(gè)神經(jīng)元的權(quán)重及閾值,f(x)為激活函數(shù)ReLU。 在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,過擬合的問題不容忽視。為了抑制過擬合,本文在全連接層采用Dropout,有效抑制了過擬合的現(xiàn)象。 輸出層利用Softmax分類器可以直接完成每一組輸出的分類任務(wù),每一個(gè)設(shè)備的識(shí)別概率為 (14) 式中:N為輻射源設(shè)備的總數(shù),且所有概率之和為1。 卷積神將網(wǎng)絡(luò)的損失函數(shù)通過Softmax的輸出向量與實(shí)際的標(biāo)簽做交叉熵計(jì)算而來,損失函數(shù)的公式為 (15) 式中:yi′表示實(shí)際標(biāo)簽中的第i個(gè)值,yi為Softmax輸出向量中的第i個(gè)值。 在網(wǎng)絡(luò)反向傳播過程中,使用Adam算法進(jìn)行參數(shù)優(yōu)化,利用參數(shù)的一階矩估計(jì)和二階矩估計(jì)動(dòng)態(tài)調(diào)整每個(gè)參數(shù)的學(xué)習(xí)率,從而更新權(quán)值求得最優(yōu)解[17]。 本文構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)超參數(shù)如表1所示,其中輸入為Welch功率譜數(shù)據(jù)(5 120×1),輸出為分?jǐn)?shù)向量(維度20×1)。 表1 神經(jīng)網(wǎng)絡(luò)超參數(shù) 為驗(yàn)證本文提出的模型在實(shí)際場(chǎng)景下的識(shí)別性能,我們將采集的有線I/Q數(shù)據(jù)按照文獻(xiàn)[18]的處理方法,仿真出在典型城區(qū)瑞利衰落下傳播的信號(hào),并在信號(hào)中添加高斯白噪聲。通過仿真,最終得到在瑞利信道條件下,全頻段功率信噪比為-30~25 dB(信噪比以5 dB為間隔)、信號(hào)帶寬與噪聲帶寬比值為1∶5時(shí)的標(biāo)準(zhǔn)化I/Q數(shù)據(jù),如圖8所示(以0 dB為例)。 圖8 瑞利信道下0 dB信噪比前同步碼I/Q數(shù)據(jù) 在Welch功率譜算法中,F(xiàn)FT運(yùn)算點(diǎn)數(shù)對(duì)功率譜的分辨率有較大的影響。我們通過Welch算法得到基于5 120、10 240、20 480、40 960點(diǎn)FFT的功率譜數(shù)據(jù)(如圖9所示),將其送入卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練并分析不同F(xiàn)FT點(diǎn)數(shù)Welch功率譜數(shù)據(jù)對(duì)識(shí)別效果的影響。 (a)5 120點(diǎn)FFT功率譜 (b)10 240點(diǎn)FFT功率譜 (c)20 480點(diǎn)FFT功率譜 (d)40 960點(diǎn)FFT功率譜圖9 不同F(xiàn)FT點(diǎn)數(shù)Welch功率譜 神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集為20個(gè)CC2530ZigBee發(fā)射器的1 000次傳輸?shù)那巴酱aWelch功率譜數(shù)據(jù),共20 000組。網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集按5∶1劃分。訓(xùn)練參數(shù):batch-size為128,Dropout比率為0.5,學(xué)習(xí)率0.001,epoch為100輪。在不同F(xiàn)FT點(diǎn)數(shù)下的Welch功率譜數(shù)據(jù)對(duì)輻射源個(gè)體的識(shí)別率如圖10所示。 圖10 不同F(xiàn)FT點(diǎn)數(shù)Welch功率譜識(shí)別率 由實(shí)驗(yàn)結(jié)果分析可知,在信噪比高于0 dB時(shí),不同F(xiàn)FT運(yùn)算點(diǎn)數(shù)對(duì)輻射源識(shí)別率影響較小,在25 dB信噪比條件下,10 240點(diǎn)FFT的Welch功率譜對(duì)20個(gè)輻射源的識(shí)別率達(dá)到了98.88%,高于其他點(diǎn)數(shù)FFT運(yùn)算Welch功率譜對(duì)輻射源的識(shí)別概率;當(dāng)信噪比低于0 dB時(shí),5 120點(diǎn)FFT的Welch功率譜數(shù)據(jù)對(duì)輻射源的識(shí)別性能明顯下降,識(shí)別率低于其他對(duì)照組。 為了對(duì)比驗(yàn)證本文算法的識(shí)別效果,本文實(shí)驗(yàn)還采用了近年來熱門的5種基于變換域的識(shí)別方式,即基于I/Q數(shù)據(jù)和卷積神經(jīng)網(wǎng)絡(luò)、基于頻譜和卷積神經(jīng)網(wǎng)絡(luò)、基于短時(shí)傅里葉變換和卷積神經(jīng)網(wǎng)絡(luò)、基于積分雙譜切片、循環(huán)譜切片的方法進(jìn)行實(shí)驗(yàn)對(duì)比,分析不同算法的性能。瑞利信道下不同信噪比的各種輻射源識(shí)別方法的性能如圖11所示。 圖11 輻射源識(shí)別方法性能比較 由圖11可知,在瑞利衰落條件下,當(dāng)全頻段功率信噪比大于20 dB時(shí),不同算法對(duì)20個(gè)輻射源的識(shí)別能力相近,但是當(dāng)信噪比較低時(shí),各種算法的識(shí)別性能有明顯的降低。本文所提出的基于Welch功率譜和卷積神經(jīng)網(wǎng)絡(luò)的輻射源識(shí)別算法在全頻段功率信噪比為0 dB條件下仍有92.78%的識(shí)別率,在低信噪比條件下識(shí)別性能明顯優(yōu)于其他算法,證明了本文算法的優(yōu)越性。 基于深度學(xué)習(xí)的通信輻射源識(shí)別逐漸模糊了輻射源特征提取和分類識(shí)別的界限,大大減小了之前憑借提取專家特征進(jìn)行識(shí)別的束縛,能夠提取更全面、本質(zhì)的細(xì)微特征。本文通過分析常用通信協(xié)議的幀格式,利用Welch功率譜算法得到前同步碼的功率譜并將其作為輻射源的特征,在保留輻射源所有的細(xì)微特征的同時(shí)避免了不同調(diào)制信息帶來的干擾。因此,本文方法可推廣到通信協(xié)議已知的各種輻射源識(shí)別場(chǎng)景中,具有良好的適用性。在先前的輻射源識(shí)別的研究中,信道和信噪比對(duì)識(shí)別效果的影響常常被忽略,而本文實(shí)驗(yàn)場(chǎng)景全部基于典型的瑞利衰落和不同信噪比模型,且經(jīng)驗(yàn)證,本文方法在低信噪比的條件下識(shí)別效果明顯優(yōu)于其他算法,具有很好的魯棒性。3 基于Welch算法的信號(hào)功率譜特征提取
3.1 Welch法估計(jì)信號(hào)功率譜
3.2 Welch功率譜在低信噪比下性能分析
4 卷積神經(jīng)網(wǎng)絡(luò)
5 實(shí)驗(yàn)分析
5.1 不同F(xiàn)FT點(diǎn)數(shù)Welch功率譜識(shí)別率
5.2 不同算法的識(shí)別效果
6 結(jié) 論