朱勇剛 于 龍 朱義勇 賈錄良
(1. 國防科技大學(xué)第六十三研究所, 江蘇南京 210007; 2. 國防科技大學(xué)信息通信學(xué)院, 湖北武漢 430010;3. 陸軍工程大學(xué)通信工程學(xué)院, 江蘇南京 210007)
跟蹤干擾是指干擾信號能跟蹤信號頻率跳變的一種干擾方式,按典型實現(xiàn)途徑,跟蹤干擾可分為波形跟蹤干擾、轉(zhuǎn)發(fā)跟蹤干擾和引導(dǎo)跟蹤干擾三種[1]。波形跟蹤干擾指干擾機在破譯用戶跳頻圖案的基礎(chǔ)上,同步施放與跳頻通信每一跳信號的時間和頻率都一致的干擾信號,干擾效率高。但由于在戰(zhàn)場復(fù)雜電磁環(huán)境下,進行實時網(wǎng)臺分選并破譯跳頻圖案的難度大,目前還未見實用化波形跟蹤機的報導(dǎo)。轉(zhuǎn)發(fā)跟蹤干擾是將接收到的跳頻通信信號直接或處理后轉(zhuǎn)發(fā)出去,從而對當(dāng)前跳的跳頻通信頻率形成干擾。轉(zhuǎn)發(fā)跟蹤干擾需要接收和轉(zhuǎn)發(fā)整個跳頻帶寬內(nèi)的信號,若跳頻帶寬足夠?qū)?,干擾機功放的大部分功率會被無效消耗,實際干擾效果不佳。引導(dǎo)跟蹤干擾指干擾機對跳頻通信信號快速檢測和識別,并立即引導(dǎo)干擾機在該頻率上施加干擾。由于該干擾方式的實現(xiàn)途徑簡單且干擾效果較好,從而被廣泛使用。本文主要研究抗引導(dǎo)跟蹤干擾方法。面對跟蹤干擾,一種直接的方式是通過提高跳頻速率來實現(xiàn)抗干擾[1]。然而,由于射頻器件及自動增益控制器等的限制,用戶切換頻率后存在器件狀態(tài)不穩(wěn)定的換頻時間,換頻時間內(nèi)用戶無法進行通信[2]。在時間一定的條件下,若跳速過快,則由于換頻時間的存在導(dǎo)致實際通信時間減少;若跳速較慢,則被敵方有效感知并實施跟蹤干擾的概率增加。因此,跳頻通信的最優(yōu)跳速選擇是一個需要解決的重要問題。
本文針對引導(dǎo)跟蹤干擾,將跳頻通信信號檢測與抗干擾博弈結(jié)合起來,采用Stackelberg博弈模型[13]研究通信干擾方與抗干擾方在時域的博弈問題。在該模型中,存在一個先行者(leader)和一個跟隨者(follower),通信方作為先行者首先以一定跳速進行通信,干擾方作為跟隨者在已知跳速的基礎(chǔ)上分配合適的信號檢測時間和干擾時間;然后,通信方在檢測到干擾方的檢測時間與干擾時間后,重新調(diào)整跳頻速率,博弈過程依次持續(xù)進行。本文首先建立了基于Stackelberg博弈的通信干擾與抗干擾模型,然后推導(dǎo)了相應(yīng)的Stackelberg均衡解,并將所提方法的抗干擾性能與盲跳頻和變速跳頻[12]的抗跟蹤干擾性能進行比較,證明了所提方法的抗跟蹤干擾性能顯著優(yōu)于已有方法。
典型的跳頻信號結(jié)構(gòu)示意圖如圖1所示。令跳頻用戶的跳頻頻率集為F,滿足|F|=M,即跳頻信號在M個相鄰但不相交的子頻帶內(nèi)偽隨機跳變。假設(shè)跳頻周期為T,且T∈[0,Tmax],Tmax為最大跳頻周期,即跳頻用戶能夠根據(jù)引導(dǎo)式跟蹤干擾的參數(shù),在0到Tmax的范圍內(nèi)自適應(yīng)調(diào)整跳頻周期。受器件和工藝水平等的限制,跳頻信號的頻率切換不可避免地存在不穩(wěn)定的暫態(tài)過程,在該過程期間跳頻通信系統(tǒng)既不發(fā)射也不接收信號[2]。令該暫態(tài)過程的持續(xù)時間為Tc,在跳頻通信系統(tǒng)工作期間可以將其看成是固定值。
圖1 跳頻信號結(jié)構(gòu)示意圖Fig.1 The framework of frequency-hopping signal
引導(dǎo)式跟蹤干擾的干擾策略是[10]:在每個跳頻周期內(nèi),干擾方首先檢測跳頻信號,若檢測到跳頻通信信號,則立即引導(dǎo)干擾機進行干擾;否則,干擾機不發(fā)射干擾信號。因此,可以將每個跳周期T分成兩部分:信號檢測時間Td和干擾時間Tj,且T=Td+Tj。由于信號檢測概率往往與檢測時間或檢測信號長度有關(guān):檢測時間越長,檢測概率越高;反之,則越低,因此,為跳頻通信信號的檢測概率可以表示為p(Td),那么,一個跳周期內(nèi)通信方的平均接收信噪比可以表示為:
(1)
(2)
在通信抗干擾博弈過程中,通信方首先以一定的跳周期T進行通信,然后干擾方將根據(jù)通信方的跳周期T以合適的信號檢測時間Td和干擾時間Tj進行信號檢測和施放干擾,其目標(biāo)是使得通信方的平均接收信噪比最??;之后,通信方將根據(jù)干擾方的信號檢測時間Td和干擾時間Tj調(diào)整跳頻周期T,以使得己方的平均接收信噪比最大。因此,通信方和干擾方的效用函數(shù)UC(T)和UJ(Td,Tj)可以分別表示為:
(3)
在博弈過程中,干擾方作為跟隨者根據(jù)跳頻通信信號的檢測結(jié)果,由如下優(yōu)化問題確定最優(yōu)檢測時間:
(4)
(5)
將式(2)帶入式(4)、(5),并通過簡要分析可知通信博弈雙方的目標(biāo)函數(shù)可以分別等效為:
(6)
(7)
可以看出,博弈雙方的最優(yōu)策略與信號檢測性能p(Td)有關(guān),下面結(jié)合具體的信號檢測方法進行分析。常用的信號檢測方法包括能量檢測、匹配濾波檢測和循環(huán)平穩(wěn)特征檢測等[14]。本文不以信號檢測研究為重點,因此假設(shè)干擾方采用能量檢測作為跳頻通信信號的檢測方法:對M個正交子頻帶的接收信號進行能量檢測,取能量最大者作為跳頻通信信號所在頻率的估計結(jié)果。附錄1給出了該檢測方法的近似檢測概率表達(dá)式:
(8)
其中,為便于分析,在上式中令Ts=1,即Td為歸一化檢測時間或采樣信號個數(shù),另外,上式中的近似處理是取m/(m+1)≈1得到的。下面,結(jié)合式(8)給出的檢測概率p(Td),求解式(6)、(7)的目標(biāo)函數(shù),確定通信博弈雙方的最優(yōu)策略。
(9)
(10)
干擾方的最優(yōu)解由下式給出:
(11)
(12)
(13)
由此,得到干擾方最優(yōu)干擾策略的近似解析解:
(14)
本文將在第4部分對近似解式(14)和精確解式(11)的近似程度進行比較和分析。
為了求解通信方的最優(yōu)抗干擾策略,將式(11)代入式(7),并求解可得:
(15)
附錄3給出了定理1的詳細(xì)證明。由式(11)以及定理1可知:干擾方和通信方的目標(biāo)函數(shù)都為單峰函數(shù),因此,存在唯一的Stackelberg均衡解。但是,通信方的目標(biāo)函數(shù)都較為復(fù)雜,難以得到其導(dǎo)數(shù)的解析表達(dá)式,因此,采用黃金分割法尋找雙方的最優(yōu)解[15]。
第1步:將最大跳周期設(shè)為搜索區(qū)間,即設(shè)a1=0,b1=Tmax,k=1,搜索精度為t0>0,計算試探點λ1、μ1及對應(yīng)的函數(shù)值UC(λ1)、UC(μ1),其中:λ1=a1+0.382(b1-a1),μ1=a1+0.618(b1-a1);UC(λ1)、UC(μ1)的計算可以首先將λ1、μ1分別代入式(14)計算Td(λ1)、Td(μ1)的近似解,也可以將λ1、μ1代入式(11)采用黃金分割法的方法求解Td(λ1)、Td(μ1)的精確解。
第2步:若bk-ak
第3步:ak+1=λk,bk+1=bk,λk+1=μk,μk+1=ak+1+0.618(bk+1-ak+1),計算UC(μk+1),轉(zhuǎn)入第5步;
第4步:ak+1=ak,bk+1=μk,μk+1=λk,λk+1=ak+1+0.382(bk+1-ak+1),計算UC(λk+1),轉(zhuǎn)入第5步;
第5步:k=k+1,轉(zhuǎn)入第2步。
圖2 干擾方的目標(biāo)函數(shù)曲線Fig.2 The objective curve of jammer
圖3 通信方的目標(biāo)函數(shù)曲線Fig.3 The objective curve of communicator
圖4給出了最優(yōu)檢測時間的精確解和近似解(式(14))隨信噪比的變化曲線。仿真中,取M=8??梢钥闯觯S著信噪比、跳周期的變化,近似解與精確解具有相同的變化趨勢,且當(dāng)信噪比適中時,近似解對精確解的近似程度最好。另外,隨著信噪比的增加,干擾方的最優(yōu)檢測時間減小。這是因為當(dāng)信噪比較高時,只需較少的檢測時間即可以較高的概率有效檢測跳頻信號,干擾方可以減小檢測時間,增加干擾時間,從而獲得最優(yōu)干擾效果。
圖4 最優(yōu)檢測時間隨信噪比的變化曲線Fig.4 The optimal detection time vs. SNR
圖5給出了取Tmax=50 ms時,最優(yōu)跳周期隨信噪比的變化曲線??梢钥闯?,當(dāng)信噪比較小時,通信方的最優(yōu)跳周期較大,即采用慢跳頻;當(dāng)信噪比增加時,通信方的最優(yōu)跳周期減小,即提高跳速。這是因為當(dāng)信噪比較低時,干擾方需要較多時間用于檢測跳頻信號,因此通信方采用盡可能慢的跳頻速率,以減小跳頻損傷的影響;當(dāng)信噪比較高時,干擾方能夠快速檢測到跳頻信號,因此通信方需要提高跳速,盡可能減小干擾的影響。同時,從圖5可以看出,隨著信道數(shù)的增加,通信方的最優(yōu)跳頻周期將有所增加。
圖5 最優(yōu)跳周期隨信噪比的變化曲線Fig.5 The optimal frequency-hopping cycle vs. SNR
圖6 多種跳頻模式的抗跟蹤干擾性能Fig.6 The anti-following jamming performance for different hopping model
基于博弈論的通信干擾與抗干擾是目前的研究熱點之一,本文將已有的功率域、頻率域的博弈框架擴展到時間域,結(jié)合干擾方檢測通信信號需要付出時間開銷和存在檢測誤差的特點,提出了存在檢測誤差條件下的最優(yōu)跳速設(shè)計問題,并采用Stackelberg博弈模型對該問題進行了求解。理論分析與仿真結(jié)果表明,當(dāng)信噪比小于4/TlnM時,干擾方的最優(yōu)干擾策略是盲干擾,通信方的最優(yōu)抗干擾策略是慢速跳頻;反之,干擾方的最優(yōu)干擾策略是先檢測后干擾,通信方將相應(yīng)地調(diào)整跳頻周期已獲得最優(yōu)抗干擾性能。需要指出,盡管本文所提方法在一定程度上克服了已有研究難以考慮檢測開銷與檢測性能的關(guān)系對最優(yōu)跳速設(shè)計的不足,但該方法需要通信對抗雙方準(zhǔn)確獲取對方的決策信息。下一步將結(jié)合強化學(xué)習(xí)技術(shù)研究干擾方?jīng)Q策信息的在線學(xué)習(xí)方法[17]。另外,本文所提方法可以與功率域、頻率域博弈相結(jié)合,構(gòu)造多域博弈抗干擾,以進一步提高抗干擾性能。
采用能量檢測方法對M個子頻帶上的接收信號進行檢測時,跳頻通信信號的檢測概率可以表示為:
p(Td)=p(R2(Td) (A1) (A2) (A3) 其中,Ts為采樣周期。 對式(8)求導(dǎo)可知: (A4) 將Td=0代入上式并化簡可得: (A5) (A6) 將式(A6)和p(0)=1/M代入式(9)得: (A7) 證明:證明的主要思路是分別針對T→0和T→的情況,分析的單調(diào)性。首先,當(dāng)M較大時,式(13)給出的可以近似為進一步地,當(dāng)T→0時,對根號函數(shù)進行一階泰勒展開:(1+x)1/ 2≈1+x/ 2,因此,可以近似為下式: (A8) 同樣地,對式(8)中的指數(shù)函數(shù)進行一階泰勒展開,并將式(A8)代入其中,可得: (A9) 將式(A8)、(A9)代入式(7),得到T→0條件下通信方等效目標(biāo)函數(shù)的近似表達(dá)式: (A10) 其次,當(dāng)T→時,由式(13)可知其中α是與T無關(guān)的大于0的常數(shù),同時,當(dāng)T→時,p(Td)趨近于1,因此,令p(Td)=1-β,其中,β→0,將以上近似結(jié)果代入式(7),得到T→條件下通信方等效目標(biāo)函數(shù)的近似表達(dá)式: (A11)附錄2 信噪比門限的求解
附錄3 定理1的證明