柴曉飛 羅丁利 徐丹蕾 楊 磊
(西安電子工程研究所 西安 710100)
建筑物與植被作為雷達地雜波背景中的主要組成部分,對兩者的識別和分類,可以幫助我們建立地區(qū)的場景先驗信息,根據不同的雜波類型采用不同的雜波抑制方法,同時為陣地適配提供參考信息。目前基于合成孔徑雷達圖像的分割技術已經有較多的研究成果[1-5],如基于數據驅動、模型驅動的SAR圖像分割技術,這里主要針對低分辨雷達的頻譜進行研究。
在有風的條件下,植被會出現(xiàn)緩慢的搖擺,由于雜波之間運動的隨機性,目標頻譜將會被展寬,即與固定建筑物的頻譜會產生差異。二者有以下區(qū)別:
1)在同一部雷達的照射下,雖然影響地雜波的有很多因素,但建筑物的回波強度一般大于植被的回波強度。
2)建筑物的分布范圍獨立且集中,植被覆蓋率高,分布范圍寬廣。
3)在有風條件下,植被受風作用擺動將產生隨機多普勒分量,造成雜波譜展寬。而建筑物受風的影響小,頻譜寬度小。
4)植被的運動還有其自身的特點,如雙向交錯性,短時間性,即在小段時間內,植被起伏大,平穩(wěn)性差,而建筑物幾乎沒有任何波動。
該實驗以某雷達為實驗平臺,采集雜波數據,來進行實驗方法研究以及實驗數據的驗證。
在有風條件下,由于樹木的擺動,產生多普勒分布,從而會展寬雜波譜的譜線,由于雜波源之間運動的隨機性,經查閱文獻[6]及雷達實測數據證明,指數分布最適合對風吹植被所形成的地雜波進行建模。
(1)
3dB譜寬可用標準差表示為:
來自森林區(qū)域不同風速時地雜波頻譜擴展的估計值見表1[7]。
表1 不同風速時頻譜擴展的測量值
風條件風速(km/h)風速(m/s)指數ac形狀參數β(m/s)-1均方根頻譜寬度σv(m/s)典型最壞情況典型最壞情況軟風1~70.28~1.9412-0.12-微風7~151.94~4.178-0.18-大風15~304.17~8.335.75.20.250.27狂風30~608.33~16.674.33.80.330.37
本文的所有數據來源于某雷達實驗平臺。該雷達平臺靜止工作,地雜波分布在零多普勒頻率附近,主要探測地面活動的目標,用于警戒、偵察人員、車輛等動目標,測定其方位、距離和活動路線。
處理機對接收到的雷達中頻回波信號,利用數字下變頻技術,將回波信號中承載的信息變化到基帶,通過數字脈沖壓縮技術,獲得最大信噪比的輸出信號,然后對脈壓處理后的每一個距離單元內的慢時間序列做離散傅里葉變換(DFT),得到相應的脈沖-多普勒平面。由于本文的研究對象是地雜波,因此可將地雜波視為期望信號進行檢測,為了在干擾噪聲功率電平變化的條件下保持CFAR,此處在多普勒維采用單元平均CFAR分析,得到檢測后的數據矩陣,根據風速的大小和多普勒分辨率選取雜波單元,提取相應雜波單元內的頻譜特征,送入訓練好的分類器模型,進行場景分類,通過投票融合方法,進一步提高識別的準確度。場景分類處理流程如圖1所示:
圖1 場景分類處理流程圖
地雜波處于零多普勒通道附近,由風速等級及多普勒速度分辨率可對植被雜波譜的展寬做出估計,確定所占多普勒通道數的最大區(qū)間,對經過恒虛警檢測后的每個快時間-慢時間矩陣,在慢時間維截取對應多普勒區(qū)間數據,作為雜波單元。
通過對該地區(qū)雷達掃描范圍內的回波數據進行分析,可得到連續(xù)時間內對該地區(qū)的多次掃描結果,即基于不同時段的該地區(qū)樣本值的強度和頻譜進行研究。首先根據統(tǒng)計設定一個合適的強度閾值,對低于閾值的距離單元不做識別,直接判為未知目標。然后對強度高于閾值的距離單元,提取對應的雜波單元內的頻譜特征,送入訓練好的分類器模型,進一步對植被和建筑物進行識別分類。得到該地區(qū)不同時間段的多次識別分類結果。
(2)
如圖2,基于對該地區(qū)17次預測分類的情況下,單次決策結果錯誤率與集成學習錯誤率的關系曲線,交點大約位于0.5,即當單次決策結果的錯誤率小于0.5時,集成學習的錯誤率要低于單次決策結果;當單次決策結果的錯誤率大于等于0.5時,集成學習的錯誤率要高于單次決策結果。
該融合方法的優(yōu)點是:不需要進行訓練,簡單有效;但是它也存在一定的局限性,即忽略了每次掃描結果的差異性,給予它們相同的輸出同等地位;其次,容易出現(xiàn)相同票數的情況,需要拒判。
圖2 單次決策錯誤率與集成學習錯誤率關系曲線
為了說明該方法的可行性,專門選擇一塊實驗區(qū)域,此處樹木茂盛,農業(yè)主要種植小麥與玉米;建筑物分布范圍小但大多數集中分布,多是低矮的房屋;且區(qū)域內還有部分的裸露地。
數據是在微風條件下采集的,區(qū)分兩類目標主要是利用它們在有風條件下速度的差別,多普勒存在差異,雜波頻譜展寬程度不同,反映在雷達距離-多普勒平面上即為兩類目標占據多普勒單元的多少。如圖3所示:
圖3 距離多普勒平面
從實測回波數據中,選取兩類樣本在有風條件的典型頻譜。由于在有風條件下,草木會隨風擺動,而且根據風向的不同,風速的不同,擺動幅度不同,目標頻譜也會產生差異。即植被頻譜相對于雜波譜中心并不總是對稱的,頻譜展寬起伏大且平穩(wěn)性差,如圖4所示。在有風條件下,建筑物的穩(wěn)定性比較好,不會隨著風速的變化而變化,因此目標的頻譜呈箭狀,分布在0多普勒通道兩側,有固定的雜波譜寬度,頻譜相對于雜波譜中心對稱,幾乎沒有起伏變化,如圖5所示。
由雷達參數可知,多普勒分辨單元為0.14m/s,此時風速等級大致為1~7km/h,對經過恒虛警檢測后頻譜所占的多普勒通道數的最大區(qū)間作出估計,即取0通道附近左右各10個作為雜波處理單元。
圖4 植被頻譜
圖5 建筑物頻譜
根據兩類目標頻譜特征的明顯差異,對植被和建筑物各500個樣本提取二階中心矩、波形熵、頻域歸一化方差3個特征,并畫出相應的分布直方圖。從圖中可看出兩類目標有明顯的差異,植被的頻譜特征二階矩大、波形熵大、幅度方差小;建筑物的頻譜特征為二階矩小、波形熵小,能量集中,幅度方差大。因此所提特征能夠很好地區(qū)分植被和建筑物兩類目標。
目標的多普勒譜X=[X(1),X(2),…,X(N)],其中N為脈沖積累數。設X(n)出現(xiàn)的概率為P(n)。
(3)
3.2.1 二階中心矩
二階中心矩(后面簡稱二階矩)是一種平移、旋轉和尺度不變特征,可用來反映兩類目標的形狀信息。二階矩計算公式表示為:
(4)
圖6 二階矩分布直方圖
3.2.2 波形熵
波形熵(后面簡稱熵)是用來描述信源的平均不確定性。用頻域波形熵來表征頻域能量的散布程度,能量越集中,熵值越小。即熵值也用來作為識別兩類目標的特征之一。
(5)
圖7 波形熵分布直方圖
3.2.3 頻域幅度歸一化方差
植被和建筑物兩類目標頻譜的幅度差異較大,故可提取各自頻譜的方差作為識別的特征之一。由于存在幅度敏感性,將幅度取模值然后進行歸一化處理。方差的一般定義為:
(6)
歸一化方差為:
(7)
圖8 幅度方差分布直方圖
本文通過對某地區(qū)有風條件下的地雜波譜提取的二階矩、波形熵、幅度方差3個特征,采用支持向量機[8]對植被和建筑物的分布情況進行識別分類,驗證所提特征都是有效且穩(wěn)健的。
支持向量機(Support Vector Machine,SVM)是90年代初發(fā)展起來的一種監(jiān)督學習的模式識別技術,對每個類別的已知樣本值進行學習,進而對未知的樣本進行預測?;舅枷霝椋和ㄟ^非線性變換將輸入空間變換到一個高維空間,在這個空間里構造出不同類之間達到最大分類間隔的最優(yōu)超平面即最大間隔分類面,而這種非線性變換是通過定義適當的內積核函數實現(xiàn)的。在基于低分辨雷達回波數據信噪比低,訓練樣本數較少的情況下,SVM能夠得到比其它算法較好的結果,是因為SVM是基于結構風險最小化原則而不是經驗風險最小化,這樣就可以避免過學習的問題,計算復雜度小,泛化能力要比其它算法好。
選取典型植被頻譜的樣本500個,建筑物頻譜的樣本500個,分別提取二階矩、幅度方差、波形熵3類特征,送入支持向量機,圖9給出了兩類樣本三個特征的三維分布圖。隨機選取700個作為訓練樣本,選取合適的參數,得到性能良好的分類器模型。再將剩余300個樣本作為測試樣本,對識別結果做出預測,對分類器性能進行測試,利用SVM的總分類率為99.5%,植被和建筑物的可分性非常好,支持向量的個數為73個,對存儲空間的需求比較小。對整個地區(qū)進行識別分類,首先由統(tǒng)計值可設定強度的閾值為65dB,對雜波強度高于閾值提取相應的頻譜特征,送入訓練好的分類器模型中,可對不同時間段該地區(qū)的植被和建筑物的分布情況進行預測分類。
圖9 樣本分布
對該地區(qū)的17次識別結果,進一步采用上述集成學習-多數投票法進行決策融合,即某個距離單元的的決策結果取決于17次分類器輸出結果中的大多數。最終的場景分類結果如圖10所示,扇形區(qū)域內的深色表示建筑物,淺色扇形表示植被,扇形區(qū)域外的深色部分表示不進行識別分類。與該地區(qū)的Google高清衛(wèi)星地圖進行對比,可較準確的進行場景分類,如圖11所示。因此可驗證所提方法的有效性。
本文通過提取二階矩、波形熵、幅度方差3個特征,在有風條件下對某地區(qū)的植被和建筑物分布情況進行分類識別,通過對實測數據的分析,表明所提特征是有效的、穩(wěn)健的。需要指明的是,本方法的適用條件為有風條件下,建筑物多是低矮的農舍,低速目標的出現(xiàn)以及裸土地也會對兩類目標的分類有一定的影響,以后會考慮進一步提取新的特征,細化分類結果。
圖10 基于二階矩、熵、方差場景分類結果 圖11 地區(qū)高清衛(wèi)星地圖