孟非,王旭
基于PSO-BP神經(jīng)網(wǎng)絡(luò)的DOA估計(jì)方法?
孟非,王旭
(江蘇科技大學(xué)電子信息學(xué)院,江蘇鎮(zhèn)江212003)
提出利用粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)來改善來波到達(dá)角估計(jì)性能的方法。傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu),因此采用粒子群算法對(duì)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行優(yōu)化,并將其應(yīng)用到來波到達(dá)角估計(jì)中。所提方法僅利用陣列協(xié)方差矩陣的第一行作為來波方位特征,與常用的協(xié)方差矩陣上三角特征相比,在不損失有效方位信息的基礎(chǔ)上使特征維數(shù)極大降低。仿真實(shí)驗(yàn)證明:同經(jīng)典的RBF神經(jīng)網(wǎng)絡(luò)方法相比,基于所提方法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)更簡(jiǎn)潔,泛化性能更好,來波方位估計(jì)精度更高。
波達(dá)角估計(jì);粒子群算法;神經(jīng)網(wǎng)絡(luò);特征維數(shù)
在無源定位、聲納陣列測(cè)向、地震和地質(zhì)資源探測(cè)以及移動(dòng)通信等諸多研究領(lǐng)域,來波信號(hào)到達(dá)角估計(jì)問題是一個(gè)熱點(diǎn)問題[1]。在過去的幾十年中,一些高性能和高分辨率的算法得到了重大發(fā)展,如傳統(tǒng)的MUSIC算法、ESPRIT算法等。盡管它們提供了合理有效的估計(jì),但是需要進(jìn)行大量的計(jì)算,進(jìn)而消耗大量的時(shí)間,不能達(dá)到實(shí)時(shí)性的要求。
隨著計(jì)算智能技術(shù)的飛速發(fā)展,人們開始研究通過學(xué)習(xí)大量的樣本來解決來波到達(dá)角估計(jì)問題,而神經(jīng)絡(luò)無疑被人們認(rèn)為是解決這一問題的強(qiáng)有力工具。神經(jīng)網(wǎng)絡(luò)因其非線性映射及泛化能力可以用于來波到達(dá)角估計(jì)問題,其優(yōu)點(diǎn)在于建模過程是采用訓(xùn)練樣本構(gòu)造神經(jīng)網(wǎng)絡(luò),而不再是精確的數(shù)學(xué)方程式,在實(shí)際情況下采集到的訓(xùn)練樣本可以將噪聲、信號(hào)模型、信噪比、傳輸通道等因素考慮進(jìn)去,而無需進(jìn)行特征值分解、譜峰搜索,且計(jì)算可以并行快速實(shí)現(xiàn),從而有望應(yīng)用到實(shí)際工程。文獻(xiàn)[2-6]采用了RBF神經(jīng)網(wǎng)絡(luò)來解決來波到達(dá)角估計(jì)問題,無論在估計(jì)精度和估計(jì)時(shí)間上都優(yōu)于MUSIC算法[7]。
BP神經(jīng)網(wǎng)絡(luò)也能夠解決DOA估計(jì)問題,但BP算法容易陷入局部最小點(diǎn),不能夠很好地得到理想的效果。本文首先運(yùn)用粒子群算法來優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)閾值,然后再用BP算法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以達(dá)到尋找全局最小值的目的;其次,僅利用陣列協(xié)方差矩陣的第一行作為來波方位特征,與常用的協(xié)方差矩陣上三角特征相比,在不損失有效方位信息的基礎(chǔ)上使特征維數(shù)極大降低,大大簡(jiǎn)化了DOA估計(jì)模型中神經(jīng)網(wǎng)絡(luò)的輸入維數(shù)。同RBF神經(jīng)網(wǎng)絡(luò)相比,本文方法在處理DOA估計(jì)問題時(shí)具有更好的精確度。
2.1粒子群算法的簡(jiǎn)單介紹
PSO算法是一種基于群體智能的進(jìn)化算法[8],其思想來源于人工生命和進(jìn)化計(jì)算理論,最早是受鳥群覓食行為的啟發(fā)提出的。PSO算法采用實(shí)數(shù)求解,并且需要調(diào)整的參數(shù)較少,易于實(shí)現(xiàn),是一種通用的全局搜索算法。它的優(yōu)勢(shì)在于簡(jiǎn)單容易實(shí)現(xiàn),同時(shí)又有深刻的智能背景,既適合科學(xué)研究,又特別適合工程應(yīng)用。PSO算法的基本公式如下:
式中,ω為慣性權(quán)重;c1和c2被稱為學(xué)習(xí)因子;rand()為介于(0,1)的隨機(jī)數(shù),這幾個(gè)參數(shù)決定了粒子群優(yōu)化的開發(fā)能力和探測(cè)能力分別為粒子i在第k次迭代中第d維的速度和位置,兩者均被限制在一定的范圍內(nèi);pbest為粒子i在第d維的個(gè)體極值的位置;gbes為群體在第d維的全局極值的位置。
2.2PSO-BP組合模型核心思想
BP算法是由信號(hào)的正向傳播和誤差的反向傳播兩個(gè)過程組成,正向傳播時(shí),輸入樣本從輸入層傳入,然后經(jīng)各隱層處理后傳向輸出層。如果輸出層的實(shí)際輸入與期望輸出不相符,則將轉(zhuǎn)到誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱層向輸入層逐層反傳,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號(hào),此誤差信號(hào)即作為修正各單元權(quán)閾值的依據(jù)。這種信號(hào)正向傳播與誤差反向傳播的權(quán)閾值調(diào)整過程是周而復(fù)始地進(jìn)行的。權(quán)閾值不斷調(diào)整過程就是網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過程,直至訓(xùn)練網(wǎng)絡(luò)輸出達(dá)到預(yù)期的要求為止。
從BP算法的整個(gè)學(xué)習(xí)過程可以看出,其在學(xué)習(xí)過程中沒有引入任何額外參數(shù),其學(xué)習(xí)過程完全是根據(jù)訓(xùn)練樣本對(duì)初始權(quán)閾值的調(diào)整,所以最初權(quán)閾值選取的好壞將會(huì)直接影響到最終模型的泛化能力。最近的研究表明,對(duì)BP模型的初始權(quán)閾值首先采用一定的方法進(jìn)行優(yōu)化,然后再采用BP算法進(jìn)行二次優(yōu)化確定權(quán)閾值,最終可以有效提高模型的運(yùn)行效率。因此,本文在事先已經(jīng)確定好的BP
神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上,將粒子群優(yōu)化算法與BP算法結(jié)合,采用粒子群算法尋找神經(jīng)網(wǎng)絡(luò)的初始權(quán)值與閾值,接著再采用改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法來訓(xùn)練經(jīng)過粒子群算法尋優(yōu)的初始權(quán)值與閾值,得到模型最終的權(quán)值與閾值,從而形成最終模型。利用此種方法構(gòu)造的模型可以有效地克服單純BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)穩(wěn)定性差、可靠性低與易陷入局部極小等問題。
采用PSO-BP組合算法模型對(duì)信號(hào)來波到達(dá)角進(jìn)行預(yù)測(cè)的步驟如下。
(1)確定粒子群規(guī)模,即粒子的個(gè)數(shù)m和維數(shù)n。本文選取粒子的個(gè)數(shù)為m=50,假設(shè)神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)為M-N-2,則粒子的維數(shù)n=(M+N)×
N+(N+1)×2。
(2)學(xué)習(xí)因子c1和c2以及慣性權(quán)重ω的確定。學(xué)習(xí)因子決定了粒子群優(yōu)化的開發(fā)能力和探測(cè)能力,本文中取c1=c2=2。慣性權(quán)重ω用來控制粒子以前速度對(duì)當(dāng)前速度的影響,它將影響粒子的全局搜索能力和局部搜索能力,為使粒子保持運(yùn)動(dòng)慣性,使其有能力探索新的區(qū)域,本文采取線性遞減權(quán)值策略,如式(3)所示:
式中,Tmax為最大進(jìn)化代數(shù),t為當(dāng)前進(jìn)化代數(shù),w0為初始慣性權(quán)值,wend為迭代至最大代數(shù)時(shí)的慣性權(quán)值。其中w0=0.95,wend=0.4,Tmax=500。
(3)確定適應(yīng)度函數(shù)。以訓(xùn)練均方誤差函數(shù)E作為粒子的適應(yīng)度評(píng)價(jià)函數(shù),即:
式中,N為訓(xùn)練的樣本數(shù),yi(real)為第i個(gè)樣本的實(shí)際值,yi為第i個(gè)樣本的模型輸出值。因此,算法迭代停止時(shí)適應(yīng)度最低的粒子對(duì)應(yīng)的位置,即為問題所求的最優(yōu)解。
(4)更新粒子的位置與速度,計(jì)算出算法的誤差。
(5)判斷誤差是否滿足預(yù)設(shè)精度或迭代是否達(dá)到最大次數(shù)。若誤差滿足預(yù)設(shè)精度,算法收斂,最后一次迭代的全局最優(yōu)值中每一維的權(quán)值和閾值就是所求的最優(yōu)解;若迭代次數(shù)未達(dá)到最大,返回步驟4,算法繼續(xù)迭代,否則算法終止。
(6)以粒子群算法優(yōu)化得到的權(quán)值和閾值作為網(wǎng)絡(luò)初始值,利用BP算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)達(dá)到指定精度,以此建立DOA估計(jì)的預(yù)測(cè)模型。
假設(shè)有M個(gè)天線組成的均勻線性陣列,K個(gè)非相干的窄帶信號(hào)源以{θ1θ2…θK}的角度入射到天線陣列上,利用波的傳播過程的關(guān)系,則第i個(gè)天線陣元接收到的信號(hào)可表示為
其中,sm是第m個(gè)窄帶信號(hào),ni(t)是第i個(gè)天線陣元接收到的噪聲,ω0是信號(hào)源中心頻率,d為天線陣元之間的間距,c是光速。將式(3)以矩陣的方式表示出來:
其中,A是M×K的信號(hào)導(dǎo)向矩陣。
假設(shè)噪聲信號(hào)是獨(dú)立于窄帶信號(hào)S(t)的均值為0、方差為σ2的高斯白噪聲,那么接收信號(hào)的空間關(guān)聯(lián)矩陣R可表示如下:
在這里需要對(duì)神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行改變,多數(shù)文獻(xiàn)中神經(jīng)網(wǎng)絡(luò)的輸入為協(xié)方差矩陣的上(下)三角矩陣,而本文中神經(jīng)網(wǎng)絡(luò)的輸入只取協(xié)方差矩陣的第一行,具體原因如下:假設(shè)忽略每個(gè)協(xié)方差矩陣上面的噪聲,任意兩個(gè)陣元的協(xié)方差可表示為
其中Xi(t)=αiS(t)Xl(t)=αlS(t),那么
在這里,定義P=E{S(t)S(t)H},那么Pil= E{Si(t)Sl(t)*},其中*代表復(fù)共軛。因此,當(dāng)所接收的信號(hào)源互為非相干時(shí),那么
如果式(17)可以寫成如下形式:αPαHβPγH= βPαHαPγH,則公式(15)就可以變?yōu)?/p>
從公式(18)中可以看到,當(dāng)接收信號(hào)源互為非相干時(shí),協(xié)方差矩陣的第一行足以代表整個(gè)協(xié)方差矩陣的所有信息,因此,本文只取協(xié)方差矩陣的第一行作為每個(gè)樣本的神經(jīng)網(wǎng)絡(luò)的輸入,即神經(jīng)網(wǎng)絡(luò)的特征輸入維數(shù)為2M-1個(gè)。基于神經(jīng)網(wǎng)絡(luò)的DOA估計(jì)框圖如圖1所示。
圖1 基于神經(jīng)網(wǎng)絡(luò)的DOA估計(jì)框圖Fig.1 Block diagram of DOA estimation based on NN
4.1仿真實(shí)驗(yàn)1
仿真條件:天線陣元個(gè)數(shù)M為5,兩個(gè)非相干的正弦信號(hào)源,信噪比為10 dB,快拍數(shù)為500,陣元間距為半波長(zhǎng)。那么,以大多數(shù)文獻(xiàn)中采用的RBF神經(jīng)網(wǎng)絡(luò)方法,神經(jīng)網(wǎng)絡(luò)的輸入個(gè)數(shù)為2M(M-1),即為40個(gè),而按照本文的方法,神經(jīng)網(wǎng)絡(luò)的輸入個(gè)數(shù)為2M-1,即為9個(gè),這樣大大減少了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度。
訓(xùn)練樣本:兩個(gè)信號(hào)源的間隔為20°和25°;測(cè)試樣本:兩個(gè)信號(hào)源間隔為22°。以間隔20°為例,也就是說,當(dāng)?shù)谝粋€(gè)信號(hào)源為-90°時(shí),第二個(gè)信號(hào)源為-70°;第一個(gè)信號(hào)源為-89°時(shí),第二個(gè)信號(hào)源為-69°,以此類推,覆蓋整個(gè)[-90°~90°]范圍。另外,RBF方法中采用的隱層神經(jīng)元個(gè)數(shù)為40個(gè),而本方法中采用的隱層神經(jīng)元個(gè)數(shù)僅為10個(gè)。圖2和圖3給出了RBF方法在處理DOA估計(jì)時(shí)的輸出預(yù)測(cè)曲線和誤差曲線,圖4和圖5分別給出了本文方法在處理DOA估計(jì)的輸出預(yù)測(cè)曲線和誤差曲線。
圖2 基于RBFNN的DOA估計(jì)輸出預(yù)測(cè)曲線Fig.2 The forecast error curve of DOA estimation based on RBFNN
圖3 基于RBFNN的DOA估計(jì)輸出誤差曲線Fig.3 The output error curve of DOA estimation based on RBFNN
圖4 基于PSO-BPNN的DOA估計(jì)輸出預(yù)測(cè)曲線Fig.4 The forecast error curve of DOA estimation based on PSO-BPNN
圖5 基于PSO-BPNN的DOA估計(jì)輸出誤差曲線Fig.5 The output error curve of DOA estimation based on PSO-BPNN
從上述圖中可以看出,盡管PSO-BP神經(jīng)網(wǎng)絡(luò)的隱層神經(jīng)元的個(gè)數(shù)僅僅是RBF神經(jīng)網(wǎng)絡(luò)的一半,但與RBF神經(jīng)網(wǎng)絡(luò)相比,本文方法的精確度更高。
4.2仿真實(shí)驗(yàn)2
考察不同信噪比對(duì)DOA估計(jì)性能的影響。仿真條件:在上述兩種方法的基礎(chǔ)上,天線陣元M= 10,信號(hào)源N=2,快拍數(shù)L=500。
訓(xùn)練樣本:兩信號(hào)源間隔為10°和15°;測(cè)試樣本:兩信號(hào)源間隔為12°。依次估計(jì)上述條件兩種方法在信噪比為-5 dB、0 dB、5 dB、10 dB、15 dB、20 dB、25 dB下的均方誤差。具體仿真結(jié)果如圖6所示。從圖6中可以看到:隨著信噪比的增大,均方誤差逐漸減小,-5~15 dB之間,MSE變化得比較大;15 dB以后,MSE逐漸趨于平穩(wěn),在低信噪比下,本文方法的處理效果明顯好于RBF神經(jīng)網(wǎng)絡(luò)的處理效果。
圖6 不同信噪比下兩種方法的均方誤差Fig.6 The MSE of two methods in different SNRs
本文主要利用粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)來解決DOA估計(jì)問題。本文在用PSO-BP神經(jīng)網(wǎng)絡(luò)解決DOA估計(jì)問題時(shí),神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜度大大降低,從而提高了神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度。一方面,PSO-BP神經(jīng)網(wǎng)絡(luò)的輸入僅取協(xié)方差矩陣的第一行,減少了神經(jīng)網(wǎng)絡(luò)的輸入特征維數(shù);另一方面,PSO-BP神經(jīng)網(wǎng)絡(luò)所需隱層神經(jīng)元個(gè)數(shù)大大少于RBF神經(jīng)網(wǎng)絡(luò)所采用的個(gè)數(shù)。另外,本文方法的唯一缺點(diǎn)是,運(yùn)用粒子群算法訓(xùn)練BP算法需要花費(fèi)一定量的時(shí)間(約15 min),但訓(xùn)練是離線的,并不影響DOA估計(jì)的實(shí)時(shí)性。因此,利用本文方法處理DOA估計(jì)問題具有更好的優(yōu)越性。
[1]Li Bai,Peng C Y,Biswas S.Association of DOA Estimation from Two ULAs[J].IEEE Transactions on Instrumentation and Measurement,2008,57(6):1094-1101.
[2]Zooghby A H,Christotodoulou C G.Performance of Radial-Basis Function Networks for Direction of Arrival Estimation with Antenna Arrays[J].IEEE Transactions on Antennas and Propagation,1997,45(11):1611-1617.
[3]Zooghby A H,Christotodoulou C G.A Neural Network-Based Smart Antenna for Multiple Source Tracking[J].IEEE Transactions on Antennas and Propagation,2000,48(5):768 -776.
[4]Vigneshwaran S,Sundararajan N.Direction of Arrival Estimation Under Array Sensor Failures Using a Minimal Resource Allocation Neural Network[J].IEEE Transactions on Antennas and Propagation,2007,55(2):334-343.
[5]張旻,李鵬飛.基于分層神經(jīng)網(wǎng)絡(luò)的寬頻段DOA估計(jì)方法[J].電子與信息學(xué)報(bào),2009,31(9):2118-2122.
ZHANG Min,LI Peng-fei.A Broadband Direction of Arrival Estimation Approach Based on Hirearchy Neural Networks[J].Journal of Electronics and Information Technology,2009,31(9):2118-2122.(in Chinese)
[6]Kuwahra Matsumoto.Experiments of direction finder by RBF neural network with postprocessing[J].IEEE Electronic Letters,2005,41(10):24-25.
[7]盧新文.基于提升小波算子的MUSIC法的DOA估計(jì)[J].電訊技術(shù),2010,50(12):33-38.
LU Xin-wen.DOA Estimation with Music Algorithm Based on Lifting Wavelet Operator[J].Telecommunication Engineering,2010,50(12):33-38.(in Chinese)
[8]Kennedy J,Eberhart R.Particle Swarm Optimization[C]//Proceedings of 1995 IEEE International Conference on Neural Networks.Perth,Australia:IEEE,1995:1942-1948.
MENG Fei was born in Shenyang,Liaoning Province,in 1977.She is now a lecturer.Her research concerns computational intelligence technologies and its applications.
王旭(1986—),男,河南洛陽人,2009年獲學(xué)士學(xué)位,現(xiàn)為碩士研究生,主要研究方向?yàn)殛嚵行盘?hào)處理技術(shù)。
WANG Xu was born in Luoyang,Henan Province,in 1986.He received the B.S.degree in 2009.He is now a graduate student. His research direction is array signal processing.
Email:andyluck1234@126.com
DOA Estimation Method Based on PSO-BP Neural Network
MENG Fei,WANG Xu
(School of Electronics and Information,Jiangsu University of Science and Technology,Zhenjiang 212003,China)
Particle swarm optimization(PSO)is used for optimization of BP neural network to improve the performance of direction of arrival(DOA)estimation.Due to the fact that BP neural network is inclined to be trapped in local minimum point,a novel network-PSO based BP neural network is proposed and applied to DOA estimation.This method uses the first row of correlation matrix instead of commonly used upper triangular half of the covariance matrix,therefore the feature dimension is largely reduced without losing any DOA information.Experimental results show that the performance of the proposed method is much better than that of classic RBF method in terms of neural network size,generalization and estimation precision.
DOA estimation;particle swarm optimization;neural network;feature dimension
The National Defense Science and Technology Pre-research Program(10J3.5.2)
TN911.72
A
10.3969/j.issn.1001-893x.2012.05.018
孟非(1977-),女,遼寧沈陽人,講師,主要研究方向?yàn)橛?jì)算智能技術(shù)及其應(yīng)用;
1001-893X(2012)05-0694-05
2011-10-15;
2012-02-22
國(guó)防科技預(yù)研項(xiàng)目(10J3.5.2)