尹偉石, 楊文紅, 曲福恒
(1. 長(zhǎng)春理工大學(xué) 理學(xué)院, 長(zhǎng)春 130022; 2. 長(zhǎng)春理工大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院, 長(zhǎng)春 130022)
聲波散射問(wèn)題在雷達(dá)、 無(wú)損探傷、 醫(yī)學(xué)成像等領(lǐng)域應(yīng)用廣泛, 目前已得到廣泛關(guān)注. 聲波散射問(wèn)題分為正散射問(wèn)題和反散射問(wèn)題. 正散射問(wèn)題是指對(duì)給定的入射波和散射體確定波場(chǎng)的散射特性, 反散射問(wèn)題是根據(jù)波場(chǎng)的散射特性確定散射體的物理或幾何信息. Kress等[1]提出并證明了無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)具有平移不變性, 因此利用無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)重構(gòu)障礙物的位置十分困難; Zhang等[2]證明了兩個(gè)不同方向的平面波疊加入射可打破無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)的平移不變性, 并用牛頓迭代法重構(gòu)了障礙物形狀; 文獻(xiàn)[3-4]通過(guò)在散射系統(tǒng)中加入?yún)⒖记? 打破了無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)的平移不變性; Sun等[5]提出了兩個(gè)點(diǎn)源疊加入射可以克服無(wú)相位數(shù)據(jù)的平移不變性, 并給出了相應(yīng)的證明. 這些方法使無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)的平移不變性得到解決. 目前, 關(guān)于無(wú)相位數(shù)據(jù)反演障礙物形狀問(wèn)題的研究已有很多結(jié)果: Shin[6]在足夠高的頻率下, 提出了利用無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)重構(gòu)障礙物形狀的迭代算法, 并通過(guò)數(shù)值實(shí)驗(yàn)證明了所提方法的有效性; Zhang等[7]提出了一種直接成像算法, 在固定頻率下, 由多組不同方向的入射波和觀測(cè)點(diǎn)產(chǎn)生的無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)重構(gòu)障礙物的形狀.
近年來(lái), 神經(jīng)網(wǎng)絡(luò)方法在反散射問(wèn)題中被廣泛應(yīng)用[8-13]. Li等[8]提出了一種幾何體生成方法, 根據(jù)輸入的特征參數(shù)生成幾何體, 并通過(guò)數(shù)值實(shí)驗(yàn)證明了該方法可很好地重構(gòu)幾何體; Yin等[9]提出了一種序列對(duì)序列的神經(jīng)網(wǎng)絡(luò)方法, 使用無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)較好地恢復(fù)了障礙物的位置和形狀. 在實(shí)際應(yīng)用中, 遠(yuǎn)場(chǎng)數(shù)據(jù)的相位信息很難獲取, 只能獲取遠(yuǎn)場(chǎng)數(shù)據(jù)的強(qiáng)度或模(無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)), 本文考慮無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)恢復(fù)散射障礙問(wèn)題, 提出一種兩層門控循環(huán)單元(GRU)神經(jīng)網(wǎng)絡(luò)對(duì)門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)的方法(MGNN), 并給出該方法的收斂性分析.
考慮二維聲波散射問(wèn)題, 對(duì)均勻介質(zhì)中的不可穿透障礙物D?2, 總場(chǎng)u(x)∶=u(i)(x)+u(s)(x), 滿足Helmholtz系統(tǒng)[14]:
因此無(wú)法用無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)|u(∞)(x;d,k)|重構(gòu)障礙物的位置和形狀. 為打破無(wú)相位數(shù)據(jù)的平移不變性, 本文考慮用兩組不同方向的平面波, 令
u(i)=u(i)(x;d1j,d2j,k)∶=exp{ikd1j·x}+exp{ikd2j·x},
(4)
本文從機(jī)器學(xué)習(xí)的角度考慮無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)反演障礙物位置及形狀問(wèn)題.
(5)
并定義x=(x(1),x(2),…,x(T))表示{λ11,λ12,…,λnj,…,λΓ1Γ2}, 其中T=Γ1Γ2.
假設(shè)1假設(shè)障礙物D的邊界曲線有以下參數(shù)化形式:
?D:z(t)=(z1(t),z2(t)), 0≤t≤2π,
其中z1(t),z2(t)用下列Fourier的截?cái)嘈问奖硎?
(6)
式中Q∈. 定義y=(y(1),y(2),…,y(M))表示式(6)的系數(shù)a0,b0,aq,bq,q=1,2,…,Q, 其中M=4Q+2.
本文構(gòu)建一種兩層GRU神經(jīng)網(wǎng)絡(luò)對(duì)門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(MGNN)模型, 該模型由多個(gè)GRU神經(jīng)網(wǎng)絡(luò)構(gòu)成. 在訓(xùn)練過(guò)程中,x=(x(1),x(2),…,x(T))為模型的輸入,y=(y(1),y(2),…,y(M))為模型的輸出. 對(duì)輸入向量x=(x(1),x(2),…,x(T))中每個(gè)元素x(t)都先經(jīng)過(guò)兩層的GRU神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取, 并將提取特征作為中間特征進(jìn)行特征記憶, 再將記憶的特征與y(m)經(jīng)過(guò)兩層GRU神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí), 從而完成整個(gè)神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練. 每個(gè)GRU神經(jīng)網(wǎng)絡(luò)的工作狀態(tài)如圖1所示.
圖1 GRU神經(jīng)網(wǎng)絡(luò)示意圖Fig.1 Schematic diagram of GRU neural network
GRU神經(jīng)網(wǎng)絡(luò)的工作過(guò)程由重置門和更新門控制, 圖1中r(t)表示重置門,z(t)表示更新門. 實(shí)現(xiàn)過(guò)程如下:
r(t)=S(Wr[x(t),h(t-1)]),
t時(shí)刻的候選狀態(tài)為:
z(t)=S(Wz[x(t),h(t-1)]),
并計(jì)算出中間狀態(tài)
3) 中間狀態(tài)h(t)經(jīng)過(guò)全連接層得到最終輸出為y(t)=S(Wo·h(t)).
(7)
損失函數(shù)對(duì)權(quán)重的梯度為
(8)
更新模型即為更新模型中的權(quán)重和偏置.
神經(jīng)網(wǎng)絡(luò)第一層、 第二層、 第三層、 第四層的輸入分別為
每層神經(jīng)網(wǎng)絡(luò)的輸入向量為
定義3激活函數(shù)對(duì)于任意向量A=(a1,a2,…an)T, 有G(A)=(g(a1),g(a2),…,g(an))T, 定義
G′(A)=(g′(a1),g′(a2),…,g′(an))T,G″(A)=(g″(a1),g″(a2),…,g″(an))T.
第四層神經(jīng)網(wǎng)絡(luò)重置門的權(quán)重梯度為
由初始條件y(0)恒為0得
(10)
對(duì)任意給定的初始權(quán)重w0, 權(quán)重序列{wk}由以下迭代產(chǎn)生:
wk+1=wk+Δwk,
(11)
其中,
(12)
η>0是學(xué)習(xí)率.
假設(shè)2|g(r)|,|g′(r)|,|g″(r)|和|S(r)|,|S′(r)|,|S″(r)|對(duì)于r∈是一致有界的.
假設(shè)3|wk|(k=0,1,2,…)是一致有界的.
注1假設(shè)2和假設(shè)3對(duì)本文使用的S型激活函數(shù)及雙曲正切激活函數(shù)有效, 且傳統(tǒng)方法經(jīng)常使用假設(shè)3進(jìn)行非線性迭代[12-13], 以確保網(wǎng)絡(luò)是收斂的.
定理1假設(shè)誤差函數(shù)為式(7), 權(quán)重矩陣wt是由式(11)的任意初始權(quán)重w0生成的, 且權(quán)重矩陣wk二次連續(xù)可導(dǎo), 則有:
1)E(wk+1)≤E(wk),k=0,1,2,…;
定理1表明建立的神經(jīng)網(wǎng)絡(luò)模型是收斂的.
注2由式(7),(8)可得
考慮不同迭代次數(shù)的權(quán)重{wk}, 并定義
引理1令Δv(4)(wk,m)=v(4)(wk+1,m)-v(4)(wk,m), 則
(13)
且當(dāng)d=1時(shí), 有
其中
θ(m-d)是Δv(wk,m)和Δv(wk+1,m)的中間量.
證明: 使用歸納法證明式(13), 首先考慮當(dāng)m=1時(shí),
Δv(wk,1)=wk+1u(4)(wk+1,1)-wku(4)(wk,1)=wk+1u(4)(wk,1)-wku(4)(wk,1)=u(4)(wk,1)Δwk
成立. 其次, 假設(shè)
成立, 則只需證明下式成立即可:
引理2若假設(shè)2和假設(shè)3成立, 則‖Δv(wk,t)‖≤C‖Δwk‖.
證明: 使用歸納法. 首先考慮當(dāng)m=1時(shí), 下式成立:
Δv(wk,1)=wk+1u(wk+1,1)-wku(wk,1)=wk+1u(wk,1)-wku(wk,1)=Δwku(wk,1)≤C‖Δwk‖.
假設(shè)‖Δv(wk,m)‖≤C‖Δwk‖成立, 則只需證下式成立即可:
同理可證對(duì)四層神經(jīng)網(wǎng)絡(luò)的權(quán)重也成立.
下面證明定理1. 應(yīng)用Taylor展開(kāi)式(7),(8),(12)以及注2、 引理1和引理2, 有
其中,
τ(m-d)是Δv(wk,m)和Δv(wk+1,m)的中間量. 根據(jù)假設(shè)1、 假設(shè)2、 注2、 引理1和引理2及Cauchy-Schwarz不等式, 有|ρ(wk)|≤C‖Δwk‖2, 因此L(wk+1)-L(wk)≤-(η-C)‖Δwk‖2, 若學(xué)習(xí)率足夠小且滿足0<η<1/C(C是常數(shù)), 則結(jié)論1)成立.
下面通過(guò)數(shù)值實(shí)例說(shuō)明建立的模型可應(yīng)用于無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)重構(gòu)障礙物的形狀, 并通過(guò)數(shù)值實(shí)驗(yàn)驗(yàn)證本文提出的神經(jīng)網(wǎng)絡(luò)模型收斂.
數(shù)據(jù)集的構(gòu)造是機(jī)器學(xué)習(xí)解決反散射問(wèn)題的基礎(chǔ), 本文構(gòu)造無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)與形狀參數(shù)的數(shù)據(jù)集. 障礙物D對(duì)應(yīng)的數(shù)據(jù)由定義1的無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)XD=(XD(1),XD(2),…,XD(T))和假設(shè)1的形狀參數(shù)YD=(YD(1),YD(2),…,YD(M))構(gòu)成. 因此, 引入訓(xùn)練數(shù)據(jù)集
T={(XD,YD);D∈D},
(14)
其中D表示形狀集合. 首先, 對(duì)給定的形狀D, 使用積分方程方法[14]求解系統(tǒng)(1)-(3), 以獲得相關(guān)的無(wú)相遠(yuǎn)場(chǎng)數(shù)據(jù). 其次, 為排除自交邊界曲線和參數(shù)為零的情形, 將式(6)系數(shù)(均勻分布在[-α,α]內(nèi),α∈+為給定的先驗(yàn)常數(shù))用隨機(jī)森林算法[15]進(jìn)行分類處理. 即在第一階段, 訓(xùn)練網(wǎng)絡(luò)以識(shí)別其屬于障礙的類別; 在第二階段, 在給定的障礙類別內(nèi), 通過(guò)給定其無(wú)相遠(yuǎn)場(chǎng)數(shù)據(jù), 訓(xùn)練網(wǎng)絡(luò)以恢復(fù)未知障礙的相應(yīng)Fourier系數(shù).
假設(shè):
1) 入射波u(i)=u(i)(x;d1j,d2j,k)(j=1,2), 兩組不同入射方向的夾角均為π/3;
2) 用實(shí)線表示障礙物的精確邊界, 虛線表示障礙物的預(yù)測(cè)邊界;
3) 障礙物的無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)均由波數(shù)k=1.1,2.1計(jì)算產(chǎn)生的無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù)拼接而成;
4) GRU神經(jīng)網(wǎng)絡(luò)的神經(jīng)元個(gè)數(shù)一般設(shè)為2p(p∈+), 通過(guò)大量實(shí)驗(yàn)確定模型中的參數(shù). 模型中GRU神經(jīng)元個(gè)數(shù)為256個(gè), Dropout為0.5, 批量處理(Batch)為800, 迭代次數(shù)(Epoch)為50.
圖2 花生形狀重構(gòu)Fig.2 Reconstruction of peanut shape
圖3 風(fēng)箏形狀重構(gòu)Fig.3 Reconstruction of kite shape
其次, 分別對(duì)Γ1,Γ2=5的數(shù)據(jù)集加入5%,10%,20%的噪聲(均值為0、 方差為0.05,0.1,0.2的高斯白噪聲), 對(duì)花生和風(fēng)箏形狀進(jìn)行反演, 結(jié)果分別如圖4和圖5所示. 其中, 圖4(A)~(C)和圖5(A)~(C)分別表示加5%,10%,20%噪聲的訓(xùn)練數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)預(yù)測(cè)的花生形狀和風(fēng)箏形狀. 由圖4和圖5可見(jiàn): 加10%以下噪聲時(shí)對(duì)花生和風(fēng)箏形狀的反演結(jié)果無(wú)明顯影響; 當(dāng)增加到20%噪聲時(shí), 反演的障礙物曲線與真實(shí)曲線發(fā)生偏離. 圖6(A),(B)分別為針對(duì)花生形狀和風(fēng)箏形狀迭代次數(shù)繪制的損失函數(shù)曲線(針對(duì)Γ1,Γ2=5的網(wǎng)絡(luò)). 圖6結(jié)果驗(yàn)證了網(wǎng)絡(luò)的收斂性. 對(duì)入射方向及觀測(cè)方向Γ1,Γ2=5產(chǎn)生的無(wú)相位遠(yuǎn)場(chǎng)數(shù)據(jù), 分別選取訓(xùn)練樣本集為2萬(wàn)個(gè)樣本和5萬(wàn)個(gè)樣本進(jìn)行花生形狀重構(gòu)實(shí)驗(yàn), 結(jié)果如圖7所示. 由圖7可見(jiàn), 增加數(shù)據(jù)集的大小, 可使反演結(jié)果更好.
圖4 加噪數(shù)據(jù)對(duì)花生形狀重構(gòu)效果Fig.4 Reconstruction effects of peanut shape with noisy data
圖5 加噪數(shù)據(jù)對(duì)風(fēng)箏形狀重構(gòu)效果Fig.5 Reconstruction effects of kite shape with noisy data
圖6 迭代損失曲線Fig.6 Curves of iteration loss
圖7 2萬(wàn)樣本數(shù)據(jù)集(A)和5萬(wàn)樣本數(shù)據(jù)集(B)的花生形狀重構(gòu)效果Fig.7 Reconstruction effects of peanut shapes data sets with 20 000 (A) and 50 000 (B) samples
綜上可見(jiàn), 兩層GRU神經(jīng)網(wǎng)絡(luò)對(duì)GRU神經(jīng)網(wǎng)絡(luò)的方法能有效恢復(fù)散射障礙的位置和形狀, 本文從理論和數(shù)值實(shí)驗(yàn)兩方面說(shuō)明了算法的收斂性, 為無(wú)相位反散射問(wèn)題提供了一種新的計(jì)算方法.