劉麗娟 陳宇 羅濤等
摘要:全連接神經(jīng)網(wǎng)絡(luò)模型可以擬合復(fù)雜函數(shù)輸入輸出關(guān)系。文章基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)方法,利用COMSOL數(shù)值模擬計(jì)算得到的數(shù)據(jù)集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)能夠預(yù)測(cè)出響應(yīng)未知的虹膜帶通濾波器的透射譜。利用深度學(xué)習(xí)來(lái)解決波導(dǎo)濾波器傳輸特性的計(jì)算,可以避開傳統(tǒng)的數(shù)理方法和麥克斯韋電磁方程的復(fù)雜求解,實(shí)現(xiàn)波導(dǎo)帶通濾波囂的快速預(yù)測(cè)。
關(guān)鍵詞:深度學(xué)習(xí);波導(dǎo)濾波器;虹膜
中圖法分類號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A
1 引言
深度學(xué)習(xí)(Deep learning,DL)是當(dāng)今人工智能領(lǐng)域一顆耀眼的明星。其中,名震天下的AlphaGo 圍棋程序以及智能聊天機(jī)器人CHartGPT 都是使用深度學(xué)習(xí)算法來(lái)實(shí)現(xiàn),可以說(shuō)現(xiàn)代機(jī)器學(xué)習(xí)徹底改變了計(jì)算機(jī)科學(xué)。
近年來(lái),深度學(xué)習(xí)也成功應(yīng)用于物理學(xué),如粒子物理學(xué)[1] 、微納光學(xué)[2~4] 、化學(xué)物理學(xué)。在波與物質(zhì)相互作用中,不同的微結(jié)構(gòu)與波相互作用會(huì)產(chǎn)生不同的效果。波導(dǎo)結(jié)構(gòu)設(shè)計(jì)(改變結(jié)構(gòu)的尺寸、材料、形狀等性質(zhì))在實(shí)現(xiàn)對(duì)波的調(diào)控中起著重要作用。目前,設(shè)計(jì)方法主要有基于數(shù)值模擬方法的電磁建模,但對(duì)于某種特定功能的器件,往往要不斷微調(diào)幾何形狀并反復(fù)執(zhí)行仿真來(lái)接近目標(biāo),計(jì)算資源和時(shí)間都消耗很大。本文基于深度學(xué)習(xí)思路,遵循數(shù)據(jù)驅(qū)動(dòng)的建模思想,不引入人為規(guī)則和設(shè)定,而是通過(guò)學(xué)習(xí)大量的數(shù)據(jù),得到波導(dǎo)傳輸特性與設(shè)計(jì)參數(shù)之間的對(duì)應(yīng)規(guī)律。
2 波導(dǎo)濾波器簡(jiǎn)介
波導(dǎo)濾波器是一種選頻電路,因其結(jié)構(gòu)簡(jiǎn)單、加工方便、損耗低,被廣泛應(yīng)用在通信、雷達(dá)、自動(dòng)測(cè)量設(shè)備等微波設(shè)備中。作為一種經(jīng)常使用的無(wú)源微波濾波器,特別是在大功率、高頻段的天饋系統(tǒng)中有著不可動(dòng)搖的地位。在波導(dǎo)中放置橫向電感膜片作為濾波電抗元件可以增加傳輸帶寬。如圖1 所示,該波導(dǎo)濾波器模型由1 個(gè)WR?90X 波段波導(dǎo)和對(duì)稱的感性膜片組成。通過(guò)設(shè)置合適的結(jié)構(gòu)參數(shù),可以顯示出良好的通帶響應(yīng)和帶外抑制。
3 理論計(jì)算
3.1 基本原理
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的1 個(gè)子集,可以自動(dòng)從圖像、視頻或文本等數(shù)據(jù)中學(xué)習(xí)表征,無(wú)需引入人類領(lǐng)域的知識(shí)。深度學(xué)習(xí)使用多層人工神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)是由輸入和輸出之間節(jié)點(diǎn)的幾個(gè)“隱藏層”組成的網(wǎng)絡(luò)。如圖2 所示,從宏觀層面來(lái)看,人工神經(jīng)網(wǎng)絡(luò)由輸入層(Input layer)、隱藏層(Hidden layer)、輸出層(Output layer)組成。輸入層是原料采購(gòu)部,隱藏層是數(shù)據(jù)加工部,輸出層是數(shù)據(jù)成品部。隱藏層、輸出層由一個(gè)個(gè)圓圈組成,每一個(gè)圓圈就叫節(jié)點(diǎn),也叫神經(jīng)元或感知機(jī)。神經(jīng)網(wǎng)絡(luò)模型每層都存在若干節(jié)點(diǎn)(神經(jīng)元),然后通過(guò)1 個(gè)線性函數(shù)y(x)= W?x+b 連接,其中x 為上一層的矩陣輸出,作為本層的輸入,W 是權(quán)重矩陣,b 為偏差矩陣。通過(guò)多層的線性變換,把一個(gè)多維空間映射為另外一個(gè)多維空間。在f(x)= W?x+b 的基礎(chǔ)上對(duì)輸出結(jié)果再次進(jìn)行處理,增加1 個(gè)非線性函數(shù)(激活函數(shù)),從而可以模擬出非線性函數(shù)。
將y(x)= W?x+b 進(jìn)一步優(yōu)化為y(x)= δ(W?x+b),其中δ 是激活函數(shù)。常見的激活函數(shù)有sigmoid,Tanh,ReLU 等。
深度學(xué)習(xí)網(wǎng)絡(luò)模型的訓(xùn)練有2 道工序,分別為正向傳播(也叫前向傳播)和反向傳播。正向傳播是數(shù)據(jù)從輸入層傳遞到輸出層的過(guò)程,目標(biāo)是得到預(yù)測(cè)值,再得到損失函數(shù)/ 代價(jià)函數(shù)。反向傳播是深度學(xué)習(xí)的靈魂,從損失函數(shù)/ 代價(jià)函數(shù)出發(fā),求偏導(dǎo)數(shù),計(jì)算出w,b 的值。一般而言,使用梯度下降算法來(lái)求解w,b 最小值。
3.2 整體思路
以波導(dǎo)濾波器的結(jié)構(gòu)參數(shù)作為輸入數(shù)據(jù)(xi ),利用深度神經(jīng)網(wǎng)絡(luò)得到預(yù)測(cè)的透射譜線值(yi ),與COMSOL 仿真計(jì)算出的譜線值比較,得到二者均方誤差值,然后用誤差計(jì)算梯度,之后根據(jù)梯度在反向傳播過(guò)程中更新權(quán)重。經(jīng)過(guò)多輪訓(xùn)練學(xué)習(xí),最終找到合適的權(quán)重系數(shù)和閾值系數(shù),從而建立濾波器性能參數(shù)和結(jié)構(gòu)參數(shù)的內(nèi)在規(guī)律。
3.3 數(shù)據(jù)采集
首先提取濾波器的結(jié)構(gòu)特征,結(jié)構(gòu)參數(shù)有波導(dǎo)寬度W,波導(dǎo)長(zhǎng)度L,虹膜片1 的長(zhǎng)度l_iris1,虹膜片2 的長(zhǎng)度l_iris2,虹膜片間距spacing,虹膜厚度d。利用COMSOL 對(duì)光學(xué)濾波器進(jìn)行模擬計(jì)算,在指定的值域范圍內(nèi)等間隔掃描模型的結(jié)構(gòu)參數(shù),得到其透射系數(shù),構(gòu)成數(shù)據(jù)集。
3.4 模型架構(gòu)與訓(xùn)練
構(gòu)造的神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)為1 個(gè)輸入層、1 個(gè)輸出層以及3 層隱藏層,輸入層包含6 個(gè)神經(jīng)元,中間的3 層隱藏層的神經(jīng)元個(gè)數(shù)分別定義為600,100,50,得到1 個(gè)6?600?100?50?33 的全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。100 次迭代后損失函數(shù)穩(wěn)定在0.04,如圖3 所示。
神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成后,將未訓(xùn)練的測(cè)試數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行驗(yàn)證。
4 結(jié)果分析
利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的波導(dǎo)透射譜線結(jié)果與COMSOL 結(jié)果的仿真結(jié)果進(jìn)行對(duì)比驗(yàn)證,如圖4 所示,預(yù)測(cè)的透射譜線線型與仿真的結(jié)果整體趨勢(shì)相似,但是存在一定的偏移量。偏差來(lái)源主要有2 點(diǎn):(1)訓(xùn)練的模型沒有進(jìn)一步優(yōu)化;(2)訓(xùn)練數(shù)據(jù)的體量不夠。
5 結(jié)束語(yǔ)
利用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型在一定誤差范圍可以預(yù)測(cè)波導(dǎo)濾波器的透射譜線,作為一種數(shù)據(jù)驅(qū)動(dòng)的建模方法,其提升了波導(dǎo)虹膜濾波器傳輸響應(yīng)的計(jì)算效率,節(jié)約了計(jì)算資源。
參考文獻(xiàn):
[1] WIGLEY P B, EVERITT P J, BASTIAN J W, et al. Fastmachine?learning online optimization of ultra?cold?atomexperiments[J].Scientific reports,2016,6(1):25890.
[2] MALKIEL I, MREJEN M, NAGLER A, et al. Plasmonicnanostructure design and characterization via Deep Learning[J].Light: Science & Applications,2018,7(1):1?8.
[3] DAI P,WANG Y,HU Y,et al. Accurate inverse design ofFabry – Perot?cavity?based color filters far beyond sRGB viaabidirectional artificial neural network [ J ]. PhotonicsResearch,2021,9(5):22?33.
[4] 吳海蓮.基于深度學(xué)習(xí)原理的介質(zhì)濾波器傳輸特性研究與設(shè)計(jì)[D].北京:北京郵電大學(xué),2020.
作者簡(jiǎn)介:劉麗娟( 2002—), 本科, 研究方向: 數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)。