劉麗娟 陳宇 羅濤等
摘要:全連接神經(jīng)網(wǎng)絡(luò)模型可以擬合復雜函數(shù)輸入輸出關(guān)系。文章基于深度學習神經(jīng)網(wǎng)絡(luò)方法,利用COMSOL數(shù)值模擬計算得到的數(shù)據(jù)集對神經(jīng)網(wǎng)絡(luò)進行訓練,訓練好的神經(jīng)網(wǎng)絡(luò)能夠預測出響應(yīng)未知的虹膜帶通濾波器的透射譜。利用深度學習來解決波導濾波器傳輸特性的計算,可以避開傳統(tǒng)的數(shù)理方法和麥克斯韋電磁方程的復雜求解,實現(xiàn)波導帶通濾波囂的快速預測。
關(guān)鍵詞:深度學習;波導濾波器;虹膜
中圖法分類號:TP183 文獻標識碼:A
1 引言
深度學習(Deep learning,DL)是當今人工智能領(lǐng)域一顆耀眼的明星。其中,名震天下的AlphaGo 圍棋程序以及智能聊天機器人CHartGPT 都是使用深度學習算法來實現(xiàn),可以說現(xiàn)代機器學習徹底改變了計算機科學。
近年來,深度學習也成功應(yīng)用于物理學,如粒子物理學[1] 、微納光學[2~4] 、化學物理學。在波與物質(zhì)相互作用中,不同的微結(jié)構(gòu)與波相互作用會產(chǎn)生不同的效果。波導結(jié)構(gòu)設(shè)計(改變結(jié)構(gòu)的尺寸、材料、形狀等性質(zhì))在實現(xiàn)對波的調(diào)控中起著重要作用。目前,設(shè)計方法主要有基于數(shù)值模擬方法的電磁建模,但對于某種特定功能的器件,往往要不斷微調(diào)幾何形狀并反復執(zhí)行仿真來接近目標,計算資源和時間都消耗很大。本文基于深度學習思路,遵循數(shù)據(jù)驅(qū)動的建模思想,不引入人為規(guī)則和設(shè)定,而是通過學習大量的數(shù)據(jù),得到波導傳輸特性與設(shè)計參數(shù)之間的對應(yīng)規(guī)律。
2 波導濾波器簡介
波導濾波器是一種選頻電路,因其結(jié)構(gòu)簡單、加工方便、損耗低,被廣泛應(yīng)用在通信、雷達、自動測量設(shè)備等微波設(shè)備中。作為一種經(jīng)常使用的無源微波濾波器,特別是在大功率、高頻段的天饋系統(tǒng)中有著不可動搖的地位。在波導中放置橫向電感膜片作為濾波電抗元件可以增加傳輸帶寬。如圖1 所示,該波導濾波器模型由1 個WR?90X 波段波導和對稱的感性膜片組成。通過設(shè)置合適的結(jié)構(gòu)參數(shù),可以顯示出良好的通帶響應(yīng)和帶外抑制。
3 理論計算
3.1 基本原理
深度學習是機器學習的1 個子集,可以自動從圖像、視頻或文本等數(shù)據(jù)中學習表征,無需引入人類領(lǐng)域的知識。深度學習使用多層人工神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)是由輸入和輸出之間節(jié)點的幾個“隱藏層”組成的網(wǎng)絡(luò)。如圖2 所示,從宏觀層面來看,人工神經(jīng)網(wǎng)絡(luò)由輸入層(Input layer)、隱藏層(Hidden layer)、輸出層(Output layer)組成。輸入層是原料采購部,隱藏層是數(shù)據(jù)加工部,輸出層是數(shù)據(jù)成品部。隱藏層、輸出層由一個個圓圈組成,每一個圓圈就叫節(jié)點,也叫神經(jīng)元或感知機。神經(jīng)網(wǎng)絡(luò)模型每層都存在若干節(jié)點(神經(jīng)元),然后通過1 個線性函數(shù)y(x)= W?x+b 連接,其中x 為上一層的矩陣輸出,作為本層的輸入,W 是權(quán)重矩陣,b 為偏差矩陣。通過多層的線性變換,把一個多維空間映射為另外一個多維空間。在f(x)= W?x+b 的基礎(chǔ)上對輸出結(jié)果再次進行處理,增加1 個非線性函數(shù)(激活函數(shù)),從而可以模擬出非線性函數(shù)。
將y(x)= W?x+b 進一步優(yōu)化為y(x)= δ(W?x+b),其中δ 是激活函數(shù)。常見的激活函數(shù)有sigmoid,Tanh,ReLU 等。
深度學習網(wǎng)絡(luò)模型的訓練有2 道工序,分別為正向傳播(也叫前向傳播)和反向傳播。正向傳播是數(shù)據(jù)從輸入層傳遞到輸出層的過程,目標是得到預測值,再得到損失函數(shù)/ 代價函數(shù)。反向傳播是深度學習的靈魂,從損失函數(shù)/ 代價函數(shù)出發(fā),求偏導數(shù),計算出w,b 的值。一般而言,使用梯度下降算法來求解w,b 最小值。
3.2 整體思路
以波導濾波器的結(jié)構(gòu)參數(shù)作為輸入數(shù)據(jù)(xi ),利用深度神經(jīng)網(wǎng)絡(luò)得到預測的透射譜線值(yi ),與COMSOL 仿真計算出的譜線值比較,得到二者均方誤差值,然后用誤差計算梯度,之后根據(jù)梯度在反向傳播過程中更新權(quán)重。經(jīng)過多輪訓練學習,最終找到合適的權(quán)重系數(shù)和閾值系數(shù),從而建立濾波器性能參數(shù)和結(jié)構(gòu)參數(shù)的內(nèi)在規(guī)律。
3.3 數(shù)據(jù)采集
首先提取濾波器的結(jié)構(gòu)特征,結(jié)構(gòu)參數(shù)有波導寬度W,波導長度L,虹膜片1 的長度l_iris1,虹膜片2 的長度l_iris2,虹膜片間距spacing,虹膜厚度d。利用COMSOL 對光學濾波器進行模擬計算,在指定的值域范圍內(nèi)等間隔掃描模型的結(jié)構(gòu)參數(shù),得到其透射系數(shù),構(gòu)成數(shù)據(jù)集。
3.4 模型架構(gòu)與訓練
構(gòu)造的神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)為1 個輸入層、1 個輸出層以及3 層隱藏層,輸入層包含6 個神經(jīng)元,中間的3 層隱藏層的神經(jīng)元個數(shù)分別定義為600,100,50,得到1 個6?600?100?50?33 的全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。100 次迭代后損失函數(shù)穩(wěn)定在0.04,如圖3 所示。
神經(jīng)網(wǎng)絡(luò)訓練完成后,將未訓練的測試數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)進行驗證。
4 結(jié)果分析
利用訓練好的神經(jīng)網(wǎng)絡(luò)預測的波導透射譜線結(jié)果與COMSOL 結(jié)果的仿真結(jié)果進行對比驗證,如圖4 所示,預測的透射譜線線型與仿真的結(jié)果整體趨勢相似,但是存在一定的偏移量。偏差來源主要有2 點:(1)訓練的模型沒有進一步優(yōu)化;(2)訓練數(shù)據(jù)的體量不夠。
5 結(jié)束語
利用深度學習神經(jīng)網(wǎng)絡(luò)模型在一定誤差范圍可以預測波導濾波器的透射譜線,作為一種數(shù)據(jù)驅(qū)動的建模方法,其提升了波導虹膜濾波器傳輸響應(yīng)的計算效率,節(jié)約了計算資源。
參考文獻:
[1] WIGLEY P B, EVERITT P J, BASTIAN J W, et al. Fastmachine?learning online optimization of ultra?cold?atomexperiments[J].Scientific reports,2016,6(1):25890.
[2] MALKIEL I, MREJEN M, NAGLER A, et al. Plasmonicnanostructure design and characterization via Deep Learning[J].Light: Science & Applications,2018,7(1):1?8.
[3] DAI P,WANG Y,HU Y,et al. Accurate inverse design ofFabry – Perot?cavity?based color filters far beyond sRGB viaabidirectional artificial neural network [ J ]. PhotonicsResearch,2021,9(5):22?33.
[4] 吳海蓮.基于深度學習原理的介質(zhì)濾波器傳輸特性研究與設(shè)計[D].北京:北京郵電大學,2020.
作者簡介:劉麗娟( 2002—), 本科, 研究方向: 數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)。