徐啟偉 王佩佩 曾鎮(zhèn)佳 黃澤斌 周新星 劉俊敏 李瑛 陳書青 范滇元
1) (深圳技術(shù)大學(xué)新材料與新能源學(xué)院, 深圳 518118)
2) (深圳大學(xué)二維材料光電科技國際合作聯(lián)合實(shí)驗(yàn)室, 廣東省二維材料信息功能器件與系統(tǒng)工程技術(shù)研究中心, 深圳 518060)
3) (湖南師范大學(xué)物理與電子學(xué)院量子效應(yīng)及其應(yīng)用協(xié)同創(chuàng)新中心, 長沙 410081)
光束在自由空間中傳播時(shí)容易受到大氣湍流的影響, 其對(duì)傳輸光束的影響相當(dāng)于附加一個(gè)隨機(jī)噪聲相位, 導(dǎo)致傳輸光束質(zhì)量下降.本文提出了一種基于深度卷積神經(jīng)網(wǎng)絡(luò) (convolutional neural network, CNN)的湍流相位信息提取方法, 該方法采用受湍流影響的光強(qiáng)圖為特征提取對(duì)象, 經(jīng)過對(duì)海量樣本進(jìn)行自主學(xué)習(xí)后,CNN的損失函數(shù)值收斂到0.02左右, 其在測試集上的平均損失函數(shù)值低于0.03.訓(xùn)練好的CNN模型具有很好的泛化能力, 可以直接根據(jù)輸入的光強(qiáng)圖準(zhǔn)確提取出湍流相位.利用I5-8500 CPU, 預(yù)測三種湍流強(qiáng)度的湍流相位所需要的平均時(shí)間低至 5 ×10?3s .此外, CNN的湍流相位提取能力可以通過提高計(jì)算能力或者優(yōu)化模型結(jié)構(gòu)來進(jìn)一步提升.這些結(jié)果表明, 基于CNN的湍流相位提取方法能夠有效的提取湍流相位, 在湍流補(bǔ)償、大氣湍流特性研究和圖像重構(gòu)等方面具有重要的應(yīng)用價(jià)值.
光在自由空間傳輸過程中不可避免地會(huì)受到大氣湍流效應(yīng)的影響[1?6], 在天文目標(biāo)觀測過程中,大氣湍流使得目標(biāo)成像模糊, 光能分散, 分辨率嚴(yán)重受限[7]; 激光光束在傳輸過程中受到大氣湍流的影響會(huì)導(dǎo)致光束發(fā)生隨機(jī)漂移[8]; 在自由空間光通信系統(tǒng) (free space optical communications, FSO)中, 大氣湍流容易使信號(hào)光發(fā)生相位畸變, 引發(fā)模式串?dāng)_, 使得FSO系統(tǒng)誤碼率上升[9].于是有許多學(xué)者提出了抑制大氣湍流影響的解決方案[10,11].在糾正大氣湍流的影響時(shí)往往需要預(yù)先知道所受大氣湍流的具體信息, 而傳輸光束受湍流影響后相當(dāng)于附加了一個(gè)隨機(jī)湍流相位, 因此從畸變的光束中提取湍流信息實(shí)際上也就是提取湍流相位.傳統(tǒng)的湍流相位提取方法多采用Gerchberg-Saxton (GS)算法[12], Fu等[13]利用CCD相機(jī)采集受大氣湍流影響的高斯光束的強(qiáng)度分布, 利用GS算法最終可以得到影響高斯光束的湍流相位.但是, 傳統(tǒng)的GS算法無記憶性, 即每次預(yù)測都需要重新設(shè)置初始相位進(jìn)行多次迭代, 并且容易出現(xiàn)迭代停滯.另外, 利用隨機(jī)并行梯度下降算法的自適應(yīng)光學(xué)技術(shù)補(bǔ)償大氣湍流效應(yīng)[14]也是一種可行的方法, 但是隨機(jī)并行梯度下降算法收斂效果和速度易受增益系數(shù)的影響.若增益系數(shù)選擇不正確易使優(yōu)化曲線陷入局部極值, 增加了湍流補(bǔ)償系統(tǒng)的不穩(wěn)定性.
解決傳統(tǒng)的相位提取方案中存在的這些問題,關(guān)鍵在于準(zhǔn)確提取畸變光強(qiáng)中攜帶的湍流相位特征,而特征提取正是近幾年各種深層神經(jīng)網(wǎng)絡(luò)擅于處理的.2006年, 多倫多大學(xué)的Hinton 和Salakhutdinov[15]通過無監(jiān)督預(yù)訓(xùn)練方法初始化權(quán)值, 再進(jìn)行權(quán)值微調(diào), 解決了多層隱藏層的訓(xùn)練問題, 從此引發(fā)深度學(xué)習(xí)的研究熱潮[16].深度學(xué)習(xí)因具有很好的非線性表達(dá)能力而可以精確地提取特征信息, 并且具有記憶功能而引起了各個(gè)研究領(lǐng)域的關(guān)注.有研究者已經(jīng)將其應(yīng)用于光學(xué)領(lǐng)域的研究, Li等[17]提出基于CNN的聯(lián)合大氣湍流檢測與OAM (orbital angular momentum, OAM)鍵控解調(diào)技術(shù), 在受強(qiáng)湍流影響的8-OAM系統(tǒng)中實(shí)現(xiàn)了達(dá)到99.5%的自適應(yīng)解復(fù)用精確率.但是該方案只能進(jìn)行湍流強(qiáng)度(用大氣結(jié)構(gòu)率常數(shù)來表示)的分類檢測,還沒有實(shí)現(xiàn)大氣湍流信息的提取, 不利于后續(xù)大氣湍流補(bǔ)償以及大氣湍流信息的研究分析.
為了更好地實(shí)現(xiàn)大氣湍流相位提取, 本文提出一種基于深度CNN的大氣湍流湍流提取方法.利用CNN出色的圖像處理能力, 將標(biāo)準(zhǔn)高斯光束和受湍流影響的畸變高斯光束共同作為CNN的輸入, 湍流相位作為輸出.經(jīng)過海量樣本集的有監(jiān)督式的訓(xùn)練學(xué)習(xí)后, 最終可以得到一個(gè)具有強(qiáng)泛化能力、能自動(dòng)提取湍流相位的CNN模型.同時(shí), 為了應(yīng)對(duì)復(fù)雜多變的湍流環(huán)境, 本文對(duì)受不同湍流強(qiáng)度 (=1×10?14, 5 ×10?14和 1 ×10?13m?2/3)影響下的高斯光進(jìn)行了湍流相位提取.結(jié)果顯示本文提出的CNN模型對(duì)不同湍流都能實(shí)現(xiàn)準(zhǔn)確而快速的相位提取.另外, 在保持湍流強(qiáng)度一樣的情況下, 對(duì)比了基于傳統(tǒng)GS算法的湍流相位提取方法, 結(jié)果表明基于深度CNN的方法在訓(xùn)練過程中會(huì)自動(dòng)根據(jù)輸入和理想輸出構(gòu)建其中的映射關(guān)系,并不需要初始化參數(shù)等系列操作, 具有較好的穩(wěn)定性.CNN在訓(xùn)練過程中具有記憶功能, 訓(xùn)練好的CNN模型可以直接對(duì)湍流相位進(jìn)行預(yù)測, 具有很好的泛化能力, 并且預(yù)測一次湍流相位的時(shí)間是毫秒量級(jí), 大大縮短了湍流預(yù)測的時(shí)間.
在大氣湍流中, 折射率的隨機(jī)分布擾亂了高斯光束的波前相位.文獻(xiàn)[17]指出大氣湍流對(duì)高斯光傳輸?shù)挠绊懣梢缘刃楦咚构庠陔S機(jī)相位屏間自由傳輸.隨機(jī)相位屏的產(chǎn)生方法有兩種: Zernike多項(xiàng)式展開法[18]和功率譜反演法[19].本文采用經(jīng)典的基于Andrews改進(jìn)Hill譜的大氣折射率變動(dòng)頻譜的功率譜反演法.其中, Andrews分析定義更加符合真實(shí)大氣湍流情況的大氣折射率變動(dòng)頻譜表達(dá)式為[20]
式中,kl=3.3/l0;l0是湍流的內(nèi)尺度;L0是湍流的外尺度;kx和ky分別是X軸和Y軸方向上的頻率波數(shù);為大氣折射率結(jié)構(gòu)常數(shù), 常用來表示湍流強(qiáng)度.相位譜與折射率頻譜的關(guān)系為
式中, ?Z代表連續(xù)兩相位屏的間距.隨機(jī)相位屏頻域分布的方差為
式中,N是柵格元素?cái)?shù)目; ?x是柵格距.相位屏在空間域的計(jì)算公式為
式中, FFT 表示快速傅里葉變換;C是N×N復(fù)隨機(jī)數(shù)矩陣.為了便于計(jì)算, 在笛卡爾坐標(biāo)系中描述了相位擾動(dòng)的隨機(jī)分布, 然后通過快速傅里葉變換操作在頻域中表示隨機(jī)相位屏.接著將復(fù)數(shù)形式的相位?(x,y) 進(jìn)行求模處理, 以得到可以直接加載到光束上的湍流相位.為模擬高斯光在大氣中的傳輸過程, 本文采用高斯光中最重要的基模高斯光(下文簡稱為高斯光), 并假設(shè)高斯光在Z方向上傳播, 則高斯光束的光場表達(dá)式可以表示為
式中,U0為常數(shù); 截面半徑r2=x2+y2;zR是高斯光束的共焦參數(shù); 波數(shù)k=2π/λ;ω(z) 稱為z處的截面半徑, 其中ω0為基模高斯光束的束腰半徑;R(z)表示z點(diǎn)處的波面曲率半徑.(5)式可以分成兩部分, 乘號(hào)前面部分為振幅因子, 乘號(hào)后面部分為相位因子.而大氣湍流對(duì)高斯光束的影響主要是對(duì)相位產(chǎn)生影響, 在傳播一定距離后, 湍流引起的相位起伏累積會(huì)引起復(fù)振幅發(fā)生變化, 導(dǎo)致光強(qiáng)發(fā)生畸變, 因此可以將大氣湍流的影響等價(jià)于附加了一個(gè)隨機(jī)相位, 主要對(duì)相位因子產(chǎn)生影響, 即此時(shí)受湍流影響的高斯光束的光場表達(dá)式為
將光場在XY面上的截面分成 128 pixel ×128 pixel的二維像素矩陣, 所選取的大氣折射率頻譜為2.1節(jié)的Andrews改進(jìn)Hill譜的大氣折射率變動(dòng)頻譜, 其他相關(guān)仿真參數(shù)見表1.湍流強(qiáng)度與大氣折射率系數(shù)和源半徑有關(guān), 為了更方便描述湍流強(qiáng)度變化, 將光束束腰半徑設(shè)為定值.因此湍流強(qiáng)度可以由大氣折射率結(jié)構(gòu)常數(shù)表示, 對(duì)于沿水平或準(zhǔn)水平路徑傳播的應(yīng)用,可以假定為常數(shù).設(shè)置這三種湍流強(qiáng)度, 根據(jù)表1設(shè)置的參數(shù), 最后得到如圖1所示的不同對(duì)應(yīng)的隨機(jī)相位屏.
圖1(a)與圖1(b)、圖1(c)與圖1(d)及圖1(e)與圖1(f)的湍流強(qiáng)度分別為從不同湍流強(qiáng)度的相位屏的灰度變化范圍可以發(fā)現(xiàn),隨著湍流強(qiáng)度變強(qiáng), 湍流相位振幅的峰值也越來越大.這也與實(shí)際中湍流強(qiáng)度越強(qiáng), 傳輸光束的畸變程度越嚴(yán)重相符合.圖1的第一行和第二行為同等湍流強(qiáng)度下的兩個(gè)隨機(jī)相位屏, 因此其灰度起伏范圍十分接近, 而造成上下兩個(gè)大氣湍流相位屏分布不一樣的主要原因在于決定其相位分布的復(fù)數(shù)隨機(jī)矩陣C是隨機(jī)生成的.為進(jìn)一步驗(yàn)證該模型的準(zhǔn)確性, 本文將高斯光分別通過湍流相位屏, 如圖2所示為受不同湍流影響后的光斑圖.
表1 仿真參數(shù)Table 1.Parameter of simulation.
圖1 各湍流強(qiáng)度下的隨機(jī)相位屏 (a), (b)=1×10?14m?2/3 ; (c), (d)=5×10?14m?2/3 ; (e), (f)=1×10?13m?2/3Fig.1.Random phase screen at each turbulence intensity: (a), (b) =1×10?14m?2/3 ; (c), (d) =5×10?14m?2/3 ;(e), (f)=1×10?13m?2/3 .
圖2 各湍流強(qiáng)度影響下傳輸光束截面光斑 (a) 初始高斯光束 ; (b), (c) =1×10?14m?2/3 ; (d), (e) =5×10?14m?2/3; (f), (g)=1×10?13m?2/3Fig.2.The cross-section spot of transmission beam at each turbulence intensity: (a) Initial Gaussian beam; (b), (c) =1×10?14m?2/3; (d), (e)=5×10?14m?2/3 ; (f), (g)=1×10?13m?2/3 .
圖2(a)為未受湍流影響的標(biāo)準(zhǔn)高斯光, 圖2(b)—(g)為高斯光分別受圖1(a)—(f)的湍流相位屏影響后的光強(qiáng)分布.從光斑的變化趨勢可以看出, 光斑畸變程度隨著湍流的增強(qiáng)而增加.當(dāng)湍流強(qiáng)度時(shí), 光斑中心尚未發(fā)生嚴(yán)重漂移, 但已不再是對(duì)稱的圓形光斑; 當(dāng)湍流強(qiáng)度時(shí), 光斑中心開始發(fā)生較小的漂移, 光斑形狀發(fā)生較為嚴(yán)重的畸變; 當(dāng)湍流強(qiáng)度時(shí), 光斑中心已嚴(yán)重地漂移, 光斑形狀也由最開始的圓形畸變成不規(guī)則形狀.引起這種現(xiàn)象的主要原因在于當(dāng)湍流強(qiáng)度增強(qiáng)時(shí), 湍流相位的波動(dòng)幅值范圍增大, 對(duì)傳輸光束的相位影響加劇, 引起更加強(qiáng)烈的相位起伏、光強(qiáng)起伏和光斑漂移等湍流現(xiàn)象, 最終導(dǎo)致光束畸變更加嚴(yán)重.另外, 相同湍流強(qiáng)度的隨機(jī)相位屏分布也存在差異, 進(jìn)而導(dǎo)致圖2(b)與圖2(c)、圖2(d)與圖2(e)、圖2(f)與圖2(g)的光強(qiáng)分布有明顯的區(qū)別, 但是畸變程度在同一等級(jí).這也可以證實(shí)得到的仿真結(jié)果不僅與理論分析相符合還與實(shí)際情況十分吻合,所以該大氣模型是準(zhǔn)確的.
從上面的分析可以得出, 影響傳輸光束的大氣湍流可以等效為一個(gè)湍流相位, 所以提取大氣湍流信息就是從畸變光束中提取湍流相位.為了準(zhǔn)確提取高斯光束攜帶的湍流相位, 本文提出了一種基于深度CNN的大氣湍流相位提取方法.CNN是一種學(xué)習(xí)效率很高的深度神經(jīng)網(wǎng)絡(luò), 其核心是通過卷積核來進(jìn)行特征提取, 低層的卷積層提取諸如邊緣、線條、角度等特征, 而高層的卷積層提取更加抽象的高級(jí)特征, 同時(shí)還包括組合低層卷積層提取到的特征.另外, 在訓(xùn)練過程中主要采用的優(yōu)化算法包括反向傳播算法[21]和梯度下降算法[22].而這些卷積核的參數(shù)則是通過網(wǎng)絡(luò)的損失函數(shù)根據(jù)反向傳播算法進(jìn)行優(yōu)化調(diào)整, 在對(duì)大量樣本進(jìn)行有監(jiān)督式學(xué)習(xí)訓(xùn)練后, 得到的CNN模型就可以對(duì)輸入的受湍流影響的高斯光束進(jìn)行直接的預(yù)測, 同時(shí)也減少了提取大氣湍流相位的時(shí)間.綜合考慮大氣湍流的復(fù)雜性與CNN各層的性能和作用, 提出了如圖3所示的CNN結(jié)構(gòu).
圖3 提取湍流相位的 CNN 結(jié)構(gòu)Fig.3.The CNN structure of extracting the turbulent phase.
本文所采用的CNN結(jié)構(gòu)(如圖3所示)共包含17層(不包括輸入和輸出層), 其中卷積層共有11 層, 池化層共有 3 層, 反卷積層共有 3 層.輸入的是兩幅單通道的二維圖像, 一幅是標(biāo)準(zhǔn)的高斯光束, 另一幅是受大氣湍流影響的高斯光束, 為了降低網(wǎng)絡(luò)的時(shí)間復(fù)雜度, 兩幅圖像尺寸大小都被縮小到 6 4×64 .經(jīng)過卷積核大小為 5 ×5 的第一層卷積層(Conv1)后得到32個(gè)大小為 6 4×64 的特征圖;第二層還是卷積層(Conv2), 通過 3 ×3 的卷積核后得到了32個(gè)大小為 6 4×64 的特征圖; 第三層是池化層(Pool1), 采用的是最大池化操作, 池化核尺寸為 2 ×2 , 步長為 2, 非重疊池化, 所以輸出特征圖尺寸減半, 即此時(shí)特征圖大小為 3 2×32 , 但特征圖的數(shù)量沒有變, 仍然是32個(gè).之后再經(jīng)過兩次相同的卷積層和池化層交替設(shè)置的結(jié)構(gòu)后, 得到64個(gè)大小為 8 ×8 的特征圖, 再經(jīng)過5層純粹的卷積層, 所用的卷積核大小都為 3 ×3 .在第十三層至第十五層添加了反卷積層, 卷積核大小都是 3 ×3 ,這里設(shè)置反卷積層的目的是為了還原湍流相位.經(jīng)過三層的反卷積層后再經(jīng)過2層卷積核大小為3×3的卷積層后就可以得到尺寸大小為 6 4×64 的輸出圖像, 即影響傳輸高斯光束的湍流相位.根據(jù)反向傳播理論, CNN利用預(yù)測湍流相位與實(shí)際湍流相位構(gòu)成的損失函數(shù)對(duì)上述的卷積核參數(shù)進(jìn)行調(diào)整.這里所用的評(píng)估索引為j的樣本誤差損失函數(shù)為
式中, R elu(x)=max(0,x) ;p(j)表示實(shí)際的湍流相位;表示CNN模型預(yù)測的湍流相位.其具體表達(dá)式為
式中,θ和b分別表示卷積核和標(biāo)量偏差, 這是模型的兩個(gè)訓(xùn)練參數(shù).a(j)包含兩幅單通道圖像(一幅是標(biāo)準(zhǔn)的高斯光束, 另一幅是受大氣湍流影響的高斯光束).從(9)式可以看出, 誤差越小表示預(yù)測湍流相位與實(shí)際湍流相位更加接近, 且當(dāng)兩者相等時(shí)誤差為0.(10)式和(11)式則是用來限制與實(shí)際湍流相位不相符的像素值.對(duì)于給定的訓(xùn)練集, 這個(gè)誤差只與模型的訓(xùn)練參數(shù)(卷積核θ和標(biāo)量偏差b)有關(guān), 然后再將訓(xùn)練集中所有樣本誤差的平均來衡量模型預(yù)測的質(zhì)量, 即:
式中,m為采集的樣本數(shù).
為了證明該方法的可行性, 本文采用上述的大氣湍流模型產(chǎn)生的隨機(jī)相位屏對(duì)傳輸?shù)母咚构馐┘佑绊? 然后利用CNN對(duì)湍流提取進(jìn)行仿真.由于我們提出的CNN結(jié)構(gòu)比較復(fù)雜, 為了保證模型具有良好的泛化能力, 就需要足夠多的訓(xùn)練數(shù)據(jù), 并且樣本的多樣性也能有效地防止過擬合.因此, 對(duì)三種湍流強(qiáng)度都分別設(shè)置了70000個(gè)訓(xùn)練集,3000個(gè)測試集, 2600個(gè)校驗(yàn)集.訓(xùn)練集用于對(duì)CNN模型進(jìn)行訓(xùn)練, 在訓(xùn)練過程中最小化損失函數(shù)來不斷優(yōu)化模型參數(shù), 校驗(yàn)集用于將訓(xùn)練過程可視化, 呈現(xiàn)不同訓(xùn)練迭代次數(shù)時(shí)CNN對(duì)湍流相位的預(yù)測效果.訓(xùn)練好的CNN模型用測試集進(jìn)行測試, 一個(gè)良好的CNN模型不僅追求訓(xùn)練誤差小,而且要求測試誤差盡可能小.若對(duì)CNN輸入一個(gè)受大氣湍流影響的高斯光束后, CNN的最終輸出的湍流相位與仿真產(chǎn)生的隨機(jī)相位屏的湍流相位一致, 則證明了該方法的可行性.
另外, 由于自由空間中的大氣湍流是多變的,本文對(duì)另外兩種湍流強(qiáng)度進(jìn)行了訓(xùn)練, 如圖6所示為三種不同湍流強(qiáng)度(=1×10?14, 5×10?14和 1 ×10?13m?2/3)的損失函數(shù)值隨迭代次數(shù)變化的關(guān)系曲線, 從圖6中的損失函數(shù)的變化趨勢可以看出, 經(jīng)過一定迭代次數(shù)的訓(xùn)練, CNN模型都能得到很好的湍流預(yù)測結(jié)果, 同時(shí)也表明其性能并不會(huì)因?yàn)橥牧鲝?qiáng)度的增加而變差.圖6顯示的曲線并不是光滑的, 而是存在著許多毛刺, 其原因是訓(xùn)練過程的損失函數(shù)值會(huì)根據(jù)本次網(wǎng)絡(luò)參數(shù)更新, 預(yù)測湍流與實(shí)際湍流相位作比較而得出, 但并不是每次網(wǎng)絡(luò)更新的湍流相位都可以保證比上一次更接近實(shí)際湍流相位, 所以損失函數(shù)值在局部是不斷波動(dòng)的, 但是整體上還是單調(diào)遞減.其次, 這三種湍流強(qiáng)度的下降趨勢幾乎一致, 且最后損失函數(shù)值都收斂到0.02左右, 說明了本文提出的基于CNN的湍流提取方法適用性強(qiáng).
圖4 訓(xùn)練過程損失函數(shù)曲線Fig.4.The loss function curve of training process.
圖5 訓(xùn)練過程提取到的湍流相 (a) 與 (b), (c) 與 (d), (e)與 (f), (g)與 (h), (i)與 (j) 和 (k)與 (l)的迭代次數(shù)分別為 1, 100, 500,4000, 8000, 14000Fig.5.The turbulent phase during the training process: The number of iterations of (a) and (b), (c) and (d), (e) and (f), (g) and(h), (i) and (j), and (k) and (l) is 1, 100, 500, 4000, 8000, 14000.
圖6 各湍流強(qiáng)度損失函數(shù)曲線Fig.6.The loss function curve at each turbulence intensity.
這三種模型的測試結(jié)果如圖7所示, 第一行、第二行和第三行分別是湍流強(qiáng)度=1×10?14,5×10?14和 1 ×10?13m?2/3的仿真結(jié)果, 從圖7 中可以看出CNN輸出的預(yù)測湍流相位和理想輸出湍流相位在相位振幅分布和圖像細(xì)節(jié)方面都高度吻合.而且提取效果并沒有隨湍流強(qiáng)度的變化而出現(xiàn)波動(dòng), 從而證明了基于深度CNN提取受湍流影響高斯光束的湍流相位這一方法是十分有效的, 并且還原效果并沒有隨著湍流強(qiáng)度的增強(qiáng)而出現(xiàn)顯著惡化, 證明了該方法的普遍適用性.另外, 對(duì)于每個(gè)湍流強(qiáng)度所設(shè)置的3000個(gè)測試集, 絕大部分仿真結(jié)果都可以獲得如圖7所示的還原效果, 說明已經(jīng)獲得了泛化能力不錯(cuò)的CNN模型.
圖7 不同湍流強(qiáng)度下, 經(jīng)過 CNN 提取到的湍流相位 (a), (b), (c)初始高斯光束; (d), (e), (f) 受大氣湍流影響的高斯光束;(g), (h), (i) 實(shí)際的大氣湍流相位; (j), (k), (l) CNN 輸出的預(yù)測湍流相位Fig.7.The predicted turbulent phase based on CNN at each turbulence intensity: (a), (b), (c) Initial Gaussian beam; (d), (e), (f)Gaussian beam affected by atmospheric turbulence; (g), (h), (i) the actual turbulence phase; (j), (k), (l) the output phase of CNN.
為了證明基于深度CNN方法在大氣湍流相位提取方面的優(yōu)勢, 本文還對(duì)目前普遍采用的GS算法湍流相位提取進(jìn)行了對(duì)比研究.利用GS算法提取湍流相位的第一步是對(duì)初始高斯光束做快速傅里葉變換 (fast Fourier transform, FFT),以確定相應(yīng)光場函數(shù)的像平面分布.然后其頻域振幅由攜帶湍流相位的高斯光束的頻域振幅代替.接著經(jīng)過快速傅里葉逆變換(inverse fast Fourier transform, IFFT), 這時(shí)的空域振幅再用入射高斯光振幅代替, 最后對(duì)其作FFT.如圖8所示為兩者輸出的湍流相位與實(shí)際湍流相位的對(duì)比, 圖8中三行采用的分別是強(qiáng)度為中的任意三種湍流分布.從提取到的湍流相位的結(jié)果來看, 利用GS算法提取的湍流相位無論在相位振幅分布還是圖像細(xì)節(jié)方面都遠(yuǎn)不如基于深度CNN模型輸出的結(jié)果.并且, 在多達(dá)1000次的仿真測試中發(fā)現(xiàn), GS算法不總是可以得到圖8(j)—(l)的結(jié)果, 其還存在極小部分劣于圖8(j)—(l)的情況, 其中一個(gè)非常主要的原因是GS算法在一定程度上可以看成是一種誤差減少算法, 它通過時(shí)域和頻域的振幅約束, 每次迭代后誤差都會(huì)下降, 最終重建出目標(biāo)相位.該方法適用于計(jì)算輸入和輸出面的光強(qiáng)分布存在嚴(yán)格的解析傅里葉變換對(duì)[23],但是實(shí)際應(yīng)用中存在解析傅里葉變換對(duì)的情況畢竟是極少數(shù), 尤其是在復(fù)雜的大氣湍流中的應(yīng)用.這時(shí), GS算法往往會(huì)出現(xiàn)收斂速度下降和收斂停滯, 導(dǎo)致提取的湍流相位不精確, 而基于深度CNN提取湍流相位的方法則在多達(dá)3000次的測試中都可以獲得圖8(g)—(i)所展示的結(jié)果, 這體現(xiàn)了該CNN模型性能穩(wěn)定.
圖8 CNN 與 GS 算法提取湍流相位效果對(duì)比 (a), (b), (c)受湍流強(qiáng)度為=1×10?14m?2/3 影響的高斯光束; (d), (e),(f)實(shí)際湍流相位; (g), (h), (i)基于 CNN 模型提取的湍流相位; (j), (k), (l) GS 算法提取的湍流相位Fig.8.The comparison of CNN and GS algorithm for extracting turbulence phase: (a), (b), (c) Gaussian beam affected by atmospheric turbulence with=1×10?14m?2/3 ; (d), (e), (f) the actual turbulence phase; (g), (h), (i) the predicted turbulent phase based on CNN; (j), (k), (l) the predicted turbulent phase based on GS algorithm.
另外, 預(yù)測湍流相位所需的時(shí)間也是評(píng)估湍流信息提取能力的標(biāo)準(zhǔn)之一, 因此本文還記錄了兩者預(yù)測湍流相位所需的平均時(shí)間(如表2所列).表中顯示訓(xùn)練好的CNN模型預(yù)測一個(gè)湍流相位所耗時(shí)間在毫秒量級(jí), 并且?guī)缀跖c湍流強(qiáng)度無關(guān).而GS算法一般都需要進(jìn)行70次的迭代才可以得到比較好的輸出[13], 這意味著對(duì)于每一個(gè)相位的預(yù)測都需要花費(fèi)0.4 s左右的時(shí)間, 其所花費(fèi)的時(shí)間大約是CNN的100倍.至此, 不難看出本文提出的方法在相位還原準(zhǔn)確率和還原速度方面都優(yōu)于GS算法.
表2 兩方法預(yù)測時(shí)間對(duì)比Table 2.The predicted time comparison of two methods.
為了獲得更好的預(yù)測結(jié)果, CNN模型需要經(jīng)過16000多次的迭代訓(xùn)練, 這似乎比GS算法的70次迭代更加耗時(shí).但是, 得益于計(jì)算機(jī)科學(xué)技術(shù)的快速發(fā)展和深度學(xué)習(xí)技術(shù)的深入研究, 特別是圖形處理器 (graphics processing unit, GPU)的廣泛應(yīng)用使得訓(xùn)練時(shí)間大大減少.我們在對(duì)70000多個(gè)樣本進(jìn)行16000多次的訓(xùn)練僅需要幾個(gè)小時(shí), 然后給我們帶來的是訓(xùn)練好的CNN模型工作時(shí)間的大幅減少和預(yù)測湍流相位效果的巨大改善.而GS算法由于對(duì)初始相位敏感, 所以在對(duì)大量樣本檢測時(shí)會(huì)出現(xiàn)預(yù)測效果時(shí)好時(shí)壞, 當(dāng)應(yīng)用于大氣湍流補(bǔ)償系統(tǒng), 這將會(huì)影響整個(gè)補(bǔ)償系統(tǒng)的穩(wěn)定性,而CNN則很好地克服了GS算法對(duì)初始相位敏感的問題.
在實(shí)際自由空間中, 大氣折射率結(jié)構(gòu)參數(shù)是隨機(jī)變化的, 在前面研究內(nèi)容中, 我們選取了三個(gè)常數(shù)作為大氣折射率結(jié)構(gòu)參數(shù)的值, 而這樣做的目的主要是利用盡可能少的數(shù)據(jù)量來證明提出的CNN能夠在不同湍流強(qiáng)度的擾動(dòng)環(huán)境中實(shí)現(xiàn)對(duì)湍流的準(zhǔn)確預(yù)測.結(jié)果顯示對(duì)于這三種湍流強(qiáng)度,CNN具有良好的湍流預(yù)測能力, 而對(duì)于強(qiáng)度介于這三者之間的湍流, CNN應(yīng)該同樣能準(zhǔn)確地進(jìn)行預(yù)測.為了驗(yàn)證這一觀點(diǎn), 同時(shí)為了充分反應(yīng)現(xiàn)實(shí)自由空間中處于不斷變化的湍流環(huán)境, 將大氣折射率結(jié)構(gòu)參數(shù)范圍設(shè)置為∈ [1×10?14m?2/3,1×10?13m?2/3],的具體值從該范圍中隨機(jī)選取, 產(chǎn)生70000個(gè)訓(xùn)練數(shù)據(jù)和2600個(gè)驗(yàn)證測試數(shù)據(jù).用訓(xùn)練集和驗(yàn)證集對(duì)CNN模型進(jìn)行迭代訓(xùn)練和驗(yàn)證測試, 其結(jié)果如圖9所示, 圖9(a)為訓(xùn)練過程中的損失函數(shù)變化曲線, 隨著迭代次數(shù)的增加,損失函數(shù)值在不斷下降, 當(dāng)?shù)螖?shù)達(dá)到1400次時(shí), 損失值降到了 0.0162.另外, 在訓(xùn)練過程中調(diào)用驗(yàn)證集對(duì)CNN模型進(jìn)行測試, 如圖9(b)為迭代次數(shù)分別為 20, 500, 8000 和 14000 時(shí), CNN 對(duì)應(yīng)預(yù)測出的湍流相位.與實(shí)際相位對(duì)比可以發(fā)現(xiàn), 當(dāng)?shù)螖?shù)達(dá)到8000, CNN已經(jīng)具備了較好的湍流相位預(yù)測能力.由此可以得到結(jié)論, 我們提出的CNN模型結(jié)構(gòu)在大氣折射率結(jié)構(gòu)參數(shù)隨機(jī)變化的實(shí)際傳輸情況中, 同樣具有很強(qiáng)的適應(yīng)和泛化能力.而對(duì)于更強(qiáng)的湍流, 可以考慮通過優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)來抓取更多的特征信息, 從而實(shí)現(xiàn)湍流信息的預(yù)測.
圖9 訓(xùn)練及驗(yàn)證測試結(jié)果 (a)訓(xùn)練過程損失函數(shù)曲線;(b)訓(xùn)練過程中利用驗(yàn)證集測試得到的預(yù)測湍流相位Fig.9.Training and validation set test results: (a) The loss function curve of training process; (b) the predicted turbulence phase obtained by testing the validation set during training.
伴隨著人工智能的蓬勃發(fā)展, 深度學(xué)習(xí)也越來越得到人們的重視, 尤其是近年的發(fā)展更是火熱,但仍然存在著許多棘手的問題.其中一個(gè)比較重要的原因就是存在理論分析困難.整個(gè)隱藏層看起來更像個(gè)“黑箱子”, 人們?nèi)匀徊荒芎芎玫睦斫馄浠纠碚? 也就是說對(duì)于一個(gè)具體的任務(wù), 仍很難確定哪種結(jié)構(gòu), 使用多少的訓(xùn)練參數(shù), 隱藏層使用多少層等才是最合適的[24].再加上現(xiàn)在人工神經(jīng)網(wǎng)絡(luò),包括卷積神經(jīng)網(wǎng)絡(luò), 已經(jīng)有很多算法和技術(shù)用于提高網(wǎng)絡(luò)模型訓(xùn)練過程的訓(xùn)練速度[25], 增加網(wǎng)絡(luò)層深度[26]和稀疏化編碼[27]等等, 這些方法在本文還未能得到巧妙地結(jié)合, 所以在CNN網(wǎng)絡(luò)模型上的優(yōu)化還有較大的提升空間.
本文提出一種基于深度CNN模型的大氣湍流相位提取方法, 該方法利用卷積層逐層提取湍流特征, 再經(jīng)過海量樣本集的有監(jiān)督式的訓(xùn)練學(xué)習(xí),最終在三種湍流強(qiáng)度(=1×10?14, 5×10?14和 1 ×10?13m?2/3)的測試樣本集上的平均損失函數(shù)值都低于0.03.該方法還與傳統(tǒng)的GS算法進(jìn)行對(duì)比, 不僅在提取湍流相位的效果上獲得了很大的提高, 而且預(yù)測時(shí)間縮短了兩個(gè)數(shù)量級(jí).隨著GPU的不斷升級(jí)以及各種訓(xùn)練優(yōu)化算法的提出使得訓(xùn)練時(shí)間大大減少, 這意味著可以進(jìn)行更多次的參數(shù)調(diào)試以更接近最優(yōu)模型, 所以該方法的應(yīng)用與發(fā)展都有著非常好的前景.