張燁方 馮真禎 劉 冰
1 福建省災(zāi)害天氣重點(diǎn)實(shí)驗(yàn)室,福州 350001 2 福建省氣象災(zāi)害防御技術(shù)中心,福州 350001
提 要: 從研究人工智能雷電臨近預(yù)警模型的目的出發(fā),以卷積神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),結(jié)合多個(gè)時(shí)間序列的雷達(dá)產(chǎn)品(組合反射率、液態(tài)水含量、回波頂高)與閃電數(shù)據(jù),對(duì)雷電臨近預(yù)報(bào)方法進(jìn)行基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的應(yīng)用,以福建省2017—2018年雷達(dá)、閃電數(shù)據(jù)為樣本完成了模型的訓(xùn)練與預(yù)測(cè)研究。訓(xùn)練結(jié)果顯示,15~30 min模型訓(xùn)練樣本測(cè)試集準(zhǔn)確率為0.798 5;選取福建省2019年20個(gè)雷電過(guò)程驗(yàn)證分析表明,15~30 min模型對(duì)動(dòng)力抬升型雷電過(guò)程預(yù)警TS評(píng)分為0.716,夏季局地?zé)崂妆╊A(yù)警TS評(píng)分為0.694,與常規(guī)采用雷達(dá)、閃電閾值控制的雷電預(yù)警算法相比,準(zhǔn)確率有一定的提高,具有一定的實(shí)踐意義。
人工智能是近幾年來(lái)發(fā)展特別迅速的一門(mén)科學(xué)技術(shù),普遍被認(rèn)為是下一場(chǎng)科技革命的生產(chǎn)力代表,2017年8月國(guó)務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,提出了面向2030年我國(guó)新一代人工智能發(fā)展的戰(zhàn)略目標(biāo)。逐步推進(jìn)氣象業(yè)務(wù)工作與人工智能技術(shù)的對(duì)接,拓展未發(fā)掘的預(yù)報(bào)模式,滿(mǎn)足多角度氣象專(zhuān)業(yè)服務(wù)需求,是實(shí)現(xiàn)氣象工作自動(dòng)化、智能化、現(xiàn)代化的重要途徑。
我國(guó)在20世紀(jì)90年代初已開(kāi)始?xì)庀箢I(lǐng)域人工智能方面的預(yù)報(bào)研究,如中國(guó)氣象局在“八五”期間就成立了《人工智能、模式識(shí)別在天氣預(yù)報(bào)業(yè)務(wù)中的應(yīng)用》課題項(xiàng)目,運(yùn)用神經(jīng)網(wǎng)絡(luò)模式對(duì)暴雨預(yù)報(bào)進(jìn)行試驗(yàn)(王寶榮,1993)。進(jìn)入21世紀(jì)后,國(guó)內(nèi)出現(xiàn)更多基于機(jī)器學(xué)習(xí)的氣象人工智能研究,如賀佳佳等(2017)采用支持向量機(jī)(SVM)開(kāi)展局部短時(shí)臨近降雨預(yù)測(cè)研究;孫全德等(2019)對(duì)數(shù)值天氣預(yù)報(bào)模式ECMWF預(yù)測(cè)的華北地區(qū)近地面10 m 風(fēng)速進(jìn)行訂正,指出三種機(jī)器學(xué)習(xí)算法的訂正效果均好于傳統(tǒng)訂正方法模式輸出統(tǒng)計(jì)〈MOS〉的結(jié)果;熊亞軍等(2015)利用KNN(KNearest Neighbor)數(shù)據(jù)挖掘算法構(gòu)建等級(jí)預(yù)報(bào)分類(lèi)器,開(kāi)展霾等級(jí)客觀識(shí)別實(shí)驗(yàn);陳勇偉等(2013)、趙旭寰等(2009)使用BP(back propagation)神經(jīng)網(wǎng)絡(luò)模型,選用7個(gè)對(duì)流參數(shù)對(duì)雷暴活動(dòng)進(jìn)行潛勢(shì)預(yù)報(bào)。
在雷電臨近預(yù)警領(lǐng)域,目前主要是使用雷達(dá)組合反射率、液態(tài)水含量、回波頂高、閃電數(shù)據(jù)進(jìn)行預(yù)警,如:張其林等(2010)對(duì)閃電發(fā)生進(jìn)行高密度區(qū)域識(shí)別并外推,得出雷電預(yù)警產(chǎn)品;呂偉濤等(2009)借鑒美國(guó)NCAR的TITAN(Thunderstorm Identification,Tracking,Analysis,and Nowcasting)算法對(duì)雷達(dá)數(shù)據(jù)進(jìn)行重點(diǎn)區(qū)域識(shí)別與外推,研究格點(diǎn)雷電發(fā)生概率;秦微等(2016)在深圳地區(qū)采用TITAN算法對(duì)某次強(qiáng)風(fēng)暴過(guò)程中的強(qiáng)回波區(qū)進(jìn)行分析,得出該算法識(shí)別效果理想的結(jié)果;劉維成等(2015)對(duì)甘肅中部雷達(dá)回波單體與雷電活動(dòng)之間的對(duì)應(yīng)關(guān)系進(jìn)行分析,得出回波強(qiáng)度、回波頂高、垂直累積液態(tài)含水量與雷電發(fā)生的閾值關(guān)系,并根據(jù)該結(jié)論建立了雷電預(yù)警方案;常越等(2010)對(duì)湖南省閃電的發(fā)生和雷達(dá)關(guān)系進(jìn)行研究,認(rèn)為閃電發(fā)生與回波強(qiáng)度、回波頂高、速度場(chǎng)特征、垂直液態(tài)含水量等有著密切的關(guān)系;此外還有研究使用衛(wèi)星、探空、大氣電場(chǎng)等數(shù)據(jù)對(duì)雷電預(yù)警關(guān)系進(jìn)行分析。國(guó)外在雷電臨近預(yù)警研究方面,Hondl and Eilts(1994)根據(jù)雷暴發(fā)展到不同高度層的回波特征與閾值進(jìn)行短時(shí)臨近預(yù)報(bào),Schmeits et al(2008)運(yùn)用數(shù)理統(tǒng)計(jì)方法處理和開(kāi)發(fā)雷電臨近預(yù)報(bào)系統(tǒng),Jacobson et al(2011)統(tǒng)計(jì)分析衛(wèi)星、閃電定位系統(tǒng)等提供的雷電數(shù)據(jù),計(jì)算雷電發(fā)生概率。近幾年國(guó)外在雷電臨近預(yù)報(bào)領(lǐng)域也有了一些新的成果,如Ivanova(2019)應(yīng)用地面微波輻射計(jì)進(jìn)行雷電預(yù)警;Baldini et al(2018)利用雙偏振雷達(dá)識(shí)別graupel粒子,研究與雷電活動(dòng)的相關(guān)性。在人工智能的氣象應(yīng)用上,還沒(méi)有明確應(yīng)用于雷電臨近預(yù)警的成果,但在氣象預(yù)報(bào)的其他領(lǐng)域已經(jīng)有較多的人工智能應(yīng)用產(chǎn)品,如:Andreev et al(2019)將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于云識(shí)別與檢測(cè),Saha et al(2016)采用自編碼器對(duì)印度季風(fēng)進(jìn)行預(yù)測(cè)應(yīng)用;Geng et al(2019)引入ConvLSTM建立包含不同編碼器、預(yù)測(cè)解碼器的LightNet模型對(duì)雷電進(jìn)行預(yù)測(cè)等。探索一種新的雷電預(yù)警思路與當(dāng)前人工智能技術(shù)的興起不謀而合,利用人工智能技術(shù)來(lái)進(jìn)行雷電臨近預(yù)警具有很好的探索意義。
現(xiàn)行的雷電臨近預(yù)警技術(shù)方案主要以線(xiàn)性或簡(jiǎn)單的非線(xiàn)性函數(shù)為主,非線(xiàn)性化程度低,以非變形外推為主,較少看到變形外推的應(yīng)用模型,或者以中尺度分析技術(shù)中的“配料法”為基礎(chǔ),對(duì)雷達(dá)、閃電數(shù)據(jù)進(jìn)行“配料”閾值控制預(yù)警,而實(shí)際雷電的發(fā)生與各影響要素之間不僅只存在線(xiàn)性的關(guān)系,可能還有我們未發(fā)掘的更為復(fù)雜的非線(xiàn)性規(guī)則,因此采用具有強(qiáng)非線(xiàn)性表征能力的神經(jīng)網(wǎng)絡(luò)技術(shù)來(lái)處理雷電臨近預(yù)警問(wèn)題是提升預(yù)警效果的有效途徑。
本文選用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)為基礎(chǔ),構(gòu)建基于CNN的雷電臨近預(yù)警模型,將雷達(dá)組合反射率、液態(tài)水含量、回波頂高、云地閃電數(shù)據(jù)等指標(biāo)按CNN所需求的“圖片”模式進(jìn)行網(wǎng)格“切片”化處理,對(duì)數(shù)據(jù)進(jìn)行時(shí)間、空間維度上的延伸,建立相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型,采用谷歌公司人工智能線(xiàn)性代數(shù)編譯器(TENSORFLOW)為計(jì)算工具,對(duì)該模型進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,將得到的結(jié)果進(jìn)行實(shí)例的檢驗(yàn)和應(yīng)用。
CNN是一種專(zhuān)門(mén)用來(lái)處理類(lèi)似網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),它采用具有一定大小、包含權(quán)重矩陣的格點(diǎn)網(wǎng)(卷積核,也稱(chēng)過(guò)濾器)對(duì)輸入圖像逐個(gè)位置進(jìn)行掃描和卷積,利用卷積實(shí)變函數(shù)運(yùn)算實(shí)現(xiàn)對(duì)圖像局部特征的信息提取并保存在權(quán)重矩陣中,加上中間添加的非線(xiàn)性激活函數(shù),使整個(gè)神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的學(xué)習(xí)和非線(xiàn)性處理能力,實(shí)踐表明該計(jì)算方式可以很好地獲取圖片的總體與局部特征,其一般流程是對(duì)輸入的多通道圖像(可以把氣象格點(diǎn)數(shù)據(jù)看成是圖像)經(jīng)過(guò)多次的卷積、池化操作,提取到圖像深層次的高維特征,再將卷積、池化操作后的矩陣展開(kāi)成神經(jīng)網(wǎng)絡(luò)層,經(jīng)過(guò)一定層數(shù)的神經(jīng)網(wǎng)絡(luò)層計(jì)算后,根據(jù)需求輸出對(duì)輸入圖像某一種類(lèi)別屬性的預(yù)測(cè)結(jié)論,例如判斷輸入的圖像是哪一種動(dòng)物、哪一個(gè)數(shù)字等。
盡管CNN已經(jīng)在計(jì)算機(jī)視覺(jué)、圖像分析等領(lǐng)域取得了積極的成果,但也存在著一定的不足和缺點(diǎn),主要表現(xiàn)在對(duì)訓(xùn)練數(shù)據(jù)的需求量大、自身模型計(jì)算量龐大及訓(xùn)練時(shí)間長(zhǎng)、硬件要求高、生物學(xué)基礎(chǔ)支持不足、無(wú)法掌握其內(nèi)部的計(jì)算機(jī)理、過(guò)多的參數(shù)設(shè)計(jì)使得模型設(shè)計(jì)的最優(yōu)解難以精確得到,等等。尤其在氣象預(yù)報(bào)應(yīng)用領(lǐng)域,由于常規(guī)的CNN處理的是圖片輸入、有限類(lèi)別輸出的情形,而在格點(diǎn)化氣象預(yù)報(bào)領(lǐng)域,則要求輸入圖片,針對(duì)圖片的所有格點(diǎn)都要求有結(jié)果輸出的情況,即圖片輸入、圖片輸出,在人工智能領(lǐng)域稱(chēng)這樣的問(wèn)題為像素級(jí)的預(yù)測(cè)模型,因此常規(guī)的CNN模型無(wú)法直接應(yīng)用到氣象格點(diǎn)預(yù)報(bào)中。為了解決氣象預(yù)報(bào)這樣像素級(jí)的人工智能CNN模型,本文提出了一種采用切片式的數(shù)據(jù)處理方法,將輸入的氣象格點(diǎn)圖片根據(jù)像素預(yù)報(bào)點(diǎn)轉(zhuǎn)換成多量的“小切片”,作為新的輸入圖片進(jìn)行CNN預(yù)測(cè);為了規(guī)避這種方法可能帶來(lái)的大計(jì)算量,本文設(shè)計(jì)了適宜的數(shù)據(jù)壓縮模型,有效降低了整個(gè)模型的計(jì)算量,使模型的預(yù)測(cè)計(jì)算可以在1~2 min內(nèi)實(shí)現(xiàn)福建省區(qū)域內(nèi)的格點(diǎn)化預(yù)警預(yù)報(bào),保證預(yù)警產(chǎn)品的時(shí)效性,具體模型內(nèi)容討論如下。
深度神經(jīng)網(wǎng)絡(luò)是一個(gè)封閉的黑盒子計(jì)算單元,目前在人工智能領(lǐng)域?qū)τ谏窠?jīng)網(wǎng)絡(luò)的工作原理尚不清楚,只知道“神經(jīng)元+激活函數(shù)”可以實(shí)現(xiàn)復(fù)雜的非線(xiàn)性數(shù)學(xué)變換,本文根據(jù)目前雷電臨近預(yù)警預(yù)報(bào)工作常用的思路與方法,結(jié)合雷電發(fā)生、發(fā)展的規(guī)律以及預(yù)報(bào)產(chǎn)品的時(shí)效、精度需求,選用下面幾個(gè)參量作為神經(jīng)網(wǎng)絡(luò)的輸入與輸出單元。
(1)雷達(dá)產(chǎn)品數(shù)據(jù),包括組合反射率、液態(tài)水含量、回波頂高三個(gè)參數(shù)。 這是目前雷電臨近預(yù)警預(yù)報(bào)工作最常用的三個(gè)指標(biāo)。國(guó)內(nèi)多項(xiàng)研究也表明這三個(gè)參數(shù)可以很好地適配雷電臨近預(yù)警工作,結(jié)合雷達(dá)數(shù)據(jù)質(zhì)量控制與SWAN雷達(dá)拼圖的處理等相關(guān)研究,如對(duì)有源干擾回波識(shí)別(黃小玉等,2019)、雷達(dá)CAPPI格點(diǎn)數(shù)據(jù)均一性處理(葉飛等,2020)、SWAN雷達(dá)拼圖產(chǎn)品處理(張勇等,2019)。對(duì)所有雷達(dá)產(chǎn)品數(shù)據(jù)進(jìn)行質(zhì)量控制和處理,剔除可能存在誤差或錯(cuò)誤的雷達(dá)產(chǎn)品數(shù)據(jù)。
(2)云地閃數(shù)據(jù)。 閃電定位監(jiān)測(cè)數(shù)據(jù)是目前表征雷電發(fā)生位置、時(shí)間最直接、精度最高的觀測(cè)產(chǎn)品。利用不同時(shí)次地閃發(fā)生位置的變化來(lái)預(yù)測(cè)下一時(shí)次的雷電發(fā)生位置,是當(dāng)前地閃數(shù)據(jù)在雷電臨近預(yù)警工作中的主要應(yīng)用思路。本文通過(guò)對(duì)云地閃數(shù)據(jù)按雷達(dá)時(shí)次(本文規(guī)定每個(gè)小時(shí)的第00、06、12、…、54 min,即雷達(dá)數(shù)據(jù)產(chǎn)生的時(shí)間為雷達(dá)時(shí)次,以下同)和設(shè)計(jì)的柵格大小進(jìn)行每個(gè)柵格云地閃頻數(shù)的統(tǒng)計(jì)(時(shí)間分辨率:6 min,空間分辨率:0.01°),實(shí)現(xiàn)將一條一條的云地閃數(shù)據(jù)轉(zhuǎn)變成和雷達(dá)產(chǎn)品數(shù)據(jù)一樣格式的格點(diǎn)化數(shù)據(jù),應(yīng)用到神經(jīng)網(wǎng)絡(luò)模型中,設(shè)待計(jì)算時(shí)刻為t1,計(jì)算t1往前6 min的時(shí)刻t0,獲取[t0,t1]時(shí)間、柵格區(qū)域內(nèi)所有發(fā)生的云地閃數(shù)據(jù),計(jì)算其總頻數(shù)作為該t1時(shí)刻、該柵格區(qū)域的標(biāo)示值。
(3)預(yù)警輸出標(biāo)簽設(shè)計(jì)。按二分類(lèi)對(duì)預(yù)警輸出結(jié)果進(jìn)行標(biāo)簽編制,考慮到雷達(dá)、閃電數(shù)據(jù)的實(shí)際到達(dá)時(shí)間存在一定的延遲(SWAN拼圖要等到所有單站雷達(dá)數(shù)據(jù)全到位才能拼圖,因此延遲在10 min左右),加上模型計(jì)算、結(jié)果傳輸所消耗的時(shí)間,雖然也可以做到0~15 min的預(yù)警,但該預(yù)警結(jié)果基本失去其時(shí)效意義,因此預(yù)報(bào)結(jié)果設(shè)定為當(dāng)前時(shí)刻之后15~30、30~45、45~60 min內(nèi)雷電發(fā)生位置的網(wǎng)格化產(chǎn)品,限于篇幅關(guān)系,本文僅對(duì)15~30 min 內(nèi)的預(yù)報(bào)模型進(jìn)行討論、介紹。具體規(guī)則:對(duì)于某一個(gè)預(yù)警格點(diǎn),當(dāng)該格點(diǎn)在15~30 min的時(shí)間區(qū)間里監(jiān)測(cè)到有一次以上的云地閃數(shù)據(jù)時(shí),即標(biāo)記該預(yù)警格點(diǎn)標(biāo)簽值為1,否則則記為0。
針對(duì)氣象預(yù)報(bào)對(duì)預(yù)報(bào)結(jié)果的需求特點(diǎn)(大輸入、大輸出),本文把每個(gè)預(yù)報(bào)格點(diǎn)看成是一個(gè)實(shí)例,把一張300×300像素點(diǎn)的預(yù)報(bào)圖片,看成是預(yù)報(bào)300×300個(gè)實(shí)例的樣式;對(duì)每一個(gè)預(yù)報(bào)格點(diǎn),分別向四個(gè)方向拓展指定的網(wǎng)格,形成以預(yù)報(bào)格點(diǎn)為中心,具有一定長(zhǎng)、寬的網(wǎng)格切片,對(duì)每個(gè)時(shí)次、每個(gè)參數(shù)的網(wǎng)格圖層進(jìn)行一次切片,得到指定大小的網(wǎng)格矩陣,類(lèi)比為圖片的一個(gè)“通道”,這樣每個(gè)時(shí)次的每個(gè)參數(shù)就可以得到一個(gè)通道,n個(gè)參數(shù)、m個(gè)時(shí)次就可以得到n×m個(gè)通道的輸入層,再經(jīng)過(guò)CNN的訓(xùn)練和計(jì)算后,就可以得到該網(wǎng)格(像素點(diǎn))的預(yù)報(bào)結(jié)果了,具體思路如圖1所示。
圖1 單個(gè)格點(diǎn)的切片處理方法及雷電臨近預(yù)警CNN模型示意圖Fig.1 Slice processing method for single grid points and lightning nowcasting warning CNN model diagram
在上述采用切片提取與該網(wǎng)格預(yù)報(bào)結(jié)果有關(guān)參數(shù)的矩陣時(shí),通過(guò)向四個(gè)方向分別拓展一定距離的網(wǎng)格來(lái)形成該參數(shù)一個(gè)“通道”的“圖片”。經(jīng)驗(yàn)表明,福建省內(nèi)中小尺度天氣系統(tǒng)移動(dòng)速度最大在0.1°·6 min-1以?xún)?nèi),也就是說(shuō),如果要做15~30 min預(yù)報(bào)的話(huà),需要拓展網(wǎng)格的距離在0.25°~0.5°,保證對(duì)中心點(diǎn)有影響的數(shù)據(jù)包含在這個(gè)“圖片”內(nèi),換算成0.01°的個(gè)數(shù)就是25~50個(gè)柵格,取40格來(lái)計(jì)算的話(huà),那么按上述拓展方法得到的一個(gè)時(shí)次、一個(gè)指標(biāo)的切片通道“圖片”的分辨率是(40×2+1,40×2+1),即(81,81)。由于這個(gè)圖片的大小比較大,為了降低計(jì)算量、提高預(yù)警速率,需要對(duì)原始網(wǎng)格化圖片進(jìn)行壓縮、池化處理。原來(lái)網(wǎng)格單元為0.01°×0.01°,選取k×k個(gè)相鄰的網(wǎng)格,將這k×k個(gè)網(wǎng)格的所有數(shù)值提取出來(lái)作為一個(gè)樣本序列,取這個(gè)樣本序列的最大值、中位數(shù)表征這個(gè)網(wǎng)格壓縮后的信息。以本文所討論15~30 min為例,對(duì)于15~30 min 預(yù)報(bào)模型,選取k=3,即把某參數(shù)、某通道切片的每9個(gè)網(wǎng)格壓縮成1個(gè)網(wǎng)格,每個(gè)網(wǎng)格儲(chǔ)存原9個(gè)網(wǎng)格數(shù)值的最大值、中位數(shù)兩個(gè)數(shù)值信息,如圖2所示,對(duì)雷達(dá)組合反射率、液態(tài)水含量、回波頂高提取這兩個(gè)值,對(duì)于地閃參數(shù)則僅用這3×3個(gè)網(wǎng)格的總地閃個(gè)數(shù)表示,即實(shí)現(xiàn)了2/9的壓縮、提取,大大減少了計(jì)算量,滿(mǎn)足了臨近預(yù)報(bào)對(duì)預(yù)報(bào)產(chǎn)品時(shí)效性的需求。
圖2 某參數(shù)某通道數(shù)據(jù)3×3壓縮方法示意圖Fig.2 A diagram of a channel data 3×3 compression method for a parameter
本文實(shí)際模型中先對(duì)各指標(biāo)按3×3網(wǎng)格進(jìn)行格點(diǎn)壓縮,對(duì)于每個(gè)預(yù)報(bào)格點(diǎn)按東10、西13、南8、北6個(gè)格點(diǎn)距離拓展進(jìn)行切片處理,這樣處理后每個(gè)參數(shù)通道的切片分辨率為(10+13+1,8+6+1),即24×15=360,對(duì)每個(gè)參數(shù)選取當(dāng)前預(yù)報(bào)時(shí)刻往前2個(gè)雷達(dá)時(shí)次的值,最終本文設(shè)計(jì)模型的每個(gè)預(yù)報(bào)格點(diǎn)輸入情況總結(jié)如下:
(1)預(yù)報(bào)格點(diǎn)基準(zhǔn)大小為0.03°×0.03°;
(2)共包含雷達(dá)組合反射率、液態(tài)水含量、回波頂高以及云地閃4個(gè)參量;
(3)每個(gè)參量按0.03°×0.03°網(wǎng)格進(jìn)行格點(diǎn)壓縮,壓縮后雷達(dá)組合反射率、液態(tài)水含量、回波頂高包含最大值、中位數(shù)值兩個(gè)圖片通道,云地閃包含總頻次一個(gè)圖片通道,4個(gè)參量合計(jì)有3×2+1×1=7個(gè)圖片通道;
(4)每個(gè)參量包含當(dāng)前時(shí)刻以及當(dāng)前時(shí)刻往前6 min時(shí)刻的2個(gè)時(shí)間序列,即按上述處理后,共計(jì)有7×2=14個(gè)0.03°×0.03°大小的圖片通道;
(5)每個(gè)待預(yù)報(bào)格點(diǎn)在每個(gè)通道上按東10、西13、南8、北6個(gè)格點(diǎn)距離拓展進(jìn)行切片處理,每個(gè)切片大小為24×15,14個(gè)通道得到14個(gè)通道的24×15分辨率的小圖片,實(shí)際輸入大小為24×15×14=5040。
按上述方法對(duì)雷達(dá)、閃電數(shù)據(jù)進(jìn)行切片及切片壓縮處理后,對(duì)于每一個(gè)預(yù)報(bào)格點(diǎn),可以得到14個(gè)通道、24×15分辨率的小圖片,將這14個(gè)通道的圖片作為神經(jīng)網(wǎng)絡(luò)模型的輸入,按“兩次卷積-池化-兩次卷積-池化-展開(kāi)-全連接層-全連接層-激活函數(shù)(sigmoid)激活輸出”的流程建立深度學(xué)習(xí)模型,具體如圖3所示,模型中各個(gè)處理單元設(shè)計(jì)如下:
圖3 CNN設(shè)計(jì)模型示意圖Fig.3 Diagram of the model design of convolutional neural network
(1)卷積層:選用2×2濾波器,移動(dòng)步長(zhǎng)為1,采用邊界不填0的卷積處理方式。這主要是考慮使用的4個(gè)參數(shù)的數(shù)值存在較多0值的情況,如果采用0值填邊的話(huà)會(huì)使神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí)以為邊界沒(méi)有天氣活動(dòng),進(jìn)而引起較大的誤差。通道數(shù)按輸入通道數(shù)的1.25倍數(shù)遞增(取整),采用層標(biāo)準(zhǔn)化技術(shù)(batch normalization)對(duì)每層輸入值進(jìn)行規(guī)范化處理,最后按激活函數(shù)(relu)對(duì)卷積層做非線(xiàn)性激活,隨意節(jié)點(diǎn)丟棄率(dropout)取值為0.15,防止模型的過(guò)擬合,將結(jié)果傳遞到下一層模型中。
(2)池化層:按最大池化(max pooling)模式進(jìn)行池化操作,移動(dòng)步長(zhǎng)為2,采用邊界不填0的卷積處理方式,理由同卷積層的設(shè)計(jì)。
(3)全連接層:在兩次卷積-池化操作后,將輸出的多通道圖片按單列格點(diǎn)展開(kāi),進(jìn)行全連接操作。全連接共兩層,全連接節(jié)點(diǎn)設(shè)置為64、32,每個(gè)全連接層都采用層標(biāo)準(zhǔn)化技術(shù)對(duì)輸入值進(jìn)行規(guī)范化處理,選用激活函數(shù)(relu),隨意節(jié)點(diǎn)丟棄率(dropout)取值為0.15,防止模型的過(guò)擬合,最后使用激活函數(shù)(sigmoid)對(duì)前面神經(jīng)網(wǎng)絡(luò)運(yùn)算結(jié)果進(jìn)行最后預(yù)測(cè),定義最后的預(yù)測(cè)值>0.5為Y=1類(lèi)標(biāo)簽,預(yù)測(cè)值≤0.5為Y=0類(lèi)標(biāo)簽,得到0、1的二分類(lèi)結(jié)果。
對(duì)于Y標(biāo)簽按如下規(guī)則確定:以本文討論的15~30 min預(yù)報(bào)為例,若預(yù)報(bào)網(wǎng)格在預(yù)報(bào)時(shí)刻往后的15~30 min監(jiān)測(cè)到云地閃,則不管該時(shí)段內(nèi)發(fā)生多少次閃電,都標(biāo)記為1,沒(méi)有監(jiān)測(cè)到云地閃即標(biāo)記為0。
以2017年3—10月、2018年3—7月福建省雷達(dá)、閃電監(jiān)測(cè)數(shù)據(jù)為樣本,對(duì)每個(gè)月選取當(dāng)月閃電定位監(jiān)測(cè)數(shù)據(jù)文本文件大小最大的兩個(gè)日期,對(duì)每個(gè)選取日期按每個(gè)小時(shí)、每個(gè)雷達(dá)時(shí)次、每個(gè)經(jīng)緯度網(wǎng)格進(jìn)行切片選取(X輸入)與對(duì)應(yīng)15~30 min后該經(jīng)緯度網(wǎng)格雷電發(fā)生情況(Y二分類(lèi)標(biāo)簽)進(jìn)行提取。 由于Y=0且X大部分?jǐn)?shù)據(jù)為0值(即各個(gè)網(wǎng)格的雷達(dá)、閃電數(shù)據(jù)基本為0,對(duì)應(yīng)預(yù)報(bào)時(shí)效內(nèi)沒(méi)有閃電)的情況占所遴選樣本的比例非常大,因此在數(shù)據(jù)提取時(shí)判定當(dāng)X數(shù)據(jù)中雷達(dá)組合反射率的值大于20 dBz的個(gè)數(shù)占比小于10%時(shí),本次樣本提取放棄; 此外由于閃電定位監(jiān)測(cè)數(shù)據(jù)存在一定的偏差,經(jīng)常出現(xiàn)在同一時(shí)間段,某個(gè)閃電數(shù)據(jù)的發(fā)生位置與當(dāng)時(shí)的閃電集中區(qū)域偏離較大的情況,為了使訓(xùn)練樣本Y=1的標(biāo)簽降低噪聲、干擾的情況,樣本提取時(shí)剔除閃電定位方法為2站、雷電流幅值絕對(duì)值≤2 kA、某個(gè)閃電前后10 min內(nèi)距離本次閃電0.5°范圍內(nèi)沒(méi)有其他閃電監(jiān)測(cè)記錄的閃電數(shù)據(jù)。為了避免訓(xùn)練樣本出現(xiàn)0、1標(biāo)簽個(gè)數(shù)差別太大的情況,對(duì)當(dāng)前得到的所有訓(xùn)練樣本進(jìn)行隨機(jī)遴選,根據(jù)計(jì)算機(jī)的計(jì)算負(fù)荷,設(shè)置總量為80 000個(gè)樣本,遴選0、1樣本個(gè)數(shù)各40 000個(gè),進(jìn)入后續(xù)的網(wǎng)絡(luò)訓(xùn)練。 具體網(wǎng)絡(luò)訓(xùn)練采用Adam優(yōu)化器,即在梯度下降進(jìn)行迭代求最優(yōu)解的基礎(chǔ)上,根據(jù)一階梯度矩估計(jì)、二階梯度矩估計(jì)計(jì)算更新步長(zhǎng)的優(yōu)化模型,設(shè)置初始學(xué)習(xí)率為0.001,模型學(xué)習(xí)率自動(dòng)衰減為0.9,設(shè)置單次訓(xùn)練樣本數(shù)(batch size)為120,選取10%的樣本容量作為測(cè)試數(shù)據(jù),選擇二分類(lèi)損失函數(shù)(binary crossentropy)為損失計(jì)算方式,設(shè)置最大訓(xùn)練次數(shù)為500次,將訓(xùn)練過(guò)程中準(zhǔn)確率最好的參數(shù)矩陣保存為最終訓(xùn)練結(jié)果。
按上述方法與規(guī)則對(duì)模型進(jìn)行訓(xùn)練,繪制整個(gè)訓(xùn)練過(guò)程的損失(losses)與準(zhǔn)確率(accuracy)曲線(xiàn)(圖4)。由圖4可知,損失曲線(xiàn)下降的速度適均,說(shuō)明模型設(shè)計(jì)的初始學(xué)習(xí)率可行;最終測(cè)試集損失控制在0.430 1,測(cè)試集準(zhǔn)確率為0.798 5,測(cè)試集與訓(xùn)練集的損失、準(zhǔn)確率曲線(xiàn)基本貼合,訓(xùn)練后期也沒(méi)有出現(xiàn)明顯的分開(kāi),表明模型沒(méi)有出現(xiàn)明顯的過(guò)擬合現(xiàn)象,也說(shuō)明按本文設(shè)計(jì)的訓(xùn)練數(shù)據(jù)提取、遴選方法可行,保證了數(shù)據(jù)集數(shù)據(jù)質(zhì)量的一致性與噪聲的隨機(jī)分布。整個(gè)訓(xùn)練模型在大概訓(xùn)練350個(gè)訓(xùn)練次數(shù)后開(kāi)始趨于平穩(wěn),模型學(xué)習(xí)率經(jīng)自動(dòng)衰減100個(gè)訓(xùn)練次數(shù)仍沒(méi)有明顯下降和變化,可見(jiàn)模型在這時(shí)基本已訓(xùn)練到飽和,整個(gè)模型的訓(xùn)練過(guò)程合理、可行。
圖4 模型訓(xùn)練損失曲線(xiàn)(a)和準(zhǔn)確率曲線(xiàn)(b)Fig.4 Curves of model training losses (a) and accuracy (b)
本文所建立與訓(xùn)練的模型在福建省2019年的汛期工作(3—10月)中得到完整的應(yīng)用。從總體上看本文討論的15~30 min雷電預(yù)警效果總體表現(xiàn)穩(wěn)定和良好,取2019年4月22日14時(shí)的預(yù)報(bào)、實(shí)況圖(圖5)為例,由圖可見(jiàn),模型預(yù)報(bào)的幾個(gè)雷電發(fā)生區(qū)域在15~30 min后的都有閃電發(fā)生。需要說(shuō)明的是,預(yù)報(bào)圖中對(duì)預(yù)報(bào)格點(diǎn)按福建省邊界外圍一定距離做了裁剪,因此實(shí)況圖中左下角的閃電并非沒(méi)有預(yù)報(bào)出來(lái),而是被裁剪。
圖5 2019年4月22日14時(shí)的15~30 min雷電預(yù)報(bào)(a)、實(shí)況(b)對(duì)比Fig.5 The 15-30 min lightning nowcasting (a) and observation (b) at 14:00 BT 22 April 2019
為了更精確了解本模型的實(shí)際準(zhǔn)確率情況,本文按系統(tǒng)動(dòng)力抬升型雷電過(guò)程、副高邊緣局地?zé)崂妆┻^(guò)程這兩種福建省主要雷電天氣類(lèi)別,選取了2019年主要雷電天氣(兩種類(lèi)型各選取10 d)作為樣本進(jìn)行TS評(píng)分計(jì)算,結(jié)果表明:
動(dòng)力抬升型雷電過(guò)程, TS平均評(píng)分為0.716,平均漏報(bào)率、空?qǐng)?bào)率分別為0.095、0.190;
局地?zé)崂妆┬屠纂娺^(guò)程,TS平均評(píng)分為0.694,平均漏報(bào)率、空?qǐng)?bào)率分別為0.112、0.194。
檢驗(yàn)結(jié)果表明,模型對(duì)前汛期動(dòng)力抬升型的雷電過(guò)程預(yù)警效果略微好于夏季局地?zé)崂妆┑睦纂娺^(guò)程,考慮到閃電定位系統(tǒng)本身存在的誤差,且福建省多山地地形,這樣的預(yù)報(bào)結(jié)果基本可以接受。有研究采用雷達(dá)與閃電閾值控制算法,對(duì)福建省進(jìn)行格點(diǎn)化雷電臨近預(yù)警應(yīng)用,按雷達(dá)組合反射率37 dBz、垂直液態(tài)水含量1.5 kg·m-2、回波頂高11 km作為雷達(dá)預(yù)警控制的閾值,研究中直接閃電預(yù)警判定距離為10 km,間接閃電預(yù)警判定距離為15 km,閃電預(yù)警解除判定距離為15 km,最后分析得出其TS評(píng)分為0.671(張燁方等,2019)。相比之下,本文設(shè)計(jì)與訓(xùn)練的CNN模型的準(zhǔn)確率有了一定提升。
本文以雷達(dá)產(chǎn)品(組合反射率、液態(tài)水含量、回波頂高)和閃電數(shù)據(jù)為指標(biāo),對(duì)CNN模型進(jìn)行了適應(yīng)雷電臨近預(yù)警需求的改進(jìn)和調(diào)整,對(duì)改進(jìn)后的模型進(jìn)行了訓(xùn)練、檢驗(yàn),得出以下結(jié)論:
(1)本文設(shè)計(jì)的切片式處理方法可以解決CNN在氣象格點(diǎn)預(yù)報(bào)應(yīng)用中遇到的像素級(jí)分類(lèi)問(wèn)題,設(shè)計(jì)的格點(diǎn)壓縮算法可以在短時(shí)間、一般計(jì)算硬件的條件下,得到一個(gè)省范圍內(nèi)的格點(diǎn)預(yù)報(bào)產(chǎn)品,滿(mǎn)足臨近預(yù)警服務(wù)對(duì)時(shí)效性的要求。檢驗(yàn)表明設(shè)計(jì)的模型在預(yù)警效果上比常規(guī)采用“配料法-閾值控制”的雷電臨近預(yù)警模型有了一定的提高,模型對(duì)動(dòng)力抬升型雷電過(guò)程的預(yù)警效果稍微好于副熱帶高壓邊緣局地?zé)崂妆┻^(guò)程的預(yù)警效果。
(2)原始訓(xùn)練數(shù)據(jù)的質(zhì)量對(duì)模型的訓(xùn)練效果有很大影響,原始數(shù)據(jù)噪聲的大小、不同類(lèi)別標(biāo)簽的數(shù)量比例遴選不合理甚至可能會(huì)使訓(xùn)練的模型矩陣出現(xiàn)預(yù)報(bào)結(jié)果全是0或1的“垃圾輸出”;此外,在雷電臨近預(yù)警領(lǐng)域,對(duì)閃電定位數(shù)據(jù)進(jìn)行適宜的修訂可以有效提高模型的訓(xùn)練準(zhǔn)確率,本文按“剔除2站定位、雷電流幅值絕對(duì)值≤2 kA、某個(gè)閃電前后10 min 內(nèi)距離本次閃電0.5°范圍沒(méi)有其他閃電監(jiān)測(cè)記錄的閃電數(shù)據(jù)”的條件對(duì)訓(xùn)練的閃電數(shù)據(jù)進(jìn)行了剔除和修訂后,模型的訓(xùn)練準(zhǔn)確率提高了近0.10,是模型訓(xùn)練過(guò)程中各個(gè)環(huán)節(jié)、參數(shù)調(diào)整中準(zhǔn)確率變化最大的地方。
(3)1~2 h預(yù)報(bào)思路展望。相較傳統(tǒng)的雷達(dá)回波相關(guān)性跟蹤(TREC)的外推算法,本文所建立基于切片式處理、CNN模型的雷電臨近預(yù)警模型在預(yù)報(bào)區(qū)域的外推上,初步具有變形外推的效果,但在不少方面仍有改進(jìn)和不足的地方。如:模型沒(méi)有根據(jù)不同的天氣系統(tǒng)進(jìn)行分類(lèi)訓(xùn)練、預(yù)警;模型在參數(shù)的選擇上沒(méi)有把高程、土壤、云閃及潛勢(shì)預(yù)報(bào)的因子列入其中;限于計(jì)算硬件設(shè)備的影響,本文輸入數(shù)據(jù)的時(shí)間序列時(shí)段、切片大小有限等。需要看到的是,單純依靠上述模型只能滿(mǎn)足15~60 min的雷電預(yù)警需求,要做1~2 h的預(yù)警產(chǎn)品,需要再引入其他強(qiáng)天氣潛勢(shì)預(yù)報(bào)涉及的物理量,但這些物理量在格點(diǎn)精度、時(shí)間序列點(diǎn)上與雷達(dá)、閃電的數(shù)據(jù)無(wú)法同步,這也是影響1~2 h臨近預(yù)報(bào)格點(diǎn)產(chǎn)品效果的重要因素,本文研究項(xiàng)目也正嘗試對(duì)這些物理量進(jìn)行基于深度學(xué)習(xí)網(wǎng)絡(luò)模型的處理,努力將其融入到本文所研究模型的1~2 h預(yù)報(bào)產(chǎn)品中,以更好地實(shí)現(xiàn)人工智能技術(shù)在雷電臨近預(yù)警工作中的有效應(yīng)用。