王 興,呂晶晶,周 可,詹少偉
(1.南京信息工程大學(xué) 大氣科學(xué)與環(huán)境氣象國家級實驗教學(xué)示范中心,江蘇 南京210044;2.南京信大氣象科學(xué)技術(shù)研究院,江蘇 南京 210044)
下?lián)舯┝魇且环N局地災(zāi)害性天氣現(xiàn)象,它形成于強對流云團內(nèi),是急速下沉的氣流在到達地面時形成強烈的輻散性直線強風(fēng)。盡管其發(fā)生的概率和影響的地理范圍不如常見的雷暴、短時強降水等極端天氣,然而一旦發(fā)生,其造成的危害往往是巨大的。下?lián)舯┝鳟a(chǎn)生時,會引發(fā)局地的風(fēng)速劇增和強烈的風(fēng)切變,當(dāng)飛機穿越該區(qū)域時很可能失去平衡,甚至失速墜機。下?lián)舯┝鞯竭_地面的風(fēng)力可達15級,受其影響地區(qū)極易發(fā)生房屋倒塌、植被破壞,進而造成巨大的經(jīng)濟損失和人員傷亡事故。我國“東方之星”號客輪翻沉事件就是一起由下?lián)舯┝鲗?dǎo)致的重大災(zāi)難性事件。
長期以來,氣象、空管和航運等部門都高度重視對各類災(zāi)害性天氣的監(jiān)測、預(yù)測和預(yù)警。不斷革新的探測手段和急速提升的計算機性能為下?lián)舯┝飨嚓P(guān)研究和業(yè)務(wù)應(yīng)用提供強有力的支撐。近年來,相關(guān)研究主要是從下?lián)舯┝鞯男纬蓹C理、下?lián)舯┝魅芷谠谔鞖饫走_上表現(xiàn)出的圖像形態(tài)特征,以及利用精細化數(shù)值模式進行物理量預(yù)報等方面展開。但由于下?lián)舯┝餍纬傻目臻g尺度極小,且生消發(fā)展速度極快,當(dāng)前主流的多普勒天氣雷達在SA工作模式下,往往只有1~2次體掃能相對清楚地捕捉到下?lián)舯┝鞯娜舾傻湫吞卣?,如果氣象業(yè)務(wù)人員此時沒有緊盯屏幕,往往會錯過對其的分析和判讀。而事實上,隨著氣象信息化程度的不斷提升,每天數(shù)以百GB的數(shù)據(jù)量已然超出氣象工作者主觀研讀的能力。因此,亟需借助計算機智能識別相關(guān)技術(shù),實現(xiàn)對下?lián)舯┝鞯雀呶?、高影響天氣的快速識別和準(zhǔn)確預(yù)報。
將深度學(xué)習(xí)技術(shù)應(yīng)用到對下?lián)舯┝鞯淖R別和預(yù)報是一些研究人員努力的目標(biāo),但由于下?lián)舯┝靼l(fā)生發(fā)展過程在雷達產(chǎn)品等資料中所表現(xiàn)出的一些典型特征并不是一直存在,而且一些關(guān)鍵性特征又難以量化,使得不論采用圖像模式識別還是機器學(xué)習(xí)算法識別,都難以有效實施應(yīng)用。為了克服上述困難,本文提出一種以深度神經(jīng)網(wǎng)絡(luò)為模型,以雷達回波圖像和徑向速度場圖像為輸入,融合雷達回波時空序列多種特征的下?lián)舯┝髦悄茏R別方法。
下?lián)舯┝鞯母拍钍?0世紀(jì)70年代由氣象學(xué)家Fujita提出的。當(dāng)時,全球民航先后發(fā)生多起因局地性切變大風(fēng)造成的災(zāi)難性事故。此后的數(shù)十年間,人們對下?lián)舯┝鞯难芯恳恢睕]有停止。當(dāng)前很多研究表明,一次典型的下?lián)舯┝鬟^程通常在雷達圖像上表現(xiàn)出以下特征:在形成階段,強對流單體合并加強形成弓狀回波;在弓狀回波前沿,反射率因子梯度大值區(qū)易發(fā)生下?lián)舯┝?,風(fēng)暴中心持續(xù)上升再急速下降。結(jié)合探空報等資料可計算分析出,強對流系統(tǒng)在發(fā)展階段,底層有較強的暖濕入流,高層有明顯的上層出流,中層以上升氣流為主。風(fēng)暴中心下降過程中,中層以上存在強度不斷增大的徑向風(fēng)輻合,在雷達徑向速度圖上呈現(xiàn)為一對“正負(fù)速度對”。下?lián)舯┝靼l(fā)生時,底層會出現(xiàn)相應(yīng)的徑向風(fēng)輻散,即與中層位置大致相反的“正負(fù)速度對”。在垂直方向上,高低層存在垂直切變。
盡管上述特征是下?lián)舯┝鞯墓残蕴卣?,但又有一些研究指出,這些特征并不是一直存在的。例如,陶嵐等認(rèn)為識別下?lián)舯┝髯羁煽康奶卣魇堑孛孑椛?,在圖像上表現(xiàn)為雷達徑向上的“牛眼”回波,即“正負(fù)速度對”,但由于環(huán)境風(fēng)場的影響,這種特征并不總是存在,“正負(fù)速度對”往往并不對稱;而且,依靠雷達識別出的強對流天氣有很多特征與下?lián)舯┝魇窍嗨频?。這些因素都對下?lián)舯┝鞯臏?zhǔn)確識別造成了極大的干擾。
要實現(xiàn)對下?lián)舯┝鞯淖詣幼R別預(yù)警,關(guān)鍵需要解決兩方面問題:一是要確保用于對下?lián)舯┝鞅O(jiān)測、預(yù)測等氣象業(yè)務(wù)的實時探測數(shù)據(jù)的可靠性;二是要確保風(fēng)暴識別追蹤相關(guān)算法模型的可靠性。國際上主要是通過反射率因子核的下降以及若干環(huán)境因子的計算結(jié)果分析,來進行下?lián)舯┝鞯念A(yù)報預(yù)警。但起關(guān)鍵性作用的雷達資料,其波束寬度約為1°(WSR-88D),由于下?lián)舯┝鞯某叨刃?,受雷達探測分辨率的限制,其有效探測半徑僅有約50 km。并且,環(huán)境因子依賴于探空報等資料,而這些資料的觀測頻次低且空間間隔距離大,因此難以在實際業(yè)務(wù)中推廣應(yīng)用。如何有效提升對下?lián)舯┝髯詣幼R別的準(zhǔn)確率當(dāng)前仍是一項技術(shù)難題。
隨著GPU和眾核技術(shù)的普及,深度神經(jīng)網(wǎng)絡(luò)在圖像分類、識別和物體檢測等領(lǐng)域得到廣泛深入的研究,尤其是圖像智能識別技術(shù)的不斷成熟,極大地促進了醫(yī)學(xué)診斷、人體行為識別和生態(tài)環(huán)境監(jiān)控等行業(yè)應(yīng)用的智能化,并且這種智能化水平仍在不斷提升。
與傳統(tǒng)針對雷達圖像特征識別的技術(shù)相比,運用深度神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)進行下?lián)舯┝髯R別的最大優(yōu)勢在于不需要針對不同地區(qū)、不同季節(jié)的雷達回波和徑向速度場圖像,分別設(shè)計總結(jié)出一套發(fā)生規(guī)律或特征。只要輸入神經(jīng)網(wǎng)絡(luò)的樣本數(shù)量足夠多,且樣本的時間分布和地理空間分布相對均衡,再結(jié)合一些模型優(yōu)化技術(shù),即能通過神經(jīng)網(wǎng)絡(luò)模型完成對下?lián)舯┝骼走_圖像特征的準(zhǔn)確識別。并且,由于下?lián)舯┝鞯目臻g尺度很小,在雷達回波圖像上往往只表現(xiàn)為幾個或十幾個像素寬度的高亮色塊,基于深度神經(jīng)網(wǎng)絡(luò)的圖像識別并不需要人為定義這些色塊的形狀特征,這將比人工判讀或基于傳統(tǒng)圖像形態(tài)的識別更加有效。
本文算法的總體技術(shù)路線如圖1所示。
圖1 總體技術(shù)路線
本文算法的目標(biāo)是以深度神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),尋找“雷達回波時序圖像和徑向速度場時序圖像”與“是否發(fā)生下?lián)舯┝魈鞖猬F(xiàn)象”之間的一個函數(shù)映射關(guān)系。
算法的深度神經(jīng)網(wǎng)絡(luò)主要以卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)為基本單元,同時借鑒了LeNet和GoogLeNet的技術(shù)思路,構(gòu)建一套適用于處理雷達回波時序圖像和徑向速度場時序圖像的網(wǎng)絡(luò)模型。上述兩種雷達圖像可通過專業(yè)軟件或公開的算法生成,而客觀判定是否發(fā)生了下?lián)舯┝鲃t需要通過實況觀測資料加以分析,其中最直接有效的一種觀測資料是地面氣象站的測風(fēng)數(shù)據(jù)。圖1中的,-1和分別表示不同時刻的雷達圖像,這些圖像記錄了大氣中水汽等粒子在時間和空間上的一些特征。將預(yù)處理后的局部雷達圖像與自動站的氣象數(shù)據(jù)通過經(jīng)緯度信息結(jié)合起來,生成用來訓(xùn)練和測試的數(shù)據(jù)集。訓(xùn)練過程包括數(shù)據(jù)預(yù)處理、識別模型的構(gòu)建、數(shù)據(jù)增強優(yōu)化、損失函數(shù)優(yōu)化和折交叉驗證等。檢驗過程為:通過客觀量化的評價指標(biāo)統(tǒng)計每種優(yōu)化技術(shù)產(chǎn)生的效果,并對結(jié)果加以分析。
數(shù)據(jù)預(yù)處理的主要任務(wù)是生成一段時間內(nèi)兩種雷達圖像(回波圖像和徑向速度場圖像)序列與下?lián)舯┝靼l(fā)生與否的標(biāo)簽之間的“數(shù)據(jù)對”。
雷達圖像的生成主要有兩種方式:一種為PPI(平面位置顯示),它是雷達在某個仰角上掃描一圈得到的數(shù)據(jù);另一種為CAPPI(等高平面位置顯示),它是在某一等高位置上的雷達數(shù)據(jù),通常是由PPI數(shù)據(jù)通過空間插值計算得到。CAPPI對于主觀分析雷達圖像更具優(yōu)勢??紤]到CAPPI是PPI的次級產(chǎn)品,在插值計算時數(shù)值存在失真,因此,本文算法以我國S波段多普勒天氣雷達在VCP21工作方式下生成的雷達資料為例,采用雷達的PPI回波圖像和徑向速度場圖像作為模型的輸入。單個時刻的雷達圖像如圖2所示。
圖2 本文算法使用的單個時刻的雷達圖像示例
圖2中前兩行是同一時刻9個仰角面的雷達回波圖像,最后一張是回波強度色標(biāo)圖;后兩行是相同時刻9個仰角面的徑向速度場圖像,最后一張是速度大小色標(biāo)圖。各圖像所對應(yīng)的雷達探測仰角依次升高。
下?lián)舯┝靼l(fā)生與否的標(biāo)簽是通過基本臺站和加密自動氣象站記錄的風(fēng)速數(shù)據(jù),經(jīng)下述規(guī)則判定得到:
1)瞬時風(fēng)速達到或超過17.2 m/s(8級風(fēng)力);
2)過去10 min內(nèi),風(fēng)速變化超過11.7 m/s;
3)在氣象站觀測風(fēng)速的最近1 h內(nèi),從各時次雷達探測資料中識別到風(fēng)暴核心(強回波中心)存在急速下降的現(xiàn)象。
當(dāng)這3項條件均滿足時,標(biāo)記此時發(fā)生了下?lián)舯┝?;其他情況下,均標(biāo)記為無下?lián)舯┝鳌S捎跉庀笳撅L(fēng)速觀測的時間周期與雷達探測的周期不同,因此,還需要對上述資料進行時間規(guī)整和質(zhì)量控制。由于雷達中心位置的經(jīng)緯度坐標(biāo)可查,雷達探測的空間分辨率固定,因此,通過數(shù)學(xué)方法可以建立起雷達中心位置與地面氣象站之間的空間位置關(guān)系。
由于引發(fā)下?lián)舯┝鞯娘L(fēng)暴核心通常能達到的最高高度不超過15 km,而隨著PPI圖像上探測點遠離雷達中心,其高度不斷增加,距離雷達中心點50 km以外的高仰角的雷達回波高度已高于15 km,因此,對所有圖像統(tǒng)一截取以雷達中心點為中心,長、寬均為100像素的圖像作為網(wǎng)絡(luò)模型所輸入的單幀圖像。此外,考慮到9個仰角中,最高仰角的信息量往往很少,對下?lián)舯┝鞯淖R別意義不大。因此,輸入圖像時剔除了1個最高仰角的回波圖像和徑向速度場圖像。
綜上所述,本算法輸入到深度網(wǎng)絡(luò)模型的數(shù)據(jù)是一個100×100×(8+8)×的四維向量,其中,表示選取的雷達時序資料的時刻數(shù)。以體掃周期6 min為例,選取近30 min的雷達時序資料,取值為6。
采用CNN模型對圖像進行智能分類識別,是當(dāng)前較為常用的一種技術(shù)手段。在此基礎(chǔ)上,衍生出了很多卓有成效的模型,如VGGNet、LeNet和AlexNet等。本算法的網(wǎng)絡(luò)模型借鑒了LeNet和GoogLeNet的技術(shù)思路,同時做出一些改進以適用于四維雷達時空向量的訓(xùn)練。下?lián)舯┝髦悄茏R別的網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 下?lián)舯┝髦悄茏R別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
如圖3所示,模型首先將數(shù)據(jù)集拆解成雷達回波時序圖像和徑向速度場時序圖像,每一組包括8個仰角面、6個相鄰時刻的圖像,圖像大小為100×100像素。對雷達回波圖像的處理,首先設(shè)計了一個4通道的稀疏網(wǎng)絡(luò)結(jié)構(gòu)來生成稠密數(shù)據(jù),每個通道又包含1~2個卷積層,卷積核的大小為1×1,3×3和5×5。通過這種結(jié)構(gòu)來抽取不同時間尺度下的回波強度空間信息,4個通道均采用合適的填充(Padding)來保持輸入與輸出的圖像大小一致。然后,將每個通道的輸出在通道維上連結(jié),得到100×100×8×1的四維向量,并輸入到后續(xù)層中,這些層的結(jié)構(gòu)如圖4所示。
圖4中,Conv表示卷積層,括號中數(shù)值表示卷積核的窗口大小或輸出數(shù)。輸入層是一個四維向量,其他各層的作用與英文名稱的含義相一致,其中,Dropout層采用0.75為參數(shù)值。
圖4 下?lián)舯┝髦悄茏R別的網(wǎng)絡(luò)結(jié)構(gòu)
采用相同的網(wǎng)絡(luò)模型對徑向速度場時序圖像進行處理,直到兩者分別經(jīng)過最后一次卷積Conv(3×3×64)和Dropout后,再進行Flatten和全連接,最終輸出為2分類one-hot編碼的數(shù)據(jù)形式。除了圖3所示的各個神經(jīng)元層外,卷積層和全連接層所采用的激活函數(shù)均為Relu函數(shù)。此外,在輸入層后還增加了批規(guī)范化層(Batch Normalization),用于提升該模型訓(xùn)練的魯棒性。
盡管采用CNN構(gòu)建的深度學(xué)習(xí)模型理論上具有良好的泛化能力,但考慮到下?lián)舯┝鬟@類災(zāi)害性天氣的發(fā)生屬于小概率事件,如果直接將大量歷史氣象數(shù)據(jù)按上述預(yù)處理方法處理后,輸入模型進行訓(xùn)練,很可能會出現(xiàn)訓(xùn)練結(jié)果偏向于大概率事件,即沒有下?lián)舯┝鞯陌l(fā)生。這種“數(shù)據(jù)不均衡”問題勢必影響模型對下?lián)舯┝髯R別預(yù)警的準(zhǔn)確性。
為了克服上述問題,本文采用一種基于低概率訓(xùn)練樣本重采樣的數(shù)據(jù)增強方法,將可能存在下?lián)舯┝魈卣鞯睦走_圖像通過小幅度的平移、旋轉(zhuǎn)、變形和增加噪聲等方式,生成一批新的訓(xùn)練樣本,使得數(shù)據(jù)樣本中發(fā)生下?lián)舯┝鞯谋壤兴黾樱M而降低數(shù)據(jù)不均衡對模型訓(xùn)練的影響。由于雷達圖像上各個像素點的經(jīng)緯度坐標(biāo)可通過數(shù)學(xué)方法計算得到,因此發(fā)生形變后,與雷達圖像相對應(yīng)的地面站資料的經(jīng)緯度坐標(biāo)也可做相同的轉(zhuǎn)換處理,使得兩種雷達圖像與下?lián)舯┝靼l(fā)生與否的標(biāo)簽在地理位置上依然保持一致。圖5為6幅雷達回波圖像,第1幅為局部原圖,后5幅分別做了順時針旋轉(zhuǎn)、逆時針旋轉(zhuǎn)、縮小、放大和放大旋轉(zhuǎn)。
圖5 數(shù)據(jù)增強示例
與所有“有監(jiān)督學(xué)習(xí)”一樣,深度學(xué)習(xí)模型本身并不能解決圖像識別和分類的問題,而是需要通過大量歷史樣本“數(shù)據(jù)對”由計算機不斷學(xué)習(xí)和自我校正,逐步構(gòu)建和完善分類識別模型的若干參數(shù)和權(quán)重,以做出準(zhǔn)確識別和分類。為了進一步解決樣本數(shù)據(jù)不平衡的問題,在損失函數(shù)中引入類別權(quán)重,賦予實際存在下?lián)舯┝鞯P妥R別為不存在下?lián)舯┝鬟@種情況更大的懲罰項。改進后的損失函數(shù)為:
式中:y 是下?lián)舯┝魈鞖獾氖拘院瘮?shù);t 是模型對應(yīng)于下?lián)舯┝魈鞖獾妮敵?,表示該區(qū)域被識別為下?lián)舯┝魈鞖獾母怕?;是判定?quán)重項,即懲罰項。值越大,模型會將更多的雷達圖像判定為存在下?lián)舯┝鳎M而造成更高的誤報率,但相應(yīng)地,識別的成功率也會提升。很顯然,的取值將對模型識別結(jié)果產(chǎn)生重要影響,具體取值將在實驗與結(jié)果分析部分進行論證。
由于下?lián)舯┝鞯陌l(fā)生具有一定的季節(jié)特征,而基于大量歷史氣象資料的數(shù)據(jù)集是按時間先后順序組織的。為提升模型泛化性能,并在相近訓(xùn)練時間找到更優(yōu)的網(wǎng)絡(luò)參數(shù),提出采用折交叉驗證的方法進一步優(yōu)化上述網(wǎng)絡(luò)模型。所謂折,即是將原有數(shù)據(jù)集拆分成份,其中-1份作為訓(xùn)練集,剩下的一份作為驗證集。具體步驟為:
1)如圖6所示,將原有數(shù)據(jù)集隨機地拆分為份;
圖6 K折交叉驗證示例
2)挑選任意一份作為驗證集,剩余均作為訓(xùn)練集,用于模型的訓(xùn)練。通過該訓(xùn)練集訓(xùn)練后得到一個帶有網(wǎng)絡(luò)參數(shù)的模型,用此模型在驗證集上進行測試,并保存模型的評價指標(biāo)E;
3)重復(fù)第2步次,以確保所有子集都有且僅有一次機會作為驗證集;
4)將各組評價指標(biāo)的均值作為模型精度的估計,并將其作為當(dāng)前折交叉驗證下網(wǎng)絡(luò)模型的綜合評價指標(biāo):
通常對于原數(shù)據(jù)集的拆分采取的是均分方式,為了更好地均衡下?lián)舯┝鲗嶋H發(fā)生在數(shù)據(jù)集中的分布,可以采取進一步的策略使每組內(nèi)的有無發(fā)生下?lián)舯┝鞯恼急扰c總體數(shù)據(jù)集中占比近似一致。該方法的優(yōu)勢在于,可從有限的數(shù)據(jù)集中獲得盡可能多的有效信息,避免陷入局部的極值,同時尋求最優(yōu)參數(shù),進而提升模型識別的準(zhǔn)確率和穩(wěn)定性。
為了檢驗上述方法識別下?lián)舯┝鞯男Ч?,本實驗?zhǔn)備了2018年全年南京地區(qū)雷達和江蘇、安徽兩省的地面氣象站資料作為數(shù)據(jù)集。該雷達體掃周期為6 min,收集到有效探測數(shù)據(jù)共58173個。地面氣象站資料剔除了超出雷達圖像覆蓋范圍的站點,站點記錄的氣象要素包括溫度、濕度、風(fēng)向和風(fēng)速等,觀測記錄的頻率主要為60 s/次。采用第2.2節(jié)所述方法對數(shù)據(jù)進行預(yù)處理,得到25137組由雷達探測資料(回波時序圖像和徑向速度場時序圖像)和下?lián)舯┝靼l(fā)生與否的標(biāo)簽構(gòu)成的“數(shù)據(jù)對”。
首先,定義如表1所示的4類事件。
表1 事件定義
然后,采用擊中率(POD)、誤識率(FAR)兩個量化指標(biāo)來評價下?lián)舯┝髯R別的效果。其中,POD表示采用本文所述算法識別到下?lián)舯┝鳎⑶覍嶋H發(fā)生下?lián)舯┝鞯臄?shù)量占實際發(fā)生下?lián)舯┝骺倲?shù)的比例;FAR表示采用本文所述算法識別到下?lián)舯┝?,但實際未發(fā)生下?lián)舯┝鞯臄?shù)量占本算法識別為下?lián)舯┝骺倲?shù)的比例。計算方法如下:
首先,采用第2.4節(jié)所述方法將數(shù)據(jù)集擴充到66898組“數(shù)據(jù)對”,增加客觀存在下?lián)舯┝魈鞖獾挠美跀?shù)據(jù)集中的比重。
然后,按照第2.5節(jié)所述方法,定義3個懲罰項參數(shù)={1,1.5,2},分別用于數(shù)據(jù)檢驗。
再按照第2.6節(jié)所述方法,采用10折(=10)交叉驗證,將數(shù)據(jù)集拆分為10份依次進行模型的迭代訓(xùn)練。
最后,采用第2.3節(jié)所述網(wǎng)絡(luò)模型,將數(shù)據(jù)集應(yīng)用于該模型進行訓(xùn)練和檢驗。為了檢驗數(shù)據(jù)增強優(yōu)化和損失函數(shù)優(yōu)化的效果,實驗實施和結(jié)果分析時,也列出了不做相關(guān)優(yōu)化的統(tǒng)計數(shù)據(jù)。
首先統(tǒng)計不做任何優(yōu)化的深度神經(jīng)網(wǎng)絡(luò)模型識別下?lián)舯┝鞯男Ч?。直接將最初?5137組“數(shù)據(jù)對”拆分成9∶1份,其中9份用于模型的訓(xùn)練,剩下1份用于檢驗。分別進行了6次相互獨立的訓(xùn)練和檢驗,統(tǒng)計出4種事件和POD、FAR的值,如表2所示。
表2 未做優(yōu)化的檢驗結(jié)果
從表2的6次檢驗結(jié)果可以看出:未做優(yōu)化的下?lián)舯┝髯R別模型識別擊中率接近或超過80%,最高成績?yōu)?5.1%;但誤識率普遍超過60%,最大達68.8%。每次檢驗得到的POD和FAR指標(biāo)懸殊較大,距平分別達到7.5%和8.9%。這可能是因為下?lián)舯┝鞯陌l(fā)生存在一定的季節(jié)性,而檢驗數(shù)據(jù)集是從25137組“數(shù)據(jù)對”中隨機抽取,從而增加了檢驗結(jié)果的波動性。
將上述6次檢驗得到的評價指標(biāo)的平均值,即POD=85.5%和FAR=63.7%作為基準(zhǔn),用于評估各項優(yōu)化產(chǎn)生的效果。圖7給出了幾個優(yōu)化方法及組合優(yōu)化方法檢驗結(jié)果的統(tǒng)計數(shù)據(jù)。
圖7 模型優(yōu)化效果統(tǒng)計
從圖7可以看出:第1項優(yōu)化“數(shù)據(jù)增強&=1”相當(dāng)于僅采取了數(shù)據(jù)增強優(yōu)化,該優(yōu)化使得FAR指標(biāo)顯著下降了8.3%,但對于POD的提升僅有1.7%;而隨著懲罰項取值的提高,POD提升并不明顯,但FAR不降反增。這說明賦予“實際存在下?lián)舯┝鞯P妥R別為不存在下?lián)舯┝鳌边@種情況較大的懲罰值,能夠小幅度提高模型對下?lián)舯┝髯R別的成功率,但造成的弊端是誤識率顯著上升。后3項優(yōu)化是在前3項的基礎(chǔ)上增加了折交叉檢驗,可看出,采用“數(shù)據(jù)增強&=2&折交叉”組合優(yōu)化方案的POD最高,識別成功率達到95.7%,但存在同樣的問題,該方案的FAR比不做任何優(yōu)化還高出1.9%。相較而言,第4項“數(shù)據(jù)增強&=1&折交叉”是相對最佳的優(yōu)化方案,既保證了識別的擊中率又將誤識率控制在相對低的水平。此外,實驗過程中還發(fā)現(xiàn),設(shè)置較大的值,在模型訓(xùn)練的初期,誤差收斂的速度相對更快,而到了模型訓(xùn)練的后期,這一速度優(yōu)勢并不能帶來識別準(zhǔn)確率的顯著提高。
由于整個數(shù)據(jù)集中發(fā)生下?lián)舯┝魈鞖獾恼急群苄?,而下?lián)舯┝靼l(fā)生時其在雷達圖像上的特征復(fù)雜多樣,使得上述優(yōu)化技術(shù)在努力提升識別成功率的前提下,放大了誤識的概率。造成FAR指標(biāo)居高不下的另一個重要原因是,在構(gòu)建數(shù)據(jù)集時,對于“是否發(fā)生下?lián)舯┝鞯臉?biāo)簽”的定義,主要是依靠地面氣象站觀測到的風(fēng)速,采用第2.2節(jié)所述的預(yù)處理方法進行判定。由于加密自動氣象站的數(shù)量多,部分風(fēng)速記錄存在較大的誤差甚至錯誤值,使得本為正常的天氣被錯誤地標(biāo)記為“存在下?lián)舯┝魈鞖狻?,而這樣的“數(shù)據(jù)對”輸入深度網(wǎng)絡(luò)模型后,增加了對下?lián)舯┝髡`識別的概率。
本文提出一種基于深度學(xué)習(xí)技術(shù)的下?lián)舯┝髦悄茏R別方法,將雷達回波時序圖像和徑向速度場時序圖像的四維時空特征融合到深度神經(jīng)網(wǎng)絡(luò)模型中進行訓(xùn)練。該方法能夠?qū)⒁酝拘枰蓺庀髮I(yè)人員主觀分析、判讀雷達圖像的工作自動化、客觀化,提高了對下?lián)舯┝魈鞖庾R別、預(yù)警相關(guān)業(yè)務(wù)的準(zhǔn)確性和時效性。
由于大風(fēng)的成因,不僅是下?lián)舯┝?,還可能受到臺風(fēng)的影響,而單純由下?lián)舯┝饕l(fā)的大風(fēng)又很難逐一界定,因此,本文對于下?lián)舯┝髯R別效果的檢驗主要是通過對擊中率POD和誤識率FAR的對比分析得到。
下?lián)舯┝鞑⒉皇墙?jīng)常發(fā)生,然而一旦遭遇,所造成的危害是巨大的。本文方法不僅適用于下?lián)舯┝鞯淖R別,也適用于小尺度天氣系統(tǒng)中對能量相對較小且下沉氣流輻散所形成的大風(fēng)的識別。