周必高 魯小琴 鄭 峰 黃克慧 洪水潔 謝海華 趙兵科
1 浙江省溫州市氣象局,溫州 325000 2 浙江省溫州市臺(tái)風(fēng)監(jiān)測預(yù)報(bào)技術(shù)重點(diǎn)實(shí)驗(yàn)室,溫州 325000 3 中國氣象局上海臺(tái)風(fēng)研究所,上海 200030 4 四創(chuàng)科技有限公司,福州 350000
提 要: 臺(tái)風(fēng)預(yù)報(bào)除常規(guī)方法外,查找歷史相似作為預(yù)報(bào)和決策的參考依據(jù)是常用手段,但從海量歷史臺(tái)風(fēng)中檢索相似費(fèi)時(shí)費(fèi)力。提出了一種基于改進(jìn)的視覺幾何組模型VGG16的副熱帶高壓(以下簡稱副高)相似檢索方法,進(jìn)行基于副高相似的歷史相似臺(tái)風(fēng)查詢。通過對(duì)1979—2020年臺(tái)風(fēng)季19 736個(gè)對(duì)應(yīng)時(shí)次的副高圖像提取、數(shù)據(jù)增強(qiáng)、模型學(xué)習(xí)和優(yōu)化,并以學(xué)習(xí)感知圖像塊相似度(learned perceptual image patch similarity,LPIPS)作為副高相似的度量指標(biāo),最終建立了改進(jìn)的VGG16模型。試驗(yàn)結(jié)果表明,使用該模型可以找出較為相似的歷史臺(tái)風(fēng),模型檢索得到的排名第一的歷史相似臺(tái)風(fēng)與目標(biāo)臺(tái)風(fēng)相似度高達(dá)92.55%,該方法可為臺(tái)風(fēng)預(yù)報(bào)業(yè)務(wù)人員提供了積極參考。同時(shí),該模型相較于傳統(tǒng)的人工識(shí)別,識(shí)別時(shí)間較短、檢索效率高,可在業(yè)務(wù)及科研中推廣應(yīng)用。
我國地處太平洋西岸,海岸線漫長,從廣西到遼寧常年都會(huì)受到臺(tái)風(fēng)的影響(陳聯(lián)壽和丁一匯,1979)。尤其在夏季,沿海及內(nèi)陸受臺(tái)風(fēng)影響地區(qū)常常會(huì)因臺(tái)風(fēng)襲擊而造成人員傷亡和重大財(cái)產(chǎn)損失,因此精準(zhǔn)的臺(tái)風(fēng)路徑、強(qiáng)度及風(fēng)雨影響預(yù)報(bào)對(duì)保障人民的生命財(cái)產(chǎn)安全具有重大的現(xiàn)實(shí)意義。臺(tái)風(fēng)路徑預(yù)報(bào)的準(zhǔn)確性是開展防臺(tái)減災(zāi)服務(wù)的基礎(chǔ)。氣象學(xué)家們針對(duì)臺(tái)風(fēng)路徑預(yù)報(bào)的方法發(fā)展了大量統(tǒng)計(jì)或動(dòng)力模型,同時(shí)也發(fā)現(xiàn)歷史相似臺(tái)風(fēng)能夠?yàn)榕_(tái)風(fēng)路徑、強(qiáng)度和風(fēng)雨預(yù)報(bào)提供非常有價(jià)值的參考信息。已有的歷史臺(tái)風(fēng)相似檢索大多基于人工主觀判別進(jìn)行或者針對(duì)臺(tái)風(fēng)路徑空間相似開展(劉勇等,2006;王遠(yuǎn)飛等,2006;魯小琴等,2013;徐高揚(yáng)和劉姚,2019),但存在以下問題:(1)歷史數(shù)據(jù)中采用人工識(shí)別查找歷史相似臺(tái)風(fēng)。該方法判別時(shí)間長,不能滿足預(yù)報(bào)決策的實(shí)時(shí)性需求。(2)基于空間相似的歷史臺(tái)風(fēng)自動(dòng)檢索。該方法速度快,但找到的歷史相似臺(tái)風(fēng),大部分由于和目標(biāo)臺(tái)風(fēng)所對(duì)應(yīng)的大尺度環(huán)境流場存在差異,并且造成的風(fēng)雨影響及災(zāi)害也各異,因而此類相似臺(tái)風(fēng)并不一定屬于氣象意義上的相似臺(tái)風(fēng)。在此基礎(chǔ)上,預(yù)報(bào)員們提出能否根據(jù)臺(tái)風(fēng)環(huán)境場的相似去查找歷史相似臺(tái)風(fēng),進(jìn)而為當(dāng)前臺(tái)風(fēng)預(yù)報(bào)和防臺(tái)減災(zāi)決策提供更為科學(xué)且專業(yè)的參考。
臺(tái)風(fēng)的移動(dòng)受到各種復(fù)雜因素的影響,但實(shí)踐表明牽引運(yùn)動(dòng)是最主要的因素,因此大型氣壓場的分布及與此相應(yīng)的大范圍深厚的基本氣流是臺(tái)風(fēng)路徑預(yù)報(bào)的重要根據(jù)(陳聯(lián)壽和丁一匯,1979)。其中,副熱帶高壓(以下簡稱副高)就是影響臺(tái)風(fēng)移動(dòng)路徑的一個(gè)非常重要的大型環(huán)流系統(tǒng),其周期變化、形狀特征及與西風(fēng)槽的相互作用等,很大程度上引導(dǎo)著未來臺(tái)風(fēng)走向及可能帶來的風(fēng)雨影響。因此以副高相似來查詢得到的歷史相似臺(tái)風(fēng),可能可為當(dāng)前臺(tái)風(fēng)的路徑及風(fēng)雨影響預(yù)報(bào)提供較為精準(zhǔn)的輔助資訊。
科學(xué)家們已經(jīng)開展了很多有關(guān)氣象要素場的相似研究,大多基于格點(diǎn)數(shù)據(jù)進(jìn)行距離或相關(guān)分析(李開樂,1986;羅陽,1996;羅陽和趙偉,2008;丁晨晨等,2019;黃小玉等,2019;宋文彬等,2020),并未針對(duì)某個(gè)特定的環(huán)流系統(tǒng)開展。事實(shí)上影響臺(tái)風(fēng)移動(dòng)的副高具有特定的形狀和相對(duì)的地理空間分布(如距離大陸遠(yuǎn)近等),因此具有圖像特征識(shí)別功能的神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)實(shí)現(xiàn)大區(qū)域環(huán)境場中副高的識(shí)別和提取,并進(jìn)行相似判定具有非常大的優(yōu)勢(shì)。且神經(jīng)網(wǎng)絡(luò)技術(shù)已在各行各業(yè)開展了大量的研究和應(yīng)用,如人臉識(shí)別(吳素雯和戰(zhàn)蔭偉,2017)、字符識(shí)別(葛明濤等,2014)和語音識(shí)別(Xue et al,2014)等。氣象領(lǐng)域中,黃小燕和金龍(2013)在綜合考慮臺(tái)風(fēng)移動(dòng)路徑的氣候持續(xù)因子和數(shù)值預(yù)報(bào)產(chǎn)品動(dòng)力預(yù)報(bào)因子的基礎(chǔ)上,建立了基于主成分分析的人工智能臺(tái)風(fēng)路徑預(yù)報(bào)模型,預(yù)報(bào)精度高于氣候持續(xù)法;葉小嶺等(2014)基于主成分分析及RBF神經(jīng)網(wǎng)絡(luò)開展了浙江省臺(tái)風(fēng)災(zāi)害損失預(yù)測;代刊等(2013)基于自組織神經(jīng)網(wǎng)絡(luò)算法分析了華北區(qū)域夏季天氣氣候?qū)W特征;陳文兵等(2019)利用G-CNN模型開展了濃霧天氣形勢(shì)識(shí)別。以上研究表明基于一般神經(jīng)網(wǎng)絡(luò)技術(shù)在氣象領(lǐng)域進(jìn)行天氣特征識(shí)別(如濃霧)或預(yù)報(bào)預(yù)測(如臺(tái)風(fēng)路徑和強(qiáng)度、災(zāi)害等)已取得了一些成效,但采用神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)臺(tái)風(fēng)大尺度環(huán)境場中的副高進(jìn)行識(shí)別和判定,成果鮮見。
本文擬基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的視覺幾何組模型(visual geo-metry group,VGG16)(Lecun et al,1998;Simonyan and Zisserman,2016)來識(shí)別臺(tái)風(fēng)大尺度環(huán)境場中的副高,并以學(xué)習(xí)感知圖像塊相似度(learned perceptual image patch similarity,LPIPS)(Wang et al,2004)作為圖像相似度量指標(biāo),建立副高相似的識(shí)別算法,進(jìn)而開展對(duì)應(yīng)歷史相似臺(tái)風(fēng)查詢,以期為臺(tái)風(fēng)路徑預(yù)報(bào)提供更高效而精準(zhǔn)的參考信息。
本文中大尺度環(huán)境場主要用500 hPa位勢(shì)高度來表征,資料來自ERA5再分析數(shù)據(jù)集(https:∥cds.climate.copernicus.eu/)。資料集覆蓋時(shí)間范圍為1979—2020年,時(shí)間分辨率為6 h(逐日00、06、12和18時(shí),世界時(shí),下同);空間范圍為90°S~90°N、180°E~180°W,空間分辨率為1°×1°。為節(jié)約計(jì)算資源,只截取本研究關(guān)注的西北太平洋區(qū)域(10°S~75°N、75°E~165°W),用于開展對(duì)歷史副高的識(shí)別和相似檢索分析。
臺(tái)風(fēng)路徑數(shù)據(jù)(Ying et al,2014;Lu et al,2021)來自中國氣象局熱帶氣旋資料中心的臺(tái)風(fēng)最佳路徑數(shù)據(jù)集(https:∥tcdata.typhoon.org.cn/zjljsjj_zlhq.html),包含1979—2020年發(fā)生在西北太平洋及南海地區(qū)的逐臺(tái)風(fēng)記錄時(shí)間、中心經(jīng)度和緯度、中心最大風(fēng)速和最低氣壓,時(shí)間分辨率為6 h(逐日00、06、12和18時(shí))。
為了便于后續(xù)算法模型對(duì)副高的識(shí)別,對(duì)ERA5再分析數(shù)據(jù)進(jìn)行預(yù)處理:(1)數(shù)據(jù)提取。讀取500 hPa位勢(shì)高度層網(wǎng)格數(shù)據(jù),并提取大于5880 gpm的格點(diǎn)數(shù)值用來表征副高。(2)數(shù)據(jù)清洗。采用圖像形態(tài)學(xué)算法中的腐蝕和膨脹運(yùn)算等技術(shù),對(duì)部分孤立點(diǎn)、邊緣處裂痕等異常數(shù)據(jù)進(jìn)行剔除或彌補(bǔ),對(duì)提取得到的副高圖像進(jìn)行邊緣光滑,以提高副高相似分析的準(zhǔn)確性。(3)近似多邊形提取。采用Canny邊緣檢測技術(shù),提取副高邊緣上的離散點(diǎn)并連接形成多邊形,將其作為最終副高輪廓。圖1為2019年8月5日00時(shí)臺(tái)風(fēng)環(huán)境場和預(yù)處理提取得到的副高對(duì)照?qǐng)D,可見該時(shí)刻臺(tái)風(fēng)中心位于副高西南側(cè),在副高的影響下呈西北行趨勢(shì);而預(yù)處理提取到了完整的副高形態(tài)和分布。
圖1 2019年8月5日00時(shí)(UTC)(a)臺(tái)風(fēng)環(huán)境場和(b)預(yù)處理提取的副高(黑色三角形:臺(tái)風(fēng)中心位置) Fig.1 Comparison of (a) environmental field of typhoon and (b) extracted subtropical high at 0000 UTC 5 August 2019(black triangle: typhoon center)
CNN由輸入層、隱含層和輸出層組成(圖2),隱含層中又包含卷積層、池化層和全連接層(Zeiler and Fergus,2014)。其中,在卷積層中,利用設(shè)定大小的卷積核和指定步長在輸入圖像(原圖或特征圖)上進(jìn)行滑動(dòng)并做卷積計(jì)算,該層的作用是提取輸入圖像的主要關(guān)鍵特征;池化層的作用是對(duì)提取的特征進(jìn)行抽樣,在減輕網(wǎng)絡(luò)模型過擬合程度(Matsugu et al,2003)的同時(shí)可以減小后續(xù)運(yùn)算量。卷積層和池化層合作,實(shí)現(xiàn)對(duì)輸入圖像的特征提取并抽樣降維,能提取出副高形態(tài)中最具有代表性的關(guān)鍵特征;卷積層和池化層一般交替出現(xiàn)在網(wǎng)絡(luò)中,一個(gè)卷積層加一個(gè)池化層被稱為一個(gè)特征提取過程。最后,全連接層負(fù)責(zé)把提取的特征圖連接起來,通過分類器得到最終的分類估算結(jié)果(鄭澤宇等,2018)。
圖2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.2 Structure diagram of convolutional neural network
VGG16是CNN的一個(gè)經(jīng)典模型,該模型具有5個(gè)卷積組(13個(gè)卷積層)和3個(gè)全連接層(圖3),在使用同等大小卷積核的條件下,提升了網(wǎng)絡(luò)的深度和效果(Simonyan and Zisserman,2016)。其網(wǎng)絡(luò)結(jié)構(gòu)非常一致,全部使用3×3卷積和2×2池化。該模型相比于其他卷積神經(jīng)網(wǎng)絡(luò)模型,主要采用連續(xù)的3×3的小卷積核代替較大卷積核。對(duì)于給定的特征圖,連續(xù)采用小卷積核堆積的策略要優(yōu)于大的卷積核,因?yàn)檩^高深度的多層非線性層能使卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)更復(fù)雜的模態(tài),并且需要的參數(shù)較少,模型的計(jì)算代價(jià)更小,一定程度上提升了神經(jīng)網(wǎng)絡(luò)的效果。
圖3 VGG16網(wǎng)絡(luò)架構(gòu)Fig.3 Network architecture of VGG16
LPIPS也被稱為“感知損失”,用于度量兩張圖像之間的相似程度。本研究當(dāng)中主要使用LPIPS來度量兩幅副高圖像的相似程度。該指標(biāo)在視覺相似性判斷上更接近人類感知(Zhang et al,2018)。其計(jì)算公式如下:
(1)
為了便于比較輸出圖像相似度,副高x與x0的圖片相似度P定義為:
P(x,x0)=[1-d(x,x0)]×100
(2)
VGG16模型是基于大圖像數(shù)據(jù)庫(ImageNet)訓(xùn)練而成的,具備較強(qiáng)的深度特征學(xué)習(xí)能力的參數(shù)和權(quán)重網(wǎng),特別是對(duì)卷積層輸入的圖像輪廓、邊緣、曲線等特征提取具有較強(qiáng)的能力。因此,為減少網(wǎng)絡(luò)訓(xùn)練時(shí)間和提高網(wǎng)絡(luò)訓(xùn)練效率,將已訓(xùn)練好的VGG16模型作為預(yù)訓(xùn)練模型,采用遷移學(xué)習(xí)的方式(關(guān)胤,2019),引入副高識(shí)別模型進(jìn)行卷積層、池化層再訓(xùn)練。VGG16模型的輸入和網(wǎng)絡(luò)架構(gòu)參數(shù)設(shè)置改進(jìn)如下文所述,模型訓(xùn)練流程如圖4所示。
圖4 副高相似識(shí)別模型訓(xùn)練流程圖Fig.4 The training flow chart of similarity recognition model of subtropical high
3.1.1 訓(xùn)練樣本
將輸入的三通道彩色圖改變?yōu)閱瓮ǖ阑叶葓D,輸入尺寸由224×224×3改為86×44×1。圖像灰度化并框定小區(qū)域之后可以大幅減少計(jì)算量,同時(shí)可重點(diǎn)突出副高在大尺度環(huán)境場中的空間位置和大小。設(shè)置數(shù)據(jù)集中用于學(xué)習(xí)和測試的樣本比例分別為80%和20%。
3.1.2 數(shù)據(jù)增強(qiáng)
為彌補(bǔ)CNN訓(xùn)練需要海量的數(shù)據(jù)樣本而當(dāng)前歷史副高圖庫中的樣本數(shù)量較少的缺陷,采用數(shù)據(jù)增強(qiáng)的方法,對(duì)已有的數(shù)據(jù)樣本進(jìn)行翻轉(zhuǎn)、剪裁、高斯噪聲等處理,并生成新的數(shù)據(jù)樣本來補(bǔ)充原圖庫樣本資料集,由此擴(kuò)大了訓(xùn)練集和測試集的樣本數(shù)量,同時(shí)提高了模型的泛化能力,并減少過度擬合。
3.1.3 網(wǎng)絡(luò)架構(gòu)參數(shù)設(shè)置
設(shè)定本模型中使用3個(gè)卷積組,網(wǎng)絡(luò)架構(gòu)的輕巧化有利于快速提取副高圖像的特征數(shù)據(jù);每個(gè)卷積組設(shè)定只含2個(gè)卷積層和1個(gè)池化層,但為充分提取副高細(xì)微圖像特征,在個(gè)別卷積組中增加卷積核的數(shù)目;同時(shí)只進(jìn)行圖像特征提取,即去掉分類器,只包括卷積層、池化層和全連接層。
模型訓(xùn)練采用Tensorflow深度學(xué)習(xí)框架,處理器使用Intel酷睿i7—9700,機(jī)器內(nèi)存為16 GB,優(yōu)化器使用Adam,批大小為30,學(xué)習(xí)率為4×10-3,損失函數(shù)采用Cross Entropy Loss計(jì)算。
針對(duì)1979—2020年臺(tái)風(fēng)季19 736個(gè)對(duì)應(yīng)時(shí)次的副高圖像樣本,設(shè)定8∶2的樣本劃分比例確定訓(xùn)練集和測試集,對(duì)模型進(jìn)行學(xué)習(xí)訓(xùn)練(圖5)。由圖5a 可見,當(dāng)?shù)螖?shù)到達(dá)20次,該模型的訓(xùn)練集和測試集準(zhǔn)確率都明顯增加,迭代達(dá)80次之后,該模型的訓(xùn)練精準(zhǔn)度和損失函數(shù)值趨于平衡,其訓(xùn)練集和測試集準(zhǔn)確度峰值分別為89.7%和86.5%。從圖5b中可以看出,迭代80~100次后,損失函數(shù)值達(dá)到最小,表明模型已收斂并穩(wěn)定。保存此時(shí)模型結(jié)構(gòu)參數(shù)及網(wǎng)絡(luò)權(quán)重為最終副高相似識(shí)別模型。
圖5 1979—2020年臺(tái)風(fēng)季樣本訓(xùn)練過程(a)準(zhǔn)確率,(b)損失函數(shù)Fig.5 Training process of samples in typhoon season from 1979 to 2020(a) accuracy, (b) loss function
以0309號(hào)臺(tái)風(fēng)為例(以下稱為目標(biāo)臺(tái)風(fēng)),選2003年8月4日06時(shí)副高圖像(圖6a)作為檢索目標(biāo),利用改進(jìn)的VGG6模型進(jìn)行相似檢索試驗(yàn)。
圖6 (a)2003年8月4日06時(shí)0309號(hào)臺(tái)風(fēng)及其對(duì)應(yīng)副高,(b~f)相似檢索得到的歷史相似臺(tái)風(fēng)及其對(duì)應(yīng)副高(b)1713號(hào),(c)0708號(hào),(d)0108號(hào),(e)1617號(hào),(f)1319號(hào)(黑點(diǎn):臺(tái)風(fēng)中心位置,黑線:前后36 h臺(tái)風(fēng)路徑)Fig.6 (a) Typhoon No.0309 and its corresponding subtropical high at 06:00 UTC 4 August 2003, (b-f) historical similar typhoons and the corresponding subtropical high obtained by similar retrieval(b) No.1713, (c) No.0708, (d) No.0108, (e) No.1617, (f) No.1319(black dot: location of typhoon center, black line: typhoon track before and after 36 h)
4.1.1 相似副高圖像比較
利用本模型檢索得到的歷史相似臺(tái)風(fēng)排名前五位的分別為1713號(hào)(圖6b)、0708號(hào)(圖6c)、0108號(hào)(圖6d)、1617號(hào)(圖6e)和1319號(hào)臺(tái)風(fēng)(圖6f)。圖6顯示,相似臺(tái)風(fēng)對(duì)應(yīng)時(shí)刻的副高形狀(西伸型)、副高分布范圍大小(南北跨度及東西長度)及伸至大陸以西時(shí)的略微南掉都非常一致。就視覺感知情況而言,其中1713號(hào)臺(tái)風(fēng)的對(duì)應(yīng)時(shí)刻副高最為相似(圖6b),0108號(hào)臺(tái)風(fēng)的對(duì)應(yīng)時(shí)刻副高(圖6d)相似度略差。
4.1.2 LPIPS相似度值的比較
計(jì)算檢索得到的排名前五位臺(tái)風(fēng)對(duì)應(yīng)時(shí)刻副高相似度LPIPS值(表1)。發(fā)現(xiàn)1713號(hào)臺(tái)風(fēng)的對(duì)應(yīng)LPIPS值最高,同視覺感知情況一致;但是LPIPS值排在前五位的臺(tái)風(fēng)就視覺感知而言其相似程度排序會(huì)有不同,這與人眼識(shí)別和客觀判據(jù)的差異有關(guān)。
表1 前五位相似臺(tái)風(fēng)對(duì)應(yīng)副高間的LPIPS值Table 1 The LPIPS value of corresponding subtropical high of top 5 similar typhoons
綜上所述可見,利用改進(jìn)的VGG16模型識(shí)別檢索到的歷史相似臺(tái)風(fēng)對(duì)應(yīng)的副高,從視覺特征上看與目標(biāo)臺(tái)風(fēng)的副高大小、位置、形狀是一致的,且對(duì)應(yīng)的LPIPS值的大小與視覺特征的相似度也基本匹配。
為了檢驗(yàn)VGG16模型檢索到的歷史相似副高與目標(biāo)副高的相似程度,以目標(biāo)臺(tái)風(fēng)對(duì)應(yīng)的2003年8月4日06時(shí)副高的相似檢索結(jié)果為例,針對(duì)目標(biāo)臺(tái)風(fēng)和歷史相似臺(tái)風(fēng)對(duì)應(yīng)時(shí)刻的副高區(qū)域分別提取近似多邊形,分別定義為A和B,通過幾何圖像算法分別分析其大小(面積)、重心(位置)和形狀(輪廓)等幾何特征差異 (周必高等,2021),從幾何學(xué)的角度綜合比較其相似程度。
4.2.1 大小相似度
采用面積作為參數(shù)來衡量副高大小相似程度。獲取A和B的面積SA和SB,使用式(3)計(jì)算面積相似度:
SimArea(A,B)=1-abs(SA-SB)/Max(SA,SB)
(3)
式中:SA、SB分別為A和B的面積,abs(SA-SB)表示求取SA、SB差的絕對(duì)值,Max(SA,SB)為取SA、SB最大值,SimArea(A,B)為A和B間的面積相似度值。以目標(biāo)副高的相似檢索結(jié)果為例,面積大小相似度排名前五位如表2所示。
表2 同表1,但為面積相似度 Table 2 Same as Table 1, but for area similarity
4.2.2 位置相似度
提取A和B的質(zhì)心坐標(biāo)A(Xa,Ya)、B(Xb,Yb)作為副高中心位置,其中質(zhì)心定義為副高多邊形的幾何中心;通過歐氏距離計(jì)算兩質(zhì)心間的距離,并將距離歸一化到[0,1]范圍之內(nèi),作為位置相似度衡量指標(biāo)。
歐氏距離計(jì)算公式如下所示:
(4)
位置歸一化算法如下所示:
SimDis(A,B)=1/[Dis(A,B)/C+1]
(5)
式中:Xa、Ya和Xb、Yb分別為副高質(zhì)心A和B的坐標(biāo),Dis(A,B)為A和B質(zhì)心間的距離;C為A和B的任意邊界點(diǎn)間距離的最大值,SimDis(A,B)為歸一化后的位置相似度值。位置相似度排名前五位如表3所示。
表3 同表1,但為位置相似度Table 3 Same for Table 1, but for location similarity
4.2.3 輪廓相似度
基于射線的幾何匹配方法,以副高近似多邊形的幾何中心為原點(diǎn),從原點(diǎn)發(fā)出射線與x軸的夾角為Qi,將Qi作為幾何形狀描述函數(shù)的參數(shù),Qi∈[0,2π]。射線分別相交于近似多邊形A和B的輪廓邊界于點(diǎn)PAi和PBi,分別計(jì)算交點(diǎn)PAi和PBi到原點(diǎn)的距離:LA(Qi)=|PAiO|和LB(Qi)=|PBiO|。則A和B在Qi方向上的相似度為:
(6)
式中:Max[LA(Qi),LB(Qi)]為取這兩個(gè)距離中的最大值,Simangle(Qi)則為A和B在Qi方向上的相似度值。
旋轉(zhuǎn)射線角度與近似多邊形A、B連續(xù)相交,則A和B的形狀輪廓相似度計(jì)算公式如下:
(7)
式中:M表示射線數(shù)量,A(M)=2e-1/M,用來調(diào)節(jié)差異距離大小,|LA(Qi)-LB(Qi)|為A和B在Qi方向的差距,SimShape(A,B)即為A和B的輪廓相似度。以目標(biāo)副高的相似檢索結(jié)果為例,輪廓相似度排名前五位如表4所示。
表4 同表1,但為輪廓相似度Table 4 Same as Table 1, but for shape similarity
4.2.4 綜合相似度
利用A和B之間的面積、位置和輪廓相似度進(jìn)行綜合相似度計(jì)算,計(jì)算公式如下:
SimLand(A,B)=aSimArea(A,B)+
bSimDis(A,B)+cSimShape(A,B)
(8)
式中:SimLand(A,B)為計(jì)算得到的A和B的綜合相似度。a、b和c分別表示對(duì)應(yīng)維度的權(quán)重值,根據(jù)業(yè)務(wù)應(yīng)用經(jīng)驗(yàn)設(shè)定a、b和c權(quán)重值分別為0.5、0.3 和0.2,綜合相似度排名前五位如表5所示。
表5 同表1,但為綜合相似度Table 5 Same as Table 1, but for comprehensive similarity
綜上所述,通過對(duì)目標(biāo)副高和相似副高的幾何圖像學(xué)大小、中心位置和輪廓各維度的比對(duì),發(fā)現(xiàn)排名前五位的相似臺(tái)風(fēng)的面積如表2所述,相似度排序和VGG16模型檢索出的結(jié)果完全一致。而相似副高的質(zhì)心位置如表3所示,相似度排序和VGG16模型得出的結(jié)果也基本一致。輪廓相似度排序與模型檢索稍有差異,一方面因?yàn)閷?duì)副高本身外圍邊界的描述算法不盡完善;另外副高形態(tài)變化快,導(dǎo)致檢索得到的相似副高與目標(biāo)副高輪廓會(huì)略有差異??偠灾?,基于綜合的幾何圖像學(xué)比較了VGG16模型檢索得到的相似副高與目標(biāo)副高的相似度高度一致。表明改進(jìn)后的VGG16模型在識(shí)別副高及查找歷史相似副高和對(duì)應(yīng)相似臺(tái)風(fēng)的分析中是非常有效的。
本文針對(duì)影響臺(tái)風(fēng)路徑移動(dòng)的一個(gè)非常重要的大型環(huán)流系統(tǒng)——副高的相似度判別,提出了一種基于CNN技術(shù)的改進(jìn)VGG16模型。利用1979—2020年臺(tái)風(fēng)季歷史樣本對(duì)模型進(jìn)行訓(xùn)練和測試,使用LPIPS作為相似度量標(biāo)準(zhǔn),進(jìn)行歷史副高相似識(shí)別。試驗(yàn)表明,通過該方法可以找到歷史相似副高所對(duì)應(yīng)的歷史相似臺(tái)風(fēng),解決了針對(duì)海量歷史臺(tái)風(fēng)數(shù)據(jù)進(jìn)行人工相似識(shí)別的難題;同時(shí)通過幾何圖像學(xué)相似檢驗(yàn)其檢索效果,結(jié)論基本一致。改進(jìn)的VGG16模型檢索效率高,可為預(yù)報(bào)員開展臺(tái)風(fēng)預(yù)報(bào)和防臺(tái)減災(zāi)決策提供快速且更科學(xué)的參考。
但影響臺(tái)風(fēng)移動(dòng)的副高在時(shí)刻發(fā)生變化,當(dāng)前時(shí)次相似,下一個(gè)時(shí)次可能發(fā)生較大的改變,故需要綜合考慮某個(gè)時(shí)間段內(nèi)平均環(huán)境場的相似,對(duì)臺(tái)風(fēng)未來的移動(dòng)走向趨勢(shì)引導(dǎo)才具有更重要的預(yù)報(bào)決策參考意義。另外,本文僅考慮了位勢(shì)高度值為5880 gpm的副高主體對(duì)臺(tái)風(fēng)路徑移動(dòng)的影響,實(shí)際上有時(shí)副高主體的西北側(cè)會(huì)向外伸出高壓壩或高壓脊(位勢(shì)高度值不等于5880 gpm),其對(duì)臺(tái)風(fēng)移動(dòng)也有很好的指示意義。因此,下一步將結(jié)合高壓壩和高壓脊,開展對(duì)確定時(shí)段內(nèi)副高區(qū)域平均場的相似或者24、48、72 h預(yù)報(bào)場的相似檢索,以期給出綜合性更高,更為合理和科學(xué)的歷史相似臺(tái)風(fēng),為預(yù)報(bào)決策提供支撐。