文 | 郝伊一 唐偉 周勇 王喆
1.中國氣象局氣象干部培訓學院 2.中國氣象局發(fā)展研究中心
衛(wèi)星在氣象預報、生態(tài)監(jiān)測、水利資源及開發(fā)等方面的應用非常廣泛。衛(wèi)星資料有圖像資料(衛(wèi)星云圖)和探測資料(定量數(shù)字資料)兩大類。以衛(wèi)星云圖為例,它是由氣象衛(wèi)星(或個別陸地衛(wèi)星)自上而下觀測到的云層覆蓋和地表面特征的圖像,利用衛(wèi)星云圖可以彌補常規(guī)探測資料的不足,為天氣分析和天氣預報提供依據(jù),對提高預報準確率起了重要作用。對于衛(wèi)星資料的處理,傳統(tǒng)以閾值法、聚類法為主,21世紀以來由于人工智能的迅速發(fā)展,基于機器學習的方法陸續(xù)被提出。
機器學習是指通過計算機學習數(shù)據(jù)中的內(nèi)在規(guī)律性信息,獲得新的經(jīng)驗和知識,以提高計算機的智能性,使計算機能夠像人那樣去決策[1]。作為人工智能的技術基礎,與傳統(tǒng)的統(tǒng)計方法相比,機器學習不僅擁有通過算法對計算機數(shù)據(jù)進行快速處理的能力,還擁有統(tǒng)計模型所具有的對問題進行預測、分類的能力[2],并且準確率較傳統(tǒng)方法有明顯提高。在當前的“大數(shù)據(jù)”時代,機器學習在海量的衛(wèi)星資料中有著巨大的應用潛力。本文簡要梳理了國內(nèi)外機器學習算法在衛(wèi)星資料的云識別、降水估計等相關領域的主要應用情況。
利用氣象衛(wèi)星云圖進行云的檢測和分類是基于“在衛(wèi)星觀測視角內(nèi),地表和云有不同的特征”這一假設的基礎上進行的,云檢測和云分類是氣象衛(wèi)星云圖最基本也是最重要的研究內(nèi)容之一。
云檢測是利用云和晴空像元在不同光譜段上輻射特性的不同,采用多通道輻射信息,將衛(wèi)星觀測像元分為有云像元和晴空像元。已有研究利用神經(jīng)網(wǎng)絡、支持向量機、遷移學習、卷積神經(jīng)網(wǎng)絡等方法,成功地對衛(wèi)星圖像進行云檢測。師春香等人采用多閾值和人工神經(jīng)網(wǎng)絡相結(jié)合的方法,對日本靜止氣象衛(wèi)星GMS紅外云圖進行自動分割,輸出分割出的每一個云區(qū),同時還包括云區(qū)的邊界鏈碼、起始點、周長、面積,并保留了原始圖像數(shù)據(jù),結(jié)果顯示云檢測正確率達到90%以上[3]。宋小寧等人利用一種基于空間結(jié)構(gòu)分析和神經(jīng)網(wǎng)絡的云自動檢測算法,對美國極軌氣象衛(wèi)星Terra和Aqua上搭載的中分辨率成像光譜儀(MODIS)圖像進行了云檢測研究,研究表明利用MODIS圖像可成功地檢測云點像元[4]。胡根生等人提出一種云量自動評估和加權支持向量機相結(jié)合的云檢測算法對美國陸地衛(wèi)星(Landsat)圖像進行云檢測。結(jié)果表明,該方法既具有云量自動評估算法的云檢測優(yōu)勢,還對云量自動評估算法難以識別的半透明云有較好的檢測效果。[5]胡凱等人利用遷移學習中的多源加權(Tradaboost)算法(內(nèi)部采用極限學習機作為分類器)對我國環(huán)境與災害監(jiān)測預報小衛(wèi)星星座(HJ-1A/B)的衛(wèi)星圖像進行云的檢測,利用多人(多源)標注的大量厚云的樣本構(gòu)成多源輔助樣本集,利用少量標注的薄云樣本構(gòu)成目標樣本集。結(jié)果表明遷移學習可以充分利用容易獲得的大樣本厚云輔助樣本知識,對同類型有關聯(lián)的小樣本薄云分類器進行識別提高。[6]夏旻等人利用卷積神經(jīng)網(wǎng)絡方法,針對HJ-1A/B衛(wèi)星圖像進行云的檢測,并利用空間相關法計算總云量,結(jié)果表明,通過對卷積網(wǎng)絡結(jié)構(gòu)及參數(shù)的優(yōu)化,卷積神經(jīng)網(wǎng)絡可以很好地提取云圖的特征,云分類時厚云和薄云之間的過渡區(qū)域清晰,云的識別率以及云量計算的準確率都比傳統(tǒng)閾值法、動態(tài)閾值法以及極限學習機模型的結(jié)果要好。[7]
云分類是利用可見光和紅外通道觀測數(shù)據(jù)對云進行分類,從宏觀角度一般可將云分為:積雨云、厚卷云、薄卷云、雨層云、中云、低云和層云(霧);根據(jù)云頂特性,可以從云的相態(tài)將云分為冰云、水云和混合相態(tài)云。已有研究利用神經(jīng)網(wǎng)絡、遺傳算法、支持向量機方法,成功地對衛(wèi)星圖像進行云分類。白慧卿識別了日本靜止氣象衛(wèi)星GMS云圖中的四類云系,并與傳統(tǒng)的統(tǒng)計識別方法進行了對比,結(jié)果表明神經(jīng)網(wǎng)絡方法更適合于云系的特征識別。[8]洪梅等人提出一種結(jié)合了遺傳算法全局尋優(yōu)、模糊C均值聚類算法局部尋優(yōu)、模糊減法聚類算法客觀估算聚類數(shù)三種方法的綜合方法(FSC-GA-FCM),對GMS-5衛(wèi)星云圖進行云分類判別。試驗結(jié)果表明,綜合方法的云分類效果明顯優(yōu)于單一的模糊C均值聚類算法和遺傳算法,可運用于實況云圖的云分類客觀、自動判別。[9]黃兵等人建立了自組織神經(jīng)網(wǎng)絡(SOFM)和概率神經(jīng)網(wǎng)絡(PNN)的綜合云分類器優(yōu)化方法,對GMS-5衛(wèi)星云圖多光譜云類樣本進行云分類,試驗結(jié)果表明,該方法可有效提高云類判別效果,分類結(jié)果的總正確率達到92.4%,Kappa系數(shù)為90.82,明顯優(yōu)于單一的統(tǒng)計分類器判別效果。[10]張振華等人采用兩層嵌套的BP人工神經(jīng)網(wǎng)絡模型,基于我國靜止氣象衛(wèi)星風云二號C星(FY-2C)可見光和紅外、水汽亮溫資料進行云分類研究,結(jié)果表明,嵌套模型的分類結(jié)果比傳統(tǒng)模型的分類結(jié)果更合理,特別是在中低云和薄卷云的云量和位置分辨能力上有了較大提高。[11]Lee Y等人應用多參數(shù)支持向量機方法全局優(yōu)化分類(MSVM)來模擬MODIS數(shù)據(jù)進行云的分類,取得很好的分類效果。[12]嚴衛(wèi)等人構(gòu)建了聯(lián)合美國云-氣溶膠激光雷達和紅外探路者衛(wèi)星(CALIPSO)和云探測衛(wèi)星(CloudSat)資料的云相態(tài)識別模型,并和溫度閾值法進行比較,結(jié)果表明支持向量機云相態(tài)識別技術具有較高的識別精度,能夠更為準確地反演云相態(tài)的垂直分布信息。[13]
氣象衛(wèi)星的降水估計(降水分類)是指根據(jù)天氣學云的知識,利用云圖識別原理來估計一些天氣系統(tǒng)的降水分布(或是識別出產(chǎn)生降水的主要云類),具有重要的應用價值。[14]已有研究人員利用人工神經(jīng)網(wǎng)絡、支持向量機、隨機森林等方法,成功地利用衛(wèi)星資料進行降水估計。
利用日本GMS衛(wèi)星紅外圖像和地面資料估計降雨率,Kou-Lin Hsu等人提出一種基于自適應人工神經(jīng)網(wǎng)絡的降水估計算法,結(jié)果顯著提高了對不同地理區(qū)域、不同時間降水特征的估計性能。[15]熊秋芬等人采用人工神經(jīng)網(wǎng)絡方法對GMS衛(wèi)星多通道資料進行地面降水估計,結(jié)果表明,該方法提供的客觀定量的降水量估算平均相關系數(shù)為0.57,較使用單通道紅外云圖資料和簡單閾值和函數(shù)方法更佳。[16]夏雙等人基于三層前向型反向傳播神經(jīng)網(wǎng)絡的衛(wèi)星降水估算模型,利用我國FY-2C數(shù)據(jù)對藏北高原進行了降水估計研究。結(jié)果表明,人工神經(jīng)網(wǎng)絡能較好地刻畫該地域衛(wèi)星降水特征的非線性規(guī)律,三層前向型反向傳播神經(jīng)網(wǎng)絡衛(wèi)星降水估算模型的估算結(jié)果與雨量計實測值間的相關性可以達到0.57。[17]劉建朝等人利用支持向量機方法,基于FY-2C/D資料和我國氣象部門預報業(yè)務系統(tǒng)Micaps 1小時雨量資料,建立預測降水與非降水的分類模型。結(jié)果表明,降水類的預測準確率在40%~60%,非降水類的預測準確率在90%以上。[18]Bellerby T等人結(jié)合美國靜止氣象衛(wèi)星GOES衛(wèi)星圖像和熱帶降雨測量任務衛(wèi)星(TRMM)降水雷達數(shù)據(jù),生成巴西某地區(qū)0.12°的空間分辨率、半小時的降水估計,將相應的降水雷達觀測值與四波段GOES圖像數(shù)據(jù)進行匹配,形成人工神經(jīng)網(wǎng)絡訓練數(shù)據(jù)集,將多個GOES像素的統(tǒng)計信息與每次降水觀測進行匹配,將云紋理和變化速率的信息納入到估計過程中。結(jié)果表明降水雷達和GOES數(shù)據(jù)的組合可以用來生成大尺度長時間序列的高時空分辨率降水估計。[19]Grimes D I F等人將歐洲靜止氣象衛(wèi)星Meteosat的熱紅外圖像中獲得的冷云期(CCD)圖像與數(shù)值天氣模式分析數(shù)據(jù)一起作為人工神經(jīng)網(wǎng)絡輸入,得到非洲地區(qū)的降水估計,結(jié)果比標準CCD方法有一定改進,特別是對較大降雨量的改進很明顯。[20]
除了云識別和降水估計以外,衛(wèi)星資料在氣象資料反演、災害性天氣識別、生態(tài)監(jiān)測等方面也有很多成功應用,在防災減災救災和生態(tài)文明建設中可以發(fā)揮重要作用。
氣象衛(wèi)星資料反演是指將衛(wèi)星探測的原始數(shù)據(jù)經(jīng)一定的變換、訂正與計算, 反求出表征衛(wèi)星探測對象某種特性狀態(tài)的演算過程。在地面觀測數(shù)據(jù)不足時,氣象衛(wèi)星資料反演得到的均勻的、高時空分辨率的氣象要素資料具有很高的價值。胡文東等人利用BP人工神經(jīng)網(wǎng)絡和最優(yōu)擬合回歸方法,基于日本GMS-5衛(wèi)星紅外資料,建立了反演大氣相對濕度場的數(shù)學模型。[21]鮑艷松等人利用人工神經(jīng)網(wǎng)絡方法,研究了我國靜止氣象衛(wèi)星風云四號的高光譜紅外載荷大氣溫度廓線反演方法。[22]涂滿紅等人研究了基于中國北斗導航衛(wèi)星反射信號的支持向量機海面風速反演方法。[23]
災害性天氣識別是對人民生命財產(chǎn)有嚴重威脅、對工農(nóng)業(yè)和交通運輸會造成重大損失的天氣進行歸類和定性。[24]利用我國極軌氣象衛(wèi)星風云一號D星(FY-1D)遙感數(shù)據(jù),劉年慶等人提出了一種基于支持向量機的大霧判別方法。[25]Lakshmanan V等人基于美國GOES衛(wèi)星和多普勒天氣雷達(WSR-88D)獲得的反射率數(shù)據(jù)和云頂紅外溫度資料,研究了一種用于識別不同尺度風暴的天氣圖像的分層K均值聚類方法。[26]周康輝等人利用模糊邏輯算法,結(jié)合風云氣象衛(wèi)星的紅外亮溫和地面氣象觀測、雷達等多源數(shù)據(jù),實現(xiàn)了雷暴大風與非雷暴大風的有效識別和實時監(jiān)測。[27]
衛(wèi)星生態(tài)監(jiān)測是利用衛(wèi)星監(jiān)測天氣、農(nóng)作物生長狀況、森林病蟲害、空氣和地表水的污染情況等,其最大的優(yōu)點是覆蓋面寬,可以獲得人工難以到達的高山、叢林資料。楊俊濤等人利用決策樹分類方法,基于美國靜止氣象衛(wèi)星GOES數(shù)據(jù)生成了雪蓋產(chǎn)品,同時融合被動微波輻射計(AMSR-E)雪水當量產(chǎn)品進行雪蓋聯(lián)合監(jiān)測。[28]梁益同等人利用神經(jīng)網(wǎng)絡方法實現(xiàn)了基于美國極軌氣象衛(wèi)星NOAA的森林火點自動識別。[29]樓琇林等人利用美國NOAA衛(wèi)星可見光和熱紅外波段遙感數(shù)據(jù),研究了基于人工神經(jīng)網(wǎng)絡的赤潮監(jiān)測方法。[30]Roberts D A等人基于光譜混合分析和決策樹分類方法,利用1975年至1999年期間在三個相鄰地區(qū)獲得的33個Landsat場景,描述了巴西隆多尼亞中部超過80000km土地覆蓋的時空變化。[31]彭靜等人對美國Landsat影像資料進行決策樹分類,得到土地利用/覆蓋分類圖像,來研究背景城市熱島的時空變化;[32]李建楠等人采用監(jiān)督分類支持向量機方法,利用美國Landsat衛(wèi)星遙感影像進行了呼和浩特地區(qū)地表覆蓋類型的識別。[33]何文莉等人基于我國環(huán)境與災害監(jiān)測預報衛(wèi)星HJ-1A/B數(shù)據(jù)對濕地地表類型進行識別,提取了鄱陽湖自然濕地的湖泊濕地類型變化數(shù)據(jù)。[34]
目前,我國有8顆風云氣象衛(wèi)星在軌業(yè)務運行,為全球93個國家和地區(qū)提供服務,是世界氣象組織全球業(yè)務應用氣象衛(wèi)星序列的重要成員。風云衛(wèi)星數(shù)據(jù)逐日遞增,僅2018年的數(shù)據(jù)服務總量就達到近5PB,如何認識、理解和用好衛(wèi)星數(shù)據(jù)是當前的一個重大課題。未來應加強機器學習的應用,提高風云衛(wèi)星資料中云識別、降水估計、災害性天氣識別等信息提取和判別的準確性,同時在生態(tài)監(jiān)測中發(fā)揮重要作用,為國家防災減災、經(jīng)濟建設、生態(tài)文明建設等提供科技支撐。