任 雍,梁 鶯,劉光普,周亭亭
(1.福建省氣象科學(xué)研究所,福建 福州350001;2.福建省大氣探測技術(shù)保障中心,福建 福州350008;3.北京無線電測量研究所,北京100854)
云內(nèi)部微物理特征的演變過程是影響各類天氣過程產(chǎn)生、發(fā)展、消亡的核心因素,云內(nèi)水凝物熱力學(xué)相態(tài)是主要的云微觀物理參數(shù)之一[1]。作為重要的云微物理參數(shù),云中粒子相態(tài)的分布和演化對人工影響天氣、飛機(jī)積冰等方面研究有十分重要的影響[2-3],是云微觀探測的重點(diǎn)關(guān)注領(lǐng)域。
目前對云的遙感探測手段主要包括氣象衛(wèi)星、激光云高儀、天氣雷達(dá)、毫米波測云雷達(dá)等。前3 種裝備觀測的主要是云的宏觀特征,而毫米波測云雷達(dá)則可同時(shí)兼顧云體宏觀特征和云粒子的半徑、數(shù)量、分布等微觀特征。毫米波測云雷達(dá)波長與云粒子尺度最為接近,具有高靈敏度和高時(shí)空分辨率,是目前對云粒子最敏感的探測設(shè)備[4],雙極化毫米波雷達(dá)通過接收水平和垂直方向的電磁波,能夠得到回波的強(qiáng)度、速度、譜寬、線性退極化比信息,從而揭示云內(nèi)粒子的形狀、相態(tài)、空間分布,為氣象研究和氣象保障提供準(zhǔn)確的數(shù)據(jù)支持[5]。目前對于云粒子相態(tài)和過冷水的研究均基于厘米波天氣雷達(dá),其主要用于探測大范圍降水天氣,對云內(nèi)微觀狀態(tài)不敏感,且云內(nèi)部探測結(jié)果會受到強(qiáng)降水過程的干擾影響[6-7]。
Shupe[8]提出了聯(lián)合激光雷達(dá)、8 mm 云雷達(dá)以及微波輻射計(jì)等判斷云水凝物相態(tài)的算法,可得到云水凝物相態(tài)的垂直分布,其中考慮利用激光雷達(dá)退偏振比以及毫米波雷達(dá)的反射率因子、Doppler 平均速度和譜寬、溫度等閾值判斷粒子相態(tài)及形狀。國內(nèi)外也有相關(guān)研究利用微波雷達(dá)退偏振因子分析降水云粒子的相態(tài)及形狀[9-10],認(rèn)為在零度層以上降水粒子的空間取向和介電特性很復(fù)雜,退偏振因子信息較差分反射率信息更有意義,但退偏振因子的利用要求雷達(dá)系統(tǒng)具備較高的靈敏度。為改進(jìn)閾值法過于剛性的分類方法,許多研究采用模糊邏輯法[11-14],充分利用雙偏振天氣雷達(dá)的各種參量對降水系統(tǒng)中的粒子進(jìn)行分類。彭亮等[15]利用2008 年壽縣站點(diǎn)大氣輻射測量項(xiàng)目(ARM)3 mm 云雷達(dá)的觀測資料以及探空資料,根據(jù)前人觀測試驗(yàn)總結(jié)的不同種類粒子的閾值,建立隸屬度函數(shù),然后利用模糊邏輯法進(jìn)行水凝物相態(tài)垂直分布反演試驗(yàn)。
本研究中首次采用了工作于Ka 波段的毫米波測云雷達(dá)回波數(shù)據(jù),能夠識別非降水云和弱降水云內(nèi)粒子相態(tài)和過冷水分布特征,從而為天氣過程演變研究、民航保障和人工影響天氣研究提供決策依據(jù)。
Ka 波段毫米波測云雷達(dá)的波長介于厘米波和激光之間,使其兼具兩者的特點(diǎn):毫米波波長短的特點(diǎn),使其比厘米波雷達(dá)對云粒子更敏感;而與激光雷達(dá)相比,毫米波又具有更好的穿透能力。
毫米波雷達(dá)技術(shù)優(yōu)勢主要體現(xiàn)在以下幾點(diǎn):雷達(dá)后向散射截面σ 與λ-4成正比[16],毫米波雷達(dá)工作在Rayleigh 散射區(qū)[17],對小粒子敏感性強(qiáng),具有很高的靈敏度,Ka 波段與S 波段天氣雷達(dá)相比,具有40 dB以上的增益;雷達(dá)體積小、重量輕、功耗低,適合配置在移動平臺上;多普勒效應(yīng)明顯,速度分辨率高,測速精度高;可基于較小的天線口徑得到窄波束,方向性好,空間分辨率高。
本文應(yīng)用設(shè)備為北京無線電測量研究所研制的HMB-KST 型全固態(tài)毫米波測云雷達(dá),試驗(yàn)期間雷達(dá)系統(tǒng)架設(shè)于北京南郊,其主要技術(shù)參數(shù)如表1 所述。
表1 HMB-KST 毫米波測云雷達(dá)主要技術(shù)參數(shù)
云粒子相態(tài)識別主要依據(jù)不同類型粒子反映的雷達(dá)探測參數(shù)值不同。根據(jù)試驗(yàn)需要,本文對云粒子相態(tài)分類如下:干冰晶、濕冰相和融化層、混合相與降水、過冷水滴、暖云滴。各類粒子特征如下:
(1)干冰晶,主要集中在冷云中上部至云頂,是云內(nèi)主要凝結(jié)核。干冰晶的平均半徑較??;作為單一粒子層,具有較小的速度譜寬;線性退極化比較小。冰晶向下運(yùn)動遇到過冷水時(shí)形成雪和霾,雪和霾經(jīng)過融化層形成降雨。
(2)濕冰相和融化層,相態(tài)最為多變,包括冰晶和過冷水碰并后的雪和霰,以及冰相粒子經(jīng)過零度等溫線后的融化相。其含水量遠(yuǎn)高于冰晶,雪的含水量高于霰。雪和霰生成于冰晶與過冷水混合層,向下運(yùn)動延伸至融化層。在雷達(dá)探測參數(shù)表征方面,雪和霰有較大的速度譜寬和線性退極化比,而融化層具有最大的線性退極化比。
(3)混合相與降水,混合相意味著在一個(gè)距離庫內(nèi)同時(shí)存在著冰相和液相粒子,降水粒子有明顯的下落速度,二者都具有最大的速度譜寬。
(4)過冷水滴,主要集中在冷云中下層,溫度在-20~0 ℃,是影響降水豐沛程度的主要云粒子。過冷水滴由強(qiáng)上升氣流將暖云滴抬升而產(chǎn)生,在遇到更高處的冰晶時(shí)迅速消耗[9]。過冷水滴平均直徑小,運(yùn)動速度統(tǒng)一,在冷云層中有最小的反射率因子、線性退極化比和速度譜寬。
(5)暖云滴,溫度高于零度的暖云的主要粒子形態(tài),主要集中于云體下部,對于非降水云,暖云滴具有最小的反射率因子、譜寬和線性退極化比;對于降水云,暖云滴直徑大,反射率因子多大于過冷水滴[18]。
根據(jù)上述分析,雖然各類型粒子有其自有特征,但這些特征不具備排它式的門限值特征,而是互有耦合的綜合反映結(jié)果。這種情況下,選用決策樹算法可以得到較好的識別效果。算法選擇的直接探測參量包括:雷達(dá)得到的反射率因子、速度譜寬、線性退極化比,以及同期探空資料插值得到的溫度信息。
基于決策樹的云粒子相態(tài)識別算法根據(jù)半物理規(guī)律的統(tǒng)計(jì)特征,應(yīng)用機(jī)器學(xué)習(xí)的思想進(jìn)行算法設(shè)計(jì),為各雷達(dá)探測要素分配不同層級的決策函數(shù),構(gòu)成決策空間的多個(gè)緯度,完成相態(tài)判別。
決策樹(Decision Tree)是在已知各種情況發(fā)生概率的基礎(chǔ)上,通過構(gòu)成決策樹來求取凈現(xiàn)值的期望值大于等于零的概率,判斷其可行性的決策分析方法,是直觀運(yùn)用概率分析的一種圖解法。
在機(jī)器學(xué)習(xí)中,決策樹是一個(gè)預(yù)測模型,其代表的是對象屬性與對象值之間的一種映射關(guān)系。相比近些年應(yīng)用日趨廣泛的支持向量機(jī)算法,決策樹是相對簡單的機(jī)器學(xué)習(xí)算法,但是在面對輸入數(shù)據(jù)維度較少的情況時(shí),具有很高的效率。并且,在面對某些復(fù)雜決策問題時(shí),基于單決策樹算法可以構(gòu)建隨機(jī)森林,可以大幅拓展其應(yīng)用領(lǐng)域[19-20]。
本應(yīng)用的算法包括決策因子分析、規(guī)則推導(dǎo)、決策空間建立、邏輯判別等幾部分。
反射率因子的公式為:
式(1)中D 為粒子直徑,反射率因子Z 與粒子的直徑密切相關(guān),故不同相態(tài)的粒子大小的差異會呈現(xiàn)不同的反射率因子值;速度譜寬SW 是下落過程中不同相態(tài)粒子大小、形狀、密度等差異使粒子的下落速度不同導(dǎo)致速度譜寬的不同;退偏振因子LDR 與粒子的非圓形程度和介電常數(shù)有關(guān),不同的粒子的非圓形程度和介電常數(shù)不同,因此會呈現(xiàn)不同的LDR 值,故反射率因子Z、速度譜寬SW、退偏振因子LDR 作為粒子相態(tài)的識別參數(shù),探空數(shù)據(jù)溫度T的相關(guān)變化也能夠反映粒子相態(tài)的變化。不同相態(tài)粒子的反射率因子Z、速度譜寬SW、退偏振因子LDR 的特征在第三部分云粒子相態(tài)識別原理中有具體說明。因此選擇反射率因子Z、速度譜寬SW、退偏振因子LDR、探空數(shù)據(jù)溫度T 4 個(gè)參量作為決策樹算法的決策因子。
在確定好決策因子后,將其作為決策樹學(xué)習(xí)算法的屬性,根據(jù)這些屬性進(jìn)行云粒子相態(tài)分類和識別。算法利用訓(xùn)練數(shù)據(jù)集合B(包含各訓(xùn)練數(shù)據(jù)的云粒子相態(tài)) 和對應(yīng)的樣本屬性集合A ={a1,a2,…,ad}(包含對應(yīng)的4 種決策因子的值)來進(jìn)行訓(xùn)練。該部分主要是確定好各屬性的結(jié)點(diǎn)位置及該屬性判別時(shí)的閾值。劃分屬性主要是依據(jù)信息增益和增益率的大小來進(jìn)行。由于訓(xùn)練樣本中的屬性大多為連續(xù)值,因此先將屬性的樣本集合進(jìn)行分段,即對四類屬性分別進(jìn)行合適的分段,則有集合:
式(2)中i=1,2,3,4 表示4 類屬性,j 表示在第i 類屬性中根據(jù)該類值的大小劃分的第j 段,該段內(nèi)的值所在區(qū)間為,共分為ni段。
劃分好分段后,則可按照離散屬性值來進(jìn)行劃分:
式(3)中Ent 表示信息熵,Pk表示屬于該相態(tài)的概率,式(4)中Gain 表示屬性在當(dāng)前層級的信息增益,式(5)Gain_ratio表示相應(yīng)的信息增益率,式(6)中IV表示該類屬性的固有值。
由式(3)~式(6)可得到各個(gè)屬性的增益率,然后從中找出信息增益率高于平均水平的增益,再從中選擇增益率最高的作為決策樹當(dāng)前層級的結(jié)點(diǎn),同時(shí)選取增益率最高時(shí)的閾值。確定好當(dāng)前層級的結(jié)點(diǎn)后,可再下一層級將繼續(xù)利用公式(3)~式(6)來求取,此時(shí)公式中的屬性計(jì)算不包含上一層級的屬性。以此類推,直到屬性的全部劃分完畢。
決策樹屬性及相關(guān)閾值劃分好之后,基于訓(xùn)練數(shù)據(jù)的決策空間初步建立。在決策樹學(xué)習(xí)中,為了盡可能正確分類訓(xùn)練樣本,結(jié)點(diǎn)劃分過程不斷重復(fù),有時(shí)會造成決策樹分支過多,此時(shí)容易把訓(xùn)練集自身的一些特點(diǎn)當(dāng)作所有數(shù)據(jù)都具有的一般性質(zhì)而導(dǎo)致過擬合。此時(shí)需要進(jìn)行“后剪枝”處理,即在訓(xùn)練集生成一個(gè)完整的決策樹后,自底向上地對非枝葉結(jié)點(diǎn)進(jìn)行考察,若將該結(jié)點(diǎn)對應(yīng)的子樹(置信度不高的情況)替換為葉結(jié)點(diǎn)能帶來決策樹泛化性能提升,則將該子樹替換為葉結(jié)點(diǎn),降低過擬合的風(fēng)險(xiǎn)。
經(jīng)過訓(xùn)練數(shù)據(jù)生成的決策樹空間包含相應(yīng)的屬性層級分類和相關(guān)的閾值判斷標(biāo)準(zhǔn),則在新數(shù)據(jù)(實(shí)測數(shù)據(jù)和對應(yīng)的決策因子)輸入的情況下,可以按照決策樹模型等邏輯判別來進(jìn)行云粒子相態(tài)的分類和識別。
在經(jīng)過大量的訓(xùn)練數(shù)據(jù)訓(xùn)練后,決策樹的模型及相關(guān)參量已構(gòu)建完成。在本應(yīng)用中,輸入數(shù)據(jù)僅包含了反射率因子Z、速度譜寬SW、退偏振因子LDR和溫度T 4 種參量,應(yīng)用決策樹算法具有較高的效費(fèi)比。
根據(jù)云相態(tài)識別應(yīng)用的特點(diǎn),設(shè)計(jì)決策樹模型。算法輸入決策域包含:回波強(qiáng)度、速度譜寬、線性退極化比、大氣溫度4 類數(shù)據(jù)。輸出域?yàn)? 種云粒子相態(tài):干冰相、濕冰相、混合相和降水、過冷水、暖云滴。算法的輸入的溫度數(shù)據(jù)經(jīng)過三階樣條插值處理與測云雷達(dá)的距離庫相匹配。
本文選擇試驗(yàn)期間的3 次典型天氣過程分別為:2017 年1 月19 日、2017 年2 月7 日、2017 年3 月20 日。對雷達(dá)觀測的回波進(jìn)行分析,雷達(dá)數(shù)據(jù)選用RHI 掃描模式的數(shù)據(jù),雷達(dá)數(shù)據(jù)和相態(tài)識別結(jié)果的橫縱坐標(biāo)均表示探測范圍,探空數(shù)據(jù)的橫坐標(biāo)是溫度,縱坐標(biāo)為高度。云體反射率因子、探空數(shù)據(jù)、相識別結(jié)果如圖(2~4)所示。
2017 年1 月19 日小雪天氣過程觀測產(chǎn)品如圖2 所示,探空溫度顯示地表以上各層溫度均低于零度。雷達(dá)掃描仰角范圍為20°~90°。相態(tài)識別結(jié)果表明:此次小雪過程中云頂表現(xiàn)主要為一薄層干冰晶相,過冷水主要分布在3000~5000 m 高度處,二者交匯處多表現(xiàn)為濕冰相和混合相。近地面處識別為干冰晶,表明當(dāng)天降雪中的液態(tài)水含量較低。
圖2 1 月19 日反射率因子(a)、相態(tài)識別結(jié)果(b)和探空數(shù)據(jù)(c)
2017 年2 月7 日北京入冬以來出現(xiàn)的明顯降雪天氣,圖3 為該時(shí)間段觀測產(chǎn)品。雷達(dá)掃描仰角范圍為20°~90°。根據(jù)識別結(jié)果可知:5000 m 以上高空云體主要由冰晶構(gòu)成;過冷水主要分布在1500~5000 m 高度間,分布范圍較廣,與探空資料中的逆溫層強(qiáng)相關(guān);過冷水與冰晶交匯處出現(xiàn)混合層和帶狀濕冰相。本次過冷水區(qū)回波強(qiáng)度較大,判斷本次降雪形成機(jī)制為冰晶與過冷水碰并生長的貝吉隆過程,豐富的過冷水是本次降雪形成的關(guān)鍵。探空溫度數(shù)據(jù)的逆溫層表明可能存在上升氣流,上升氣流促進(jìn)了下部過冷水與上部冰晶的碰并凝結(jié),而凝結(jié)過程中釋放的熱量也導(dǎo)致逆溫現(xiàn)象更加明顯。近地面處識別為降水態(tài)和冰晶態(tài),表明當(dāng)天的降雪濕度比2017 年1 月19 日明顯偏大。
圖3 2 月7 日反射率因子(a)、相態(tài)識別結(jié)果(b)和探空數(shù)據(jù)(c)
圖4 3 月20 日反射率因子(a)、相態(tài)識別結(jié)果(b)和探空數(shù)據(jù)(c)
圖4 展示了2017 年3 月20 日的試驗(yàn)數(shù)據(jù),當(dāng)天天氣情況為陰天、層云,伴有間歇性小雨和毛毛雨。雷達(dá)掃描仰角范圍為5°~90°。相態(tài)識別結(jié)果為:云頂5000 m 以上有一薄層的干冰晶,云體中下部存在少量過冷水,云體大部分區(qū)域?yàn)榛旌舷唷T频自?100 m 附近識別為帶狀融化層、濕冰,其下為降水。根據(jù)相關(guān)文獻(xiàn)的歷史統(tǒng)計(jì)結(jié)果,典型的融化層亮帶多發(fā)生于降水過程即將結(jié)束時(shí),而過冷水層耗盡是層狀云降水結(jié)束的主要原因,因此強(qiáng)亮帶上方過冷水含量應(yīng)該較少,本識別結(jié)果中,左側(cè)近區(qū)典型強(qiáng)亮帶上方基本無過冷水,而右側(cè)遠(yuǎn)區(qū)弱亮帶上方則含有過冷水,與統(tǒng)計(jì)結(jié)論吻合較好。根據(jù)歷史統(tǒng)計(jì),華北地區(qū)層狀云降水強(qiáng)度與過冷水豐度高度相關(guān),本次識別結(jié)果中,過冷水分布區(qū)域相對較小且所在區(qū)域回波強(qiáng)度較低,表明過冷水豐度不高;本次降水過程表現(xiàn)為小雨和毛毛雨,雨強(qiáng)與過冷水識別結(jié)果相吻合。
上述3 次天氣過程的分析表明,利用毫米波測云雷達(dá)回波數(shù)據(jù)分析得到的粒子相態(tài)結(jié)果與實(shí)測天氣狀況吻合較好,也符合天氣學(xué)微物理過程原理。
毫米波測云雷達(dá)作為一種新型氣象遙感裝備,綜合利用了毫米波波長短、穿透力強(qiáng)的特征,彌補(bǔ)了厘米波雷達(dá)和激光雷達(dá)的不足,表現(xiàn)出對云粒子微觀特征高度敏感的優(yōu)勢。
本文基于毫米波測云雷達(dá)的探測數(shù)據(jù)和探空儀獲取的溫度數(shù)據(jù),設(shè)計(jì)了云粒子相態(tài)識別的決策樹算法。該算法以反射率因子Z、速度譜寬SW、退偏振因子LDR 和溫度T 等4 種參量作為輸入,具有較高的效費(fèi)比。
采用該算法,本文對2017 年1 月19 日、2 月7日、3 月20 日的毫米波測云雷達(dá)探測數(shù)據(jù),進(jìn)行云粒子相態(tài)識別和過冷水等數(shù)據(jù)產(chǎn)品的反演和分析。分析結(jié)果表明:
(1)逆溫層與過冷水層高度正相關(guān),過冷水層通常伴隨著逆溫層一同出現(xiàn);
(2)過冷水和冰晶交匯區(qū)附近通常會出現(xiàn)濕冰相和混合相;
(3)過冷水含量與融化層亮帶會呈現(xiàn)出一定的負(fù)相關(guān)關(guān)系。
整體上來講,采用本文提出的決策樹算法得到的相態(tài)識別結(jié)果,與實(shí)際物理機(jī)制相吻合,驗(yàn)證了該識別算法的有效性。空中水凝物的相態(tài)識別,尤其是過冷水相態(tài)的辨識,對采用遙感手段分析降水特征、估計(jì)降水參量具有重要意義,后續(xù)將進(jìn)一步開展深入研究。