閆 鑫,陳 華,尚志宏,王金星
(1. 安徽省水利水電勘測(cè)設(shè)計(jì)研究總院有限公司,安徽 合肥 230088; 2. 武漢大學(xué) 水資源與水電工程科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072; 3. 松遼水利委員會(huì)水文局,吉林 長(zhǎng)春 130021; 4. 水利部信息中心,北京 100053)
降水作為地球水循環(huán)的重要組成部分,在水文、氣象、生態(tài)等方面具有重要意義[1-3]。陸地水文過(guò)程中的不確定性大多是由降水的時(shí)空變異性引起的[4,5],水文模型輸出的質(zhì)量在很大程度上依賴(lài)于輸入降水估算的質(zhì)量[6]。目前,主要采用雨量站、衛(wèi)星遙感、天氣雷達(dá)等手段測(cè)量降水。雨量站可以在點(diǎn)尺度上提供較為準(zhǔn)確的降水值,但在大尺度上無(wú)法準(zhǔn)確估算連續(xù)的空間降水分布[7]。氣象雷達(dá)可以提供更精確的時(shí)間和空間分辨率的降水?dāng)?shù)據(jù),但是在復(fù)雜地形條件下,由于波束遮擋和雷達(dá)信號(hào)隨距離衰減等原因,會(huì)造成測(cè)量誤差[8]。得益于衛(wèi)星傳感器和測(cè)量技術(shù)的發(fā)展,基于衛(wèi)星的遙感數(shù)據(jù)正在成為提供全球時(shí)空連續(xù)的降水估計(jì)的一種有效的數(shù)據(jù)源。衛(wèi)星降水產(chǎn)品可以提供關(guān)于降水分布及其變化的周期性和區(qū)域性信息,比雨量站數(shù)據(jù)更能反映空間分布,但大多數(shù)衛(wèi)星降水產(chǎn)品存在較大的系統(tǒng)偏差和隨機(jī)誤差[9]。
數(shù)據(jù)融合是指將來(lái)自多個(gè)數(shù)據(jù)源的數(shù)據(jù)進(jìn)行融合,從而獲得比任何單一數(shù)據(jù)源更準(zhǔn)確、更有價(jià)值的信息的過(guò)程[10]。近年來(lái),為了減少衛(wèi)星降水估計(jì)誤差,提高精度,利用雨量站數(shù)據(jù)和衛(wèi)星降水?dāng)?shù)據(jù)在可用性和準(zhǔn)確性方面具有互補(bǔ)的特點(diǎn),將兩者的觀測(cè)數(shù)據(jù)融合已成為一種常用的方法,如空間隨機(jī)森林法[11]、貝葉斯平均法[12]、具有外部漂移的克里金法[13]和地理加權(quán)嶺回歸[14]等。然而,由于衛(wèi)星像元與雨量站在空間尺度上存在不匹配的問(wèn)題,將會(huì)導(dǎo)致難以避免的誤差[15]。因此,為了解決上述問(wèn)題,有研究提出在進(jìn)行融合校正前,需要對(duì)原始低分辨率的衛(wèi)星反演降水?dāng)?shù)據(jù)進(jìn)行降尺度處理,以更好地匹配雨量站數(shù)據(jù)源的尺度[16-18]。
研究的主要目的是通過(guò)兩步降尺度融合方法來(lái)獲得高分辨率日降水產(chǎn)品。首先,基于隨機(jī)森林模型對(duì)GPM_3IMERGDF 日降水產(chǎn)品進(jìn)行空間降尺度,提出了“時(shí)間升尺度-空間降尺度-時(shí)間降尺度”一體化方案。其次,采用協(xié)同克里金法將降尺度衛(wèi)星降水?dāng)?shù)據(jù)與地面雨量站觀測(cè)數(shù)據(jù)融合,獲得高精度日降水產(chǎn)品。最后,通過(guò)半分布式日尺度WASMOD-D(the daily version of Water And Snow balance MODeling system)水文模型來(lái)模擬降雨—徑流過(guò)程,評(píng)估融合降水產(chǎn)品的徑流模擬效果。
漢江流域位于中國(guó)中南部,在北緯30°4'~34°11'到東經(jīng)106°5'~114°18'之間,面積為15.9 萬(wàn)km2。漢江流域降水分布表現(xiàn)出很強(qiáng)的梯度,隨經(jīng)度、緯度和海拔變化,屬于亞熱帶季風(fēng)區(qū),氣候溫和濕潤(rùn),年降水量873 mm,水量豐富。
表1 研究數(shù)據(jù)及其來(lái)源Tab.1 Research data and sources
圖1 研究區(qū)域Fig.1 Study area
2.1.1 隨機(jī)森林模型
隨機(jī)森林(Random Forests)[19]是一種增強(qiáng)的決策樹(shù)模型,基于引導(dǎo)聚集算法(Bootstrap Aggregating)來(lái)增加額外的隨機(jī)性層。如圖2所示,在隨機(jī)森林模型中,決策樹(shù)模型作為單個(gè)預(yù)測(cè)模型。隨機(jī)森林模型可用于分類(lèi)和回歸,在降水和溫度等氣象數(shù)據(jù)降尺度方面具有良好的表現(xiàn)。
圖2 基于Bagging方法的隨機(jī)森林算法示意圖Fig.2 Schematic diagram of random forest algorithm based on bagging method
2.1.2 降尺度模型的構(gòu)建
由于日降水量與陸面環(huán)境變量之間缺乏較強(qiáng)的相關(guān)關(guān)系,研究首先在季節(jié)尺度上對(duì)GPM 降水?dāng)?shù)據(jù)進(jìn)行空間降尺度,然后對(duì)降尺度結(jié)果在時(shí)間上進(jìn)行分解,由此得到高時(shí)空分辨率的GPM 日降水?dāng)?shù)據(jù)。GPM 降水?dāng)?shù)據(jù)和夜間地表溫度(LSTnight)、日間地表溫度(LSTday)、坡度、高程、坡向、經(jīng)緯度和NDVI 數(shù)據(jù)輸入到隨機(jī)森林模型中,建立陸面環(huán)境變量與降水量之間的回歸模型,如圖3所示。
圖3 基于隨機(jī)森林模型的降尺度方案流程圖Fig.3 Schematic diagram of downscaling scheme based on random forest
2.1.3 季節(jié)GPM 降水的分解
研究中,雨量站觀測(cè)被視為“真實(shí)降水量”,通過(guò)定量和定性指標(biāo)評(píng)估衛(wèi)星降水產(chǎn)品的精度。對(duì)于星地融合降水?dāng)?shù)據(jù)的精度,采用留一交叉驗(yàn)證法來(lái)進(jìn)行評(píng)估[14]。相關(guān)系數(shù)(r)反映了觀測(cè)值和預(yù)測(cè)值之間的線性相關(guān)程度。平均絕對(duì)值誤差(Mean Absolute Error,MAE),它表示預(yù)測(cè)值和觀測(cè)值之間絕對(duì)誤差的平均值。均方根誤差(Root Mean Square Error,RMSE)代表觀測(cè)值和預(yù)測(cè)值(稱(chēng)為殘差)之間差異的樣本標(biāo)準(zhǔn)偏差。偏差(Bias)代表預(yù)測(cè)值和觀測(cè)值的偏離程度。修正Kling-Gupta效率系數(shù)(the modified Kling-Gupta Efficiency,KGE)是對(duì)觀測(cè)值與預(yù)測(cè)值在整體趨勢(shì)上進(jìn)行綜合比較。精度評(píng)估指標(biāo)計(jì)算公式如下:
式中:o為觀測(cè)降水量;p為估計(jì)降水量為觀測(cè)降水量的平均值為估計(jì)降水量的平均值;CV為以mm 為單位的變異系數(shù);σp為估計(jì)降水量的標(biāo)準(zhǔn)差;σo為觀測(cè)降水量的標(biāo)準(zhǔn)差。
檢測(cè)率(Probability of Detection,POD)、誤檢率(False Alarm Ratio,F(xiàn)AR)和臨界成功指數(shù)(Critical Success Index,CSI)被選擇來(lái)評(píng)估衛(wèi)星降水?dāng)?shù)據(jù)檢測(cè)降水事件的能力,計(jì)算公式如下:
式中:H為同時(shí)通過(guò)雨量站觀測(cè)和衛(wèi)星降水?dāng)?shù)據(jù)確定的降水事件數(shù);M為被衛(wèi)星降水?dāng)?shù)據(jù)確定但未被雨量站觀測(cè)捕獲的降水事件數(shù)量;F為在雨量站觀測(cè)中識(shí)別到但在衛(wèi)星降水?dāng)?shù)據(jù)中未被識(shí)別的降水事件數(shù)。
Xu 等[20]基 于NOPEX 流 域 開(kāi) 發(fā) 了WASMOD 水 文 模 型。Gong 等[21]在WASMOD 基礎(chǔ)上開(kāi)發(fā)了半分布式日尺度WASMOD-D 模型。WASMOD 水文模型是一個(gè)水量平衡模型,模型概念簡(jiǎn)單,參數(shù)較少。模型結(jié)構(gòu)如圖4 所示,包含降水下滲、蒸發(fā)、產(chǎn)流和匯流等四個(gè)模塊。
圖4 WASMOD模型系統(tǒng)概念圖Fig.4 conceptual diagram of wasmod model system
為了比較3 種不同降水產(chǎn)品降水的空間分布情況,以研究時(shí)段的4 個(gè)年份的3 天的日降水?dāng)?shù)據(jù)為例,分別繪制了原始GPM 降水產(chǎn)品(Ori_GPM)、降尺度GPM 降水產(chǎn)品(Down_GPM)和降尺度—融合降水產(chǎn)品(MR_CK)的空間分布圖(如圖5~8 所示)。這些日期橫跨了了春、夏、秋三季,包括了漢江流域的主要降雨季節(jié),因此具有良好代表性。Down_GPM 不僅保留了原始GPM 降水的空間分布模式,也改善了其空間細(xì)節(jié),尤其對(duì)于局部降水事件較多的情況。在與雨量站觀測(cè)數(shù)據(jù)融合后,GPM降水?dāng)?shù)據(jù)的降水量和空間分布都得到了一定的校正。
圖5 3種降水產(chǎn)品在2014年第101 d、第242 d、第284 d的降水分布圖Fig.5 Precipitation distribution of three precipitation products on the 101st, 242 and 284 days in 2014
圖6 3種降水?dāng)?shù)據(jù)集在2015年第91 d、第196 d、第284 d的降水分布圖Fig.6 Precipitation distribution of three precipitation products on the 91st, 196 and 284 days in 2015
圖7 3種降水?dāng)?shù)據(jù)集在2016年第96 d、第174 d、第311 d的降水分布圖Fig.7 Precipitation distribution of three precipitation products on the 96st, 174 and 311 days in 2016
圖8 3種降水?dāng)?shù)據(jù)集在2017年第99 d、第187 d、第270 d的降水分布圖Fig.8 Precipitation distribution of three precipitation products on the 99st, 187 and 270 days in 2017
表2 列出了降水產(chǎn)品精度評(píng)估指標(biāo)的結(jié)果。從總體上來(lái)看,與Down_GPM 相 比,MR_CK 的MAE和RMSE分 別 下 降 了32.38%和21.38%,偏差的絕對(duì)值從20%降低到了小于1%,r和KGE分別提高了17.40%和31.78%。在與雨量站觀測(cè)數(shù)據(jù)進(jìn)行融合后,MR_CK顯著提高了Down_GPM的精度。
表2 3種日降水產(chǎn)品精度評(píng)估指標(biāo)結(jié)果Tab.2 Precision evaluation index results of three daily precipitation products
從圖9 可以看出,所有降水產(chǎn)品都能很好地識(shí)別出無(wú)雨事件,但識(shí)別能力隨著降水量的增加而逐漸降低。Down_GPM 的識(shí)別能力與Ori_GPM 幾乎相同,在與雨量站觀測(cè)數(shù)據(jù)融合后,MR_CK在識(shí)別降水事件方面的能力得到了顯著的提高。此外,隨著降水量的增加,3 種降水產(chǎn)品的RMSE和MAE逐漸增加,并具有相似的變化模式。
圖9 不同降水范圍內(nèi)Ori_GPM、Down_GPM 和MR_CK的精度表現(xiàn)Fig.9 Precision performance of Ori_GPM, Down_GPM and MR_CK in different precipitation ranges
研究選取漢江流域的典型子流域白河流域作為研究對(duì)象,如圖10 所示。設(shè)置兩個(gè)徑流模擬情景,在情景I中,WASMODD 模型參數(shù)用雨量站降水?dāng)?shù)據(jù)進(jìn)行率定,并以3 種降水?dāng)?shù)據(jù)集和站點(diǎn)降水作為輸入驅(qū)動(dòng)模型進(jìn)行徑流模擬。在情景II 中,每個(gè)降水?dāng)?shù)據(jù)集分別率定WASMOD-D 模型參數(shù),再根據(jù)不同的參數(shù)集進(jìn)行徑流模擬。
圖10 白河流域概況Fig.10 Baihe River Basin
使用納西效率系數(shù)(NSE)、相關(guān)系數(shù)(r)和水量相對(duì)誤差(Re)這3個(gè)指標(biāo)來(lái)評(píng)價(jià)3種降水產(chǎn)品對(duì)日徑流模擬精度。
3.3.1 徑流模擬情景I:使用雨量站數(shù)據(jù)進(jìn)行模型率定
為了保證降水?dāng)?shù)據(jù)的獨(dú)立性,率定模型的雨量站數(shù)據(jù)選自中國(guó)地面氣候資料日值數(shù)據(jù)集(V3.0),選擇白河水文站1969-1979 年的歷史實(shí)測(cè)徑流數(shù)據(jù)來(lái)進(jìn)行模型參數(shù)的率定。然后,3種降水?dāng)?shù)據(jù)集和站點(diǎn)降水?dāng)?shù)據(jù)作為輸入驅(qū)動(dòng)WASMOD-D 模型進(jìn)行水文模擬。從圖11可知,衛(wèi)星降水產(chǎn)品驅(qū)動(dòng)的模擬徑流大部分高估了日徑流觀測(cè)的極大值。從表3 可知,徑流模擬一致性效果較好的是MR_CK,其相關(guān)模擬徑流的NSE和r分別為0.67和0.87,相較于站點(diǎn)降水?dāng)?shù)據(jù)有一定的提升。
圖11 3種降水產(chǎn)品和站點(diǎn)降水驅(qū)動(dòng)WASMOD-D水文模型模擬的白河流域出水口白河站的日徑流和月平均徑流Fig.11 Daily runoff and monthly average runoff of Baihe station at the outlet of Baihe River Basin simulated by WASMOD-D hydrological model driven by three precipitation products and station precipitation
表3 3種降水產(chǎn)品和站點(diǎn)降水?dāng)?shù)據(jù)驅(qū)動(dòng)下的徑流模擬效果Tab.3 Runoff simulation effect driven by three precipitation products and station precipitation data
3.3.2 徑流模擬情景II:利用每個(gè)降水?dāng)?shù)據(jù)集進(jìn)行模型率定
分別使用3 種降水?dāng)?shù)據(jù)集和站點(diǎn)降水對(duì)WASMOD-D 水文模型進(jìn)行率定,比較其水文模擬效果差異。設(shè)置率定期為2014-03-01-2017-02-28,檢驗(yàn)期為2016-03-01-2018-02-28。
從圖12(a)可知,無(wú)論衛(wèi)星降水產(chǎn)品還是融合降水產(chǎn)品驅(qū)動(dòng)的模擬徑流都低估了日徑流觀測(cè)的極大值。由表4 可知,在率定期模擬效果較好的是MR_CK,其相關(guān)模擬徑流的NSE、Re和r分 別 為0.74、-10.88% 和0.86。與Ori-GPM 相 比,Dowm_GPM 的水量相對(duì)誤差有明顯下降,降低了58%。在檢驗(yàn)期模擬效果最好的是MR_CK,其相關(guān)模擬徑流的NSE、Re和r分別為0.71、-7.55%和0.84。與站點(diǎn)降水相比,MR_CK 徑流模擬的一致性指標(biāo)略有提升,但是水量平衡誤差改善較為明顯。
圖12 3種降水產(chǎn)品和站點(diǎn)降水驅(qū)動(dòng)WASMOD-D水文模型模擬的白河流域出水口白河站的日徑流和月平均徑流Fig.12 Daily runoff and monthly average runoff of Baihe station at the outlet of Baihe River Basin simulated by WASMOD-D hydrological model driven by three precipitation products and station precipitation
基于隨機(jī)森林的降尺度模型將低分辨率降水?dāng)?shù)據(jù)降尺度至高空間分辨率,為雨量站的點(diǎn)數(shù)據(jù)和衛(wèi)星像素之間的尺度差問(wèn)題提供了有效的解決方案。利用隨機(jī)森林模型對(duì)衛(wèi)星降水?dāng)?shù)據(jù)進(jìn)行降尺度處理提高融合結(jié)果的精度,由于降尺度降水?dāng)?shù)據(jù)與雨量站數(shù)據(jù)空間尺度更加匹配,且降尺度過(guò)程具有一定的平滑效果,使得衛(wèi)星降水?dāng)?shù)據(jù)分布更加連續(xù)。有助于解決不連續(xù)降水背景場(chǎng)所導(dǎo)致的邊界偏差問(wèn)題和繪制高分辨率降水分布圖[22]。
在先前的研究中,陳圓圓[18]使用面到點(diǎn)克里格法(Area-To-Koint Kriging,ATPK)對(duì)(Tropical Precipitation Measurement Mission,TRMM)月降水產(chǎn)品進(jìn)行空間降尺度,然后使用地理加權(quán)回歸克里金法(Geographically Weighted Regression Kriging,GWRK)將降尺度降水量與雨量站觀測(cè)值進(jìn)行融合。Chen等[13]通過(guò)地理加權(quán)回歸縮小了TRMM 降水量的尺度,然后使用具有外部漂移的克里金法將降尺度TRMM 降水?dāng)?shù)據(jù)與雨量站觀測(cè)值進(jìn)行融合。Chen 等[14]使用地理加權(quán)嶺回歸(Geographically Weighted Ridge Regression,GWRR)將四個(gè)降尺度衛(wèi)星降水?dāng)?shù)據(jù)與雨量站觀測(cè)值進(jìn)行融合。與以往的研究不同,研究引入了機(jī)器學(xué)習(xí)算法中的隨機(jī)森林模型和地統(tǒng)計(jì)學(xué)中的協(xié)同克里金法來(lái)構(gòu)造降尺度-融合方案。結(jié)果表明,在日尺度上融合降水?dāng)?shù)據(jù)的精度顯著提高。對(duì)于衛(wèi)星降水和雨量站觀測(cè)的融合,增加雨量站的分布密度有助于提高融合結(jié)果的質(zhì)量[17,18,23]。然而,當(dāng)雨量站密度達(dá)到臨界閾值時(shí),這種改善將受到限制[24]。對(duì)于不同的融合算法,對(duì)于最優(yōu)融合結(jié)果,最優(yōu)雨量站密度是不同的,值得進(jìn)一步研究。
情景I 對(duì)于有實(shí)測(cè)資料的流域,使用獨(dú)立的雨量站數(shù)據(jù)進(jìn)行水文模型參數(shù)率定,在水文界應(yīng)用廣泛。而情景II 則可以被視為無(wú)雨量站實(shí)測(cè)資料流域的替代方案,主要適用于只有來(lái)自遙感觀測(cè)平臺(tái)的降水?dāng)?shù)據(jù)。與基于雨量站參數(shù)的模擬表現(xiàn)相比,模型重新率定顯著改善了兩種衛(wèi)星降水?dāng)?shù)據(jù)集的NSE值,但Re值和r值卻有所下降;而對(duì)于融合降水?dāng)?shù)據(jù)集和站點(diǎn)降水來(lái)說(shuō),NSE值和Re值改善較為明顯,r值的變化并不明顯。經(jīng)分析認(rèn)為,可能是以NSE為目標(biāo)函數(shù)進(jìn)行參數(shù)率定時(shí),參數(shù)的調(diào)整是朝著NSE的最優(yōu)值方向靠近的。Xue 等[25]指出不同的參數(shù)設(shè)置(即情景II 中根據(jù)不同輸入的降水?dāng)?shù)據(jù)集重新率定水文模型參數(shù))可以補(bǔ)償降水?dāng)?shù)據(jù)集驅(qū)動(dòng)中的誤差,從而改善徑流的模型預(yù)測(cè)。利用偏差較大的衛(wèi)星降水產(chǎn)品進(jìn)行徑流模擬時(shí),根據(jù)相應(yīng)的衛(wèi)星數(shù)據(jù)重新率定參數(shù),可以提高徑流模擬性能,是提高近實(shí)時(shí)衛(wèi)星降水產(chǎn)品在徑流模擬中適用性的關(guān)鍵步驟。這種參數(shù)補(bǔ)償效應(yīng)被廣泛認(rèn)可,并應(yīng)用于水文研究中[12,26,27]。
(1)基于“時(shí)間升尺度—空間降尺度—時(shí)間降尺度”三步綜合降尺度方案,為衛(wèi)星日降水?dāng)?shù)據(jù)的空間降尺度提供了有效途徑。該方案所獲得的降尺度日降水估計(jì)不僅保留了衛(wèi)星數(shù)據(jù)的原始空間格局,而且顯著地改善了其空間細(xì)節(jié),使得衛(wèi)星降水?dāng)?shù)據(jù)分布更加連續(xù),改善了不連續(xù)降水背景場(chǎng)所導(dǎo)致的邊界偏差問(wèn)題?;陔S機(jī)森林模型的降尺度算法不僅顯著提高了GPM降水的空間分辨率,而且保持了較好的精度。
(2)考慮到地面觀測(cè)降雨與衛(wèi)星反演降水具有空間相關(guān)性,將協(xié)同克里金法引入融合地面雨量站—衛(wèi)星遙感反演降水估計(jì)中,提出了一種降水?dāng)?shù)據(jù)線性融合模型。精度評(píng)估結(jié)果證明,當(dāng)衛(wèi)星降雨數(shù)據(jù)與雨量站觀測(cè)數(shù)據(jù)融合后精度得到了顯著提高, 相較于Down_GPM,MR_CK 對(duì)日降水估計(jì)的精度有了明顯的提升,在柵格尺度上,r和KGE均大于0.7。
(3)利用原始GPM 降水產(chǎn)品(Ori_GPM)、降尺度GPM 降水產(chǎn)品(Down_GPM)、降尺度—融合降水產(chǎn)品(MR_CK)和站點(diǎn)實(shí)測(cè)降水驅(qū)動(dòng)分布式水文模型WASMOD-D 來(lái)模擬降雨—徑流過(guò)程,在兩種不同的徑流模擬情景下評(píng)價(jià)了三種降水產(chǎn)品和站點(diǎn)降水對(duì)日徑流模擬的精度。綜合兩種不同情景下的日徑流模擬效果來(lái)看,由于結(jié)合了衛(wèi)星降水?dāng)?shù)據(jù)和站點(diǎn)降水?dāng)?shù)據(jù)的優(yōu)勢(shì),MR_CK的整體模擬效果最好。
(1)針對(duì)不同區(qū)域不同的降水分布規(guī)律以及對(duì)于不同的融合算法,融合降水結(jié)果達(dá)到最優(yōu)時(shí)的最佳雨量站密度是不一樣的,這個(gè)問(wèn)題在今后值得進(jìn)一步研究。
(2)高時(shí)間分辨率(如小時(shí)尺度)的降水?dāng)?shù)據(jù)對(duì)于短期水文預(yù)報(bào)等研究是十分重要的。對(duì)于高時(shí)間分辨率的衛(wèi)星降水?dāng)?shù)據(jù)的降尺度和數(shù)據(jù)融合值得進(jìn)一步研究。