溫華洋,陳鳳嬌,邱康俊,朱華亮
1.安徽省氣象信息中心,合肥 230031
2.南京氣象科技創(chuàng)新研究院,南京 210019
安徽省位于東亞季風區(qū),同時因皖南及皖西山區(qū)地形地質(zhì)條件復(fù)雜,局地強降水容易引發(fā)泥石流、山體滑坡等地質(zhì)災(zāi)害[1-6]。獲取高精度、高時空分辨率且長時間連續(xù)的降水觀測資料是我們?nèi)嬲J知不同氣候區(qū)內(nèi)降水變化趨勢的重要手段。而目前常規(guī)氣象觀測雨量站進行單點觀測,站點布設(shè)具有空間不均勻性,使得高空間分辨率的降水資料匱乏,無法滿足氣象服務(wù)的需要。因此,迫切需要我們研制高精度且高空間分辨率的精細化的降水資料。常規(guī)空間插值算法包括多元回歸法、反距離權(quán)重法(Inverse Distance Weight,簡稱IDW)、Kringing插值和薄盤光滑樣條函數(shù)法(Thin Plate Smoothing Spline,簡稱TPS)[7]。近年來,學(xué)者們研究發(fā)現(xiàn),TPS插值算法在對不同時間尺度、不同區(qū)域的氣候數(shù)據(jù)插值的精度較高,在氣象數(shù)據(jù)科學(xué)領(lǐng)域具有較高的應(yīng)用價值,但由于不同氣象要素、不同區(qū)域的TPS插值算法的最優(yōu)模型略有差異,往往需要提前進行模型優(yōu)選已生成高精度的氣象數(shù)據(jù)產(chǎn)品。[8-13]。因此,本研究基于2008-2018年安徽省及周邊省氣象站觀測的小時降水資料、以及地理信息資料,利用薄盤樣條插值算法,經(jīng)過模型優(yōu)選、精度評估,研制了安徽省11年的1 km分辨率的小時降水網(wǎng)格產(chǎn)品。
本研究使用源數(shù)據(jù)來自安徽省氣象信息中心。數(shù)據(jù)包括空間范圍在 29°23′24′′-34°39′N,114°52′12′′-119°38′24′′E 內(nèi)的氣象觀測站小時降水觀測數(shù)據(jù)和對應(yīng)站點地理信息。該區(qū)域主要包括安徽省境內(nèi)為主的2400多個區(qū)域氣象站和81個國家氣象站。由于使用薄盤樣條插值算法插值時,需考慮到地理高程信息,還使用了相應(yīng)區(qū)域的5 km分辨率的地理高程信息。
基于薄盤樣條插值算法的安徽省1 km分辨率的小時降水柵格產(chǎn)品的實現(xiàn)主要包括數(shù)據(jù)獲取、轉(zhuǎn)換、預(yù)處理、插值算法調(diào)用、最優(yōu)模型篩選及評估、長序列數(shù)據(jù)產(chǎn)品研制等步驟。技術(shù)路線如圖1所示,具體如下:
圖1 安徽省1 km分辨率降水產(chǎn)品研制技術(shù)流程Figure 1 Data processing flow of the gridded hourly precipitation at 1-km resolution over Anhui Province
(1)數(shù)據(jù)源?;谌珖C合氣象信息共享平臺(China Integrated Meteorological Information Service System, 簡稱CIMISS)獲取小時降水資料,剔除其中標注為錯誤、可疑類型的數(shù)據(jù),形成規(guī)定格式的數(shù)據(jù)文件。
(2)數(shù)據(jù)預(yù)處理。配置多個模型參數(shù)文件、高程基礎(chǔ)信息數(shù)據(jù)和實時數(shù)據(jù)文件,為插值算法做準備。
(3)插值算法。本數(shù)據(jù)集使用的插值算法為薄盤樣條插值算法[10,14]。
(4)最優(yōu)模型篩選。薄盤樣條插值算法中高程參數(shù)設(shè)置為1000,節(jié)點數(shù)目設(shè)置為1/3。再將獨立變量(可選參數(shù)2或3)、協(xié)變量(可選參數(shù)1或0)和樣條次數(shù)(可選參數(shù)2或3或4),這三個參數(shù)的多種排列組合,設(shè)置為多個模型。利用氣象觀測站觀測資料開展模型試驗,用交叉檢驗和獨立樣本檢驗等方法,通過偏差、均方根誤差、相關(guān)系數(shù)、平均誤差等方法比較評估各模型參數(shù)的精度。最終,篩選出當獨立變量參數(shù)為2,協(xié)變量為1,樣條次數(shù)為4時,高分辨率降水產(chǎn)品的精度最高,將該參數(shù)設(shè)置的模型定義為最優(yōu)模型。
(5)數(shù)據(jù)產(chǎn)品研制。利用最優(yōu)模型、實時數(shù)據(jù)文件、高程文件,采用薄盤樣條插值算法生成格點化降水數(shù)據(jù)產(chǎn)品。
數(shù)據(jù)集為基于薄盤樣條插值的安徽省1km分辨率的小時降水柵格數(shù)據(jù)。時間段為2008年1月至 2018年 12月,共 132個月。數(shù)據(jù)集壓縮后文件共計 5.8 GB。文件命名方式為:Model02_Z_SURF_MUL_AHFC_YYYYMMDDHHmmss_PRE_HOR_GRD.grd。文件名含義見表1。
表1 文件名含義Table 1 The meaning of the variables in the file name
數(shù)據(jù)文件的內(nèi)容由文件頭和數(shù)據(jù)項組成。圖2為grd文件的示例。其中,第1-6行為頭文件,分別代表列、行、起始經(jīng)度、起始緯度、空間分辨率和數(shù)據(jù)缺省值,如表2。從第七行開始為數(shù)據(jù)項,代表小時降水量,單位為毫米每小時。值得說明的是,數(shù)據(jù)塊每隔48行,代表一個緯度帶。數(shù)據(jù)塊一共10列,代表隨著起始經(jīng)度開始,以0.01度為間隔增加(見表3)。圖3給出了2018年6月的1次降水過程的降水強度空間分布圖。
圖2 安徽省1 km分辨率格式降水產(chǎn)品數(shù)據(jù)樣例Figure 2 A case of the gridded hourly precipitation dataset at 1 km resolution
表2 文件頭文件格式說明Table 2 The illustration of the format of the head in the dataset
表3 數(shù)據(jù)段格式說明Table 3 The illustration of the format of the data segment in the dataset
圖3 2018年6月8日16點安徽省1 km分辨率的小時降水產(chǎn)品空間分布圖Figure 3 The spatial pattern of the gridded hourly precipitation at 1 km resolution over Anhui Province at 16:00 on June 8th, 2018
氣象觀測數(shù)據(jù)采集、傳輸、質(zhì)控、歸檔由省級氣象信息中心負責,嚴格遵循氣象觀測質(zhì)量管理體系的要求。質(zhì)量控制步驟包括:數(shù)據(jù)采集后通過通信系統(tǒng)傳輸,由氣象資料業(yè)務(wù)系統(tǒng)(Meteorological Data Operational System,簡稱MDOS)進行實時質(zhì)量控制,主要包括降水天氣現(xiàn)象觀測與“雨量值”是否匹配、小時雨量和分鐘合計雨量是否匹配檢查,再由 CIMISS提供實時數(shù)據(jù)服務(wù);次月形成歸檔數(shù)據(jù)文件,再次進行人機交互軟件質(zhì)量控制(如地面自動站觀測資料三級質(zhì)量控制軟件,Climate data quality control,簡稱CDQC),主要進行“降水閾值檢查”。利用質(zhì)量控制后的數(shù)據(jù)更新CIMISS的數(shù)據(jù),供氣候變化、預(yù)報檢驗等業(yè)務(wù)科研使用,并用于歸檔。本研究采用歸檔數(shù)據(jù)中質(zhì)控標識位正確的數(shù)據(jù)。整體質(zhì)控過程嚴格,數(shù)據(jù)可靠性高。
對插值后生成的數(shù)據(jù)產(chǎn)品同樣進行了質(zhì)量控制,剔除了其中異常數(shù)據(jù),使用的質(zhì)量控制方法主要是界限值檢查法(為基于安徽區(qū)域降水氣候極值范圍)。
逐小時的氣象觀測資料作為實況,按照臨近站法,逐小時1 km格點化產(chǎn)品結(jié)果與氣象觀測站觀測值進行統(tǒng)計比較,引入偏差(Bias,記為BIAS)、均方根誤差(Root Mean Square Error, 簡稱RMSE)和相關(guān)系數(shù)(Correlation coefficient, 簡稱COR)等統(tǒng)計指標進行精度評估。相關(guān)計算公式如下:
偏差(BIAS):
均方根誤差(RMSE):
相關(guān)系數(shù)(COR):
其中,Oi為站點觀測值,站點觀測值總樣本的平均值,Gi為實況分析產(chǎn)品插值到檢驗站點得到的數(shù)值,實況分析產(chǎn)品總樣本的平均值,N為參與檢驗的總樣本數(shù)(站次數(shù))。
視觀測值為“真值”,對網(wǎng)格產(chǎn)品進行評估,針對2016年的安徽省高分辨率的1km小時降水數(shù)據(jù)的評估結(jié)果表明:數(shù)據(jù)集和觀測值之間數(shù)據(jù)整體偏差為1.05,均方根誤差為0.67 mm/h,相關(guān)系數(shù)為0.80??傮w偏差較小,且偏差相對穩(wěn)定,兩者相關(guān)系數(shù)高,總體準確性較高。針對2016年汛期網(wǎng)格產(chǎn)品的精度評估可參考文獻[15]。
降水是全球水循環(huán)的重要一環(huán),對安徽省降水的精細化監(jiān)測和預(yù)報一直是人民生產(chǎn)生活的關(guān)鍵所在。本研究提供的數(shù)據(jù)集具有時空分辨率高、精度高、序列長等特點,安徽省1km分辨率的小時降水產(chǎn)品可有效地反映地面降水實況,同時長時間序列的柵格產(chǎn)品未來可廣泛應(yīng)用于氣候變化、災(zāi)害風險評估、數(shù)值預(yù)報精度評估等領(lǐng)域。未來可進一步利用傳統(tǒng)質(zhì)控算法或人工智能方法對高分辨率降水產(chǎn)品進行數(shù)據(jù)質(zhì)控,進一步提高數(shù)據(jù)產(chǎn)品精度。