劉 櫻,馬 浩,楊 明,宋雪菲
(1.浙江省氣候中心,浙江 杭州310017;2.浙江省氣象信息網(wǎng)絡(luò)中心,浙江 杭州310017;3.新疆農(nóng)業(yè)氣象臺(tái),新疆 烏魯木齊830002)
降水自記紙是客觀記錄降水的寶貴氣象實(shí)測(cè)資料之一,其記錄時(shí)間長(一般是從建站開始)且保存的完整度高,對(duì)城市暴雨特征、雨型分析等研究有重要意義[1-4],為城市防災(zāi)減災(zāi)提供了較強(qiáng)的數(shù)據(jù)支撐。降水自記紙記錄數(shù)據(jù)的提取主要有兩種形式:一是以人工讀取的方式,提取所需時(shí)段的降水值[5-6];二是利用現(xiàn)代技術(shù)方法,對(duì)降水自記紙資料進(jìn)行信息化處理,形成一套完整的降水自記紙信息化分鐘降水?dāng)?shù)據(jù)(后簡(jiǎn)稱分鐘降水?dāng)?shù)據(jù))[7-9]。人工讀取作為提取降水?dāng)?shù)據(jù)的傳統(tǒng)形式由來已久,其弊端在于讀取的準(zhǔn)確性很大程度依賴于人為經(jīng)驗(yàn),讀取時(shí)間長,提取資料需要花費(fèi)較大的精力、人力,且不可避免地存在一定人為誤差;與人工提取降水資料相比,利用科學(xué)合理的方法,將降水自記紙資料進(jìn)行數(shù)字化處理,使其使用靈活便捷,可自由提取研究任意時(shí)段降水量,不但縮短了提取時(shí)間,且大大降低了計(jì)算結(jié)果的主觀性。然而這一技術(shù)的可靠性、穩(wěn)定性和區(qū)域適用性目前仍然缺乏評(píng)估,特別是在區(qū)域尺度上,兩種資料的對(duì)比分析研究更為鮮見,這在一定程度上制約著降水自記紙信息化數(shù)據(jù)的業(yè)務(wù)化應(yīng)用。
目前,對(duì)人工讀取數(shù)據(jù)與分鐘降水?dāng)?shù)據(jù)的對(duì)比研究,主要針對(duì)氣象自動(dòng)站記錄的分鐘數(shù)據(jù)與降水自記紙之間差異的對(duì)比來展開[10-12]。浙江省大部分氣象自動(dòng)站是在2004 年以后建站,除新建站外,自動(dòng)氣象站和降水自記紙分鐘雨量一般有2~3 a 的平行觀測(cè)數(shù)據(jù),主要用于為數(shù)據(jù)質(zhì)控及均一化處理提供對(duì)比結(jié)果,在此之后氣象站降水量則以自動(dòng)觀測(cè)為主。而自動(dòng)氣象站建站之前分鐘數(shù)據(jù)的獲取,仍依賴于降水自記紙的記錄結(jié)果。因此,自記紙記錄的分鐘降水量對(duì)于了解和研究長年代歷史分鐘雨量特征及規(guī)律尤為重要。尤其是在城市暴雨強(qiáng)度公式編制及暴雨雨型分析的研究中[13-14],都需要長年代歷史分鐘雨量數(shù)據(jù)的支持。目前,浙江省已完成第一批19 個(gè)國家基本(準(zhǔn))站的分鐘降水自記紙信息化處理,時(shí)間為1961—2000 年,剩余站點(diǎn)信息化數(shù)據(jù)仍在人工校對(duì)階段。信息化降水自記紙分鐘數(shù)據(jù)可以很好地滿足長序列需求,那么,在長序列意義上,和人工讀取結(jié)果相比,信息化處理結(jié)果是否準(zhǔn)確可靠,是否可以替代人工讀取數(shù)據(jù)?
本文以降水自記紙資料為基礎(chǔ),圍繞以人工經(jīng)驗(yàn)讀取降水自記紙資料為主的年報(bào)表降水資料和降水自記紙信息化后的分鐘降水?dāng)?shù)據(jù)在不同歷時(shí)下、不同站點(diǎn)之間的共性和差異開展研究,重點(diǎn)分析信息化后的降水分鐘數(shù)據(jù)的適用性,開展針對(duì)信息化后分鐘降水?dāng)?shù)據(jù)長序列研究的初步探索。
本文選用經(jīng)人工審核后的年報(bào)表中15 歷時(shí)最大降水資料作為人工讀取的代表數(shù)據(jù)。逐分鐘降水自記紙數(shù)據(jù)使用浙江省第一批信息化分鐘降水資料,即浙江省19 個(gè)國家基本(準(zhǔn))站,站點(diǎn)分布情況如圖1 所示。
數(shù)據(jù)資料選取時(shí)間為1980—2000 年,主要考慮浙江省年報(bào)表資料中的15 時(shí)段最大降水資料一般從1980 年開始有記錄,而浙江省19 個(gè)國家基本(準(zhǔn))站降水自記紙資料信息化時(shí)間為1961—2000年,因此選取1980—2000 年降水自記紙資料和人工讀取資料的重合時(shí)段作為研究時(shí)段。
圖1 浙江省19 個(gè)國家基本(準(zhǔn))站站點(diǎn)分布
人工讀取的降水自記紙數(shù)據(jù)中的15 時(shí)段最大降水量數(shù)據(jù)讀取主要通過[15-16]:(1)從降水自記紙上挑取對(duì)應(yīng)時(shí)段的最大降水量。(2)對(duì)照月報(bào)表,對(duì)比核查提取結(jié)果。降水自記紙記錄信息化處理主要依靠機(jī)器識(shí)別來判斷[17-19]:利用降水自記紙數(shù)字化處理系統(tǒng)軟件,從掃描得到的降水自記紙彩色掃描圖像文件中,采用曲線自動(dòng)識(shí)別,提取降水曲線描述數(shù)據(jù),通過確保跟蹤曲線與原降水曲線重疊及利用分鐘降水強(qiáng)度數(shù)據(jù)合計(jì)值與雨量筒日降水?dāng)?shù)據(jù)校對(duì)訂正等手段方法,完成降水分鐘強(qiáng)度數(shù)據(jù)的質(zhì)量控制。
由于信息化后的降水自記紙以分鐘降水[20]作為記錄,因此本文采用滑動(dòng)求和的方法,提取浙江省19 國家基本(準(zhǔn))站1980—2000 年5、10、15、20、30、45、60、90、120 min 共9 個(gè)歷時(shí)下每年最大降水量。除此以外,還用到方差、偏差百分率、偏差概率、相關(guān)系數(shù)等統(tǒng)計(jì)方法。
為了了解信息化分鐘降水?dāng)?shù)據(jù)與人工讀取的異同性,本文將通過直接對(duì)比、方差比、不同強(qiáng)度等級(jí)下偏差統(tǒng)計(jì)以及偏差的空間分布等方法,從時(shí)空2個(gè)層面對(duì)信息化分鐘降水?dāng)?shù)據(jù)和人工讀取數(shù)據(jù)進(jìn)行對(duì)比分析。
提取浙江省19 個(gè)國家基本(準(zhǔn))站的年報(bào)表數(shù)據(jù)和信息化分鐘降水?dāng)?shù)據(jù),計(jì)算9 個(gè)歷時(shí)下的年最大降水?dāng)?shù)據(jù)。通過計(jì)算不同歷時(shí)下人工讀取數(shù)據(jù)與分鐘降水?dāng)?shù)據(jù)的差值(圖2),發(fā)現(xiàn)分鐘降水?dāng)?shù)據(jù)普遍比人工讀取數(shù)值偏小,偏小值在1 mm 之內(nèi)。其中,5、10 min 降水?dāng)?shù)據(jù)與人工讀取數(shù)據(jù)的降水偏小程度略大,偏小0.6~0.9 mm,偏差率在3%~8%,30 min 以上效果較好,偏差0.2 mm 左右,偏差率1%以內(nèi),可見30 min 以上二者計(jì)算結(jié)果非常接近。
圖2 各歷時(shí)人工讀取數(shù)據(jù)與分鐘降水?dāng)?shù)據(jù)降水量偏差
分鐘降水?dāng)?shù)據(jù)與年報(bào)表資料方差比(圖3)的計(jì)算中,比值越接近1 說明計(jì)算結(jié)果越接近。可見,10min后兩者的方差比值基本達(dá)0.9 以上,且在20 min 后趨于穩(wěn)定、效果較好,說明兩組數(shù)據(jù)在20 min 后已非常接近;而在5 min 下方差比為0.74,說明5 min歷時(shí)下兩者計(jì)算結(jié)果有一定的偏差,這與相關(guān)系數(shù)計(jì)算結(jié)果一致。從兩組數(shù)據(jù)相關(guān)性看,全歷時(shí)下相關(guān)性可達(dá)0.99,不同歷時(shí)下5 min 內(nèi)的相關(guān)性較差,30 min后相關(guān)性較好可達(dá)0.98。可見,從數(shù)據(jù)的整體穩(wěn)定性來看,30 min 后信息化的分鐘數(shù)據(jù)與人工讀取結(jié)果非常接近,而在較短歷時(shí)下的統(tǒng)計(jì)值反而存在一定的誤差。
圖3 分鐘降水?dāng)?shù)據(jù)和人工讀取數(shù)據(jù)各歷時(shí)最大降水量方差比
將分鐘降水?dāng)?shù)據(jù)與人工讀取數(shù)據(jù)的偏差量細(xì)分為10 個(gè)等級(jí),分別統(tǒng)計(jì)每個(gè)等級(jí)下的偏差次數(shù)(表1)。
表1 各歷時(shí)分鐘降水?dāng)?shù)據(jù)與人工讀取數(shù)據(jù)最大降水量不同程度偏差的個(gè)數(shù)統(tǒng)計(jì) 個(gè)
各歷時(shí)偏差個(gè)數(shù)主要集中在降水偏差為-1.5~0.5 mm,其中,5~15 min 降水自記數(shù)據(jù)與人工讀取數(shù)據(jù)的偏差主要集中在降水偏差為-2.0~0 mm,20~90 min主要集中在降水偏差<0.5 mm 的范圍內(nèi),120 min 歷時(shí)下則在降水偏差<1.0 mm 的范圍內(nèi)較為集中。
為了更好地了解信息化后的分鐘降水?dāng)?shù)據(jù)與人工記錄的對(duì)應(yīng)性,從空間分布的角度對(duì)兩者的關(guān)系做進(jìn)一步討論。
各站各歷時(shí)下分鐘降水?dāng)?shù)據(jù)與人工記錄降水量偏小的概率見表2,各站主要集中在40.5%~81%,其中以龍泉站偏小次數(shù)最少,洞頭站最多。各歷時(shí)下,5~20 min 歷時(shí)下偏小概率較高,基本達(dá)到70%以上,以淳安站、石浦站、鄞州站、玉環(huán)站、洞頭站最為明顯。
表2 各站各歷時(shí)分鐘降水?dāng)?shù)據(jù)最大降水量偏小概率 %
圖4 為各站各歷時(shí)分鐘降水?dāng)?shù)據(jù)與人工讀取數(shù)據(jù)最大降水量偏小量方差,可以很好地表現(xiàn)出不同歷時(shí)下各站降水量偏離總體樣本的情況。大陳島在120 min 歷時(shí)下,方差達(dá)到0.26,金華站在5 min 方差也較大,其他站點(diǎn)整體在0.05 左右。因此從單站看,各站中偏小概率出現(xiàn)最高的站點(diǎn)為洞頭氣象站;而各樣本的比較中,偏小量相對(duì)較大的氣象站為大陳島氣象站。
圖4 各站各歷時(shí)分鐘降水?dāng)?shù)據(jù)與人工讀取數(shù)據(jù)最大降水量偏小量方差歸一化分布
通過比較人工讀取數(shù)據(jù)和分鐘降水?dāng)?shù)據(jù)最大降水量分布情況發(fā)現(xiàn),分鐘降水?dāng)?shù)據(jù)可以很好地反映出浙江省的整體降水分布特征,總體分布情況與人工讀取一致:呈東西分布,即東部沿海地區(qū)最大降水量較大,西部內(nèi)陸地區(qū)相對(duì)較小。對(duì)于一次降水過程中信息化降水?dāng)?shù)據(jù)的適應(yīng)性,提取1980—2000 年短歷時(shí)下各站人工讀取最大年降水量及對(duì)應(yīng)的信息化數(shù)據(jù)、繪制人工讀取數(shù)據(jù)及對(duì)應(yīng)時(shí)間下信息化后數(shù)據(jù)的極端最大降水空間分布,也發(fā)現(xiàn)信息化降水?dāng)?shù)據(jù)仍可以較好地反映出一次降水量的分布特征,尤其是在30 min 后,有非常好的適應(yīng)性,這與之前的分析一致;30 min 內(nèi)降水整體空間分布一致,衢州等站降水量略偏小。
從空間差異上看(圖5),除龍泉站各歷時(shí)信息化資料大于人工讀取外,其他站各歷時(shí)多數(shù)以偏小為主,這也是19 個(gè)站中唯一各歷時(shí)分鐘降水?dāng)?shù)據(jù)均大于人工讀取數(shù)據(jù)的站點(diǎn)。
信息化后的降水自記紙數(shù)據(jù)與人工讀取數(shù)據(jù)在較短歷時(shí)如30 min 以內(nèi)的誤差相對(duì)較大,而30 min以上最大降水雨量的記錄偏差反倒較小。本文試尋找典型站點(diǎn),分析誤差產(chǎn)生的可能原因。利用不同歷時(shí)下各站最大降水量信息化數(shù)據(jù)結(jié)果與人工讀取年最大降水結(jié)果相關(guān)分析并檢驗(yàn),發(fā)現(xiàn):除龍泉站在5 min 歷時(shí)下的最大降水量相關(guān)性未通過0.05 的顯著性水平檢驗(yàn)外,其他站點(diǎn)在5~120 min 降水歷時(shí)內(nèi)均通過顯者性檢驗(yàn)。因此以玉環(huán)站5 min 為例(圖6),同時(shí)選取數(shù)據(jù)相關(guān)性較好的杭州站(圖7),對(duì)信息化后的分鐘降水?dāng)?shù)據(jù)及年報(bào)表中人工讀取最大降水量進(jìn)行校對(duì)、檢驗(yàn)。
圖5 各站各歷時(shí)人工讀取數(shù)據(jù)和分鐘降水?dāng)?shù)據(jù)最大降水量差值分布
圖6 龍泉站不同歷時(shí)分鐘降水?dāng)?shù)據(jù)和人工讀取數(shù)據(jù)最大降水過程偏差曲線
圖7 杭州站不同歷時(shí)分鐘降水?dāng)?shù)據(jù)和人工讀取數(shù)據(jù)最大降水過程偏差曲線
根據(jù)逐年最大降水偏差量變化曲線,篩選出龍泉站降水偏差量較大年份為1983、1988、1993、1995年,核對(duì)這些年份5 min 降水自記紙數(shù)據(jù)與年報(bào)表中人工讀取數(shù)據(jù)對(duì)應(yīng)的最大降水發(fā)生時(shí)間,發(fā)現(xiàn)5 min 最大過程降水發(fā)生時(shí)間不一致。利用同期原始降水自記紙掃描資料進(jìn)行檢查,偏差最大的1988 年為信息化數(shù)據(jù)記錄錯(cuò)誤,出現(xiàn)明顯偏大值。其余3 a雖有偏差,但偏差值量值不大,均在5 mm以內(nèi),1983年屬于記錄時(shí)間基本一致,信息化數(shù)據(jù)結(jié)果比人工讀取偏小,而剩余2 a 發(fā)生時(shí)間不一致,其中1993、1995 年5 min 最大降水均屬于降水自記紙記錄曲線非常密集的年份,且1995 年降水曲線存在被墨跡污染,可能人工未找到最大時(shí)段的情況。這種情況以龍泉站120 min 降水過程中1991 年最為明顯,年報(bào)表人工讀取最大降水過程在1991 年3 月27 日10:53(圖8),而信息化后找到最大降水過程為1991 年5 月7 日6:32(圖9),由于人工未找到最大降水過程導(dǎo)致過程最大降水明顯偏小,而信息化后的數(shù)據(jù)可以相對(duì)準(zhǔn)確地提取最大降水過程。
除此以外,對(duì)相關(guān)性較好的杭州站5 min 數(shù)據(jù)進(jìn)行分析,從歷年最大降水過程偏差量看,杭州站5 min整體偏差較小,挑選偏差相對(duì)較大的年份,以1986、1987、1995、1996 年為例與原始降水自記紙進(jìn)行對(duì)比分析偏差原因。杭州站4 a 中有3 a 發(fā)生時(shí)間對(duì)應(yīng)一致,數(shù)值上和其他年份一致略偏小??梢?,在信息化數(shù)據(jù)較為準(zhǔn)確的情況下,信息化數(shù)據(jù)在大部分情況下可以很好地代替人工,甚至在過程降水的提取中比人工讀取更有優(yōu)勢(shì)。
綜上分析,通過選擇典型站點(diǎn)提取短歷時(shí)下每年最大降水量分析得出,信息化數(shù)據(jù)與人工數(shù)據(jù)對(duì)比結(jié)果主要分為兩類:(1)最大降水過程發(fā)生時(shí)間一致,但過程降水總量整體偏小,信息化后數(shù)據(jù)計(jì)算出的降水過程總量一般略偏小。(2)最大降水過程發(fā)生時(shí)間不一致的情況較為復(fù)雜,主要為:①存在信息化原始數(shù)據(jù)記錄錯(cuò)誤。這種情況下將信息化記錄值對(duì)應(yīng)原始降水自記紙后容易發(fā)現(xiàn),記錄值一般是異常偏大,避免這種問題的出現(xiàn)需要在分鐘數(shù)據(jù)信息化的人工審核校對(duì)上留意奇異值,并且在后期數(shù)據(jù)的加工使用過程中,如果發(fā)現(xiàn)奇異值,應(yīng)當(dāng)首先與原始降水資料進(jìn)行校對(duì),檢查數(shù)據(jù)的合理性。②人工查找原始降水自記紙最大降水過程時(shí),可能出現(xiàn)漏掉最大過程。在這種情況下信息化降水資料更容易找到正確的降水時(shí)段。③降水自記紙較為密集,且存在被污染、墨跡模糊的時(shí)段,尤其是紙張大片被污染,人工讀取和信息化分鐘降水計(jì)算結(jié)果在較短歷降水過程統(tǒng)計(jì)下可能出現(xiàn)偏差,需要重點(diǎn)關(guān)注。
圖8 1991 年龍泉站120 min 年報(bào)15 時(shí)段中最大降水過程時(shí)間的降水自記紙曲線
圖9 1991 年龍泉站120 min 信息化年最大降水過程時(shí)間的降水自記紙曲線
在信息化數(shù)據(jù)質(zhì)量較好情況下,信息化數(shù)據(jù)大部分可以代替人工讀取,甚至在降水過程的提取中比人工讀取更有優(yōu)勢(shì),主要體現(xiàn)在:
(1)處理過程更客觀。降水自記紙的人工讀取過程中,主要根據(jù)降水曲線與時(shí)間的對(duì)應(yīng)點(diǎn),選定最大降水區(qū)間,通過讀取降水自記紙網(wǎng)格點(diǎn)對(duì)應(yīng)的降水量獲取數(shù)據(jù)值,因此同一條降水曲線由于主觀判斷或者是肉眼誤差導(dǎo)致不同人讀取時(shí)可能產(chǎn)生數(shù)值大小的偏差。而信息化分鐘降水?dāng)?shù)據(jù)主要是通過曲線自動(dòng)識(shí)別,提取降水曲線描述數(shù)據(jù)。為了減少誤差,在人工讀取和信息化分鐘數(shù)據(jù)讀取后,通常會(huì)通過正點(diǎn)降水量、12 h 及24 h 降水量等其他觀測(cè)結(jié)果來校核對(duì)比,而較短時(shí)段(如5 min、10 min)提取出的降水量則缺少一個(gè)精準(zhǔn)有效的驗(yàn)證數(shù)值。因此在較短時(shí)段內(nèi)人工讀取數(shù)值的訂正值更加依賴于人為主觀性;信息化數(shù)據(jù)則是通過平滑處理,對(duì)分鐘降水做統(tǒng)一規(guī)范。而60 min 以上降水過程由于通過其他手段的對(duì)比校驗(yàn),因此相對(duì)準(zhǔn)確,人工和信息化結(jié)果也較為接近。簡(jiǎn)單來說,信息化數(shù)據(jù)主要通過數(shù)值訂正,而人工讀取主要依靠為人工修正,可見,信息化數(shù)據(jù)在較短降水時(shí)段內(nèi)比人工讀取數(shù)值更加客觀、穩(wěn)定。
(2)方便數(shù)據(jù)的使用及提取。信息化數(shù)據(jù)方便提取每年任意時(shí)段的降水過程,對(duì)過程降水雨量進(jìn)行精準(zhǔn)排序,尤其是對(duì)提取每年前N(N>1)場(chǎng)降雨過程時(shí),比人工讀取更加便捷,也可解決人工尋找過程最大降水值較困難的問題。
(3)精度高。在較短歷時(shí)下,強(qiáng)降水導(dǎo)致降水自記紙中的降水曲線非常密集,人為主觀判斷就會(huì)對(duì)結(jié)果的準(zhǔn)確性產(chǎn)生一定影響,造成數(shù)據(jù)偏大或者偏小,而信息化后的數(shù)據(jù)是將降水量分配到逐分鐘,可精確、客觀的計(jì)算任意時(shí)間的降水總量。
可見,信息化結(jié)果在大部分情況下可以很好的代替人工讀取,甚至比人工統(tǒng)計(jì)結(jié)果更加穩(wěn)定、客觀,不但能很好地反應(yīng)出當(dāng)?shù)亟邓杂浖埖慕邓畔ⅲ瑫r(shí)還有效地彌補(bǔ)了自動(dòng)氣象站建站之前逐分鐘降水資料記錄的空缺,具有很好的適應(yīng)性。
隨著自動(dòng)觀測(cè)的廣泛開展,降水量自動(dòng)讀取結(jié)果的可信度及人工讀取結(jié)果的可替代性成為一個(gè)影響觀測(cè)質(zhì)量和氣候研究的重要問題。本文系統(tǒng)評(píng)估了1980—2000 年浙江省信息化分鐘降水自記紙數(shù)據(jù)與人工讀取數(shù)據(jù)的對(duì)比結(jié)果,主要結(jié)論如下:
(1)短歷時(shí)下信息化后的降水資料與人工觀測(cè)整體表現(xiàn)一致,數(shù)值上略偏小,相關(guān)系數(shù)達(dá)到0.99。整體來看,各歷時(shí)偏小值在1 mm 之內(nèi),其中30 min以上效果更好、偏小比例在1%以內(nèi),可見30 min 以后兩種數(shù)據(jù)的計(jì)算結(jié)果非常接近。
(2)信息化分鐘降水自記紙數(shù)據(jù)和人工讀取的年最大降水偏差量主要集中在-1.5~0.5 mm。偏小概率最高值出現(xiàn)在洞頭氣象站,此外大陳島的偏離量相對(duì)其他站點(diǎn)較大。
(3)空間分布上,信息化分鐘降水與人工讀取數(shù)據(jù)總體分布一致,均呈東多西少;在一次降水過程的空間分布特征中,信息化降水?dāng)?shù)據(jù)也有很好的適應(yīng)性。就空間差異而言,除龍泉站各歷時(shí)信息化資料均大于人工讀取外,其他站各歷時(shí)多以偏小為主。
(4)信息化數(shù)據(jù)在大部分情況下可以較好地代替人工讀取。由于不受主觀經(jīng)驗(yàn)影響,比人工觀測(cè)更加穩(wěn)定、客觀,可以很好地反映出當(dāng)?shù)亟邓杂浖埖慕邓畔?,具有很好的適應(yīng)性。這為計(jì)算暴雨強(qiáng)度公式、設(shè)計(jì)暴雨雨型等基于長時(shí)間序列分鐘降水資料的研究工作奠定了基礎(chǔ)。