降水自記跡線及雨量數(shù)字化提取質(zhì)檢技術

2019-11-15 06:15:00吳興洋周成霞蘭方信卜英竹潘徐燕許平

Advances in Meteorological Science and Technology 2019年3期

吳興洋周成霞蘭方信卜英竹潘徐燕許平

（貴州省氣象信息中心，貴州 550002）

0 引言

在自動氣象站投入氣象觀測業(yè)務以前，氣象觀測站用配有自記記錄紙的翻斗雨量計和虹吸雨量計來觀測連續(xù)的液態(tài)降水天氣過程，其降水自記跡線記錄了液態(tài)降水隨時間變化的變率（也稱強度）和雨量，對降水跡線進行數(shù)字化提取，能獲得降雨過程的分鐘、小時降水數(shù)據(jù)，據(jù)此建立一個氣象觀測站的分鐘、小時降水數(shù)據(jù)文件[1]。

降水自記跡線及雨量數(shù)字化提取工作，國外相關工作少有報道。20世紀80年代，國家氣象中心就在降水自記跡線數(shù)據(jù)提取技術及產(chǎn)品開發(fā)應用方面進行了探索[2]，用數(shù)字化儀進行試驗研究，由于誤差難以控制和工作量太大，未能在全國開展該項工作[3]。20世紀90年代初，用黑白滾筒掃描儀進行掃描和程序識別跟蹤曲線的方式，進行降水自記紙的數(shù)字化工作，由于系統(tǒng)自動化識別降水自記曲線性能差，曲線跟蹤的人工干預操作多，工作量大，沒能全面開展[3]。2001年4月—2012年11月，國家氣象中心和廣東省氣象局基于當時的軟硬件環(huán)境研制了降水自記紙數(shù)字化處理系統(tǒng)[4]，采用當時先進的圖形掃描和數(shù)據(jù)處理技術，實現(xiàn)了對降水自記信息的完整、真實的提取。2002—2006年，應用該系統(tǒng)，全國完成了國家地面基準、基本氣象站降水曲線數(shù)據(jù)提取工作，形成了我國地面基準、基本氣象站1960—2000年期間的分鐘、小時降水數(shù)據(jù)標準文件。應用這些分鐘、小時及日降水數(shù)據(jù)，國內(nèi)多個行業(yè)的研究人員在“我國大陸地區(qū)降水位相的特征分析”“不同區(qū)域歷時、小時、逐時、日降水雨強特征研究”“暴雨強度公式研制”等方面取得了大量的成果[5-18]。

為了拯救紙質(zhì)歷史氣象資料，滿足氣象業(yè)務、科研及其他部門對長序列精細化的降水數(shù)據(jù)需求，2016年6月起，中國氣象局預報司組織國家氣象信息中心、各?。▍^(qū)、市）氣象局，用一年多的時間，完成我國所有國家地面氣象站改用自動氣象站前一年的降水自記跡線及雨量的數(shù)字化提取，建立我國地面氣象站完整性好、序列長、質(zhì)量高、唯一的分鐘和小時降水文件數(shù)據(jù)集。為此，成立了全國歷史氣象資料數(shù)字化項目技術組，制訂了技術規(guī)定[19]，完善了2002年應用的跡線提取系統(tǒng)，新開發(fā)了降水數(shù)字化成果質(zhì)量檢查和評估軟件[20-21]。本次應用的降水自記紙數(shù)字化處理系統(tǒng)在2002年的基礎上增加了掃描圖像的朝向、分辨率調(diào)整功能，保證提取跡線與雨量的準確性、比較性。新開發(fā)的降水數(shù)字化成果質(zhì)量檢查和評估軟件，讓數(shù)字化生產(chǎn)單位質(zhì)檢人員、省級質(zhì)檢人員、國家級質(zhì)檢人員都能快速回放檢查提取跡線與原跡線的偏離度，實現(xiàn)降水跡線提取降雨量與對應時段（主要是過去12和24 h）人工觀測降雨量的對比檢查，跡線提取的逐小時雨量與人工讀取的逐小時雨量對比檢查，該軟件最大限度地提高了質(zhì)檢工作的質(zhì)量和效率。經(jīng)過了三級質(zhì)檢建立的降水分鐘、小時數(shù)據(jù)文件，保證了提取的雨量數(shù)據(jù)與實際降水過程雨量的一致性、準確性、可用性及實用性。

20世紀80—90年代，對于降水自記儀器介紹、跡線記錄分析處理的文章[22-31]，其內(nèi)容涉及不同雨量計介紹，異常記錄和特殊記錄的討論，對于做好本次降水自記紙跡線及數(shù)據(jù)提取有很好的指導作用。本文根據(jù)不同時期的觀測規(guī)范，結(jié)合實例，總結(jié)了應用降水數(shù)字化成果質(zhì)量檢查、評估軟件做好質(zhì)檢工作的流程、內(nèi)容及技術，提出了對于跨越定時觀測時段（包括跨日界記錄）的異常跡線，技術規(guī)定未明確處理規(guī)則的處理方法，達到提取雨量數(shù)據(jù)盡量逼近異常跡線時段的實際降雨天氣過程；分析了用數(shù)字化提取小時降雨量與歷史人工讀取小時降雨量的一致性來評價數(shù)字化成果一致率存在缺陷，探索了降水跡線數(shù)據(jù)提取成果質(zhì)量評估的改進方案，對比了兩種方案的評估結(jié)果。

1 全國降水自記紙數(shù)字化工作概況

2016年6月起開展的全國降水自記紙數(shù)字化工作內(nèi)容包括：完成31個省（區(qū)、市）2049個地面氣象站、計劃數(shù)6513879頁的降水自記跡線及雨量的數(shù)字化提取（表1）。最終完成數(shù)與此有一些誤差，如貴州實際完成了276282頁降水自記紙的跡線提取，涉及的質(zhì)檢工作包括修改、補錄了4163個月A6（歷史自記紙人工整理小時降水數(shù)據(jù)文件）文件，核對46354頁降水自記紙的跡線及雨量提取，查閱校對4994日人工定時觀測日降雨量與自記跡線提取日降雨量差異較大的記錄，該項工作量之大可見一斑。

表1 全國降水自記紙數(shù)字化工作分省計劃 Table 1 National precipitation recording paper digitization work sub-provincial plan

2 降水自記紙降雨量跡線及數(shù)據(jù)提取技術規(guī)定

一般情況下，安裝在同一個觀測場的雨量器和雨量計，雨量計自記跡線數(shù)字化提取降雨量數(shù)據(jù)累計值與對應時段定時觀測降雨量應基本一致；雨量計自記跡線數(shù)字化提取的逐時數(shù)據(jù)與人工讀取逐時數(shù)據(jù)應該基本一致。據(jù)此，降水自記紙跡線數(shù)字化提取技術規(guī)定：降水跡線提取降雨量數(shù)據(jù)20時—次日20時累計降雨量與雨量器日降雨量R的差：R≤5 mm時，誤差應≤0.5 mm，R＞5 mm時，誤差應≤R×10%。當人工讀取小時累計降雨量≤5.0 mm時，提取的逐時降雨量累計值與對應時間段人工讀取逐時降雨量累計值差值應≤0.3 mm，累計降雨量≥5.0 mm，誤差百分率≤2%。提取跡線與圖像跡線的偏離度≤0.2 mm，起始、終止時間與原記錄時間誤差≤2 min。

3 降水自記紙降雨量跡線及提取數(shù)據(jù)質(zhì)檢工作內(nèi)容和流程

降水自記紙記錄數(shù)字化規(guī)范[1]規(guī)定，降水跡線提取信息包括：降水跡線、雨量計類型、雨量和時間坐標比例尺、降水跡線的起止時間及異常記錄等。

準確提取降水自記跡線及降雨量數(shù)據(jù)的關鍵在于做好上述提取信息的質(zhì)檢工作，內(nèi)容包括：圖像掃描分辨率達到精度要求；降水跡線起止時間正確、降水分辨率設置正確；跟蹤跡線與原跡線偏離度低于記錄精度；異常記錄處理符合技術規(guī)定等。原因是跟蹤跡線與降水跡線偏離，會導致提取小時降雨量數(shù)據(jù)及累計值與人工讀取小時降雨量及定時降雨量誤差大，降水分辨率不恰當會引起提取降雨量數(shù)據(jù)系統(tǒng)性偏大或偏小，起止時間錯誤引起逐時降水數(shù)據(jù)錯誤，甚至改變了降水過程的起止時間，跡線出現(xiàn)異常未正確處理，則提取降雨量數(shù)據(jù)就不是實際降雨過程的降雨量。遵循如下流程與規(guī)則，才能全面準確完成所有內(nèi)容的正確質(zhì)檢。

質(zhì)檢流程第一步是用自記降水檢查程序（ZJJC）檢查降水圖像和提取跡線文件ZJR完整性、正確性。查看跡線提取位圖圖像BMP大小，檢查掃描圖像分辨率是否符合要求。為了保證降水自記紙掃描圖像上降水跡線提取及轉(zhuǎn)換數(shù)據(jù)精度不低于曲線記錄精度，如21號降水自記紙，圖像掃描分辨率應不低于150 dpi[4]，對應的BMP圖像大小在440 KB左右，本次應用的提取系統(tǒng)要求圖像分辨率不大于200 dpi，對應的BMP圖像大小在560 KB左右。

質(zhì)檢流程第二步是檢查提取參數(shù)文件（LIB）一行中最后兩列即：時間、降水分辨率數(shù)據(jù)，Rxxxxx1961080101.old，219，3245，20.35，.01321，.47389，其中的斜體數(shù)值，查看是否滿足精度要求。方法是將LIB文件導入Excel，分別對最后兩列排序查看即可。不同型號的自記紙，其記錄精度不一樣，相應的滿足提取精度要求的圖像分辨率不同。如21號自記紙，150 dpi的圖像掃描分辨率，則時間分辨率應不低于0.012，降水分辨率應不低于0.4。

質(zhì)檢流程第三步是對異常處理程序（ZJR）輸出的異常記錄逐條審核，查看異常時間段內(nèi)是否有正常跡線未跟蹤，對跨越08、14、20時的異常跡線要用08、14、20時的定時觀測降雨量數(shù)據(jù)進行分段處理。

質(zhì)檢流程第四步是核對ZJJC提出的每一條疑誤信息，核實數(shù)字化值與人工讀取值差異原因及其處理是否正確。

質(zhì)檢流程第五步是檢查應用質(zhì)檢評估（ZJPG）軟件逐一檢查根據(jù)挑選條件（與定時、A6差異超技術規(guī)定的、日降雨量＞30 mm、小時降雨量＞10 mm、跡線有異常的等）篩選出的跡線是否存在起止時間設定錯誤、跟蹤跡線偏離原跡線、異常時段內(nèi)有正常跡線未跟蹤，注意查看臨時（AS—linshi—file）文件中每條跡線起始、終止時間，其中與換紙時間差異較大的，要逐一核對。

4 自記降水跡線及數(shù)據(jù)提取的正確處理

降水跡線的形成需要雨量計雨量測量系統(tǒng)和其自記系統(tǒng)協(xié)同運轉(zhuǎn)，記錄一次降水天氣過程的跡線異常來自于這兩系統(tǒng)中之一或兩部分運轉(zhuǎn)失靈，如自記鐘停、記錄筆出墨異常、筆壓失靈、虹吸雨量計浮子漏水、翻斗雨量計翻轉(zhuǎn)失靈、跨大步等等，每一種故障都會引起跡線不正常，造成較大的測量誤差。質(zhì)檢人員應熟悉不同異常跡線的產(chǎn)生原因，表現(xiàn)形式，正確判斷降水跡線異常時間段，當自記紙上沒有標明異常時間或異常時段標記不明時，異常持續(xù)時間參考A0或A文件[32]中天氣現(xiàn)象的降雨記錄時間。本文以虹吸雨量計為例，根據(jù)歷史觀測規(guī)范對降水自記紙跡線及數(shù)據(jù)提取技術規(guī)定進行補充，歸納提取跡線及降雨量數(shù)據(jù)應遵循的原則和處理方法。

4.1 降水跡線提取必須遵循的原則

提取跡線、雨量必須真實反映實際降雨天氣過程，有雨時，降雨量必須提取出來，無雨時，一定不能出現(xiàn)降雨量。如圖1所示，19時原記錄注明無雨，跡線數(shù)字化提取有0.1 mm降水，查閱該日天氣現(xiàn)象記錄，降雨終止時間為16時20分，因此，圖1中19時數(shù)字化提取的0.13 mm降雨量是錯誤的。

4.2 觀測時間不一致引起降水跡線數(shù)字化提取與人工定時觀測有差異。

1960年前，降雨量人工定時觀測是07、19時，07、19時的降雨量被用來代替了歷史氣象月報數(shù)據(jù)文件[32]中08、20時的降雨量，1960年后，有的觀測員對降水觀測規(guī)范“20時降水觀測時和觀測前無降水，而其后至20時正點之間（包括延續(xù)至次日）有降水，應于20時正點補測降水并記錄降水量及天氣現(xiàn)象”這一規(guī)范執(zhí)行不到位，上述兩種情況都會引起降水跡線提取降雨量與人工定時觀測時段降雨量出現(xiàn)差異，降水日數(shù)出現(xiàn)差異，這是觀測時長不一致引起。由于人工觀測與跡線提取降雨量在08、20時有1～15 min的時間差，08、20時前15 min有強降水時，會帶來過去1、12、24 h提取降雨量與對應的定時觀測降雨量有較大差異。圖2a所示為一站2000年6月6—7日的降水跡線，圖2b為跡線提取與定時觀測對比情況，表2為跡線提取降雨量與定時觀測降雨量記錄。圖中看出該日19時50分起降雨，20時降雨量為3.7 mm，而該日定時觀測20時降雨量為0.0 mm，應是20時人工定時觀測降雨量未補測降雨量，降雨量計入到下一日，因此，6日人工觀測降雨量無降水，引起6、7日定時觀測與自記觀測降雨量差異和降水日數(shù)不一致。

圖1 無雨時數(shù)字化提取有降雨量的錯誤提取 Fig. 1 Error of digitized extraction for rainfall when there is no rain

4.3 降水跡線異常時的處理

圖2 （a）某站2000年6月1—7日降水跡線原始圖像；（b）圖2a所示跡線提取及雨量數(shù)據(jù)：6、7日與定時觀測降雨量和降水日數(shù)不一致 Fig. 2 (a) Original image from precipitation track on 1 to 7 June 2000 at a certain station; (b) Trace extraction and rainfall data shown in Fig. 2a: the precipitation and precipitation days observed on 6 and 7 June are not consistent with those observed at regular intervals

技術規(guī)定要求，在自記跡線異常時間段內(nèi)有正常跡線，要提取正常跡線及降雨量數(shù)據(jù)，時段內(nèi)異常時間各時降雨量采用平均分配該異常時段降雨量，對于異常跡線跨越08、20時的情況，未明確規(guī)定應用上08或20時定時觀測降雨量數(shù)據(jù)。本文認為考慮到與歷史定時觀測過去12 h或24 h降雨量的一致性，應以08時、20時為界分段處理異常跡線，這樣盡可能將降水跡線異常時的降雨量分配到相應時間段，逼近實際降雨天氣過程。07、19時有定時觀測降雨量，應以07、13、19時為斷點分段處理；08、20時有定時觀測降雨量，應以08、14、20時為斷點分段處理。如圖3所示，18日18 時—19日22時儀器故障，跡線異常，異常跡線按一段異常處理（圖3b），以20時為界分段處理（圖3c）。圖3b中20、21、22時跡線提取降雨量分別是25.7、21.0、2.0 mm，18日跡線提取降雨量為29.96 mm，人工定時觀測降雨量為35.6 mm，兩者有較大差異。圖3c應用了20時定時觀測降雨量，以20時為界分段處理，其中20、21、22時跡線提取降雨量分別是31.3、15.5、1.9 mm，提取的降雨量更符合當時的降雨天氣過程，日降雨量也與人工定時觀測雨量保持了一致性，同為35.6 mm。為清楚對比，將兩種方法處理的18、19日降雨量結(jié)果列于表3。

表2 圖2a所示人工定時觀測與同時段降水跡線提取降雨量對比 Table 2 Comparison between the artificial timing observation as shown in Fig. 2a and the precipitation trace line extraction at the same period

4.4 歷史觀測員未識別出來的異常跡線的處理

當跡線提取降雨量與定時觀測降雨量出現(xiàn)較大差異時，查閱氣薄-1定時觀測降雨量無誤，應該根據(jù)天氣現(xiàn)象降雨記錄時間，在有降雨期間增補異常降雨時段來處理，異常降雨量就是該時段定時觀測降雨量與時段內(nèi)正常跡線提取降雨量之差。圖4a所示為此類一例，27日人工08時定時觀測降雨量為20.1 mm，圖4b中其跡線提取值僅為8.9 mm，查閱天氣現(xiàn)象記錄，26日夜間至27日09時55分有雨，因此判定跡線走平段05時20分—08時降水跡線異常，應作異常處理，異常時段降雨量為20.1-8.9=11.2 mm。27日09時55分—16時47分，間斷式下雨，27日20時定時觀測降雨量為2.3 mm，因此08時—16時47分做異常處理，異常時段降雨量2.3 mm。

4.5 降水跡線有中斷，可連線按正常跡線處理，歷史觀測員錯按異常跡線處理

當降水跡線出現(xiàn)中斷時，中斷時間未超過1 h，如果用連線兩端點的方法處理缺測段，提取降雨量與定時觀測量一致，用這種方式處理中斷時段是合理的[31]（圖5）。圖5a為某站1969年5月22—23日降水跡線圖像，歷史觀測員當時處理為23日04—08時異常，降雨量為25.2 mm，圖5b為跡線提取圖，采用斷點到底連線，按正常虹吸處理，其結(jié)果與定時觀測降雨量一致，這樣處理比之歷史觀測員處理要與天氣過程相符（夜間該站不觀測）。

5 降水跡線降雨量數(shù)據(jù)提取成果一致性評估改進方案

本次質(zhì)檢評估采用提取逐小時降雨量數(shù)據(jù)與對應的人工讀取小時降雨量進行一致性評估?？墒窃谡c時刻有強降水發(fā)生時、跡線異常時，會出現(xiàn)提取小時降雨量與人工讀取小時降雨量差異較大，出現(xiàn)明顯的不一致。人工讀取小時降雨量出自于多名觀測員，強降水跨過正點時，肉眼分辨力有限，當有時間訂正時，人工無法精確、均勻分配時差，與數(shù)字化精確提取的小時降雨量出現(xiàn)差異較大不可避免。異常跡線發(fā)生時，人工是將異常時間段的累計降雨量計入降雨過程的最后一小時，數(shù)字化是將該值平均分配到異常時段各小時，導致異常時段逐時降雨量兩組數(shù)據(jù)不一致。為此提出，跡線異常時段逐時數(shù)據(jù)不參與評估，增設異常小時降雨量統(tǒng)計及評估，這可評估國家地面氣象站過去業(yè)務質(zhì)量和同期儀器故障率。降水時長1 h以上的，采用過程降雨量進行一致性評估，這樣評估的一致率更為客觀。舉例如下：某站1998年有效降水560 h，提取小時數(shù)據(jù)（包括異常跡線分配的小時數(shù)據(jù)）與對應的人工讀取有50 h出現(xiàn)較大差異，逐時一致率為91%。如果用本文提出的評估方案，差異較大的僅08時觀測時長不一致引起，共2 h，逐時一致率接近100%，異常小時數(shù)42 h，異常率7.5%。圖6是該站1980—2006年兩種評估方案的結(jié)果對比。

6 小結(jié)

自記降水跡線及數(shù)據(jù)提取是為了拯救紙質(zhì)歷史氣象資料和獲取同期小時、分鐘降水資料數(shù)據(jù)開展的歷史氣象資料信息化工作，目的是建立起我國國家地面氣象站分鐘降雨量的長序列資料。以此為基礎數(shù)據(jù)，可計算降雨過程中任意時間段的降雨量，制作成各種降水數(shù)據(jù)產(chǎn)品，相關人員應用這些數(shù)據(jù)對降水過程任意時段降水強度及其分布特征進行統(tǒng)計分析、時空分析。有了分鐘降水強度數(shù)據(jù)，能對暴雨的分時雨強分布進行深入研究，對天氣雷達降雨量預估進行評估和驗證。一個地區(qū)有了長期的雨強序列資料，人們能夠?qū)Ρ緟^(qū)域的強降水特征有全面的認識，為農(nóng)業(yè)、城市、交通、水利等領域的規(guī)劃和建設及政府防災減災策略的制定提供科學的數(shù)據(jù)支撐。

圖3 （a）某站1998年6月18—19日降水跡線原始圖像；（b）圖3a中異常時段不分段提取跡線及降雨量；（c）圖3a中異常時段以18日20時為界分段提取跡線及降雨量 Fig. 3 (a) The original image of precipitation track line of a certain station from 18 to 19 June 1998; (b) Track lines and rainfall were extracted unsegmented in abnormal periods in Fig. 3a; (c) Trace lines and rainfall were extracted segmented in the abnormal period with 20 BT on 18 June 1998 as a dividing date

歷史降水資料數(shù)字化建設工作范圍遍及全國，資料時間跨度長，期間涉及觀測規(guī)范、時制的多次變化，異常記錄情況多樣，技術規(guī)定不可能面面俱到，只有對跡線跟蹤及數(shù)據(jù)提取全面質(zhì)檢，對提取雨量與人工定時觀測出現(xiàn)差異較大，超出技術規(guī)定范圍的記錄，必須去一一查證，依據(jù)當時的規(guī)范進行合理的處理，才能得到正確的降水序列資料。在查證提取雨量與人工定時觀測超出技術規(guī)定范圍記錄的過程中，自記紙需要核實的內(nèi)容包括：自記紙日期是否正確；結(jié)合前后記錄核實日期是否標注錯誤；跡線異常未被發(fā)現(xiàn)；如4.4節(jié)中個例，這類情況都需要重新處理。對于正點時刻有強降水、跡線異常、跨日界降水引起的超差記錄，只要過程降雨量一致，核實即可。對于提取雨量與人工定時觀測差異大的記錄，在自記紙正確及跡線正常的情況下，必須用觀測記錄薄核實定時觀測降雨量，在分析雨量計工作正常的情況下，同時核對當日相鄰站的雨量后，方可修正定時觀測雨量。特別提到1960年前，定時觀測是07、19時，與現(xiàn)行08、20時不一致，限于篇幅和資料不足，未列舉對翻斗雨量計的實例。

表3 圖3a所示異常跡線分段與不分段提取的逐時雨量及時段累計降雨量（單位：0.1 mm） Table 3 Cumulative rainfall of hourly rainfall and time interval extracted by section-wise and non-section-wise abnormal track lines as shown in Fig 3a (unit: 0.1 mm)

圖4 某站1979年5月26—27日降水跡線原始圖像（a），降水自記紙觀測跡線跟蹤處理（b） Fig. 4 (a) The original image of precipitation track line, 1979; (b) tracking and processing of self-recording paper observation track lines of precipitation at a station from 26 to 27 May 1979

圖5 某站1969年5月22—23日降水自記跡線及人工處理（跡線中斷處異常處理）（a），降水跡線及數(shù)據(jù)提?。ㄛE線中斷處正常連線處理）（b） Fig. 5 (a) Precipitation recording track and manual processing (abnormal processing at the break of track); (b)Precipitation track and data extraction at a certain station from 22 to 23 May 1969 (normal connection processing at the break of track)

圖6 某站1980—2006年用逐時降雨量與降水過程評估提取降雨量與人工讀取一致率 Fig. 6 Consistency rate between extracted rainfall and manual observation by hourly precipitation and precipitation process assessment in a certain station from 1980 to 2006