周莉 嚴(yán)鋒 何健 鮑慶煜 朱慶云 于飛龍
摘要:
南京潮水位站是長(zhǎng)江進(jìn)入江蘇的“第一站”,提高潮位預(yù)報(bào)精度對(duì)于南京市防洪減災(zāi)具有重要意義。利用南京潮水位站2010~2020年高潮位超過(guò)8.50 m年份的實(shí)測(cè)資料,采用多元回歸分析建立南京潮水位站高潮位預(yù)報(bào)模型。為消除多重共線性的影響,采用逐步回歸對(duì)變量進(jìn)行篩選,并對(duì)預(yù)報(bào)模型進(jìn)行實(shí)時(shí)修正以提高預(yù)報(bào)精度。結(jié)果表明:根據(jù)GB/T 22482-2008《水文情報(bào)預(yù)報(bào)規(guī)范》,該模型預(yù)報(bào)精度可達(dá)甲等。該預(yù)報(bào)方法簡(jiǎn)單、實(shí)用,對(duì)于提高受潮汐影響站點(diǎn)的潮位預(yù)報(bào)精度具有一定的參考價(jià)值。
關(guān)鍵詞:
高潮位預(yù)報(bào); 多元逐步回歸; 實(shí)時(shí)修正; 南京潮水位站
中圖法分類號(hào):P338
文獻(xiàn)標(biāo)志碼:A
DOI:10.15974/j.cnki.slsdkb.2023.03.003
文章編號(hào):1006-0081(2023)03-0022-04
0 引 言
長(zhǎng)江南京段位于長(zhǎng)江流域下游,南京潮水位站作為重要的國(guó)家基本水位站,承擔(dān)著該河段的水文監(jiān)測(cè)工作,為該地區(qū)的防汛、抗旱、海事、航運(yùn)、供水等眾多部門提供水情數(shù)據(jù)[1]。歷史資料表明,長(zhǎng)江流域洪水頻發(fā),在秦始皇元年至唐代中期遭受201次洪澇災(zāi)害,其中長(zhǎng)江下游占大部分[2];20世紀(jì),長(zhǎng)江流域共發(fā)生3次特大洪水,分別為1931年、1954年和1998年[3],其中1954年8月17日,南京潮水位站超歷史,測(cè)記最高潮水位10.22 m;21世紀(jì),長(zhǎng)江流域共發(fā)生2次特大洪水,分別為2016年和2020年,其中2020年7月21日長(zhǎng)江南京站潮水位再次超歷史,觀記最高潮水位為10.39 m。長(zhǎng)江流域防洪形勢(shì)嚴(yán)峻,為減少洪澇災(zāi)害帶來(lái)的人員傷亡和經(jīng)濟(jì)損失,南京潮水位站潮位預(yù)測(cè)顯得尤為重要。
莊一鸰等[4]采用相應(yīng)水位法建立長(zhǎng)江南京站潮位預(yù)報(bào)方案;張行南等[5]采用改進(jìn)的相應(yīng)水位法、分離過(guò)程線法和有限記憶最小二乘法分別建立南京潮水位站潮位預(yù)報(bào)方案。易建軍等[6]選用1996,1998,1999,2000年汛期水文觀測(cè)資料(大通流量過(guò)程和下關(guān)站前期潮位過(guò)程),采用近似方法建立下關(guān)站潮位過(guò)程預(yù)報(bào)模型。孫宜寶等[7]選用1991,1995,1996,1998,1999,2003年的實(shí)測(cè)資料,采用相關(guān)預(yù)報(bào)方法建立南京潮水位站高潮位預(yù)報(bào)方案。聞?dòng)嗳A等[8]采用多因子回歸方法對(duì)南京潮水位站高潮進(jìn)行預(yù)報(bào),但未考慮實(shí)時(shí)修正;朱慶云等[1]選用1950~2011年南京潮水位站實(shí)測(cè)月最高潮位,利用差分自回歸移動(dòng)模型(ARIMA)研究潮水位變化規(guī)律、預(yù)報(bào)月最高潮位。
考慮到2020年長(zhǎng)江南京站潮水位再次超歷史,本文在原有研究基礎(chǔ)上選用2010~2020年的最新數(shù)據(jù),同時(shí)考慮到上游來(lái)水和潮汐變化的影響,以及影響因子存在多重共線性的問(wèn)題,建立了基于多元逐步回歸及實(shí)時(shí)修正的南京潮水位站高潮位預(yù)報(bào)模型。
1 潮位影響因素
長(zhǎng)江南京段位于長(zhǎng)江下游,長(zhǎng)江南京站潮水位主要受上游來(lái)水和下游潮汐影響[9],區(qū)間來(lái)水亦是影響因素,但相對(duì)而言影響不大。
1.1 上游來(lái)水影響
上游來(lái)水影響主要是來(lái)自大通站以上的降雨徑流影響。大通站水位和流量的相關(guān)系數(shù)高達(dá)0.965,因此二者均可代表洪水的大小。大通站水位和流量是南京潮位站最高潮位的主要影響因素[7]。因此,本文選取大通站水位作為上游來(lái)水影響因子。
1.2 潮汐影響
長(zhǎng)江下游自大通起至徐六涇止,為感潮河段,水位受潮汐影響,長(zhǎng)江南京段水位因此呈現(xiàn)明顯的半日潮,每天出現(xiàn)兩個(gè)高潮、兩個(gè)低潮,最大潮差可達(dá)1.5 m以上。因此,位于長(zhǎng)江口的吳淞站的潮位可作為表征潮汐對(duì)長(zhǎng)江南京段水位影響的因子。
1.3 區(qū)間來(lái)水影響
大通站至南京潮水位站的區(qū)間面積僅占南京潮水位站以上面積的3%,絕大多數(shù)情況下,區(qū)間來(lái)水對(duì)南京潮水位站水位影響不大[10]。
綜合以上分析,南京潮水位站潮位的主要影響因素為上游來(lái)水及??诔毕@兩個(gè)因子,區(qū)間來(lái)水的影響在本文中不予考慮。
2 數(shù)據(jù)來(lái)源與研究方法
2.1 數(shù)據(jù)來(lái)源
南京潮水位站設(shè)立于1912年1月,現(xiàn)有觀測(cè)項(xiàng)目:最高和最低潮水位、水溫、逐日降水量。本文選用南京潮水位站2010~2020年間高潮位超過(guò)8.50 m的年份(2010,2015,2016,2017,2019,2020年)的實(shí)測(cè)資料進(jìn)行分析,共有114組樣本,每組樣本選取Z南京,Z大通1,Z大通2,Z吳淞1,Z吳淞2共5個(gè)因子,其中Z南京為南京潮水位站的高潮位,Z大通1為大通站前1日08∶00水位,Z大通2為大通站前2日08∶00水位,Z吳淞1為吳淞站前一次高潮位,Z吳淞2為吳淞站前前次高潮位。
2.2 研究方法
SPSS(Statistical Product and Service Solutions)作為現(xiàn)今最權(quán)威的兩大統(tǒng)計(jì)軟件之一,具有數(shù)據(jù)管理和統(tǒng)計(jì)分析等功能,其中統(tǒng)計(jì)分析功能包括相關(guān)分析和回歸分析等[11]。本文利用SPSS進(jìn)行多元線性回歸分析,建立因變量y與自變量xi之間的回歸模型[12],見式(1):
y=b0+b1·x1+ b2·x2+…+ bk·xk+e(1)
式中:b為回歸系數(shù);e為隨機(jī)誤差。
多元線性回歸分析需滿足3個(gè)假設(shè):
(1) 獨(dú)立性。各自變量之間不能存在多重共線性;在進(jìn)行分析解釋之前,需進(jìn)行共線性診斷[13]。常用的參數(shù)有容差(Tolerance)、方差膨脹因子(Variance Inflate Factor,VIF)、條件指數(shù)(Condition Index,CI),具體標(biāo)準(zhǔn)見表1。
為滿足獨(dú)立性要求,本文選取逐步回歸方法對(duì)自變量進(jìn)行篩選:將自變量逐個(gè)引入模型,當(dāng)原先引入的自變量因后面引入自變量變得不再顯著時(shí),則將其刪除。不斷重復(fù)該步驟,直到既沒(méi)有影響顯著的自變量選入回歸方程,也沒(méi)有影響不顯著的自變量從回歸方程中剔除為止[14]。
(2) 正態(tài)分布。自變量任意線性組合,殘差服從正態(tài)分布。
(3) 方差齊性。自變量任意線性組合,因變量方差不變,殘差齊性。
回歸方程建立之后,需通過(guò)方差分析(F檢驗(yàn))、t檢驗(yàn)以及確定性系數(shù)R2檢驗(yàn)方程的有效性[15]。其中,當(dāng)R2>0.6表示模擬效果良好。
3 結(jié)果分析
考慮到大通站水位及吳淞站潮位變化趨勢(shì)的影響,本文根據(jù)資料選取大通站前1日與前2日08∶00水位,以及吳淞站前一次高潮位與前前次高潮位4個(gè)因子進(jìn)行逐步回歸,建立大通水位-南京潮位-吳淞潮位相關(guān)關(guān)系,并進(jìn)行實(shí)時(shí)修正。
3.1 多元回歸方程建立
本文選取2010,2015,2019,2020年南京潮水位站85組數(shù)據(jù)進(jìn)行多元回歸分析。由表2可知,大通站水位是南京潮水位站潮位的主要影響因素。大通站前1日、前2日08∶00水位兩個(gè)因子間相關(guān)系數(shù)為0.983,相關(guān)性較大;吳淞站前一次高潮位、前前次高潮位兩個(gè)因子間相關(guān)系數(shù)為0.825,相關(guān)性較大。為消除多重共線性的影響,本文通過(guò)逐步回歸建立大通水位-南京潮位-吳淞潮位相關(guān)關(guān)系,各因子間的相關(guān)性見表2,多元回歸模型回歸系數(shù)見表3。
由表3可知,大通站前1日08∶00水位、吳淞站前一次高潮位2個(gè)因子與南京潮水位站高潮位相關(guān),自變量Z大通1,Z吳淞1的VIF<10,該模型不存在多重共線性問(wèn)題。對(duì)該模型顯著效果解釋如下。
(1) 模型調(diào)整R2=0.925>0.6,即該回歸模型對(duì)因變量的解釋程度為92.5%,模擬效果較好。
(2) 該回歸方程的顯著性水平小于0.05,在F檢驗(yàn)中拒絕原假設(shè),因變量(南京潮水位站高潮位)與自變量(Z大通1,Z吳淞1)的線性關(guān)系顯著,即該回歸模型能有效預(yù)測(cè)因變量。
(3) 自變量Z大通1,Z吳淞1的VIF<10,該模型不存在多重共線性問(wèn)題。
(4) 標(biāo)準(zhǔn)化殘差呈正態(tài)分布,散點(diǎn)在直線附近,回歸方程滿足線性及方差齊次檢驗(yàn)。其中,圖1為正態(tài)分布曲線直方圖,可以發(fā)現(xiàn)圖形基本呈現(xiàn)鐘形,表示樣本觀測(cè)值基本符合正態(tài)分布假設(shè)。圖2 為回歸標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖,由圖可知,該圖從左下到右上呈現(xiàn)一條45°的直線,表明樣本分布基本符合正態(tài)分布的標(biāo)準(zhǔn)。
綜上分析,該模型符合線性、獨(dú)立性、正態(tài)性、齊次性這4個(gè)假設(shè),且回歸效果顯著。根據(jù)表3系數(shù)b,可得到南京潮水位站高潮位Z南京的回歸方程:
Z南京=0.699Z大通1+0.280Z吳淞1-2.127(2)
根據(jù)GB/T 22482-2008《水文情報(bào)預(yù)報(bào)規(guī)范》,用率定期內(nèi)2010,2015,2019,2020年南京潮水位站超8.50 m水位期間觀測(cè)資料(85組數(shù)據(jù))進(jìn)行評(píng)定,回歸模型的精度評(píng)定見表4。
3.2 多元回歸方程檢驗(yàn)
選取2016,2017年29組數(shù)據(jù)進(jìn)行驗(yàn)證。根據(jù)GB/T 22482-2008《水文情報(bào)預(yù)報(bào)規(guī)范》要求,對(duì)預(yù)報(bào)方案進(jìn)行檢驗(yàn),檢驗(yàn)期精度評(píng)定見表5。由表5可知,當(dāng)許可誤差取正常潮位預(yù)報(bào)許可誤差±0.30 m時(shí),合格率為79.31%,預(yù)報(bào)方案為乙等;當(dāng)許可誤差取±0.10 m時(shí),合格率僅為6.90%,沒(méi)有達(dá)到南京潮水位站潮位預(yù)報(bào)精度要求。
3.3 實(shí)時(shí)修正
為了提高南京潮水位站高潮位的預(yù)報(bào)精度,選取前1日南京站高潮位預(yù)報(bào)差值c對(duì)預(yù)報(bào)值進(jìn)行實(shí)時(shí)修正,可得到修正后的南京潮水位站高潮位Z南京修正的回歸方程:
Z南京修正=0.699Z大通1+0.280Z吳淞1-2.127-c(3)
經(jīng)過(guò)對(duì)預(yù)報(bào)值進(jìn)行實(shí)時(shí)修正,回歸模型的率定期和驗(yàn)證期的評(píng)定精度分別見表6~7。
通過(guò)表4~7可知,南京潮水位站高潮位通過(guò)實(shí)時(shí)修正以后,率定期和驗(yàn)證期的平均誤差、平均相對(duì)誤差均減小,許可誤差分別取±0.10 m和±0.30 m時(shí)的合格率均得到大幅提升。根據(jù)GB/T 22482-2008《水文情報(bào)預(yù)報(bào)規(guī)范》,經(jīng)過(guò)實(shí)時(shí)修正,率定期和驗(yàn)證期的精度等級(jí)均達(dá)到甲等。
4 結(jié) 語(yǔ)
本文利用多元線性回歸方法建立南京潮水位站高潮位預(yù)報(bào)模型。為消除多重共線性的影響,采用逐步回歸對(duì)變量進(jìn)行篩選。對(duì)南京潮水位站高潮位進(jìn)行實(shí)時(shí)修正后,率定期和驗(yàn)證期的精度等級(jí)均達(dá)甲等。該預(yù)報(bào)方法簡(jiǎn)單、實(shí)用、價(jià)值高,對(duì)于受潮汐影響站點(diǎn)的潮位預(yù)報(bào)有一定的參考借鑒作用。
參考文獻(xiàn):
[1] 朱慶云.ARIMA模型在南京站月最高潮位預(yù)報(bào)中的應(yīng)用[J].人民長(zhǎng)江,2013,44(增1):20-21.
[2] 姚亦鋒.南京市城市地理變遷及現(xiàn)代景觀[M].南京:南京大學(xué)出版社,2006.
[3] MIDDLETON N.Rivers:A Very Short Introduction [M].Oxford:Oxford University Press,2012.
[4] 莊一鸰,林三益.水文預(yù)報(bào)[M].北京:水利電力出版社,1986.
[5] 張行南,況惠恒,吳一鳴.南京站實(shí)時(shí)潮位預(yù)報(bào)系統(tǒng)研制[J].水利科技與經(jīng)濟(jì),2005(8):487-489.
[6] 易建軍,王建群.潮位過(guò)程預(yù)報(bào)的近似方法[J].東北水利水電,2005(8):36-37,54-56.
[7] 孫宜寶,趙建華,嚴(yán)鋒.長(zhǎng)江南京站高潮潮水位預(yù)報(bào)方案[J].江蘇水利,2006(7):33-35.
[8] 聞?dòng)嗳A,司存友,羅利雅.多元回歸方法在長(zhǎng)江南京站潮位預(yù)報(bào)中的應(yīng)用[J].江蘇水利,2012(4):28-29.
[9] 張麗.南京站潮位實(shí)時(shí)預(yù)報(bào)系統(tǒng)研究[D].南京:河海大學(xué),2001.
[10] 李國(guó)芳,黃振平,章志強(qiáng),等.長(zhǎng)江防洪堤南京段設(shè)計(jì)洪水位風(fēng)險(xiǎn)分析[J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),1999(2):25-30.
[11] 李娜卿.基于SPSS多元回歸分析的城市地下水用水量預(yù)測(cè)[J].河北水利,2021(8):42-43.
[12] 黃振平.水文統(tǒng)計(jì)學(xué)[M].南京:河海大學(xué)出版社,2003.
[13] 張鳳蓮.多元線性回歸中多重共線性問(wèn)題的解決辦法探討[D].廣州:華南理工大學(xué),2010.
[14] 周莉,李致家,韓通.基于地形地貌資料的Nash單位線參數(shù)規(guī)律研究[J].湖泊科學(xué),2016,28(5):1141-1147.
[15] 林彬.多元線性回歸分析及其應(yīng)用[J].中國(guó)科技信息,2010(9):60-61.
(編輯:江 文)
High tidal level forecasting of Nanjing Tidal Level Station on Yangtze River based on Multiple Stepwise Regression and real-time correction
ZHOU Li1,YAN Feng1,HE Jian2,BAO Qingyu1,ZHU Qingyun1,YU Feilong1
(1.Nanjing Branch of Jiangsu Province Hydrology and Water Resources Investigation Bureau,Nanjing 210008,China; 2.Jiangsu Province Hydrology and Water Resources Investigation Bureau,Nanjing 210029,China)Abstract:
Nanjing Tidal Level Station is the first hydrological station located along Yangtze River in Jiangsu Province.Improving the accuracy of tide level forecasting is important for flood control and disaster reduction of Nanjing.The high tidal level forecasting model introduced in this paper was established with the method of Multiple Regression,using the measured data of high tidal level over 8.50m from 2010 to 2020.In order to eliminate the effects of multicollinearity,the variables were screened with the method of stepwise regression,at the same time,real time modification was conducted in the forecasting process to improve the forecast accuracy.The results showed that the model forecast accuracy reached the level of Class A stipulated by the GB/T 22482-2008 Standard for Hydrological Information and Hydrological Forecasting Standard.The forecasting method is simple and effective,which can be useful for improving the forecast accuracy of tidal level of the hydrological station affected by tide.
Key words:
high tide level forecasting;Multiple Stepwise Regression;real-time correction;Nanjing Tidal Level Station
收稿日期:
2022-04-28
作者簡(jiǎn)介:
周 莉,女,工程師,碩士,主要從事水文測(cè)報(bào)工作。E-mail:zhoulinanjing@163.com