王盼秋,曾 丹,孟凡宇
(1.淄博市水文局,山東 淄博 255000;2.臨沂市水文局,山東 臨沂 276000)
回歸分析法在水位預(yù)測(cè)中的應(yīng)用
王盼秋1,曾丹2,孟凡宇1
(1.淄博市水文局,山東 淄博 255000;2.臨沂市水文局,山東 臨沂 276000)
【摘要】通過(guò)對(duì)大武水源地1986—2011年枯水期水位、開(kāi)采量、降水量等多個(gè)長(zhǎng)系列實(shí)測(cè)資料的統(tǒng)計(jì)分析,建立了多元線性回歸模型,對(duì)模型進(jìn)行F檢驗(yàn)和T檢驗(yàn)修正后,利用該模型進(jìn)行水源地次年枯水期水位預(yù)測(cè)。結(jié)果為實(shí)測(cè)資料與模擬預(yù)測(cè)值的誤差在5%以內(nèi),表明該方法預(yù)測(cè)精度較高,適用于該水源地水位預(yù)測(cè)。
【關(guān)鍵詞】大武水源地;線性回歸;水位預(yù)測(cè)
地下水動(dòng)態(tài)的分析,尤其是地下水源地水位的精確預(yù)報(bào)及趨勢(shì)分析,對(duì)水源地的管理和開(kāi)采布局的適時(shí)調(diào)控起著至關(guān)重要的作用,有利于水資源的可持續(xù)利用。另外,對(duì)防止地面沉降、地下水污染等地質(zhì)環(huán)境災(zāi)害有著積極作用。本文以淄博市大武水源地為例,選用多元線性回歸模型,對(duì)其枯水期水位進(jìn)行了分析預(yù)測(cè),旨在為水源地的合理調(diào)控提供依據(jù)。
大武水源地位于山東省淄博市臨淄區(qū)境內(nèi),指位于臨淄區(qū)的大武、辛店、南仇3個(gè)地下水源地的閉合富水區(qū)域,總面積110km2,可開(kāi)采資源量40萬(wàn)m3/d。
大武水源地開(kāi)采程度一直較高,供水范圍涉及城市生活、工業(yè)、農(nóng)業(yè)灌溉等各個(gè)方面。從大武水源地歷年開(kāi)采量可知,大致可分4個(gè)階段:開(kāi)采量大幅度上升期(1980—1996年),開(kāi)采量緩慢減少期 (1996—2001年),開(kāi)采量大幅度壓減期(2002—2011年),保護(hù)性開(kāi)采期 (2011-07以后)。經(jīng)統(tǒng)計(jì),1980—2012年大武水源地多年平均開(kāi)采量14718.3萬(wàn)m3,其中2002年以來(lái)年平均開(kāi)采量11925萬(wàn)m3。
從大武水源地歷年地下水位曲線可知,自1980年以來(lái),受高強(qiáng)度開(kāi)采和降水豐枯變化等影響,大武水源地水位經(jīng)歷了1980—1990年、1991—1996年、1997—2005年3個(gè)升降周期,表現(xiàn)為下降(持續(xù)或穩(wěn)步或間斷)~回升(急劇或連續(xù))狀態(tài)。2006—2010年為相對(duì)穩(wěn)定階段,水源地總體上采補(bǔ)平衡,地下水位變化較平穩(wěn),水位一般保持在25~35m。根據(jù)1980年運(yùn)行以來(lái)水位動(dòng)態(tài)資料可知,其有以下變化特征:1)地下水位年際變幅大,季節(jié)性變化明顯。2)各富水段表現(xiàn)出平盤升降的特征,表明富水地段之間存在著密切的水力聯(lián)系。
2.1多元線性回歸模型介紹
回歸分析法是指在掌握了一定量的觀測(cè)數(shù)據(jù)的前提下,用數(shù)理統(tǒng)計(jì)的方法建立變量與自變量之間的回歸函數(shù)關(guān)系。回歸分析根據(jù)自變量個(gè)數(shù)的多少可分為一元回歸分析和多元回歸分析。按照回歸表達(dá)式的形式又可分為線性回歸分析和非線性回歸分析。多元線性回歸模型就屬于回歸分析的一種,該方法多用于水文地質(zhì)條件復(fù)雜的地區(qū)。
多元線性回歸模型的因變量與自變量之間為線性關(guān)系,數(shù)學(xué)模型為:
Y=b0+b1X1+b2X2+……+bpXp+e
其中:Y為因變量,Xi(i=1,2,3,……,p)為自變量,b0,b1,b2,……,bp為未知回歸參數(shù),e為隨機(jī)變量。
對(duì)于一組數(shù)據(jù)(X1,X2,……,Xp,Y),回歸模型由兩部分組成,即b0+b1X1+b2X2+……+bpXp和e,即觀測(cè)因素和非觀測(cè)因素。當(dāng)隨機(jī)誤差e的平方和最小時(shí),回歸方程的擬合程度就最好,基于這種思想求未知參數(shù)b0,b1,b2,……,bp的方法叫最小二乘法。
用最小二乘法求得模型參數(shù)的估計(jì)值后,還需要進(jìn)行顯著性檢驗(yàn)。常采用兩種方式進(jìn)行檢驗(yàn),一是對(duì)回歸參數(shù)的顯著性檢驗(yàn)(T檢驗(yàn)),用于檢驗(yàn)每個(gè)變量Xi對(duì)因變量Y影響的顯著性;二是回歸方程的整體線性顯著性檢驗(yàn) (F檢驗(yàn)),用于檢驗(yàn)Y與變量Xi之間的線性關(guān)系是否顯著。
2.2回歸模型建立與求解
對(duì)水源地1980—2012年因變量Y(次年6 月1日水位)和自變量Xi(當(dāng)年10月1日水位、當(dāng)年10.1至次年6.1降水量、當(dāng)年汛期降水量、時(shí)段開(kāi)采量、黑旺鐵礦排水量、當(dāng)年10月至次年5月補(bǔ)源量、當(dāng)年7~9月補(bǔ)源量)進(jìn)行統(tǒng)計(jì),如表1示。通過(guò)Matlab對(duì)數(shù)據(jù)進(jìn)處理計(jì)算,用最小二乘法得到模型的回歸參數(shù)bp見(jiàn)表2和方差分析見(jiàn)表3。
表2 回歸方程參數(shù)表
由表2得出回歸方程為:
Y=-7.087+0.953X1+0.033X2+0.025X3
表3 方差分析表
-0.002X4+0.0005X5+0.0003X6-0.0007X7
在顯著性水平為0.05的情況下對(duì)方程進(jìn)行F統(tǒng)計(jì)檢驗(yàn),由表3知該方程的F值為76.11,故:
證明該回歸方程顯著。
在顯著性水平為0.05的情況下對(duì)各自變量參數(shù)進(jìn)行T檢驗(yàn),查T值表得:
當(dāng)表2中各參數(shù)對(duì)應(yīng)T值的絕對(duì)值小于2.064時(shí),即|Ti|<2.064時(shí)自變量對(duì)因變量Y有顯著性影響。統(tǒng)計(jì)結(jié)果表明,只有10月1日至次年6月1日降水量、10月1日至次年6月1日開(kāi)采量、黑旺排水量、10月1日至次年6月1日補(bǔ)源量對(duì)水源地次年枯水期水位即6月1日水位有著顯著性影響,其他因子對(duì)次年6月1日水位的影響顯著性稍差。
利用多元線性回歸模型計(jì)算得大武水源地1986—2001年次年6月1日水位預(yù)測(cè)值,并求得預(yù)測(cè)值的絕對(duì)誤差和相對(duì)誤差。從對(duì)比情況可見(jiàn),除極個(gè)別年份外預(yù)測(cè)值絕對(duì)誤差較小,相對(duì)誤差在10%以內(nèi),對(duì)實(shí)測(cè)水位與預(yù)測(cè)水位進(jìn)行曲線擬合,兩曲線擬合程度較好,預(yù)測(cè)結(jié)果與實(shí)測(cè)數(shù)據(jù)較為符合。
1)采用多元線性回歸模型,對(duì)大武水源地次年枯水期水位進(jìn)行超前預(yù)測(cè),結(jié)果表明,預(yù)測(cè)精度較高,方法可以采用。
2)由結(jié)果可知,模型預(yù)測(cè)值與實(shí)測(cè)值誤差較大的點(diǎn)為序列的極值點(diǎn),這是吉布斯現(xiàn)象的反應(yīng)。
3)在預(yù)測(cè)的過(guò)程中,應(yīng)根據(jù)序列的加長(zhǎng)和結(jié)果的誤差精度,對(duì)參數(shù)值進(jìn)行合適的調(diào)整。同時(shí)隨著自變量等因素的變化,應(yīng)不斷檢驗(yàn)參數(shù)影響的顯著性,選取不同自變量組合并改變回歸方程進(jìn)行預(yù)測(cè)。
4)利用多元線性回歸模型對(duì)水源地次年枯水期水位進(jìn)行超前預(yù)測(cè),對(duì)于水源地開(kāi)采模式及開(kāi)采量的合理調(diào)整,提高供水保證率,水資源的可持續(xù)利用等方面均可起到至關(guān)重要的作用。
(責(zé)任編輯 崔春梅)
【中圖分類號(hào)】P641.7
【文獻(xiàn)標(biāo)識(shí)碼】B
【文章編號(hào)】1009-6159(2015)-03-0029-03
收稿日期:2014-12-11
作者簡(jiǎn)介:王盼秋(1987—),男,助理工程師