李恒麗 李保珠
摘 要:位于云南省麗江市古城區(qū)的黑龍?zhí)度?,在降雨偏少時(shí)會(huì)發(fā)生季節(jié)性斷流,特別是近年來(lái)由于降雨減少,人為活動(dòng)增多,泉群斷流情況越來(lái)越嚴(yán)重,斷流次數(shù)逐漸增多、時(shí)長(zhǎng)也增長(zhǎng),以致麗江市從“高原姑蘇”變成嚴(yán)重缺水的城市,直接影響了麗江市的形象,制約其社會(huì)經(jīng)濟(jì)的發(fā)展。因此對(duì)黑龍?zhí)度哼M(jìn)行動(dòng)態(tài)研究與斷流分析預(yù)測(cè),對(duì)于麗江市的發(fā)展、地下水資源的利用具有重要意義。本文采用人工神經(jīng)網(wǎng)絡(luò)方法分析黑龍?zhí)度航涤炅颗c流量的變化,應(yīng)用python語(yǔ)言及相關(guān)庫(kù)分析,計(jì)算黑龍?zhí)督涤炅颗c流量的相關(guān)性系數(shù),利用matlab人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)黑龍?zhí)度旱某鏊考芭袛嗍欠駭嗔?。模型模擬及預(yù)測(cè)結(jié)果較好,與實(shí)際值相差無(wú)幾,能較好地預(yù)測(cè)流量的變化趨勢(shì)及斷流結(jié)果。
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò);流量預(yù)測(cè);斷流預(yù)測(cè)
中圖分類號(hào):TP183 ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ?文章編號(hào):1006—7973(2020)07-0149-04
1 引言
黑龍?zhí)度何挥邴惤璧貣|北部的象山山麓,九子海復(fù)向斜南部翹起端,泉群出露于三疊系北衙組中上段裂隙發(fā)育的灰?guī)r、白云質(zhì)灰?guī)r中。泉群地下水類型為炭酸鹽巖裂隙水,補(bǔ)給來(lái)源主要是大氣降水,其次還有冰雪融水、基巖地下水、河流渠道水等,地下水補(bǔ)給來(lái)源十分豐富,使黑龍?zhí)度簱碛休^大的出水量[1~4]。黑龍?zhí)度簽辂惤懦翘峁┥?、景觀及服務(wù)業(yè)用水,其流量的變化直接關(guān)系到麗江市民的生活狀況。但上世紀(jì)八十年代以來(lái),其發(fā)生過多次斷流,給麗江的生產(chǎn)、生活各方面造成了巨大的影響,所以其流量的穩(wěn)定性及提前預(yù)測(cè)具有重要意義[5,6]。
目前研究發(fā)現(xiàn),對(duì)黑龍?zhí)度毫髁康闹饕绊懸蛩貫椋核囱a(bǔ)給區(qū)域的降雨量、城市用水量、植被退化與地下水開采。其中降雨量為最主要因素,降雨量減少導(dǎo)致滲入地下的水流減少,最終造成黑龍?zhí)稊嗔鱗7]。目前對(duì)黑龍?zhí)读髁康难芯空撐囊灿泻芏啵饕酝A粼诙ㄐ苑治錾?,只是研究了大體的影響因素及如何作用還有一些統(tǒng)計(jì)學(xué)數(shù)據(jù);對(duì)流量的定量研究仍處于初步階段,很多模型都沒有嘗試過,當(dāng)然,對(duì)其進(jìn)行定量研究時(shí),整個(gè)系統(tǒng)的周期性可能不是按整月的,而數(shù)據(jù)統(tǒng)計(jì)時(shí)都按整月統(tǒng)計(jì),造成了變化不一致等;還有整個(gè)系統(tǒng)的響應(yīng)并不是線性的,自變量較多及存在很多潛在因素的影響等造成系統(tǒng)建模難度增大。而利用傳統(tǒng)的GMS進(jìn)行建模分析時(shí),需要鉆孔鉆探試驗(yàn)確認(rèn)地下含水層的厚度、頂?shù)装?,各處的滲透系數(shù)等,而這些數(shù)據(jù)因?yàn)楦鞣矫娴脑蚨紱]進(jìn)行實(shí)驗(yàn)采集,所以該方法也很難進(jìn)行。
在這種模糊條件過多,響應(yīng)為非線性,各因素的影響系數(shù)未知的系統(tǒng)中,最合適的研究方法為人工神經(jīng)網(wǎng)絡(luò)。該方法在確定主要影響因素的情況下,可以將所有影響因素作為自變量導(dǎo)入,將要研究的對(duì)象作為因變量,讓計(jì)算機(jī)自動(dòng)尋找規(guī)律,而且如果對(duì)結(jié)果不滿意可以多次訓(xùn)練模型或者調(diào)整參數(shù)、自變量等,使結(jié)果最終符合預(yù)期目標(biāo),達(dá)到良好的預(yù)測(cè)效果。利用python先分析出各月降雨量、井水位與流量的相關(guān)性,確定主要影響因素,然后用matlab的神經(jīng)網(wǎng)絡(luò)工具箱,代入所有影響因素跟是否斷流后,訓(xùn)練模型,再用新數(shù)據(jù)檢驗(yàn)?zāi)P停粩嗾{(diào)整參數(shù),當(dāng)效果達(dá)到預(yù)期后最終導(dǎo)出模型。
2 主要影響因素的確定
當(dāng)前能為建模提供建?;A(chǔ)的數(shù)據(jù)主要參考為麗江站1988~2018年每月降雨量,九子海2000~2017年每月降雨量,麗江站1992~2018年每月井水位,黑龍?zhí)?990~2012年每月流量。由于九子海降雨量太小,為間接影響黑龍?zhí)读髁恳蛩厍遗c黑龍?zhí)读髁繑?shù)據(jù)的時(shí)間重合度太低,暫時(shí)不作為因素考慮。為了宏觀地觀察麗江站降雨量、麗江井水位與黑龍?zhí)读髁康年P(guān)系,先繪制出重合時(shí)間內(nèi)三者的趨勢(shì)圖。由于井水位的數(shù)據(jù)級(jí)別太小,為方便觀察,將其擴(kuò)大400倍與降雨量跟流量比較。
圖1明顯表明:流量與井水位保持同步變化,當(dāng)井水位上升時(shí)流量隨之上升,且時(shí)間刻度上保持一致,未見滯后性。而降雨量與流量整體趨勢(shì)也相同,但圖上也很明顯有時(shí)間差,當(dāng)降雨量到達(dá)最大值時(shí),往往過二至三個(gè)月,流量才達(dá)到最大值,由此猜測(cè)本月麗江降雨量并不會(huì)對(duì)本月流量產(chǎn)生影響,而是影響兩到三月后黑龍?zhí)兜牧髁俊?/p>
為了驗(yàn)證以上猜想,需要計(jì)算降雨量與流量的相關(guān)性系數(shù)。
經(jīng)計(jì)算,本月流量與本月降雨量相關(guān)性系數(shù)為-0.166067,與往前一個(gè)月為0.110125,與往前兩個(gè)月為0.333704,與往前三個(gè)月為0.449788,與往前四個(gè)月為0.456936,本月流量與本月井水位的相關(guān)性系數(shù)為0.938674。很明顯,相關(guān)性系數(shù)的計(jì)算結(jié)果與假設(shè)相符。
由于表中所有數(shù)據(jù)都是基于時(shí)間序列的離散型數(shù)據(jù),且流量與本月降雨,前月降雨相關(guān)性系數(shù)太低,由此利用傳統(tǒng)的分析方法,假設(shè)流量的變化量與前2、3、4月降雨量存在相關(guān)性。將本月流量與前月流量作差,得到流量的變化量。由于多元自變量不方便分析,同時(shí)為了均衡多個(gè)月份降雨量對(duì)流量的影響,現(xiàn)計(jì)算多個(gè)月流量的平均值與流量的相關(guān)性,然后選取相關(guān)性最大的作為單一自變量。
經(jīng)計(jì)算,本月流量與前2、3月降雨量平均值的相關(guān)性系數(shù)為0.435440,與前3、4月份為0.503288,與前2、3、4月為0.503063。因此此處選擇相關(guān)性系數(shù)最大值作為自變量,即前3、4月份的平均降水量。由此,將前3、4月份的平均降雨量作為自變量,將流量的變化量作為因變量進(jìn)行線性分析并繪制出分布散點(diǎn)圖。
圖2中縱坐標(biāo)為本月相對(duì)于上月的流量變化量,橫坐標(biāo)為本月前3、4月的平均降雨量,圖中直線為基于最小二乘法的線性回歸線。很明顯,分布呈現(xiàn)很大的離散性,即表明相同或相近的降雨量所導(dǎo)致的流量變化差異很大,如前3、4月平均降雨量在1500mm左右時(shí),本月流量的變化可能幾乎不變,也可能上升800mm。另外,點(diǎn)的分布也并未與任何規(guī)律曲線(二次或三次曲線)相符,由此,并不能基于此建模。
由以上推論,降雨量不能作為影響流量的單一變量,而井水位與流量的相關(guān)性系數(shù)比較大,所以可以將上個(gè)月的井水位作為一個(gè)影響因素。另外,從原理上分析,也是在降雨后,雨水滲入地下,三個(gè)月以后才影響黑龍?zhí)度毫髁浚晁德浜鬂B入地下,優(yōu)先會(huì)作用表現(xiàn)在井水位上,然后井水位上升后,再體現(xiàn)在流量的變化上。且井水位可以看成是降雨量與流量雙重作用下長(zhǎng)期累積的結(jié)果,其承擔(dān)著降雨量轉(zhuǎn)化為黑龍?zhí)读髁康臉屑~關(guān)系,所以應(yīng)將其看成是影響流量的重要因素。另外,前一個(gè)月流量也必然影響著本月的流量,因?yàn)榱髁慷际腔谇耙粋€(gè)月的流量在變化著的,例如,上月流量很大,但前幾個(gè)月降雨量都很小,流量必然會(huì)降低,這種降低是基于前個(gè)月的流量下的,卻不會(huì)因?yàn)榻涤炅繙p少而突然斷流。上個(gè)月流量較大時(shí),即使降雨量很小,斷流的幾率也幾乎為零。最后,由于每年降雨量,蒸發(fā)量,農(nóng)業(yè)灌溉等也是周期性的,所以將月份納入到影響因素也很有必要。由此,初步確認(rèn)了所有的自變量即影響流量的所有因素:前月流量,前月井水位,月份,往前三個(gè)月,往前四個(gè)月與往前五個(gè)月的降雨量。
3 ?MATLAB神經(jīng)網(wǎng)絡(luò)分析
人工神經(jīng)網(wǎng)絡(luò)是模仿人腦工作原理設(shè)計(jì)的計(jì)算模型,它由多個(gè)節(jié)點(diǎn)互相連接組成,能對(duì)數(shù)據(jù)的復(fù)雜關(guān)系進(jìn)行建模。節(jié)點(diǎn)間的連接都被賦予不同的權(quán)重,權(quán)重的含義是一個(gè)節(jié)點(diǎn)對(duì)另一個(gè)節(jié)點(diǎn)的影響大小。每個(gè)節(jié)點(diǎn)表示一個(gè)特定的函數(shù),其他節(jié)點(diǎn)傳來(lái)的數(shù)據(jù)到達(dá)該節(jié)點(diǎn)后會(huì)進(jìn)行相應(yīng)的權(quán)重計(jì)算,輸入到一個(gè)激活函數(shù)中并計(jì)算新的值。從系統(tǒng)的角度上看,人工神經(jīng)網(wǎng)絡(luò)是由大量的神經(jīng)元經(jīng)過復(fù)雜的連接構(gòu)成的自適應(yīng)非線性動(dòng)態(tài)系統(tǒng)。一個(gè)兩層的神經(jīng)網(wǎng)絡(luò)就可以逼近任意函數(shù),所以,只要有足夠的神經(jīng)元和訓(xùn)練數(shù)據(jù),人工神經(jīng)網(wǎng)絡(luò)可以學(xué)到很多復(fù)雜的函數(shù)。
流量的預(yù)測(cè)是一個(gè)復(fù)雜的非線性系統(tǒng),這個(gè)系統(tǒng)的真正狀態(tài)方程必然是由很多微分方程組成,同時(shí)系統(tǒng)又包含了很多的未知情況,有很多隱藏的因素作用在系統(tǒng)上,而且支持整個(gè)系統(tǒng)的理論也有很多需要深究之處。綜上,要想用數(shù)學(xué)方法準(zhǔn)確建模是十分困難的,因此,可以嘗試用神經(jīng)網(wǎng)絡(luò)來(lái)表達(dá)這個(gè)復(fù)雜的非線性系統(tǒng)。
將整個(gè)系統(tǒng)看成是一個(gè)黑箱,所有影響因素作為系統(tǒng)輸入,把是否斷流作為輸出,最終整個(gè)系統(tǒng)也就是成為了一個(gè)二分類問題。通過所有的統(tǒng)計(jì)數(shù)據(jù)神經(jīng)網(wǎng)絡(luò),不斷地調(diào)整優(yōu)化后,使得該網(wǎng)絡(luò)有了能表達(dá)該未知系統(tǒng)的能力,這個(gè)神經(jīng)網(wǎng)絡(luò)也就能預(yù)測(cè)系統(tǒng)輸出了。
此處使用MATLAB的神經(jīng)網(wǎng)絡(luò)工具箱對(duì)其進(jìn)行分析,該神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)最大的特點(diǎn)就是信號(hào)前向傳播,誤差反向傳播,每層的神經(jīng)元狀態(tài)只會(huì)影響下一層的,如果輸出層達(dá)不到期望的輸出,就會(huì)把誤差進(jìn)行反向傳播,調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值,最終使神經(jīng)網(wǎng)絡(luò)的輸出不斷逼近預(yù)期值。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程包含以下幾個(gè)步驟:
(1)初始化神經(jīng)網(wǎng)絡(luò):根據(jù)系統(tǒng)的輸入輸出值(X,Y)大致推出網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)n、隱含層節(jié)點(diǎn)數(shù) ? ,輸出層節(jié)點(diǎn)數(shù)m,初始化輸入層、隱含層和輸出層神經(jīng)元之間的連接權(quán)值ωij,ωjk,初始化隱含層閾值α,輸出層閾值b,給定學(xué)習(xí)速率和神經(jīng)元激勵(lì)函數(shù)。
對(duì)于預(yù)測(cè)斷流,將是否斷流看成是一個(gè)二分類問題,將斷流定義為0,未斷流定義為1,而神經(jīng)網(wǎng)絡(luò)所有的預(yù)測(cè)并不會(huì)完全確定各月是否斷流,而是計(jì)算出一個(gè)概率,該概率值介于0與1之間,預(yù)測(cè)結(jié)果的數(shù)據(jù)越接近1就表示越不會(huì)斷流,越接近0,即表示斷流的概率越大。
將麗江站降雨量,月份,黑龍?zhí)渡显铝髁?,上月井水位作為自變量,設(shè)置神經(jīng)網(wǎng)絡(luò)的隱藏層深度為8層,設(shè)置訓(xùn)練集為90%的總體樣本數(shù),驗(yàn)證集為5%的總體樣本數(shù),測(cè)試集為5%的總體樣本數(shù),對(duì)本月是否斷流進(jìn)行分析。在對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行多次調(diào)整并重新學(xué)習(xí)后,訓(xùn)練出了預(yù)測(cè)準(zhǔn)確率較高的模型。用該模型重新預(yù)測(cè)全部月份的斷流情況,總數(shù)據(jù)量為237個(gè),預(yù)測(cè)斷流的準(zhǔn)確次數(shù)為227次,準(zhǔn)確率達(dá)到了95.78%,而且在預(yù)測(cè)會(huì)斷流而實(shí)際未發(fā)生斷流時(shí),該月實(shí)際流量也已經(jīng)很低了,接近于斷流狀態(tài)。實(shí)際發(fā)生了斷流卻未預(yù)測(cè)成功的只有一次。截取所有數(shù)據(jù)中1995年的情況,表1中列出了該年每月的實(shí)際流量,實(shí)際是否斷流,預(yù)測(cè)的斷流情況。
表1對(duì)1995年6、7兩月的斷流已經(jīng)準(zhǔn)確地預(yù)測(cè)出來(lái)了,但對(duì)5月的預(yù)測(cè)有誤差,預(yù)測(cè)該月斷流的概率較大,但實(shí)際還有流量。從實(shí)際情況來(lái)看,卻也不能認(rèn)為預(yù)測(cè)錯(cuò)誤,因?yàn)閺牧髁縼?lái)說(shuō),該月的流量已經(jīng)很低了,可能該月月底也已經(jīng)斷流了,實(shí)際也需要采取補(bǔ)水措施。綜上,該模型已經(jīng)能對(duì)斷流提供良好的預(yù)測(cè)能力,能夠指導(dǎo)進(jìn)行提前預(yù)防控制了。
4 結(jié)論
(1)經(jīng)計(jì)算得出,黑龍?zhí)度毫髁颗c降雨量的相關(guān)性系數(shù)最大的月份為本月往前三、四月:與往前三個(gè)月降雨量為0.449788,與往前四個(gè)月為0.456936,另外本月流量與本月井水位的相關(guān)性系數(shù)為0.938674。由此得出:①流量與井水位基本保持同步變化,當(dāng)井水位上升時(shí)流量隨之上升,未見滯后性;②本月麗江降雨量并不會(huì)對(duì)本月流量產(chǎn)生影響,而是影響三到四月后黑龍?zhí)兜牧髁俊?/p>
(2)前幾月平均降雨量與本月流量相關(guān)性系數(shù)計(jì)算中,得出前3、4月份平均降雨量相關(guān)性最大,為0.503288。而將前3、4月份的平均降雨量與流量的變化量進(jìn)行線性分析,發(fā)現(xiàn)準(zhǔn)確性太差,從而得出降雨量不能作為影響流量的單一影響因素,并且綜合分析初步確認(rèn)了所有的影響流量的所有因素:前月流量,前月井水位,月份,往前三個(gè)月,往前四個(gè)月與往前五個(gè)月的降雨量。
(3)通過人工神經(jīng)網(wǎng)絡(luò)建立的模型已經(jīng)能較準(zhǔn)確地預(yù)測(cè)是否斷流,能使用MATLAB中建好的模型對(duì)是否斷流進(jìn)行指導(dǎo)性的預(yù)測(cè);本文通過選取黑龍?zhí)度?992年到2011年降雨量與出水量數(shù)據(jù)的90%搭建人工神經(jīng)網(wǎng)絡(luò),用該模型預(yù)測(cè)剩余10%的情況,結(jié)果與預(yù)期目標(biāo)相符。
(4)通過人工神經(jīng)網(wǎng)絡(luò)模型如果有更多的數(shù)據(jù)進(jìn)行訓(xùn)練,預(yù)測(cè)的準(zhǔn)確性和通用性將會(huì)大大提高,所以可以將以后統(tǒng)計(jì)的實(shí)際數(shù)據(jù)納入到訓(xùn)練樣本中,從而提高生產(chǎn)力。對(duì)于預(yù)測(cè)到斷流,該給黑龍?zhí)堆a(bǔ)多少水的問題,由于沒有補(bǔ)水對(duì)流量影響的試驗(yàn)數(shù)據(jù),所以很難給出參考,需要進(jìn)行相關(guān)實(shí)驗(yàn)及相關(guān)的地質(zhì)考察后,才有條件模擬出。
參考文獻(xiàn):
[1] 康曉波,張華,王波. 麗江黑龍?zhí)度核牡刭|(zhì)特征及斷流的影響因素分析(云南省地質(zhì)環(huán)境監(jiān)測(cè)院)[C].巖溶水文地質(zhì)研討會(huì)暨第十八屆全國(guó)洞穴學(xué)術(shù)會(huì)議,2012.
[2] 周友妹.麗江古城黑龍?zhí)度當(dāng)嗔髟蚍治鯷J].人民珠江.2015(01):54-58.
[3] 和菊芳,方金鑫.麗江黑龍?zhí)度畡?dòng)態(tài)變化與降水關(guān)系初探[J].中國(guó)農(nóng)村水利水電. 2019(08): 26-27.
[4] 譚乃元,張麗芳.麗江黑龍?zhí)度當(dāng)嗔鞒跆絒J].城市建設(shè), 2012(17).
[5] 李豫馨,許模,高偉,漆繼紅. 基于時(shí)間序列方法預(yù)測(cè)麗江黑龍?zhí)度蛄髁縖J].人民珠江, 2016(3):6-9.
[6] 李豫馨.基于時(shí)間序列分析的麗江黑龍?zhí)度騽?dòng)態(tài)研究[J].成都理工大學(xué),2016.
[7] 曾成,楊睿,楊明明,胡君春,武貴華,樊宇紅 .麗江市黑龍?zhí)度簲嗔鞯娜斯ど窠?jīng)網(wǎng)絡(luò)模擬[J].中國(guó)巖溶, 2013(04) P391-397.
[8]王小川,史峰,郁磊,李洋編著. MATLAP神經(jīng)網(wǎng)絡(luò)43個(gè)案例分析[Z]. MATLAP 技術(shù)論壇.
[9] 陳明編著.MATLAP神經(jīng)網(wǎng)絡(luò)原理與實(shí)例精講[Z].