蔡蓉蓉,張紅武,卜海磊,張 宇
(1. 清華大學(xué)水沙科學(xué)與水利水電工程國家重點實驗室,北京 100084;2. 鄭州清大水利工程技術(shù)咨詢有限公司,河南鄭州 450003)
黃河流域的徑流主要來自內(nèi)蒙古自治區(qū)托克托縣河口鎮(zhèn)以上,泥沙主要來源于河口鎮(zhèn)以下至陜西潼關(guān)之間,水沙異源[1],且黃河歷來“水少沙多,水沙關(guān)系不協(xié)調(diào)”,加上下游洪災(zāi)頻發(fā)[2-3],下游河段淤積嚴(yán)重,成為舉世聞名的“地上懸河”。1960 年代以來,黃河下游洪水漫灘機(jī)遇減少,泥沙主要淤積在主槽及嫩灘,形成“二級懸河”[4]。下游水沙條件大為改變后,一些河段“二級懸河”發(fā)展迅速[5],“二級懸河”形勢依然嚴(yán)峻[6],河道治理仍面臨挑戰(zhàn)。河床的沖淤變形與水沙組合(徑流量與輸沙量組合)類型密切相關(guān),研究黃河的水沙組合類型有助于深入了解黃河水沙特點、進(jìn)一步揭示河床沖淤變形規(guī)律,對判斷未來的水沙情勢及制定黃河未來治理方略大有裨益。
黃河水沙變化研究,一直是制定黃河治理開發(fā)方案的基礎(chǔ)和難點,也是技術(shù)界關(guān)注與爭論的焦點,尤其自1980 年代以來,有關(guān)部門先后圍繞該問題開展相關(guān)項目的科學(xué)研究,取得了一系列成果[7]。特別地,有學(xué)者利用經(jīng)驗或理論方法,利用實測水沙資料對黃河的水沙關(guān)系展開了有關(guān)研究。尹學(xué)良認(rèn)為大水期黃河河槽發(fā)生沖刷、小水期發(fā)生淤積,提出山東段黃河河槽的沖淤分界流量在1800 m3/s左右[8]。邰淑彩借鑒并改進(jìn)了劉善均研究水文站典型水沙年的方法,與劉善均[9]認(rèn)為河流的水量和沙量一般呈正相關(guān)關(guān)系不同,邰淑彩[10]認(rèn)為黃河的水量和沙量可呈現(xiàn)出非正相關(guān)關(guān)系,她仍將水(沙)豐隸屬度及其均值作為分類依據(jù),利用閾值β(水沙大年下限)、a(水沙中年界限)、α(水沙小年上限),對渭河華縣站的水文泥沙年資料進(jìn)行分類并選取了包括小水大沙年在內(nèi)的典型水沙年。目前,黃河水沙情勢已發(fā)生改變[7],沙量銳減。實測資料表明,黃河中游潼關(guān)站年輸沙量已由年均16億t(1919—1959年)銳減至不足3億t(2000—2018年)。信忠保等學(xué)者[11]認(rèn)為退耕還林還草工程使植被恢復(fù)可能是導(dǎo)致相應(yīng)區(qū)域產(chǎn)沙量顯著下降的重要原因。馬麗梅、趙躍中、蔣觀滔等學(xué)者[12-14]的研究也給出了類似結(jié)論,都表明植被覆蓋面積不斷恢復(fù)是黃河沙量銳減的重要原因。由于黃河問題的復(fù)雜性與研究的重要性,“十三五”期間,國家重點研發(fā)計劃首批設(shè)立“黃河流域水沙變化機(jī)理與趨勢預(yù)測”項目(2016YFC0402400),對黃河水沙關(guān)系及水沙變化機(jī)理繼續(xù)展開深入研究。
近年來,以人工神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)方法在水科學(xué)研究中得到了廣泛應(yīng)用[15],有學(xué)者已將神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用于降雨、徑流預(yù)報及模擬等研究中[16],這為研究黃河水沙關(guān)系提供了新的方法。自組織映射(Self-Organizing Map,SOM)模型作為一種典型的神經(jīng)網(wǎng)絡(luò)模型,具有聚類、模式識別等眾多功能,如伊璇等[17]利用該模型進(jìn)行了滇池流域的分類和無資料區(qū)的徑流模擬。鑒于黃河中游潼關(guān)站來沙量基本能反映黃土高原的侵蝕量及產(chǎn)沙強(qiáng)度[18],同時考慮到由于黃河支流伊洛、沁河的匯入及三門峽水庫與小浪底水庫的攔截作用,潼關(guān)站與花園口站相比,年徑流量一般偏小,年輸沙量一般偏大,可以說潼關(guān)站水沙條件更為不利。本文選取潼關(guān)站為代表站,利用該站的實測水沙資料,基于自組織映射-K均值聚類耦合方法(以下簡稱SOM-K法),對該站的水沙組合進(jìn)行分類,揭示出不同階段各水沙組合類型的變化規(guī)律,為深入了解黃河中下游潼關(guān)以下河段水沙變化特點提供參考。
2.1 SOM模型Kohonen參考人腦神經(jīng)元的特性,于1982年提出SOM模型[19]。SOM是一種無監(jiān)督學(xué)習(xí)模型,可將復(fù)雜的高維輸入數(shù)據(jù)通過非線性映射反映到低維(一般是二維)網(wǎng)格,并保留數(shù)據(jù)的拓?fù)潢P(guān)系,從而對輸入數(shù)據(jù)進(jìn)行有效聚類[19]。SOM 模型由輸入層和可代表網(wǎng)格拓?fù)浣Y(jié)構(gòu)的輸出層組成,輸入(出)層由存放輸入(出)向量的神經(jīng)元組成,通常情況下,輸出神經(jīng)元以二維網(wǎng)格的形式排列,每一個輸入神經(jīng)元與每一個輸出神經(jīng)元間通過權(quán)值向量連接(圖1)[20]。
圖1 SOM模型結(jié)構(gòu)
在利用SOM 模型進(jìn)行聚類分析前,需明確距離度量方法,數(shù)據(jù)初始化、數(shù)據(jù)訓(xùn)練所采用的算法類型,確定SOM 模型的網(wǎng)絡(luò)尺寸、網(wǎng)格及映射類型、鄰域類型、訓(xùn)練次數(shù)等參數(shù)。實踐中一般使用歐氏距離作為距離度量方法,采用隨機(jī)初始化方法(random initialization)進(jìn)行數(shù)據(jù)初始化[21]。批量訓(xùn)練(batch training)算法中每次將所有數(shù)據(jù)向量輸入模型,順序訓(xùn)練(sequential training)算法中每次僅輸入一個數(shù)據(jù)向量[22],前者可節(jié)省計算時間,更適用于實際[21]。輸出層神經(jīng)元數(shù)量確定方法沒有統(tǒng)一的標(biāo)準(zhǔn):Melssen 等[23]認(rèn)為,輸出層神經(jīng)元數(shù)量應(yīng)大于所期望聚類組數(shù)的2 倍并遠(yuǎn)小于輸入數(shù)據(jù)的樣本數(shù);Lin等[24]認(rèn)為輸出層神經(jīng)元數(shù)量應(yīng)盡可能大以確保得到最大的分類;Abrahart等[25]及Parasuraman 等[26]采用反復(fù)試驗(trial and error)的方法選取輸出層神經(jīng)元數(shù)量;亦可根據(jù)樣本數(shù)量n采用公式m=5 n 確定輸出層神經(jīng)元數(shù)量m[22],并根據(jù)輸入數(shù)據(jù)協(xié)方差矩陣最大兩個特征值的比例確定網(wǎng)格的邊長比[27]。為便于可視化,網(wǎng)格類型(grid shape)一般采用六邊形(hexagonal),映射類型(map shape)一般定為片狀(sheet)[27]。在水資源領(lǐng)域使用SOM 模型時,一般選擇高斯(Gaussian)鄰域函數(shù)[15]。使用順序訓(xùn)練算法時,為使結(jié)果收斂,訓(xùn)練次數(shù)應(yīng)至少是輸出層神經(jīng)元數(shù)量的500倍[27]。本文利用mean quantization error(QE)與topographic error(TE)度量SOM模型的聚類效果,QE代表輸入向量與獲勝神經(jīng)元的平均距離,TE代表數(shù)據(jù)中第一獲勝神經(jīng)元與第二獲勝神經(jīng)元不相鄰的比例。QE和TE越小,說明SOM模型的運(yùn)算結(jié)果越好,但對于小尺寸網(wǎng)格TE并非決定性因素[28]。
2.2 K均值聚類法K均值聚類法是一種尋找輸入數(shù)據(jù)集中未知子類的無監(jiān)督學(xué)習(xí)方法,旨在將輸入數(shù)據(jù)劃分到指定數(shù)量的類中,使類內(nèi)差異盡可能小而類間差異盡可能大[29-30]。
K均值聚類法的算法步驟如下:(1)確定想要得到的輸入數(shù)據(jù)集的子類數(shù)K;(2)為每個輸入向量隨機(jī)分配一個1至K的編號作為該輸入向量的初始子類;(3)將各子類中輸入向量的均值向量作為相應(yīng)子類的類中心;(4)計算每個輸入向量與各子類類中心的距離,將每個輸入向量分配到距離其最近的類中心所在的子類中;(5)計算調(diào)整后新類的類中心,重復(fù)步驟(4),直至迭代結(jié)束或者子類類中心沒有任何變化[30]。K均值聚類法得到的可能是局部最優(yōu)解,所得結(jié)果依賴于步驟(2)中輸入向量的類別初始化情況,因此,必須多次運(yùn)行步驟(2)—(5),選擇一個最優(yōu)的情況[30]。
2.3 SOM-K法SOM模型具有自組織性,算法簡單,但SOM模型網(wǎng)絡(luò)收斂時間過長[31]。K均值聚類法效率較高,但聚類結(jié)果依賴于所選取的初始聚類中心,容易陷入局部最優(yōu)情況造成聚類效果不佳[31-32]。K均值聚類法處理噪聲數(shù)據(jù)的能力遜于SOM模型[33]。黃河徑流量與輸沙量數(shù)據(jù)變幅較大,變化規(guī)律十分復(fù)雜,為了取得較好的聚類效果,本文使用自組織映射-K均值聚類耦合方法,即SOM-K法進(jìn)行分析:將原始數(shù)據(jù)(矩陣尺寸n×b,n代表樣本數(shù)量,b代表特征個數(shù),考慮年徑流量及年輸沙量時b=2)輸入SOM模型得到輸出結(jié)果,該輸出結(jié)果(矩陣尺寸a×b,a為SOM模型輸出層神經(jīng)元數(shù)量)表示SOM模型對于原始數(shù)據(jù)矩陣的學(xué)習(xí)結(jié)果,將其作為K均值聚類法的輸入數(shù)據(jù)進(jìn)行訓(xùn)練,最終得到聚類結(jié)果。本文利用MATLAB SOM Toolbox 工具箱[34]實現(xiàn)SOM 模型,使用MATLAB R2017a 中的kmeans函數(shù)實現(xiàn)K均值聚類。
黃河發(fā)源于青藏高原巴顏喀拉山北麓,在山東省東營市墾利區(qū)流入渤海,全長約5464 km,流域面積約75萬km2[2](圖2)。以內(nèi)蒙古自治區(qū)托克托縣河口鎮(zhèn)與河南省滎陽市廣武鎮(zhèn)桃花峪為分界點將黃河分為上中下游三段。黃河上游長約3472 km,流域面積約占總流域面積的51.3%;中游長約1224 km,流域面積約占總流域面積的45.7%;下游長約768 km,流域面積約占總流域面積的3.0%[2]。
圖2 黃河流域示意圖
本文利用1919—2018 年及1987—2018 年黃河中游潼關(guān)站的年徑流量及年輸沙量數(shù)據(jù)(均為日歷年數(shù)據(jù),其中潼關(guān)2018年輸沙量包括1億多噸萬家寨等水庫排沙量,取為3.7億t),分別構(gòu)造水沙數(shù)據(jù)矩陣,矩陣維度分別為100行(即100年)2列(年徑流量,年輸沙量)及32行2列,基于SOM-K法進(jìn)行年尺度水沙組合類型分類。由于潼關(guān)站早期實測數(shù)據(jù)匱乏,1919—1951年采用陜縣站數(shù)據(jù)。年徑流量及年輸沙量數(shù)據(jù)單位不同,數(shù)量級上存在較大差異,故本文使用標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)標(biāo)準(zhǔn)化公式為:
式中:Xst為標(biāo)準(zhǔn)化后的數(shù)據(jù);為數(shù)據(jù)的平均值;σ為數(shù)據(jù)的標(biāo)準(zhǔn)差。
4.1 1919—2018年潼關(guān)站水沙組合分類將歐氏距離作為距離度量方法,選取隨機(jī)初始化方法、批量訓(xùn)練算法、六邊形網(wǎng)格形狀、片狀映射結(jié)構(gòu)、高斯鄰域函數(shù)配置SOM模型,訓(xùn)練次數(shù)選為輸出層神經(jīng)元數(shù)量的500倍。綜合多方面考慮,結(jié)合Melssen等提出的方法與反復(fù)試驗法確定輸出層神經(jīng)元數(shù)量。根據(jù)前人經(jīng)驗,黃河的水沙組合可分為沙多水多、沙多水中、沙多水少、沙中水多、沙中水中、沙中水少、沙少水多、沙少水中及沙少水少9類,故輸出層神經(jīng)元數(shù)量宜大于18;由于輸入數(shù)據(jù)樣本數(shù)較少,且“遠(yuǎn)小于”的概念較為模糊,本文認(rèn)為輸出層神經(jīng)元數(shù)量上限取為樣本數(shù)的1/2 即可。將輸出層最大邊長定為10,結(jié)合上述兩條原則,訓(xùn)練1919—2018年百年數(shù)據(jù)時共選取39組輸出層神經(jīng)元網(wǎng)格尺寸(表1)。每一種尺寸的SOM模型均進(jìn)行500次訓(xùn)練,選擇QE最小的一次結(jié)果作為各尺寸的最終結(jié)果。通過比較不同尺寸SOM模型的結(jié)果,將輸出層神經(jīng)元網(wǎng)格尺寸選為3×10,輸出層神經(jīng)元數(shù)量為30,該尺寸下500次訓(xùn)練的部分QE結(jié)果如表2所示(QE的最小值加粗表示)。
表1 輸出層神經(jīng)元網(wǎng)格尺寸(39組)
表2 部分試驗QE結(jié)果(輸出層神經(jīng)元網(wǎng)格尺寸:3×10)
SOM模型的可視化聚類結(jié)果如圖3所示,W代表徑流量,Ws代表輸沙量,TG代表潼關(guān)站,兩個3×10六邊形拓?fù)浣Y(jié)構(gòu)代表兩個變量的標(biāo)準(zhǔn)化值分布,標(biāo)準(zhǔn)化值越大,六邊形顏色越深。采用K均值聚類法將SOM模型的結(jié)果分為4大類,使用輪廓值(silhouette value)[35]評價聚類效果。輪廓值在-1到1之間,如果大多數(shù)輸入向量擁有較大的輪廓值,可以認(rèn)為聚類結(jié)果是合理的,如果大多數(shù)輸入向量擁有較小或者為負(fù)數(shù)的輪廓值,表明聚類不合理,分得的子類數(shù)目可能過多或過少[35]。本次聚類效果如圖4所示,大多數(shù)輸入向量擁有較大的輪廓值,將輸入數(shù)據(jù)集分為4個子類是合理的。
圖3 SOM模型可視化聚類結(jié)果(1919—2018年數(shù)據(jù))
圖4 聚類效果圖(1919—2018年數(shù)據(jù))
潼關(guān)站4個子類的年徑流量及年輸沙量分布如圖5所示,依據(jù)各子類的年徑流量均值及年輸沙量均值將4個子類依次命名為沙少水中類型、沙多水多類型、沙多水中類型及沙中水中類型,各水沙組合的年徑流量均值及年輸沙量均值如表3 所示。值得注意的是,水沙組合類型中的“多”、“中”,“少”并非絕對的概念,而是與研究時期有關(guān)的相對值。
圖5 潼關(guān)站4個子類的年徑流量及年輸沙量分布(1919—2018年數(shù)據(jù))
表3 潼關(guān)站4種類型的水沙均值及出現(xiàn)頻率(1919—2018年數(shù)據(jù))
4種類型的出現(xiàn)頻率如表3所示,沙少水中類型出現(xiàn)頻率最大,為42%,沙多水多類型出現(xiàn)頻率仍有20%。周恩來總理曾指出“水土保持是根治開發(fā)黃河的基礎(chǔ)”[36],據(jù)《黃河水土保持志》記載,黃河流域的水土保持群眾運(yùn)動在1958—1960年進(jìn)入高潮[37],張含英[38]認(rèn)為1960年是水土保持工作中具有決定意義的一年,劉瑞龍[39]在這一年提出必須大抓黃河中上游的水土保持工作,可以說1960年是水土保持工作達(dá)到高潮并具有重要意義的一年。劉家峽及龍羊峽水庫分別建成于1968年10月及1986年10月[40],龍劉水庫的修建使黃河干流的水沙條件發(fā)生不小的改變[41]。1998 年特大洪水后朱镕基總理提出要“封山植樹、退耕還林”[42],國務(wù)院發(fā)出緊急通知,2000 年前要對毀林開墾的林地實現(xiàn)全部還林[43]。劉家峽水庫為不完全年調(diào)節(jié)水庫,龍羊峽水庫雖為多年調(diào)節(jié)水庫改變了黃河上游的年際水量[44],但龍劉水庫聯(lián)合運(yùn)用主要影響徑流年內(nèi)分配,且黃河沙量主要來源于中游,潼關(guān)站年水沙量受龍劉水庫影響較小,故僅將1960 年及2000 年作為時間節(jié)點將1919—2018 年分為3 個階段:第1 階段為水土保持運(yùn)動達(dá)到高潮前(1919—1960 年);第2 階段為水土保持運(yùn)動達(dá)到高潮后至實施退耕還林前(1961—1999年);第3階段為實施退耕還林后(2000—2018年)。如表4所示,沙少水中類型主要在實施退耕還林后的時期出現(xiàn),在3 個階段中的出現(xiàn)頻率相對增加,這與現(xiàn)有認(rèn)識相符,說明本文方法可將水沙類型正確分類;沙多水多及沙多水中類型出現(xiàn)在實施退耕還林前的時期,在3 個階段中的出現(xiàn)頻率相對減少;沙中水中類型在3 個階段中的出現(xiàn)頻率先增后減。1986 年以來黃河年徑流量及年輸沙量大幅度減少[45],這一點亦可通過水沙組合分類結(jié)果看出:1986 年后潼關(guān)站有利于下游河道輸沙的大水類型的出現(xiàn)幾率明顯減少(表5)??紤]到黃河水沙條件在1986年后的顯著變化,需將1986 年后潼關(guān)站的年徑流量及輸沙量數(shù)據(jù)進(jìn)行單獨分類,以明確黃河水沙條件發(fā)生顯著變化后潼關(guān)站水沙組合類型的變化。
表4 4種類型在3個階段中的出現(xiàn)頻數(shù)(頻率)(1919—2018年數(shù)據(jù))
表5 1986年后4種類型分別出現(xiàn)的頻率
4.2 1987—2018年潼關(guān)站水沙組合分類將輸出層最大邊長定為10,訓(xùn)練1987—2018年的數(shù)據(jù)時共選取14組輸出層神經(jīng)元網(wǎng)格尺寸(表6)。每一種尺寸的SOM模型均進(jìn)行500次訓(xùn)練,選擇QE最小的一次結(jié)果作為各尺寸的最終結(jié)果。通過比較不同尺寸SOM模型的結(jié)果,將輸出層神經(jīng)元網(wǎng)格尺寸選為5×2,輸出層神經(jīng)元數(shù)量為10,該尺寸下500次訓(xùn)練的部分QE 結(jié)果如表7所示(QE 的最小值加粗表示)。
SOM模型的可視化聚類結(jié)果如圖6所示。采用K均值聚類法將SOM模型的結(jié)果分為2大類,本次聚類效果如圖7所示,大多數(shù)輸入向量擁有較大的輪廓值,將輸入數(shù)據(jù)集分為2個子類是合理的。
表6 輸出層神經(jīng)元網(wǎng)格尺寸(14組)
表7 部分試驗QE結(jié)果(輸出層神經(jīng)元網(wǎng)格尺寸:5×2)
圖6 SOM模型可視化聚類結(jié)果(1987—2018年數(shù)據(jù))
圖7 聚類效果圖(1987—2018年數(shù)據(jù))
潼關(guān)站2個子類的年徑流量及年輸沙量分布如圖8所示。同樣地,依據(jù)各子類的年徑流量均值及年輸沙量均值將2個子類分別命名為沙中水中類型及沙少水中類型,各類型的年徑流量均值及年輸沙量均值的出現(xiàn)頻率如表8所示。
采用4.1 節(jié)中的處理方法,將1987—2018 年根據(jù)時間節(jié)點2000 年分為1987—1999 年及2000—2018年2個階段,2種類型在2個階段中的出現(xiàn)頻數(shù)(頻率)如表9所示??梢钥闯?,沙中水中類型的出現(xiàn)頻率相對減少,沙少水中類型的出現(xiàn)頻率相對增加。
圖8 潼關(guān)站2個子類的年徑流量及年輸沙量分布(1987—2018年數(shù)據(jù))
表8 潼關(guān)站2種類型的水沙均值及出現(xiàn)頻率(1987—2018年數(shù)據(jù))
表9 2種類型在2個階段中的出現(xiàn)頻數(shù)(頻率)(1987—2018年數(shù)據(jù))
4.3 結(jié)果討論比較表4及表9的結(jié)果,發(fā)現(xiàn)使用1919—2018年百年數(shù)據(jù)分析時,沙中水中類型的出現(xiàn)頻率先增后減,而使用1987—2018年數(shù)據(jù)分析時,該類型的出現(xiàn)頻率相對減少。給出百年數(shù)據(jù)分析結(jié)果中4種類型在1919—1960年、1961—1986年、1987—1999年及2000—2018年中的出現(xiàn)頻數(shù)(頻率),如表10所示,沙中水中類型在1987—1999年及2000—2018年出現(xiàn)頻率相對減少,與表9結(jié)果相符,而在1919—1960年及1961—1986年出現(xiàn)頻率明顯增加,使得從百年尺度上看沙中水中類型的出現(xiàn)頻率先增后減。
表10 4種類型在各時期中的出現(xiàn)頻數(shù)(頻率)(1919—2018年數(shù)據(jù))
確定水利工程的設(shè)計及校核洪水時往往采用洪水頻率分析成果,目前我國選用皮爾遜Ⅲ型曲線作為未知的洪水總體頻率曲線線型[46],從而根據(jù)擬合曲線確定出設(shè)計洪水成果,例如將曲線上P=0.1%時的洪峰流量視為尚未發(fā)生過的千年一遇洪水洪峰流量。將水沙組合類型中出現(xiàn)頻率最大的一組水沙組合(最高頻水沙組合)下的徑流量及輸沙量視為水沙組合類型特征值,參考洪水頻率分析方法中使用頻率分析成果確定未發(fā)生過洪水的思路,認(rèn)為此特征值可能較接近未來實際情況。4.1節(jié)與4.2 節(jié)的分析表明,兩種時間尺度(1919—2018 年與1987—2018 年)下出現(xiàn)頻率最大的水沙組合類型(均為沙少水中類型)對應(yīng)的年徑流量均值及年輸沙量均值分別為249 億m3及5.3 億t 與211.2 億m3及3.1億t,此種差異產(chǎn)生的原因主要是時間尺度不同造成潛在分類閾值不同,即不同的時間尺度上對于黃河水沙豐度的衡量標(biāo)準(zhǔn)也是動態(tài)變化的。由王遠(yuǎn)見等學(xué)者的研究成果[47],黃河源區(qū)1959—2017年的年降雨量有顯著的增加趨勢,由靳少波等學(xué)者的研究成果[44],2007—2016年唐乃亥以上14站平均降雨量較1967—2016年多年均值增加6.2%,鑒于近些年降雨量有所增加的趨勢,綜合4.1節(jié)與4.2節(jié)結(jié)果,為留有一定安全余地,黃河中下游潼關(guān)以下河段年徑流量特征值宜選用1919—2018年分析成果,即249億m3。劉曉燕等學(xué)者的研究成果[48]表明,1980年代后,龍門、咸陽、張家山、河津及狀頭等水文斷面以上地區(qū)單位降雨產(chǎn)沙量(產(chǎn)沙強(qiáng)度)明顯降低,考慮到黃河流域通過水土保持措施使得沙量明顯減少且基本不會大幅度增加的事實,表明未來潼關(guān)以下自然狀況下,實際年輸沙量一般不會超過表9 與表10 中2000—2018 年階段沙少水中類型的年輸沙量均值2.4 億t。綜合兩節(jié)結(jié)果,黃河中下游潼關(guān)以下河段年輸沙量特征值選用1987—2018年分析成果即可,即3.1億t。此外,值得注意的是,1987年后沙中水中類型的出現(xiàn)頻率超過30%,為留有一定安全余地,如為在黃河中下游修建水庫時留出充足的淤積庫容,應(yīng)將沙中水中類型年輸沙量均值7.9 億t(約為8 億t)亦考慮在內(nèi),作為黃河干流修建大型工程及下游治理方案論證的沙量特征值。鑒于問題的復(fù)雜性,黃河中下游潼關(guān)以下河段水量和沙量特征值的確定有待進(jìn)一步深入研究。
本文利用自組織映射-K均值聚類耦合方法對黃河中游潼關(guān)水文站1919—2018年的年徑流量及年輸沙量數(shù)據(jù)進(jìn)行分析,將潼關(guān)站的水沙組合分為沙多水多、沙多水中、沙中水中及沙少水中4 種類型。沙少水中類型的出現(xiàn)頻率最大,為42%,沙多水多類型的出現(xiàn)頻率仍有20%。將研究時段分為水土保持運(yùn)動達(dá)到高潮前(1919—1960年)、水土保持運(yùn)動達(dá)到高潮后至實施退耕還林前(1961—1999年)及實施退耕還林后(2000—2018年)3個階段,發(fā)現(xiàn)沙少水中類型主要在實施退耕還林后的時期出現(xiàn),在3個階段中的出現(xiàn)頻率相對增加;沙多水多及沙多水中類型出現(xiàn)在實施退耕還林前的時期,在3個階段中的出現(xiàn)頻率相對減少;沙中水中類型在3個階段均有出現(xiàn),出現(xiàn)頻率先增后減。
考慮到近期黃河水沙條件的顯著變化,利用自組織映射-K 均值聚類耦合方法對1986 年后(1987—2018年)潼關(guān)站的年徑流量及年輸沙量數(shù)據(jù)進(jìn)行分析,將潼關(guān)站的水沙組合分為沙中水中及沙少水中2 種類型,沙少水中類型的出現(xiàn)頻率為65.625%。將研究時段分為1987—1999 年及2000—2018年2個階段,發(fā)現(xiàn)沙少水中類型出現(xiàn)頻率相對增加,沙中水中類型出現(xiàn)頻率相對減少,與百年分類結(jié)果的差異體現(xiàn)出黃河水沙變化的復(fù)雜性。
基于自組織映射-K均值聚類耦合方法的潼關(guān)站水沙組合分類可較好地反映出實測水沙特性,有助于深入了解黃河中下游水沙變化特點,潼關(guān)站水沙組合特征值亦可為黃河中下游水沙變化研究提供參考。