李晨濤
(遼寧省本溪水文局,遼寧 本溪 117000)
近些年來,受環(huán)境變化影響,中小河流突發(fā)洪水呈現(xiàn)逐年增多趨勢,產(chǎn)生災害的程度也越來越嚴重。本溪地區(qū)位于遼寧省東部,屬于典型的東部山區(qū),區(qū)域內(nèi)中小河流眾多,流域面積100km2和200km2以上的河流分別為12條和27條。本溪地區(qū)屬于遼寧省暴雨洪水易發(fā)區(qū),大部分中小河流位于無徑流觀測資料的區(qū)域,很難構建預報方案。為提高本溪地區(qū)中小河流預報能力,亟需對其預報斷面進行方案構建。當前,對于無資料地區(qū)中小河流研究也取得一定研究成果,這些成果大都通過有資料地區(qū)進行參數(shù)移植到無資料地區(qū),從而構建無資料地區(qū)預報方案,而采用的方法主要為相似流域法或者經(jīng)驗判定法,其中相似流域應用較多,但相似流域方法大都按照流域面積以及地理位置相近為原則,不能充分考慮流域下墊面特征或者水文特征對預報模型參數(shù)的影響,存在一定的局限。一些研究成果表明,對于無資料地區(qū)中小河流,綜合考慮流域下墊面特征和水文特征,可以有效提高無資料地區(qū)中小河流參數(shù)移植的精度。本文以充分反映中小河流洪水模擬特點的下墊面及水文特征的7個參數(shù)作為聚類指標,采用主成分聚類分析方法對本溪地區(qū)中小河流預報斷面進行參數(shù)移植,研究成果對于本溪及全省其他無資料地區(qū)中小河流洪水預報方案構建提供方法參考。
流域產(chǎn)匯流地形等參數(shù)具有較高的相關性,水量平衡方程及水文情勢受植被覆蓋影響也不能忽略。伊璇等通過對全國多個無資料地區(qū)進行徑流模擬試驗表明流域徑流影響指標主要為四類共計18個指標,分別為地形類包括流域面積、河流長度、流域比降、河網(wǎng)密度、流域形狀系數(shù);地勢類主要為流域的高程;水文特征類包括降水量、徑流深年均值;土地利用類主要包括農(nóng)業(yè)用地、林地、草地、水域的占比面積;土壤類型類主要包括沙土、粘土、壤土的占比。本文依據(jù)此成果首先選取以上18個指標,考慮到各指標之間的關聯(lián)度較多,不同指標之間的信息會有所重疊,一些變化規(guī)律有所掩蓋,需要降低聚類分析的維度?;诖吮疚慕Y合SCS降雨徑流模型,將流域地形、地勢、土地利用類型、土壤類型作為模型參數(shù),選取遼東地區(qū)南甸峪、二道河子等7個水文站點50場洪水數(shù)據(jù),以洪峰為目標,對選取的18個水文地理指標進行敏感度分析,敏感度分析成果可詳見參考文獻[17]。通過敏感度分析,對于遼東地區(qū)而言,河流長度、匯水面積、河流坡度、流域形態(tài)、植被覆蓋度、降水量及徑流深年平均值7個指標對于區(qū)域洪峰影響較為敏感,而其他11個指標敏感度較低,甚至不敏感。本文在進行遼東地區(qū)參數(shù)移植聚類指標分析時,以上述7個指標進行聚類分析。
主成分分析方法在大量的信息數(shù)據(jù)中通過方差解釋來確定主成分分析向量,將原有數(shù)據(jù)的高維投影數(shù)據(jù)進行降維處理后得到特殊的數(shù)組矩陣,從而使得原有數(shù)據(jù)信息得到較為有效的保留,從而對數(shù)據(jù)信息進行更便捷的處理和使用,這其中需要對原有參數(shù)的主要信息進行有效提取,從而降低分析的指標個數(shù),從主要關聯(lián)度進行變量的提取后,降低參數(shù)分析的空間維數(shù)。
數(shù)據(jù)挖掘是聚類分析的主要方法,將多個數(shù)據(jù)按照相似度進行數(shù)據(jù)對象的分類,從而得到具有一定差異度的數(shù)據(jù)分類,主要步驟為:
(1)對于分析的各變量聚類指標而言,對于其維度空間P對應下的n個聚類指標,可以采用不同聚類指標之間的關聯(lián)度進行分析,其關聯(lián)度一般采用數(shù)學距離方法或者絕對值方法進行判定,其各聚類指標之間的變異度本文主要采用歐氏距離方法進行判定。
(2)對于距離判定較為接近的2類聚類指標進行合并成為一類指標,本文對各類指標進行平均法計算。
(3)計算各類指標與合并后的新的聚類指標的歐氏距離值,將距離最短的兩類指標進行重新合并,若聚類指標合并為一類,則表示聚類計算結束,重新返回到第二個步驟進行聚類指標之間的歐氏距離計算。
本溪市地處遼東山丘區(qū)。山多地少,呈現(xiàn)“八山一水一分田”的地貌格局,地勢西北低,東南高并向中部傾斜。流域內(nèi)屬溫帶氣候,受季風影響較重,冬夏氣候分明。平均氣溫6~8℃,最高氣溫35~38.0℃,最低氣溫-29.2~-37.9℃。降雨量充沛,最大年降水量為1172.9mm,最小年降水量為503.5mm,年平均降水量為750~850mm。降水年內(nèi)分配不均勻,暴雨多集中在七、八兩月,降水量約占全年降水量的70~80%,七、八兩月受副熱帶高壓影響,常有臺風雨,易造成泥石流。流域內(nèi)全年平均降水天數(shù)為80~120天,由于降雨時空分布的差異性,本溪地區(qū)發(fā)生洪澇的頻次較高。
基于本溪地區(qū)中小河流站點水文地理特征數(shù)據(jù),對區(qū)域區(qū)主要中小河流站點的下墊面特征以及水文特征進行提取,提取結果見表1。
采用本溪地區(qū)具有長系列觀測數(shù)據(jù)的參考水文站和新建中小河流站點進行各指標的聚類分析,對各聚類指標進行關聯(lián)度的計算,其關聯(lián)度計算結果見表2。從表中可看出,各聚類指標之間存在一定的關聯(lián)度,年徑流深均值和年降水均值之間的關聯(lián)度最大,且兩個指標與森林率之間具有較高的關聯(lián)度,關聯(lián)系數(shù)均高于0.6。
表2 相關系數(shù)矩陣分析結果
對聚類指標進行主成分貢獻率累積值的計算,當兩個主成分方差累積貢獻率高于1.0,則認為為聚類指標的主成分,各主成分累積方差貢獻率高于1 的荷載矩陣分析結果見表3。各聚類指標主成分與初始值之間的關聯(lián)度可以通過荷載矩陣指標值進行分析,聚類指標的主成分主要表征各聚類指標的影響度。通過分析對于本溪地區(qū)聚類指標而言,對第二個主成分影響程度較高的是河長特征指標。
表3 主成分荷載矩陣分析結果
基于各站點主成分聚類分析值,可以對樣本序列進行重聚類分析計算,從而得到各聚類指標之間的關聯(lián)結構,通過分析可以將本溪地區(qū)各中小河流站點和其對應的參考站點劃分為6個聚類組,各組內(nèi)對應的參考站和中小河流站點見表4。
表4 本溪地區(qū)參照站與中小河流站對應表
(續(xù)表)
從對應分聚類分組結構可看出,在同一個聚類分組內(nèi)的站點有相近的地理位置,也有個別站點具有較遠的地理位置,在地理位置的相似度較低。而分組內(nèi)的三道河站和偏嶺站具有較為接近的地理位置,而統(tǒng)一分組內(nèi)的孟柳站則距離二道河子站和偏嶺站的地理位置較遠。
由于本溪站中小河流大都處于無徑流觀測資料的區(qū)域,且建站以來具有完成洪水測次的站點較少,對采用主成分聚類方法進行參數(shù)移值進行驗證,需要兩個有實測洪水數(shù)據(jù)的站點進行參數(shù)移植驗證。按照聚類相似分組情況,南甸峪站和橋頭站在同一個相似組,且橋頭站已有預報方案,因此將橋頭站的參數(shù)移植到南甸峪站,結合南甸峪站實測洪水數(shù)據(jù)選用新安江模型進行參數(shù)移值方法的驗證。
南甸峪水文站位于本溪縣南甸鎮(zhèn)小峪村,東經(jīng)124°24′,北緯41°16′,始建于1958年1月,集水面積765km2,為區(qū)域代表站,國家基本站。南甸站流域內(nèi)設有雨量站4處,分別是羊胡子溝、南孤山、林場、南甸雨量站。站點分布如圖1所示。
圖1 南甸峪站流域內(nèi)站點分布
本溪地區(qū)實用洪水預報方案中橋頭站采用新安江模型進行預報方案的構建,將橋頭站已率定好的新安江模型參數(shù)移值到南甸峪水文站,模型參數(shù)見表5。
表5 模型參數(shù)移值結果
在模型參數(shù)移值的基礎上,采用南甸站11場次洪水進行模型驗證,模型產(chǎn)匯流計算結果見表6和表7。模型產(chǎn)流和匯流按照GB/T 22482—2008《水文情報預報規(guī)范》其合格率可分別達到91%和73%。
表6 南甸峪水文站產(chǎn)流模擬結果
表7 南甸峪水文站匯流模擬結果
參數(shù)移值后南甸峪水文站以上流域各場次洪水徑流量誤差除個別場次洪水外,總體可低于15%,產(chǎn)流計算精度較高,尤其對于降雨強度較高,過程雨量較大的場次洪水其產(chǎn)流模擬誤差較低,而對于前期影響雨量較高且過程降水量較小的場次洪水,其產(chǎn)流模擬誤差相對較大,而對于“20010728”場次洪水而言,通過調(diào)查該場次洪水由于人類活動影響使得其產(chǎn)流量實際值有所偏低。
從匯流模擬結果來看,除個別場次洪水外,南甸峪水文站以上流域在進行參數(shù)移值后其匯流模擬精度也較高,峰現(xiàn)時間以及洪峰流量模擬值和實際值之間的誤差均在水文情報預報規(guī)范的誤差允許范圍內(nèi),尤其對場次洪水的洪峰流量具有較高的模擬精度,整體的平均確定性系數(shù)模擬精度較高。對于“19730716”場次洪水,通過降雨資料可以看出降雨中心區(qū)域首先在南甸水文站下游,然后才轉(zhuǎn)移到南甸水文站上游,降雨分布在時間上和空間上都不均勻,這就導致了實際洪峰出現(xiàn)時間較模擬洪峰出現(xiàn)時間較早,使得參數(shù)移值后模型模擬擬合度較低。
(1)通過主成分聚類方法對流域下墊面和水文特征指標進行特征值的分析和處理,從而確定參考站和中小河流站點的相似分組,該方法可綜合考慮流域許多指標之間的相關性,使得參數(shù)移值更為科學,可推廣和應用于構建無資料地區(qū)中小河流預報方案。
(2)對于無徑流觀測資料的中小河流站點其年徑流深指標值可通過區(qū)域徑流系數(shù)等值線圖,結合年降水量進行分析得到。年徑流深、年降水量、森林率、流域面積具有較高的關聯(lián)度,聚類分組內(nèi)的站點空間屬性具有差異性。
(3)無資料地區(qū)參數(shù)移值后洪水和模擬的精度受流域?qū)傩灾笜诉x取的直接影響,因此其流域特征指標的分層分類還有待研究,尤其是各指標與模型參數(shù)之間的響應機理還要深入分析,從而建立一套可以在全流域參數(shù)移值聚類指標選取的標準體系。