魏光輝
(新疆塔里木河流域管理局,新疆 庫爾勒 841000)
?
基于主成分與聚類分析的水面蒸發(fā)影響因素分類
——以新疆塔中地區(qū)為例
魏光輝
(新疆塔里木河流域管理局,新疆 庫爾勒841000)
摘要:以新疆塔中氣象站2013年逐日氣象觀測資料為例,采用主成分與聚類分析方法對研究區(qū)冰期與非冰期水面蒸發(fā)影響因素進行分類與機理闡述.結(jié)果表明主成分與聚類分析的水面蒸發(fā)影響因素分類結(jié)果完全一致,據(jù)此認為在不同冰期情況下,溫度都是影響水面蒸發(fā)的主要因素.
關(guān)鍵詞:水面蒸發(fā);水資源配置;主成分分析;聚類分析;塔里木盆地
0引言
陸面蒸散是陸面水量平衡計算的一個重要參數(shù),也是地球水分消耗的主要方式[1].其與地表植被性態(tài)、土壤環(huán)境及微氣象條件等因素密切相關(guān),時空差異性較大.此外,陸面蒸散也是干旱、沙塵暴等氣象災害的誘因之一[2,3],其對區(qū)域水資源合理配置[4]、農(nóng)業(yè)灌溉制度制定等也有重要影響[5,6].
目前,國內(nèi)外學者已對蒸散問題進行了大量研究,并取得了一些卓有成效的工作[7-9].其研究方法主要是根據(jù)彭曼法、蒸發(fā)皿法、蒸滲計法及衛(wèi)星遙感等來估算蒸散量.在大尺度、長時間系列情況下一般采用彭曼法來計算[10].當然,也有根據(jù)蒸發(fā)皿實測數(shù)據(jù)分析蒸散量的時空變化及其對氣候的響應[11].
塔里木盆地位于我國的新疆南疆地區(qū),世界第二大流動沙漠塔克拉瑪干沙漠坐落于盆地中心.這里氣候干燥、降水稀少,是我國的極端干旱區(qū),當?shù)厝祟惢顒又饕性谂璧剡吘壍牧阈蔷G洲內(nèi),而地處塔里木盆地腹地的塔中地區(qū),迄今為止有關(guān)水面蒸發(fā)與氣象要素的關(guān)系研究鮮見報道.鑒于此,本文利用目前世界唯一深入流動沙漠腹地200 km以上的新疆塔中氣象站冰期與非結(jié)冰期日水面蒸發(fā)氣象數(shù)據(jù),利用主成分與聚類分析方法,分析各氣象要素對水面蒸發(fā)的影響,并從機理上對其進行闡述,得到了一些有價值的研究成果.
1資料與方法
1.1研究區(qū)概況
塔中地區(qū)位于塔克拉瑪干沙漠腹地,具有高溫干燥、降水稀少、植被稀少、沙源豐富的特點.多年平均氣溫13.6 ℃,極端最高氣溫為46.0 ℃,極端最低氣溫為-25.0 ℃.多年平均降水量25.9 mm,主要集中于春、夏季,約占全年降水量90%左右.年均蒸發(fā)量為3 812.3 mm(Φ20小型蒸發(fā)皿觀測數(shù)據(jù)),風沙活動頻繁,風能資源豐富.
1.2數(shù)據(jù)資料
本文資料數(shù)據(jù)來自于中國氣象數(shù)據(jù)共享服務(wù)網(wǎng).選取新疆塔中氣象站(39°00′N,83°40′E,海拔高度1 099.3 m)2013年1月至12月的日均氣溫、日均地表溫度、日均水汽壓、日均大氣壓、日均相對濕度、日平均風速、日照時數(shù)以及日蒸發(fā)量(Φ20小型蒸發(fā)皿)等共計12個氣象要素,進行研究分析.
1.3主成分分析
主成分分析[12](Principal Component Analysis,簡稱PCA)為多元統(tǒng)計方法,其利用降維思想,可將多指標數(shù)據(jù)轉(zhuǎn)化為綜合指標數(shù)據(jù),并最大限度保留原始數(shù)據(jù)所蘊含的信息,其原理如下:
(1)假設(shè)有n個樣本,p項指標,則構(gòu)建評價矩陣X=(xij)n×p.
(2)為消除評價矩陣的量綱差異性,對數(shù)據(jù)進行歸一化處理:
(1)
(3)計算評價指標間的相關(guān)系數(shù)R=(rij)n×n,求解特征值λi(i=1,2,…,p),并按大小順序排序,之后計算特征值λi的對應特征向量ei(i=1,2,…,p),且‖ei‖=1.
1.4聚類分析
聚類分析(ClusterAnalysis,簡稱CA)屬于多變量統(tǒng)計分析方法,它能夠?qū)⒛撑螛颖緮?shù)據(jù)按照自身性質(zhì),根據(jù)某一評價標準進行自動分類.層次聚類分析法(HierarchicalClusterAnalysisMethods)屬于聚類分析的改進方法,其基本思想是:先將樣本總體看成一類,之后規(guī)定各樣本間的距離和類與類間的距離.初始狀態(tài)下,各樣本自成一類,類間距離與樣本距離一致,選擇距離最小的一對合并成一個新類,計算新類和其他類的距離,之后反復如此,直至所有樣本合為一類[13].
2模型計算與分析
(1)非冰期(4月至10月).選取日均氣溫(x1,℃)、日最高氣溫(x2,℃)、日最低氣溫(x3,℃)、日均地表溫度(x4,℃)、日均水汽壓(x5,hPa)、日均大氣壓(x6,hPa)、日均相對濕度(x7,%)、日總云量(x8,成)、日低云量(x9,成)、日均風速(x10,m/s)與日照時數(shù)(x11,h)這11類氣象因素為分析對象,模型樣本數(shù)為214組.
(2)冰期(1月、3月、11月及12月).選取日均氣溫(x1,℃)、日最高氣溫(x2,℃)、日最低氣溫(x3,℃)、日均地表溫度(x4,℃)、日均水汽壓(x5,hPa)、日均大氣壓(x6,hPa)、日均相對濕度(x7,%)、日總云量(x8,成)、日低云量(x9,成)、日均風速(x10,m/s)與日照時數(shù)(x11,h)這11類氣象因素為分析對象,模型樣本數(shù)為151組.
上述各氣象因素的日統(tǒng)計值由于篇幅所限,未在此列出.
2.1非冰期水面蒸發(fā)分析
(1)主成分分析
根據(jù)式(1)對評價樣本進行歸一化處理,計算得到氣象因素的相關(guān)系數(shù)矩陣(見表1).
由表1的相關(guān)系數(shù)計算結(jié)果可知,除日總云量(x8)、日低云量(x9)與日照時數(shù)(x11)這3因素外,其他氣象因素與水面蒸發(fā)的相關(guān)系數(shù)均達到了極顯著水平.
主成分特征值及累計貢獻率(見表2),由表2確定主成分個數(shù)為4.
根據(jù)確定的主成分個數(shù),采用方差極大正交法得到主成分荷載(見表3).
表1 相關(guān)系數(shù)矩陣(非冰期)
注: 左下角為相關(guān)系數(shù),右上角為顯著性;相關(guān)系數(shù)臨界值,a=0.05時,r=0.134 2;a=0.01時,r=0.175 7;表中字母y代表蒸發(fā)量.
表2 特征值及累計貢獻率(非冰期)
表3 主成分荷載值(非冰期)
由表3可知,第一主成分主要是溫度與大氣壓的綜合指標,它包含了日均氣溫、日最高氣溫、日最低氣溫、日均地表溫度與日均大氣壓這五個因素,解釋了總變量46.8%的信息;第二主成分主要是云量的綜合指標,它解釋了總變量21.5%的信息;第三主成分主要是空氣濕度指標,它包含了日均水汽壓與日均相對濕度這兩個因素,解釋了總變量11.8%的信息;第四主成分為風速、日照的綜合指標,它解釋了總變量10%的信息.上述4個主成分包含原始數(shù)據(jù)指標信息的90.1%(累計貢獻率).
對各指標進行KMO檢驗,其值為0.727 7,Bartlett球形檢驗的相伴概率遠小于顯著性水平0.01,故樣本適合因子分析.
(2)聚類分析
將選取的11個氣象因素數(shù)據(jù)組成聚類分析的樣本矩陣,采用類平均法進行聚類分析.本文采用SPSS13統(tǒng)計軟件實現(xiàn)聚類分析,并得到聚類分析譜系圖.結(jié)果(見圖1)(圖1中,縱軸中的阿拉伯數(shù)字1代表日均氣溫,2代表日最高氣溫,3代表日最低氣溫,4代表日均地表溫度,5代表日均水汽壓,6代表日均大氣壓,7代表日均相對濕度,8代表日總云量,9代表日低云量,10代表日均風速,11代表日照時數(shù);橫軸表示類之間的平均距離,無量綱).
圖1 水面蒸發(fā)氣象因素聚類(非冰期)
從圖1可知,取類間距離d=1.22時,水面蒸發(fā)因素可分為兩類,但此時有的類間距離太大,所以取d=0.81,分為四類比較合適,即日均氣溫、日最高氣溫、日最低氣溫、日均地表溫度與日均大氣壓這五個氣象因素為一類,日均水汽壓與日均相對濕度為一類,日總云量與日低云量這兩個氣象因素為一類,日均風速與日照時數(shù)這兩個氣象因素為一類.
聚類分析將影響水面蒸發(fā)的11個氣象因素分為4類,這與主成分分析計算結(jié)果完全一致.
2.2冰期水面蒸發(fā)計算
(1)主成分分析
同理,計算得到各氣象因素的相關(guān)系數(shù)矩陣(見表4).
表4 相關(guān)系數(shù)矩陣(冰期)
注:左下角為相關(guān)系數(shù) ,右上角為顯著性 ;相關(guān)系數(shù)臨界值,a=0.05時 ,r=0.160;a=0.01時 ,r=0.209;表中字母 y代表蒸發(fā)量因素.
由表4的相關(guān)系數(shù)計算結(jié)果可知,除日低云量(x9)與日照時數(shù)(x11)這2因素外,其他氣象因素與水面蒸發(fā)的相關(guān)系數(shù)均達到了極顯著水平.
主成分特征值及累計貢獻率(見表5),由表5最終確定主成分個數(shù)為5.
根據(jù)確定的主成分個數(shù),采用方差極大正交法求得主成分荷載(見表6).
表5 特征值及累計貢獻率(冰期)
表6 主成分荷載(冰期)
由表6可知,第一主成分主要是溫度、水汽壓與風速的綜合指標,它包含了日均氣溫、日最高氣溫、日最低氣溫、日均地表溫度、日均水汽壓與日均風速這6個因素,解釋了總變量52.6%的信息;第二主成分主要是大氣壓與濕度的綜合指標,它解釋了總變量17.1%的信息;第三主成分主要是太陽輻射指標,它包含了日照時數(shù)這個因素,解釋了總變量9.5%的信息;第四主成分主要是總云量指標,它解釋了總變量6.8%的信息;第五主成分主要是低云量的描述指標,它解釋了總變量5.4%的信息.這5個主成分共計包含原始數(shù)據(jù)指標信息的91.4%(累計貢獻率).
對各指標進行KMO檢驗,其值為0.775 9,Bartlett球形檢驗的相伴概率遠小于顯著性水平0.01,故適合進行因子分析.
(2)聚類分析
同理,采用類平均法進行冰期水面蒸發(fā)聚類分析,結(jié)果(見圖2).圖2中各指標含義同圖1.
圖2 影響水面蒸發(fā)的氣象因素聚類(冰期)
從圖2可以看出,取類間距離d=4.55時,水面蒸發(fā)因素可分為兩類,但此時有的類間距離太大,所以取d=3.0,分為五類比較合適,即日均氣溫、日最高氣溫、日最低氣溫、日均地表溫度、日均水汽壓與日均風速這6個氣象因素為一類,日均大氣壓與日均相對濕度這兩個氣象因素為一類,日總云量與日低云量這2個氣象因素各為一類,日照時數(shù)為一類.
聚類分析結(jié)果將影響水面蒸發(fā)的11種氣象要素分為5大類,這同樣與主成分分析結(jié)果一致,充分說明了主成分分析的正確性,也實現(xiàn)了方法的檢驗.
2.3水面蒸發(fā)影響因素機理分析
由以上分析可知:在非冰期,水面蒸發(fā)主要受溫度因素(包括日均氣溫、日最高氣溫、日最低氣溫、日均地表溫度4項指標,下同)、大氣壓與云量(總云量與日低云量)這3因素的影響;在冰期,主要受溫度因素、日均水汽壓與日均風速這三因素的影響.兩種情況下,溫度因素都是影響水面蒸發(fā)的主要因素,這與文獻[14]的研究一致.
由于溫度決定著水體表面的水汽擴散速度;云量的多少直接影響著水體接收太陽輻射的大小及大氣溫度的高低,云量大則水面蒸發(fā)弱;水體表面的水汽壓越大,則水汽擴散交換速率就會越小,蒸發(fā)則弱;風速大,水體表面干濕空氣交換就會越快,水面蒸發(fā)就會越大[15].
3結(jié)論
本文以新疆塔中氣象站觀測數(shù)據(jù)為例,將主成分與聚類分析應用于冰期與非冰期水面蒸發(fā)影響因素分類研究中,主要取得了以下結(jié)論:
(1)主成分分析中:非冰期所提取的4個主成分包含原有11個氣象數(shù)據(jù)的90.1%信息,滿足分析精度要求;冰期提取的5個主成分包含原有11個氣象指標的91.4%信息,同樣滿足分析精度要求.
(2)在聚類分析中:非冰期各氣象要素對水面蒸發(fā)的影響可以歸并為4類:日均氣溫、日最高氣溫、日最低氣溫、日均地表溫度與日均大氣壓這五個氣象因素為一類,日均水汽壓與日均相對濕度這兩個氣象因素為一類,日總云量與日低云量這兩個氣象因素為一類,日均風速與日照時數(shù)這兩個氣象因素為一類;冰期各氣象要素對水面蒸發(fā)的影響可以歸并為5類,即日均氣溫、日最高氣溫、日最低氣溫、日均地表溫度、日均水汽壓與日均風速這六個氣象因素為一類,日均大氣壓與日均相對濕度這兩個氣象因素為一類,日總云量為一類,日低云量為一類,日照時數(shù)為一類.
(3)不同冰期情況下,溫度因素都是影響水面蒸發(fā)的主要因素.
參考文獻:
[1]閆桂霞,李登華.1961—2006年我國水面蒸發(fā)時空變化特征分析[J].水電能源科學,2015(10):1-5.
[2]唐凱,姜海波,何新林.干旱區(qū)水面蒸發(fā)特性及消減技術(shù)研究[J].水資源與水工程學報,2014(6):68-71.
[3]趙曉松,李梅,王仕剛.鄱陽湖夏季水面蒸發(fā)與蒸發(fā)皿蒸發(fā)的比較[J].湖泊科學,2015(2):343-351.
[4]仇寶云,王斐.水面蒸發(fā)對南水北調(diào)江蘇段調(diào)水效率的影響[J].排灌機械工程學報,2011(3):219-223.
[5]葛建坤,李佳,羅金耀.基于水面蒸發(fā)法的日光溫室膜下滴灌番茄需水量計算模型[J].灌溉排水學報,2015(8):53-56.
[6]UZOKWEPAULINE,李新強,高陽.不同灌水方式下基于水面蒸發(fā)量的夏玉米灌溉試驗研究[J].灌溉排水學報,2013(3):59-62.
[7]童新,劉廷璽,楊大文.半干旱沙地-草甸區(qū)水面蒸發(fā)模擬及其影響因子辨識[J].干旱區(qū)地理,2015(1):10-17.
[8]柯珂,金曉媚,高萌萌.以改進SEBS模型估算蘇木吉林南湖的水面蒸發(fā)[J].中國沙漠,2015(1):233-239.
[9]魏光輝,陳亮亮,董新光.基于熵值與關(guān)聯(lián)分析法的塔里木河下游區(qū)域水面蒸發(fā)影響因子敏感性研究[J].沙漠與綠洲氣象,2014,8(1):66-69.
[10]王振英.天山西部地區(qū)水面蒸發(fā)量計算模型研究[J].南水北調(diào)與水利科技,2013(6):30-34,38.
[11]魏素潔,余維.水面蒸發(fā)及其影響因子的原位對比觀測實驗分析[J].人民長江,2013(1):10-13,41.
[12]陳亮亮,魏光輝.新疆瑪納斯灌區(qū)水面蒸發(fā)量主成分分析[J].沙漠與綠洲氣象2009,3(3):49-51.
[13]張堯庭,方開泰.多元統(tǒng)計分析引論[M].北京:科學出版社,2003.
[14]魏光輝,王勇,申蓮.庫尉地區(qū)氣象要素對水面蒸發(fā)量影響程度的灰關(guān)聯(lián)分析[J].沙漠與綠洲氣象,2007,1(3):18-20.
[15]孫鳳賢,劉昌宇,夏新林.太陽輻照對靜止水面穩(wěn)態(tài)蒸發(fā)的影響[J].計算物理,2014(6):699-705.
Classification of Influential Factors on Water Surface Evaporation Based on PCA and HCA Methods—Taking Tazhong as an Example
WEI Guang-hui
(Xinjiang Tarim River Basin Management Bureau, Korla 841000, China)
Abstract:Water surface evaporation is an important factor in the water balance calculation, which also has an important influence on regional water resources allocation and development of crop irrigation system. The paper takes daily meteorological data of Tazhong Meteorological Station in 2013 as an example, the principal component analysis and cluster analysis method are used to classify the influencing factors of glacial and non-glacial period, and from the mechanism of classification index carries on the elaboration. The results showed that: the temperature was the main factors affected water surface evaporation during the different periods. The main factors were the same as the effect factors of water surface evaporation in the cluster analysis and principal component analysis. The results provide a reference for the mechanism of water evaporation in arid desert area.
Key words:water surface evaporation; water resources allocation; principal component regression; cluster analysis; Tarim basin
收稿日期:2016-01-25
基金項目:國家自然科學基金資助項目(51369030);新疆水文學及水資源重點學科資助(XJSWSZYZDXK20101202).
作者簡介:魏光輝(1981-),男,新疆石河子人,高級工程師,博士,主要從事干旱區(qū)水資源利用研究.
中圖分類號:TV211
文獻標志碼:A
文章編號:1008-536X(2016)04-0042-06