• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      主成分分析與聚類分析在青島夏季氣溫變化研究中的應(yīng)用

      2014-09-09 07:42:55屈家安曹杰
      大氣科學(xué)學(xué)報(bào) 2014年4期
      關(guān)鍵詞:距平平均氣溫協(xié)方差

      屈家安,曹杰

      (南京信息工程大學(xué),江蘇 南京 210044)

      主成分分析與聚類分析在青島夏季氣溫變化研究中的應(yīng)用

      屈家安,曹杰

      (南京信息工程大學(xué),江蘇 南京 210044)

      選用青島站1951—2010年每年 6—8月各月平均氣溫資料,通過SAS軟件進(jìn)行了主成分分析和聚類分析,分析了近60 a夏季氣溫的年際氣候變化。主成分分析的結(jié)果表明,第一主成分反映青島夏季氣溫距平,其正(負(fù))方向反映夏季氣溫的正(負(fù))距平,其強(qiáng)度反映氣溫偏高(低)的程度;第二主成分則反映同一年內(nèi)夏季各月間氣溫的差異,其絕對(duì)值越大,表示各月氣溫差異越大。聚類分析的結(jié)果表明,青島站夏季月平均氣溫的變化可以分為3類:1)6月、7月氣溫較低,在8月升溫;2)7月平均氣溫最高,6月、8月相對(duì)較低;3)6月氣溫低,7、8兩月氣溫較高。其中1993、2003年為第一類,2005年為第二類,其余為第三類。

      主成分分析;聚類分析;SAS軟件;氣象應(yīng)用

      0 引言

      多元統(tǒng)計(jì)分析在我國(guó)氣象業(yè)務(wù)預(yù)報(bào)和科研工作中起著重要的作用,特別是在數(shù)值預(yù)報(bào)產(chǎn)品的統(tǒng)計(jì)使用及中長(zhǎng)期預(yù)報(bào)業(yè)務(wù)中,統(tǒng)計(jì)方法更是扮演著一個(gè)重要的角色,多元統(tǒng)計(jì)分析中的主成分分析和聚類分析等也是氣象預(yù)報(bào)和分析不可缺少的工具(謝炯光等,2003)。主成分分析方法是在一組變量中找出其方差和協(xié)方差矩陣的特征量,把多個(gè)變量通過降維的方法轉(zhuǎn)化為少數(shù)幾個(gè)綜合變量的統(tǒng)計(jì)分析方法(Moshonas and Shaw,1997;Korre,1999;高吉喜等,2006),可以找出幾個(gè)綜合因子來代表原來眾多的氣象要素,避免了各個(gè)氣象因子間存在交叉重疊信息,從而達(dá)到簡(jiǎn)化的目的(尹云鶴等,2009;李宗省等,2010;王少鵬等,2010)。聚類分析方法是指將物理或抽象對(duì)象的集合分組成為由類似對(duì)象組成的多個(gè)類的方法,在氣象數(shù)據(jù)獲取、處理和應(yīng)用流程中運(yùn)用聚類分析方法,可發(fā)現(xiàn)其中具有內(nèi)在聯(lián)系的規(guī)則或模式,為科學(xué)決策提供更好的服務(wù)(Bock,1985)。

      近年來,計(jì)算機(jī)技術(shù)的發(fā)展促進(jìn)了社會(huì)的信息化進(jìn)程,也促進(jìn)了多元統(tǒng)計(jì)方法的軟件化進(jìn)程,各種統(tǒng)計(jì)分析軟件的出現(xiàn)使氣象科研和預(yù)報(bào)人員處理大量數(shù)據(jù)變得得心應(yīng)手,極大地提高了工作效率。SAS(statistical analysis system)軟件系統(tǒng)是大型集成應(yīng)用系統(tǒng),功能齊全而且強(qiáng)大,具有完備的數(shù)據(jù)訪問、數(shù)據(jù)管理、數(shù)據(jù)分析、報(bào)告編制和數(shù)據(jù)呈現(xiàn)功能,不僅在統(tǒng)計(jì)分析、時(shí)間序列分析、運(yùn)籌決策上功能強(qiáng)大,并可將各種數(shù)據(jù)以靈活多樣的各種報(bào)表、圖形和三維透視的形式直觀地表現(xiàn)出來,而且在數(shù)據(jù)的處理上也顯示了比較強(qiáng)的優(yōu)勢(shì)(李夠霞,2002)。本文使用SAS軟件對(duì)青島地區(qū)近60 a氣溫進(jìn)行主成分分析和聚類分析。

      氣候變暖是當(dāng)前國(guó)內(nèi)外科學(xué)研究及全球媒體關(guān)注的熱點(diǎn)問題(易湘生等,2011)。但眾多研究表明,全球氣溫變化在不同區(qū)域存在著明顯的區(qū)域差異(理查德和迪安,2001;于秀林和任雪松,2003;張堯庭和方開泰,2003;陳效逑等,2009)。青島是中國(guó)最早開展氣象觀測(cè)的站點(diǎn)之一,氣溫序列是連續(xù)的。青島的氣溫?cái)?shù)據(jù)能夠真實(shí)地反映青島地區(qū)的升溫情況,對(duì)山東乃至華東和華北地區(qū)都有很好的借鑒意義。另外,青島是中國(guó)經(jīng)濟(jì)發(fā)達(dá)城市,在東部沿海具有代表性,其氣候變遷和氣溫變化對(duì)其旅游經(jīng)濟(jì)具有一定的影響,因此,研究青島氣溫的變化有著較高的現(xiàn)實(shí)意義(龐華基等,2007)。

      1 資料與方法

      選用青島站1951—2010年共60 a 6—8月各月平均氣溫資料。資料來自國(guó)家氣候中心氣候系統(tǒng)診斷預(yù)測(cè)室提供的全國(guó)160站月氣溫和降水資料。

      1.1 主成分分析

      主成分分析是通過構(gòu)造原變量的線性組合,產(chǎn)生一系列互不相關(guān)的新變量,從中選出少數(shù)幾個(gè)新變量使他們含有盡可能多的原變量信息,從而以較少新變量代替原來較多變量,消除信息冗余,實(shí)現(xiàn)模型的簡(jiǎn)化(曹彥龍等,2007;張旋等,2010)。主成分分析也可以實(shí)現(xiàn)計(jì)算原變量的重要性系數(shù)進(jìn)行排序,達(dá)到篩選變量降低模型維數(shù)的目的(張建偉等,2011)。主成分分析的數(shù)學(xué)模型(吳誠(chéng)鷗和秦偉良,2007)是:對(duì)于隨機(jī)向量X,選一些常數(shù)向量ci,用ci′X盡可能多反映隨機(jī)向量X的主要信息,也即D(ci′X)盡量大。但是ci的模可以無限增大,從而使D(ci′X)無限變大,這是不利的,于是限定ci模的大小,而改變ci各分量的比例,使D(ci′X)最大;通常取ci的模為1最方便。

      當(dāng)隨機(jī)向量方差已知時(shí),主成分的計(jì)算公式為:設(shè)隨機(jī)向量X=(X1,…Xp)′方差存在為Σ。Σ特征值從大到小為λ1≥λ2≥…≥λp,λj對(duì)應(yīng)的彼此正交單位特征向量為cj。則X的第j個(gè)主成分Yj為cj與X的內(nèi)積,即Yj=cj′X,且Yj的隨機(jī)變量方差為λi。

      1.2 聚類方法

      聚類方法根據(jù)觀測(cè)對(duì)象之間的彼此相似程度達(dá)到“物以類聚”的目的(António,2002),其原則是根據(jù)事物本身的特征研究個(gè)體分類的方法(Glenn,1981;Forner-Cordero et al.,2005)。聚類分析運(yùn)用數(shù)學(xué)方法對(duì)不同的樣本進(jìn)行數(shù)字分類,定量的確定樣本間的親屬關(guān)系,并按照他們之間的相似程度,歸組并類(胡婭敏等,2010)。本文使用的聚類分析方法為類平均法(average linkage method)(吳誠(chéng)鷗和秦偉良,2007):d(x,y)=‖x-y‖2為觀測(cè)樣本的歐氏距離。類平均法有兩種定義:一種定義方法是把類與類之間的距離定義為所有樣品對(duì)之間的平均距離,即定義Gk和Gl之間的距離為

      其中nk和nl分別為類Gk和Gl的樣品個(gè)數(shù)。

      當(dāng)某類Gk和Gl合并成一個(gè)新類Gm,計(jì)算Gm與任一類Gj的距離,其遞推公式為

      另一種定義方法是定義類與類之間的平方距離為樣品對(duì)之間平方距離的平均值,即

      在上面的遞推公式中,Dkj沒有被反映出來,為此可將該公式進(jìn)一步推廣為

      其中β<1,稱這種系統(tǒng)聚類法為可變類平均法。

      2 結(jié)果分析

      2.1 主成分分析結(jié)果

      使用SAS軟件。因?yàn)樗凶兞繂挝幌嗤?可用協(xié)方差陣求主成分。以變量T6、T7、T8分別表示6、7、8月的平均氣溫(程序略)。

      表1為所得的基本統(tǒng)計(jì)量。由表1可見,7月氣溫的標(biāo)準(zhǔn)差最大,說明數(shù)據(jù)的離散度最大,亦即7月氣溫的波動(dòng)范圍較其他兩個(gè)月大,氣溫不穩(wěn)定。

      表1基本統(tǒng)計(jì)量

      Table 1 Simple statistics ℃

      月份氣溫平均值標(biāo)準(zhǔn)差620.586666670.78361757724.413333331.04888426825.298333330.83208777

      所得樣本協(xié)方差矩陣為

      表2為樣本協(xié)方差矩陣的特征值,前兩個(gè)特征值累計(jì)方差貢獻(xiàn)率達(dá)到84.76%,因此取前兩個(gè)主成分。

      表2樣本協(xié)方差矩陣的特征值表

      Table 2 Eigenvalues of the covariance matrix

      主成分特征值方差貢獻(xiàn)率/%累計(jì)方差貢獻(xiàn)率/%11.5789686865.6165.6120.4608297519.1584.7630.3667863215.24100.00

      表3給出了樣本協(xié)方差矩陣的特征向量。

      表3樣本協(xié)方差矩陣的特征向量

      Table 3 Eigenvectors of the covariance matrix

      氣溫第一主成分第二主成分第三主成分T60.419158-0.6039050.677942T70.776723-0.148121-0.612177T80.4701140.7831720.406981

      根據(jù)特征向量構(gòu)建主成分與氣溫之間的線性關(guān)系:

      y1=0.419 158T6+0.776 723T7+0.470 114T8,

      y2=-0.603 905T6-0.148 121T7+0.783 172T8,

      y3=0.677 942T6-0.612 177T7+0.406 981T8。

      由線性關(guān)系可見,第一主成分中系數(shù)均為正,且T6、T8系數(shù)較小,T7系數(shù)較大,說明相較于6、8月,7月氣溫的影響更大。第一主成分反映了青島夏季氣溫距平,其正(負(fù))方向反映夏季氣溫的正(負(fù))距平,其強(qiáng)度反映氣溫偏高(低)的程度。因此,當(dāng)?shù)谝恢鞒煞种递^大時(shí),說明夏季氣溫偏高程度較高。

      第二主成分T6系數(shù)與T8系數(shù)符號(hào)相反且絕對(duì)值均比較大,說明第二主成分主要表示6月與8月溫度距平的差異,即6月溫度距平與8月溫度距平的差值。因此,第二主成分反映了同一年內(nèi)夏季各月間氣溫的差異,其絕對(duì)值越大,表示各月氣溫差異越大。

      由主成分得分表(表略)可見:1994年第1主成分最強(qiáng)(夏季氣溫偏高),1976年第1主成分負(fù)方向最強(qiáng)(夏季氣溫偏低),1952年第1主成分絕對(duì)值最小(夏季氣溫最接近常年);1951年第2主成分最強(qiáng)(8月比6月氣溫高得多),2005年第2主成分負(fù)方向最強(qiáng)(8月氣溫與6月氣溫差值較小),2000年第2主成分絕對(duì)值最小(8月氣溫與6月氣溫差接近歷年平均值)。

      2.2 聚類分析結(jié)果

      使用類平均法對(duì)6、7、8三個(gè)月的平均氣溫進(jìn)行聚類分析,以年區(qū)分聚類的觀測(cè)。圖1為聚類樹形圖,可見,可將青島1951—2010年共60 a夏季月平均氣溫的變化分成三類:1993、2003年為第一類,2005年為第二類,其余年份為第三類。

      第一類為6、7月溫度較低,8月氣溫較高;第二類是2005年,7月平均氣溫高而6、8月相對(duì)較低;其余年份歸為第三類,即6月氣溫低,7、8兩月氣溫較高。

      圖1 聚類樹形圖Fig.1 The cluster tree diagram

      3 結(jié)論

      青島的氣溫?cái)?shù)據(jù)對(duì)山東乃至華東和華北地區(qū)都有很好的借鑒意義,在東部沿海具有代表性,青島地區(qū)的氣候變遷和氣溫變化對(duì)其旅游經(jīng)濟(jì)具有一定的影響。本文選用了青島站1951—2010年共60 a每年6—8月的各月平均氣溫資料進(jìn)行主成分分析和聚類分析,結(jié)果表明:

      1)第一主成分反映青島夏季氣溫距平,其正(負(fù))方向反映夏季氣溫的正(負(fù))距平,其強(qiáng)度反映氣溫偏高(低)的程度;第二主成分則反映同一年內(nèi)夏季各月間氣溫的差異,其絕對(duì)值越大,表示各月氣溫差異越大。

      2)聚類分析表明,青島站夏季月平均氣溫的變化可以分為三類:第一類在6、7月氣溫較低,8月升溫;第二類為7月平均氣溫最高而6、8月相對(duì)較低;第三類為6月氣溫相對(duì)較低,7、8兩月氣溫較高。其中1993、2003年為第一類,2005年為第二類,其余為第三類。

      主成分分析和聚類分析等多元統(tǒng)計(jì)分析方法在氣象預(yù)報(bào)和研究中發(fā)揮著重要作用,采用SAS軟件系統(tǒng)進(jìn)行氣象資料的主成分分析和聚類分析,對(duì)研究氣溫的年際氣候變化有一定的幫助,利用SAS軟件得出的統(tǒng)計(jì)分析結(jié)果具有實(shí)際意義,可極大地提高氣象資料分析的效率。

      曹彥龍,李崇明,闞平.2007.重慶三峽庫區(qū)面源污染源評(píng)價(jià)與聚類分析[J].農(nóng)業(yè)環(huán)境科學(xué)學(xué)報(bào),26(3):857-862.

      陳效逑,彭嘉棟,李慧敏.2009.內(nèi)蒙古地區(qū)氣溫變化的季節(jié)和區(qū)域差異[J].地理研究,28(1):27-35.

      高吉喜,段飛舟,香寶,等.2006.主成分分析在農(nóng)田土壤環(huán)境評(píng)價(jià)中的應(yīng)用[J].地理研究,25(5):836-842.

      胡婭敏,丁一匯,廖菲.2010.近52年江淮梅雨的江水分型[J].氣象學(xué)報(bào),68(2):235-247.

      理查德,迪安.2001.實(shí)用多元統(tǒng)計(jì)分析[M].4版.北京:清華大學(xué)出版社.

      李夠霞.2002.SAS軟件在氣象數(shù)據(jù)處理中的應(yīng)用[J].計(jì)算機(jī)與農(nóng)業(yè),17(6):33-35.

      李宗省,何元慶,辛惠娟,等.2010.我國(guó)橫斷山區(qū)1960—2008年氣溫和降水時(shí)空變化特征[J].地理學(xué)報(bào),65(5):563-579.

      龐華基,高靖,李春,等.2007.青島百年氣溫變化及其影響因素分析[J].南京氣象學(xué)院學(xué)報(bào),30(4):524-529.

      王少鵬,王志恒,樸世龍,等.2010.我國(guó) 40年來增溫時(shí)間存在顯著的區(qū)域差異[J].科學(xué)通報(bào),55(16):1538-1543.

      吳誠(chéng)鷗,秦偉良.2007.近代實(shí)用多元統(tǒng)計(jì)分析[M].北京:氣象出版社.

      謝炯光,曾瓊,紀(jì)忠萍.2003.中國(guó)近30年來氣象統(tǒng)計(jì)預(yù)報(bào)進(jìn)展[J].氣象科技,31(2):67-83.

      易湘生,尹衍雨,李國(guó)勝,等.2011.青海三江源地區(qū)近50年來的氣溫變化[J].地理學(xué)報(bào),66(11):1451-1465.

      尹云鶴,吳紹洪,陳剛.2009.1961—2006年我國(guó)氣候變化趨勢(shì)與突變的區(qū)域差異[J].自然資源學(xué)報(bào),24(12):2147-2157.

      于秀林,任雪松.2003.多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社.

      張建偉,王根,張華,等.2011.基于主成分累計(jì)影響系數(shù)法的高光譜大氣紅外探測(cè)器的通道選擇試驗(yàn)[J].大氣科學(xué)學(xué)報(bào),34(1):36-42.

      張旋,王啟山,于淼,等.2010.基于聚類分析和水質(zhì)標(biāo)識(shí)指數(shù)的水質(zhì)評(píng)價(jià)方法[J].環(huán)境科學(xué)學(xué)報(bào),4(2):476-480.

      張堯庭,方開泰.2003.多元統(tǒng)計(jì)分析引論[M].北京:科學(xué)出版社.

      António P D S.2002.Discarding variables in a principal component analysis:Algorithms for all-subsets comparisons[J].Computational Statistics,17(2):251-271.

      Bock H H.1985.On some significance tests in cluster analysis[J].Journal of Classification,2(1):77-108.

      Forner-Cordero A,Levin O,Li Y,et al.2005.Principal component analysis of complex multijoint coordinative movements[J].Biological Cybernetics,93(4):63-78.

      Glenn W M.1981.A monte carlo study of thirty internal criterion measures for cluster analysis[J].Psychometrika,46(2):187-199.

      Korre A.1999.Statistical and spatial assessment of soil heavy metal contamination in areas of poorly recorded,complex sources of pollution,Part 1:Factor analysis for contamination assessment[J].Stochastic Environmental Research and Risk Assessment,13:260-287.

      Moshonas M G,Shaw P E.1997.Dynamic headspace gas chromatography combined with multivariate analysis to classify fresh and processed orange juices[J].Journal of Essential Oil Research,9(2):133-139.

      (責(zé)任編輯:張福穎)

      ApplicationofprincipalcomponentanalysisandclusteranalysisinastudyonthechangeofsummertemperatureinQingdao

      Qü Jia-an,CAO Jie

      (Nanjing University of Information Science & Technology,Nanjing 210044,China)

      Interannual change of summer temperature in Qingdao was analyzed based on the monthly average temperature data during June and August in 1951—2010 by using the method of principal component analysis and cluster analysis through SAS software.According to principal component analysis,the first principal component was the summary of summer temperature departure in Qingdao.The positive(negative) direction reflected the positive(negative) anomaly of temperature and the strength reflected its degree.The second principal component reflected the temperature difference among each month of the same year.The larger the absolute value of the second principal component was,the greater the temperature difference among each month was.Cluster analysis showed that the change of average monthly temperature in summer in Qingdao could be divided into three categories.The first type was that the temperature was low in June and July and warmed up in August.The second type was that the average temperature in July was the highest while in June and August it was relatively low.The third category was that the temperature in June was low and it got high in both July and August.The year of 1993 and 2003 were of the first type,2005 of the second type and the other years of the third type.

      principal component analysis;cluster analysis;SAS software;applications in meteorology

      2013-05-15;改回日期2013-10-07

      國(guó)家自然科學(xué)基金資助項(xiàng)目(71101073)

      屈家安,博士生,副研究員,研究方向?yàn)闅庀鬄?zāi)害應(yīng)急決策,qujiaan@nuist.edu.cn.

      10.13878/j.cnki.dqkxxb.20130515005.

      1674-7097(2014)04-0517-04

      P468

      A

      10.13878/j.cnki.dqkxxb.20130515005

      屈家安,曹杰.2014.主成分分析與聚類分析在青島夏季氣溫變化研究中的應(yīng)用[J].大氣科學(xué)學(xué)報(bào),37(4):517-520.

      Qü Jia-an,Cao Jie.2014.Application of principal component analysis and cluster analysis in a study on the change of summer temperature in Qingdao[J].Trans Atmos Sci,37(4):517-520.(in Chinese)

      猜你喜歡
      距平平均氣溫協(xié)方差
      颶風(fēng)Edouard(2014)暖心結(jié)構(gòu)的多資料對(duì)比分析
      烏蘭縣近38年氣溫變化特征分析
      近40年阿里地區(qū)云量和氣溫的年際變化
      西藏科技(2018年9期)2018-10-17 05:51:30
      從全球氣候變暖大背景看萊州市30a氣溫變化
      1981—2010年拐子湖地區(qū)氣溫變化特征及趨勢(shì)分析
      近50年來全球背景下青藏高原氣候變化特征分析
      甘肅省降水和冰雹天氣氣候分析
      不確定系統(tǒng)改進(jìn)的魯棒協(xié)方差交叉融合穩(wěn)態(tài)Kalman預(yù)報(bào)器
      一種基于廣義協(xié)方差矩陣的欠定盲辨識(shí)方法
      基于距平百分率的萬源市氣象干旱灰色預(yù)測(cè)
      纳雍县| 万宁市| 巴东县| 贡嘎县| 合江县| 牡丹江市| 石渠县| 丹凤县| 汪清县| 建瓯市| 当涂县| 新安县| 天柱县| 瓦房店市| 梁平县| 滦南县| 始兴县| 新余市| 云南省| 诸城市| 宁波市| 阳江市| 禄丰县| 女性| 苏尼特左旗| 西安市| 策勒县| 阿拉尔市| 沂源县| 沂水县| 崇文区| 喀喇沁旗| 天长市| 天等县| 古丈县| 广平县| 巴塘县| 武山县| 襄垣县| 疏附县| 弋阳县|