• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一個(gè)高效實(shí)現(xiàn)灰色關(guān)聯(lián)分析的R程序

      2015-12-25 00:34高志華李桂琴石曉輝馬莉麗
      安徽農(nóng)學(xué)通報(bào) 2015年23期
      關(guān)鍵詞:R語(yǔ)言灰色關(guān)聯(lián)分析

      高志華++李桂琴++石曉輝++馬莉麗

      摘 要:灰色關(guān)聯(lián)分析模型是一種廣泛應(yīng)用于各個(gè)科研領(lǐng)域的重要的統(tǒng)計(jì)模型,但其數(shù)據(jù)處理過(guò)程計(jì)算量很大。R是一門(mén)高級(jí)統(tǒng)計(jì)計(jì)算編程語(yǔ)言,可以在通用公共許可(GPL)規(guī)則下從互聯(lián)網(wǎng)免費(fèi)獲取。該研究基于灰色關(guān)聯(lián)分析方法設(shè)計(jì)了一個(gè)可快速自動(dòng)計(jì)算鄧氏關(guān)聯(lián)度的R程序,通過(guò)成功應(yīng)用于實(shí)例,驗(yàn)證了本程序的可行性和高效性。

      關(guān)鍵詞:R語(yǔ)言;灰色關(guān)聯(lián)分析;R程序應(yīng)用實(shí)例

      中圖分類(lèi)號(hào) N941.5 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1007-7731(2015)23-13-04

      An Efficient R Program for Implementing Grey Relational Analysis

      Gao Zhihua1,2,3 et al.

      (1College of Biological Science and Engineering,Hebei University of Economics and Business,Shijiazhuang 050061,China;2 School of Life Science,Hebei Normal University,Shijiazhuang 050016,China;3 School of Life Sciences,F(xiàn)udan University,Shanghai 200438,China)

      Abstract:Grey relational analysis model widely used in various scientific research fields is a very important statistical model,but it needs lots of computations to finish the whole data process. R is an advanced programming language for statistical computing and is available as free software downloaded from the Internet under the terms of the Free Software Foundations GNU General Public License.In this paper,based on the method of grey relational analysis,a fast automatic calculation program in R for Deng relational degree is designed,and successfully applied into the actual case to verify its feasibility and high-efficiency.

      Key words:R program;Grey relational analysis;Application case in R program

      灰色關(guān)聯(lián)分析是從無(wú)序、隨機(jī)的系統(tǒng)特征量中確定各因素間的關(guān)聯(lián)程度,早在1982年,鄧聚龍教授就提出了計(jì)算灰色關(guān)聯(lián)度的統(tǒng)計(jì)模型,該模型基本思想是根據(jù)序列曲線幾何形狀的相似程度來(lái)判斷其聯(lián)系是否密切,曲線越接近,則相應(yīng)序列之間關(guān)聯(lián)度就越大,反之則越小[1-3]?;疑P(guān)聯(lián)分析方法是處理“小樣本”、“貧信息”不確定系統(tǒng)的有效方法,因其實(shí)用性強(qiáng),且不像其他多元統(tǒng)計(jì)模型(如相關(guān)、回歸等)要求大樣本和符合典型分布,故在許多科學(xué)研究領(lǐng)域都用廣泛應(yīng)用[4]。經(jīng)初步統(tǒng)計(jì)中國(guó)知網(wǎng)文獻(xiàn)檢索結(jié)果,發(fā)現(xiàn)從2000年至今,公開(kāi)發(fā)表的應(yīng)用灰色關(guān)聯(lián)分析模型解決生命科學(xué)問(wèn)題的相關(guān)學(xué)術(shù)論文已有506篇,且大體呈上升趨勢(shì)(如圖1所示),可見(jiàn),灰色關(guān)聯(lián)分析方法在生命科學(xué)領(lǐng)域的應(yīng)用日益廣泛。

      圖1 2000年至今發(fā)表的灰色關(guān)聯(lián)分析方面論文篇數(shù)

      目前,常用的數(shù)理統(tǒng)計(jì)軟件有:Excel、SPSS、SAS、DPS等[5,6]。在這506篇論文中有120篇明確指出了灰色關(guān)聯(lián)分析所使用的數(shù)據(jù)分析軟件,但是所使用的軟件種類(lèi)卻不盡相同(見(jiàn)表1)。

      Excel是Microsoft Office辦公軟件的組件之一,具有數(shù)據(jù)統(tǒng)計(jì)分析的功能,比較靈活、直觀,能夠根據(jù)不同計(jì)算目的,編寫(xiě)不同的公式來(lái)進(jìn)行一些簡(jiǎn)單的數(shù)據(jù)分析,有6.67%的灰色關(guān)聯(lián)分析單獨(dú)使用Excel來(lái)完成,有27.5%的灰色關(guān)聯(lián)分析需要Excel配合其它軟件來(lái)完成,說(shuō)明Excel在日常數(shù)據(jù)分析中占有重要地位,但是,如果使用Excel處理大量數(shù)據(jù),即使是使用相同算法,也需要每次輸入眾多數(shù)學(xué)公式,進(jìn)行繁瑣的代數(shù)運(yùn)算,費(fèi)時(shí)費(fèi)力,還易出錯(cuò);SPSS和SAS都是非常優(yōu)秀的國(guó)外數(shù)理統(tǒng)計(jì)軟件,它們區(qū)別在于:前者已經(jīng)將常用的統(tǒng)計(jì)算法固化于軟件之中,只要熟練掌握使用方法,能夠減少重復(fù)性勞動(dòng),且分析效率高,但由于其自身封閉性,如果想使用一些不常用或最新的算法處理自己的數(shù)據(jù),則不支持,除非軟件編制者更新這些算法,后者除了具備各種統(tǒng)計(jì)功能之外,還能夠通過(guò)編程來(lái)實(shí)現(xiàn)自己的特殊算法,以滿足不同的數(shù)據(jù)處理需求,但是,要求使用者事先熟練掌握其復(fù)雜的編程語(yǔ)法,由于二者都要求使用者事先熟練掌握大量的功能函數(shù)及相應(yīng)分析模型的理論,而且都是英文操作界面,這就使得基礎(chǔ)科技工作者難以在短期內(nèi)準(zhǔn)確掌握;Matlab已經(jīng)發(fā)展為綜合高性能的數(shù)值計(jì)算軟件,在數(shù)理統(tǒng)計(jì)方面的功能不斷增強(qiáng),也支持編程,情況與SAS類(lèi)似[7];DPS(Data Processing System)是由浙江大學(xué)農(nóng)業(yè)與生物技術(shù)學(xué)院唐啟義教授研發(fā)的國(guó)內(nèi)首款中文操作界面數(shù)理統(tǒng)計(jì)軟件,因其無(wú)需使用者了解具體運(yùn)算細(xì)節(jié),僅靠點(diǎn)擊鼠標(biāo)即可完成絕大多數(shù)的數(shù)據(jù)分析任務(wù),簡(jiǎn)單易行,所以越來(lái)越得到廣大科技工作者的認(rèn)可[8]。與SPSS、SAS和Matlab的22.5%使用率相比,有56.67%的學(xué)者選擇DPS進(jìn)行灰色關(guān)聯(lián)分析也充分說(shuō)明了這一點(diǎn)。但值得一提的是,無(wú)論是與SPSS、SAS、Matlab,還是DPS,都屬于商業(yè)軟件,有的甚至還需要二次支付額外費(fèi)用才能使用這些軟件的某些數(shù)理統(tǒng)計(jì)模塊,無(wú)疑給科研工作增加了不小的成本投入。也正是基于這一點(diǎn),本文首次探索R語(yǔ)言實(shí)現(xiàn)灰色關(guān)聯(lián)分析的新途徑。

      1 R語(yǔ)言簡(jiǎn)介

      R語(yǔ)言是一門(mén)出色的統(tǒng)計(jì)計(jì)算編程語(yǔ)言,屬于解釋性計(jì)算機(jī)語(yǔ)言,可以在通用公共許可(GPL)規(guī)則下從互聯(lián)網(wǎng)免費(fèi)獲取,能夠?qū)⑵洳渴鹪贛icrosoft Windows、UNIX、Linux以及Macintosh OS X系統(tǒng)中,可以實(shí)現(xiàn)“一次編碼,到處運(yùn)行”,極大提高了分析效率[9]。R語(yǔ)言為統(tǒng)計(jì)建模和圖示提供了種類(lèi)繁多、唾手可得的軟件包,還允許用戶既可以使用成熟的統(tǒng)計(jì)技術(shù),也可以使用實(shí)驗(yàn)性的統(tǒng)計(jì)技術(shù)。同時(shí),R語(yǔ)言具有極其豐富的繪圖功能,如前文圖1就是使用ggpolt2 R包繪制。與C/C++語(yǔ)言相比,R語(yǔ)言是一種更加高級(jí)的編程語(yǔ)言,易學(xué)易用,盡管其執(zhí)行速度稍遜,但實(shí)踐表明,其開(kāi)發(fā)速度帶來(lái)的效益遠(yuǎn)遠(yuǎn)大于執(zhí)行速度帶來(lái)的損失,特別是在現(xiàn)代計(jì)算機(jī)的處理速度情況下。R語(yǔ)言現(xiàn)已逐步成為國(guó)內(nèi)外眾多科技工作者青睞的數(shù)據(jù)分析工具。

      2 鄧氏灰色關(guān)聯(lián)分析算法簡(jiǎn)介及R實(shí)現(xiàn)

      灰色關(guān)聯(lián)分析方法依據(jù)空間理論的數(shù)學(xué)基礎(chǔ),按照規(guī)范性、偶對(duì)稱(chēng)性、整體性和接近性的灰色關(guān)聯(lián)四原則,以確定參考序列和若干個(gè)比較序列之間的關(guān)聯(lián)系數(shù)和關(guān)聯(lián)度。鄧氏關(guān)聯(lián)分析模型是最早運(yùn)用灰色系統(tǒng)理論計(jì)算灰色關(guān)聯(lián)度的統(tǒng)計(jì)模型,在各個(gè)學(xué)科領(lǐng)域均有應(yīng)用,所以尋求一種簡(jiǎn)單、自動(dòng)、高效的鄧氏關(guān)聯(lián)度計(jì)算方法十分必要。

      2.1 鄧氏灰色關(guān)聯(lián)分析算法 鄧氏灰色關(guān)聯(lián)分析模型包括以下6個(gè)計(jì)算步驟:

      (1)確定待分析的變量序列。參考序列用x0表示,比較序列用xi(i=1,2,…,n,表示共有n個(gè)比較序列)表示,統(tǒng)稱(chēng)為變量序列[4]。

      (2)對(duì)變量序列進(jìn)行無(wú)量綱化。為了消除各指標(biāo)量綱不一致對(duì)關(guān)聯(lián)分析的影響,要在分析前對(duì)變量序列原始數(shù)據(jù)進(jìn)行無(wú)量綱化處理,處理后的參考序列用x′0表示,比較序列用x′i(i=1,2,…,n,表示共有n個(gè)比較序列)表示。常用的方法有初值化法、均值化法、區(qū)間化法、逆化法、倒數(shù)化法等[10-11]。

      (3)求差序列、最大差和最小差。根據(jù)公式:△0i(k)=|x′0(k)-x′i(k)|(其中,i=1,2,…,n,表示共有n個(gè)比較序列;k=1,2,…,m,表示每個(gè)比較序列由m個(gè)指標(biāo)組成)計(jì)算參考序列與其余各比較序列的絕對(duì)差值,并找出其中的最大差和最小差,分別用△max與△min表示。

      (4)計(jì)算關(guān)聯(lián)系數(shù)。其中,為關(guān)聯(lián)系數(shù),ρ為分辨系數(shù),0≤ρ≤1,一般ρ取0.5。

      (5)計(jì)算關(guān)聯(lián)度。其中,為參考序列x0與比較序列xi的鄧氏關(guān)聯(lián)度,為第k個(gè)指標(biāo)的加權(quán)系數(shù)。

      (6)按取值大小進(jìn)行排序。對(duì)各從大到小進(jìn)行排序,取值越大,說(shuō)明比較序列與參考序列的平均距離越小,越相似。

      2.2 鄧氏灰色關(guān)聯(lián)分析算法的R實(shí)現(xiàn)及要求 利用R軟件(V3.20)編程實(shí)現(xiàn)上述算法,該程序提供了初值化和均值化兩種變量序列無(wú)量綱化方法,及是否加權(quán)計(jì)算鄧氏關(guān)聯(lián)度的選項(xiàng),運(yùn)行該程序的基本環(huán)境要求如下:(1)硬件要求:目前主流的個(gè)人電腦配置(32位或64位)均可,一般硬盤(pán)最好40GB以上,內(nèi)存最好2GB以上。(2)軟件要求:安裝WindowXP或Windows 7操作系統(tǒng),安裝2003及以上Microsoft Office辦公軟件,安裝V3.20及以上R環(huán)境。

      3 R程序應(yīng)用于實(shí)例

      以灰度關(guān)聯(lián)分析方法對(duì)不同南瓜品種的產(chǎn)量和果膠質(zhì)量(果膠含量、酯化度、粘度)進(jìn)行綜合評(píng)價(jià)為例[12],使用上述R程序進(jìn)行灰度關(guān)聯(lián)分析過(guò)程如下:

      3.1 新建原始數(shù)據(jù)文件 新建原始數(shù)據(jù)文件example.csv,鍵入不同南瓜品種的產(chǎn)量和果膠質(zhì)量(果膠含量、酯化度、粘度)的原始數(shù)據(jù)(見(jiàn)表2),保存并退出。

      在上述命令中,greyRelationalAnalysis.R為鄧氏灰色關(guān)聯(lián)分析R程序,example.csv為原始數(shù)據(jù)文件,接下來(lái)的2個(gè)“1”分別是無(wú)量綱化方法參數(shù)和是否加權(quán)參數(shù),out.csv為分析結(jié)果文件。在此,無(wú)量綱化方法參數(shù)共有2個(gè):1表示初值化法,2表示均值化法;是否加權(quán)參數(shù)也有兩個(gè):0表示不加權(quán),1表示加權(quán)。

      3.3 分析結(jié)果 采用初值化法將9種南瓜品種(含假設(shè)理想品種)各指標(biāo)的平均值進(jìn)行無(wú)量綱化后,得到如表3所示結(jié)果;再將8種南瓜品種分別與假設(shè)理想品種做比較,得到8種南瓜品種與假設(shè)理想品種間各指標(biāo)的關(guān)聯(lián)系數(shù)(見(jiàn)表4);然后按照加權(quán)(各指標(biāo)的權(quán)重依次為:0.35、0.25、0.20、0.20)和不加權(quán)兩種方式計(jì)算8種南瓜品種與假設(shè)理想品種間鄧氏關(guān)聯(lián)度;最后對(duì)兩類(lèi)關(guān)聯(lián)度分別進(jìn)行排序(見(jiàn)表5)。

      由表5可知,不論是加權(quán)還是不加權(quán),北京1號(hào)的鄧氏關(guān)聯(lián)度最高,京紅栗的鄧氏關(guān)聯(lián)度最低,根據(jù)灰色系統(tǒng)理論,北京1號(hào)不僅產(chǎn)量高,而且果膠品質(zhì)好,適宜用于果膠開(kāi)發(fā),京紅栗不宜作果膠開(kāi)發(fā)原料,這與蘇艷玲等[12]的分析結(jié)果一致,說(shuō)明本文開(kāi)發(fā)的R程序可以進(jìn)行鄧氏灰色關(guān)聯(lián)分析。

      4 討論與結(jié)論

      根據(jù)研究對(duì)象的不同特征,除鄧氏灰色關(guān)聯(lián)分析模型外[13],還有灰色絕對(duì)關(guān)聯(lián)度、相對(duì)關(guān)聯(lián)度、廣義關(guān)聯(lián)度[14-16]、灰色斜率關(guān)聯(lián)度、區(qū)間關(guān)聯(lián)度Ⅰ[17]、點(diǎn)關(guān)聯(lián)度、區(qū)間關(guān)聯(lián)度Ⅱ[18]、B型關(guān)聯(lián)度、C型關(guān)聯(lián)度[19]、T型關(guān)聯(lián)度[20]、向量關(guān)聯(lián)度、復(fù)數(shù)關(guān)聯(lián)度[21]等。SPSS和DPS是十分成熟的軟件,但很難涵蓋上述所有灰色關(guān)聯(lián)分析模型;SAS和Matlab除了提供各種統(tǒng)計(jì)功能,還支持編程,但由于和SPSS、DPS一樣,只有付費(fèi)才能獲得正版軟件的使用權(quán),增加了廣大科技工作者的科研成本;Excel生動(dòng)直觀,但計(jì)算繁瑣且容易出錯(cuò)。R軟件是一款自由、免費(fèi)、開(kāi)源的軟件,具有強(qiáng)大的統(tǒng)計(jì)分析功能,同時(shí)又是一門(mén)高級(jí)編程語(yǔ)言,而且無(wú)需編譯過(guò)程,開(kāi)發(fā)周期較短,代碼維護(hù)方便,程序運(yùn)行簡(jiǎn)單。本文根據(jù)鄧氏灰色關(guān)聯(lián)分析算法編寫(xiě)的R程序分析了不同南瓜品種的產(chǎn)量和果膠質(zhì)量(果膠含量、酯化度、粘度)各指標(biāo),得到了與蘇艷玲等[12]一致的分析結(jié)果,并且從原始數(shù)據(jù)輸入到分析任務(wù)完成僅用0.019秒(見(jiàn)圖2),可見(jiàn)本程序?qū)疑P(guān)聯(lián)分析的可行性和高效性,同樣,本程序也非常適合大量數(shù)據(jù)的分析和重復(fù)性強(qiáng)的工作。通過(guò)利用R編程對(duì)鄧氏關(guān)聯(lián)分析的成功探索,為日后繼續(xù)開(kāi)發(fā)其它灰色關(guān)聯(lián)分析模型的R程序奠定了堅(jiān)實(shí)基礎(chǔ)。

      參考文獻(xiàn)

      [1]鄧聚龍.灰色系統(tǒng)基礎(chǔ)方法[M].武漢:華中理工大學(xué)出版社,1987.

      [2]李東亮,馮廣林,李剛,等.灰色系統(tǒng)理論在煙草質(zhì)量評(píng)價(jià)中的應(yīng)用[M].北京:中國(guó)水利水電出版社,2013.

      [3]劉思峰,謝乃明.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,2013.

      [4]譚學(xué)瑞,鄧聚龍.灰色關(guān)聯(lián)分析:多因素統(tǒng)計(jì)分析新方法[J].統(tǒng)計(jì)研究,1995,65(3):46-48.

      [5]朱海濤,陳黎,涂自良,等.DPS數(shù)據(jù)處理系統(tǒng)在藥學(xué)研究數(shù)據(jù)處理中的應(yīng)用[J].醫(yī)藥導(dǎo)報(bào),2006,25(4):363-365.

      [6]唐啟義,馮明光.DPS數(shù)據(jù)處理系統(tǒng)——實(shí)驗(yàn)設(shè)計(jì)、統(tǒng)計(jì)分析及模型優(yōu)化[M].北京:科學(xué)出版社,2006.

      [7]周建興,豈興明,矯津毅,等.MATLAB從入門(mén)到精通[M].北京:人民郵電出版社,2012.

      [8]唐啟義.通用統(tǒng)計(jì)軟件DPS研制與應(yīng)用[J].科學(xué)中國(guó)人,2004(9):56.

      [9]郝智恒,何通,鄧一碩,等.R語(yǔ)言統(tǒng)計(jì)入門(mén)(第2版)[M].北京:人民郵電出版社,2014.

      [10]徐文鳳,毛志泉,孫海濤,等.灰色關(guān)聯(lián)度分析法在拮抗絲核菌木霉菌株篩選中的應(yīng)用[J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào),2012,43(2):189-192.

      [11]劉新梅,徐潤(rùn)芳,張若勇.鄧氏灰色關(guān)聯(lián)分析的應(yīng)用模型[J].統(tǒng)計(jì)與決策,2008,262(20):23-25.

      [12]蘇艷玲,張學(xué)杰.不同南瓜品種果膠含量與特性分析及其利用評(píng)價(jià)[J].園藝學(xué)報(bào),2014,41(11):2323-2328.

      [13]鄧聚龍.灰色系統(tǒng)理論教程[M].武漢:華中理工大學(xué)出版社,1990.

      [14]劉思峰,黨耀國(guó),方志耕.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,2010.

      [15]XIE N M,LIU S F.Research on evaluations of several grey relational models adapt to grey relational axioms[J].Journal of Systems Engineering and Electronics,2009,20( 2):304-309.

      [16]GU H,SONG B F.Study on effectiveness evaluation of weapon systems based on grey relational analysis and TOPSIS[J].Journal of Systems Engineering and Electronics,2009,20(1):106-111.

      [17]崔杰,黨耀國(guó),劉思峰.幾類(lèi)關(guān)聯(lián)分析模型的新性質(zhì)[J].系統(tǒng)工程,2009,27(4):65-70.

      [18]肖新平,宋中民,李峰.灰技術(shù)基礎(chǔ)及其應(yīng)用[M].北京:科學(xué)出版社,2005.

      [19]王清印.灰色B型關(guān)聯(lián)度分析[J].華中理工大學(xué)學(xué)報(bào),1989,17(6):77-81.

      [20]唐五湘.T型關(guān)聯(lián)度及其計(jì)算方法[J].數(shù)理統(tǒng)計(jì)與管理,1995,14(1):34-37.

      [21]謝乃明,劉思峰.積累關(guān)聯(lián)度模型的平行性和一致性[J].系統(tǒng)工程,2007,25(8):98-103.

      (責(zé)編:張長(zhǎng)青)

      猜你喜歡
      R語(yǔ)言灰色關(guān)聯(lián)分析
      運(yùn)動(dòng)員組織承諾水平的評(píng)價(jià)與提升策略
      基于GPS軌跡數(shù)據(jù)進(jìn)行分析改善城市交通擁擠
      新疆向西開(kāi)放度與經(jīng)濟(jì)增長(zhǎng)灰色關(guān)聯(lián)分析
      基于R語(yǔ)言的Moodle平臺(tái)數(shù)據(jù)挖掘技術(shù)的研究
      基于灰色關(guān)聯(lián)的河南省旅游收入影響因素研究
      基于灰色關(guān)聯(lián)分析的制造企業(yè)跨國(guó)并購(gòu)財(cái)務(wù)決策
      中國(guó)能源消費(fèi)與經(jīng)濟(jì)增長(zhǎng)關(guān)系研究
      基于R語(yǔ)言的湖南產(chǎn)業(yè)結(jié)構(gòu)對(duì)其經(jīng)濟(jì)增長(zhǎng)貢獻(xiàn)分析
      注重統(tǒng)計(jì)思維培養(yǎng)與應(yīng)用為主導(dǎo)的生物統(tǒng)計(jì)學(xué)課程建設(shè)
      人民幣匯率的均值回復(fù)檢驗(yàn)及Hurst指數(shù)計(jì)算
      玛纳斯县| 迁安市| 南江县| 仙居县| 略阳县| 宜宾县| 翁牛特旗| 新民市| 海南省| 澄江县| 民丰县| 越西县| 西吉县| 二手房| 丰县| 望谟县| 巴彦淖尔市| 新兴县| 北安市| 昌平区| 南雄市| 巢湖市| 英德市| 乌苏市| 曲靖市| 瑞金市| 九龙坡区| 新晃| 成武县| 汝南县| 贵德县| 平南县| 吕梁市| 南通市| 泰州市| 桦甸市| 蓝山县| 博湖县| 通城县| 忻城县| 渝北区|