張少偉,苗作云,馬順興,魯廣偉
(1.河南投資集團(tuán)有限公司,河南 鄭州 450008;2.黃河科技學(xué)院,河南 鄭州450002;3.河南農(nóng)業(yè)職業(yè)學(xué)院,河南 鄭州 450003;4.原陽縣農(nóng)林畜牧局,河南 新鄉(xiāng) 453500)
林業(yè)科研中不同數(shù)據(jù)縮減方法對群體數(shù)據(jù)結(jié)構(gòu)的影響
張少偉1,苗作云2,馬順興3,魯廣偉4
(1.河南投資集團(tuán)有限公司,河南 鄭州 450008;2.黃河科技學(xué)院,河南 鄭州450002;3.河南農(nóng)業(yè)職業(yè)學(xué)院,河南 鄭州 450003;4.原陽縣農(nóng)林畜牧局,河南 新鄉(xiāng) 453500)
為了研究不同的數(shù)據(jù)處理方法對方差分析結(jié)果的影響,該研究以省沽油6個種源的果實(shí)長度為例,研究了直接方差分析法、群體抽樣法、分層抽樣法、群體抽樣求平均法及分層抽樣取平均法5種數(shù)據(jù)處理方法分別對數(shù)據(jù)結(jié)構(gòu)的影響。研究表明不同的數(shù)據(jù)處理方法得到排序后求平均值的方法能更好地保留原來群體的數(shù)據(jù)結(jié)構(gòu)。研究結(jié)果可以為林業(yè)科學(xué)研究的試驗(yàn)設(shè)計(jì)及數(shù)據(jù)處理提供參考。
方差分析;多重比較;試驗(yàn)設(shè)計(jì)
林業(yè)由于工作特殊性,經(jīng)常長期在野外環(huán)境艱苦的條件下調(diào)查以取得試驗(yàn)數(shù)據(jù),調(diào)查難度的高低與調(diào)查的數(shù)據(jù)量有直接關(guān)系。數(shù)據(jù)量大,費(fèi)事費(fèi)力,但數(shù)據(jù)量小又難以保證結(jié)果的準(zhǔn)確性。研究以實(shí)際例子探討幾種數(shù)據(jù)簡化處理方法對群體數(shù)據(jù)結(jié)構(gòu)的影響,以期為科研工作者在試驗(yàn)設(shè)計(jì)及減輕野外數(shù)據(jù)獲取中提供參考。
數(shù)據(jù)源自 2015年底調(diào)查三門峽地區(qū)省沽油(Staphylea bumalda DC.)6個種源的果實(shí)長度。
用 Excel2007進(jìn)行數(shù)據(jù)整理,采用 SPSS16.0進(jìn)行描述性統(tǒng)計(jì)[1-4],數(shù)據(jù)整理方法如下。
(1)直接分組法:即完全隨機(jī)抽樣法,視種源內(nèi)150例數(shù)據(jù)相互獨(dú)立。
(2)整群分類法:將每個種源的數(shù)據(jù)隨機(jī)完全隨機(jī)分為6組,即群體內(nèi)有一定變異,群體隨機(jī)。
(3)分層分類法:將每組的數(shù)據(jù)進(jìn)行排序,然后平均分為6組,類似于分層隨機(jī)抽樣,每層內(nèi)數(shù)據(jù)變異較小,不同層次間變異較大。
(4)整群分類求平均法:按整群分類法分為 6組,以小組平均值為單位計(jì)算。
(5)分層分類求平均法:按分層分類法分為 6組,以小組平均值為單位計(jì)算。
從描述統(tǒng)計(jì)性圖(圖1)來看,排序后求平均值的方法得到的正態(tài)圖與原始圖形分布更接近,而隨機(jī)平均得到的正態(tài)圖則偏態(tài)現(xiàn)象明顯。說明排序后求平均值的方法能更好的保留原來群體的數(shù)據(jù)結(jié)構(gòu)。
圖1 不同處理方法所得數(shù)據(jù)的正態(tài)分布
3種處理方法得到的數(shù)據(jù)描述統(tǒng)計(jì)如表 1所示,采用不同方法所得各種源平均值均相同,但種源內(nèi)的標(biāo)準(zhǔn)差及整體標(biāo)準(zhǔn)差均有所降低。但隨機(jī)平均及排序求平均后,因平均作用,降低了數(shù)據(jù)的變異幅度,縮小了數(shù)值范圍,但從數(shù)值上來看,排序后再進(jìn)行平均化,其各項(xiàng)指標(biāo)與原始數(shù)據(jù)更為接近。數(shù)據(jù)經(jīng)縮減后仍可基本保持原來的變異幅度,但其標(biāo)準(zhǔn)差卻顯著降低,說明通過適當(dāng)?shù)臄?shù)據(jù)處理方式可以基本保持?jǐn)?shù)據(jù)的原貌。并未因數(shù)據(jù)求平均而造成縮小其變異性。另外,在求平均值的過程中,隨機(jī)取值每次組合不同,所以結(jié)果變動性較大,而排序后求平均,則能有效避免該現(xiàn)象。
不同的數(shù)據(jù)縮減方法得到的數(shù)據(jù)結(jié)構(gòu)特征差別較大,分層分類求平均法能更好的保留原來群體的數(shù)據(jù)結(jié)構(gòu),因每次都是固定的組合,所以結(jié)果固定;而按照整群分類求平均法得到的結(jié)果卻因每次組合都是隨機(jī)的,雖然在抽樣中完全隨機(jī)也有一定的代表性,但誤差相對較大。
[1] 張文彤,董偉. SPSS統(tǒng)計(jì)分析高級教程[M]. 北京:高等教育出版社,2004.
[2] 吳明隆. SPSS統(tǒng)計(jì)應(yīng)用實(shí)務(wù)[M]. 北京:中國鐵道出版社,2000.
[3] 張文彤,董偉. SPSS統(tǒng)計(jì)分析高級教程[M]. 北京:高等教育出版社,2004.
[4] 郭志剛. 新編21世紀(jì)社會學(xué)系列教材:社會統(tǒng)計(jì)分析方法·SPSS軟件應(yīng)用[M]. 北京:中國人民大學(xué)出版社,2004 .
(責(zé)任編輯:王文彬)
S757.2+4
A
1003-2630(2017)02-0013-02
2017-04-15
河南省科技攻關(guān)(162102110090);鄭州市2015年度科技發(fā)展計(jì)劃(20150271);中牟縣技術(shù)研究與開發(fā)項(xiàng)目(zmkjj20160616)
張少偉(1981-),男,河南安陽人,講師,主要城市綠化樹種選育。通訊作者:馬順興(1980-),男,河南新鄭人,工程師。