□謝煊(成都體育學(xué)院四川成都610041;華安財(cái)產(chǎn)保險(xiǎn)股份有限公司四川分公司四川成都610016)
多元線性回歸的S P SS統(tǒng)計(jì)應(yīng)用
——以某公司成年男子體脂率與身體形態(tài)指標(biāo)為例
□謝煊(成都體育學(xué)院四川成都610041;華安財(cái)產(chǎn)保險(xiǎn)股份有限公司四川分公司四川成都610016)
本文運(yùn)用多元線性回歸分析方法,對(duì)某公司40名成年男子的體脂率與身體形態(tài)指標(biāo)進(jìn)行分析,用逐步回歸方法建立線性回歸方程,并與全回歸結(jié)果進(jìn)行對(duì)比,通過(guò)分析找出影響體脂率的主要形態(tài)指標(biāo)因素。
成年男子體脂率形態(tài)指標(biāo)多元線性回歸應(yīng)用
為了描述父母身高與兒子身高之間的關(guān)系,生物統(tǒng)計(jì)學(xué)家高爾頓(F.Galton,1822-1911)引進(jìn)了“回歸”一詞。
線性回歸分析研究的是因變量與自變量的線性依存關(guān)系,多元線性回歸方程為:y^=b0+b1x1+…+b k x k,其中y^為因變量y的估計(jì)值,x i(i=1,…,k)為自變量,k為自變量個(gè)數(shù),b0為回歸方程的常數(shù)項(xiàng),b i(i=1,…,k)為回歸系數(shù)。
一元線性回歸方程在回歸模型中只含有一個(gè)自變量,它是多元線性回歸方程的特殊情形。
某公司40名成年男子體脂率(y)與身高(x1)、體重(x2)、胸圍(x3)、腰圍(x4)、臀圍(x5)等指標(biāo),如下表1所示。運(yùn)用多元線性回歸分析法的其中兩種方法,即全回歸分析法及逐步回歸分析法及其相互間的分析對(duì)比,找出影響體脂率的主要形態(tài)指標(biāo)因素。
選擇“分析”菜單—“回歸”—“線性(L)…”項(xiàng),打開(kāi)如圖1所示的“線性回歸”對(duì)話框,從左邊的原變量列表框?qū)⒁蜃兞俊绑w脂率”移至“因變量(D)”框,再將“身高”、“體重”、“胸圍”、“腰圍”、“臀圍”等自變量全部移至“自變量(I)”框。在“方法(M)”下拉式列表框中選擇“進(jìn)入”。
圖1 線性回歸對(duì)話框
單擊“統(tǒng)計(jì)量(S)…”按鈕,打開(kāi)“線性回歸:統(tǒng)計(jì)量”對(duì)話框,如圖2所示。在“回歸系數(shù)”框中選擇“估計(jì)(E)”項(xiàng),在“殘差”框中選擇“Dur b in-W atson”項(xiàng),在其他選項(xiàng)中選擇“模型擬合度(M)”和“共線性診斷(L)”,其余使用默認(rèn)選項(xiàng)?;氐健熬€性回歸”對(duì)話框,按“確認(rèn)”按鈕,進(jìn)行S P SS運(yùn)算。
單擊“統(tǒng)計(jì)量(S)…”按鈕,打開(kāi)“線性回歸:統(tǒng)計(jì)量”對(duì)話框,如圖2所示。在“回歸系數(shù)”框中選擇“估計(jì)(E)”項(xiàng),在“殘差”框中選擇“Dur b in-W atson”項(xiàng),在其他選項(xiàng)中選擇“模型擬合度(M)”和“共線性診斷(L)”,其余使用默認(rèn)選項(xiàng)?;氐健熬€性回歸”對(duì)話框,按“確認(rèn)”按鈕,進(jìn)行S P SS運(yùn)算。
表1 某公司40名成年男子形態(tài)指標(biāo)匯總表
計(jì)算結(jié)果如表2至表5所示。
表2給出了回歸分析的常用統(tǒng)計(jì)量,其中包含了D-W檢驗(yàn)值。決定系數(shù)R2為0.841,較接近于1;剩余標(biāo)準(zhǔn)差S y為2.69701,經(jīng)計(jì)算,標(biāo)準(zhǔn)剩余標(biāo)準(zhǔn)差S y'為14.93%,精度低;D-W檢驗(yàn)值為1.165,其值趨向于2,則說(shuō)明不存在自相關(guān)關(guān)系,即不能認(rèn)為存在異方差。
圖2 “線性回歸:統(tǒng)計(jì)量”對(duì)話框
表2模型匯總b
表3是對(duì)方程進(jìn)行方差分析檢驗(yàn)的結(jié)果,P<0.001,方程具有顯著的可靠性,線性關(guān)系可以確立。
?
表4給出方程系數(shù)、系數(shù)檢驗(yàn)結(jié)果和共線性檢驗(yàn)結(jié)果。由各自變量的標(biāo)準(zhǔn)回歸系數(shù)可以看出,胸圍(x3)、腰圍(x4)、臀圍(x5)等三項(xiàng)指標(biāo)對(duì)體脂率(y)的影響最大。通過(guò)對(duì)各自變量回歸系數(shù)的t值大小的比較,也可以分析出胸圍(x3)、腰圍(x4)、臀圍(x5)等三個(gè)自變量對(duì)體脂率(y)的影響最大。參數(shù)檢驗(yàn)結(jié)果顯示,只有b3、b4、b5的相伴概率P<0.1具有顯著意義,其余系數(shù)均P>0.1,不顯著。根據(jù)容忍值(T ol)法,因?yàn)門(mén) ol均大于0.1,初步說(shuō)明自變量間的共線性不強(qiáng)。
表4 系數(shù)a
表5 共線性診斷a結(jié)果
由表4,可以得到回歸方程為:
y^=-32.796-0.47x1+0.00003956x2+0.192x3+0.218x4+0.252x5
表5為共線性診斷分析結(jié)果??梢钥吹剑?維的條件索引為174.314,遠(yuǎn)遠(yuǎn)大于30,特征值為0,但因只有身高(x1)的方差比例(0.99)大于50%,說(shuō)明這幾個(gè)變量間不存在嚴(yán)重的共線性問(wèn)題,即自變量間的共線性不強(qiáng)。
選擇“分析”菜單-“回歸”-“線性(L)…”項(xiàng),打開(kāi)如圖3所示的“線性回歸”對(duì)話框,從左邊的原變量列表框?qū)⒁蜃兞俊绑w脂率”移至“因變量(D)”框,再將“身高”、“體重”、“胸圍”、“腰圍”、“臀圍”等自變量全部移至“自變量(I)”框。在“方法(M)”下拉式列表框中選擇“逐步”。
圖3 線性回歸對(duì)話框
在“線性回歸”對(duì)話框中單擊“選項(xiàng)”按鈕,打開(kāi)“線性回歸:選項(xiàng)”對(duì)話框,如圖4所示,本題采用圖4的默認(rèn)值。
回到“線性回歸”對(duì)話框,單擊“確認(rèn)”按鈕進(jìn)行統(tǒng)計(jì)S P SS運(yùn)算。
圖4 “線性回歸:選項(xiàng)”對(duì)話框
計(jì)算結(jié)果如表6-表9所示。
由表6可以看出,本題的最終決定系數(shù)為0.840,與全回歸決定系數(shù)0.841非常接近,且仍較接近于1;剩余標(biāo)準(zhǔn)差S y為2.62864,經(jīng)計(jì)算,標(biāo)準(zhǔn)剩余標(biāo)準(zhǔn)差S y'為14.55%,雖然自變量減少,但估計(jì)精度比全回歸反倒有所提高;D-W檢驗(yàn)值為1.234,其值趨向于2,則說(shuō)明不存在自相關(guān)關(guān)系,即不能認(rèn)為存在異方差。
表6 模型匯總d
由表7可以看出,方差分析結(jié)果P<0.001,方程具有顯著的可靠性,線性關(guān)系可以確立。
由表8可以看出,只有胸圍(x3)、腰圍(x4)、臀圍(x5)被選入方程,其余變量均被剔除,最終得到回歸方程為:
y^=-40.787+0.198x3+0.214x4+0.245x5
參數(shù)檢驗(yàn)結(jié)果顯示,目前方程中的三個(gè)自變量的P值都小于0.05,具有顯著意義。共線性檢驗(yàn)結(jié)果顯示V I F<10,說(shuō)明不存在共線性。
表7 逐步回歸方差分析表(novad)
表8 逐步回歸系數(shù)a分析表
由表9可以看出,模型3中第二維的條件指數(shù)大于15,第三維、第四維的條件指數(shù)均大于30,其特征值均接近于0,但在這三維中均未出現(xiàn)兩個(gè)以上變量的方差比例同時(shí)大于50%的情況,因此不能認(rèn)定存在共線性問(wèn)題。這與表8的結(jié)論一致。
表9 逐步回歸共線性診斷a分析表
通過(guò)與全回歸結(jié)果的對(duì)比分析,逐步回歸的效果均優(yōu)于全回歸分析效果;影響體脂率的主要形態(tài)指標(biāo)因素是胸圍(x3)、腰圍(x4)、臀圍(x5)。
[1]權(quán)德慶主編.體育統(tǒng)計(jì)學(xué)[M].北京:人民體育出版社,2011.
[2]葉中行.概率論與數(shù)理統(tǒng)計(jì)[M].北京:北京大學(xué)出版社,2010.
[3]宇傳華.SPSS統(tǒng)計(jì)分析[M].北京:電子工業(yè)出版社,2007.
[4]陳及治.體育統(tǒng)計(jì)[M].北京:人民體育出版社,2006.
[5]李世明.實(shí)用體育多元分析方法[M].北京:人民體育出版社, 2006.
G804
A
1006-8902-(2017)-08-SY