江媚 曹玥 王心雨
(成都理工大學體育學院 四川成都 610059)
影響縣域居民參與體育鍛煉的二項Logistic回歸分析①
——以四川省安岳縣為例
江媚 曹玥 王心雨
(成都理工大學體育學院 四川成都 610059)
本文采用文獻資料法、問卷調查法對安岳縣參與體鍛煉的現(xiàn)狀進行實地調查,運用數(shù)理統(tǒng)計法中二項Logistic回歸分析基本原理對影響四川省安岳縣居民參與體育鍛煉的8個主觀因素進行逐一分析,最后得出結論:第一,安岳縣居民參與體育健身的人數(shù)是隨著文化程度的提升而增加;第二,居民對體育健身的喜歡程度會促進參與體育鍛煉的次數(shù);第三,對全民健身認識程度處于中間水平的居民參與體育健身人數(shù)發(fā)生比是最高的,與一般認為的對體育健身認識情況越高,參與體育健身可能性越大不同。
安岳縣 參與 體育健身 二項Logistic回歸分析
對影響安岳縣居民參與體育鍛煉的因素眾多,而這些因素相互聯(lián)系又相互影響。目前,隨著知識的不斷更新,運用交叉學科的知識探索、研究體育中的諸多問題提供了便捷。其中二項logistic回歸分析法就是分析影響居民參與體育鍛煉的這多因素變量間的較好方法。因此,本文采用此種方法對安岳縣居民參與體育鍛煉的影響因素進行主觀意義上的分析。
在實際問題中,所研究的對象經常只有兩種可能結果,比如工程項目是可以完成還是不能完成,某件事情是發(fā)生了還是沒有發(fā)生等,這些問題的特點是它們的因變量為定性變量,稱這種因變量為二分類變量的回歸分析為二項Logistic回歸分析,對應的模型為二項邏輯回歸模型。
二項Logistic回歸中因變量,即二分類變量的值一般用0和1兩個數(shù)值進行表示。設有自變量(亦稱協(xié)變量)X1、X2…Xn,則二項Logistic回歸函數(shù):
優(yōu)勢比的對數(shù)稱為logistic,logistic變換產生了參數(shù)的一個線性函數(shù)。
二項Logistic回歸,一般利用的是極大似然法來估計參數(shù),參數(shù)估計不存在精確解,只能通過迭代法獲得極大似然估計的數(shù)值解,并依據(jù)檢驗結果選擇恰當?shù)慕y(tǒng)計模型。最大似然估計值具有良好的一致性、漸進有效性和漸進正態(tài)性,其中漸進指在樣本規(guī)模大時該性質成立。
目前,國內外學者在對影響體育人口形成因素的研究中,大多選用了個人收入、家庭收入、受教育程度、職業(yè)、家庭體育消費、家務勞動時間、年齡、性別等具有統(tǒng)計意義的客觀因素,比如何國明《體育人口形成因素的二項Logistic回歸分析》等均以與上述影響因素相似的因素展開分析。但未對全民健身認識情況、健身重要性認識、健身的喜歡程度等主觀方面因素進行分析,一方面或許是賴于這些意識型因素難以量化;另一方面或許是因為量化后標準難以統(tǒng)一。
將調查結果中影響安岳縣居民參與體育健身的影響因素進行編碼和數(shù)據(jù)化。(見表1)
表1 對安岳縣居民參與體育健身的影響因素進行編碼和數(shù)據(jù)化
2.1 二項Logistic回歸分析結果
進行二項Logistic回歸分析時,選擇自變量進入模型的方法為向前(LR):模型從沒有自變量開始,然后根據(jù)判據(jù)引入變量,判據(jù)是,得分統(tǒng)計量的顯著性水平;變量被剔除的依據(jù)是,最大偏似然估計所得的似然比統(tǒng)計量的概率值。
表2是模型的參數(shù)擬合結果,從Wals檢驗的Sig.值可知,模型的擬合度較好(P=.000<0.05,P=.007<0.05),可以看出安岳縣體育人口人數(shù)與文化程度、全民健身認識情況和健身喜歡度密切相關。
表2 模型中的變量
依據(jù)表2可得到相應的回歸方程:
上式反映了安岳縣居民對體育健身的喜歡度對參與體育健身人數(shù)影響最大,影響系數(shù)為0.56,喜歡程度越高,參與體育健身的可能性越高。其次是居民的文化程度,影響系數(shù)為0.236,文化越高,居民參與體育健身的可能性越高。最后是居民對全民健身認識情況,影響系數(shù)是0.203,居民對全民健身認識越充分,參與體育健身的可能性越高。
2.2 二項Logistic回歸系數(shù)檢驗
表3是將變量文化程度、全民健身認識情況和健身喜歡度納入模型后,模型的全局檢驗結果。且本例采取了3種方法:步驟(歩與步間的相對似然比檢驗)、塊(塊間相對似然比檢驗)和模型(模型間相對似然比檢驗)。從Sig值可知,模型具有顯著統(tǒng)計意義。
表3 模型系數(shù)的綜合檢驗
表4是模型的分類預測值,當文化程度、全民健身認識情況和健身喜歡度進入模型后,模型的預測精確度達到71.9%,預測精確度較高。
表4 模型分類預測值
2.3 回歸系數(shù)的解釋—虛擬自變量
2.3.1 安岳縣不同文化程度居民參與體育健身人數(shù)比較
文化程度是品質的變量。在本次調查中,設計了6個分類:不識字或識字不多、小學、初中、高中、大專、本科以上。在二項Logistic回歸分析中將文化程度這個品質變量轉化成5個取值為0/1的虛擬變量。(見表5)
表5 文化程度虛擬變量的取值及其代表類別
在回歸分析中,將文化程度作作為解釋變量納入回歸模型中,實際參與回歸分析的是以上5個虛擬變量,相應回歸分析結果(見表6)。
表6 模型中的變量
由此可得Y與X2對應的5個虛擬變量間的回歸模型如下:
表6最后一列Exp(B)表示文化程度分別為小學、初中、高中、大專、本科以上的參與體育健身人數(shù)是不識字或識字不多這個參照類參與體育健身人數(shù)的1.773、1.729、2.678、3.575、4.333倍。從數(shù)據(jù)可以看出,居民參與體育健身的人數(shù)隨著文化程度的增加而增加。
2.3.2 安岳縣不同健身喜歡度居民參與體育健身人數(shù)比較將具有4個分類的健身喜歡程度,轉換成3個虛擬變量,進行二此處不直接分析項Logistic回歸分析,自變量采用強迫進入模型的方法,全部進入模型?;貧w結果(見表7)。
表7 模型中的變量
由表7可得Y與X6的3個虛擬變量間的回歸模型如下:
2.3.3 安岳縣居民全民健身認識情況對參與體育健身人數(shù)影響
表8 模型中的變量
由表8可得Y與X6的3個虛擬變量間的回歸模型如下:
從Exp(B)的取值可知,安岳縣參與體育健身人數(shù)發(fā)生比隨著居民對全民健身認識程度的增加而增加。當表中對應Sig.值小于0.05時,表示結果具有顯著統(tǒng)計意義,大于等于0.05時,表示結果不具有顯著統(tǒng)計意義,可能是由于誤差所致,因此表中X59的值為異常值,不予關注。其中X54、X55、X56、X57的Sig.值依次為0.038、0.001、0.025、0.035都小于0.05,具有顯著統(tǒng)計意義,表明當安岳縣居民對全民健身認識的得分在5分到8分之間時,參與體育健身人數(shù)發(fā)生比依次是參照類的2.071、2.765、4.333、4.000倍。
影響安岳縣居民參與體育健身的二項Logistic回歸分析結果顯示:居民參與體育健身的人數(shù)隨著文化程度的增加而增加;安岳縣參與體育健身的人數(shù)隨居民對體育健身的喜歡程度的增加而增加。對全民健身認識程度處于中間水平的居民參與體育健身人數(shù)發(fā)生比是最高的,與一般認為的對體育健身認識情況越高,參與體育健身可能性越大不同。未進入模型的因素有性別、家庭人均收入、從事行業(yè)和體育健身的重要性認識,這與安岳縣的具體情況完全吻合。
[1]盧紋岱.SPSS統(tǒng)計分析[M].北京:電子工業(yè)出版社,2010.
[2]何國民.體育人口形成因素的二項logistic回歸分析[J].武漢體育學報,2006(12).
G812.4
A
2095-2813(2014)10(b)-0134-02
江媚(1980,3—),女,成都理工大學體育學院,講師,碩士,研究方向:體育人文社會學。
曹玥(1991,7—),女,上海交通大學數(shù)學系在讀研究生,研究方向:應用數(shù)學。
王心雨(1993,7—),女,成都理工大學體育學院在讀學生,研究方向:社會體育管理。