申冰可 邵林芳
摘要:培養(yǎng)和吸收優(yōu)秀大學(xué)生入黨是高校黨建工作的需要。為了分析大學(xué)生入黨意愿自身影響因素和動(dòng)機(jī),基于首都大學(xué)生成長(zhǎng)基線報(bào)告,通過(guò)二元邏輯回歸,進(jìn)行[χ2]檢驗(yàn)和t檢驗(yàn),從而獲得影響力較大的因子。利用決策樹(shù)CHAID模型,預(yù)測(cè)大學(xué)生是否打算在大學(xué)期間入黨。實(shí)驗(yàn)結(jié)果顯示,政治面貌是大學(xué)生是否入黨的第一要素,其次是日后期望工作單位。成績(jī)排名與是否取得獎(jiǎng)勵(lì)和榮譽(yù)也是重要的影響因素,成績(jī)排名越靠前或已經(jīng)取得榮譽(yù)或獎(jiǎng)勵(lì)意愿入黨的概率越高。CHAID模型通過(guò)交叉測(cè)試的預(yù)測(cè)準(zhǔn)確率為73.3%,高于隨機(jī)的50%,具有現(xiàn)實(shí)性意義。另外,除了自身相關(guān)因素外,還有家庭、學(xué)校、社會(huì)等環(huán)境影響。在大學(xué)生自身意愿的前提下,外界的積極引導(dǎo)同樣重要。
關(guān)鍵詞:決策樹(shù);數(shù)據(jù)挖掘;入黨意愿;影響因素;二元邏輯回歸
中圖分類號(hào):G642? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)08-0000-03
1 引言
教育的改革和發(fā)展使得大學(xué)生的人數(shù)日益增加。大學(xué)是青春的一個(gè)重要階段,大學(xué)生的入黨意愿反映了他們對(duì)黨的領(lǐng)導(dǎo)的堅(jiān)定程度。探究影響大學(xué)生入黨意愿的因素,從而引導(dǎo)大學(xué)生入黨,是推動(dòng)高校黨建的保障。此前,已有部分研究根據(jù)理論分析大學(xué)生入黨意愿影響因素。例如,張銳[1]從社會(huì)、家庭和學(xué)校方面分析入黨意愿動(dòng)機(jī)影響的原因;另張銳[2]將入黨意愿分類并從社會(huì)、學(xué)校、個(gè)人、家庭和宗教四個(gè)方面,分析此類因素對(duì)高校教師與大學(xué)生入黨意愿的影響;姚斌[3]用計(jì)劃行為理論驗(yàn)證其主觀因素對(duì)入黨意愿的直接和間接影響;王君濤[4]采用結(jié)構(gòu)化方程,對(duì)大學(xué)生入黨意愿影響路徑分析。但是以上研究大多從消減大學(xué)生入黨意愿的影響因素探究,并且沒(méi)有進(jìn)行相關(guān)的預(yù)測(cè)分析。本文采用logistic回歸,獲得高置信度的因子,建立卡方自交互偵測(cè)決策樹(shù)(CHAID)模型,深入全面探究影響大學(xué)生入黨意愿自身因素并預(yù)測(cè)分析實(shí)驗(yàn)結(jié)果,為提高大學(xué)生入黨意愿提供充分的理論依據(jù)。
2 數(shù)據(jù)及其初步統(tǒng)計(jì)分析
2.1 數(shù)據(jù)
本文的數(shù)據(jù)來(lái)自中國(guó)人民大學(xué)中國(guó)調(diào)查數(shù)據(jù)中心的常規(guī)項(xiàng)目——首都大學(xué)生成長(zhǎng)跟蹤調(diào)查(2009)的基線數(shù)據(jù)。數(shù)據(jù)基于概率抽樣的原則選取調(diào)查對(duì)象,隨機(jī)從北京市15所高校的2008級(jí)(大一)和2006級(jí)(大三)抽取5100個(gè)樣本進(jìn)行調(diào)查。其中,4771人參與調(diào)查,應(yīng)答率為93.55%。調(diào)查內(nèi)容包括大學(xué)生在校時(shí)的基本情況、心理量表、高中情況、大學(xué)學(xué)業(yè)、大學(xué)政治、家庭情況等諸多信息,調(diào)查采用多階分層抽樣方式,因此該數(shù)據(jù)集可以在一定程度上支撐本課題的研究。
2.2 樣本特征與統(tǒng)計(jì)學(xué)分析
該問(wèn)卷通過(guò)“是否打算大學(xué)期間入黨”確定大學(xué)生入黨意愿,分為打算和不打算兩類??紤]包括基本信息、自身實(shí)力與自我規(guī)劃等因素,通過(guò)人工篩選,最終確定12個(gè)可能與入黨意愿密切相關(guān)的特征因素:民族、戶口性質(zhì)、性別、大學(xué)年級(jí)、現(xiàn)專業(yè)、大學(xué)期間是否獲得獎(jiǎng)勵(lì)和榮譽(yù)、成績(jī)排名、政治面貌、大學(xué)期間是否擔(dān)任過(guò)干部、畢業(yè)后最希望去的單位、對(duì)我國(guó)整體發(fā)展?fàn)顩r滿意度、認(rèn)為家庭經(jīng)濟(jì)層次。其中,為便于使用,將成績(jī)排名通過(guò)(1-班級(jí)排名/班級(jí)人數(shù))×100得到連續(xù)的值,數(shù)值越大代表排名越靠前。對(duì)于刻度變量(即連續(xù)變量)的缺失值采用平均值填補(bǔ),對(duì)于名義變量(在現(xiàn)有前提或條件下確定的值)的缺失值用眾數(shù)填補(bǔ)。經(jīng)計(jì)算,成績(jī)排名和對(duì)我國(guó)整體發(fā)展?jié)M意度刻度變量的峰度絕對(duì)值小于10并且偏度絕對(duì)值小于3,因此基本可接受為正態(tài)分布。
3 基于Logistic 回歸和決策樹(shù)的數(shù)據(jù)分析
3.1 Logistic回歸相關(guān)性探究
本文研究的是大學(xué)生在大學(xué)期間是否打算入黨,因變量表示入黨意愿,取值只有兩項(xiàng),將打算入黨賦值為1,不打算入黨賦值為0。采用二元Logistic回歸模型,如式(1):
其中,[β0]是常數(shù)項(xiàng),[ βi]是自變量[Xi]的回歸系數(shù)。[p]為打算入黨的可能性。[p]在0到1之間變化(公式(1)中[p]表示愿意入黨的概率)。[X]為影響大學(xué)生入黨意愿的相關(guān)變量。
分別采用[χ2]檢驗(yàn)和[t]檢驗(yàn),計(jì)算人工篩選后變量與因變量的依賴度。對(duì)刻度變量(對(duì)當(dāng)前我國(guó)整體發(fā)展?fàn)顩r滿意程度和認(rèn)為家庭經(jīng)濟(jì)層次)采用t檢驗(yàn),對(duì)名義變量采用[χ2]檢驗(yàn)。[χ2]統(tǒng)計(jì)值或[t]值越大,說(shuō)明兩個(gè)變量的相關(guān)性越高。有關(guān)人工篩選后的變量的分布情況,參見(jiàn)表1。
3.2 CHAID模型創(chuàng)建與分析
卡方自交互檢測(cè)決策樹(shù)(Chi-squared Automatic Interaction Detector,CHAID),分類樹(shù)方法,按照卡方顯著性劃分或組合形成多叉樹(shù)狀結(jié)構(gòu)。定距和定類變量均可作為目標(biāo)變量,適宜于預(yù)測(cè)變量為分類變量的情況。CHAID決策樹(shù)將因變量作為根節(jié)點(diǎn),按照[χ2]值最大(P值最?。┻x取變量的原則建立樹(shù)。
對(duì)CHAID模型,將父節(jié)點(diǎn)中的最小案例數(shù)設(shè)置為100,將子節(jié)點(diǎn)中的最小案例數(shù)設(shè)置為30。拆分節(jié)點(diǎn)的顯著性水平為0.05,合并類別的顯著性水平為0.1。合并和拆分條件的顯著性值采用Bonferroni方法進(jìn)行調(diào)整。通過(guò)樣本分割驗(yàn)證30%的測(cè)試樣本與70%的訓(xùn)練樣本用來(lái)檢驗(yàn)決策樹(shù)的分類效果。其中,成績(jī)排名與對(duì)我國(guó)目前發(fā)展?fàn)顩r滿意度的區(qū)間均設(shè)定為25。利用單因素logistic回歸得到的具有統(tǒng)計(jì)學(xué)意義的變量,最終生成最大樹(shù)深度為3,有22個(gè)節(jié)點(diǎn)和14個(gè)終端節(jié)點(diǎn)數(shù)的樹(shù)。包括政治面貌、大學(xué)年級(jí)、畢業(yè)后最希望去的單位、大學(xué)期間是否擔(dān)任班委、成績(jī)排名、大學(xué)期間是否獲得榮譽(yù)以及對(duì)我國(guó)整體發(fā)展整體滿意度7個(gè)自變量。結(jié)果如圖1所示。
在決策樹(shù)模型圖中,從節(jié)點(diǎn)0可以看出打算在大學(xué)期間入黨的大學(xué)生占多數(shù)(65.1%)。第一層分類的因素是政治面貌,預(yù)測(cè)結(jié)果為共青團(tuán)員和民主黨派傾向于入黨(61.6%),普通群眾入黨意愿稍弱(20.8%),說(shuō)明已經(jīng)向黨組織靠攏的人入黨意愿更大,共產(chǎn)黨員(含預(yù)備黨員)因已經(jīng)或即將成為黨員所以不再進(jìn)行分析。對(duì)于節(jié)點(diǎn)4和節(jié)點(diǎn)5,大學(xué)一年級(jí)(72.5%)的學(xué)生比大學(xué)三年級(jí)(47%)的學(xué)生更傾向入黨。入黨的流程需要消耗一定的時(shí)間,低年級(jí)學(xué)生在校剩余時(shí)間更長(zhǎng),入黨成功率更高。從節(jié)點(diǎn)5可知,畢業(yè)后最理想的工作單位也影響大學(xué)生入黨意愿。其中,希望未來(lái)到黨政機(jī)關(guān)和大型國(guó)有企業(yè)的大學(xué)生打算入黨的意愿更高(66.8%),其次是到學(xué)校,科研機(jī)構(gòu)以及其他國(guó)有和集體企業(yè)的學(xué)生(50%),而傾向去外企或合資企業(yè)、創(chuàng)業(yè)、民營(yíng)企業(yè)和一般事業(yè)單位打算入黨的大學(xué)生(35.8%)較少。在節(jié)點(diǎn)7,對(duì)我國(guó)整體發(fā)展?fàn)顩r滿意度高于75%的入黨意愿為71.3%,低于75%的為57.1%。在節(jié)點(diǎn)8,隨著成績(jī)排名下降,以34名次和68名次為分界點(diǎn),打算入黨的比例分別是89.9%、86.9%和64.1%,表明成績(jī)更好的學(xué)生有入黨意愿的概率越高。在節(jié)點(diǎn)12,擔(dān)任過(guò)學(xué)生干部(59.3%)比未擔(dān)任過(guò)學(xué)生干部(43.1%)的入黨意愿更強(qiáng)。2F64113D-F082-465A-BB82-FB64D92889B9
3.3 模型測(cè)試結(jié)果與評(píng)價(jià)
模型通過(guò)自動(dòng)減枝去除現(xiàn)專業(yè)、認(rèn)為家庭經(jīng)濟(jì)層次兩種因子。對(duì)模型交叉測(cè)試得到表2。將結(jié)果分為了四類:真負(fù)-將打算入黨的學(xué)生預(yù)測(cè)為打算入黨,假負(fù)-將不打算入黨的學(xué)生預(yù)測(cè)為打算入黨,真正-將不打算入黨的學(xué)生預(yù)測(cè)為不打算入黨,假正-將打算入黨的學(xué)生預(yù)測(cè)為不打算入黨。其中將實(shí)際不打算入黨預(yù)測(cè)為不打算入黨數(shù)為597,占比51.5%,預(yù)測(cè)正確率即真正率較低。將實(shí)際打算入黨預(yù)測(cè)為打算入黨的預(yù)測(cè)正確率即真負(fù)率較高為84.7%,預(yù)測(cè)成功率較高。總體正確率為73.3%。
因模型僅對(duì)個(gè)人因素探究,且沒(méi)有對(duì)其進(jìn)行多因素logistic回歸分析,所以預(yù)測(cè)率未達(dá)到80%。但從研究的角度來(lái)看,仍具有一定的參考價(jià)值。如果對(duì)各因素進(jìn)行多元分析,并結(jié)合家庭、學(xué)校和社會(huì)等外部因素,對(duì)提高準(zhǔn)確度有積極意義,后續(xù)需要更深入的研究。
4 結(jié)語(yǔ)
從決策樹(shù)模型可以看出,對(duì)大學(xué)生入黨意愿影響最大的因素是政治面貌,共青團(tuán)是黨的助手和后備力量,共青團(tuán)員進(jìn)入大學(xué)后,在政治上仍有理想與追求。其次是畢業(yè)后期望工作單位,工作單位不同入黨意愿不同體現(xiàn)了大學(xué)生的入黨動(dòng)機(jī)的功利性。這種現(xiàn)實(shí)傾向?qū)h組織和學(xué)生本身均存在危害,應(yīng)采取相關(guān)措施積極避免。成績(jī)排名靠前或獲得過(guò)榮譽(yù)的大學(xué)生往往有更高的追求,渴望加入黨組織。本文提出的模型預(yù)測(cè)率為73.3%??紤]到家庭因素(如家庭成員對(duì)大學(xué)生的思想教育等)、社會(huì)因素(如黨領(lǐng)導(dǎo)取得的一系列成就對(duì)大學(xué)生的吸引力等)、學(xué)校因素(如學(xué)校開(kāi)展的政治思想教育的力度)等個(gè)體以外的因素對(duì)大學(xué)生入黨意愿都有較大的影響,本文模型還有較大的改進(jìn)空間,后續(xù)將進(jìn)一步考慮上述因素對(duì)學(xué)生入黨意愿的影響,并為促進(jìn)大學(xué)生入黨提供指導(dǎo)意見(jiàn)。大學(xué)生應(yīng)該積極提高自身素質(zhì),不斷完善自我,成為“四有”新人。同時(shí),社會(huì)、學(xué)校和家庭層面也要加強(qiáng)對(duì)大學(xué)生的思想政治教育和輔導(dǎo),形成教育合力,為高校黨建工作注入更加新鮮的血液。
參考文獻(xiàn):
[1] 張銳.高校大學(xué)生入黨意愿分析[J].共產(chǎn)黨員(河北),2015(26):62.
[2] 張銳.高校青年教師和大學(xué)生入黨意愿深度分析——以寧夏師范學(xué)院為例[J].寧夏師范學(xué)院學(xué)報(bào),2015,36(5):158-160.
[3] 姚斌.基于計(jì)劃行為理論的高職學(xué)生入黨意愿和行為的影響因素研究[J].職教通訊,2020,35(2):55-63.
[4] 王君濤,沙治邦,王云龍.大學(xué)生入黨意愿影響因素及引導(dǎo)策略[J].沈陽(yáng)建筑大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2019,21(4):411-416.
[5] 宋文凱,汪睿琪.Logistic回歸與CHAID探究高考成長(zhǎng)環(huán)境影響與結(jié)果預(yù)測(cè)[J].信息技術(shù)與信息化,2020(7):83-86.
[6] 李如平.數(shù)據(jù)挖掘中決策樹(shù)分類算法的研究[J].東華理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,33(2):192-196.
[7] 姚爽,謝夢(mèng)婷,鄒迪莎,等.空腹血糖受損危險(xiǎn)因素的Logistic回歸及分類樹(shù)分析[J].安徽醫(yī)科大學(xué)學(xué)報(bào),2018,53(9):1407-1411.
[8] 晁靈,李然,梁利花.分類樹(shù)模型與Logistic回歸在兒童高血壓預(yù)測(cè)中的應(yīng)用[J].中國(guó)學(xué)校衛(wèi)生,2015,36(7):1066-1068.
[9] 王君濤.系統(tǒng)科學(xué)視閾下大學(xué)生入黨意愿影響因素研究[J].河北青年管理干部學(xué)院學(xué)報(bào),2020,32(1):15-22.
[10] 胡小軍.新時(shí)期激發(fā)培育大學(xué)生入黨意愿的途徑研究[J].廣西青年干部學(xué)院學(xué)報(bào),2011,21(6):15-17.
[11] 苗楠.民辦高校大學(xué)生入黨意愿與動(dòng)機(jī)現(xiàn)狀分析——以寧夏理工學(xué)院為例[J].現(xiàn)代商貿(mào)工業(yè),2016,37(30):151-152.
[12] 胡小軍.新時(shí)期激發(fā)培育大學(xué)生入黨意愿的途徑研究[J].廣西青年干部學(xué)院學(xué)報(bào),2011,21(6):15-17.
[13] 張海平,李堅(jiān).工科大學(xué)生入黨積極性的影響因素及對(duì)策研究——以華南農(nóng)業(yè)大學(xué)為例[J].學(xué)理論,2013(29):355-357.
[14] 張?jiān)?高職院校學(xué)生入黨意愿的調(diào)查研究[J].長(zhǎng)沙民政職業(yè)技術(shù)學(xué)院學(xué)報(bào),2018,25(1):59-61.
[15] 馬圣.發(fā)揮榜樣引導(dǎo)作用 端正大學(xué)生入黨動(dòng)機(jī)[J].求知,2018(9):49-50.
[16] 劉軍.高校學(xué)生黨員發(fā)展工作存在的問(wèn)題及對(duì)策探析[J].山東社會(huì)科學(xué),2010(9):173-176.
[17] 黃玖琴,王德召.地方高校大學(xué)生入黨動(dòng)機(jī)研究[J].學(xué)校黨建與思想教育,2019(16):22-23.
【通聯(lián)編輯:王力】2F64113D-F082-465A-BB82-FB64D92889B9