李蘋+王麗花+陶燕林
摘要:將邏輯回歸方法,引入到學(xué)生綜合素質(zhì)量化評估領(lǐng)域。以一個班學(xué)生的綜合素質(zhì)評估成績?yōu)橛?xùn)練樣本,構(gòu)造預(yù)測模型、假設(shè)函數(shù),并用梯度下降法得到模型的參數(shù)向量。根據(jù)參數(shù)向量構(gòu)造評選“省級三好學(xué)生”的邏輯回歸模型,對模型中各個特征的權(quán)重進(jìn)行分析。
關(guān)鍵詞:邏輯回歸;綜合素質(zhì)量化
中圖分類號:TP301 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)25-0183-01
學(xué)生綜合素質(zhì)量化評估是促進(jìn)學(xué)生全面發(fā)展的重要手段。通過科學(xué)的綜合素質(zhì)量化評估體系可以幫助學(xué)生了解自己的長處和不足,找準(zhǔn)努力的方向,也是對學(xué)生進(jìn)行評優(yōu)的依據(jù)[1]。在綜合素質(zhì)評估系統(tǒng)中,不同的指標(biāo)由于權(quán)重不同,導(dǎo)致評價不同[2]。根據(jù)學(xué)生培養(yǎng)目標(biāo)的要求,量化評估的指標(biāo)包括:思想道德評價,文化知識素質(zhì)評價,身體心理素質(zhì)的評價,創(chuàng)新發(fā)展能力評價。
目前我校各個指標(biāo)在綜合素質(zhì)量化評估中的比重分別為20%、10%、10%、60%,表明我校學(xué)生在綜合素質(zhì)量化評估中各個特征的重要性。
然而,不同的評優(yōu)標(biāo)準(zhǔn)要求不完全一致,推優(yōu)時應(yīng)該有針對性。例如,省級三好學(xué)生的評選標(biāo)準(zhǔn)是“具有堅(jiān)定正確的政治方向,堅(jiān)持黨的基本路線……善于學(xué)習(xí)和吸收新知識,熱愛所學(xué)專業(yè),勤奮學(xué)習(xí),成績優(yōu)異……有較強(qiáng)的實(shí)踐能力……有健康的身體、良好的心理素質(zhì)……”。省級優(yōu)秀學(xué)生干部的評選標(biāo)準(zhǔn)是“有較高的思想政治素質(zhì)……熱心承擔(dān)社會工作……有很強(qiáng)的工作能力……”。
大四畢業(yè)之際,能否根據(jù)以往的綜合成績公平公正推選各種優(yōu)秀,是每個畢業(yè)生關(guān)注的焦點(diǎn)。因此,本研究從已有的綜合素質(zhì)量化評估成績出發(fā),得出邏輯回歸模型,分析各個特征的權(quán)重,并與現(xiàn)有的指標(biāo)量化權(quán)重進(jìn)行比較,為有針對性地推優(yōu)提供參考依據(jù)。
1 邏輯回歸的基本原理
邏輯回歸是機(jī)器學(xué)習(xí)算法中的一種分類算法,適用于標(biāo)簽取值離散的情況。假設(shè)函數(shù)可以表示為:
其中,為邏輯回歸模型參數(shù)向量,x為該數(shù)據(jù)樣本特征值向量。為設(shè)定一個閾值,當(dāng)大于閾值時,判定該樣本屬于某一特定分類,反之亦然[3]。
邏輯回歸分類模型使用代價函數(shù)來衡量模型的精確度,正則化后的代價函數(shù)表示為:
其中,表示第i個數(shù)據(jù)樣本的特征向量。表示第i個樣本在訓(xùn)練集中的分類標(biāo)注,取值分別為1時表示樣本屬于某一類別,為0時表示樣本不屬于該類別。為正則化參數(shù),控制在兩個不同的目標(biāo)中的平衡關(guān)系。正則化化后的代價函數(shù)可以保持假設(shè)的形式相對簡單,避免過度的擬合。能使取極小值的邏輯回歸模型參數(shù)向量就可以用于對新樣本的預(yù)測。
可以采用梯度下降法來求解參數(shù)最小化正則化代價函數(shù)的更新公式為:
其中,是學(xué)習(xí)速率,用于控制梯度下降的步長值。
2預(yù)測模型的建立
收集一個班50名學(xué)生7個學(xué)期的綜合素質(zhì)評估成績,取各個特征7個學(xué)期的平均值形成訓(xùn)練集樣本集,以評選“省級三好學(xué)生”為例建立測評模型,分析以往的推優(yōu)結(jié)果是否體現(xiàn)了“思想道德和文化知識素質(zhì)”為主要指標(biāo)的評價方式。
2.1變量說明
(1)y:測評結(jié)果,y=0表示沒有選中,y=1表示選中為省級三好學(xué)生
(2)x1:思想道德評估成績
(3)x2:文化知識素質(zhì)評價成績
(4)x3:身體心理素質(zhì)評價成績
(5)x4:創(chuàng)新發(fā)展評價成績
對50名學(xué)生的成績獲得50組數(shù)據(jù)(),i=1,2,…,50
2.2算法步驟
(1)構(gòu)造假設(shè)函數(shù)
(2)構(gòu)造代價函數(shù)
(3)最小化代價函數(shù)。用梯度下降法求出初始代價值和梯度值,然后調(diào)用Octave中的無線約束最小化函數(shù)fminunc,找到最佳值。
獲得
(4)根據(jù)構(gòu)造評選“省級三好學(xué)生”的預(yù)測模型為:
2.3模型評價
用該模型進(jìn)行預(yù)測,得到該模型的準(zhǔn)確率為98.08,查準(zhǔn)率為0.5,召回率為1,F(xiàn)值為0.67,所以即便訓(xùn)練數(shù)據(jù)集擁有偏斜類,但是算法表現(xiàn)很好。
3 邏輯回歸結(jié)論分析
通過邏輯回歸模型分析發(fā)現(xiàn),權(quán)重從大到小分別是。表明該班在評選省級三好學(xué)生時,沒有完全把思想道德和文化知識素質(zhì)作為評價的標(biāo)準(zhǔn),只是簡單按照綜合素質(zhì)量化評估的成績打分進(jìn)行評價,沒有針對性。所以,建議各班級在以后在各種推優(yōu)過程中應(yīng)該根據(jù)評選標(biāo)準(zhǔn),有針對性的調(diào)整各個量化指標(biāo)的比重,而不能單純根據(jù)綜合素質(zhì)量化評估的原有成績。
參考文獻(xiàn):
[1]李瑞勤.大學(xué)生綜合素質(zhì)量化評估初探[J].云南民族學(xué)院學(xué)報,2002,19(3):118-119.
[2]梁寶華.基于數(shù)據(jù)挖掘的大學(xué)生綜合素質(zhì)評價系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].廣西:廣西師范大學(xué),2007.
[3]高婕.邏輯回歸參數(shù)訓(xùn)練過程的MapReduce并行化實(shí)現(xiàn)[J].廣西技術(shù)師范學(xué)院學(xué)報,2015(5):39.