邏輯回歸在學(xué)生綜合素質(zhì)量化評估中的應(yīng)用

2016-11-16 14:50:44李蘋王麗花陶燕林

電腦知識與技術(shù) 2016年25期

李蘋+王麗花+陶燕林

摘要：將邏輯回歸方法，引入到學(xué)生綜合素質(zhì)量化評估領(lǐng)域。以一個班學(xué)生的綜合素質(zhì)評估成績?yōu)橛?xùn)練樣本，構(gòu)造預(yù)測模型、假設(shè)函數(shù)，并用梯度下降法得到模型的參數(shù)向量。根據(jù)參數(shù)向量構(gòu)造評選“省級三好學(xué)生”的邏輯回歸模型，對模型中各個特征的權(quán)重進(jìn)行分析。

關(guān)鍵詞：邏輯回歸；綜合素質(zhì)量化

中圖分類號：TP301 文獻(xiàn)標(biāo)識碼：A 文章編號：1009-3044（2016）25-0183-01

學(xué)生綜合素質(zhì)量化評估是促進(jìn)學(xué)生全面發(fā)展的重要手段。通過科學(xué)的綜合素質(zhì)量化評估體系可以幫助學(xué)生了解自己的長處和不足，找準(zhǔn)努力的方向，也是對學(xué)生進(jìn)行評優(yōu)的依據(jù)[1]。在綜合素質(zhì)評估系統(tǒng)中，不同的指標(biāo)由于權(quán)重不同，導(dǎo)致評價不同[2]。根據(jù)學(xué)生培養(yǎng)目標(biāo)的要求，量化評估的指標(biāo)包括：思想道德評價，文化知識素質(zhì)評價，身體心理素質(zhì)的評價，創(chuàng)新發(fā)展能力評價。

目前我校各個指標(biāo)在綜合素質(zhì)量化評估中的比重分別為20%、10%、10%、60%，表明我校學(xué)生在綜合素質(zhì)量化評估中各個特征的重要性。

然而，不同的評優(yōu)標(biāo)準(zhǔn)要求不完全一致，推優(yōu)時應(yīng)該有針對性。例如，省級三好學(xué)生的評選標(biāo)準(zhǔn)是“具有堅(jiān)定正確的政治方向，堅(jiān)持黨的基本路線……善于學(xué)習(xí)和吸收新知識，熱愛所學(xué)專業(yè)，勤奮學(xué)習(xí)，成績優(yōu)異……有較強(qiáng)的實(shí)踐能力……有健康的身體、良好的心理素質(zhì)……”。省級優(yōu)秀學(xué)生干部的評選標(biāo)準(zhǔn)是“有較高的思想政治素質(zhì)……熱心承擔(dān)社會工作……有很強(qiáng)的工作能力……”。

大四畢業(yè)之際，能否根據(jù)以往的綜合成績公平公正推選各種優(yōu)秀，是每個畢業(yè)生關(guān)注的焦點(diǎn)。因此，本研究從已有的綜合素質(zhì)量化評估成績出發(fā)，得出邏輯回歸模型，分析各個特征的權(quán)重，并與現(xiàn)有的指標(biāo)量化權(quán)重進(jìn)行比較，為有針對性地推優(yōu)提供參考依據(jù)。

1 邏輯回歸的基本原理

邏輯回歸是機(jī)器學(xué)習(xí)算法中的一種分類算法，適用于標(biāo)簽取值離散的情況。假設(shè)函數(shù)可以表示為：

其中，為邏輯回歸模型參數(shù)向量，x為該數(shù)據(jù)樣本特征值向量。為設(shè)定一個閾值，當(dāng)大于閾值時，判定該樣本屬于某一特定分類，反之亦然[3]。

邏輯回歸分類模型使用代價函數(shù)來衡量模型的精確度，正則化后的代價函數(shù)表示為：

其中，表示第i個數(shù)據(jù)樣本的特征向量。表示第i個樣本在訓(xùn)練集中的分類標(biāo)注，取值分別為1時表示樣本屬于某一類別，為0時表示樣本不屬于該類別。為正則化參數(shù)，控制在兩個不同的目標(biāo)中的平衡關(guān)系。正則化化后的代價函數(shù)可以保持假設(shè)的形式相對簡單，避免過度的擬合。能使取極小值的邏輯回歸模型參數(shù)向量就可以用于對新樣本的預(yù)測。

可以采用梯度下降法來求解參數(shù)最小化正則化代價函數(shù)的更新公式為：

其中，是學(xué)習(xí)速率，用于控制梯度下降的步長值。

2預(yù)測模型的建立

收集一個班50名學(xué)生7個學(xué)期的綜合素質(zhì)評估成績，取各個特征7個學(xué)期的平均值形成訓(xùn)練集樣本集，以評選“省級三好學(xué)生”為例建立測評模型，分析以往的推優(yōu)結(jié)果是否體現(xiàn)了“思想道德和文化知識素質(zhì)”為主要指標(biāo)的評價方式。

2.1變量說明

（1）y：測評結(jié)果，y=0表示沒有選中，y=1表示選中為省級三好學(xué)生

（2）x1：思想道德評估成績

（3）x2：文化知識素質(zhì)評價成績

（4）x3：身體心理素質(zhì)評價成績

（5）x4：創(chuàng)新發(fā)展評價成績

對50名學(xué)生的成績獲得50組數(shù)據(jù)（），i=1，2，…，50

2.2算法步驟

（1）構(gòu)造假設(shè)函數(shù)

（2）構(gòu)造代價函數(shù)

（3）最小化代價函數(shù)。用梯度下降法求出初始代價值和梯度值，然后調(diào)用Octave中的無線約束最小化函數(shù)fminunc，找到最佳值。

獲得

（4）根據(jù)構(gòu)造評選“省級三好學(xué)生”的預(yù)測模型為：

2.3模型評價

用該模型進(jìn)行預(yù)測，得到該模型的準(zhǔn)確率為98.08，查準(zhǔn)率為0.5，召回率為1，F(xiàn)值為0.67，所以即便訓(xùn)練數(shù)據(jù)集擁有偏斜類，但是算法表現(xiàn)很好。

3 邏輯回歸結(jié)論分析

通過邏輯回歸模型分析發(fā)現(xiàn)，權(quán)重從大到小分別是。表明該班在評選省級三好學(xué)生時，沒有完全把思想道德和文化知識素質(zhì)作為評價的標(biāo)準(zhǔn)，只是簡單按照綜合素質(zhì)量化評估的成績打分進(jìn)行評價，沒有針對性。所以，建議各班級在以后在各種推優(yōu)過程中應(yīng)該根據(jù)評選標(biāo)準(zhǔn)，有針對性的調(diào)整各個量化指標(biāo)的比重，而不能單純根據(jù)綜合素質(zhì)量化評估的原有成績。

參考文獻(xiàn)：

[1]李瑞勤.大學(xué)生綜合素質(zhì)量化評估初探[J].云南民族學(xué)院學(xué)報，2002，19（3）：118-119.

[2]梁寶華.基于數(shù)據(jù)挖掘的大學(xué)生綜合素質(zhì)評價系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].廣西：廣西師范大學(xué)，2007.

[3]高婕.邏輯回歸參數(shù)訓(xùn)練過程的MapReduce并行化實(shí)現(xiàn)[J].廣西技術(shù)師范學(xué)院學(xué)報，2015（5）：39.