邢窈窈 唐麗 郭磊
摘 要:本文通過對校園刷卡行為進(jìn)行分析,運用數(shù)理統(tǒng)計模型,研究了學(xué)生成績排名的影響因素并對成績排名進(jìn)行預(yù)測。首先,利用因子分析,研究哪些因素屬于哪些潛在因子(即類別),并通過逐步回歸法得出學(xué)生成績排名回歸模型。然后,根據(jù)分析結(jié)果,有針對性地提出提高學(xué)生成績排名的實際措施。最后,利用主成份分析,得到各學(xué)生的預(yù)測成績排名,并與學(xué)生的實際排名相對照。結(jié)果表明:校園刷卡行為是反映學(xué)生學(xué)習(xí)表現(xiàn)的重要因素,體現(xiàn)了學(xué)生的自發(fā)行為,運用一卡通數(shù)據(jù)預(yù)測學(xué)生的學(xué)習(xí)成績?yōu)閷W(xué)生活動管理和學(xué)生成績提高提供了方向和方法。
關(guān)鍵詞:因子分析;逐步回歸;主成分分析;成績排名預(yù)測
中圖分類號:G40-051 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-8454(2018)09-0082-05
一、引言
目前,一卡通成為記錄學(xué)生眾多數(shù)據(jù)的承載者,除了學(xué)生的各種消費數(shù)據(jù),還包括各種圖書館數(shù)據(jù),與學(xué)生的生活息息相關(guān)。[1]這些數(shù)據(jù)背后體現(xiàn)的是學(xué)生的消費習(xí)慣、生活規(guī)律性、活躍度等。這些快速及時的一卡通數(shù)據(jù),可以及時更新,是對學(xué)生自發(fā)行為的反映,受外界影響較小。是否能根據(jù)與學(xué)生成績無直接聯(lián)系的一卡通數(shù)據(jù)對學(xué)生成績進(jìn)行預(yù)測,是本文研究的方向與重點。
已有文獻(xiàn)中,對學(xué)生成績排名的考核大多是采用平均學(xué)分績法,利用學(xué)生的多門學(xué)科考試成績對該生進(jìn)行評價。[2]有不少學(xué)者利用問卷調(diào)查方法和查閱文獻(xiàn)等,構(gòu)建成績排名評價體系,[3]對學(xué)生的成績進(jìn)行評價。 在學(xué)習(xí)差異比較方面,唐興蕓采用參數(shù)方差分析等方法對學(xué)生平均績點進(jìn)行比較,[4]然而利用這種方法忽略了學(xué)生的生活習(xí)慣、心理因素的影響。在黃紅安、文衛(wèi)平[5]的研究以及郭繼東[6]的研究中,加入了學(xué)習(xí)動機組成因素。在馮業(yè)棟、傅旭東、何建華的大學(xué)生助學(xué)體系研究中考慮多種因素,[7]給出構(gòu)建體系的意見。
本文在學(xué)習(xí)總結(jié)前人經(jīng)驗的基礎(chǔ)上,采用多方位的評價體系,對學(xué)生的一卡通數(shù)據(jù)進(jìn)行整理與研究,利用統(tǒng)計學(xué)的方法,運用相關(guān)性分析,得出10個與成績排名相關(guān)性較大的指標(biāo)。與人們傳統(tǒng)認(rèn)知相反,借書量,專業(yè)書比例,日均圖書館消費、校車總次數(shù)等指標(biāo)與成績排名不相關(guān),也可以從側(cè)面反映出,大多數(shù)學(xué)生借書后放到一邊,并沒有進(jìn)行深入的學(xué)習(xí)與領(lǐng)會。文中選取10個相關(guān)性大的指標(biāo),采取因子分析[8-10] 和主成分分析[11-12]的方法,對學(xué)生成績排名進(jìn)行評價和預(yù)測。
成績排名是衡量一個學(xué)生學(xué)習(xí)能力的標(biāo)準(zhǔn),結(jié)合一卡通相關(guān)數(shù)據(jù)的分析,給出相關(guān)的建議,對于剛進(jìn)入大學(xué)的大一學(xué)生具有指導(dǎo)意義,使他們能夠盡快地適應(yīng)大學(xué)生活,在以后的學(xué)習(xí)生活中抓住關(guān)鍵和重點,提高學(xué)習(xí)意識,為以后掌握專業(yè)知識與能力做好準(zhǔn)備。
二、研究設(shè)計
1.學(xué)生成績排名評價指標(biāo)體系構(gòu)建
根據(jù)研究目的和數(shù)據(jù)來源,充分利用一卡通數(shù)據(jù)集中的相關(guān)數(shù)據(jù),在借鑒國內(nèi)相關(guān)問題指標(biāo)體系研究的基礎(chǔ)和對學(xué)生的調(diào)查研究中,得知學(xué)生成績排名的側(cè)面評價是多方面的,選用的指標(biāo)也各不相同。從消費習(xí)慣、活躍度、生活規(guī)律性、勤奮程度等方面選取了10個指標(biāo),這10個指標(biāo)對學(xué)生成績排名產(chǎn)生不同程度的影響,而且彼此之間還存在內(nèi)在聯(lián)系。所選指標(biāo)及在本文中的代碼具體如下:X1(日均消費)、X2(在宿舍時間所占比例)、X3(周沐浴次數(shù))、X4(日均食堂吃飯次數(shù))、X5(文印中心總次數(shù))、X6(日均打水次數(shù))、X7(校醫(yī)院總次數(shù))、X8(日均超市消費)、X9(日均食堂消費)、X10(晚歸次數(shù))。其中,X1是指平均每天的總消費,X2代表一天中在宿舍度過的時間所占比例,X3代表每周沐浴的平均次數(shù),X5指在固定時間段去文印中心打印的總次數(shù),X6代表平均每天打水的次數(shù),X7是指去校醫(yī)院看病的總次數(shù),X8、X9分別指平均每天在超市、食堂消費的費用,X10代表每天晚于8點回宿舍的總次數(shù)。
2.數(shù)據(jù)來源
本文所采用數(shù)據(jù)來源于某高校兩個學(xué)年內(nèi)學(xué)生使用一卡通在校刷卡的數(shù)據(jù)。
①一卡通數(shù)據(jù):學(xué)生ID、消費類別、消費地點、消費方式、消費時間、消費金額、剩余金額。
②寢室門禁數(shù)據(jù):學(xué)生ID、具體時間、進(jìn)出方向(0進(jìn)寢室,1出寢室)。
③圖書館借書數(shù)據(jù):學(xué)生ID、借書日期、書籍名稱及作者、書籍中圖分類號。
④圖書館門禁數(shù)據(jù):學(xué)生ID、門禁編號、具體時間。
⑤學(xué)生成績排名數(shù)據(jù):學(xué)生ID、學(xué)院編號、成績排名等。
3.數(shù)據(jù)整理及分析
一卡通數(shù)據(jù):學(xué)生的在校消費、消費類別為POS消費、充值等,消費方式主要有淋浴、開水、洗衣房、文印中心、教務(wù)處、圖書館、超市、食堂、校車、校醫(yī)院等。對10號學(xué)院學(xué)生的一卡通數(shù)據(jù)統(tǒng)計,得出日均消費最大金額為27.2元,日均食堂消費最大金額為16.2元,日均超市消費最大金額為6元,可以看出學(xué)生的消費主要是食堂消費。
寢室門禁數(shù)據(jù):通過對學(xué)生的寢室門禁數(shù)據(jù)分析,學(xué)生一學(xué)年中平均有54.5%的時間在宿舍度過,有2%的學(xué)生一學(xué)年中有73.5%的時間在宿舍度過。
圖書館借書數(shù)據(jù):對學(xué)生的圖書館借書數(shù)據(jù)統(tǒng)計,在兩個學(xué)年內(nèi),學(xué)生平均借書45本,借書超過45本的有37名學(xué)生,可見有44.5%的學(xué)生有良好借閱習(xí)慣。
圖書館門禁數(shù)據(jù):分析圖書館門禁數(shù)據(jù)發(fā)現(xiàn),學(xué)生平均有23次早于早晨9點進(jìn)圖書館且晚于晚上9點出圖書館,僅有一名學(xué)生出現(xiàn)過109次此現(xiàn)象。
因子分析與主成分分析相互關(guān)聯(lián)又有著各自的特點,二者都利用降維的思想。主成分分析是找出反映多個變量的獨立綜合指標(biāo),主成分個數(shù)等于原指標(biāo)的個數(shù),一般僅取少數(shù)幾個主成分作綜合指標(biāo);因子分析是得出解釋多個指標(biāo)的獨立的公因子,若初始公因子難以合理解釋,可進(jìn)一步進(jìn)行因子旋轉(zhuǎn)求得合理解釋。接下來首先利用因子分析能夠提取出公因子,并通過旋轉(zhuǎn)成分矩陣對影響成績的因子進(jìn)行合理的解釋,結(jié)合逐步回歸,探討各因子和公因子對成績影響的比重。而主成分分析主要是預(yù)測功能。
(1)因子分析法
采用 KMO和Bartletts檢驗,得出KMO值為0.621,根據(jù)測度標(biāo)準(zhǔn),一般 KMO 值大于 0.5 則認(rèn)為可以進(jìn)行因子分析; Bartletts 檢驗近似卡方值為356.971( 自由度為 91) ,伴隨概率值為0.000<0.05,達(dá)到了顯著性水平,說明因子的相關(guān)系數(shù)矩陣不是單位矩陣,相關(guān)矩陣間有共同因素存在,適合做因子分析,見表1。
利用因子分析對10個影響學(xué)生成績排名的因素進(jìn)行分類,如表2所示。前4個因子能夠解釋71.943%的總體方差。因子旋轉(zhuǎn)后,4個因子所占比例為26.097%、18.350%、15.038%、15.329%、12.167%,見表2。
表3顯示10個因素與4個因子之間的關(guān)系,因子負(fù)荷小于0.6的未被列出。10 個因素對顧客滿意度有顯著的關(guān)系。這 10 個因素可以解釋為:消費習(xí)慣(因子1),包括日均食堂消費X9、日均消費X1、日均食堂吃飯次數(shù)X4;活躍度(因子2),包括文印中心總次數(shù)X5、日均打水次數(shù)X6、校醫(yī)院總次數(shù)X7; 勤奮程度(因子3),包括在宿舍時間所占比例X2、晚歸次數(shù)X10;生活規(guī)律性(因子4),包括周沐浴次數(shù)X3。
(2)逐步回歸分析法
首先,對10個影響學(xué)生成績排名的因素進(jìn)行逐步回歸分析,根據(jù)表4可得:排名= -46.656*日均超市消費-16.439*日均食堂消費+16.309*文印中心總次數(shù)-3.050*晚歸次數(shù)+631.189(校正R方為0.454)。
從回歸方程可以看出,4個影響學(xué)生成績排名的因素進(jìn)入了方程,證明這4個因素對學(xué)生成績排名的影響顯著。其中,日均超市消費對學(xué)生成績排名的影響最大,日均食堂消費、文印中心總次數(shù)、晚歸次數(shù)對學(xué)生成績排名的影響次之,但仍然屬于顯著性因素。模型的解釋度為 0.454。
接下來,在因子分析的結(jié)果上,對四個因子進(jìn)行逐步回歸分析,從表5可得:排名=-107.583*消費習(xí)慣+88.234*活躍度-70.175*勤奮程度-38.327*生活規(guī)律性+382.218(校正R方=0.469)。表5系數(shù)a從回歸方程可以看出:消費習(xí)慣對學(xué)生成績排名的影響最大,活躍度、勤奮程度在消費習(xí)慣之后,而生活規(guī)律性對學(xué)生成績排名的影響最小,但仍然屬于顯著性因素。模型的解釋度為 0.469。
從因子分析的結(jié)果,我們可以看出消費習(xí)慣對學(xué)生排名影響最大,由于一卡通數(shù)據(jù)反映的是學(xué)生在學(xué)校的消費情況,在學(xué)校消費越多的學(xué)生排名越靠前?;钴S度越高,成績排名越靠后,學(xué)生可能會有一些別的事情需要處理或解決,學(xué)習(xí)時間相對來說比較少,所以排名靠后。而勤奮程度越高,成績排名越靠前,進(jìn)一步說明學(xué)習(xí)時間越多、越勤奮的學(xué)生,排名也靠前。生活規(guī)律性來看,生活越規(guī)律,排名越靠前。
如果僅從單因素來看,我們發(fā)現(xiàn)日均超市消費和日均食堂消費對學(xué)生成績排名影響很大,學(xué)生一卡通數(shù)據(jù)中顯示學(xué)生有時沒有每天在食堂或超市的消費記錄,說明這些學(xué)生選擇在學(xué)校以外的地方吃飯或進(jìn)行其它消費。而在校學(xué)生主要消費在食堂和超市,說明基本在學(xué)校消費的學(xué)生成績排名越靠前。結(jié)果表明,去文印中心次數(shù)越多的學(xué)生成績排名越靠后。據(jù)觀察,去文印中心次數(shù)較多的基本是社團(tuán)和學(xué)生會的相關(guān)人員,社團(tuán)和學(xué)生會需要進(jìn)行的活動比較多,所以,活躍在各種活動中的學(xué)生往往排名比較靠后。晚歸次數(shù)是指在晚上8點之后回宿舍的次數(shù),晚回宿舍的次數(shù)越多,成績排名越靠前,進(jìn)一步說明勤奮度越高,學(xué)生成績排名越靠前。
就研究結(jié)果來看,學(xué)生提高成績需做到以下幾點:
①盡量保證在學(xué)校的學(xué)習(xí)時間。
②對于學(xué)校舉辦的一些活動、學(xué)生會、社團(tuán),要適當(dāng)參加。
③提高自己的勤奮度,發(fā)揮自己的主動性。
④養(yǎng)成良好的生活規(guī)律。
(3)主成分分析法
主成分分析法旨在利用降維的思想,將原來具有一定相關(guān)性指標(biāo)轉(zhuǎn)化為少數(shù)幾個綜合性指標(biāo),且力保數(shù)據(jù)損失最少。該方法的具體步驟如下:①對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。②計算相關(guān)系數(shù)矩陣。③計算特征值與特征向量。④計算主成分載荷,確定主成分個數(shù)。⑤各主成分的得分。
首先,對各變量進(jìn)行標(biāo)準(zhǔn)化,將標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行相關(guān)性分析及提取主成分操作(4個主成分,累積貢獻(xiàn)率71.943%),見表6。從中提取出幾個重要指標(biāo)對學(xué)生成績排名進(jìn)行評價,進(jìn)而根據(jù)綜合得分對學(xué)生成績排名進(jìn)行預(yù)測分析。[13]
由表7數(shù)據(jù)可知,第一主成分主要影響因子是X1、X8、X9,它集中反映了學(xué)生的消費情況;第二主成分的主要影響因子是X7,它反映了學(xué)生的身體情況。
根據(jù)特征向量矩陣得到主成分計算公式:
Z1=0.484*X1+0.232*X2+0.2*X3+0.273*X4-0.268*X5-0.202*X6-0.125*X7+0.415*X8+0.446*X9+0.313*X10
Z2=0.175*X1-0.180*X2-0.09*X3+0.446*X4+0.394*X5+0.433*X6+0.530*X7-0.111*X8+0.296*X9+0.086*X10
Z3=-0.111*X1+0.531*X2+0.52*X3-0.082*X4+0.267*X5+0.302*X6-0.006*X7-0.082*X8-0.272*X9+0.433*X10
Z4=0.225*X1-0.288*X2+0.515*X3-0.497*X4+0.085*X5-0.107*X6+0.455*X7+0.283*X8-0.002*X9-0.22*X10
根據(jù)主成分計算公式計算學(xué)生排名預(yù)測:(見表8)
根據(jù)表8的結(jié)果,我們可以看出采用主成分分析法預(yù)測學(xué)生成績排名,與原有利用學(xué)生成績相比,在相差15個名次的條件下,成績排名預(yù)測的正確率達(dá)到43.6%。通過對學(xué)生一卡通數(shù)據(jù)的研究,學(xué)生的消費習(xí)慣、生活規(guī)律性對成績排名有一定的影響力。除此之外,學(xué)生的學(xué)習(xí)能力、綜合素質(zhì)及其他因素對于成績排名也有一定的影響。[14]
三、總結(jié)
本文通過對校園一卡通進(jìn)行分析和建模,通過因子分析和主成分分析等研究方法得出學(xué)生成績排名與消費習(xí)慣、活躍度、勤奮程度、生活規(guī)律性有關(guān)。從上述研究結(jié)果來看,大學(xué)生的成績排名歸結(jié)于最重要的一個因素:自律。不論是在日常消費,還是過多的參加活動,亦或是借書種類和對所借書籍的利用程度方面,都說明了自我控制[15]對一個大學(xué)生的重要性,這也是由于大學(xué)生自身的特點決定的。
在運用主成分分析方法對學(xué)生成績排名預(yù)測時,提取了兩個主成分,并進(jìn)行了相關(guān)的結(jié)果分析,但是由于每個學(xué)生的個體差異和成績影響因素的復(fù)雜性,不能通過一卡通提取的特征評價體系進(jìn)行總體概括和解釋,只能分類討論影響成績排名的指標(biāo)體系,如何建立一個完善準(zhǔn)確的成績排名評價體系,對于研究影響學(xué)生成績排名因素、探索成績排名預(yù)測方法有重要意義,也是后續(xù)研究的重要工作。
參考文獻(xiàn):
[1]何秀全.校園一卡通數(shù)據(jù)分析及應(yīng)用相關(guān)研究述評[J].華中師范大學(xué)學(xué)報(自然科版),2017(S1).
[2]孫余.基于因子分析法的高職學(xué)生成績評價[J].物聯(lián)網(wǎng)技術(shù),2013,3(3).
[3]萬來紅,陳治華,謝彬.普通高校公共體育課學(xué)生成績評價體系的構(gòu)建與實踐研究[J].武漢體育學(xué)院學(xué)報,2015,49(12).
[4]唐興蕓.少數(shù)民族學(xué)生學(xué)習(xí)差異比較研究——以黔南民族師范學(xué)院為例[J].貴州民族研究,2013,34(4).
[5]黃紅安,文衛(wèi)平.非英語專業(yè)本科生英語學(xué)習(xí)動機組成因素的實證研究[J].國外外語教學(xué),2005(3).
[6]郭繼東.研究生英語學(xué)習(xí)動機與成績、性別之關(guān)系研究[J].外語界,2009(5).
[7]馮業(yè)棟,傅旭東,何建華.大學(xué)生助學(xué)體系研究[J].重慶大學(xué)學(xué)報(社會科學(xué)版),2011,17(4).
[8]林海明.因子分析應(yīng)用中一些常見問題的解析[J].統(tǒng)計與決策,2012(15).
[9]辛督強,韓國秀.因子分析法在科技期刊綜合評價中的應(yīng)用[J].數(shù)理統(tǒng)計與理,2014,33(1).
[10]俞立平,劉愛軍.主成分與因子分析在期刊評價中的改進(jìn)研究[J].情報雜志,2014,33(12).
[11]林海明,杜子芳.主成分分析綜合評價應(yīng)該注意的問題[J].統(tǒng)計研究,2013,30(8).
[12]傅德印.主成分分析中的統(tǒng)計檢驗問題[J].統(tǒng)計教育,2007(9).
[13]程毛林.Matlab軟件在多元統(tǒng)計分析中的應(yīng)用[J].數(shù)理統(tǒng)計與管理,2008(2).
[14]趙琳,王文,李一飛,紀(jì)洪超,史靜寰.大學(xué)前教育經(jīng)歷對高等教育質(zhì)量的影響機制研究——兼議教育領(lǐng)域綜合改革[J].清華大學(xué)教育研究,2014,35(3).
[15]吳娜,張晨艷,周宗奎.兒童網(wǎng)絡(luò)行為與學(xué)業(yè)成績的關(guān)系:自我控制的調(diào)節(jié)效應(yīng)[J].心理與行為研究,2017,15(2).
(編輯:王曉明)