陶毅涵
摘 要:學(xué)風(fēng)推動(dòng)是學(xué)生工作的重要內(nèi)容,也是提升高校人才培養(yǎng)質(zhì)量的重要抓手。及早地發(fā)現(xiàn)學(xué)業(yè)困難學(xué)生,有利于提前開展有針對(duì)性的教育和幫扶工作,提高學(xué)風(fēng)推動(dòng)工作效果。隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,數(shù)據(jù)挖掘技術(shù)為識(shí)別學(xué)業(yè)困難學(xué)生提供了新方法。本文采用費(fèi)希爾線性判別法,將飛行器動(dòng)力工程2016屆畢業(yè)生的基本數(shù)據(jù)和行為數(shù)據(jù)作為訓(xùn)練集,建立該專業(yè)學(xué)業(yè)困難學(xué)生預(yù)警模型。經(jīng)驗(yàn)證,該模型具有較高類間離散度,模型基本能夠識(shí)別學(xué)業(yè)困難學(xué)生。通過學(xué)生基本數(shù)據(jù)和日常行為數(shù)據(jù),提前識(shí)別學(xué)業(yè)困難學(xué)生是可行的。
關(guān)鍵詞:學(xué)生工作;學(xué)業(yè)困難;數(shù)據(jù)挖掘;費(fèi)希爾線性判別法
一、引言
(一)研究目的
隨著高等教育向大眾化發(fā)展,高等教育招生規(guī)模逐年擴(kuò)大,進(jìn)入高校的“門檻”也隨之降低,如何提升高校的人才培養(yǎng)質(zhì)量面臨著新的挑戰(zhàn)。大力加強(qiáng)學(xué)風(fēng)推動(dòng)工作,幫助學(xué)業(yè)困難學(xué)生完成學(xué)業(yè),是提升高校人才培養(yǎng)質(zhì)量的有效手段,也是學(xué)生工作的重中之重。在龐大的學(xué)生群體中,提早識(shí)別學(xué)業(yè)困難風(fēng)險(xiǎn)學(xué)生,有利于及時(shí)對(duì)學(xué)生進(jìn)行幫扶和引導(dǎo),降低學(xué)業(yè)困難學(xué)生出現(xiàn)的概率,預(yù)防產(chǎn)生困難科目的累積,避免進(jìn)入課業(yè)負(fù)擔(dān)愈發(fā)加重的惡性循環(huán),同時(shí)也能夠提升學(xué)風(fēng)推動(dòng)工作的成效。
(二)研究現(xiàn)狀
自1963年Krik首次提出學(xué)習(xí)困難這一概念以來[1],學(xué)習(xí)困難研究的范圍和程度不斷擴(kuò)大和深入,但是對(duì)于這方面的研究仍然存在很多爭(zhēng)論。1965年 Bateman 首次提出了“能力與成績(jī)之間的差異”,提出“能力—成績(jī)差異”模型[2],該模型雖已被廣泛應(yīng)用,但仍受到來自多方的質(zhì)疑:不能及時(shí)診斷,即存在“等待失敗”;錯(cuò)誤鑒定,尤其是低智力水平學(xué)生;標(biāo)準(zhǔn)不統(tǒng)一,結(jié)論不能進(jìn)一步量化。“干預(yù)—反應(yīng)模型”[3]彌補(bǔ)了“能力—成績(jī)差異模型”的不足,具有進(jìn)行早期鑒定、減少錯(cuò)誤診斷人數(shù)以及為教育干預(yù)提供幫助等優(yōu)點(diǎn),但存在評(píng)估內(nèi)容過于狹隘、實(shí)證研究局限于低年級(jí)段和閱讀領(lǐng)域等缺陷。
組織行為學(xué)研究中提出:能夠通過研究組織中人的心理和行為表現(xiàn)及其客觀規(guī)律,提高管理人員預(yù)測(cè)、引導(dǎo)和控制人的行為的能力,以實(shí)現(xiàn)組織既定目標(biāo)[4]。這便提出了一個(gè)新的研究思路:通過研究學(xué)生的行為表現(xiàn)及客觀情況,預(yù)測(cè)學(xué)生的學(xué)習(xí)狀態(tài),辨別其是否存在學(xué)業(yè)困難的風(fēng)險(xiǎn)。隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展,學(xué)生的行為數(shù)據(jù)更容易獲得,這種研究思路能夠得以實(shí)踐。
(三)研究?jī)?nèi)容
本文基于天津市輔導(dǎo)員精品項(xiàng)目——移動(dòng)智能學(xué)生工作平臺(tái)的建立。從平臺(tái)中獲取大量的學(xué)生行為信息。以2016屆飛行器動(dòng)力工程專業(yè)學(xué)生的行為數(shù)據(jù)為訓(xùn)練集,采用費(fèi)希爾線性判別法(Fishers Linear discriminant)[5,6]進(jìn)行建模,得出該專業(yè)學(xué)業(yè)困難學(xué)生預(yù)警模型。并對(duì)該模型進(jìn)行驗(yàn)證和應(yīng)用分析。
二、建模方法
(一)費(fèi)希爾判別函數(shù)
費(fèi)希爾判別的思路是將多元觀測(cè)值x變換成一元觀測(cè)值y,使得由總體π1和π2導(dǎo)出的y盡可能地分離開。用x的線性組合來建立y,使它們是x的非常簡(jiǎn)單的函數(shù),易于計(jì)算和掌握,同時(shí)也解決了在應(yīng)用統(tǒng)計(jì)方法解決模式識(shí)別問題時(shí),經(jīng)常會(huì)遇到所謂的“維數(shù)災(zāi)難”的問題。
假定x的一個(gè)固定線性組合對(duì)來自第一個(gè)總體的觀測(cè)值來說其取值為y11,y12,…,對(duì)來自第二個(gè)總體的觀測(cè)值來說其取值為y21,y22,…。這兩組單變量數(shù)據(jù)之間的分離度用以標(biāo)準(zhǔn)差為單位的與之間的差別來表示,即:
分離度,其中(2-1)
為方差的聯(lián)合估計(jì)量。目標(biāo)是選擇適當(dāng)?shù)膞的線性組合,使得樣本均值與之間的分離度達(dá)到最大。經(jīng)驗(yàn)證,當(dāng)線性組合
(2-2)
對(duì)所有可能的線性系數(shù)使得分離度最大。
費(fèi)希爾對(duì)分離問題的解法也可以用于對(duì)新的觀測(cè)值作分類,其法則為:
若:
(2-3)
或
將x0分到π1。若:
或
將x0分到π2。
(二)訓(xùn)練樣本的獲取
建立預(yù)警模型的關(guān)鍵是根據(jù)訓(xùn)練樣本,得出準(zhǔn)確的。本文的訓(xùn)練樣本選取2016屆飛行器動(dòng)力工程277名學(xué)生的基本數(shù)據(jù)和行為數(shù)據(jù)兩部分,進(jìn)行全樣本的數(shù)據(jù)挖掘?;緮?shù)據(jù)包括:性別、年齡、民族、政治面貌、高考分?jǐn)?shù)、生源地、家庭經(jīng)濟(jì)情況、家庭關(guān)系情況、人際交往情況。行為數(shù)據(jù)包括:晚查寢情況、晚簽到時(shí)間、早操出勤情況、內(nèi)務(wù)檢查情況、日常請(qǐng)假次數(shù)、上課缺勤次數(shù)、參加集體活動(dòng)次數(shù)、宿舍門禁數(shù)據(jù)、與輔導(dǎo)員談話次數(shù)。
以上18個(gè)變量全部轉(zhuǎn)換為十進(jìn)制變量,即為費(fèi)希爾判別函數(shù)中的x,要計(jì)算式(2-1)中的分離度,還需要確定合理的線性系數(shù),即。線性系數(shù)的獲取采用學(xué)生工作專家及部分優(yōu)秀學(xué)生進(jìn)行打分的方法,以學(xué)生畢業(yè)時(shí)學(xué)業(yè)情況作為打分的依據(jù)。
三、預(yù)警模型
將x(277行)與(18列)帶入式(2-2)中可以得出每名學(xué)生的學(xué)業(yè)評(píng)價(jià)值,即和Sp無偏估計(jì),進(jìn)而可以求出最佳投影向量和計(jì)算閾值。訓(xùn)練結(jié)果圖形表示如圖3.1所示。
圖3.1 費(fèi)希爾方法對(duì)學(xué)業(yè)困難學(xué)生判別的圖形表示
模型中各個(gè)參數(shù)值如表3.1所示
表3.1 學(xué)業(yè)困難預(yù)警模型參數(shù)表
30.09 6.11
0.062 7.18×10-3
2.32×104 ? ? ? ? ? ? -6.11×102
-6.11×102 ? ? ? ? ? ? 3.09×104 3.44×10-2
四、模型應(yīng)用
預(yù)警模型的應(yīng)用可基于前期搭建的移動(dòng)智能學(xué)生工作平臺(tái)。該平臺(tái)包括基于微信的手機(jī)端前臺(tái),基于web服務(wù)器技術(shù)的管理后臺(tái)。前臺(tái)用于實(shí)現(xiàn)功能和應(yīng)用,獲取用戶信息;后臺(tái)將獲取的信息進(jìn)行分析和統(tǒng)計(jì),顯示結(jié)果并向前臺(tái)發(fā)送指令和消息。平臺(tái)結(jié)合互聯(lián)網(wǎng)云存儲(chǔ)技術(shù),采集并保存學(xué)生海量的日常行為數(shù)據(jù)。平臺(tái)能夠階段性的分析其他模塊采集到的學(xué)生行為信息,周期性的對(duì)全體學(xué)生進(jìn)行觀測(cè)值的進(jìn)行計(jì)算。若學(xué)生觀測(cè)值發(fā)生變化,被分為學(xué)業(yè)困難風(fēng)險(xiǎn)群體,及時(shí)送到輔導(dǎo)員的微信端進(jìn)行預(yù)警。數(shù)據(jù)挖掘流程如圖4-1所示。
五、結(jié)論
本文以2016屆飛行器動(dòng)力工程學(xué)生的全樣本數(shù)據(jù)作為訓(xùn)練樣本,利用費(fèi)希爾線性判別法(FLD),建立了學(xué)業(yè)困難預(yù)警模型。模型具有一定的分離度和判斷精度。使面臨學(xué)業(yè)困難危機(jī)的學(xué)生群體能夠在龐大的學(xué)生群體中及時(shí)被發(fā)現(xiàn),并受到關(guān)注和幫扶。
圖4-1數(shù)據(jù)挖掘流程圖
本文的創(chuàng)新點(diǎn)在于:將大數(shù)據(jù)分析、數(shù)據(jù)挖掘技術(shù)——費(fèi)希爾線性判別法(FLD)應(yīng)用于學(xué)生工作領(lǐng)域,提升高校學(xué)風(fēng)推動(dòng)的工作成效;本項(xiàng)目成果模型將結(jié)合移動(dòng)互聯(lián)網(wǎng)和云存儲(chǔ)技術(shù),將結(jié)論模型應(yīng)用于移動(dòng)智能學(xué)生工作平臺(tái)中,實(shí)現(xiàn)資源的整合和優(yōu)化,完成了學(xué)業(yè)預(yù)警工作的閉環(huán)。
本文的不足之處在于:學(xué)生的行為數(shù)據(jù)類別仍然有待擴(kuò)充,由于客觀原因無法加入學(xué)生消費(fèi)數(shù)據(jù)和網(wǎng)絡(luò)訪問記錄。為提高模型精度,后期有待擴(kuò)充,進(jìn)行深入研究。
參考文獻(xiàn):
[1] Kirk,S.A.,Bateman,B.D.Diagnosisandremediation of learning disabilities. [J].Exceptional Children1962(2).
[2] Dombrowski S. C, Kamphaus R. W, Reynolds C R. After the demise of the discrepancy: proposed learning disabilities diagnostic criteria.Professional Psychology:Research and Practice, 2004, 35( 4): 364 -372.
[3] Douglas Fuchs,Devery Mock, Pual L. Morgan, Caresa L. Young. Responsiveness-to Intervention:Definitions, Evidence, and Implications for the Learning Disabilities Construct[J]. Learning Disabilities Research & Practice. 2003(3).
[4] (美)安妮·瑪麗·弗朗西斯科(AnneMarieFrancesco),(美)巴里·艾倫·戈?duì)柕拢˙arryAllenGold)著,顧寶炎等譯.國(guó)際組織行為學(xué)[M]. 中國(guó)人民大學(xué)出版社, 2003.
[5] Fisher, R. A. “The Use of Multiple Measurements in Taxonomic Problems.”[J] Annals of Eugenics, 7(1936):179-188.
[6] Fisher, R. A. “The Statistical Utilization of Multiple Measurements.”[J] Annals of Eugenics, 8(1938):376-386.