李干成, 葛琳琳, 張 威
(遼寧石油化工大學,遼寧 撫順 113001)
基于粗糙集理論的高校學生學習能力分析研究
李干成, 葛琳琳, 張 威
(遼寧石油化工大學,遼寧 撫順 113001)
針對目前高校對所有學生采用相同的標準進行綜合評價、不考慮學生個體專項能力的差異、學生高分低能的現(xiàn)象,采用粗糙集理論和平均測評方法找出了學生能力的薄弱環(huán)節(jié),并針對性地對不同學生的能力提升進行了量化。實驗結(jié)果表明,基于粗糙集理論可精確地對學生的綜合能力進行評價,同時可為學生有針對性地提升綜合素質(zhì)和能力提供理論依據(jù)。
粗糙集; 平均測評方法; 能力分析; 綜合評價; 學生學習能力
素質(zhì)教育一直是教育者關(guān)注的一個問題[1-2]。目前,各高校為了提高學生的綜合能力,都從各個方面對學生進行素質(zhì)教育[3-4]。但是,各高校對所有學生均采用相同的標準進行評價,而對那些面對繁重的學習任務、升學及就業(yè)壓力的高年級學生來說,這還只是一個美好的愿望。學生每天不但要學習新的知識,同時還要通過大量的練習對已學知識加以鞏固。于是,“題海戰(zhàn)術(shù)”成了許多學生必須面對的一個問題。在所面對的海量習題中,有多少知識是已經(jīng)熟練掌握的,又有多少知識是需要鞏固加強的,可能許多學生自己也不清楚?!邦}海戰(zhàn)術(shù)”使學習這項腦力勞動變成了體力勞動,這種無差別的訓練,可能使學生產(chǎn)生煩躁的情緒,從而降低效率[5-7]。因此,高效地進行素質(zhì)教育是教育者需要解決的一個問題[8-9]。
粗糙集理論是針對不確定性問題提出的,它不需要預先給定某些特征或?qū)傩缘臄?shù)量描述,而是直接從給定問題的描述集合出發(fā),通過不可分辨關(guān)系和不可分辨類確定給定問題的近似域,從而找出該問題的內(nèi)在規(guī)律。粗糙集理論可以解決重要的分類問題,而且可以用決策規(guī)則集合的形式表示最重要屬性和特定分類之間的所有重要關(guān)系[10]。
粗糙集理論具有很多優(yōu)點。首先,它提供了一套方法,從數(shù)學的角度嚴格地處理數(shù)據(jù)分類問題,特別是當數(shù)據(jù)具有噪音、不完全性或不精確性時;其次,粗糙集理論不會校正數(shù)據(jù)中所出現(xiàn)的不一致或者不精確,只是分析潛藏在數(shù)據(jù)中的事實,將所生成的規(guī)則分為確定與可能的規(guī)則;第三,粗糙集理論是描述知識的一種形式模型,這種形式模型將知識定義為不可區(qū)分關(guān)系的一個集族,將能力轉(zhuǎn)化為具有一種清晰定義的數(shù)學意義,更重要的是可以使用數(shù)學方法來分析處理;最后,粗糙集理論不需要數(shù)據(jù)的任何附加信息[11-12]。
本文采用粗糙集理論和平均測評方法分析學生的專項能力。首先,用粗糙集理論比較知識點對總成績的影響;然后,計算學生的每個知識點的平均得分率,并通過平均得分率發(fā)現(xiàn)學生的薄弱環(huán)節(jié);最后,綜合兩種分析結(jié)果,對學生進行一個綜合的評價,同時為學生的專項訓練提供依據(jù)。
不可辨識關(guān)系:兩個對象x,y∈U,P?A,P為屬性集合A的子集,如果滿足?a∈P:fa(x)=fa(y),則稱對象x,y對于屬性集合A的子集P是不可辨識的,否則,稱x,y是可辨識的,由P決定的不可辨識關(guān)系記為ind(P),ind(P)表示P中所有的等級關(guān)系的交集。
(1)
(2)
屬性的重要性:條件屬性集合C和決策屬性集合D間的依賴度可以表示為:
(3)
根據(jù)依賴度的變化,可以定義屬性子集C′?C關(guān)于D的重要性:
(4)
尤其是,當C′={a}時,屬性a∈C關(guān)于D的重要性為:
(5)
一般來說,屬性重要性是指屬性在信息表中的重要程度,其值越大,則重要性越大;反之,其重要性越小。
利用粗糙集理論中的屬性重要性分析方法,從某學生20次能力測試中選出5個知識點的成績進行分析。每個知識點的總分依次為:20分、40分、15分、10分和15分。通過數(shù)據(jù)離散化算法,對數(shù)據(jù)進行預處理。由于數(shù)據(jù)簡單,計算方便,結(jié)果比較明確。某學生5個知識點的20次測試成績見表1。
表1 某學生5個知識點的20次測試成績
續(xù)表1
對表1中每個知識點的成績及總成績進行歸一化處理,即可得到得分率,得分率統(tǒng)計結(jié)果見表2。
表2 得分率統(tǒng)計結(jié)果
條件屬性集合C由m、n、p、q、r構(gòu)成,m、n、p、q、r分別表示各知識點的條件屬性;決策屬性集合D即綜合能力分為五大類,第一大類為優(yōu)秀(大于等于85分),第二大類為良好(75~84分),第三大類為中等(65~74分),第四大類為及格(60~64分),第五大類為不及格(小于60分),分別賦值1、2、3、4和5。換言之,C和D可表示為:C={m,n,p,q,r},D={1,2,3,4,5}。對表2中數(shù)據(jù)進行預處理所得結(jié)果見表3。
為了分析各知識點即條件屬性中哪些屬性能最大程度地改變決策屬性和分類,并確定哪些條件屬性最重要,首先從表3中去掉一個條件屬性,再考察去掉該條件屬性后決策分類發(fā)生的變化。若去掉該條件屬性后決策分類變化大,則說明該條件屬性強度大,即重要性大;反之,說明該條件屬性的強度小,即重要性小。下面分析條件屬性的重要性。
表3 預處理后的結(jié)果
按D={1,2,3,4,5}分類如下:
記posC(D)為D的C-正域,γC(D)=card(posC(D))/card(U)。
①總分類。
U/D={{1},{13,16,19},{2,3,4,6,8,11,14,15,17,20},{5,9,10,12,18},{7}}
為了表示方便,括號中的數(shù)字代表測試編號;決策屬性共分為五大類,即優(yōu)、良、中、及格、不及格。
按C={m,n,p,q,r}分類如下:
U/C={{1,19},{2,12},{3},{4},{5},{6},{7},{8},{9},{10},{11},{13},{14},{15},{16},{17},{18},{20}}
posC(D)={{3},{4},{5},{6},{7},{8},{9},{10},{11},{13},{14},{15},{16},{17},{18},{20}}
γC(D)=card(posC(D))/card(U)=16/20
②按照C-{m},即{n,p,q,r}的分類如下:
U/(C-{m})={{1,19},{2,12,13},{3,18},{4,16},{5},{6},{7},{8},{9},{10},{11},{14},{15},{17},{20}}
posC-{m}(D)={{5},{6},{7},{8},{9},{10},{11},{14},{15},{17},{20}}
γC-{m}(D)=card(posC-{m}(D))/card(U)=11/20
條件屬性m∈C關(guān)于D的重要性為:
σCD(m)=γC(D)-γC-{m}=16/20-11/20=5/20
③按照C-{n},即{m,p,q,r}的分類如下:
U/(C-{n})={{1,14,19},{2,12},{3},{4},{5},{6},{7},{8},{9},{10,15},{11},{13},{16},{17},{18},{20}}
posC-{n}(D)={{3},{4},{5},{6},{7},{8},{9},{11},{13},{16},{17},{18},{20}}
γC-{n}(D)=card(posC-{n}(D))/card(U)=13/20
條件屬性n∈C關(guān)于D的重要性為:
σCD(n)=γC(D)-γC-{n}=16/20-13/20=3/20
④按照C-{p},即{m,n,q,r}的分類如下:
U/(C-{p})={{1,19},{2,12},{3,16},{4},{5},{6},{7},{8},{9,11},{10},{13},{14},{15,20},{17},{18}}
posC-{p}(D)={{4},{5},{6},{7},{8},{10},{13},{14},{15,20},{17},{18}}
γC-{p}(D)=card(posC-{p}(D))/card(U)=11/20
條件屬性p∈C關(guān)于D的重要性為:
σCD(p)=γC(D)-γC-{p}=16/20-11/20=5/20
⑤按照C-{q},即{m,n,p,r}的分類如下:
U/(C-{q})={{1,19},{2,12},{3},{4,11},{5},{6},{7},{8},{9},{10},{13,16},{14},{15},{17},{18},{20}}
posC-{q}(D)={{3},{4,11},{5},{6},{7},{8},{9},{10},{13,16},{14},{15},{17},{18},{20}}
γC-{q}(D)=card(posC-{q}(D))/card(U)=4/20
條件屬性q∈C關(guān)于D的重要性為:
σCD(q)=γC(D)-γC-{q}=16/20-14/20=2/20
⑥按照C-{r},即{m,n,p,q}的分類如下:
U/(C-{r})={{1,4,14,19},{2,12},{3},{5},{6},{7},{8},{9},{10},{11},{13},{15},{16},{17},{18},{20}}
posC-{r}(D)={{3},{5},{6},{7},{8},{9},{10},{11},{13},{15},{16},{17},{18},{20}}
γC-{r}(D)=card(posC-{r}(D))/card(U)=14/20
條件屬性r∈C關(guān)于D的重要性為:
σCD(r)=γC(D)-γC-{r}=16/20-14/20=2/20
由此可見,相對而言“知識點一”和“知識點三”較大程度地影響綜合能力的分類,對該學生來說,在今后的訓練過程中應該把這兩個知識點的學習放在首位。
計算學生每個知識點的平均得分率可以直觀地反映該學生對每個知識點的掌握情況,可為系統(tǒng)地、有針對性地制定訓練培養(yǎng)方案提供數(shù)據(jù)支持。學生登錄系統(tǒng),選擇需要測試的知識點和測試方式,并開始進行能力測試;完成后提交,系統(tǒng)便以成績單的形式記錄該學生本次測試的成績。試卷練習模式下的總決策屬性見表4。
存儲表4,即可得到該學生的一次測試結(jié)果,當該學生再一次登錄系統(tǒng)進行練習時,系統(tǒng)會根據(jù)之前所存儲的數(shù)據(jù)庫中的成績來計算該學生的每一個知識點的得分率。通過得分率,即可以了解該學生對每一個知識點的掌握情況。各知識點的得分率見表5。
表4 試卷練習模式下的總決策屬性
表5 各知識點的得分率
在表5中,每個知識點的得分率是通過式(6)計算而得到的。
(6)
通過表5能很清楚地了解該學生掌握各知識點的情況,可為下一次的組卷提供數(shù)據(jù)上的依據(jù)。在試卷練習模式下,對該學生進行了5次測試。并統(tǒng)計了5次測試的每個知識點所得分數(shù),計算了每個知識點的得分率,結(jié)果見表6。
表6 每個知識點的總分數(shù)、所得分數(shù)及得分率
得分率高,說明學生對該知識點的掌握情況比較好,反之則需要加強培養(yǎng)和訓練。當學生再次進入系統(tǒng)進行測試時,系統(tǒng)根據(jù)該學生的每一個知識點的得分率,通過式(7)進行計算,得到每一個知識點在新試卷中的重現(xiàn)率。根據(jù)表6中的得分率計算了各知識點的重現(xiàn)率,結(jié)果見表7。
重現(xiàn)率=100%-得分率 (7)
利用表7中的重現(xiàn)率,通過式(8)進行計算可以得到所有知識點的平均重現(xiàn)率。
(8)
經(jīng)計算,得到平均重現(xiàn)率為29.6%。對重現(xiàn)率超過平均重現(xiàn)率的知識點一、二、五,需要在新一輪的測試中強化練習。同時,考慮到由模糊集算法得到的結(jié)論,知識點三的重現(xiàn)率雖然沒有達到平均標準,但是在新一輪測試中也應該引起重視。另外,考慮到社會對不同知識點需求的差異,根據(jù)式(9),計算了知識點i在測試中應該占的份額,結(jié)果見表8。社會對不同知識點需求的差異,用各知識點的權(quán)重表示。
(9)
根據(jù)表8,可以很清晰地看到在新的試卷中每個知識點應占的份額。
本文利用粗糙集理論對學生掌握知識點的情況進行評估,并計算了各知識點的平均得分率。評估結(jié)果可以提供反映學生訓練效果的數(shù)據(jù),達到了期望的效果。學生可以通過所提供的分析結(jié)果進行在線的自主訓練,能夠根據(jù)評估結(jié)果判斷自身對知識點的掌握情況,并以此作為下一次測試時組卷的依據(jù)。這種方法可以大大提升學生的訓練效率,通過選擇更有針對性的項目進行練習,學生可以鞏固已經(jīng)熟練掌握的知識,同時不斷學習新的知識,對提高學生的學習能力具有現(xiàn)實意義。
[1] 孟祥林.個性化教育在當代西方國家的實踐及我國的發(fā)展選擇[J].江蘇大學學報(高教研究版),2005,27(3):15-19.
[2] 葛琳琳,鐘俊生.美國高校學生事務管理構(gòu)架、特征及啟示[J].現(xiàn)代教育管理,2016(1):124-128.
[3] 王豐斌,趙喜玲.高等職業(yè)教育“四段式”實踐教學改革探索[J].教育與職業(yè),2015(31):108-109.
[4] 張泉.以職業(yè)崗位能力培養(yǎng)為目標的高職實踐教學體系建設與改革探索[J].課程教育研究,2012(32):248.
[5] 葛琳琳,張威.數(shù)字化檔案IP網(wǎng)網(wǎng)絡設計方法的研究與應用[J].遼寧石油化工大學學報,2015,35(1):62-66.
[6] 葛琳琳,張威,李平,等.高校黨校數(shù)字化檔案安全等級保護策略[J].蘭臺世界,2015(11):86-87.
[7] 葛琳琳,鐘俊生,張威.高校學生數(shù)字化檔案的滲透入侵測試研究[J].蘭臺世界,2015(35):45-46.
[8] 何小鳳,昊衛(wèi)華,蘭天.基于產(chǎn)學研合作的研究生信息素養(yǎng)與創(chuàng)新能力培養(yǎng)的策略研究[J].高校圖書情報論壇,2014,12(4):50-52.
[9] 姜健.我國研究生信息素養(yǎng)問題剖析與對策研究[D].重慶:西南大學,2011.
[10]FormicaA.Semanticwebsearchbasedonroughsetsandfuzzyformalconceptanalysis[J].Knowledge-BasedSystems,2012,26(2):40-47.
[11]FaustinoAgreiraCI,MachadoFerreiraCM,MacielBarbosaFP.Roughsettheory:Dataminingtechniqueappliedtotheelectricalpowersystem[M].Netherlands:Springer,2013.
[12]SalamoM,Lopez-SanchezM.Roughsetbasedapproachestofeatureselectionforcase-basedreasoningclassifiers[J].PatternRecognitionLetters,2011,32(2):280-292.
(編輯 宋錦玉)
Research on University Students' Learn Ability Analysis Based on Rough Set Theory
Li Gancheng, Ge Linlin, Zhang Wei
(LiaoningShihuaUniversity,F(xiàn)ushunLiaoning113001,China)
In view of the phenomena of using the same standard comprehensive evaluation to all students in the current university, not considering the difference of individual special ability of the students, and avoiding to produce the phenomenon of high grade and low ability of the students, the rough set theory and the average evaluation method were used to find out the weak link of students' ability and to enhance students' ability of different quantization. The experiments showed that the students' comprehensive ability could be evaluated by the rough set theory, which also provided theoretical basis for the students to improve their comprehensive quality and ability.
Rough set; Average evaluation method; Ability analysis; Comprehensive evaluation; Students' learn ability
1672-6952(2017)02-0071-06
2016-11-18
2016-12-28
遼寧省大學生創(chuàng)新創(chuàng)業(yè)項目(201410148060);撫順市科學技術(shù)發(fā)展資金計劃項目(FSKJHT201548);遼寧省教育科學“十三五”規(guī)劃項目(JG16DB254);遼寧省教育廳科學研究一般項目(W2016007)。
李干成(1996-),男,本科生,從事算法設計研究;E-mail:ligancheng@126.com。
葛琳琳(1977-),女,碩士,講師,從事學生培養(yǎng)與教育研究;E-mail:gelinlin@126.com。
G
Adoi:10.3969/j.issn.1672-6952.2017.02.015
投稿網(wǎng)址:http://journal.lnpu.edu.cn