王文泉
摘 要:文章針對錯題管理系統(tǒng)中最為重要的一個組成部分——鞏固練習(xí),設(shè)計個性化推薦練習(xí)算法,采用Java語言進行模擬實現(xiàn),通過算法分析發(fā)現(xiàn)推薦結(jié)果較為理想。算法設(shè)計在網(wǎng)絡(luò)錯題管理系統(tǒng)中得到功能上的實現(xiàn),并應(yīng)用于實際教學(xué)中。
關(guān)鍵詞:錯題管理;個性化推薦;算法分析
中圖分類號:G434 文獻標志碼:B 文章編號:1673-8454(2016)11-0067-05
一、引言
網(wǎng)絡(luò)學(xué)習(xí)者作為眾多Web用戶之一,有其獨特的特征。在錯題管理系統(tǒng)中,更正錯題作為最重要的環(huán)節(jié),其中主要的策略是鞏固練習(xí)的實施。如何為學(xué)習(xí)者推薦個性化的練習(xí),消除學(xué)習(xí)者知識缺陷,最大程度做到“錯題不錯”,其推薦技術(shù)及算法值得研究。
一般來說,個性化推薦可采用基于規(guī)則的技術(shù)、基于內(nèi)容過濾的技術(shù)和協(xié)作過濾技術(shù)?;趦?nèi)容的過濾技術(shù)主要依靠關(guān)鍵詞匹配技術(shù),過濾掉那些相關(guān)度不高的項目?;趦?nèi)容過濾通過“資源——用戶”關(guān)系,利用信息資源與用戶興趣之間相似性來過濾信息,把符合用戶興趣的新的資源推薦給用戶,簡單有效。
錯題管理系統(tǒng)要為學(xué)習(xí)者推薦的試題應(yīng)該具有與學(xué)習(xí)者做錯的試題具有相同知識點、類似難度的特征。所以,本研究采用內(nèi)容過濾方法為學(xué)習(xí)者篩選出合適的試題資源。
二、算法設(shè)計
1.推薦試題特征分析
錯題的鞏固練習(xí)作為錯題管理系統(tǒng)中最為重要的一部分,其主要目的在于根據(jù)學(xué)習(xí)者需要,為學(xué)習(xí)者推薦一定數(shù)量相關(guān)知識的練習(xí)題,以用于練習(xí)和鞏固知識。在錯題管理系統(tǒng)中,推薦給學(xué)習(xí)者的試題應(yīng)具有以下三個特征:
(1)與學(xué)習(xí)者做錯的試題同屬一個知識點
作為學(xué)習(xí)者“鞏固練習(xí)”而推薦的試題,其首先要具備的特征就是要與學(xué)習(xí)者做錯的題目具有相同的知識點屬性,只有這樣,才能達到鞏固該知識的目的。
(2)試題具有盡可能高的質(zhì)量
試題的質(zhì)量高低取決于兩個方面:一是試題資源的得分,系統(tǒng)用戶對試題的評分越高,說明試題質(zhì)量越好,該題越值得推薦,反之亦然;二是試題被收藏次數(shù),由于錯題管理系統(tǒng)有著不同于普通學(xué)習(xí)系統(tǒng)的特點,它的主要目的在于消除學(xué)習(xí)者錯誤。所以,決定試題質(zhì)量高低的第二個因素是試題被收藏次數(shù)。試題被收藏次數(shù)越多,說明該題目被做錯的次數(shù)越多或者該題目極具經(jīng)典試題的特征,該試題對于當(dāng)前學(xué)習(xí)者的質(zhì)量也就越高,試題也就越值得推薦。
(3)與學(xué)習(xí)者做錯的題目具有類似的試題難度,兼顧基礎(chǔ)鞏固和能力提升
為維持學(xué)習(xí)者的學(xué)習(xí)積極性,保證學(xué)習(xí)者掌握知識,系統(tǒng)盡量為學(xué)習(xí)者推薦相同試題難度的試題。但是,當(dāng)前的推薦是發(fā)生在學(xué)習(xí)者已經(jīng)發(fā)生錯誤,并且進行了初步的分析之后,所以為起到鞏固基礎(chǔ)知識和進一步提高能力的作用,系統(tǒng)可以為學(xué)習(xí)者推薦相鄰試題難度的試題。例如,學(xué)習(xí)者當(dāng)前出錯試題難度為“理解”,那么系統(tǒng)為其推薦的試題集可能包含“識記”、“理解”、“應(yīng)用”三個難度等級;而如果學(xué)習(xí)者當(dāng)前出錯試題難度級別為“識記”,那么系統(tǒng)為其推薦的試題則可能包含“識記”和“理解”兩個難度級別。
2.算法的設(shè)計思路
該部分依據(jù)上一小節(jié)的討論,針對錯題管理系統(tǒng)中推薦試題所應(yīng)具有的三點特征進行分析,設(shè)計推薦算法。
(1)知識體系的建立
系統(tǒng)采用知識結(jié)構(gòu)樹建立知識體系,知識結(jié)構(gòu)樹的建立按照“課程——章/單元——節(jié)——知識點”的次序依次建立,效果如圖 1所示,該圖為初二《科學(xué)》課程的知識結(jié)構(gòu)樹,包含三個級別:課程——章——知識點,這是因為:根據(jù)科目的不同,知識結(jié)構(gòu)樹的建立所作的取舍也不同。
知識結(jié)構(gòu)樹建立完畢后,題目入庫將綁定到相應(yīng)的知識點(可以綁定為“課程”、“章”、“節(jié)”、“具體定理、公式、單詞等”其中的某一項或者某幾項)。當(dāng)系統(tǒng)為學(xué)習(xí)者推薦試題時,系統(tǒng)將首先檢索出與錯題具有相同知識點的題目。
(2)試題質(zhì)量的確定
根據(jù)上一小節(jié)的討論,被推薦的試題質(zhì)量由兩部分決定:試題資源的得分和試題被收藏的次數(shù)。
系統(tǒng)采用“5”、“4”、“3”、“2”、“1”評分的形式區(qū)分不同質(zhì)量的資源,將試題分為五個等級。試題得分越高,說明試題資源的質(zhì)量越好。試題評分者可以是學(xué)生或者教師,試題得分取所有評分者評分的平均值,計算公式如公式 1所示。假如試題是新加入到系統(tǒng)中,那么會出現(xiàn)試題沒有得分的現(xiàn)象。為避免這種現(xiàn)象的發(fā)生,將新加入系統(tǒng)中的每道試題得分默認設(shè)為“3”,也即設(shè)為中等水平。伴隨著系統(tǒng)的使用,試題評分逐漸增多,系統(tǒng)將自適應(yīng)地計算和更改試題得分。篩選出的試題按照試題得分由多到少排序。
S=公式 1
其中,S表示試題得分,Si表示第i個評分用戶對試題的評分,n表示對試題評分的用戶總數(shù)。
被收藏次數(shù)是指一道試題被所有學(xué)習(xí)者收藏到錯題本中的總次數(shù)。試題被收藏次數(shù)越多,說明試題質(zhì)量越高,越具有知識點代表性,越值得學(xué)習(xí)者去做。系統(tǒng)為學(xué)習(xí)者推薦的試題按試題被收藏次數(shù)由多到少排序。
由于試題質(zhì)量要綜合考慮試題得分和被收藏次數(shù)兩方面因素,而且兩個因素沒有權(quán)重區(qū)別(即同等重要),試題得分已經(jīng)界定取值范圍為1~5。所以,為了消除由于被收藏次數(shù)單方面過多或者過少而引起的試題質(zhì)量得分偏高或者偏低的現(xiàn)象發(fā)生,試題被收藏次數(shù)采取與試題得分相同的五等級劃分方法。由此而得出的結(jié)果稱為試題收藏度,其計算公式如公式 2所示。
F=*CT公式 2
其中,F(xiàn)表示試題收藏度,CTmax表示所有試題中被收藏最多的試題的被收藏次數(shù),CT表示試題的實際被收藏次數(shù)。
綜上討論,試題質(zhì)量的最后得分取試題得分和試題收藏度的均值,其計算方法如公式 3所示。試題質(zhì)量得分越高,說明試題質(zhì)量越高。
QS=50%S+50%F=50%(S+F)公式 3
其中,QS表示試題質(zhì)量得分,S表示試題資源評分,F(xiàn)表示試題收藏度。
(3)試題難度的劃分
為指導(dǎo)教育測量和評價,美國教育心理學(xué)家布魯姆發(fā)表《教育目標分類學(xué)》,將認知領(lǐng)域目標由低到高依次分為知道、領(lǐng)會、運用、分析、綜合和評價。不同層次的教育目標代表著不同的知識結(jié)果和認知水平。
系統(tǒng)借鑒布魯姆教育目標分類方法,將試題標記為識記、理解、運用(包含原始分類的運用、分析、綜合和評價)三個難度等級。
內(nèi)容過濾技術(shù)的基本過程如下:在同一特征空間下,建立資源特征向量和用戶描述文件;依據(jù)用戶描述文件,比較系統(tǒng)內(nèi)所有資源特征向量與用戶描述文件之間的相似度;把相似度高的資源推薦給用戶。余弦相似度計算公式如公式 4所示。
sim(u,q)=公式 4
其中,u表示用戶向量,q表示資源向量。
結(jié)合第二部分第一節(jié)的討論,試題難度特征值按照其難度級別,依次將識記、理解、運用記為“1”、“2”、“3”。由于跟學(xué)習(xí)者做錯的試題不屬于同一知識點的試題是不希望被選出的,試題難度級別最大特征值為“3”,所以為了區(qū)別出試題知識點屬性,將知識點特征值按照是否為所需要知識點設(shè)為“5(任意一個大于5的值)”或者“-5”。
3.個性化推薦流程
根據(jù)以上討論,確定系統(tǒng)整體推薦流程如下:
(1)獲取用戶描述文件,對學(xué)習(xí)者做錯的題目和試題資源進行特征向量構(gòu)建。
(2)通過比較資源特征向量與用戶描述文件,篩選出與學(xué)習(xí)者錯誤試題具有相同知識點、類似試題難度的試題集C1。
(3)C1按照試題質(zhì)量由高到低排序,形成試題集C2。
(4)C2按照實際需要選出top(N)推薦給學(xué)習(xí)者。
以上內(nèi)容過濾算法推薦流程中的關(guān)鍵步驟是特征向量的構(gòu)建,其思想如下:
IF 出錯
THEN 獲取出錯試題屬性信息
SELECT 試題 FROM 試題庫
IF 試題知識點屬性值=出錯試題知識點屬性值
THEN 試題知識點特征值=5
ELSE 試題知識點特征值=-5
SET 試題難度級別特征值=1,2,3 WHERE 試題難度級別=識記,理解,應(yīng)用
試題特征向量=(試題知識點特征值,試題難度級別特征值)
三、算法分析與實現(xiàn)
1.算法分析
為驗證推薦算法的有效性,現(xiàn)假定有10道試題,它們的屬性信息如圖 2所示。采用本文討論的個性化推薦方法,為學(xué)習(xí)者推薦3道試題。其詳細推薦步驟如下:
(1)假定t0為當(dāng)前學(xué)習(xí)者出錯試題,按照“試題(知識點,難度)”獲取所有試題特征向量值如表 1所示。
(2)接下來,根據(jù)公式4計算T1~T9與T0的余弦相似度,計算結(jié)果如表 2所示。
舍棄與T0不屬于同一知識點(即與T0之間的余弦相似度小于0)和與T0難度級別相差大于1(即與T0之間的余弦相似度小于等于0.94)的題目,也就是只取sim值大于0.94的試題,形成試題集C1={T1, T2, T3, T6, T7, T8, T9}。
(3)按照公式2和公式3計算C1中各試題質(zhì)量得分如表 3所示。
C1按照資源質(zhì)量得分由高到低排序,形成試題集C2={T7,T6,T3,T2,T9,T1,T8 }。
該部分代碼輸出結(jié)果如圖 4所示。
(4)根據(jù)需要,從C2中選出3道試題,即T6,T7和T3,推薦給學(xué)習(xí)者。
根據(jù)上一部分的討論,可以看出,為學(xué)習(xí)者推薦的三道試題,符合被推薦試題所應(yīng)具有的特征。
2.算法功能實現(xiàn)
根據(jù)個性化推薦練習(xí)算法的設(shè)計,在系統(tǒng)功能上予以實現(xiàn)。當(dāng)學(xué)習(xí)者做錯題目時,點擊 “舉一反三”按鈕,則彈出推薦試題練習(xí)窗口,學(xué)習(xí)者可以進行鞏固練習(xí)。
四、結(jié)束語
為考察個性化推薦練習(xí)算法的應(yīng)用效果,進一步指導(dǎo)錯題管理系統(tǒng)設(shè)計和開發(fā),筆者在深圳市福田區(qū)南華中學(xué)某兩個班進行了教學(xué)實驗。在后續(xù)的研究中,筆者將第一時間公布實驗結(jié)果;并進一步優(yōu)化個性化推薦練習(xí)算法,檢驗其效果。
參考文獻:
[1]Stellan Ohlsson. Learning from performance errors [J]. Psychological Review,1996,103(2): 241-262.
[2]Tzu-Hua Wang. Web-based dynamic assessment: Taking assessment as teaching and learning strategy for improving students e-Learning effectiveness[J].Computers & Education,2010(54): 1157-1166.
[3]Steven J. Lorenzet, Eduardo Salas, Scott I. Tannenbaum. Benefiting from Mistakes: The Impact of Guided Errors on Learning, Performance, and Self-Efficacy[J].Human Resource Development Quarterly,2005, 16(3): 301-322.
[4]王文.個性化推薦算法研究[J].電腦知識與技術(shù), 2010,6(16): 4562-4564.
[5]王智. E-learning環(huán)境中個性化推薦系統(tǒng)研究[D]. 重慶:西南大學(xué),2009.
[6]尤秀梅.教學(xué)平臺中基于知識點的個性化推薦學(xué)習(xí)的研究與實現(xiàn)[D].天津:天津師范大學(xué),2010.
[7]劉建國,周濤,汪秉宏.個性化推薦系統(tǒng)的研究進展[J].自然科學(xué)進展,2009, 19(1): 1-15.
[8]尤秀梅.教學(xué)平臺中基于知識點的個性化推薦學(xué)習(xí)的研究與實現(xiàn)[D].天津:天津師范大學(xué),2010.
[9]劉博.智能教學(xué)系統(tǒng)中個性化題庫的設(shè)計與實現(xiàn)[J].中國電化教育,2010(284): 110-114.
[10]陳敏,余勝泉,楊現(xiàn)民,黃昆.泛在學(xué)習(xí)的內(nèi)容個性化推薦模型設(shè)計[J].現(xiàn)代教育技術(shù),2011,21(6): 13-18.
[11]鄭婕.個性化推薦技術(shù)在網(wǎng)絡(luò)教學(xué)中的應(yīng)用研究[D].江西:南昌大學(xué), 2011.
[12]Marko Balabanovic, Yoav Shoham. Fab: Content-Based, Collaborative Recommendation[J].Communications of The ACM,1997,40(3): 66-72.
[13]郭麗麗.E-learning個性化推薦系統(tǒng)研究[D].山東:山東科技大學(xué), 2008.
[14]John S. Breese, David Heckerman, Carl Kadie. Empirical Analysis of Predictive Algorithms for Collaborative Filtering[C]. Proceeding UAIs 98 Proceedings of the Fourteenth conference on Uncertainty in Artificial intelligence, 1998, San Francisco: 43-52.
[15]Nicholas J. Belkin, W. Bruce Croft. Information Filtering and Information Retrieval: Two Sides of the Same Coin[J].Communication of The ACM,1992,35(12): 29-38.
[16]曾春,刑春曉,周立柱.基于內(nèi)容過濾的個性化搜索算法[J].軟件學(xué)報,2003,14(5): 999-1004.
[17]張開飛.個性化推薦學(xué)習(xí)系統(tǒng)的模型研究與設(shè)計[D].上海: 華東師范大學(xué),2009.
[18]葉海琴,尹世君.個性化推薦預(yù)測模型性能指標研究[J].軟件導(dǎo)刊,2010,9(8): 31-32.
[19]李高敏.基于協(xié)同過濾的教學(xué)資源個性化推薦技術(shù)的研究及應(yīng)用[D].北京:北京交通大學(xué),2011.
[20]張煒.教育信息共享系統(tǒng)中個性化推薦服務(wù)研究[D].陜西:西安電子科技大學(xué),2008.
(編輯:楊馥紅)