丁永剛 張 馨 桑秋俠 金夢甜 張紅波
(湖北大學 教育學院,湖北武漢 430062)
融合學習者社交網(wǎng)絡(luò)的協(xié)同過濾學習資源推薦*
丁永剛 張 馨 桑秋俠 金夢甜 張紅波
(湖北大學 教育學院,湖北武漢 430062)
傳統(tǒng)的協(xié)同過濾推薦算法存在冷啟動和數(shù)據(jù)稀疏的問題,使得新學習者因歷史學習行為記錄稀疏或缺失而無法獲得較準確的個性化學習資源推薦。鑒于此,文章提出將學習者社交網(wǎng)絡(luò)信息與傳統(tǒng)協(xié)同過濾相融合的方法,計算新學習者與好友之間的信任度,借助新學習者好友對學習資源的評分數(shù)據(jù),來預(yù)測新學習者對學習資源的評分值,以填補新學習者在學習者—學習資源評分矩陣中的缺失,實現(xiàn)對新學習者的個性化學習資源推薦。實證研究結(jié)果表明,該方法在一定程度上能夠解決傳統(tǒng)協(xié)同過濾方法的冷啟動和數(shù)據(jù)稀疏問題,提高個性化學習資源推薦的準確率。
社交網(wǎng)絡(luò);協(xié)同過濾;學習資源;個性化推薦
計算機與互聯(lián)網(wǎng)的高速發(fā)展不僅影響著人們的生活方式,而且也改變著人們的學習方式乃至思維方式[1]。網(wǎng)絡(luò)學習因具有學習資源豐富、學習過程自主控制等優(yōu)點,而成為學習者彌補傳統(tǒng)課堂學習不足和滿足個性化學習需求的首選學習方式。然而,一方面由于網(wǎng)絡(luò)學習資源數(shù)量急速增長,導致資源嚴重過載,使得學習者難以快速獲取自己感興趣的資源,因而在一定程度上加大了學習者的學習難度,延長了學習者的學習時間,降低了學習者的學習效率;另一方面,由于網(wǎng)頁之間以超鏈接的方式進行跳轉(zhuǎn),大量符合學習者個性化學習需求的學習資源可能被放置在超鏈接的深層,使得學習者無法輕易獲取,從而降低了網(wǎng)絡(luò)學習資源的有效利用率。因此,針對學習者學習偏好為其提供個性化學習資源推薦,便成為了提高學習者學習效率和網(wǎng)絡(luò)學習資源利用率的有效手段。
個性化推薦技術(shù)被認為是目前解決信息過載問題的有效途徑之一,其中最著名和最廣泛應(yīng)用的是基于協(xié)同過濾算法的推薦技術(shù)。該技術(shù)最早被應(yīng)用于電子商務(wù)領(lǐng)域[2],其基本原理是從用戶對商品的瀏覽、收藏、購買、打分、評價等歷史行為信息中提取用戶偏好信息,據(jù)此預(yù)測用戶可能感興趣的商品,并通過動態(tài)即時地向用戶推送此類商品信息來促使用戶購買商品的行為不斷發(fā)生[3]。近年來,教育技術(shù)領(lǐng)域?qū)<液蛯W者致力于將協(xié)同過濾推薦技術(shù)應(yīng)用于網(wǎng)絡(luò)學習領(lǐng)域來構(gòu)建個性化學習資源推薦系統(tǒng),為學習者提供個性化學習資源推薦服務(wù),以提高學習者的網(wǎng)絡(luò)學習效率。如楊麗娜等[4]運用協(xié)同過濾、內(nèi)容推薦及聚類分析相結(jié)合的方法,提出面向虛擬學習社區(qū)的個性化學習資源推薦框架;王永固等[5]在全面闡述協(xié)同過濾推薦技術(shù)的基礎(chǔ)上,提出學習資源個性化推薦系統(tǒng)理論模型;葉樹鑫等[6]采用協(xié)同過濾推薦技術(shù),為協(xié)作學習中的相似學習者提供個性化學習資源推薦。
協(xié)同過濾推薦技術(shù)在一定程度上解決了學習資源信息過載的問題,但是傳統(tǒng)的協(xié)同過濾算法存在冷啟動和數(shù)據(jù)稀疏的問題,使得新學習者因歷史學習行為記錄稀疏或缺失而無法獲得較準確的推薦。對此,文章提出利用學習者社交網(wǎng)絡(luò)中的好友信息,計算學習者與其好友之間的信任度,并根據(jù)學習者好友—學習資源評分矩陣,預(yù)測學習者—學習資源評分值來填補新學習者在學習者—學習資源評分矩陣中的缺失數(shù)據(jù),以提高個性化學習資源推薦的質(zhì)量,滿足學習者個性化學習的需求。
協(xié)同過濾算法應(yīng)用于個性化學習資源推薦的基本原理是:根據(jù)學習者的歷史學習記錄形成學習者—學習資源評分矩陣,利用相似性度量方法(如余弦相似度、皮爾森相關(guān)系數(shù)等),通過計算學習者或?qū)W習資源之間的相似度,挖掘出與目標學習者相似的學習者集合或與學習者歷史偏好相似的學習資源集合,形成“鄰居”,然后基于“鄰居”學習者對學習資源的評分信息,預(yù)測目標學習者對學習資源的預(yù)測評分值,并根據(jù)預(yù)測評分值的大小為目標學習者進行個性化推薦。如TopN推薦,便是將預(yù)測評分值最大的前N個學習資源推薦給目標學習者。協(xié)同過濾推薦算法的具體實現(xiàn)步驟如圖1所示。
圖1 協(xié)同過濾推薦算法實現(xiàn)原理
依據(jù)上述原理,目前將協(xié)同過濾推薦技術(shù)應(yīng)用于學習資源推薦主要有兩種方法:
1 基于學習者的協(xié)同過濾算法(LearnerCF)
LearnerCF基于學習者對學習資源的公共評分信息計算學習者之間的相似度,并依據(jù)相似度大小來確定學習者的“鄰居”集合,將“鄰居”集合中學習者感興趣的、而目標學習者沒有學習過的學習資源推薦給目標學習者。LearnerCF向?qū)W習者推薦和他有共同學習興趣的學習者感興趣的學習資源,它隱含的機理是:兩個學習者之間相似度的大小,由他們共同感興趣的學習資源評分決定。
2 基于學習資源的協(xié)同過濾算法(ResourceCF)
ResourceCF基于被共同感興趣的學習者對學習資源的評分信息計算學習資源之間的相似性,并根據(jù)目標學習者的歷史學習偏好,向其推薦與之歷史學習偏好相似的學習資源。它隱含的機理是:學習資源之間相似度的大小,由它們被共同感興趣的學習者對學習資源的評分決定。
從相似度計算的代價考慮,在學習者數(shù)量小于學習資源數(shù)量的情況下,使用LearnerCF進行個性化資源推薦較為適合;反之,ResourceCF較為適合。在網(wǎng)絡(luò)學習中學習者的數(shù)量遠遠大于學習資源的數(shù)量,因此,采用ResourceCF方法能在較好地滿足學習者個性化學習需求的同時,降低系統(tǒng)的計算代價。
上述兩種方法應(yīng)用于不同場合已取得了不錯的效果,但是仍然存在數(shù)據(jù)稀疏和冷啟動的問題。一方面,LearnerCF由于學習者評分數(shù)據(jù)的稀疏性,學習者之間的共同評分資源數(shù)很少,使得用戶相似度的計算不夠準確,從而導致推薦的準確度不高;另一方面,ResourceCF對資源相似度的計算主要基于學習者自身歷史學習記錄,避免了LearnerCF由于沒有共同評分的學習者而無法準確計算學習者相似度的問題,但對于沒有歷史學習記錄的新學習者,ResourceCF卻無法進行推薦,即存在冷啟動問題。
學習者社交網(wǎng)絡(luò)是指學習者在網(wǎng)絡(luò)環(huán)境下,借助社交平臺(如QQ、微博、微信等)與好友交流溝通、分享信息,而形成的個性化、動態(tài)化的人際信任網(wǎng)絡(luò)。
1 學習者社交網(wǎng)絡(luò)和信任關(guān)系
學習者社交網(wǎng)絡(luò)中的好友大多是其現(xiàn)實生活中的朋友、同學、同事或?qū)W習者所關(guān)注的人,因此,學習者與其社交網(wǎng)絡(luò)中的好友存在一定的信任關(guān)系。但信任是一個具有主觀性的概念,不同研究領(lǐng)域的學者對信任的概念界定不同[7]。受學者Golbeck的啟發(fā)[8],文章將“信任”界定為:如果學習者甲認為根據(jù)學習者乙的學習行為進行學習能夠取得好的學習效果,則甲信任乙。
2 信任度的表示
學習者之間的信任程度用信任度表示[8]。在某些情況下,信任度僅用二值表示,即信任和不信任,但是這種簡單度量方法在學習者社交網(wǎng)絡(luò)中不夠準確,不能充分體現(xiàn)學習者社交網(wǎng)絡(luò)中信任度的作用。因此,本研究采用離散值將信任度劃分成等級,其取值范圍設(shè)定為[0,1],其中0表示完全不信任,1表示完全信任。
3 信任度計算
社交網(wǎng)絡(luò)中學習者之間的信任度難以通過顯式的方法獲得,這是因為學習者主動輸入好友的信任度,需要花費學習者的時間;另外,由于學習者之間的信任度處于動態(tài)變化之中,不能用固定值代替。文章認為,社交網(wǎng)絡(luò)中學習者與好友之間的互動行為在一定程度上反映了學習者與好友之間的信任關(guān)系,這種互動行為主要包括評論和轉(zhuǎn)發(fā)。學習者對彼此所發(fā)布的消息評論次數(shù)越多,表示學習者之間的熟悉程度越大,其信任度越高;學習者對彼此所發(fā)布的消息轉(zhuǎn)發(fā)次數(shù)越多,表示學習者之間的認同感越強,其信任度越高。實際上,學習者一般會對自身感興趣或者不清楚的消息進行評論,但不一定轉(zhuǎn)發(fā),而學習者轉(zhuǎn)發(fā)的消息往往是經(jīng)過自身篩選并高度認同的內(nèi)容,因此轉(zhuǎn)發(fā)行為的權(quán)重相對評論行為的權(quán)重應(yīng)略大一些。受學者胡勛等[9]對移動用戶間信任度計算方法的啟發(fā),網(wǎng)絡(luò)環(huán)境下學習者之間的信任度可以采用下面的公式1計算:
個性化學習資源推薦技術(shù)作為滿足學習者個性化學習需求的有效支持服務(wù),其推薦算法的好壞是決定推薦服務(wù)質(zhì)量的關(guān)鍵。文章提出融合學習者社交網(wǎng)絡(luò)的學習資源協(xié)同過濾算法(SocialCF)進行個性化學習資源推薦,其實現(xiàn)流程如圖2所示。
圖2 融合學習者社交網(wǎng)絡(luò)的協(xié)同過濾個性化學習資源推薦流程圖
從圖2可知,本方法需要解決以下三個關(guān)鍵問題:
1 學習者社交網(wǎng)絡(luò)信息的獲取
為了獲取學習者的社交網(wǎng)絡(luò)信息,網(wǎng)絡(luò)學習平臺允許學習者以其社交平臺賬號如QQ、微博等賬號登錄,并授權(quán)學習平臺獲得學習者的好友列表信息。為保護隱私,此操作僅允許學習平臺獲取學習者與其好友的交互行為信息,而不允許對學習者的社交內(nèi)容進行獲取。
2 信任度與預(yù)測評分值的轉(zhuǎn)換
利用公式1計算得到學習者與好友之間的信任度后,即可利用公式2計算得到目標學習者對學習資源的預(yù)測值:
3 學習者信任度與學習者—學習資源評分矩陣的融合
圖3 學習者—好友信任度矩陣與學習者—學習資源評分矩陣融合示意圖
如圖3所示,將學習者任度與學習者—學習資源矩陣相融合的方法是:借助學習者—好友信任度矩陣中Learner_1“JSP程序設(shè)計”課程網(wǎng)站獲得第十四屆全國多媒體課件大賽二等獎。與Learner_2的信任關(guān)系和Learner_2對Resource_2的評分信息,產(chǎn)生Learner_1對Resource_2的評分,該評分依據(jù)公式2進行計算。以此類推,可補充學習者—學習資源評分矩陣中的其它空白。從圖3不難看出,融合了學習者社交網(wǎng)絡(luò)信息的學習者—學習資源評分矩陣,明顯比原始的學習者—學習資源評分矩陣稠密。
為驗證SocialCF方法的有效性,本研究以湖北大學教育技術(shù)學專業(yè)的120名學生為實驗對象,在自主研發(fā)的“JSP程序設(shè)計”課程學習平臺上進行實證研究。該學習平臺在“JSP程序設(shè)計”課程網(wǎng)站1“JSP程序設(shè)計”課程網(wǎng)站獲得第十四屆全國多媒體課件大賽二等獎。的基礎(chǔ)上進行二次開發(fā),增加了個性化推薦模塊和收集學習者歷史評分數(shù)據(jù)和學習者社交網(wǎng)絡(luò)數(shù)據(jù)的功能。學習者的平均好友數(shù)為4.5個,學習資源數(shù)為208個,評分記錄數(shù)為1252條,數(shù)據(jù)稀疏率為95%。實證采用問卷調(diào)查和離線實驗的方法對推薦效果進行評價。問卷調(diào)查方法從系統(tǒng)冷啟動、滿意度和信任度三個方面對推薦效果進行評價,離線實驗方法則使用準確率、召回率和覆蓋率指標對推薦效果進行評價。
1 調(diào)查問卷結(jié)果與分析
本實驗實際發(fā)放問卷120份,回收120份,有效回收率100%。表1顯示了CF和SocialCF調(diào)查問卷的結(jié)果。
表1 CF和SocialCF調(diào)查問卷的反饋結(jié)果
在表1中,第一個問題用于評測兩種不同方法對新學習者的推薦情況,即冷啟動問題。由于SocialCF使用了社交網(wǎng)絡(luò)信息,所以新學習者第一次進入系統(tǒng)時即可獲得推薦。第二和第三個問題用于測評用戶的滿意度,可以看出,雖然92.5%的學習者認為CF推薦的學習資源與其學習興趣相關(guān),但只有74.17%用戶使用了學習資源;而97.5%的學習者認為SocialCF推薦的學習資源與其學習興趣相關(guān),且96.67%的學習者使用了學習資源。由此可知,學習者對SocialCF的推薦結(jié)果較滿意。第四和五個問題用于測評學習者對推薦結(jié)果的信任度。由于SocialCF在推薦時給出了好友信息,學習者對資源推薦結(jié)果的信任度比CF提高了32.5%,這表明學習者對SocialCF的推薦結(jié)果更加信任。
2 離線實驗對比與分析
隨機抽取100個用戶數(shù)據(jù)進行離線實驗,用于評測系統(tǒng)的準確率、召回率和覆蓋率。其中80個用戶數(shù)據(jù)用于訓練集,20個用戶數(shù)據(jù)用于測試集。
(1)不同topN情況下CF與SocialCF準確率和召回率的比較
準確率是指系統(tǒng)推薦給學習者感興趣的資源占所有推薦給學習者資源的比例,召回率則指推薦給學習者感興趣的資源占系統(tǒng)中學習者感興趣的所有資源的比例。選擇推薦列表長度分別為N=5,10,15,20,25,30,35,40,對CF與SocialCF的準確率與召回率進行測定,如圖4所示??梢钥闯?,在N的各種取值下,SocialCF的準確率和召回率均高于CF,說明SocialCF能比CF為學習者推薦更準確且更多感興趣的學習資源。
圖4 不同topN情況下兩種方法的精確率和召回率
圖5 不同“鄰居”數(shù)情況下兩種方法的覆蓋
(2)不同“鄰居”個數(shù)下CF和SocialCF的覆蓋率
覆蓋率是指向?qū)W習者推薦的學習資源占總體學習資源的比例。分別選擇不同的“鄰居”個數(shù),測試CF與SocialCF的覆蓋率,如圖5所示??梢钥闯觯S著“鄰居”個數(shù)的不斷增加,學習者的學習偏好被定位到一個較小范圍,推薦的學習資源越來越少,因此CF與SocialCF覆蓋率均呈下降趨勢。但從總體來看,SocialCF的覆蓋率仍高于CF,表明SocialCF能夠在一定程度上提高學習資源的利用率。
利用個性化推薦技術(shù),幫助學習者在海量的學習資源中輕松、準確、高效地獲取感興趣的學習資源,既是決定網(wǎng)絡(luò)學習效果的關(guān)鍵,也是避免網(wǎng)絡(luò)學習資源浪費的有效途徑。文章針對傳統(tǒng)協(xié)同過濾算法中的冷啟動和數(shù)據(jù)稀疏問題,提出運用學習者社交網(wǎng)絡(luò)信息與傳統(tǒng)協(xié)同過濾相融合的方法進行個性化學習資源推薦。問卷調(diào)查和離線實驗結(jié)果表明,SocialCF能夠在一定程度上緩解協(xié)同過濾的冷啟動和數(shù)據(jù)稀疏問題,且在學習者滿意度、準確度、信任度和覆蓋率等方面均優(yōu)于CF,故提高了個性化學習資源的推薦質(zhì)量。為了取得更好的推薦效果,未來我們將進一步考慮學習者對學習資源的隱式評分數(shù)據(jù)和學習者與好友在社交網(wǎng)絡(luò)中的其它交互行為。
[1]余勝泉.技術(shù)何以革新教育——在第三屆佛山教育博覽會“智能教育與學習的革命”論壇上的演講[J].中國電化教育,2011,(7):1-6.
[2]Lee L,Lu T C.Intelligent agent-based systems for personalized recommendations in internet commerce[J].Expert Systems with Applications,2002,(22):275-284.
[3]Cheung K W,Kwok J T,Law M H,et al.Mining customer product ratings for personalized marketing[J].Decision Support Systems,2003,(35):231-243.
[4]楊麗娜,劉科成,顏志軍.面向虛擬學習社區(qū)的學習資源個性化推薦研究[J].電化教育研究,2010,(4):67-71.
[5]王永固,邱飛岳,趙建龍,等.基于協(xié)同過濾技術(shù)的學習資源個性化推薦研究[J].遠程教育雜志,2011,(3):66-71.
[6]葉樹鑫,何聚厚.協(xié)作學習中基于協(xié)同過濾的學習資源推薦研究[J].計算機技術(shù)與發(fā)展,2014,(10):63-66.
[7]張富國.基于信任的電子商務(wù)個性化推薦關(guān)鍵問題研究[D].南昌:江西財經(jīng)大學,2009:12-13.
[8]Golbeck J.Computing and applying trust in Web-based social networks[D].Maryland:University of Maryland,College Park 2005:15-16.
[9]胡勛,孟祥武,張玉潔,等.一種融合項目特征和移動用戶信任關(guān)系的推薦算法[J].軟件學報,2014,(8):1817-1830.
The Collaborative Filtering Recommendation of Learning Resources Combined with Learners’ Social Network
DING Yong-gang ZHANG Xin SANG Qiu-xia JIN Meng-tian ZHANG Hong-bo
(School of Education,Hubei University,Wuhan,Hubei,China 430062 )
The traditional collaborative filtering recommendation algorithm (CF) has the problems of cold start and data sparseness,so it is difficult for new learners to obtain learning resources recommendation because of the sparsity or the lack of history learning behavior records.Thus,in this paper,a new CF method was proposed which combined learners’social network information with traditional CF method.In order to fill the gap in the “l(fā)earner - learning resource rating matrix” and achieve the recommendation of learning resources to new learners,it first calculated the trust degrees between new learners and their friends and then predicts new learners’ ratings on learning resources by virtue of that of their friends.The experimental results shown that this method can solve the cold start and data sparsity problems in some degree and improve the accuracy of personalized learning recommendation.
social network; collaborative filtering; learning resource; personalized recommendation
小西
G40-057
A 【論文編號】1009—8097(2016)02—0108—07
10.3969/j.issn.1009-8097.2016.02.016
本文為教育部人文社會科學研究青年基金項目“基于互動電視的課堂教學模式與策略研究”(項目編號:14YJC880109)階段性研究成果。
丁永剛,副教授,在讀博士,研究方向為教育數(shù)據(jù)挖掘、個性化資源推薦,郵箱為hddyg@hubu.edu.cn。
2015年8月27日