張宏亮(溫州廣播電視大學(xué)教育技術(shù)與資源建設(shè)中心,浙江 溫州 325000)
基于協(xié)同過(guò)濾技術(shù)的學(xué)習(xí)資源個(gè)性化推薦研究
張宏亮
(溫州廣播電視大學(xué)教育技術(shù)與資源建設(shè)中心,浙江 溫州 325000)
當(dāng)前通過(guò)調(diào)研e-learning發(fā)現(xiàn),e-learning當(dāng)前的系統(tǒng)應(yīng)用到學(xué)習(xí)資源的推薦的活動(dòng)中只是有Top-N和
兩種搜索方法,不能向?qū)W習(xí)者個(gè)性的推薦學(xué)習(xí)資源。借鑒當(dāng)前電子商務(wù)研究領(lǐng)域的許多的研究的結(jié)果,我們可以把協(xié)同過(guò)濾推薦技術(shù)應(yīng)用到學(xué)習(xí)資源的個(gè)性化推薦過(guò)程中。我們分析學(xué)習(xí)資源個(gè)性化推薦的經(jīng)常用的三種推薦的技術(shù),分析出協(xié)同過(guò)濾推薦技術(shù)的工作原理、方法和出現(xiàn)的問(wèn)題。本文,通過(guò)介紹一個(gè)優(yōu)化理論模型,更好的協(xié)同過(guò)濾技術(shù)的學(xué)習(xí)資源的個(gè)性化推薦,注重探討模型的構(gòu)成,相應(yīng)的評(píng)分機(jī)制與算法的實(shí)現(xiàn),而且分析個(gè)性化學(xué)習(xí)資源推薦模型里面的三種重要的技術(shù)。希望可以使e-learning相關(guān)的人員在搜索過(guò)程中對(duì)協(xié)同過(guò)濾技術(shù)進(jìn)行有效利用,從而使學(xué)習(xí)資源個(gè)性化推薦的效率得到提升。
e-learning;協(xié)同過(guò)濾技術(shù);個(gè)性化推薦;學(xué)習(xí)資源
DOI:10.16640/j.cnki.37-1222/t.2016.16.201
經(jīng)過(guò)對(duì)許多的企業(yè)的e-learning門(mén)戶(hù)系統(tǒng)研究與分析得知,e-learning系統(tǒng)的推送學(xué)習(xí)資源主要有以下幾類(lèi)方法:(1)Top-N推薦的方法,指向用戶(hù)推薦點(diǎn)擊率最高的前N個(gè)資源[1]。點(diǎn)擊率只是反映相應(yīng)學(xué)習(xí)資源受歡迎的程度,而不能達(dá)到個(gè)性化推薦的目的。尤其對(duì)于一些涉及多種職業(yè)的行業(yè)的學(xué)習(xí)資源的管理,用戶(hù)針對(duì)資源的類(lèi)別和需求是不同的,點(diǎn)擊率高的學(xué)習(xí)資源,只是單純的反應(yīng)學(xué)習(xí)者的要求;(2)關(guān)鍵詞查詢(xún)的方法。該種方法的優(yōu)點(diǎn)是便捷快速。這種查詢(xún)的方法只是單純的達(dá)到搜索目的和關(guān)鍵詞的默契,不能篩選目標(biāo)資源的質(zhì)量,不能達(dá)到資源的個(gè)性化推薦;(3)最新的資源的推薦。該種方法能會(huì)在第一時(shí)間向用戶(hù)反饋資源庫(kù)里面更新的情況,從而使最新的學(xué)習(xí)資源得到更多的學(xué)習(xí),可是資源的質(zhì)量不能得到有效保障,不能達(dá)到個(gè)性化推薦。
個(gè)性化推薦是推薦系統(tǒng)依據(jù)用戶(hù)的個(gè)性化因素,比如愛(ài)好、職業(yè)、專(zhuān)業(yè)等因素,給用戶(hù)主動(dòng)的推薦滿(mǎn)足用戶(hù)學(xué)習(xí)的資源和咨詢(xún)的一種推薦的技術(shù)[2]。再者,通過(guò)個(gè)性化推薦技術(shù)還能很好的讓用戶(hù)之間分享學(xué)習(xí)經(jīng)驗(yàn),更可以給用戶(hù)推薦相同的用戶(hù)群喜歡的信息。
2.1關(guān)聯(lián)規(guī)則的推薦方法
該技術(shù)的推薦技術(shù)的工作原理:開(kāi)始的時(shí)候需要管理員制作一系列規(guī)則的條目,接著依據(jù)指定的規(guī)則來(lái)分析項(xiàng)目之間的聯(lián)系,并且把關(guān)聯(lián)緊密的項(xiàng)目給用戶(hù)推薦。并且在推薦的時(shí)候,系統(tǒng)合理的分析用戶(hù)目前的喜好和訪(fǎng)問(wèn)的記錄,之后根據(jù)已制定的規(guī)則,推薦給用戶(hù)想要的資源。比如,若用戶(hù)正在學(xué)習(xí)網(wǎng)頁(yè)設(shè)計(jì)技術(shù),則在他學(xué)習(xí)視頻ASP網(wǎng)頁(yè)設(shè)計(jì)的資源過(guò)程中,系統(tǒng)就會(huì)將和HTML技術(shù)有關(guān)的學(xué)習(xí)資源推薦給他。主要原因是:HTML技術(shù)是網(wǎng)頁(yè)制作的基礎(chǔ)知識(shí),學(xué)習(xí)的人還沒(méi)掌握,或者還有想繼續(xù)學(xué)的樂(lè)趣。
2.2內(nèi)容過(guò)濾推薦
內(nèi)容推薦作用機(jī)理:以機(jī)器學(xué)習(xí)與概率統(tǒng)計(jì)等技術(shù)為基礎(chǔ),來(lái)實(shí)現(xiàn)過(guò)濾,最初選用客戶(hù)的興趣向量來(lái)代表用戶(hù)的信息需求;而后,篩選文本集內(nèi)的文本,主要采用詞頻統(tǒng)計(jì)加權(quán)、標(biāo)引、分詞等方式,與此同時(shí),得到一個(gè)文本向量;最終,對(duì)文本向量與用戶(hù)向量進(jìn)行計(jì)算,確定其相似度,并向這個(gè)用戶(hù)模型的注冊(cè)的用戶(hù)推薦相似度高的資源。
2.3協(xié)同過(guò)濾推薦
不同與以上兩類(lèi)推薦技術(shù),協(xié)同過(guò)濾推薦是基于對(duì)資源內(nèi)容的分析、資源和用戶(hù)的匹配度的計(jì)算,來(lái)產(chǎn)生用戶(hù)推薦的,此外,資源推薦的憑據(jù)就是用戶(hù)對(duì)資源的評(píng)分。其工作原理:開(kāi)始的時(shí)候就是分析用戶(hù)的特點(diǎn),比如:職業(yè)、興趣等;之后采用相似性算法對(duì)用戶(hù)之間的相似性進(jìn)行計(jì)算,并找出和目標(biāo)性相似度高的K個(gè)用戶(hù);最終,以鄰居用戶(hù)對(duì)資源的評(píng)分為依據(jù),來(lái)對(duì)目標(biāo)用戶(hù)評(píng)分進(jìn)行預(yù)測(cè),再向目標(biāo)用戶(hù)推薦預(yù)測(cè)評(píng)分最高的幾個(gè)資源[3]。
協(xié)同過(guò)濾推薦系統(tǒng)采用統(tǒng)計(jì)技術(shù),對(duì)目標(biāo)用戶(hù)進(jìn)行搜索,獲取多個(gè)最近鄰,而后,以最近鄰對(duì)項(xiàng)目的評(píng)分為依據(jù),來(lái)對(duì)目標(biāo)用戶(hù)的評(píng)分進(jìn)行預(yù)測(cè),并得到相對(duì)應(yīng)的推薦的列表。實(shí)現(xiàn)協(xié)同過(guò)濾推薦的流程分為以下三步:
首先,獲得用戶(hù)信息,并將其表示出來(lái)。用戶(hù)的數(shù)據(jù)可分為用戶(hù)的注冊(cè)的信息、學(xué)習(xí)的數(shù)據(jù)與行為記錄三類(lèi)。通常情況下,推薦系統(tǒng)采用評(píng)分的方式,來(lái)獲取用戶(hù)的行為數(shù)據(jù)。
然后,形成鄰居。協(xié)同過(guò)濾技術(shù)的最主要的環(huán)節(jié)就是尋找和目標(biāo)用戶(hù)相同或相似興趣的用戶(hù)群。通過(guò)采用傳統(tǒng)的余弦相似性計(jì)算方法,尋找相似度高的用戶(hù)。
最后,產(chǎn)生推薦。協(xié)同過(guò)濾最后的步驟就是產(chǎn)生推薦。產(chǎn)生推薦的主要依據(jù)是鄰居集對(duì)資源的評(píng)分,以此評(píng)分對(duì)目標(biāo)用戶(hù)學(xué)習(xí)資源的評(píng)分進(jìn)行預(yù)測(cè),最終向用戶(hù)產(chǎn)生推薦。
存在的不足:(1)數(shù)據(jù)稀疏。由于數(shù)據(jù)稀疏,系統(tǒng)無(wú)法產(chǎn)生有效的鄰居用戶(hù)集,且計(jì)算用戶(hù)間的相似時(shí),將消耗較長(zhǎng)的時(shí)間,最終不能產(chǎn)生較好的推薦結(jié)果;(2)“冷啟動(dòng)”問(wèn)題。一方面,若用戶(hù)是新注冊(cè)的,則系統(tǒng)沒(méi)有相關(guān)的數(shù)據(jù)記錄,系統(tǒng)不能很好的產(chǎn)生推薦,另一方面,新的資源,系統(tǒng)沒(méi)有匹配的評(píng)分記錄,無(wú)法別推薦,上述情況就造成協(xié)同過(guò)濾算法的“冷啟動(dòng)”問(wèn)題。
關(guān)于數(shù)據(jù)稀疏,當(dāng)前有兩種對(duì)應(yīng)措施。第一,缺省值法,即對(duì)于用戶(hù)沒(méi)有評(píng)分的項(xiàng)目,將其評(píng)分統(tǒng)一設(shè)置成一個(gè)固定的缺省值(一般,該固定的缺省值是用戶(hù)對(duì)項(xiàng)目評(píng)分的平均值,比如:5分制中的2.5);第二,項(xiàng)目評(píng)分的預(yù)知的方式。對(duì)根據(jù)數(shù)據(jù)相似性,由用戶(hù)對(duì)相似的評(píng)分來(lái)對(duì)未評(píng)分項(xiàng)目的評(píng)分進(jìn)行預(yù)測(cè),使用戶(hù)共同評(píng)分項(xiàng)目增加,有效解決該問(wèn)題。
借鑒當(dāng)前電子商務(wù)研究領(lǐng)域的許多的研究的結(jié)果,我們可以把協(xié)同過(guò)濾推薦技術(shù)應(yīng)用到學(xué)習(xí)資源的個(gè)性化推薦過(guò)程中。本文對(duì)協(xié)同過(guò)濾推薦技術(shù)進(jìn)行研究,希望可以使e-learning相關(guān)的人員在搜索過(guò)程中更好的利用好協(xié)同過(guò)濾技術(shù),提升學(xué)習(xí)資源個(gè)性化推薦的效率。
[1]楊焱,孫鐵利,邱春艷.個(gè)性化推薦技術(shù)的研究[J].信息工程大學(xué)學(xué)報(bào),2005,6(02).
[2]趙艷霞.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)再電子商務(wù)中的應(yīng)用[J].價(jià)值工程,2006,25(05):88-91.
[3]楊焱.基于項(xiàng)目聚類(lèi)的協(xié)同過(guò)濾推薦算法的研究[D].東北師范大學(xué),2005(05).
張宏亮(1985-),男,河南信陽(yáng)人,研究生,助教,研究方向:計(jì)算機(jī)應(yīng)用技術(shù)、教育技術(shù)。