• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于標(biāo)簽與評分個性化課程推薦算法

      2017-06-05 09:07:29古奮飛
      關(guān)鍵詞:相似性標(biāo)簽聚類

      古奮飛

      (安徽新華學(xué)院 信息工程學(xué)院, 安徽 合肥 230088)

      ?

      基于標(biāo)簽與評分個性化課程推薦算法

      古奮飛

      (安徽新華學(xué)院 信息工程學(xué)院, 安徽 合肥 230088)

      首先根據(jù)課程的標(biāo)簽對課程進(jìn)行聚類,找到相似度高的課程;其次根據(jù)學(xué)生對課程的已有評價和課程的聚類結(jié)果對未選課程進(jìn)行評分預(yù)測,構(gòu)建無缺失的課程評價矩陣,在此基礎(chǔ)上再次對課程進(jìn)行相似度計算,找到相似度較高的K項(xiàng)向目標(biāo)用戶進(jìn)行推薦。通過實(shí)驗(yàn)驗(yàn)證,本算法與基于標(biāo)簽協(xié)同過濾算法以及基于評分推薦算法相比,具有更準(zhǔn)確的推薦效果。

      標(biāo)簽; 評分; 課程推薦; 聚類

      0 引 言

      隨著Web2.0不斷發(fā)展,個性化推薦不僅在電子商務(wù)、社交等領(lǐng)域應(yīng)用廣泛,而且在個性化學(xué)習(xí)領(lǐng)域中也有一定的應(yīng)用[1]。目前,在很多領(lǐng)域中的推薦系統(tǒng)均是根據(jù)用戶的歷史行為和商品的各自屬性,并利用互聯(lián)網(wǎng)技術(shù)向目標(biāo)用戶推薦感興趣的信息。隨著互聯(lián)網(wǎng)的不斷發(fā)展,教育行業(yè)也發(fā)生了巨大轉(zhuǎn)變,由傳統(tǒng)的教學(xué)方式轉(zhuǎn)變成“互聯(lián)網(wǎng)+”時代,出現(xiàn)了Coursera、Mooc等開放式教學(xué)平臺。為了更好地開展高校教育改革,教師學(xué)生可以充分利用網(wǎng)絡(luò)資源和各種學(xué)習(xí)平臺,方便高效地進(jìn)行教學(xué)。因此,如何根據(jù)用戶的學(xué)習(xí)能力、知識結(jié)構(gòu)等合理地推薦適合用戶的課程是目前的研究熱點(diǎn)。文中提出基于標(biāo)簽聚類和課程評分對用戶進(jìn)行個性化課程推薦。

      1 推薦算法

      目前在個性化推薦方面主要有基于項(xiàng)目、基于用戶、基于協(xié)同過濾以及一些混合推薦方法,這些推薦方法在電商、社交等平臺應(yīng)用較為成熟,同時也適合個性化學(xué)習(xí)的領(lǐng)域。

      1.1 傳統(tǒng)的推薦算法

      從推薦系統(tǒng)的發(fā)展歷程來看,傳統(tǒng)的推薦算法有基于關(guān)聯(lián)規(guī)則的推薦算法、基于人口統(tǒng)計學(xué)的推薦算法以及基于內(nèi)容的推薦算法[2]?;陉P(guān)聯(lián)規(guī)則的推薦算法主要的例子就是“啤酒-尿不濕”的經(jīng)典事例。這是根據(jù)用戶在購買尿不濕的同時,總是購買啤酒等商品。根據(jù)關(guān)聯(lián)規(guī)則的相關(guān)算法,得出這兩個商品是有關(guān)聯(lián)的。當(dāng)然這種關(guān)聯(lián)規(guī)則是通過大量數(shù)據(jù)進(jìn)行處理得到的。基于人口統(tǒng)計學(xué)的推薦機(jī)制[20]是一種簡單實(shí)用的推薦算法,也即為基于用戶的推薦算法。其主要思想是根據(jù)用戶的基本屬性,包括年齡、性別、興趣愛好等計算用戶之間的相似度,然后將相似度高的推薦給目標(biāo)用戶,在社交平臺中主要采用此類算法?;趦?nèi)容的推薦算法是出現(xiàn)最早的推薦系統(tǒng)[3],也即為基于項(xiàng)目的推薦算法。隨著網(wǎng)絡(luò)信息“爆炸式”增長,很多系統(tǒng)中的物品信息要比用戶信息多得多,從而提出了基于項(xiàng)目的推薦算法,其思想是通過未被選的項(xiàng)目與已被選的項(xiàng)目之間的相似度進(jìn)行推薦,此類算法比較適用于電商行業(yè)。通過以上傳統(tǒng)的推薦算法表明,個性化推薦系統(tǒng)給人類的生活、學(xué)習(xí)以及工作帶來了巨大變革。那么在高校的教育中也同樣需要個性化推薦技術(shù),特別隨著“信息爆炸”時代的誕生,學(xué)生如何有針對性地根據(jù)個人的興趣特點(diǎn)、學(xué)習(xí)基礎(chǔ)、學(xué)習(xí)能力等特性,方便快捷地得到自己想學(xué)習(xí)的課程,從而大大減小學(xué)生學(xué)習(xí)的盲目性,提高學(xué)習(xí)效率尤為重要。文中主要根據(jù)傳統(tǒng)推薦算法的啟發(fā),設(shè)計一個適用課程推薦的推薦算法。

      以上介紹的傳統(tǒng)推薦算法在實(shí)際應(yīng)用中雖然都起到良好的推薦效果,但是隨著大數(shù)據(jù)的產(chǎn)生,這些推薦算法很難實(shí)現(xiàn)個性化推薦。

      1.2 協(xié)同過濾推薦算法

      傳統(tǒng)的推薦算法只是單純地根據(jù)用戶或項(xiàng)目的相似度來進(jìn)行推薦,具體是根據(jù)用戶的特征和項(xiàng)目特征的相似度來進(jìn)行推薦的。隨著互聯(lián)網(wǎng)的不斷發(fā)展,為了讓用戶在海量數(shù)據(jù)中得到想要的數(shù)據(jù),Web更加注重用戶的歷史行為和用戶評分,因此協(xié)同過濾的推薦得到廣泛應(yīng)用。協(xié)同過濾算法是利用用戶的歷史行為來判斷用戶或項(xiàng)目的相似性,從而將一個用戶喜歡的而好友用戶并沒有關(guān)注的項(xiàng)目推薦給好友。協(xié)同過濾算法主要包括基于用戶和基于項(xiàng)目兩種。

      1.2.1 基于用戶的協(xié)同過濾算法

      基于用戶的協(xié)同過濾推薦算法是分析用戶對項(xiàng)目的歷史行為或評分,通過相應(yīng)的相似度計算公式計算用戶之間的相似性,從而形成相似用戶的“鄰居”集。根據(jù)該“鄰居”用戶進(jìn)行推薦。

      基于用戶的協(xié)同過濾推薦又稱為最近鄰(Nearest-Neighbor)協(xié)同過濾推薦或者K最近鄰法(K-Nearest-Neighbor, KNN)[4],具體算法步驟如下:

      步驟1:數(shù)據(jù)初始化。數(shù)據(jù)初始化主要是將用戶對項(xiàng)目評分?jǐn)?shù)據(jù)進(jìn)行初始化。構(gòu)建用戶與項(xiàng)目的關(guān)系矩陣,即為評分矩陣,同時去除冗余項(xiàng)目。用戶評分項(xiàng)目見表1。

      表1 用戶評分項(xiàng)目表

      步驟2:最近鄰居集的形成。根據(jù)上述關(guān)系矩陣來計算用戶之間的相似度。根據(jù)相似度值的大小排序形成目標(biāo)用戶的最近“鄰居”集。用戶相似度計算最常見的方法有3種:余弦相似性、相關(guān)相似性和約束Pearson相關(guān)系數(shù)[5]。此外,還有很多基于此3種算法的改進(jìn)計算方法。

      1)余弦相似性(Cosine Similarity)。余弦相似性是根據(jù)向量來進(jìn)行計算的,其實(shí)每個用戶對所有項(xiàng)目的評分可以被看做是該用戶的一個n維向量R(R11,R12,…,R1v),沒有評分的項(xiàng)目默認(rèn)其評分值為零,通過兩個用戶的向量之間余弦夾角來計算某兩個用戶的相似度。其值越接近1,說明這兩個用戶的相似度越高。具體公式如下:

      式中:Iu,v----用戶u,v共同評分的項(xiàng)目集合;

      Ru,i,Rv,i----分別表示用戶u,v對于項(xiàng)目i的評分;

      Iu,Iv----分別表示用戶u,v所評分的項(xiàng)目。

      2)相關(guān)相似性(Correlation Similarity)。相關(guān)相似性也稱Pearson系數(shù)相關(guān)性,根據(jù)以上用戶-項(xiàng)目的關(guān)系矩陣,可以利用Pearson系數(shù)相關(guān)性來計算某兩個用戶的相似性。根據(jù)Pearson系數(shù)的相關(guān)定義,某兩個用戶之間相似性的具體公式如下:

      式中: Iu,v----用戶u、v的共同評分項(xiàng)目集合;

      Ru,i,Rv,i----用戶u、v對于項(xiàng)目i的評分;

      3)約束Pearson相關(guān)系數(shù)。用戶u、v之間的約束Pearson相關(guān)系數(shù)是在相關(guān)相似性基礎(chǔ)上改進(jìn)所得,其定義為:

      式中:Rmed----系統(tǒng)評分區(qū)間的中值,不同系統(tǒng)的Rmed值是不相同的,取值為1~5。

      步驟3:預(yù)測評分及產(chǎn)生推薦結(jié)果。通過相似度的高低可以獲得目標(biāo)用戶u的“鄰居”集,即為N(u)={u1,u2,…,uk}。然后根據(jù)其“鄰居”集中的用戶對項(xiàng)目進(jìn)行預(yù)測評分,將評分高的項(xiàng)目推薦給目標(biāo)用戶[24]。評分預(yù)測計算公式如下:

      (4)

      1.2.2 基于項(xiàng)目的協(xié)同過濾算法

      基于項(xiàng)目的協(xié)同過濾推薦[6]與基于用戶的協(xié)同過濾推薦具有一定相似性。它主要是根據(jù)用戶對項(xiàng)目的偏好及評分,通過項(xiàng)目的相似性來進(jìn)行推薦[7]。

      基于項(xiàng)目的協(xié)同過濾推薦算法的實(shí)現(xiàn)過程也分為3個步驟:數(shù)據(jù)初始化,最近鄰居集的形成,預(yù)測評分及產(chǎn)生推薦結(jié)果。具體步驟如下:

      步驟1:數(shù)據(jù)初始化。數(shù)據(jù)初始化與基于用戶的協(xié)同過濾推薦算法一樣,主要是根據(jù)用戶-項(xiàng)目的評分情況形成一個n維的向量矩陣。其實(shí)該矩陣是個n*m的矩陣,具體如下:

      步驟2:最近“鄰居”集的形成。最近鄰居集的形成主要是通過項(xiàng)目之間的相似性計算得到的。具體方法也可以采用余弦相似性、Pearson系數(shù)相關(guān)性等方法。

      1)余弦相似性。基于項(xiàng)目的協(xié)同過濾算法是將每個項(xiàng)目評分看作n維用戶空間上的向量,項(xiàng)目間的相似性是通過兩個向量間夾角的余弦值進(jìn)行計算的。設(shè)對項(xiàng)目i和j都有評分的用戶集合為Ui,j,向量i、j分別表示項(xiàng)目i和j在用戶集合Ui,j上的評分,則項(xiàng)目i和項(xiàng)目j之間的余弦相似性為:

      2)修正的余弦相似性。直接用預(yù)先公式計算項(xiàng)目間的相似性方法忽略了用戶評分尺度不一致的因素,可以通過減去相應(yīng)用戶對所有已評分項(xiàng)目的評分均值的方法解決,這種方法稱為修正的余弦相似性。

      中:Ru,i,Ru,j----分別表示用戶u對于項(xiàng)目i、j的評分;

      3)Pearson系數(shù)相關(guān)性。項(xiàng)目i和項(xiàng)目j之間的相似性也可以通過Pearson相關(guān)系數(shù)進(jìn)行計算,具體公式如下:

      式中:Ru,i、 Ru,j----分別表示用戶u對于項(xiàng)目i、j 的評分;

      步驟3:預(yù)測評分及產(chǎn)生推薦結(jié)果。由步驟2得到目標(biāo)項(xiàng)目i的最近鄰居集N(i)={i1,i2,… ,ik}之后,就可以通過最近鄰居集預(yù)測目標(biāo)用戶對于目標(biāo)項(xiàng)目的評分,最終根據(jù)預(yù)測結(jié)果將評分得分高的項(xiàng)目推薦給目標(biāo)用戶[8],評分預(yù)測公式如下

      2 基于標(biāo)簽與評價的課程推薦算法

      為提高高校學(xué)生的學(xué)習(xí)興趣和學(xué)習(xí)質(zhì)量,并更好地讓學(xué)生適應(yīng)社會需求,改變高校傳統(tǒng)的由學(xué)校為學(xué)生定制的課程體系,文中提出基于標(biāo)簽與評分相結(jié)合的方法,給學(xué)生推薦其感興趣、符合度高的課程,進(jìn)而提高學(xué)習(xí)效果。

      2.1 基于標(biāo)簽聚類

      標(biāo)簽是目前推薦系統(tǒng)中廣泛使用的技術(shù),尤其在電子商務(wù)、社交等平臺具有很好的推薦效果。文中主要將其應(yīng)用到課程推薦之中,每一門課程在發(fā)布時都設(shè)置好標(biāo)簽,課程標(biāo)簽的規(guī)定應(yīng)根據(jù)課程和用戶學(xué)習(xí)的特征進(jìn)行設(shè)置。包括課程專業(yè)度、適合人群、難易程度等具體屬性。

      由于在實(shí)際教學(xué)中課程數(shù)量太多,而對于每一個用戶來說,選擇課程的數(shù)量是有限的,因此,構(gòu)成學(xué)生和課程矩陣是非常稀疏的,進(jìn)而單一根據(jù)標(biāo)簽屬性實(shí)現(xiàn)推薦效果肯定不佳。文中首先根據(jù)課程的標(biāo)簽對課程進(jìn)行聚類。具體如下:

      1)構(gòu)建課程與課程標(biāo)簽的矩陣,見表2。

      表2 課程-標(biāo)簽矩陣

      2)所有課程表示為Cn,即Cn(c1,c2,c3,…,cn),根據(jù)上述矩陣關(guān)系計算課程之間的相似度,對課程進(jìn)行聚類。課程的聚類結(jié)果可以表示為CI(I=1,2,…)。

      上述推薦方法其實(shí)屬于基于標(biāo)簽的協(xié)同過濾算法,利用該思想可以實(shí)現(xiàn)在一個聚類中的課程被推薦,同時也考慮其它聚類中與目標(biāo)課程相似度最高的幾門課程也可以被推薦。

      2.2 基于用戶評分

      很多課程類網(wǎng)站是利用用戶的學(xué)習(xí)數(shù)量和課程的評分來體現(xiàn)用戶的興趣,評分一般在[0~10]之間,根據(jù)這兩個因素,文中將這兩項(xiàng)進(jìn)行綜合計算課程評分,分值越高,說明該課程的受眾面和課程質(zhì)量非常不錯。具體公式如下

      式中:Su,i----用戶對課程i的選擇數(shù)量;

      Ru,i----用戶對課程i的評分。

      通過式(9)可以計算課程i的綜合評分Scorei。

      2.3 基于標(biāo)簽和評分的課程推薦算法

      根據(jù)2.1和2.2分析描述,文中將以上兩種思想進(jìn)行了結(jié)合,通過標(biāo)簽思想對課程進(jìn)行聚類,然后通過用戶對課程的綜合評分可以實(shí)現(xiàn)每個聚類中相似度較高且評分較高的課程作為推薦對象,從而讓推薦效果既符合專業(yè)度,又符合學(xué)生興趣度。具體思路如下:

      1)構(gòu)建用戶與課程的評分矩陣。

      2)為了解決稀疏矩陣的問題,文中將根據(jù)課程所屬的聚類類別以及綜合評分對未評分的課程進(jìn)行評分預(yù)測,從而解決該矩陣的稀疏性,其公式如下:

      3)通過預(yù)測評價,所有課程都有了預(yù)測評分,此時再一次計算課程之間相似度,公式如下:

      3 算法實(shí)驗(yàn)及分析

      3.1 數(shù)據(jù)

      提出了基于標(biāo)簽和評分的混合型的算法思想,為了驗(yàn)證算法的推薦準(zhǔn)確度,選取了某高校2014屆和2015屆學(xué)生在本科就讀期間的所有選課記錄數(shù)據(jù),共1 980人,課程數(shù)量為200,按照學(xué)校培養(yǎng)目標(biāo)要求,每個學(xué)生至少要選40門課程,每個學(xué)生在學(xué)習(xí)完成之后,要有所評價。針對這些實(shí)驗(yàn)數(shù)據(jù),將其分為訓(xùn)練集和測試集兩部分,其中訓(xùn)練集占90%,測試集占10%。

      3.2 實(shí)驗(yàn)步驟

      1)根據(jù)以上數(shù)據(jù)記錄進(jìn)行數(shù)據(jù)預(yù)處理,消除一些標(biāo)簽過少的數(shù)據(jù)和冗余數(shù)據(jù),通過課程與課程所列標(biāo)簽構(gòu)建課程與標(biāo)簽矩陣R。

      2)結(jié)合R矩陣,根據(jù)課程的標(biāo)簽計算課程之間的相似度,表示為sim(i,j),根據(jù)相似度對課程進(jìn)行聚類,總結(jié)出相似度較高的課程,分別形成相應(yīng)的課程集合CI。

      3)構(gòu)建用戶與課程的評價關(guān)系矩陣,根據(jù)聚類結(jié)果將相似的課程放置相鄰列,這樣根據(jù)相似課程使學(xué)生對沒有評價的課程進(jìn)行評價預(yù)測,方便操作。

      4)根據(jù)式(11)對沒有被評價的課程進(jìn)行評價預(yù)測。

      5)結(jié)合聚類和預(yù)測后的矩陣,再次計算課程的相似度,選出評價較高K項(xiàng)作為目標(biāo)用戶的TOP-N推薦集。

      3.3 結(jié)果分析

      為了進(jìn)一步驗(yàn)證預(yù)測評價的誤差,文中采用廣泛使用的平均誤差(Mean Absolute Error, MAE)的評價標(biāo)準(zhǔn)進(jìn)行衡量,MAE值越小,推薦的質(zhì)量就越高。MAE計算公式如下:

      Ru,i----實(shí)際評價。

      通過實(shí)驗(yàn)改變最近鄰K的數(shù)值,MAE的變化情況如圖1所示。

      圖1 平均絕對誤差與最近鄰個數(shù)K的關(guān)系

      從圖1可以看出,隨著K的數(shù)目的增加,MAE的值越來越小,因此本算法得到的推薦質(zhì)量是最高的。

      4 結(jié) 語

      提出了基于標(biāo)簽與評價相結(jié)合的方法在課程推薦中的研究,其效果明顯較單獨(dú)使用基于標(biāo)簽的協(xié)同過濾算法和基于評價的推薦方法在推薦準(zhǔn)確度方面有明顯提升。本算法首先采用了標(biāo)簽的特點(diǎn)對課程進(jìn)行聚類,其目的可以輔助對未被預(yù)測的課程進(jìn)行評價預(yù)測,同時,可以進(jìn)一步利用預(yù)測的評價對矩陣的稀疏性進(jìn)行改善,進(jìn)而在計算課程相似度時更加準(zhǔn)確,提高了推薦的準(zhǔn)確度。實(shí)驗(yàn)證明,文中算法可以有針對性地為用戶推薦合適的課程,提高用戶的學(xué)習(xí)興趣和學(xué)習(xí)質(zhì)量。

      [1] 汪靜,印鑒,鄭利榮,等.基于共同評分和相似性權(quán)重的協(xié)同過濾推薦算法[J].計算機(jī)科學(xué),2010(2):99-104.

      [2] 張亮.推薦系統(tǒng)中協(xié)同過濾算法若干問題的研究[D].北京:北京郵電大學(xué),2009.

      [3] 陸洲.基于標(biāo)簽的個性化推薦系統(tǒng)研究[D].長沙:湖南大學(xué),2010.

      [4] Piao C H, Zhao J, Zheng L J. Research on entropy-based collaborative filtering algorithm and personalized recommendation in e-commerce [J]. Service Oriented Computing and Applications,2009,3(2):147-157.

      [5] 文俊浩,舒珊.一種改進(jìn)相似性度量的協(xié)同過濾推薦算法[J].計算機(jī)科學(xué),2014,41(5):68-71.

      [6] Weng J, Lim E P, Jiang J, et al. Twitterrank: finding topic-sensitive influential twitterers[C]//Proceedings of the Third ACM International Conference on Web Search and Data Mining. [S.l.]: ACM,2010:261-270.

      Personalized curriculum recommendation algorithm based on tags and ratings

      GU Fenfei

      (College of Information Engineering, Anhui Xinhua University, Hefei 230088, China)

      Cluster analysis is carried out according to the tags of the curriculum to find the high similarity of courses. Then rating prediction for a course is completed based on the previous evaluation and cluster analysis, and the intact curriculum evaluation matrix is established. Again, similarity of the courses is calculated to findKitems for recommendation to the target users. Experiments indicate that the algorithm is more accurate for recommendation than those based on tags or rating.

      tag; rating; course recommendation; cluster.

      2017-02-25

      安徽省重點(diǎn)研究項(xiàng)目(kj2016A303); 安徽新華學(xué)院自然科學(xué)研究項(xiàng)目(2015zr008); 安徽新華學(xué)院質(zhì)量工程項(xiàng)目(2015sysxs01)

      古奮飛(1982-),男,漢族,安徽無為人,安徽新華學(xué)院講師,碩士,主要從事無線傳感器網(wǎng)絡(luò)、隱私保護(hù)、機(jī)器學(xué)習(xí)方向研究,E-mail:13966756031@126.com.

      10.15923/j.cnki.cn22-1382/t.2017.2.18

      TP 391

      A

      1674-1374(2017)02-0198-06

      猜你喜歡
      相似性標(biāo)簽聚類
      一類上三角算子矩陣的相似性與酉相似性
      淺析當(dāng)代中西方繪畫的相似性
      河北畫報(2020年8期)2020-10-27 02:54:20
      無懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      低滲透黏土中氯離子彌散作用離心模擬相似性
      標(biāo)簽化傷害了誰
      基于改進(jìn)的遺傳算法的模糊聚類算法
      基于多進(jìn)制查詢樹的多標(biāo)簽識別方法
      一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
      长治市| 大丰市| 时尚| 临桂县| 麦盖提县| 张家口市| 新邵县| 仁布县| 孝义市| 民权县| 开阳县| 葫芦岛市| 钦州市| 汉源县| 蒙自县| 三门县| 郁南县| 洪雅县| 海晏县| 黔南| 巴里| 隆回县| 建始县| 襄樊市| 沙坪坝区| 长葛市| 桑植县| 竹山县| 南通市| 呼和浩特市| 左贡县| 建始县| 酉阳| 剑川县| 平阳县| 临漳县| 贡觉县| 阿勒泰市| 沙洋县| 宁晋县| 昌吉市|