• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于詞向量的圖書(shū)館圖書(shū)推薦模式研究

      2019-02-20 14:26:10楊志明
      現(xiàn)代商貿(mào)工業(yè) 2019年4期
      關(guān)鍵詞:協(xié)同過(guò)濾推薦系統(tǒng)圖書(shū)館

      楊志明

      摘要:個(gè)性化推薦算法中,傳統(tǒng)的協(xié)同過(guò)濾算法通常存在數(shù)據(jù)稀疏和計(jì)算復(fù)雜的問(wèn)題,造成實(shí)際推薦效果不夠理想。據(jù)此,針對(duì)圖書(shū)館圖書(shū)推薦問(wèn)題,提出了基于詞向量的圖書(shū)推薦算法,實(shí)驗(yàn)中通過(guò)和傳統(tǒng)的協(xié)同過(guò)濾算法對(duì)比,基于詞向量的方法不管是在計(jì)算圖書(shū)相似性還是實(shí)際推薦效果均顯著提升。

      關(guān)鍵詞:圖書(shū)館;推薦系統(tǒng);詞向量;word2vec;協(xié)同過(guò)濾

      中圖分類號(hào):TB文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.19311/j.cnki.16723198.2019.04.093

      1引言

      個(gè)性化推薦中,基于內(nèi)容的推薦算法、基于協(xié)同過(guò)濾的推薦算法和混合推薦算法方法最為常用。而在數(shù)字圖書(shū)館圖書(shū)推薦中,基于協(xié)同過(guò)濾和關(guān)聯(lián)規(guī)則的推薦算法是最為常用推薦算法。但是由于大多數(shù)高校圖書(shū)館沒(méi)有讀者對(duì)圖書(shū)的評(píng)分信息,導(dǎo)致傳統(tǒng)的協(xié)同過(guò)濾算法面對(duì)數(shù)據(jù)稀疏和計(jì)算復(fù)雜的問(wèn)題。而基于關(guān)聯(lián)規(guī)則的推薦算法則存在關(guān)聯(lián)規(guī)則不容易發(fā)現(xiàn)的問(wèn)題,最終導(dǎo)致兩種算法在實(shí)際的推薦中效果均不理想。因此本文提出基于詞向量的方法計(jì)算學(xué)生與圖書(shū)的相似度從而幫助優(yōu)化推薦系統(tǒng)的推薦結(jié)果。

      2傳統(tǒng)協(xié)同過(guò)濾算法

      傳統(tǒng)的協(xié)同過(guò)濾算法通過(guò)對(duì)學(xué)生借閱記錄的挖掘發(fā)現(xiàn)學(xué)生借書(shū)的偏好,基于不同的偏好按照相似性對(duì)學(xué)生或者圖書(shū)進(jìn)行劃分從而推薦相似的圖書(shū)。協(xié)同過(guò)濾算法又可分為基于鄰居的協(xié)同過(guò)濾算法和基于模型的協(xié)同過(guò)濾算法,基于鄰居的協(xié)同過(guò)濾又分為兩類,分別是基于用戶的協(xié)同過(guò)濾算法,和基于物品的協(xié)同過(guò)濾算法。

      基于用戶的協(xié)同過(guò)濾,通過(guò)挖掘?qū)W生借閱記錄,來(lái)度量學(xué)生之間的相似性,找到“鄰居”,基于學(xué)生之間的相似性做出推薦圖書(shū)?;谖锲返膮f(xié)同過(guò)濾的原理和基于用戶的協(xié)同過(guò)濾類似,只是在計(jì)算鄰居時(shí)采用物品本身,不是從用戶的角度,即根據(jù)借閱記錄找到相似的圖書(shū),然后根據(jù)學(xué)生的歷史偏好,給該學(xué)生推薦相似的圖書(shū)。在數(shù)字圖書(shū)館圖書(shū)推薦中,由于用戶特征數(shù)據(jù)、行為數(shù)據(jù)的缺失,導(dǎo)致傳統(tǒng)的協(xié)同過(guò)濾算法面臨數(shù)據(jù)稀疏等問(wèn)題,最終導(dǎo)致推薦效果不理想。本文提出基于word2vec的方法計(jì)算學(xué)生與圖書(shū)特的相似度從而幫助優(yōu)化推薦系統(tǒng)的推薦結(jié)果的方法。

      3詞向量和Skip-gram模型

      word2vec是 Google 的Mikolov 等人提出的一種分布式詞向量模型,包括 Skip-gram 和 CBOW,模型結(jié)構(gòu)如圖1所示。

      4.2實(shí)驗(yàn)設(shè)計(jì)和結(jié)果分析

      4.2.1實(shí)驗(yàn)過(guò)程

      傳統(tǒng)的協(xié)同過(guò)濾算法依賴的讀者圖書(shū)評(píng)分?jǐn)?shù)據(jù),高校圖書(shū)館后臺(tái)管理系統(tǒng)中并不存儲(chǔ)產(chǎn)生讀者對(duì)圖書(shū)的評(píng)分?jǐn)?shù)據(jù),而生成讀者圖書(shū)評(píng)分?jǐn)?shù)據(jù)可根據(jù)本文所采用的數(shù)據(jù)集中讀者借閱信息表來(lái)生成,采用目標(biāo)讀者對(duì)目標(biāo)圖書(shū)的總借閱天數(shù)來(lái)代表讀者對(duì)該圖書(shū)的評(píng)分,其中0在矩陣中表示讀者未借閱過(guò)該圖書(shū),并且對(duì)評(píng)分進(jìn)行歸一化處理。

      為了評(píng)估詞向量方法在計(jì)算圖書(shū)相似性的有效性,本章采取計(jì)算目標(biāo)圖書(shū)A與其緊鄰的K本圖書(shū)在圖書(shū)類別上的一致性的方法來(lái)評(píng)估,其中每本圖書(shū)的類別按照《中圖法》的標(biāo)準(zhǔn)確定。如O212.6/23的分類為O21,通過(guò)word2vec方法計(jì)算的該書(shū)最相近的4本圖書(shū)為O211.64/15,O212.4,O212.1/94,O241.6/48-1,幾本書(shū)的分類分別為O21,O21,O21,O24,采取投票法確定這幾本書(shū)的最終分類為O21,和目標(biāo)圖書(shū)的分類一致。實(shí)驗(yàn)中我們采取word2vec以及基于SVD的協(xié)同過(guò)濾兩種方法計(jì)算相近圖書(shū),在不同近鄰數(shù)k(k=6,8,10,12)下對(duì)不同數(shù)目的圖書(shū)進(jìn)行實(shí)驗(yàn)。

      本文基于詞向量的協(xié)同過(guò)濾方法主要思路把圖書(shū)名稱看作單詞,以學(xué)生借閱的圖書(shū)看作句子,利用 word2vec 模型構(gòu)建圖書(shū)的向量空間。具體地,把學(xué)生的記錄按照7:3的比例隨機(jī)的分訓(xùn)練集和測(cè)試集兩部分,分別構(gòu)建基于word2vec的物品協(xié)同過(guò)濾模型(w2v-ItemCF)、基于SVD的協(xié)同過(guò)濾模型(SVD),在測(cè)試集上根據(jù)學(xué)生的歷史借閱圖書(shū)推薦相似的圖書(shū)從不同方面評(píng)估推薦效果。

      評(píng)估推薦算法推薦效果的方法有很多,主要分為離線實(shí)驗(yàn)、線上測(cè)試對(duì)比、用戶調(diào)查等幾種方式。線上測(cè)試通常是采取線上A/B測(cè)試的方式對(duì)效果進(jìn)行評(píng)估,而用戶調(diào)查則是通過(guò)科學(xué)的調(diào)查方法,比如問(wèn)卷、訪談等形式去估計(jì)評(píng)估效果,本文采用離線測(cè)試的方法對(duì)推薦效果進(jìn)行對(duì)比。具體地,如文獻(xiàn)[1],評(píng)估推薦效果的常用指標(biāo)有用戶滿意度、預(yù)測(cè)準(zhǔn)確度、覆蓋率、多樣性、新穎度、驚奇度、信任度、健壯性等。本文由于是采取離線實(shí)驗(yàn)的方式,主要從評(píng)分預(yù)測(cè)RMSE來(lái)評(píng)估推薦系統(tǒng)。

      4.2.2實(shí)驗(yàn)結(jié)果

      表2是在近鄰數(shù)為10下分別利用word2vec以及SVD計(jì)算目標(biāo)圖書(shū)和近鄰圖書(shū)類別一致性的對(duì)比結(jié)果,結(jié)果顯示基于word2vec的方法在不同數(shù)量圖書(shū)下計(jì)算的準(zhǔn)確度均比SVD的方法高。 表3是兩種方法在訓(xùn)練集上的誤差情況,可以看出基于word2vec的方法在預(yù)測(cè)誤差也明顯小于SVD的方法。

      5結(jié)論

      本文針對(duì)數(shù)字圖書(shū)館圖書(shū)推薦問(wèn)題,針對(duì)只有借閱記錄的數(shù)字圖書(shū)館,傳統(tǒng)的協(xié)同過(guò)濾算法存在數(shù)據(jù)稀疏問(wèn)題,針對(duì)此問(wèn)題提出了基于詞向量的物品推薦算法。經(jīng)過(guò)實(shí)驗(yàn)對(duì)比顯示基于詞向量的方法在圖書(shū)相似性計(jì)算以及實(shí)際推薦的效果均好于傳統(tǒng)的SVD方法。

      參考文獻(xiàn)

      [1]項(xiàng)亮.推薦系統(tǒng)實(shí)踐[M].北京:人民郵電出版社,2012.

      [2]王飛,楊國(guó)林.高校圖書(shū)館個(gè)性化推薦服務(wù)算法研究[J].內(nèi)蒙古師大學(xué)報(bào)(自然漢文版),2015,44(6):802807.

      [3]宋楚平.一種改進(jìn)的協(xié)同過(guò)濾方法在高校圖書(shū)館圖書(shū)推薦中的應(yīng)用[J].圖書(shū)情報(bào)工作,2016,60(24):8691.

      [4]Mikolov T,Chen K,Corrado G,et al.Efficient Estimation of Word Representations in Vector Space[J].Computer Science,2013.

      [5]Ozsoy M G.From Word Embeddings to Item Recommendation[Z].2016.

      猜你喜歡
      協(xié)同過(guò)濾推薦系統(tǒng)圖書(shū)館
      圖書(shū)館
      基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
      基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過(guò)濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
      基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過(guò)濾推薦算法研究
      基于個(gè)性化的協(xié)同過(guò)濾圖書(shū)推薦算法研究
      個(gè)性化推薦系統(tǒng)關(guān)鍵算法探討
      基于協(xié)同過(guò)濾算法的個(gè)性化圖書(shū)推薦系統(tǒng)研究
      混合推薦算法在電影推薦中的研究與評(píng)述
      飛躍圖書(shū)館
      淺談Mahout在個(gè)性化推薦系統(tǒng)中的應(yīng)用
      嘉义市| 治县。| 桓台县| 荔浦县| 临潭县| 星座| 眉山市| 通河县| 从江县| 和田县| 萝北县| 阆中市| 玉溪市| 洛扎县| 乌鲁木齐市| 江阴市| 太康县| 都昌县| 信宜市| 万年县| 新邵县| 肥城市| 乌海市| 通渭县| 大方县| 沙坪坝区| 保定市| 银川市| 崇州市| 云霄县| 长垣县| 玉屏| 达州市| 诏安县| 佳木斯市| 邳州市| 老河口市| 临泽县| 福州市| 道真| 天津市|