• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)下的圖書館個性化推薦研究

      2017-07-13 12:14:16何波章宏遠
      新世紀圖書館 2017年6期
      關鍵詞:個性化推薦數(shù)據(jù)挖掘大數(shù)據(jù)

      何波?章宏遠

      摘 要 隨著大數(shù)據(jù)時代的來臨,針對所有的用戶都采用同一種方法的圖書館個性化推薦,已經(jīng)無法滿足圖書館用戶的需要。論文利用基于大數(shù)據(jù)的數(shù)據(jù)挖掘預處理技術,將圖書館用戶細分為新用戶和一般用戶,然后利用數(shù)據(jù)挖掘與mapreduce技術,提出大數(shù)據(jù)下的圖書館個性化推薦方法和策略。

      關鍵詞 大數(shù)據(jù) 數(shù)據(jù)挖掘 個性化推薦

      分類號 G250.7

      DOI 10.16810/j.cnki.1672-514X.2017.06.015

      Abstract The traditional recommendation strategy adopts the same recommendation method for all users. It is not able to satisfy the library users needs in the era of big data. This paper divides library users into new users and ordinary users by data mining preprocessing technology based on big data. Also, it proposes the library personalized recommendation strategy based on data mining and mapreduce.

      Keywords Big data. Data mining. Personalized recommendation.

      大數(shù)據(jù)時代,圖書館在個性化推薦服務中應用數(shù)據(jù)挖掘[1]和Mapreduce[2]技術,將圖書館的海量數(shù)據(jù)優(yōu)勢[3-4] 充分發(fā)揮出來,大幅提升圖書館的個性化推薦服務水平。國內(nèi)外研究人員和研究機構對大數(shù)據(jù)下的圖書館個性化服務進行了初步的研究和應用。代表性的有楊亮的“大數(shù)據(jù)環(huán)境下圖書館個性化服務研究”[5]、陳臣的“基于大數(shù)據(jù)的圖書館個性化智慧服務體系構建”[6]、Cassidy R. Sugimoto的“Library and information science in the big data era:funding, projects, and future”[7]等研究成果。但是這些研究成果對圖書館全體用戶采用同樣的推薦方法,沒有考慮圖書館新用戶和一般用戶的不同。與一般用戶相比,圖書館新用戶被收集的個人信息較少,需要使用有針對性的個性化推薦方法。因此,對于海量圖書館數(shù)據(jù),需要根據(jù)圖書館新用戶和一般用戶的不同特點,提出有針對性的大數(shù)據(jù)下的圖書館個性化推薦方法和策略。

      1 大數(shù)據(jù)下的圖書館個性化用戶模式

      個性化用戶模式[8]是圖書館個性化推薦服務的基礎。利用大數(shù)據(jù)的數(shù)據(jù)挖掘預處理技術,對圖書館訪問數(shù)據(jù)進行預處理挖掘,形成大數(shù)據(jù)下的圖書館個性化用戶模式。圖書館個性化用戶模式定義為三元組,形式化的具體表示如下所示:

      其中ipt為用戶IP地址,idt為用戶ID,URLt為訪問的圖書館網(wǎng)頁的URL,u為一條用戶訪問圖書館網(wǎng)頁的記錄,u.time為訪問圖書館網(wǎng)頁的時間戳,u.timelength為訪問圖書館網(wǎng)頁的時長。u.timelength=u.time- u.time,1 ≤ k ≤ m-1.

      2 大數(shù)據(jù)下的圖書館用戶細分

      圖書館新用戶被收集的個人信息較少,不適合和一般用戶采用同樣的推薦方法。大數(shù)據(jù)下圖書館用戶細分的目的是針對不同的用戶來提供不同的個性化推薦服務。

      針對圖書館用戶的特點,將其分為新用戶(newuser)和一般用戶(domesticuser)。新用戶和一般用戶的確定需要考慮多個因素,包括圖書館訪問時長(duration)、圖書館新鮮度(new)以及圖書館訪問頻率(Frequent)。

      (1)圖書館訪問時長(duration)為用戶多次訪問圖書館的時長之和

      其中count是用戶訪問圖書館的次數(shù),durationi是用戶第i次訪問圖書館所花費的時間。

      (2)圖書館新鮮度(new)表示用戶對圖書館的訪問時間的新鮮程度

      其中userstart是用戶首次訪問圖書館的日期,usercurrency是現(xiàn)在的日期, userend是用戶最近一次訪問圖書館的結束日期。

      (3)圖書館訪問頻率(Frequent)表示用戶訪問圖書館的頻率

      其中count是用戶訪問圖書館的次數(shù)。

      對于以上各個公式計算出來的值,利用模糊函數(shù)轉換到[0,1]范圍;Frequent的權重最大,設定為;duration的權重較大,都設為;new的權重最小,都設為;用戶閾值設定為。

      if (*Frequent +*duration +*new>),表明該用戶為一般用戶(domesticuser); else 該用戶為新用戶(newuser);

      3 大數(shù)據(jù)下的圖書館個性化推薦方法和策略

      通過利用大數(shù)據(jù)的數(shù)據(jù)挖掘與mapreduce技術,針對新用戶和一般用戶的不同,分別提出有針對性的圖書館個性化推薦方法。推薦策略描述如下。

      針對圖書館個人信息較少的新用戶,提出基于用戶模式聚類與mapreduce的圖書館個性化推薦方法。該方法利用大數(shù)據(jù)的mapreduce技術,首先采用map分解任務,對相似的圖書館個性化用戶模式聚類;然后匹配圖書館個性化用戶聚類模式與圖書館用戶當前訪問路徑;最后采用reduce進行歸并,將匹配度高的推薦集推薦給用戶。該方法對相似的圖書館個性化用戶模式聚類,利用興趣相似的圖書館個性化用戶聚類模式獲得推薦集,擴大了推薦范圍,非常適合圖書館新用戶。

      一般用戶是圖書館的主要用戶。為了吸引并留住一般用戶,提出基于關聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法。該方法利用大數(shù)據(jù)的mapreduce技術,首先采用map分解任務,從圖書館個性化用戶模式中挖掘出頻繁訪問路徑,然后從頻繁訪問路徑中挖掘與圖書館用戶當前訪問路徑匹配的關聯(lián)規(guī)則;最后采用reduce進行歸并,根據(jù)關聯(lián)規(guī)則和推薦度閾值將推薦集推薦給用戶。該方法推薦速度快,準確度高,非常適合圖書館一般用戶。

      4 個性化推薦方法相關實驗

      測試設備為Lenove服務器。實驗數(shù)據(jù)來自重慶理工大學校圖書館一個月的訪問記錄。選擇100位新用戶和100位一般用戶,第1次實驗采用基于用戶模式聚類與mapreduce的圖書館個性化推薦方法進行推薦準確度測試,第2次實驗采用基于關聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法進行推薦準確度測試。圖書館用戶推薦準確度如圖1所示。

      第1次實驗采用基于用戶模式聚類與mapreduce的圖書館個性化推薦方法,實驗結果是圖書館新用戶的推薦平均準確度為83%,圖書館一般用戶的推薦平均準確度為72%。第2次實驗采用基于關聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法,實驗結果是圖書館新用戶的推薦平均準確度為68%,圖書館一般用戶的推薦平均準確度為92%。從實驗結果可以看出,第1次實驗采用的方法適合圖書館新用戶,第2次實驗采用的方法非常適合一般用戶。

      將提出的基于用戶模式聚類與mapreduce的圖書館個性化推薦方法、基于關聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法應用到學校圖書館。對200位新用戶采用基于用戶模式聚類與mapreduce的圖書館個性化推薦方法進行推薦,對200位一般用戶采用基于關聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法進行推薦。讓用戶30天后進行推薦滿意度調(diào)查。圖書館用戶推薦滿意度如圖2所示。

      圖書館用戶推薦滿意度調(diào)查結果是:200位新用戶對基于用戶模式聚類與mapreduce的圖書館個性化推薦方法的推薦滿意度為88%,200位一般用戶對基于關聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法的推薦滿意度為94%。從實驗結果可以看出,有針對性的、準確的圖書館個性化推薦能夠滿足不同用戶的推薦需求,吸引并留住圖書館用戶。

      5 結語

      圖書館新用戶被收集的個人信息較少,不適合采用和一般用戶同樣的推薦方法。圖書館應積極利用大數(shù)據(jù)的數(shù)據(jù)挖掘預處理技術,將圖書館用戶細分為新用戶和一般用戶,并通過數(shù)據(jù)挖掘與mapreduce技術,形成大數(shù)據(jù)下的圖書館個性化推薦方法和策略。實驗結果表明,這一大數(shù)據(jù)下的圖書館個性化推薦方法和策略是有效的。

      參考文獻:

      [ 1 ] HAM J W, KAMBER M, PEI J. Data mining: concepts and techniques third edition[M].San Francisco: Morgan Kaufmann, 2011.

      [ 2 ] 李建江,崔健,王聃,等. Mapreduce并行編程模型研究綜述[J].電子學報, 2011,39(11):2635-2642.

      [ 3 ] Science. Special online collection: dealing with Data [EB/OL].[2015-12-20].http://www.sciencemag.org/site/special/data/,2011.

      [ 4 ] 李國杰.大數(shù)據(jù)研究的科學價值[J].中國計算機學會通訊,2012,9(8):8-15.

      [ 5 ] 楊亮.大數(shù)據(jù)環(huán)境下圖書館個性化服務研究[J]. 現(xiàn)代情報,2014,34(4):74-77.

      [ 6 ] 陳臣.基于大數(shù)據(jù)的圖書館個性化智慧服務體系構建[J].情報資料工作, 2013,34(6):75-79.

      [ 7 ] CASSIDY R. SUGIMOTO, YING DING, THELWALL M. Library and information science in the big data era: funding, projects, and future[J].Proceedings of the American Society for Information Science and Technology, 2012,49(1):1-3.

      [ 8 ] 張潼.互聯(lián)網(wǎng)大數(shù)據(jù)發(fā)展趨勢[J].重慶理工大學學報(自然科學). 2015(10):3-4.

      猜你喜歡
      個性化推薦數(shù)據(jù)挖掘大數(shù)據(jù)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      基于鏈式存儲結構的協(xié)同過濾推薦算法設計與實現(xiàn)
      軟件導刊(2016年11期)2016-12-22 21:40:40
      個性化推薦系統(tǒng)關鍵算法探討
      基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
      無線定位個性化導覽關鍵技術在博物館中的運用
      基于大數(shù)據(jù)背景下的智慧城市建設研究
      科技視界(2016年20期)2016-09-29 10:53:22
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      江阴市| 西乌| 五峰| 抚顺县| 天长市| 葫芦岛市| 景德镇市| 图木舒克市| 呼图壁县| 嘉祥县| 富锦市| 囊谦县| 保山市| 阜新| 紫金县| 确山县| 平塘县| 淮滨县| 家居| 刚察县| 井冈山市| 文安县| 长宁县| 兴文县| 清原| 云和县| 阿城市| 平利县| 谢通门县| 正镶白旗| 宽甸| 苍山县| 邻水| 丰都县| 哈尔滨市| 伊吾县| 大安市| 庄河市| 通渭县| 高要市| 天门市|