個(gè)性化關(guān)鍵技術(shù)研究綜述

2011-02-14 02:50:22蘇玉召趙妍

圖書(shū)與情報(bào) 2011年1期

蘇玉召趙妍

摘要：個(gè)性化研究的關(guān)鍵技術(shù)主要包括有三個(gè)方面的內(nèi)容：用戶建模、推薦系統(tǒng)和評(píng)價(jià)。首先，用戶建模是收集用戶數(shù)據(jù)，目的是為推薦系統(tǒng)提供用戶的興趣、偏好等建立模型；其次，推薦系統(tǒng)的作用是根據(jù)用戶模型為用戶推薦個(gè)性化內(nèi)容，是個(gè)性化的核心內(nèi)容；最后，評(píng)價(jià)系統(tǒng)根據(jù)用戶對(duì)個(gè)性化應(yīng)用的滿意程度，反饋給推薦系統(tǒng)調(diào)整建模策略。個(gè)性化應(yīng)用是一個(gè)不斷反饋修正的過(guò)程。

關(guān)鍵詞：個(gè)性化 Web挖掘推薦系統(tǒng) 用戶建模個(gè)性化評(píng)價(jià)

中圖分類號(hào)： G350；TP311文獻(xiàn)標(biāo)識(shí)碼：Ａ文章編號(hào)： 1003-69３８（２０11）０1－0059-07

Survey of Key Technologies in Personalization Application

Su Yuahao （National Science Library， CAS， Beijing， 100190）

Zhao Yan （Zhengzhou Institute of Aeronautical Industry Management， Zhengzhou， Henan， 450015）

Abstract：The key technology of Personalization Application includes three aspects: User Modeling, Recommendation System, and Personalization Evaluation. First, User Modeling collects user personal data, and provides user's interests and preference to Recommendation System. Secondly, Recommendation System is the most important part of Personalization, which recommends personalized content for individual. Finally, Evaluation provides the feedback information of user's evaluation for Recommendation System to help it modulating the strategy of User Modeling. Personalization application is a process with continuous modulating its recommend strategy according to user's feedback.

Key words：personalization; web mining; recommendation system; user modeling; personalization evaluation

ＣＬＣ number： G350；TP311Document code： AArticle ID： 1003-6938（20１1）01-0059-07

1 引言

個(gè)性化最初起因于基于Web應(yīng)用的商務(wù)智能（BI）發(fā)展，獲得商業(yè)利潤(rùn)最大化的需要。電子商務(wù)（e-commerce）和客戶關(guān)系管理（CRM）網(wǎng)站采用數(shù)據(jù)挖掘的方法發(fā)現(xiàn)顧客與商品之間的關(guān)聯(lián)和分析用戶購(gòu)物行為，銷售更多的商品和吸引顧客而不斷調(diào)整營(yíng)銷策略。隨著數(shù)據(jù)挖掘理論及其技術(shù)進(jìn)步不斷深化，計(jì)算機(jī)網(wǎng)絡(luò)和網(wǎng)絡(luò)信息管理技術(shù)的發(fā)展，基于客戶/服務(wù)器模式為用戶和網(wǎng)站提供更多的交互機(jī)會(huì)。于是針對(duì)每個(gè)用戶的個(gè)性化服務(wù)便迅速發(fā)展起來(lái)。

關(guān)于個(gè)性化概念，不同的學(xué)者和研究人員，在不同的時(shí)期對(duì)其理解、及其所持觀點(diǎn)也各不盡相同。有些從事IT行業(yè)的專家認(rèn)為個(gè)性化是一種能力，例如，前劍橋福雷斯特研究公司的分析師Paul Hagen在1999年的一次電子商務(wù)會(huì)議上說(shuō)，“個(gè)性化是一種能力，根據(jù)每個(gè)用戶的愛(ài)好和行為知識(shí)，對(duì)其提供簡(jiǎn)潔的內(nèi)容和服務(wù)?！?長(zhǎng)期從事IT行業(yè)實(shí)踐和研究的專家Jill Dyche 女士，2002年由艾迪生-韋斯利出版公司出版的“CRM指南”，認(rèn)為“個(gè)性化是一種定制用戶交流的能力，這種能力的實(shí)現(xiàn)是借助于用戶進(jìn)行交流時(shí)的愛(ài)好和行為知識(shí)的獲得。”而有些計(jì)算機(jī)技術(shù)專家認(rèn)為，個(gè)性化是一種服務(wù)。例如，前IBM沃森研究中心的研究人員Doug Riecken在2000年美國(guó)計(jì)算機(jī)協(xié)會(huì)（ACM）通信年會(huì)上提出，“個(gè)性化是關(guān)于通過(guò)建立一種有意義的一對(duì)一關(guān)系，從而建立用戶的忠誠(chéng)度。同時(shí)，通過(guò)理解每一個(gè)用戶特殊需要的內(nèi)容，為其提供高效、有價(jià)值的服務(wù)?！币恍氖聜€(gè)性化技術(shù)研究的專家學(xué)者認(rèn)為，個(gè)性化是一種技術(shù)。例如，在2003年的個(gè)性化智能技術(shù)國(guó)際研討會(huì)上，各國(guó)的學(xué)者和研究人員就個(gè)性化概念達(dá)成共識(shí)，認(rèn)為“個(gè)性化是一種技術(shù)，這種技術(shù)根據(jù)用戶的信息定制商業(yè)和每個(gè)用戶電子商務(wù)的交互。用戶的信息可以是以前獲得的，也可以是實(shí)時(shí)方式獲得信息。根據(jù)可用的用戶信息，商業(yè)不同部門(mén)之間進(jìn)行變更以適應(yīng)用戶的需求?！?還有的一些從事信息技術(shù)研究的專家和學(xué)者認(rèn)為，個(gè)性化是一種過(guò)程。例如， Kwon分別在2007年和2009年美國(guó)信息技術(shù)協(xié)會(huì)（ITAA）年會(huì)上分別提出“個(gè)性化是一個(gè)過(guò)程，在電子服務(wù)應(yīng)用方面，是一個(gè)應(yīng)用用戶信息為其發(fā)送目標(biāo)方案的過(guò)程?！?這些關(guān)于個(gè)性化的概念重點(diǎn)是從個(gè)性化是什么和個(gè)性化能夠做什么方面定義，但是，這些觀點(diǎn)沒(méi)有從系統(tǒng)化、全面性定義個(gè)性化。

美國(guó)芝加哥德保羅大學(xué)的Bamshad Mobasher教授從20世紀(jì)90年代就開(kāi)始個(gè)性化的研究，他對(duì)個(gè)性化的特點(diǎn)、歷史、現(xiàn)狀和未來(lái)的發(fā)展趨勢(shì)具有全面和獨(dú)到的見(jiàn)解。因此，Mobasher對(duì)個(gè)性化的定義具有重要的參考價(jià)值，他認(rèn)為：“在Web上下文中，個(gè)性化意味著動(dòng)態(tài)內(nèi)容的發(fā)送，例如文本元素、鏈接、廣告和產(chǎn)品推薦等，這些內(nèi)容專門(mén)為特定用戶或者一部分用戶的需要或者興趣定制的過(guò)程”。［1 ］他把個(gè)性化過(guò)程看作是一個(gè)包含數(shù)據(jù)挖掘循環(huán)所有階段中的一個(gè)典型應(yīng)用。這些階段包括數(shù)據(jù)收集、預(yù)處理模式發(fā)現(xiàn)、性能評(píng)價(jià)和在用戶和Web網(wǎng)站之間應(yīng)用實(shí)時(shí)發(fā)現(xiàn)的知識(shí)。

主要研究個(gè)性化的ITWP國(guó)際會(huì)議重點(diǎn)內(nèi)容是個(gè)性化理論和技術(shù)，其每一次會(huì)議的成果都體現(xiàn)了當(dāng)時(shí)的研究方法和應(yīng)用領(lǐng)域。典型的個(gè)性化研究代表是Mobasher教授和其他個(gè)性化研究的專家學(xué)者等研究人員，同時(shí)，Mobasher教授一直作為ITWP組委會(huì)主席，許多他本人及其合作者的研究成果及文獻(xiàn)可以通過(guò)其個(gè)人網(wǎng)站獲得。因此，他們的個(gè)性化研究成果具有權(quán)威性和代表性。研究他們的成果對(duì)于我們未來(lái)個(gè)性化研究具有借鑒意義?？偨Y(jié)近幾年個(gè)性化研究?jī)?nèi)容，其關(guān)鍵技術(shù)主要包括推薦系統(tǒng)、用戶建模、評(píng)價(jià)等三個(gè)方面。

2 個(gè)性化推薦系統(tǒng)

個(gè)性化推薦是Web挖掘結(jié)果呈現(xiàn)給用戶的應(yīng)用，其使用的數(shù)據(jù)主要來(lái)自Web網(wǎng)站與用戶行為交互生成的數(shù)據(jù)。其依據(jù)原理是數(shù)據(jù)挖掘理論基礎(chǔ)。因此，個(gè)性化推薦使用的算法主要來(lái)自數(shù)據(jù)挖掘理論的算法。通常，個(gè)性化推薦分為基于規(guī)則過(guò)濾、基于內(nèi)容過(guò)濾、基于協(xié)作過(guò)濾的方法、以及這三種方法混合的推薦方法。根據(jù)不同的個(gè)性化推薦方法，采用的挖掘算法也各不相同，常用的算法類型包括關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、聚類分析、序列模式挖掘和回歸分析等。

2.1 Web挖掘

許多學(xué)者認(rèn)為，Etzioni是第一個(gè)提出Web挖掘（Web Mining）技術(shù)的人，［2 ］他在1996年的描述中認(rèn)為，Web挖掘是應(yīng)用數(shù)據(jù)挖掘技術(shù)，從Web文檔和服務(wù)內(nèi)容里自動(dòng)發(fā)現(xiàn)并抽取有用信息。一般情況，Web挖掘技術(shù)可以分為3種類型［3 ］：Web內(nèi)容挖掘（Web Content Mining）、Web結(jié)構(gòu)挖掘（Web Structure Mining）和Web使用挖掘（Web Usage Mining）（Kosala&Blockeel;,2000）。Srivastava等人對(duì)Web使用挖掘的定義是［4 ］：Web使用挖掘是應(yīng)用數(shù)據(jù)挖掘技術(shù)，為了更好的理解和服務(wù)基于Web應(yīng)用的需要，發(fā)現(xiàn)Web數(shù)據(jù)的使用模式。

Web內(nèi)容挖掘包括應(yīng)用數(shù)據(jù)挖掘技術(shù)從Web對(duì)象中抽取模型,Web對(duì)象內(nèi)容包括普通文本、半結(jié)構(gòu)化文檔（如HTML和XML）、結(jié)構(gòu)化文檔（如數(shù)字圖書(shū)館）、動(dòng)態(tài)文檔和多媒體文檔。Web結(jié)構(gòu)挖掘的目標(biāo)是發(fā)現(xiàn)隱藏在Web對(duì)象之間相互連接的拓?fù)浣Y(jié)構(gòu)建模，對(duì)Web網(wǎng)站進(jìn)行分類和分級(jí)，以發(fā)現(xiàn)對(duì)象之間的相似性。Web使用挖掘是應(yīng)用數(shù)據(jù)挖掘技術(shù)，從Web數(shù)據(jù)中發(fā)現(xiàn)用法模式。進(jìn)行挖掘的數(shù)據(jù)通常來(lái)自用戶與Web對(duì)象的交互行為，比如，Web服務(wù)器或者代理服務(wù)器日志、用戶查詢、注冊(cè)數(shù)據(jù)。Web使用挖掘工具發(fā)現(xiàn)并預(yù)測(cè)用戶行為，幫助設(shè)計(jì)者進(jìn)行統(tǒng)計(jì)分析、改進(jìn)Web網(wǎng)站、吸引訪問(wèn)者或者為有規(guī)律的用戶提供個(gè)性化服務(wù)。Web使用挖掘與Web結(jié)構(gòu)挖掘和Web內(nèi)容挖掘的區(qū)別在于，Web使用挖掘反映的是人與網(wǎng)絡(luò)交互的行為，對(duì)用戶行為與Web網(wǎng)站交互的分析可以深入理解定制與個(gè)性化的用戶Web體驗(yàn)。

Web使用挖掘使用的數(shù)據(jù)可能來(lái)自Web服務(wù)器訪問(wèn)日志、代理服務(wù)器日志、引用頁(yè)日志、瀏覽器日志、錯(cuò)誤日志、用戶資料、注冊(cè)數(shù)據(jù)、用戶會(huì)話、用戶交易、cookies、用戶查詢或者是用戶書(shū)簽數(shù)據(jù)（Gunduz,2003）。通過(guò)分析這些文件和文檔，我們可以獲得用戶感興趣的使用模式和信息。Web使用挖掘最初在電子商務(wù)領(lǐng)域，Web使用挖掘吸引了銷售決策者和電子商務(wù)專家的強(qiáng)烈興趣。［5 ］隨著數(shù)據(jù)挖掘理論和網(wǎng)絡(luò)信息管理技術(shù)的發(fā)展，個(gè)性化研究現(xiàn)在已經(jīng)滲透到各個(gè)行業(yè)和領(lǐng)域，例如，電信行業(yè)、銀行金融機(jī)構(gòu)、移動(dòng)設(shè)備和反恐領(lǐng)域等。

2.2 基于規(guī)則過(guò)濾的技術(shù)

基于規(guī)則過(guò)濾方法的典型例子就是“購(gòu)物籃”算法，通過(guò)查找購(gòu)買(mǎi)物品之間的聯(lián)系為用戶推薦。其特點(diǎn)在于采用關(guān)聯(lián)規(guī)則、回歸算法，找到用戶對(duì)相關(guān)聯(lián)物品之間的興趣度、發(fā)現(xiàn)用戶偏好，預(yù)測(cè)用戶未來(lái)行為。

Peng 等人提出的一種個(gè)性化推薦模型采用apriori 算法和用于統(tǒng)計(jì)的tf-idf加權(quán)技術(shù)，包括三部分：資源描述、用戶偏好抽取和個(gè)性化推薦。首先，通過(guò)分析挖掘用戶Web訪問(wèn)日志獲取的資源信息，生成資源文本空間向量；然后，采用apriori 算法對(duì)這些向量進(jìn)行計(jì)算，獲得興趣集；最后，根據(jù)推薦模型，把推薦過(guò)濾和存儲(chǔ)的資源內(nèi)容推薦給用戶。［6 ］2003年華墨西哥阿卡普爾科舉辦的第2屆個(gè)性化智能技術(shù)（ITWP2003）研討會(huì)上，［7 ］Mobasher等人基于關(guān)聯(lián)規(guī)則和序列模式的個(gè)性化推薦模型對(duì)網(wǎng)站的影響進(jìn)行了研究。［8 ］Forsati 等人提出一種用于個(gè)性化基于權(quán)重的關(guān)聯(lián)規(guī)則算法，該算法是對(duì)傳統(tǒng)的關(guān)聯(lián)規(guī)則算法的擴(kuò)展，允許交易中的每一個(gè)項(xiàng)目分配一個(gè)權(quán)重以反映用戶對(duì)該項(xiàng)目的興趣度。在結(jié)果關(guān)聯(lián)規(guī)則集里每一個(gè)項(xiàng)目都對(duì)應(yīng)一個(gè)權(quán)重參數(shù)，根據(jù)用戶的興趣程度，為每個(gè)用戶訪問(wèn)的Web頁(yè)面分配一個(gè)時(shí)間權(quán)重和訪問(wèn)頻率權(quán)重。這種方法能夠客觀地、更有效的表示預(yù)測(cè)結(jié)果，對(duì)推薦系統(tǒng)效率有很大改進(jìn)。［9 ］

2.3 基于內(nèi)容過(guò)濾的技術(shù)

基于內(nèi)容的過(guò)濾推薦技術(shù)特點(diǎn)是，［10 ］根據(jù)用戶過(guò)去選擇項(xiàng)目的特點(diǎn)，從項(xiàng)目描述、終端數(shù)據(jù)庫(kù)里的項(xiàng)目屬性關(guān)聯(lián)抽取項(xiàng)目?jī)?nèi)容特點(diǎn)，系統(tǒng)為其推薦相似的項(xiàng)目?；趦?nèi)容的過(guò)濾系統(tǒng)最大的缺點(diǎn)是用戶模型的建立過(guò)度依賴于用戶以前選擇和點(diǎn)擊的具體項(xiàng)目。此外，基于內(nèi)容過(guò)濾技術(shù)要求項(xiàng)目能夠有效代表抽取的文本特點(diǎn)，Web數(shù)據(jù)異構(gòu)的特性決定了這種方法并不總是有效。更詳細(xì)的基于內(nèi)容的過(guò)濾系統(tǒng)內(nèi)容參見(jiàn)文獻(xiàn)。［11 ］

2.4 基于協(xié)作過(guò)濾的技術(shù)

維歸約、關(guān)聯(lián)挖掘、聚類和貝葉斯學(xué)習(xí)是協(xié)作過(guò)濾系統(tǒng)采用的一些技術(shù)。協(xié)作過(guò)濾推薦系統(tǒng)利用了用戶的相似性進(jìn)行推薦，而基于內(nèi)容過(guò)濾的推薦系統(tǒng)根據(jù)商品內(nèi)容的相似性進(jìn)行推薦。

Amazon是使用協(xié)作過(guò)濾推薦系統(tǒng)的先驅(qū)，作為市場(chǎng)戰(zhàn)略的一部分，提供“針對(duì)每位顧客的個(gè)性化商店”，這種方法即有益于顧客又有益于公司。公司擁有顧客更準(zhǔn)確的模型，可以對(duì)顧客的需求有更好的了解。而服務(wù)于這些需求則可在產(chǎn)品的交叉銷售、提升銷售、產(chǎn)品親和力、一對(duì)一促銷、大購(gòu)物籃和顧客忠誠(chéng)度方面獲得更大的成功。2001年美國(guó)西雅圖舉辦的第1屆個(gè)性化智能技術(shù)（ITWP2001）研討會(huì)上，［12 ］Mobasher 等人的根據(jù)匿名Web使用數(shù)據(jù)提高協(xié)作過(guò)濾效率的研究，根據(jù)數(shù)據(jù)挖掘和Web技術(shù)實(shí)現(xiàn)個(gè)性化協(xié)作過(guò)濾系統(tǒng)。Aghabozorgi 等人提出一種基于Web使用挖掘的離線個(gè)性化系統(tǒng)動(dòng)態(tài)模型，該模型采用聚類算法。其特點(diǎn)是，根據(jù)用戶交易，把離線模型周期性地轉(zhuǎn)變?yōu)閯?dòng)態(tài)模型，解決了離線模型隨著時(shí)間的流逝，一些新用戶的加入和原有用戶行為的改變引起的個(gè)性化用戶行為預(yù)測(cè)精度下降問(wèn)題。［13 ］

協(xié)作過(guò)濾推薦系統(tǒng)［14 ］尋找與目標(biāo)顧客歷史吻合的顧客群組（稱為近鄰），比如他們購(gòu)買(mǎi)相似的商品或?qū)δ撤N商品的評(píng)價(jià)。協(xié)作過(guò)濾推薦系統(tǒng)面臨兩個(gè)主要挑戰(zhàn)：可伸縮性和確保對(duì)顧客推薦的質(zhì)量?？缮炜s性重要是原因是，電子商務(wù)系統(tǒng)必須能夠?qū)崟r(shí)搜索數(shù)以百萬(wàn)計(jì)的潛在近鄰。如果網(wǎng)站使用瀏覽模式作為產(chǎn)品偏愛(ài)的指示，則對(duì)某些顧客可能會(huì)有數(shù)以千計(jì)的數(shù)據(jù)點(diǎn)。保證推薦質(zhì)量是贏得顧客信任的基本要素。如果顧客聽(tīng)從了系統(tǒng)的推薦但是最終并不喜歡這些推薦的商品，那么他們就會(huì)對(duì)該推薦系統(tǒng)產(chǎn)生懷疑，甚至不用。有些推薦系統(tǒng)采用基于內(nèi)容過(guò)濾和協(xié)作過(guò)濾的推薦技術(shù)，進(jìn)一步改善系統(tǒng)的推薦。

2.5 基于混合過(guò)濾的技術(shù)

基于規(guī)則過(guò)濾和基于協(xié)作過(guò)濾技術(shù)的缺點(diǎn)是，通常需要離線學(xué)習(xí)訓(xùn)練樣本生成關(guān)聯(lián)規(guī)則或者用戶組的分類，這種方法具有可擴(kuò)展性差和動(dòng)態(tài)變化緩慢的特點(diǎn)。因此，不適于在線的迅速響應(yīng)，尤其不適合實(shí)時(shí)查詢的響應(yīng)?；趦?nèi)容過(guò)濾技術(shù)的優(yōu)點(diǎn)是及時(shí)響應(yīng)快，總是處于在線狀態(tài)，但是，其缺點(diǎn)是依賴于用戶的歷史操作記錄，如果用戶的興趣偏好變化或者歷史記錄缺失，推薦給用戶的結(jié)果將會(huì)產(chǎn)生嚴(yán)重的失真。因此，結(jié)合這三種方法，將會(huì)有較快的響應(yīng)速度、較好的推薦準(zhǔn)確性和較高的預(yù)測(cè)精度。

當(dāng)前解決基于內(nèi)容過(guò)濾和協(xié)作過(guò)濾不足的研究熱點(diǎn)是采用混合推薦算法，目的是提高推薦的精度。Burke提出的方法是混合基于內(nèi)容和協(xié)作過(guò)濾技術(shù)，通過(guò)豐富變量的方法生成推薦系統(tǒng)，旨在提高推薦的質(zhì)量。［15 ］有的混合推薦系統(tǒng)，例如，Ardissono 等人的用戶建模和個(gè)性化推薦技術(shù)研究，［16 ］通過(guò)收集多種用戶偏好的信息，采用多種異構(gòu)推薦技術(shù)的方法實(shí)現(xiàn)。這種方法越來(lái)越多地被用于各種個(gè)性化服務(wù)中，例如，Nima等人關(guān)于Q-learning的Web推薦系統(tǒng)研究，［17 ］Chen等人的手機(jī)新聞混合推薦系統(tǒng)的普適訪問(wèn)研究。［18 ］Mobasher 等人提出一種框架，把在線用戶訪問(wèn)Web頁(yè)面的會(huì)話活動(dòng)過(guò)程與在線數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)挖掘任務(wù)分開(kāi)處理，基于聚類的技術(shù)把Web站點(diǎn)使用和內(nèi)容模型采用統(tǒng)一的表示方法，用于實(shí)時(shí)的個(gè)性化操作。這種方法的優(yōu)點(diǎn)在于Web站點(diǎn)的使用和內(nèi)容特點(diǎn)集成到Web挖掘框架里，為推薦引擎提供統(tǒng)一的訪問(wèn)方式，從而提高了個(gè)性化的效率。［19 ］2009年美國(guó)帕薩迪納舉辦的第7屆個(gè)性化智能技術(shù)和推薦系統(tǒng)（ITWP2009）研討會(huì)上，［20 ］Rosenthal等人的提出的研究旨在提高推薦系統(tǒng)在線預(yù)測(cè)精度。

3 個(gè)性化用戶建模

個(gè)性化推薦進(jìn)行Web使用挖掘的基礎(chǔ)是用戶建模，根據(jù)用戶模型進(jìn)行挖掘，發(fā)現(xiàn)用戶的興趣和偏好，預(yù)測(cè)其未來(lái)的訪問(wèn)行為，并為其推薦個(gè)性化信息。個(gè)性化用戶建模需要根據(jù)推薦系統(tǒng)的需求收集Web使用數(shù)據(jù)。所有個(gè)性化推薦方法的好壞在很大程度上依賴于收集的數(shù)據(jù)質(zhì)量。如果收集到的數(shù)據(jù)能夠準(zhǔn)確地反映出用戶興趣和偏好，則有助于個(gè)性化推薦系統(tǒng)性能的提高，否則，個(gè)性化系統(tǒng)推薦給用戶的信息不能滿足要求，用戶可能逐漸失去個(gè)性化推薦的興趣，也可能有糟糕的推薦會(huì)激怒用戶，最終會(huì)導(dǎo)致用戶根本不用該個(gè)性化推薦系統(tǒng)。

用戶模型與用戶偏好和興趣的數(shù)據(jù)相關(guān)，這些數(shù)據(jù)的收集不應(yīng)該過(guò)于強(qiáng)調(diào)用戶自身數(shù)據(jù)。收集用戶數(shù)據(jù)常用的方法有兩個(gè)，［21 ］一是顯式詢問(wèn)他們的偏好，二是隱式監(jiān)測(cè)用戶的行為推到他們的偏好。

顯示詢問(wèn)用戶偏好信息的方法有幾種：具體興趣的調(diào)查問(wèn)卷，例如，喜歡體育新聞或者科技新聞；編輯用戶關(guān)鍵詞；或者直接詢問(wèn)用戶具體的興趣。這些方法都有其局限性，首先，因?yàn)檫@些方法都無(wú)法準(zhǔn)確地動(dòng)態(tài)反應(yīng)用戶興趣和偏好的變化。并且，通過(guò)這些方法收集到的數(shù)據(jù)可能會(huì)引起對(duì)用戶偏好錯(cuò)誤的判斷，因?yàn)椴⒉皇撬械挠脩籼峁┛煽康男畔?。其次，這些方法重點(diǎn)都是依賴于來(lái)自用戶的信息，因此，收集的用戶模型數(shù)據(jù)片不全面。最后，并不是所有的用戶都愿意顯式地提供他們的偏好信息。

隱式收集用戶偏好是通過(guò)一種特殊的智能代理監(jiān)測(cè)用戶行為，從收集到的用戶信息推導(dǎo)用戶的偏好。用戶行為有幾個(gè)方面可以被監(jiān)測(cè)到，例如一篇文檔操作的滾動(dòng)、停留在該文檔上的時(shí)間。但是，這些方法可能會(huì)引起誤導(dǎo)，因?yàn)檫@些方法并不能反映用戶是否真的感興趣。

建立用戶模型需要的信息可以歸納為三個(gè)方面：①用戶個(gè)人信息，例如，用戶名、性別、出生日期和地址等人口統(tǒng)計(jì)學(xué)信息；②用戶歷史記錄，包括過(guò)去交易成功的記錄、瀏覽的記錄和收藏的記錄，例如，在電子商務(wù)網(wǎng)站上購(gòu)買(mǎi)喜愛(ài)的商品類別或者購(gòu)買(mǎi)數(shù)量等；③用戶定制的興趣偏好，例如，iGoogle定制的音樂(lè)盒、谷歌翻譯/字典、背單詞、博客主題訂閱、網(wǎng)站導(dǎo)航、BBS導(dǎo)航等。這些信息大部分包含個(gè)性化應(yīng)用收集到的事實(shí)數(shù)據(jù)，也包括從過(guò)去交易中推導(dǎo)出來(lái)的事實(shí)數(shù)據(jù)。個(gè)性化應(yīng)用程序收集這些信息完成后，記錄到Web日志文件，可以進(jìn)行日志清洗、處理，并存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中以便進(jìn)一步為推薦系統(tǒng)進(jìn)行數(shù)據(jù)挖掘使用。

如2.1節(jié)所述。在個(gè)性化推薦的Web使用挖掘研究中，數(shù)據(jù)的收集可以在服務(wù)器端、客戶端、代理服務(wù)器端，或者是集成Web服務(wù)器的數(shù)據(jù)庫(kù)進(jìn)行。Web使用挖掘的數(shù)據(jù)源主要包括用戶查詢、注冊(cè)的數(shù)據(jù)、Web服務(wù)器訪問(wèn)日志和Web應(yīng)用服務(wù)器日志記錄的服務(wù)器日志文件［22］［23 ］。收集Web使用數(shù)據(jù)，特別是Web日志，對(duì)于個(gè)性化預(yù)測(cè)和推薦的精度具有非常重要的作用。Lathia等人對(duì)個(gè)性化協(xié)作過(guò)濾算法進(jìn)行研究，［24 ］發(fā)現(xiàn)數(shù)據(jù)的質(zhì)量和數(shù)量對(duì)推薦系統(tǒng)的精度有重要影響。在他們的自適應(yīng)信息源的協(xié)作過(guò)濾研究中，發(fā)現(xiàn)推薦系統(tǒng)關(guān)注數(shù)據(jù)質(zhì)量而不是算法本身，能提高預(yù)測(cè)的精度。

近年來(lái)，關(guān)于個(gè)性化用戶建模的研究成果不斷出現(xiàn)。例如，2008年美國(guó)芝加哥舉辦的第6屆個(gè)性化智能技術(shù)和推薦系統(tǒng)（ITWP2008）研討會(huì)上，［25 ］Gemmis等人的基于用戶概要的個(gè)性化搜索信息抽取模型，［26 ］Hung等人的基于標(biāo)簽用戶建模的社會(huì)媒體推薦系統(tǒng)，［27 ］Kirmemis等人的基于內(nèi)容的用戶模型生成和電影推薦系統(tǒng)優(yōu)化方法，［28 ］這些研究都促進(jìn)了個(gè)性化用戶建模研究的發(fā)展。

當(dāng)前關(guān)于個(gè)性化用戶建模不足之處在于，關(guān)于Web日志數(shù)據(jù)需要記錄什么樣的數(shù)據(jù)缺乏理論研究。因?yàn)椴煌膽?yīng)用環(huán)境中評(píng)價(jià)個(gè)性化推薦性能的指標(biāo)不同，所以，Web日志記錄采用的格式也不相同。例如，在線購(gòu)物網(wǎng)站想發(fā)現(xiàn)商品關(guān)聯(lián)規(guī)則實(shí)現(xiàn)捆綁銷售策略，那么，Web日志記錄顧客在買(mǎi)了書(shū)籍之后還買(mǎi)了什么是關(guān)鍵因素；對(duì)于移動(dòng)服務(wù)供應(yīng)商來(lái)說(shuō)，要實(shí)現(xiàn)增值服務(wù)，Web日志記錄顧客對(duì)什么類型的資費(fèi)套餐感興趣是關(guān)鍵因素。

4 個(gè)性化評(píng)價(jià)

在個(gè)性化應(yīng)用被部署之前及應(yīng)用過(guò)程中，評(píng)價(jià)其準(zhǔn)確性和效率至關(guān)重要，需要不斷的調(diào)整個(gè)性化策略以實(shí)現(xiàn)性能更好的個(gè)性化推薦和預(yù)測(cè)結(jié)果。早期的個(gè)性化評(píng)價(jià)研究的重點(diǎn)是推薦系統(tǒng)采用算法的精度提高，但是，好的推薦系統(tǒng)還應(yīng)該同時(shí)采用其它的方法。Franc 等人認(rèn)為評(píng)價(jià)方法還包括［29 ］：（1）覆蓋范圍，測(cè)量推薦系統(tǒng)數(shù)據(jù)集為用戶推薦包含內(nèi)容的廣泛程度；（2）信任值，幫助用戶更有效的決定是否采用推薦的內(nèi)容；（3）計(jì)算時(shí)間，測(cè)量推薦算法生成好的推薦內(nèi)容的時(shí)間：（4）新穎，測(cè)量推薦系統(tǒng)是否采用新技術(shù)，具有發(fā)展前途；（5）健壯性，測(cè)量在有噪聲干擾和稀疏數(shù)據(jù)情況下，推薦算法是否做出好的預(yù)測(cè)；（6）采用協(xié)作推薦方法，當(dāng)前個(gè)性化推薦系統(tǒng)研究主要采用多種方法相結(jié)合的協(xié)作過(guò)濾方法。研究結(jié)果證明，綜合采用這些方法能實(shí)現(xiàn)較好的個(gè)性化推薦質(zhì)量。

許多個(gè)性化推薦系統(tǒng)的評(píng)價(jià)要求用戶參與，對(duì)個(gè)性化推薦系統(tǒng)提供的產(chǎn)品或者服務(wù)質(zhì)量做出明確評(píng)價(jià)。這樣的方法的實(shí)際效果并不明顯，因?yàn)橄到y(tǒng)提供的信息列表可能占用用戶很多時(shí)間，有些用戶可能不耐煩，敷衍了事。所以，個(gè)性化評(píng)價(jià)應(yīng)該采用盡可能消耗用戶時(shí)間少，較少的操作、用戶反饋的信息能夠體現(xiàn)用戶興趣偏好的方法。［30 ］Kwon 等人提出的如何最好體現(xiàn)電子商務(wù)個(gè)性化特征的方案，［31 ］個(gè)性化策略的效果可以通過(guò)用戶的滿意度和忠誠(chéng)度來(lái)體現(xiàn)，系統(tǒng)對(duì)用戶發(fā)送調(diào)查問(wèn)卷，回答其對(duì)個(gè)性化的滿意度并判斷其忠誠(chéng)度。

當(dāng)前，個(gè)性化模型的評(píng)價(jià)工作面臨諸多挑戰(zhàn)。首先，不同的建模方法和推薦算法可能需要不同的評(píng)價(jià)因子（如用戶的興趣、偏好、是否選擇推薦的內(nèi)容、個(gè)性化評(píng)分等）。其次，個(gè)性化活動(dòng)需求可能在不同的應(yīng)用領(lǐng)域、特定的應(yīng)用和數(shù)據(jù)收集的不同而有很大的區(qū)別。最后，研究者和開(kāi)發(fā)者對(duì)于個(gè)性化系統(tǒng)中什么因素對(duì)服務(wù)質(zhì)量的影響最大缺乏共識(shí)?；谝陨显?，個(gè)性化評(píng)價(jià)標(biāo)準(zhǔn)體系還需要進(jìn)一步深入研究。

5 個(gè)性化應(yīng)用和發(fā)展趨勢(shì)

隨著個(gè)性化研究理論的不斷深化，個(gè)性化應(yīng)用逐漸發(fā)展到各種行業(yè)和領(lǐng)域。這些行業(yè)和領(lǐng)域包括：（1）電子商務(wù)（如Amazon，www.amazon.com）；（2）公共服務(wù)（如英國(guó)的國(guó)家健康衛(wèi)生網(wǎng)站，www.nhs.uk）；（3）搜索引擎（如iGoogle，www.google.com.hk）；（4）圖書(shū)館（劍橋雜志在線，journals.combridge.org，美國(guó)國(guó)家醫(yī)學(xué)圖書(shū)館，www.ncbi.nlm.nih.gov）等，還有一些網(wǎng)站正在準(zhǔn)備建立自己的個(gè)性化應(yīng)用（中國(guó)數(shù)字圖書(shū)館，www.d-library.com.cn，中國(guó)科學(xué)院國(guó)家科學(xué)數(shù)字圖書(shū)館CSDL，159.226.100.28）；（5）生物醫(yī)學(xué)（5）電子學(xué)習(xí)（E-learning）；（6）移動(dòng)設(shè)備（如3G手機(jī)個(gè)性化）；（7）電子地圖；（8）居家生活等。

近幾年的研究也出現(xiàn)了一些新的研究方向。在2005年蘇格蘭愛(ài)丁堡舉辦的第3屆個(gè)性化智能技術(shù)（ITWP2005）研討會(huì)上，［32 ］出現(xiàn)了個(gè)性化安全方面的研究，例如，Burke等人的協(xié)作過(guò)濾系統(tǒng)系統(tǒng)中欺騙攻擊研究。［33 ］

研究發(fā)現(xiàn)，基于記憶的標(biāo)準(zhǔn)協(xié)作過(guò)濾算法，諸如K最近鄰算法，易于受到入侵攻擊，但是，基于模型的技術(shù)比K近鄰算法有較強(qiáng)的健壯性。Sandvig等人采用數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)規(guī)則算法，發(fā)現(xiàn)采用基于模型的Apriori算法在穩(wěn)定性和健壯性方面比K最近鄰算法更好。此外，實(shí)驗(yàn)結(jié)果還顯示Apriori算法比K最近鄰算法的推薦精度更高。［34 ］

Mobasher于2005主持，由美國(guó)國(guó)家科學(xué)基金支持的“個(gè)性化安全”研究項(xiàng)目在Microsoft的推薦系統(tǒng)上實(shí)現(xiàn)［35 ］，重點(diǎn)是通過(guò)攻擊建模分析對(duì)各種推薦算法的影響。研究結(jié)果顯示，基于用戶和項(xiàng)目的算法在特定的攻擊模型下很脆弱，但是，采用混合算法的推薦系統(tǒng)具有較強(qiáng)的健壯性。

在2006年美國(guó)馬薩諸塞州波士頓舉辦的第4屆個(gè)性化智能技術(shù)（ITWP2006）研討會(huì)上，［36 ］開(kāi)始出現(xiàn)了語(yǔ)義和本體技術(shù)在個(gè)性化協(xié)作過(guò)濾方面的研究。例如，Toivonen等人的本體角色在個(gè)性化內(nèi)容過(guò)濾應(yīng)用需求的研究，［37 ］Symeonidis等人的基于潛在語(yǔ)義標(biāo)引的可擴(kuò)展協(xié)作過(guò)濾研究。［38 ］

在2008年美國(guó)芝加哥舉辦的第6屆個(gè)性化智能技術(shù)和推薦系統(tǒng)（ITWP2008）研討會(huì)上，［25 ］個(gè)性化研究開(kāi)始采用社會(huì)標(biāo)簽的社會(huì)網(wǎng)絡(luò)等新技術(shù)。例如，Hung等人的基于標(biāo)簽用戶建模的社會(huì)媒體推薦系統(tǒng)，［39 ］Sandvig等人的分析社會(huì)標(biāo)簽系統(tǒng)攻擊的框架研究。［40 ］

移動(dòng)設(shè)備促進(jìn)了普適計(jì)算的發(fā)展，這使得不同的設(shè)備在任何時(shí)間、任何地點(diǎn)訪問(wèn)服務(wù)成為可能。［41 ］個(gè)性化服務(wù)的提供也應(yīng)該根據(jù)需要進(jìn)行定制，特別是應(yīng)該滿足移動(dòng)用戶在城市中步行或者開(kāi)車的特定需要。一些鼓吹者認(rèn)為，在未來(lái)，除了普通人群需要把普適計(jì)算集成到服務(wù)中，并且普適計(jì)算將會(huì)在學(xué)術(shù)和公司的實(shí)驗(yàn)室里發(fā)揮重要作用。這種新環(huán)境要求服務(wù)提供者考慮新的策略適應(yīng)新特點(diǎn)，例如用戶的位置、移動(dòng)速度、環(huán)境條件（光線、噪音），特別是不同特性的移動(dòng)設(shè)備訪問(wèn)個(gè)性化服務(wù)的需求也不一樣。［42 ］

在未來(lái)的普適計(jì)算環(huán)境中，一些影響服務(wù)質(zhì)量的必要數(shù)據(jù)可能由于以下兩個(gè)原因而無(wú)法獲得。一是數(shù)據(jù)不存在，二是數(shù)據(jù)雖然存在卻無(wú)法獲得。例如，用戶不想泄露私人信息，服務(wù)提供者也不想暴露其提供服務(wù)功能技巧的數(shù)據(jù)。因此，個(gè)性化服務(wù)存在著獲得涉及到個(gè)人隱私的數(shù)據(jù)的風(fēng)險(xiǎn)，尤其是在一些敏感行業(yè)，例如銀行金融、移動(dòng)服務(wù)等。Kasai等人進(jìn)行私有數(shù)據(jù)保護(hù)功能的分布式個(gè)性化服務(wù)研究，［43 ］在不侵犯用戶隱私的情況下，既能保護(hù)用戶的隱私信息，又能保證獲得的有效數(shù)據(jù)不失真。

6 結(jié)語(yǔ)

個(gè)性化是一種Web智能技術(shù)，在未來(lái)幾年的研究中其關(guān)鍵技術(shù)依然是是推薦系統(tǒng)。［44 ］個(gè)性化推薦是基于Web挖掘理論和技術(shù)而不斷發(fā)展。Web挖掘是數(shù)據(jù)挖掘應(yīng)用的一個(gè)分支，涉及到數(shù)據(jù)挖掘、人工智能、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的理論。并且，隨著Web技術(shù)和普適計(jì)算的發(fā)展，個(gè)性化推薦系統(tǒng)采用的挖掘技術(shù)越來(lái)越復(fù)雜，由單一技術(shù)向混合技術(shù)發(fā)展。例如，個(gè)性化推薦系統(tǒng)逐漸趨向于使用混合幾種挖掘算法；由離線或在線狀態(tài)學(xué)習(xí)趨向于二者的結(jié)合，這樣便于個(gè)性化推薦的可擴(kuò)展性。

用于個(gè)性化用戶建模的數(shù)據(jù)收集也不再是單純的顯式或隱式的方法，而是采用更加智能的方法，既保護(hù)用戶的隱私，又能夠保證收集到數(shù)據(jù)的有效性。同時(shí)，個(gè)性化推薦進(jìn)行數(shù)據(jù)挖掘需要的數(shù)據(jù)源越來(lái)越多樣化，綜合了日志數(shù)據(jù)、歷史交易記錄、用戶搜藏、用戶注冊(cè)信息、個(gè)人評(píng)價(jià)反饋信息等。當(dāng)前，關(guān)于Web日志格式的設(shè)計(jì)原則，還缺乏相關(guān)的理論研究。因此，我們可以考慮將來(lái)進(jìn)行Web日志格式設(shè)計(jì)的研究。

當(dāng)前關(guān)于個(gè)性化評(píng)價(jià)的研究存在的問(wèn)題比較多。因?yàn)閭€(gè)性化評(píng)價(jià)的因子選擇與推薦系統(tǒng)的精度相關(guān)，因此，如何選擇評(píng)價(jià)因子具有重要的影響作用。一般情況下，影響個(gè)性化推薦系統(tǒng)精度的因素有兩個(gè)：一是個(gè)性化用戶模型建模是否準(zhǔn)確的體現(xiàn)了其偏好，這個(gè)因素影響推薦系統(tǒng)精度的原因在于收集的用戶數(shù)據(jù)是否全面、準(zhǔn)確；另一個(gè)因素是推薦系統(tǒng)算法，一些算法的先進(jìn)性直接影響著推薦系統(tǒng)的精度。當(dāng)前，一些研究者為了提高個(gè)性化推薦系統(tǒng)的精度，把研究重點(diǎn)放在提高推薦系統(tǒng)的算法優(yōu)化方面。但是，有針對(duì)性的定制收集用戶數(shù)據(jù)進(jìn)行用戶模型建模，對(duì)于個(gè)性化推薦系統(tǒng)精度的提高有著根本性的促進(jìn)作用。因?yàn)?，這些用戶數(shù)據(jù)是根據(jù)用戶操作定制收集，能夠體現(xiàn)出其實(shí)際需求。所以，這些定制收集到的用戶數(shù)據(jù)能準(zhǔn)確的反映出用戶的偏好，并且，用戶模型建模收集到的數(shù)據(jù)越準(zhǔn)確，就越有利于推薦系統(tǒng)的精度提高。同時(shí)，經(jīng)過(guò)定制收集到的數(shù)據(jù)還能夠有助于減輕推薦系統(tǒng)計(jì)算冗余數(shù)據(jù)的負(fù)載，從而提高個(gè)性化系統(tǒng)整體性能。

簡(jiǎn)言之，一個(gè)好的個(gè)性化應(yīng)用是一個(gè)不斷完善的過(guò)程。首先，個(gè)性化系統(tǒng)根據(jù)搜集到的用戶建模信息，把經(jīng)過(guò)挖掘的推薦結(jié)果呈現(xiàn)給用戶；其次，用戶對(duì)推薦的內(nèi)容進(jìn)行評(píng)價(jià)，系統(tǒng)收集到這些反饋信息后，調(diào)整個(gè)性化策略，再次進(jìn)行用戶建模；最后，把以更滿足用戶需求的挖掘結(jié)果再次呈現(xiàn)給用戶。這個(gè)過(guò)程不斷重復(fù)，即保證了系統(tǒng)的性能提高，又吸引了用戶的使用。

參考文獻(xiàn)：

［1］Bamshad mobasher. Data Mining for Web Personalization［C］. The Adaptive Web, Lecture Notes in Computer Science, 2007:90-135.

［2］Resul Das, lbrahim Turkoglu.Creating meaningful data from web logs for improving the impressiveness of a website by using path analysis method［J］. Expert Systems with Applications, 2009, （36）:6635-6644.

［3］F. Zhang and H. Chang. “Research and development in web usage mining system- key issues and proposed solutions: a survey”［C］. In First IEEE Int. Conf. on Machine Learning and Cybernetics Proceedings, 2002:986-990.

［4］Jaideep Srivastava, Robert Cooley, Mukund Deshpande, and Pang-Ning Tan, Web usage mining: discovery and applications of usage patterns from web data［C］. SIGKDD Explore, 2000,1（12）:12-23.

［5］Z. Markov, and D. T. Larose.Data mining the Web : uncovering patterns in Web content, structure, and usage［M］. Hoboken, N.J.: Wiley-Interscience/John Wiley & Sons, 2007.

［6］Xueping Peng, Yujuan Cao, Zhendong Niu. Mining Web Access Log for the personalization Recommendation［C］. International Conference on MultiMedia and Information Technology, 2008：72-75.

［7］ITWP2003［C/OL］. ［2010-09-26］. http://maya.cs.depaul.edu/~mobasher/itwp03/.

［8］Miki Nakagawa and Bamshad Mobasher. Impact of Site Characteristics on Recommendation Models Based On Association Rules and Sequential Patterns［C/OL］. ［2010-09-26］.http://maya.cs.depaul.edu/~mobasher/itwp0

3/papers/itwp03-06.pdf.

［9］Forsati R., Meybodi M. R., Neiat A.G.. Web Page personalization Based on Weighted Association Rules［C］.International Conference on Electronic Computer Technology, 2009：130-135.

［10］Billsus.Pazzani.A personal news agent that talks, learns and explains［C］. Proc. 3rd Int. Conf. on Autonomous Agents （Agents 99）, Seattle, WA, 1999：268-275.

［11］Michael J. Pazzani and Daniel Billsus. The Adaptive Web:Content_Based Recommendation Systems［C］. Lecture Notes in Computer Science,2007：325-341.

［12］Bamshad Mobasher, Honghua Dai, Tao Luo, Miki Nakagawa. Improving the Effectiveness of Collaborative Filtering on Anonymous Web Usage Data. Proceedings of the IJCAI 2001 Workshop on Intelligent Techniques for Web Personalization （ITWP01）, 2001 ［C/OL］.［2010-09-26］. http://maya.cs.depaul.edu /~mobasher/itwp01/.

［13］Aghabozorgi, S.R., Teh Yang Wah. Dynamic Modeling by Usage Data for personalization Systems［C］. 13th International Conference Information Visualisation, 2009： 450-455.

［14］（加）Jiawei Han,（加）Micheline Kamber.范明，孟小峰譯. 數(shù)據(jù)挖掘概念與技術(shù)［M］.北京：機(jī)械工業(yè)出版社.2006.

［15］Burke.Hybrid Web recommender systems［C］. Brusilovsky, P., Kobsa, A., Nejdl, W., eds.: The Adaptive Web: Methods and Strategies of Web Personalization, Lecture Notes in Computer Science, 2007：377-408.

［16］Ardissono, L., Gena, C., Torasso, P., Bellifemine, F., Difino, A., Negro, B. User modeling and recommendation techniques for personalized Electronic Program Guides［C］. Personalized Digital Television. Targeting Programs to Individual Users. Kluwer Academic Publishers , 2004：3-26.

［17］Nima Taghipour, Ahmad Kardan.A hybrid web recommender system based on Q-learning［C］. Proceedings of the 2008 ACM symposium on Applied computing, 2008： 1164-1168.

［18］Wei Chen, Li-jun Zhang, Chun Chen, Jia-jun Bu. A Hybrid Phonic Web News Recommender System for Pervasive Access［C］. International Conference on Communications and Mobile Computing, 2009：122-126.

［19］Bamshad Mobasher, Honghua Dai, Tao Luo, Yuqing Sun, Jiang Zhu. Integrating Web Usage and Content Mining for More Effective Personalization［Ｃ］. Lecture Notes in Computer Science , Electronic Commerce and Web Technologies, 2000：165-176.

［20］ITWP2009［C/OL］. ［2010-09-27］. http://www.dcs.warwick.ac.uk/~ssanand/itwp09/.

［21］Talia Lavie , MichalSela, IlitOppenheim, OhadInbar, JoachimMeyer. User attitudes towards news content personalization［J］. International Journal of Human-Computer Studies, 2010：483-495.

［22］WWW Committee Web Usage Characterization Activity［EB/OL］. ［2010-09-27］. http://www.w3.org/.

［23］M. Baglioni1, U. Ferrara2, A. Romei1, S. Ruggieri1, and F. Turini1. Preprocessing and Mining Web Log Data for Web Personalization［C］. Advances in Artificial Intelligence,Lecture Notes in Computer Science Pages, 2003：237-249.

［24］Neal Lathia，Xavier Amatriain, Josep M. Pujol. Collaborative Filtering With Adaptive Information Sources［C］. The 7th Workshop on Intelligent Techniques for Web Personalization & Recommender Systems （ITWP2009）, 2009：63-74.

［25］ITWP2008［C/OL］.［2010-09-27］. http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

［26］Marco de Gemmis, Giovanni Semeraro, Pasquale Lops,Pierpaolo Basile. A Retrieval Model for Personalized Searching relying on Content-based User Profiles［C/OL］.［2010-09-27］. http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

［27］Chia-Chuan Hung, Yi-Ching Huang, Jane Yung-jen Hsu. Tagging-Based User Profiling for Social Media Recommendation［C/OL］.［2010-09-27］. http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

［28］Oznur Kirmemis, Aysenur Birturk. A Content-Based User Model Generation and Optimization Approach for Movie Recommendation［C/OL］.［2010-9-27］.http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

［29］Franc?ois Fouss, Marco Saerens. Evaluating performance of recommender systems: An experimental Comparison［C］. IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, 2008：735-738.

［30］Lorraine Mc Ginty, Barry Smyth. Evaluating Preference-Based Feedback in Recommender Systems［C］. Lecture Notes in Computer Science , Artificial Intelligence and Cognitive Science, 2002：209-214.

［31］Kwiseok Kwon, Jinhyung Cho, Yongtae Park. How to best characterize the personalization construct for e-services［J］. Expert Systems with Applications, 2010, 37（3）:2232-2240.

［32］ITWP2005［C/OL］. ［2010-09-27］. http://maya.cs.depaul.edu/~mobasher/itwp05/.

［33］Robin Burke, Bamshad Mobasher, Runa Bhaumik. Limited Knowledge Shilling Attacks in Collaborative Filtering Systems［C/OL］.［2010-09-27］. http://maya.cs.depaul.edu/~mobasher/itwp05/.

［34］J. J. Sandvig , Bamshad Mobasher , Robin Burke. Robustness of Collaborative Recommendation Based On Association Rule Mining［C］. Proceedings of the 2007 ACM conference on Recommender systems, 2007：105-111.

［35］Bamshad Mobasher, Robin Burke, Runa Bhaumik, Chad Williams. Toward Trustworthy Recommender Systems:An Analysis of Attack Models and Algorithm Robustness［Ｊ］. ACM Transactions on Internet Technology, 2007, 7（4）:231-269.

［36］ITWP2006［C/OL］. ［2010-09-27］. http://maya.cs.depaul.edu/~mobasher/itwp06/.

［37］S. Toivonen, O. Riva. The Necessary But Not Sufficient Role of Ontologies in Applications Requiring Personalized Content Filtering［C/OL］.［2010-09-27］. http://maya.cs.depaul.edu/~mobasher/itwp06/.

［38］P. Symeonidis, A. Nanopoulos, A. Papadopoulos, Y. Manolopoulos. Scalable Collaborative Filtering based on Latent Semantic Indexing［C/OL］.［2010-09-27］. http://maya.cs.depaul.edu/~mobasher/itwp06/.

［39］Chia-Chuan Hung, Yi-Ching Huang, Jane Yung-jen Hsu. Tagging-Based User Profiling for Social Media Recommendation［C/OL］.［2010-09-27］.http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

［40］J.J Sandvig, Runa Bhaumik, Maryam Ramezani, Robin Burke, Bamshad Mobasher. A Framework for the Analysis of Attacks Against Social Tagging Systems［C/OL］. ［2010-09-27］. http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

［41］Sadeh, N. Mobile commerce: new technologies, services and business models［M］. Wiley &Sons;, Ltd. 2002.

［42］Herder, E., van Dijk, B.: Personalized adaptation to device characteristics［C］.BerlinHeidelberg New York, Springer-Verlag, 2002,：598-602.

［43］Hiroyuki Kasai, Wataru Uchida, Shoji Kurakake. A service provisioning system for distributed personalizationwith private data protection［J］. The Journal of Systems and Software, 2007, 80：2025?褷2038.

［44］ITWP2010［C］. ［2010-09-27］. http://ls13-www.cs.uni-dortmund.de/homepage/ITWP2010/index.shtml.

作者簡(jiǎn)介：蘇玉召（1975-），男，中科院國(guó)家科學(xué)圖書(shū)館博士研究生，研究方向：計(jì)算機(jī)網(wǎng)絡(luò)、網(wǎng)絡(luò)信息管理技術(shù)與信息系統(tǒng)、數(shù)據(jù)挖掘；趙妍（1979-），女，鄭州航空工業(yè)管理學(xué)院助教。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

個(gè)性化關(guān)鍵技術(shù)研究綜述