雷威 張玉繼 李文博
摘 要:通過分析用戶行為和Agent技術(shù),提出基于用戶行為的多Agent個性化信息推薦系統(tǒng)設(shè)計模型。對基于用戶行為數(shù)據(jù)進(jìn)行分析,整合用戶的行為特性可以為用戶帶來更好的使用體驗(yàn),多Agent技術(shù)能結(jié)合用戶興趣偏好信息及用戶訪問記錄實(shí)現(xiàn)信息過濾并推理出用戶的意圖,從而提供個性化的推薦服務(wù)。
關(guān)鍵詞:多 Agent技術(shù);推薦系統(tǒng);信息過濾;用戶行為
DOI:10.11907/rjdk.171443
中圖分類號:TP399 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2017)009-0167-03
Abstract:The individualized demand of the user has become a trend. By analyzing the user behavior and Agent technology, the paper puts forward the design model of the multi-agent personalized information recommendation system based on user behavior. Based on the user behavior data analysis, the integration of the users behavior can give users a better experience, multi-agent technology can be combined with user interest preferences and user access records to carry out information filtering to infer the users intention to provide Personalized referral service. Multi-Agent technology is the core of this system to realize personalized information recommendation.
Key Words:Multi-agent; recommended system; information filtering; user behavior
0 引言
信息爆炸時代,信息過載問題日益突出,需要通過某種方式來作出篩選以滿足人們的個性化信息需求,此時電子商務(wù)推薦系統(tǒng)應(yīng)運(yùn)而生,它能幫助用戶快速找到所需商品。目前的推薦系統(tǒng)種類繁多[1],各有優(yōu)勢但同時也存在各自的缺點(diǎn),在不同的平臺表現(xiàn)出來的性能差異較大。通過調(diào)查分析發(fā)現(xiàn),市場上的推薦系統(tǒng)普遍存在以下問題:系統(tǒng)移植比較困難、提供的推薦功能不夠靈活多樣、系統(tǒng)不容易維護(hù)、系統(tǒng)需要定制導(dǎo)致開發(fā)代價高等。
鑒于此,本文基于用戶行為的多Agent信息推薦系統(tǒng),結(jié)合用戶行為數(shù)據(jù)進(jìn)行分析,引入多Agent技術(shù)[2],利用Agent的智能性、自主性、代理性特征,能夠使得推薦系統(tǒng)從眾多信息里過濾出用戶真正所需的信息,使得推薦結(jié)果更符合用戶的請求,即使在不確定和動態(tài)的環(huán)境下,此系統(tǒng)也能夠表現(xiàn)出良好的性能,真正體現(xiàn)了智能適應(yīng)性的個性信息推薦,也即“信息找人”的服務(wù)模式,從而提高系統(tǒng)的整體運(yùn)營效率并創(chuàng)造更多的效益,有效減輕了信息過載問題。
1 信息推薦系統(tǒng)核心技術(shù)
1.1 用戶行為數(shù)據(jù)分析
用戶瀏覽系統(tǒng)往往具有很強(qiáng)的目的性,用戶行為數(shù)據(jù)分析[3]是指獲得訪問基本數(shù)據(jù)情況,對有關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計、分析,用戶很多瀏覽行為都能很好地反映用戶興趣愛好,從服務(wù)器日志挖掘出代表用戶興趣的模型,從中發(fā)現(xiàn)用戶訪問規(guī)律,并將這些規(guī)律與推薦算法等相結(jié)合,從而提高個性推薦系統(tǒng)的精確度。
用戶行為分析包含以下重點(diǎn)數(shù)據(jù)分析:①用戶的來源地區(qū)、來路域名和頁面;②用戶在網(wǎng)站的停留時間、回訪次數(shù)、間隔訪問次數(shù);③用戶所使用的搜索引擎、關(guān)鍵詞、站內(nèi)關(guān)鍵詞;④注冊用戶和非注冊用戶兩者之間的瀏覽習(xí)慣。
通過對用戶行為監(jiān)測獲得的數(shù)據(jù)進(jìn)行分析可以更加詳細(xì)、清楚地了解用戶個性化需求。
用戶通過瀏覽相關(guān)物品信息,以及有相似興趣的其他用戶或者好友和用戶本身注冊信息具有的標(biāo)簽等,通過對這些數(shù)據(jù)的分析向用戶推薦個性化的物品信息。用戶行為分析模型如圖1所示。
1.2 多Agent技術(shù)
Agent技術(shù)是一種處于一定環(huán)境下包裝的計算機(jī)系統(tǒng),能在該環(huán)境下靈活、自主地活動。Agent具有這樣的特性:自治性、社會性、反映性、能動性,還具備一些人類才具有的特性,如知識、信念、義務(wù)、意圖等。它擁有一定程度的擬人性,也即幫助或者代替人來完成某些任務(wù),因此本文使用Agent來構(gòu)建個性化推薦系統(tǒng)。
多Agent技術(shù)是多個Agent組成的集合,Agent成員之間相互協(xié)調(diào)、相互服務(wù),將大而復(fù)雜的系統(tǒng)建設(shè)成小的、能夠彼此相互通信和協(xié)調(diào)的智能化易于管理的系統(tǒng)。各Agent成員之間的活動是自治獨(dú)立的,其自身的目標(biāo)和行為不受其它Agent成員的限制,它們通過競爭和磋商等手段協(xié)商和解決相互之間的矛盾和沖突。多Agent技術(shù)研究的主要目的是通過多個Agent所組成的交互式團(tuán)體求解超出Agent個體能力的大規(guī)模復(fù)雜問題。
多Agent技術(shù)用于解決實(shí)際問題的優(yōu)勢主要體現(xiàn)在:①支持分布式應(yīng)用,具有良好的模塊性、易于擴(kuò)展性和設(shè)計靈活簡單,克服了建設(shè)一個龐大系統(tǒng)所造成的管理和擴(kuò)展的困難,有效降低了系統(tǒng)的總成本;②各Agent通過相互協(xié)調(diào)去解決大規(guī)模的復(fù)雜問題,多Agent采用信息集成技術(shù),將每個Agent的信息集成在一起,完成復(fù)雜的功能;③Agent是異質(zhì)的、分布的。它們可以是不同的個人或組織,采用不同的設(shè)計方法和計算機(jī)語言開發(fā)而成,因此可以是完全異質(zhì)和分布的;④多Agent技術(shù)打破了人工智能領(lǐng)域僅使用一個專家系統(tǒng)的限制,各領(lǐng)域的不同專家可協(xié)作求解某一個專家無法解決的問題,提高系統(tǒng)解決問題的能力;⑤處理是異步的,由于各Agent是自治的,每個Agent都有自己的進(jìn)程,按照自己的運(yùn)行方式異步地進(jìn)行。endprint
1.3 基于用戶的協(xié)同過濾推薦算法
基于用戶推薦的算法是以用戶為主題的算法,一般在海量用戶中發(fā)掘出一小部分品位比較相似的用戶,在協(xié)同過濾中這些用戶成為鄰居,然后根據(jù)他們喜歡的其它東西組成一個排序的目錄推薦給這些用戶。要實(shí)現(xiàn)協(xié)同過濾[4],需要實(shí)現(xiàn)幾個步驟:①收集用戶偏好;②找到相似的用戶或物品;③計算推薦給用戶。舉例說明,基于用戶的協(xié)同過濾算法基于這樣一個事實(shí):如果A與B在電影方面的喜好相同,那么用戶B把他喜歡的電影推薦給用戶A是合理的,以此為基礎(chǔ),基于用戶的協(xié)同過濾算法出現(xiàn)了,可據(jù)此求出用戶的相似度。式(1)給出了相似度計算方法,R代表相似度的值,如果想計算每兩個用戶的相似度,所需要的時間復(fù)雜度為O(n*n*d)。n為用戶數(shù)目,d為商品數(shù)目。R=N(u)∩N(v)N(u)*N(v)
(1) 通過式(1)能得到一個相似度矩陣。然而在很多應(yīng)用中該相似度矩陣是很稀疏的,也即很多用戶相互之間沒有相同的商品生產(chǎn)行為。如果直接先將相似度不為0的用戶對數(shù)求出來,然后只計算這些不為0的用戶對,這樣復(fù)雜度較高。用數(shù)組C[u][v]記錄用戶u和v有相同商品行為的數(shù)目,首先建立一個倒排表,每個物品都保存在產(chǎn)生過行為的用戶信息中,然后對于每個物品的所有用戶對數(shù)(u,v),C[u][v]加1,這樣結(jié)束后就可只利用相似度不為0的用戶對數(shù)。
得到相似度矩陣后利用式(2)預(yù)測用戶u對物品i的感興趣程度。其中S(u,k)表示與用戶u最接近的k個用戶,N(i)表示對物品i有過行為的用戶集合,Wuv表示用戶u和v的相似度,rvi表示用戶v對物品i的感興趣程度。p(u,i)=∑v∈S(u,k)∩N(i)wuvrvi
(2) 從式(2)可以看出,如果p(u,i)的值越大,說明u對物品i越感興趣,這時可以設(shè)定一個給定的閾值,如果小于該閾值就不推薦,否則推薦給相應(yīng)的用戶。
2 推薦系統(tǒng)整體架構(gòu)與運(yùn)行機(jī)制
2.1 推薦系統(tǒng)功能
傳統(tǒng)的信息服務(wù)系統(tǒng)大多需要用戶根據(jù)自己的需要主動搜索信息,但是人們處于一種信息過載的環(huán)境中,已經(jīng)很難及時和準(zhǔn)確獲取用戶想要的信息數(shù)據(jù)。此時改變傳統(tǒng)的被動服務(wù)方式,“信息找人”的模式也即主動向客戶推薦用戶想要的個性化信息資源非常有必要。本文提出的基于用戶行為的多Agent信息推薦系統(tǒng),根據(jù)用戶行為,由多個Agent替用戶獲得所需信息,此系統(tǒng)可以主動幫助用戶獲得用戶所需的個性化信息需求。此推薦系統(tǒng)可以給用戶提供多種類型和層次多樣化的信息服務(wù),建立一個更個性化、更高效的信息推薦平臺。
2.2 系統(tǒng)架構(gòu)
實(shí)現(xiàn)個性化信息推薦的核心是解決用戶行為監(jiān)測、信息反饋、數(shù)據(jù)挖掘[5]、過濾推薦等問題。本文提出了一個信息推薦系統(tǒng)構(gòu)架,將系統(tǒng)劃分層次結(jié)構(gòu),分別由不同的Agent來完成,各Agent相互協(xié)調(diào)工作實(shí)現(xiàn)系統(tǒng)功能,具體如圖2所示。
2.3 系統(tǒng)運(yùn)行機(jī)制
當(dāng)用戶在使用系統(tǒng)時,系統(tǒng)里的各Agent開始協(xié)調(diào)工作,源數(shù)據(jù)庫監(jiān)控Agent監(jiān)測源數(shù)據(jù)庫里的數(shù)據(jù)并發(fā)送給推薦引擎Agent,用戶行為Agent接收監(jiān)測Agent里的數(shù)據(jù)并對這些數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)挖掘Agent根據(jù)監(jiān)測Agent監(jiān)測數(shù)據(jù)進(jìn)行挖掘,用戶興趣模型管理Agent則對數(shù)據(jù)挖掘Agent和用戶行為Agent發(fā)送過來的數(shù)據(jù)進(jìn)行用戶興趣建模和管理,推薦引擎Agent根據(jù)源數(shù)據(jù)庫監(jiān)控Agent和用戶興趣模型管理Agent發(fā)送過來的數(shù)據(jù),產(chǎn)生推薦結(jié)果發(fā)送給用戶界面Agent,然后再由用戶界面Agent發(fā)送給用戶。
基于以上系統(tǒng)框架,推送系統(tǒng)根據(jù)用戶興趣從眾多相關(guān)信息中篩選和過濾出用戶真正需要的信息推薦給用戶。
3 結(jié)語
信息爆炸時代下,如何在互聯(lián)網(wǎng)世界里查找到用戶想要的信息,避免不必要的時間浪費(fèi)值得重視?;谟脩粜袨榈腁gent技術(shù)的出現(xiàn)讓智能信息推薦在互聯(lián)網(wǎng)世界里引領(lǐng)潮流,隨著多Agent技術(shù)的繼續(xù)發(fā)展,其必然給社會創(chuàng)造更多的效益。推薦構(gòu)架還有一些問題需要攻克,比如,一個新的信息推薦系統(tǒng)如何使用該推薦服務(wù)解決冷啟動的問題。相信隨著后續(xù)研究的深入,這些問題將逐一解決。
參考文獻(xiàn):
[1] 夏洪文,蒿景蘭.基于web3.0的個性化信息服務(wù)及其系統(tǒng)設(shè)計[J].現(xiàn)代教育技術(shù),2012(11):121-123.
[2] 林琳,劉峰.基于改進(jìn)合同網(wǎng)協(xié)議的多Agent協(xié)作模型[J].計算機(jī)研究與發(fā)展,2010,20(3):70-75.
[3] 李建延,郭曄,湯志軍.基于用戶瀏覽行為分析的用戶興趣度計算[J].計算機(jī)工程與設(shè)計,2012(3):968-972.
[4] 王元濤.Netflix數(shù)據(jù)集上的協(xié)同過濾算法[D].北京:清華大學(xué),2009:156-158.
[5] 朱建峰.可視化數(shù)據(jù)挖掘[M].北京:電子工業(yè)出版社,2008:302-304.
(責(zé)任編輯:孫 娟)endprint