王嶸冰,徐紅艷,馮 勇,安維凱
(遼寧大學(xué) 信息學(xué)院, 遼寧 沈陽 110036)
Web 2.0時代的到來,使各類應(yīng)用于社交的新媒體不斷涌現(xiàn)。目前應(yīng)用較為廣泛的社交新媒體如: 新浪微博、Facebook、Twitter等。使用者通過這些新媒體可以得到自己感興趣的資源與信息。國內(nèi)社交新媒體的領(lǐng)軍者新浪微博因用戶群逐漸壯大而導(dǎo)致微博內(nèi)容也隨之激增,“信息迷航”問題[1]日益嚴(yán)峻。個性化推薦技術(shù)被認(rèn)為是解決該問題的有效手段[2]。
本文在改進(jìn)原始HITS(hyperlink-induced topic search)算法時將微博用戶劃分為不同的類別,在計算微博主題相似度時融入中心度及權(quán)威度,以達(dá)到提升推薦結(jié)果準(zhǔn)確率的目的;對微博用戶間的社交網(wǎng)絡(luò)關(guān)系以及用戶發(fā)布的微博主題內(nèi)容進(jìn)行分析,進(jìn)而將興趣、愛好相近的用戶推薦給使用者。用戶可以有效地利用這些社交平臺提供的推薦功能來發(fā)現(xiàn)新朋友,進(jìn)而使用戶對社交平臺產(chǎn)生依賴性,提高忠誠度。龐大的用戶數(shù)量可以增強(qiáng)該社交平臺的社會影響力,繼而為平臺帶來可觀的經(jīng)濟(jì)效益。
微博擁有數(shù)量龐大的用戶群,只利用微博主題相似性去發(fā)現(xiàn)符合需求的用戶推薦是難以實現(xiàn)的。本文以提高用戶推薦準(zhǔn)確度為目的,提出了一種基于相似主題和HITS的微博用戶推薦算法。算法首先根據(jù)微博用戶的粉絲數(shù)量、原創(chuàng)微博數(shù)量、轉(zhuǎn)發(fā)微博數(shù)量來劃分用戶類別;然后,將改進(jìn)后的HITS算法應(yīng)用到微博用戶權(quán)威度以及中心度的計算中。在本文中將重要用戶劃分為專家用戶(Authority user)—Authority(權(quán)威度)值高、中樞用戶(Hub user)—Hub(中心度)值高;最后按類別計算用戶間的微博主題相似性,并進(jìn)行興趣相似微博用戶的推薦。
本文的內(nèi)容組織如下: 第1節(jié)是相關(guān)工作的介紹;第2節(jié)介紹基于相似主題的微博用戶推薦算法框架;第3節(jié)對改進(jìn)的推薦算法核心環(huán)節(jié)進(jìn)行詳細(xì)介紹;第4節(jié)介紹實驗環(huán)節(jié)的設(shè)計及實驗結(jié)果分析;第5節(jié)為本文的總結(jié)。
隨著學(xué)者們對微博重要用戶發(fā)現(xiàn)方法的深入展開,有研究者在推薦算法中運(yùn)用微博主題相似性的計算來提升推薦質(zhì)量[3]。代表性研究成果有: 仲兆滿等[4]選擇分別來自文化、企業(yè)管理、軍事、時尚、教育5個領(lǐng)域的微博數(shù)據(jù),利用這些數(shù)據(jù)來挖掘用戶興趣、計算用戶相似度,但算法沒有考慮到用戶興趣領(lǐng)域中的微博用戶可分為不同的類型: 有的以原創(chuàng)為主,有的以轉(zhuǎn)發(fā)為主,還有的以瀏覽為主。本文將上述三種類型用戶命名為: 專家用戶、中樞用戶及普通用戶。缺乏對用戶所屬類型的分析是導(dǎo)致推薦結(jié)果準(zhǔn)確性不高的原因之一。姚彬修等[5]先對微博用戶實施類型劃分,接著對微博用戶多源信息相似度進(jìn)行計算,在計算時引入時間權(quán)重值和豐富度權(quán)重值。但該算法缺乏對微博用戶之間社交網(wǎng)絡(luò)結(jié)構(gòu)的分析,因而該算法的推薦準(zhǔn)確率依舊有待提高。彭澤環(huán)等[6]在設(shè)計推薦算法時考慮如下四類信息: 個人信息、社交網(wǎng)絡(luò)結(jié)構(gòu)信息、交互信息以及微博主題內(nèi)容信息,但此推薦算法缺少對微博主題權(quán)重的進(jìn)一步區(qū)分,因而推薦結(jié)果質(zhì)量提升有限。
分析網(wǎng)頁重要度的HITS算法是由美國康奈爾大學(xué)的Jon Kleinberg教授提出。該算法通過分析網(wǎng)頁的鏈接關(guān)系來計算每個頁面的Hub屬性值和Authority屬性值,并根據(jù)值的大小將網(wǎng)頁分為Hub頁面和Authority頁面。
目前,HITS算法被廣泛地應(yīng)用在搜索引擎、自然語言處理、社交分析等領(lǐng)域。吳樹芳等[7]針對傳統(tǒng)的HITS算法,提出在計算微博用戶可信度時融入博文內(nèi)容以及用戶交互行為的改進(jìn)HITS算法。喻依等[8]通過HITS算法計算期刊的權(quán)威度和中心度來反映期刊的權(quán)威性和中心性,產(chǎn)生更權(quán)威性的期刊排序。苗家等[9]首先基于特征計算出評論的權(quán)重,然后結(jié)合圖模型使用HITS算法得到正文句子權(quán)重,進(jìn)而得到文摘句。上述算法都是使用HITS算法來計算鏈接圖中節(jié)點的權(quán)威度和中心度。由于原始HITS算法僅僅考慮用戶之間的鏈接關(guān)系,因而存在主題偏移、容易作弊等缺陷。
而本文所研究的微博用戶之間的關(guān)注模型與網(wǎng)頁的鏈入、鏈出模型很相似,因此建立鏈接圖時,圖中的節(jié)點為微博用戶,圖中的有向邊為微博用戶間的關(guān)注關(guān)系,通過改進(jìn)HITS算法來準(zhǔn)確計算微博用戶的權(quán)威度和中心度,有效地解決了原始HITS算法的不足,從而提高微博用戶推薦的準(zhǔn)確率。
隨著微博用戶數(shù)量的激增,將導(dǎo)致了多種用戶類型的出現(xiàn)。例如: 微博認(rèn)證用戶以及普通微博用戶。在社交平臺中,普通微博用戶通過瀏覽微博認(rèn)證用戶的微博來獲取自己感興趣的資源。而微博認(rèn)證用戶是瀏覽與自身興趣相似或相近的其他微博認(rèn)證用戶的微博來獲取資源。為使各類微博用戶均能有效獲取與自身興趣相似的用戶或信息,本文提出了一種基于相似主題的微博用戶推薦算法。改進(jìn)的算法包括如下四個環(huán)節(jié)[10]: ①用戶社群劃分—專家/中樞類、普通類;②用戶類別劃分—專家及中樞;③設(shè)定用戶推薦關(guān)系;④微博主題相似度計算及Top-N推薦。其中環(huán)節(jié)②和環(huán)節(jié)④是算法的核心。改進(jìn)算法框架描述如下:
(1)用戶社群劃分。根據(jù)用戶擁有的粉絲量、轉(zhuǎn)發(fā)微博量以及原創(chuàng)微博量劃分出兩大類用戶社群: 專家/中樞類、普通類。計算如式(1)所示。
(1)
其中,F(xiàn)為用戶粉絲數(shù)量,Y為原創(chuàng)數(shù)量,Z為轉(zhuǎn)發(fā)數(shù)量,α和β的取值根據(jù)實驗爬取的數(shù)據(jù)集確定。滿足式(1)的用戶不僅粉絲數(shù)量眾多,而且微博信息量龐大,本文將該類用戶歸類為專家/中樞類。其他用戶歸類為普通類。
(2) 用戶類別劃分。對于步驟(1)中的專家/中樞類用戶社群,本文將采用改進(jìn)的HITS算法將其進(jìn)一步劃分為專家用戶和中樞用戶,此環(huán)節(jié)內(nèi)容的實現(xiàn)過程詳見3.1節(jié)。
(3) 用戶推薦關(guān)系設(shè)定。步驟(1)和步驟(2)劃分出了不同類型的用戶,算法按照不同用戶的需求進(jìn)行推薦。各類型用戶間的推薦關(guān)系設(shè)定如圖1所示。在圖中所示的推薦關(guān)系中,僅將專家用戶推薦給中樞用戶和其他專家用戶,為普通用戶僅推薦中樞用戶。在推薦關(guān)系設(shè)定中,為普通用戶推薦中樞用戶的好處如下: ①普通用戶無須關(guān)注過多的中樞用戶即可獲取中樞用戶轉(zhuǎn)發(fā)的多個專家用戶的微博信息,從中發(fā)現(xiàn)與自身興趣相同的信息。②專家用戶興趣單一,而中樞用戶興趣具有多樣性,可將中樞用戶所關(guān)注的專家用戶的微博信息推薦給普通用戶,這些信息分屬不同興趣領(lǐng)域,進(jìn)而擴(kuò)展普通用戶的興趣領(lǐng)域。
圖1 用戶推薦關(guān)系設(shè)定
(4) 微博主題相似度計算及Top-N推薦。該環(huán)節(jié)完成三類微博主題向量的計算: 原創(chuàng)微博主題向量(專家類)、轉(zhuǎn)發(fā)微博主題向量(中樞類)以及所有微博主題向量(普通類)。對圖1所示的三類推薦關(guān)系(專家推薦專家、專家推薦中樞、中樞推薦普通用戶),本文使用余弦相似度來實現(xiàn)用戶微博相似度的計算,根據(jù)計算結(jié)果完成Top-N推薦,此環(huán)節(jié)內(nèi)容的具體實現(xiàn)詳見3.2節(jié)。
式(1)僅能將微博用戶劃分為兩大類用戶社群: 專家/中樞類、普通類。本文還需進(jìn)一步區(qū)分專家用戶和中樞用戶,這個區(qū)分過程的實現(xiàn)可以借鑒HITS算法。傳統(tǒng)HITS算法衡量檢索到網(wǎng)頁的重要度是通過如下兩個指標(biāo)來實現(xiàn): 網(wǎng)頁中心度(Hub)、權(quán)威度(Authority)[11]。據(jù)此,本文規(guī)定專家用戶為Authority值高的微博用戶,而中樞用戶則為Hub值高的用戶。受HITS算法中隱含假設(shè)的啟發(fā),我們同理認(rèn)為社交平臺中的專家用戶與中樞用戶之間的關(guān)注是相互的。本文將改進(jìn)傳統(tǒng)HITS算法,并使用改進(jìn)后的算法來計算微博用戶的Authority值和Hub值,以實現(xiàn)對專家用戶和中樞用戶的區(qū)分。
A(ui)為用戶ui的Authority值,H(ui)為用戶ui的Hub值。傳統(tǒng)的HITS算法在計算用戶Authority值時,僅累加該用戶粉絲用戶的Hub值,如式(2)所示;而計算用戶Hub值時,也僅累加該微博用戶所關(guān)注用戶的Authority值,如式(3)所示。綜上分析,傳統(tǒng)的HITS方法因無法體現(xiàn)微博用戶間的差異性而使計算所得的指標(biāo)值準(zhǔn)確率較低。
其中,d1,d2…,dj為用戶ui的粉絲用戶集合,t1,t2,…,tk為用戶ui關(guān)注的用戶集合。
每個微博用戶類型具有自身的特點: 專家用戶轉(zhuǎn)發(fā)微博數(shù)量要遠(yuǎn)遠(yuǎn)小于原創(chuàng)微博數(shù)量,而中樞用戶則恰恰相反。因而,在對HITS算法進(jìn)行改進(jìn)時將引入如下參數(shù): 用戶原創(chuàng)微博比例、用戶轉(zhuǎn)發(fā)微博比例。改進(jìn)算法中對Authority值和Hub值的計算如式(4)、式(5)所示。
(4)
其中,Zdj為粉絲用戶dj轉(zhuǎn)發(fā)微博用戶ui的微博數(shù)量,Ndj為用戶dj的原創(chuàng)及轉(zhuǎn)發(fā)微博數(shù)量和。
(5)
其中,Ytk為用戶ui轉(zhuǎn)發(fā)微博用戶tk的原創(chuàng)微博數(shù)量,Ntk表示用戶tk的原創(chuàng)及轉(zhuǎn)發(fā)微博數(shù)量總和。
在HITS算法中使用式(4)和式(5),通過多次迭代計算所得的用戶Hub值和Authority值更加精確,與傳統(tǒng)的HITS算法相比能將用戶之間的差異性體現(xiàn)得更為準(zhǔn)確。
本文在計算用戶微博主題相似度時,不同類別的用戶將采用不同的計算方法。
(1) 針對普通用戶: 整合該用戶的所有轉(zhuǎn)發(fā)和原創(chuàng)微博信息到一個文檔中,繼而運(yùn)用LDA[12]對該普通用戶的微博主題向量進(jìn)行計算[13]。
(2) 針對專家用戶: 計算其原創(chuàng)微博主題向量,如式(6)所示。
(6)
(3) 針對中樞用戶: 計算其轉(zhuǎn)發(fā)微博主題向量,如式(7)所示。
(7)
為了發(fā)現(xiàn)并推薦與使用者興趣相似的其他微博用戶,本文算法首先依據(jù)式(1)完成目標(biāo)用戶的社群劃分[14],若目標(biāo)用戶劃分到專家/中樞類用戶社群,則繼續(xù)使用式(4)、式(5)對Authority值和Hub值進(jìn)行計算,以確定該用戶是專家用戶還是中樞用戶;為了發(fā)現(xiàn)與目標(biāo)用戶興趣相近的其他微博用戶,微博主題相似度的計算使用余弦相似度[15]來實現(xiàn)。根據(jù)圖1設(shè)定的微博用戶推薦關(guān)系,為目標(biāo)用戶選擇合適的用戶類型進(jìn)行微博主題相似度的計算。
上述微博主題相似度計算如式(8)所示。
(8)
算法1 相似主題的微博用戶推薦算法
6: endif7:endfor//步驟2:改進(jìn)的HITS算法8:fork=1tondo9: uk.auth=1;//Authority初始值設(shè)置為110:uk.hub=1;//Hub初始值設(shè)置為111:endfor12:forj=1tondo13. uj.auth=Get_Auth(uj.hub,Y);//用戶uj的Author-ity14. uj.hub=Get_Hub(uj.auth,Z);//用戶uj的Hub15:endfor//步驟3:用戶類別劃分—專家用戶與中樞用戶16:fork=1tondo17: ifuk.auth>>uk.hub&&uk∈L118: Uzj.AddUser(uk);//uk添加為專家用戶Uzj19: elseifuk.auth< 在改進(jìn)的HITS算法中: 引入用戶微博轉(zhuǎn)發(fā)率和用戶微博原創(chuàng)率作為鏈接系數(shù),用戶之間的鏈接系數(shù)越大表明用戶之間有更多的相似興趣,因而有效解決主題偏移問題;此外,算法中還引入用戶之間的微博轉(zhuǎn)發(fā)率和原創(chuàng)率,即使作弊用戶關(guān)注大量專家用戶,但是作弊用戶與專家用戶之間的鏈接系數(shù)卻很低,有效降低作弊用戶的Hub值,使容易作弊問題得到有效的解決。 由于本文計算用戶Authority值只是將原始HITS算法計算權(quán)威度的每一個Hub值乘以用戶的微博轉(zhuǎn)發(fā)率,計算用戶Hub值也僅在原HITS算法計算中心度的每一個Authority值乘以用戶的原創(chuàng)率(微博轉(zhuǎn)發(fā)率、原創(chuàng)率均為介于0到1之間數(shù)值)。即若原始HITS算法計算所得的權(quán)威度記為A(i)、中心度記為H(i),本文算法計算所得的用戶權(quán)威度和中心度分別為A′(i)和H′(i),則有A′(i)≤A(i),H′(i)≤H(i),改進(jìn)算法的迭代規(guī)則與原始算法相同,因此,改進(jìn)后的HITS算法依舊保持收斂。在算法設(shè)計中最大迭代次數(shù)max_iterations=150,最小誤差閾值ε=0.001,在算法執(zhí)行過程中,在進(jìn)行105次迭代計算后收斂,得到穩(wěn)定的數(shù)值。 本文實驗所需的軟硬件環(huán)境配置: 操作系統(tǒng)為Windows7、CPU為i5-4460、主頻3.20GHz、硬盤空間50GB及以上、內(nèi)存2GB及以上,編程語言為Java。在Eclipse環(huán)境下搭建實驗平臺并完成實驗方案設(shè)計。Mahout為Apache的一個開源工具,提供大多數(shù)經(jīng)典推薦算法的代碼。在實驗過程中使用和改編的對比算法均為封裝在Apache Mahout框架中的協(xié)同過濾推薦算法。 本文通過新浪微博提供的API接口和爬蟲工具[17],從新浪微博中選取8個常見的主題領(lǐng)域: 體育領(lǐng)域、美食領(lǐng)域、科技領(lǐng)域、健康領(lǐng)域、汽車領(lǐng)域、情感生活領(lǐng)域、房產(chǎn)領(lǐng)域和娛樂領(lǐng)域,實驗中從這些領(lǐng)域中各隨機(jī)選取10名種子用戶進(jìn)行輻射以爬取實驗數(shù)據(jù),最終采集微博用戶信息15萬條、微博主題信息5 000萬條。按照式(1)將15萬名用戶劃分到不同的用戶社群: 專家/中樞類包含10 516名用戶,剩下的用戶均為普通類;進(jìn)而繼續(xù)使用用戶類別劃分算法將10 516名用戶劃分成4 275個專家用戶、6 241個中樞用戶。 實驗中根據(jù)爬取的數(shù)據(jù)集確定參數(shù)α和β的取值。α=sum(數(shù)據(jù)集中所有用戶的粉絲數(shù)量)/count(數(shù)據(jù)集中的用戶);β=sum(數(shù)據(jù)集中所有用戶的微博數(shù)量)/count(數(shù)據(jù)集中的用戶)。針對本文數(shù)據(jù)集的計算結(jié)果α=1000、β=300。 為了驗證本文參數(shù)α和β取值的合理性,在實驗過程中另外選取α為600、800、1200,β為100、200、400,再加上本文選取的α=1000,β=300。根據(jù)不同的α和β取值組合進(jìn)行實驗,對每一組實驗的F1值進(jìn)行計算,結(jié)果如表1所示。 表1 不同α和β值對應(yīng)的F1度量值 從表1的實驗結(jié)果可以看出,當(dāng)參數(shù)α=1 000、β=300時,F(xiàn)1度量值最大,實驗效果最好。 實驗選取的數(shù)據(jù)分布如表2所示。 表2 各領(lǐng)域?qū)嶒灁?shù)據(jù)分布 實驗中分別從不同類別的微博用戶中隨機(jī)選取1名用戶以驗證用戶分類的準(zhǔn)確性: ① 中樞用戶1772598673,微博主題領(lǐng)域為美食領(lǐng)域,原創(chuàng)微博數(shù)為615,轉(zhuǎn)發(fā)微博數(shù)為12 650,用戶Hub值為0.719 3; ② 專家用戶3606455372,微博主題領(lǐng)域為情感生活領(lǐng)域,原創(chuàng)微博數(shù)為12 675,轉(zhuǎn)發(fā)微博數(shù)為3 009,用戶Authority值為0.672 3; ③ 普通用戶1863606222,微博主題領(lǐng)域為科技領(lǐng)域,用戶原創(chuàng)微博數(shù)為488,用戶轉(zhuǎn)發(fā)微博數(shù)為576。 對于不同類型微博用戶的推薦結(jié)果如表3~表5所示。 表3~表5中的數(shù)據(jù)表明: 在三種類型用戶的Top-10推薦列表中,對于同一個用戶ID號,應(yīng)用本文算法所推薦的主題相似度值均要高于MISUR算法和TCF算法。 表3 專家用戶推薦結(jié)果列表 表4 中樞用戶推薦結(jié)果列表 表5 普通用戶推薦結(jié)果列表 續(xù)表 為了更好地驗證本文算法的優(yōu)勢,本文選取了傳統(tǒng)的微博用戶推薦算法與本文算法進(jìn)行對比: ①TCF[18]算法將協(xié)同過濾和標(biāo)簽進(jìn)行結(jié)合: 算法在計算資源特征相似性和用戶偏好度時融入資源標(biāo)簽,并應(yīng)用基于資源的協(xié)同過濾推薦算法來完成資源的TOP-N個性化推薦;MISUR[5]算法在進(jìn)行微博用戶推薦時,考慮用戶的社交信息、交互關(guān)系以及微博內(nèi)容等多源信息,在計算總相似度時融入了時間權(quán)重因子及豐富度權(quán)重因子,最后根據(jù)計算所得的相似度值向用戶進(jìn)行Top-N推薦;本文算法與TCF算法和MISUR算法在推薦好友個數(shù)不同情況下的準(zhǔn)確率、召回率和F1度量值[19]對比結(jié)果如圖2~圖4所示。 圖2 不同算法推薦準(zhǔn)確率對比 圖3 不同算法推薦召回率對比 圖4 不同算法推薦F1度量值對比 由圖2可以觀察到三種算法的推薦準(zhǔn)確率隨著推薦好友個數(shù)增加而不斷提升,當(dāng)推薦好友個數(shù)達(dá)到60時趨于平緩。在推薦好友為20時,本文算法的準(zhǔn)確率比TCF算法提高了19.4%,比MISUR算法提高了7.5%;在推薦好友為60時,本文算法的準(zhǔn)確率比TCF算法提高了28.6%,比MISUR算法提高了9.1%;在推薦好友為100時,本文算法的準(zhǔn)確率比TCF算法提高了25%,比MISUR算法提高了8.7%。 從圖3可以看出三種算法的召回率隨著推薦好友個數(shù)增加而下降,當(dāng)推薦好友個數(shù)小于60時下降較為平緩。當(dāng)推薦好友個數(shù)為20、60、100時,本文算法的召回率與TCF算法相比分別提升了14.3%、17.3%、40.5%,比MISURF算法分別提升了4.9%、7%、15.6%。分析表明,隨著推薦好友個數(shù)的增加,本文算法的召回率要優(yōu)于其他兩種對比算法。 圖4中的數(shù)據(jù)表明,當(dāng)推薦好友個數(shù)增加時,三種推薦算法的F1值都有所提升。當(dāng)推薦好友數(shù)量達(dá)到60時,各算法的F1度量值均達(dá)到峰值;當(dāng)推薦好友數(shù)量超過60后,各算法的F1度量值均在下降。產(chǎn)生這種情況的主要原因為: 當(dāng)推薦好友數(shù)量偏多時,排名靠后用戶的Authority值和Hub值都偏低,應(yīng)用本文算法時無法體現(xiàn)這些專家/中樞用戶的重要度,所以影響了微博主題相似性的計算,導(dǎo)致F1度量值下降。 根據(jù)圖4中三種算法F1值的對比可以看出: 在推薦結(jié)果準(zhǔn)確率上本文算法要優(yōu)于MISUR算法和TCF算法。原因如下: 數(shù)據(jù)稀疏性問題是傳統(tǒng)的TCF算法中存在的弊端,也是推薦準(zhǔn)確率低的重要原因;MISUR算法雖然通過用戶多源信息的融入來緩解數(shù)據(jù)稀疏問題對推薦結(jié)果的影響,但是缺乏對微博用戶的社交結(jié)構(gòu)信息進(jìn)行考量。本文算法首先運(yùn)用改進(jìn)的HITS算法分析微博用戶的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并根據(jù)分析的結(jié)果將用戶劃分為專家用戶、中樞用戶和普通用戶,進(jìn)行相似度計算時結(jié)合不同類型用戶的行為特點,即本文在進(jìn)行微博主題相似性計算時既考慮到微博用戶的社交網(wǎng)絡(luò)結(jié)構(gòu),又引入了Authority值和Hub值,從而使推薦準(zhǔn)確率得到有效提升。 本文算法旨在解決傳統(tǒng)個性化推薦算法普遍存在的推薦準(zhǔn)確率較低的不足。所提算法在使用改進(jìn)的HITS算法對微博用戶的社交網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行分析的基礎(chǔ)上,將微博用戶劃分為專家用戶、中樞用戶及普通用戶3個類型;在計算微博主題相似度時,既結(jié)合用戶的Authority值和Hub值,又結(jié)合用戶原創(chuàng)及轉(zhuǎn)發(fā)微博信息的數(shù)量。通過本文算法與TCF算法和MISUR算法進(jìn)行對比,結(jié)果表明本文算法由于考慮到微博用戶的網(wǎng)絡(luò)結(jié)構(gòu)信息,同時采用改進(jìn)的HITS算法準(zhǔn)確地計算微博用戶的Authority值和Hub值,在進(jìn)行微博主題相似度計算時,融入計算所得的Authority值和Hub值,從而較大程度地提升了推薦的準(zhǔn)確率。3.4 改進(jìn)算法收斂性分析
4 實驗實施與結(jié)果分析
4.1 實驗環(huán)境配置
4.2 實驗數(shù)據(jù)
4.3 實驗結(jié)果與分析
5 結(jié)束語