徐郡明,朱福喜,劉世超,朱碧穎
武漢大學(xué) 計(jì)算機(jī)學(xué)院,武漢 430072
在復(fù)雜網(wǎng)絡(luò)社區(qū)中,各用戶因其環(huán)境、性格不同,所起到的作用也有所不同。其中,部分用戶會(huì)積極的接受并傳播某些信息和觀點(diǎn),并且對(duì)其他用戶有著重要的影響力,這些用戶即為“意見領(lǐng)袖”?!耙庖婎I(lǐng)袖”傳播的信息會(huì)影響網(wǎng)絡(luò)中另一部分用戶,引導(dǎo)這部分用戶的行為。因此,若使用某些信息影響“意見領(lǐng)袖”,就可能高效地影響到網(wǎng)絡(luò)中的大多數(shù)用戶。所以,進(jìn)行“意見領(lǐng)袖”的挖掘,對(duì)于利用已成型、穩(wěn)定的社區(qū)網(wǎng)絡(luò)進(jìn)行信息推廣、輿情監(jiān)測(cè)等具有重要的理論及現(xiàn)實(shí)意義。
LeaderRank算法是一個(gè)有效的意見領(lǐng)袖挖掘算法,本文在該算法的基礎(chǔ)上,結(jié)合用戶之間的情感傾向信息和用戶活躍度因素,以提高意見領(lǐng)袖挖掘的準(zhǔn)確度。
新興媒體(如微博、微信等)逐漸滲透到人們的日常生活中,在用戶之間形成了一個(gè)“用戶-用戶”的復(fù)雜網(wǎng)絡(luò)。越來越多的研究人員開始關(guān)注信息如何在這個(gè)復(fù)雜網(wǎng)絡(luò)中進(jìn)行傳播[1]以及如何控制傳播速度[2-4],從而找到合適的方式促進(jìn)正確的社會(huì)價(jià)值信息的傳播,抑制謠言的流行,提高廣告投放的精確度。
Aral等[5]的研究證明意見領(lǐng)袖在復(fù)雜網(wǎng)絡(luò)的信息傳播中起著關(guān)鍵性作用。Bai等[6-7]認(rèn)為可以將復(fù)雜網(wǎng)絡(luò)中度最大的節(jié)點(diǎn)看作“意見領(lǐng)袖”,通過影響這些節(jié)點(diǎn)來控制信息在網(wǎng)絡(luò)中傳播,這一方法被應(yīng)用于多種復(fù)雜網(wǎng)絡(luò)的意見領(lǐng)袖挖掘[8-10]。
Kitsak等[11]人指出,網(wǎng)絡(luò)中節(jié)點(diǎn)的傳播能力與節(jié)點(diǎn)所處的位置有重要關(guān)系,處于網(wǎng)絡(luò)核心位置的節(jié)點(diǎn),即使度較小,也會(huì)有較高的影響力;反之亦然。與此同時(shí),意見領(lǐng)袖挖掘方面的其他研究人員也陸續(xù)提出了大量其他指標(biāo),例如接近中心性[12]、特征向量中心性[13]、路由中心性[14]和環(huán)中心性[15]。這些指標(biāo)主要是用來衡量一個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中的傳播能力。
Song等[16]借鑒PageRank算法對(duì)用戶進(jìn)行排名,并結(jié)合用戶之間情感傾向分析、評(píng)論隱含關(guān)系分析、評(píng)論的時(shí)間衰減等因素挖掘復(fù)雜網(wǎng)絡(luò)中的意見領(lǐng)袖。但使用PageRank算法不適合在結(jié)構(gòu)快速變化的復(fù)雜網(wǎng)絡(luò)中挖掘意見領(lǐng)袖。
鑒于PageRank算法在意見領(lǐng)袖挖掘方面表現(xiàn)出來的種種問題,Lv等人[17]提出了一種意見領(lǐng)袖挖掘的新算法——LeaderRank算法。在意見領(lǐng)袖挖掘方面,Leader-Rank算法比PageRank算法的準(zhǔn)確性更高,面對(duì)噪音和惡意攻擊時(shí)的穩(wěn)定性更強(qiáng)。
Li等[18]針對(duì)LeaderRank算法進(jìn)行改進(jìn),提出加權(quán)的LeaderRank算法,并通過實(shí)驗(yàn)驗(yàn)證了加權(quán)的LeaderRank算法具有更好的準(zhǔn)確性和穩(wěn)定性。
因此,國(guó)內(nèi)外學(xué)者在意見領(lǐng)袖挖掘研究工作中非常注重LeaderRank算法。但LeaderRank算法及其加權(quán)改進(jìn)算法也存在一些可改進(jìn)之處,例如:算法沒有考慮網(wǎng)絡(luò)中“用戶之間的情感傾向”、“用戶活躍程度”等因素對(duì)意見領(lǐng)袖挖掘的影響,這會(huì)制約算法性能的進(jìn)一步提升。本文旨在這些方面做出改進(jìn)。
PageRank算法將對(duì)頁面的鏈接看成投票,實(shí)現(xiàn)將互聯(lián)網(wǎng)中“鏈接價(jià)值”概念作為排名因素。PageRank算法將計(jì)算得到的網(wǎng)頁在不同時(shí)刻的得分作為衡量網(wǎng)頁重要性的標(biāo)準(zhǔn)。PageRank算法的核心公式如式(1)所示:
其中,N表示頁面總數(shù);Pi(t)表示在t時(shí)刻,i頁面的得分;αji表示當(dāng)頁面j中是否存在指向頁面i的超鏈接,存在時(shí),αji=1,否則,αji=0;表示j頁面中指向其他頁面的超鏈接的個(gè)數(shù);當(dāng)=0時(shí),=1 ,當(dāng)≠0時(shí),=0;c是“跳轉(zhuǎn)概率”,當(dāng)一個(gè)用戶訪問一個(gè)頁面時(shí),以概率c通過地址欄,隨機(jī)跳到其他網(wǎng)頁,以概率1-c通過網(wǎng)頁中的超鏈接跳轉(zhuǎn)到其他網(wǎng)頁。
在網(wǎng)絡(luò)結(jié)構(gòu)快速變化的社會(huì)網(wǎng)絡(luò)中,PageRank算法的“跳轉(zhuǎn)概率”c的最佳值,需要隨著網(wǎng)絡(luò)結(jié)構(gòu)的變化而不斷調(diào)整。針對(duì)某一特定結(jié)構(gòu)的網(wǎng)絡(luò),要經(jīng)過多次訓(xùn)練才能得到參數(shù)c的最佳取值,這對(duì)于結(jié)構(gòu)變化頻繁的網(wǎng)絡(luò)并不適用。除此之外,社交網(wǎng)絡(luò)是一個(gè)非連通圖,而PageRank算法并不保證在非連通圖上具有收斂性。上述兩原因?qū)е翽ageRank算法在意見領(lǐng)袖挖掘方面有很大限制。
Lv等[17]提出的LeaderRank算法,對(duì)PageRank算法的改進(jìn)主要是在網(wǎng)絡(luò)中添加一個(gè)公共節(jié)點(diǎn)“Ground Node”,并讓此節(jié)點(diǎn)連接網(wǎng)絡(luò)中的全部節(jié)點(diǎn),這樣一個(gè)N節(jié)點(diǎn)M邊的網(wǎng)絡(luò)G(N,M)就變成N+1節(jié)點(diǎn)M+2N邊的網(wǎng)絡(luò)G(N+1,M+2N)。
添加“Ground Node”的作用如下:
(1)由于“Ground Node”連接了網(wǎng)絡(luò)中其余各節(jié)點(diǎn),從而形成一個(gè)連通圖,這就保證了LeaderRank算法的收斂性。不僅如此,“Ground Node”的加入還減小了整個(gè)網(wǎng)絡(luò)的半徑,增加收斂速度。
(2)某i節(jié)點(diǎn)的信息來源(即由i節(jié)點(diǎn)發(fā)出的指向其他節(jié)點(diǎn)的邊)的多少反比于節(jié)點(diǎn)i流向“Ground Node”節(jié)點(diǎn)的個(gè)數(shù)。隨著網(wǎng)絡(luò)結(jié)構(gòu)的變化,不同的節(jié)點(diǎn)會(huì)有不同的“跳轉(zhuǎn)概率”。LeaderRank算法不再需要參數(shù)“跳轉(zhuǎn)概率”c。
Lü等[17]還通過實(shí)驗(yàn)證明了LeaderRank算法具有更高的準(zhǔn)確性和更強(qiáng)的穩(wěn)定性。LeaderRank算法的核心公式如式(2)、(3)所示:
其中,si(t)表示i節(jié)點(diǎn)在t時(shí)刻的得分;tc表示si(t)收斂的時(shí)刻;sg(tc)表示在tc時(shí)刻“Ground Node”節(jié)點(diǎn)的得分;Si表示i節(jié)點(diǎn)最終的得分,其他變量含義同式(1)。
在現(xiàn)實(shí)網(wǎng)絡(luò)中,用戶之間存在明顯的觀點(diǎn)差異或是有相當(dāng)數(shù)量的惡意注冊(cè)用戶,都會(huì)導(dǎo)致意見領(lǐng)袖排名出現(xiàn)偏差,而LeaderRank算法會(huì)受到這兩方面因素的影響。因此,改進(jìn)的LeaderRank算法增加了用戶的情感傾向和惡意注冊(cè)用戶兩個(gè)方面考察。
3.3.1 用戶的情感傾向
用戶可以接受其他信息源的某個(gè)觀點(diǎn)并加以傳播,也可以反對(duì)其他信息源的觀點(diǎn)并阻礙其傳播。這取決于用戶的情感傾向。例如在微博中,粉絲中有所謂的“紅粉”(支持博主觀點(diǎn))和“黑粉”(反對(duì)博主觀點(diǎn))之分,如圖1所示,第一、三條是支持博主的評(píng)論,而第二條反對(duì)博主的評(píng)論。而之前的LeaderRank算法都沒有考慮到用戶之間的情感傾向。
圖1 某微博評(píng)論圖
在微博中,存在一些特殊符號(hào),例如@、#等,在圖1中的第三條微博回復(fù)中,此用戶(用戶A)就使用了@符號(hào),指向其他用戶(用戶B、用戶C)。雖然用戶A不是直接被用戶B、C的微博內(nèi)容影響,但用戶B、C的其他行為顯然也影響到了用戶A(比如,這里的影視劇作品)。將這種關(guān)系定義為成“隱式關(guān)聯(lián)”,LeaderRank算法也都沒有考慮數(shù)據(jù)集中存在的“隱式關(guān)聯(lián)”。為保留“隱式關(guān)聯(lián)”對(duì)意見領(lǐng)袖排名的影響,會(huì)在實(shí)驗(yàn)前的數(shù)據(jù)整理過程中,將其顯式表示出來(即顯式的添加邊A→B和邊A→C,并在計(jì)算A與B、C的情感傾向時(shí),將此評(píng)論計(jì)算進(jìn)去)。
3.3.2 惡意注冊(cè)用戶
除了考慮用戶間的情感傾向外,需注意到網(wǎng)絡(luò)中存在的一定數(shù)量的惡意注冊(cè)用戶,例如微博中出現(xiàn)的“僵尸粉”?!敖┦邸蓖ǔS傻谌较到y(tǒng)自動(dòng)產(chǎn)生。如圖2所示,第二、三、四條評(píng)論即是惡意注冊(cè)用戶對(duì)某微博進(jìn)行惡意評(píng)論的情況。
圖2 某微博惡意評(píng)論圖
這種惡意注冊(cè)用戶在現(xiàn)實(shí)網(wǎng)絡(luò)中,并不對(duì)信息進(jìn)行傳播或阻礙,因此在挖掘意見領(lǐng)袖時(shí),將這種惡意注冊(cè)用戶也計(jì)算進(jìn)去是不恰當(dāng)?shù)?。雖然在LeaderRank算法以及加權(quán)LeaderRank算法中,通過添加“Ground Node”可以讓惡意注冊(cè)用戶的更多分?jǐn)?shù)流入“Ground Node”,但是惡意注冊(cè)用戶始終還是存在分?jǐn)?shù)流入其他信息源的情況,當(dāng)這種惡意注冊(cè)用戶足夠多時(shí),會(huì)影響到意見領(lǐng)袖的排名,從而影響意見領(lǐng)袖挖掘的準(zhǔn)確性。
針對(duì)上述LeaderRank算法存在的缺陷,本文做出了如下改進(jìn)。
3.4.1 添加用戶情感傾向
從圖1中可以得到,微博內(nèi)容主要是由文本、表情符合以及“贊”標(biāo)志個(gè)數(shù)構(gòu)成,微博內(nèi)容的情感傾向也主要由這三部分的情感傾向組成。為簡(jiǎn)單起見,本文使用“贊”標(biāo)志個(gè)數(shù)表示微博的情感傾向,其計(jì)算公式如式(4)所示:
其中,μij表示節(jié)點(diǎn)i對(duì)節(jié)點(diǎn)j發(fā)布的某條回復(fù)(或微博)的感情傾向得分;δ表示此回復(fù)的“贊”的個(gè)數(shù);lgδ是此條回復(fù)的“贊”標(biāo)志的得分。
在確定網(wǎng)絡(luò)中任意兩個(gè)用戶α和β之間的情感傾向時(shí),并不是取決于α和β之間的某次回帖的情感傾向,而是由特定時(shí)間段內(nèi),α和β之間全部回帖的情感傾向的平均值決定的。ρij表示節(jié)點(diǎn)i與節(jié)點(diǎn)j之間的“平均情感傾向”,其計(jì)算公式如式(5)所示:
其中,μij表示在t時(shí)刻節(jié)點(diǎn)i對(duì)節(jié)點(diǎn)j回復(fù)的情感傾向得分,共計(jì)n個(gè)時(shí)刻。
3.4.2 減弱惡意注冊(cè)用戶的影響
通過對(duì)微博等社交網(wǎng)絡(luò)的觀察,發(fā)現(xiàn)惡意注冊(cè)用戶與非活躍用戶之間存在很大交集,因此本文使用時(shí)間衰減的方式來限制惡意注冊(cè)用戶對(duì)意見領(lǐng)袖挖掘的影響。衰減比例公式如式(6)所示:
其中,tl表示用戶i最后一次有效操作的時(shí)間(例如,發(fā)帖、發(fā)表評(píng)論、轉(zhuǎn)帖等操作);D是衰減指數(shù);E是阻尼系數(shù);θi(tc)表示的是節(jié)點(diǎn)i在tc時(shí)刻的衰減比例。
3.4.3 算法的改進(jìn)
本文將用戶之間的情感傾向、時(shí)間衰減因素與加權(quán)LeaderRank算法結(jié)合,改進(jìn)的LeaderRank算法核心公式如式(7)所示:
其中,ωij為一條邊的權(quán)重值,取值規(guī)則為:若j為“Ground Node”,ωig=1,ωgi=;若不存在i指向j的邊,ωij=0;其余情況ωij=1。ρji為式(4)中得到的節(jié)點(diǎn)i與節(jié)點(diǎn)j之間的情感傾向值。θj(t)為式(5)式中得到的節(jié)點(diǎn)j在t時(shí)刻的衰減比例;其他變量含義同公式(1)、(2)。
實(shí)驗(yàn)?zāi)P停簩?shí)驗(yàn)采用Susceptible-Infected-Removed(SIR)模型[19],該模型由Kermack與McKendrick在1927年提出,直到現(xiàn)在SIR模型仍被廣泛使用。在SIR模型中,用N(t)表示t時(shí)刻的總?cè)藬?shù),總?cè)丝诜譃橐韵氯悾阂赘姓撸⊿usceptibles),記為S(t),表示t時(shí)刻未染病但有可能被該類疾病傳染的人數(shù);染病者(Infectives),記為I(t),表示t時(shí)刻已被感染成為病人而且具有傳染力的人數(shù);移出者(Removal),記為R(t),表示t時(shí)刻已從染病者中移出的人數(shù)。在實(shí)驗(yàn)過程中發(fā)現(xiàn),將SIR模型中的康復(fù)免疫概率γ設(shè)置成1,感染概率β設(shè)置成0.02時(shí),效果較好。
數(shù)據(jù)準(zhǔn)備:實(shí)驗(yàn)使用的數(shù)據(jù)集為新浪微博在2013年8月到12月份中對(duì)某一熱門話題的討論數(shù)據(jù)。由于新浪微博API存在接口訪問頻次等限制,所以實(shí)驗(yàn)并沒有使用新浪API獲取實(shí)驗(yàn)數(shù)據(jù),而是使用課題組實(shí)現(xiàn)的頁面爬蟲工具進(jìn)行抓取,再將得到的原始數(shù)據(jù)進(jìn)行整理,除去新浪微博活動(dòng)、廣告等非用戶發(fā)布的信息,并且將上文提到的“隱式關(guān)聯(lián)”顯式表示出來。數(shù)據(jù)整理后,共計(jì)67 031個(gè)節(jié)點(diǎn),130 122條邊。
參數(shù)分析:在上述公式(6)中,參數(shù)D的取值對(duì)減弱惡意用戶的影響有重要作用。若D取值過大,則減弱惡意用戶影響力的效果不明顯;若D取值過小,則會(huì)影響正常用戶中,短時(shí)間未活動(dòng)用戶的影響力。
下面通過實(shí)驗(yàn)確定參數(shù)D較合適的取值。考察對(duì)于D的不同取值,改進(jìn)LeaderRank得到前5名的意見領(lǐng)袖的所影響的用戶個(gè)數(shù)的平均值。從圖3中可以得到,當(dāng)D取值在區(qū)間[0.8,0.9]之間較合適。
圖3 參數(shù)D取值測(cè)試圖
以PageRank算法和LeaderRank算法為對(duì)照組,實(shí)驗(yàn)驗(yàn)證改進(jìn)LeaderRank算法的準(zhǔn)確性。在上述數(shù)據(jù)集中,分別應(yīng)用上述3種算法找到的排名前20的意見領(lǐng)袖,實(shí)驗(yàn)結(jié)果數(shù)據(jù)如表1所示。
表1 排名前20的意見領(lǐng)袖對(duì)比表
表1第一行第二列表示應(yīng)用LeaderRank算法得到的排名第一的意見領(lǐng)袖為“id=13423”號(hào)用戶,其他列以此類推。由實(shí)驗(yàn)結(jié)果整理可得,LeaderRank算法得到的前20名中的{1207,517,31241}號(hào)意見領(lǐng)袖無法由其他兩種算法得到。同理,PageRank算法得到的{37,517,143}和改進(jìn)LeaderRank算法得到的{1207,544,31241}無法由其他兩種算法得到。針對(duì)表1中的數(shù)據(jù),專門查看了造成此差異的具體原因,以“id=517”號(hào)用戶為例,在LeaderRank算法的結(jié)果中排名為第5,在改進(jìn)Leader-Rank算法的結(jié)果中排名為第151。這里發(fā)現(xiàn)其微博的粉絲和評(píng)論很多,但是相當(dāng)一部分都是反對(duì)其觀點(diǎn)的評(píng)論,并且其微博“贊”個(gè)數(shù)幾乎沒有,如圖4所示。
圖4 反對(duì)評(píng)論示例圖
接著,給這些只由單一算法得到的意見領(lǐng)袖施加影響,觀察一段時(shí)間內(nèi),受這些意見領(lǐng)袖影響的其他用戶的人數(shù),由此判定這些意見領(lǐng)袖的影響力,作為衡量“意見領(lǐng)袖挖掘”算法準(zhǔn)確性的度量標(biāo)準(zhǔn)。實(shí)驗(yàn)得到的前20位意見領(lǐng)袖,即Top-20曲線如圖5(a)所示。出于實(shí)驗(yàn)的嚴(yán)謹(jǐn)考慮,同時(shí)實(shí)驗(yàn)Top-50曲線和Top-100曲線,分別如圖5(b)和5(c)所示。橫坐標(biāo)表示迭代時(shí)間t,縱坐標(biāo)表示被影響的節(jié)點(diǎn)個(gè)數(shù)N,PageRank算法的c取0.15;以30次實(shí)驗(yàn)平均值度量實(shí)驗(yàn)結(jié)果。
由圖5可以看出,改進(jìn)的LeaderRank算法挖掘出的意見領(lǐng)袖的影響力略高于LeaderRank算法,但收斂速度比LeaderRank算法慢一些,故而適用于對(duì)精度要求更高而對(duì)時(shí)間消耗要求相對(duì)較寬松的場(chǎng)合。
圖5 3種算法Top-N實(shí)驗(yàn)對(duì)比圖
下面設(shè)計(jì)實(shí)驗(yàn),比較3種算法的抗干擾能力。在網(wǎng)絡(luò)中添加一定數(shù)量的惡意注冊(cè)用戶,并將這些惡意注冊(cè)用戶隨機(jī)與圖中節(jié)點(diǎn)相連,并隨機(jī)對(duì)相連節(jié)點(diǎn)的微博進(jìn)行回復(fù)操作和“點(diǎn)贊”操作。比較添加惡意用戶之后各節(jié)點(diǎn)排名與添加惡意用戶之前各節(jié)點(diǎn)排名,變化較小的即被認(rèn)為是抗干擾能力強(qiáng)的??垢蓴_能力公式,如公式(8)所示:
其中,S′i表示添加惡意注冊(cè)用戶前,i節(jié)點(diǎn)的得分;S′i表示添加惡意注冊(cè)用戶后,j節(jié)點(diǎn)的得分。
實(shí)驗(yàn)對(duì)排名前100的意見領(lǐng)袖施加干擾,3種算法下的抗干擾能力結(jié)果如圖6所示,越接近對(duì)角線則認(rèn)為其抗干擾能力越強(qiáng)。實(shí)驗(yàn)結(jié)果證明,改進(jìn)的LeaderRank算法的抗干擾性優(yōu)于LeaderRank算法和PageRank算法。
圖6 3種算法穩(wěn)定性對(duì)比圖
“意見領(lǐng)袖挖掘”在社會(huì)網(wǎng)絡(luò)研究領(lǐng)域是一個(gè)重要的研究課題。本文的主要貢獻(xiàn)在于:通過將網(wǎng)絡(luò)中用戶之間的情感傾向、用戶活躍程度與LeaderRank算法相結(jié)合,對(duì)LeaderRank算法進(jìn)行改進(jìn),提高了LeaderRank算法的準(zhǔn)確性和抗干擾能力。但是,改進(jìn)后的LeaderRank依然存在不足,例如微博內(nèi)容的情感傾向沒有考慮文本以及表情符號(hào)的情感,這將是下一階段的研究重點(diǎn)。
[1]Zhou T,F(xiàn)u Z Q,Wang B H.Epidemic dynamics on complex networks[J].Progress in Natural Science,2006,16(5):452-457.
[2]Lv L,Chen D B,Zhou T.The small world yields the most effective information spreading[J].New Journal of Physics,2011,13(12).
[3]Doerr B,F(xiàn)ouz M,F(xiàn)riedrich T.Why rumors spread so quickly in socialnetworks[J].Communications ofthe ACM,2012,55(6):70-75.
[4]Schl?pfer M,Buzna L.Decelerated spreading in degreecorrelated networks[J].Physical Review E,2012,85(1).
[5]Aral S,Walker D.Identifying influential and susceptible members of social networks[J].Science,2012,337:337-341.
[6]Bai W J,Zhou T,Wang B H.Immunization of susceptibleinfected model on scale-free networks[J].Statistical Mechanics and its Applications:Physica A,2007,384(2):656-662.
[7]Hébert-Dufresne L,Allard A,Young J G,et al.Global efficiency of local immunization on complex networks[R].Scientific Reports,2013.
[8]Zhou Y B,Lv L,Li M.Quantifying the influence of scientists and theirpublications:distinguishing between prestige and popularity[J].New Journal of Physics,2012,14(3).
[9]Park J,Newman M E J.A network-based ranking system for US college football[J].Journal of Statistical Mechanics:Theory and Experiment,2005(10):10014.
[10]Huang X,Vodenska I,Wang F,et al.Identifying influential directors in the United States corporate governance network[J].Physical Review E,2011,84(4).
[11]Kitsak M,Gallos L K,Havlin S,et al.Identification of influential spreaders in complex networks[J].Nature Physics,2010,6(11):888-893.
[12]Katz L.A new status index derived from sociometric analysis[J].Psychometrika,1953,18(1):39-43.
[13]Dolev S,Elovici Y,Puzis R.Routing betweenness centrality[J].Journal of the ACM,2010,57(4).
[14]Estrada E,Rodriguez-Velazquez J A.Subgraph centrality in complex networks[J].Physical Review E,2005,71(5).
[15]Kim H J,Kim J M.Cyclic topology in complex networks[J].Physical Review E,2005,72:1-4.
[16]Song K,Wang D,F(xiàn)eng S,et al.Detecting opinion leader dynamicallyinChinesenewscomments[M]//Web-Age Information Management.Berlin Heidelberg:Springer,2012:197-209.
[17]Lv L,Zhang Y C,Yeung C H,et al.Leaders in social networks,the delicious case[J].PloS One,2011,6(6).
[18]Li Q,Zhou T,Lv L,et al.Identifying influential spreaders by weighted LeaderRank[J].Physica A,2014,404:47-75.
[19]Anderson R M,May R M,Anderson B.Infectious diseases of humans:dynamics and control[M].Oxford:Oxford University Press,1992.