田伯凱 岳躍振
摘 要:電子信息技術(shù)的發(fā)展與互聯(lián)網(wǎng)的普及,促進了信息的快速傳播。虛擬網(wǎng)絡(luò)輿論相對于傳統(tǒng)媒介而言,更廣泛地提高輿論社交普遍性、快速性、監(jiān)督性的最大值。然而,在網(wǎng)絡(luò)輿論日益凸顯其監(jiān)督的正面性的同時,一些異化現(xiàn)象假借正面性來行使其負面效能。鑒于在線社交網(wǎng)絡(luò)具備許多的復(fù)雜網(wǎng)絡(luò)特性,而用戶的線下社交網(wǎng)絡(luò)與虛擬世界社交網(wǎng)絡(luò)表現(xiàn)出高度相關(guān)性。線上行為的可記錄、易計算等特性使得對虛假網(wǎng)絡(luò)輿論的傳播預(yù)測成為可能。文章在總結(jié)復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)的特征指標和傳統(tǒng)傳染病傳播模型的基礎(chǔ)上,綜述了近年來用戶的在線社交網(wǎng)絡(luò)和信息傳播規(guī)律的相關(guān)研究,指出了社交網(wǎng)絡(luò)研究面臨的挑戰(zhàn),然后分析了謠言抑制算法在當(dāng)前社交網(wǎng)絡(luò)中的可能應(yīng)用模式,最后展望了該領(lǐng)域需要解決的關(guān)鍵問題以及可能的應(yīng)用前景。
關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò);網(wǎng)絡(luò)結(jié)構(gòu);社交網(wǎng)絡(luò);信息傳播;傳染病模型
DOI:10.16640/j.cnki.37-1222/t.2017.23.225
1 引言
近年來,旨在架起信息技術(shù)與社會科學(xué)之間的橋梁的社會計算研究領(lǐng)域開始得到廣泛的關(guān)注,特別是社交網(wǎng)絡(luò)(如Facebook,Twitter,新浪微博和微信等)的盛行,給人們的社會交往方式帶來了新的變革,社交網(wǎng)絡(luò)擁有改變?nèi)祟愡M行交流、通信和合作方式的巨大潛力,甚至能夠影響到我們對自身和社會的認識。一方面,社交網(wǎng)絡(luò)逐漸滲透到人們生活的方方面面,人們借助社交網(wǎng)絡(luò)平臺聯(lián)絡(luò)朋友,發(fā)表觀點,討論公共話題等,社交網(wǎng)絡(luò)成為了現(xiàn)實社會的延伸。另一方面,隨著社交網(wǎng)絡(luò)的不斷完善以及對人們生活滲透作用的增大,當(dāng)量變引起質(zhì)變的時候,社交網(wǎng)絡(luò)也可以看作是對現(xiàn)實社會關(guān)系網(wǎng)絡(luò)的重建。這種重建的社交模式既平行于現(xiàn)實社會,又與現(xiàn)實社會緊密相連,由于在社交網(wǎng)絡(luò)中個體的行為和狀態(tài)更容易被記錄、獲取和分析,有利于發(fā)現(xiàn)網(wǎng)絡(luò)中各用戶之間的作用機制及信息傳播機理,因此對社交網(wǎng)絡(luò)的結(jié)構(gòu)特性的分析研究成為了社會計算領(lǐng)域的重要研究內(nèi)容。
但隨著越來越多的人喜歡在社交平臺上交流互動,同時也熱衷于從社交平臺中獲取信息并進行轉(zhuǎn)發(fā)評論。而這些信息中,一些未經(jīng)求證的謠言泛濫成災(zāi),因此而造成的惡意事件也逐漸增多,影響和干擾著人們正常的生活秩序。謠言在社交網(wǎng)絡(luò)中的肆意傳播,嚴重影響到社會穩(wěn)定、經(jīng)濟發(fā)展,有效地控制社交網(wǎng)絡(luò)中信息的傳播具有重要意義。
把復(fù)雜網(wǎng)絡(luò)理論與謠言控制的迫切需要相結(jié)合,關(guān)鍵的技術(shù)是根據(jù)社交網(wǎng)絡(luò)的數(shù)據(jù)對用戶群體的關(guān)鍵節(jié)點既輿論領(lǐng)袖進行分析和預(yù)測,同時把節(jié)點信息廣泛應(yīng)用到社會計算的其他領(lǐng)域,這對于網(wǎng)絡(luò)謠言的控制有著巨大的價值。
本文第2節(jié)介紹識別社交網(wǎng)絡(luò)中輿論領(lǐng)袖的標準與方法,并論述社交網(wǎng)絡(luò)分析的理論基礎(chǔ);第3節(jié)分析謠言傳播模型,以及綜合分析其與傳統(tǒng)傳染病模型的異同;第4節(jié)從數(shù)據(jù)獲取,社交網(wǎng)絡(luò)建模和傳播模型幾方面綜述近幾年對社交網(wǎng)絡(luò)謠言抑制所做的研究;第5節(jié)對謠言抑制算法在社交網(wǎng)絡(luò)中的可能應(yīng)用進行了討論;第6節(jié)對整篇綜述內(nèi)容進行了總結(jié),并對未來的研究和應(yīng)用進行了展望。
2 輿論領(lǐng)袖節(jié)點的識別
獲取合適的數(shù)據(jù)并建立相應(yīng)的復(fù)雜網(wǎng)絡(luò)模型,是實現(xiàn)社交網(wǎng)絡(luò)輿論領(lǐng)袖節(jié)點識別的首要前提。本節(jié)重點介紹實證數(shù)據(jù)的獲取與分析,復(fù)雜網(wǎng)絡(luò)的建模標準,以及通過親密度判斷輿論領(lǐng)袖節(jié)點的方法。
2.1 數(shù)據(jù)的獲取與處理
截止2016年6月,新浪微博的月活躍用戶量為2.82億,其數(shù)據(jù)適合用于研究社交網(wǎng)絡(luò)。在數(shù)據(jù)獲取的過程中,采取“滾雪球”的方法[1],將同一行業(yè)或相關(guān)行業(yè)的的人群建立用戶組。根據(jù)每個節(jié)點“關(guān)注”與“被關(guān)注”的情況,建立二值矩陣P,矩陣“行”代表關(guān)注者,“列”代表被關(guān)注者。Pij=1表示i用戶關(guān)注了j用戶,反之則為未關(guān)注。根據(jù)節(jié)點間互相關(guān)注的情況,文獻[1]將現(xiàn)有有向網(wǎng)絡(luò)分解為入度網(wǎng)絡(luò),出度網(wǎng)絡(luò)和無向網(wǎng)絡(luò)。
2.2 數(shù)據(jù)分析
分析一個節(jié)點的重要性不能只考慮其參與網(wǎng)絡(luò)的總水平而不考慮與其相連的的鄰居節(jié)點所具有的重要性對其影響的數(shù)量?;诖丝紤],引入了度中心性,緊密度中心性,K-Shell,介數(shù)中心性,特征向量中心性5個參數(shù)。這5 種指標通常均應(yīng)用于衡量節(jié)點在網(wǎng)絡(luò)中的重要程度。但這幾種參數(shù)各有長處和不足
介數(shù)中心性與度中心性以及緊密度中心性相比能夠更準確地識別出關(guān)鍵節(jié)點,并且適用于更廣泛的網(wǎng)絡(luò)應(yīng)用場景。K-shell方法需要對網(wǎng)絡(luò)中的所有節(jié)點進行一遍一遍的脫殼處理,過程慢且識別出的節(jié)點是粗粒度的,相比介數(shù)中心性準確度較低。介數(shù)中心性在識別鄰接矩陣不對稱的網(wǎng)絡(luò)模型時,較特征向量中心性更具有優(yōu)勢。由于在社交網(wǎng)絡(luò)中用戶之間的關(guān)系具有有向性,所以基于介數(shù)中心性識別輿論領(lǐng)袖節(jié)點更為合理。
2.3 基于節(jié)點親密度的謠言抑制方法
在社交網(wǎng)絡(luò)中信息傳播的過程中,用戶節(jié)點通常會受到朋友節(jié)點的影響。Bakshy[2]以及Onnela [3]通過實驗證實了這種說法,并得出信息通過用戶節(jié)點間的鏈路進行傳播的結(jié)論,即熟人傳播,因此社交網(wǎng)絡(luò)展現(xiàn)了“口碑效應(yīng)”的影響。具體分析時在社交網(wǎng)絡(luò)中引入了親密度的概念,并衡量不相鄰節(jié)點之間的影響力大小,利用在介數(shù)中心性算法的基礎(chǔ)上實現(xiàn)輿論領(lǐng)袖節(jié)點的識別,并通過對網(wǎng)絡(luò)中與鄰居節(jié)點均具有較高的親密度的節(jié)點進行謠言的控制,都會達到較好的效果。
分析節(jié)點間的親密度可以從3個方面入手:(1)交互頻率;(2)交互類型;(3)節(jié)點間跳數(shù)。
在結(jié)合節(jié)點之間的交互頻率、好友類型和跳數(shù)時延三方面綜合量化之后,得到最終的節(jié)點之間親密度評估方法。因為在計算網(wǎng)絡(luò)拓撲中最短路徑時,鏈路上的權(quán)值越小表示路徑越短,所以將節(jié)點間的親密度量化結(jié)果也表示為值越小則親密度越高。根據(jù)介數(shù)中心性的大小識別輿論領(lǐng)袖節(jié)點,增加了對網(wǎng)絡(luò)圖加邊和更新權(quán)值的過程,這個過程的時間復(fù)雜度是隨著節(jié)點的增多線性增加的,對每個節(jié)點及其鄰居節(jié)點進行一遍計算。所以整個基于親密度的輿論領(lǐng)袖節(jié)點識別算法的時間復(fù)雜度是在Brande算法的基礎(chǔ)上加上更新過程的時間復(fù)雜度。endprint
3 謠言傳播模型
3.1 SIR 模型
在經(jīng)典的SIR 傳染病模型中,將節(jié)點狀態(tài)分為易感染狀態(tài)(susceptible)、感染狀態(tài)和治愈狀態(tài)(recovered)。社交網(wǎng)絡(luò)中除傳染源之外的節(jié)點初始狀態(tài)均為易感染狀態(tài)。當(dāng)處于易感染狀態(tài)的節(jié)點接觸到感染節(jié)點后以一定的概率變?yōu)楦腥緺顟B(tài)。當(dāng)處于感染狀態(tài)的節(jié)點在接觸到易感染狀態(tài)的節(jié)點時,又會以一定的概率將其感染。但當(dāng)處于感染狀態(tài)的節(jié)點以一定的概率被治愈后,將處于治愈狀態(tài),并具有免疫能力,不會再被感染。主要的節(jié)點狀態(tài)轉(zhuǎn)化過程如圖2 所示。
該傳播模型在傳染病傳播過程中得到廣泛應(yīng)用。適用于當(dāng)個體感染到病毒后都有成為病原體的機會,并且成為病原體的個體康復(fù)后則具有永久免疫能力的情況。
3.2 傳染病模型改進
通過向社交網(wǎng)絡(luò)中的輿論領(lǐng)袖節(jié)點注入真相從而控制社交網(wǎng)絡(luò)中謠言的傳播。因此在這一部分將社交網(wǎng)絡(luò)中節(jié)點傳播的狀態(tài)進一步細化,其中包含了當(dāng)節(jié)點接收到真相后的各種狀態(tài):
(1)易感染狀態(tài);(2)感染狀態(tài);(3) 治愈狀態(tài);(4)免疫狀態(tài)(defended)。
通過上述對抑制謠言過程中節(jié)點狀態(tài)的分類,總結(jié)社交網(wǎng)絡(luò)中節(jié)點狀態(tài)變化過程,如圖3所示。上述過程在SIR 模型的基礎(chǔ)上增加了免疫狀態(tài),更形象地描述了社交網(wǎng)絡(luò)中的節(jié)點直接相信真相的過程。
3.3 分析結(jié)論
基于上述的傳染病改進模型,結(jié)合親密度的概念可知社交網(wǎng)絡(luò)中處于免疫狀態(tài)的節(jié)點與其鄰居節(jié)點之間的親密度越大,則處于免疫狀態(tài)的節(jié)點傳播的真相信息更容易被其鄰居節(jié)點接受,從而使真相能夠在整個網(wǎng)絡(luò)中迅速傳播,進而達到快速控制謠言的目的。
4 社交網(wǎng)絡(luò)中的謠言抑制
早期研究人員對社交網(wǎng)絡(luò)的研究局限于單一節(jié)點參與網(wǎng)絡(luò)的總水平,而忽視了其相鄰節(jié)點的重要性對其影響的數(shù)量。同時因為缺乏體現(xiàn)社交網(wǎng)絡(luò)中節(jié)點影響力的量化標準,使得對社交網(wǎng)絡(luò)的認識存在局限性。
鑒于復(fù)雜網(wǎng)絡(luò)理論中已有的度中心性,緊密度中心性,K-Shell,介數(shù)中心性,特征向量中心性等參數(shù)可以反映復(fù)雜網(wǎng)絡(luò)中節(jié)點的重要性,那么利用這一理論對社交網(wǎng)絡(luò)中的輿論領(lǐng)袖進行預(yù)測也應(yīng)該具有可行性。
已有的研究表明,目前的大部分網(wǎng)絡(luò)謠言的傳播規(guī)律與傳統(tǒng)傳染病模型有一定的相似度。通過仲天鍵等人的研究,現(xiàn)在我們掌握了一種與社交網(wǎng)絡(luò)謠言傳播規(guī)律對應(yīng)的傳染病改進模型。根據(jù)此模型結(jié)合親密度的概念,可以得到控制社交網(wǎng)絡(luò)中謠言傳播的一般規(guī)則,既處于免疫狀態(tài)的節(jié)點傳播的真相信息更容易被其鄰居節(jié)點接受,從而使真相能夠在整個網(wǎng)絡(luò)中迅速傳播,進而達到快速控制謠言的目的。
5 謠言抑制在社交網(wǎng)絡(luò)中的應(yīng)用模式
一方面,現(xiàn)有的人類社群大致可分為線下組織,線上組織,線下組織在線上的延伸和線上組織在線下的延伸四類。而謠言抑制是基于對社交網(wǎng)絡(luò)中的輿論領(lǐng)袖節(jié)點的識別實現(xiàn)的。在未來應(yīng)用中,可以嘗試通過以上社群在線上的交流實現(xiàn)對社群中輿論領(lǐng)袖的識別,因而這一技術(shù)可以使有關(guān)部門在反恐、維護國家安全等方面取得新的優(yōu)勢。
另一方面,因為謠言的抑制是通過對社交網(wǎng)絡(luò)中輿論領(lǐng)袖節(jié)點注入真相實現(xiàn)。但輿論領(lǐng)袖的作用并不限于在謠言傳播時宣揚真相。通過對輿論領(lǐng)袖節(jié)點的識別可以對一個社交網(wǎng)絡(luò)中的信息流通有所把握,而與輿論領(lǐng)袖節(jié)點合作則可以引導(dǎo)社交網(wǎng)絡(luò)中的信息流通。因此這項技術(shù)在當(dāng)今的商業(yè)推廣中也可以發(fā)揮相當(dāng)大的作用。
6 展望
社交網(wǎng)絡(luò)謠言抑制可以使得大范圍控制言論傳播成為了可能,而社交網(wǎng)絡(luò)人格預(yù)測使得人格信息對大規(guī)模應(yīng)用和學(xué)術(shù)研究成為了可能。當(dāng)前社交網(wǎng)絡(luò)的大部分研究都涉及到對用戶行為及屬性的分析和預(yù)測.例如,對商品的個性化推薦是預(yù)測用戶潛在的購買行為、對廣告的個性化推薦是預(yù)測用戶的點擊行為、影響力建模是評價用戶的影響力屬性、社區(qū)發(fā)現(xiàn)是按照某種屬性對用戶個體進行聚類等。
社交網(wǎng)絡(luò)的人格預(yù)測與謠言抑制均屬于社會計算領(lǐng)域。因此我認為在未來發(fā)展中,謠言抑制算法應(yīng)該實現(xiàn)與用戶人格預(yù)測技術(shù)的結(jié)合。單一的謠言抑制使管理者永遠處于被動的狀態(tài),而二者相結(jié)合將能夠通過用戶人格預(yù)測實現(xiàn)謠言易感人群和謠言產(chǎn)生人群的定位,必將大大提高謠言控制的效率。另一方面,對用戶言論類型的記錄可以進一步擴充人格預(yù)測的數(shù)據(jù)基礎(chǔ)。二者的結(jié)合應(yīng)用將比單純的謠言抑制更有發(fā)展前景。
參考文獻:
[1]雷宏振,賈悅婷.基于復(fù)雜網(wǎng)絡(luò)的在線社交網(wǎng)絡(luò)特征與傳播動力學(xué)分析[J].統(tǒng)計與決策,2015(02):114-117.
[2]曹坤宇.基于親密度及影響力的微博社交興趣圈挖掘算法研究[D].天津大學(xué),2013.
[3]仲天鍵,蘭國興.一種基于改進SIR的網(wǎng)絡(luò)謠言傳播模型研究[J]. 信息與電腦,2015(24).
作者簡介:田伯凱(1995-),河北人,本科在讀,研究方向:經(jīng)濟管理。endprint