鄭 蕾, 李生紅
(上海交通大學 電子信息與電氣工程學院,上海 200240)
微博,是一種基于用戶關系的信息分享,傳播以及獲取的平臺,用戶通過 WEB,WAP以及各種客戶端組件便能隨時隨地地實現(xiàn)信息的更新和即時分享。與BBS和博客不同的是,微博用戶可以不受時間空間的限制,持續(xù)不斷地對某條信息作出評論和轉(zhuǎn)發(fā),使得該信息可能在極短時間內(nèi)以“核裂變”的方式被成百上千的用戶轉(zhuǎn)發(fā),從而演化成引起輿論關注的社會新聞事件,例如,直播玉樹大地震,“我爸是李剛”,唐俊“學歷門”事件等。在微博網(wǎng)絡上,信息的傳播速度,廣度和效率都得到了極大提高,但這無疑也為一些帶有敏感字眼的失實消息(如“無償獻血被紅十字以一袋 200元賣給醫(yī)院”)在微博上的傳播創(chuàng)造了更有利的條件。因此,研究信息(輿論)在微博網(wǎng)絡上的傳播及其傳播的性質(zhì) 、規(guī)律等,進而研究如何控制 、引導輿論,具有非常重要的理論價值和現(xiàn)實意義。
現(xiàn)有的文獻大多從單一的角度來研究人際網(wǎng)絡上的信息傳播,如,信息傳播所在網(wǎng)絡的拓撲結(jié)構(gòu)[1-3],個體相互作用規(guī)則[4-7]。但實際中信息(輿論)的傳播與形成是一個典型的復雜系統(tǒng)的演化過程,需要將個體的相互作用和網(wǎng)絡結(jié)構(gòu)進行綜合考慮才能更準確地描述信息在網(wǎng)絡中的傳播。文中在基于信息在微博網(wǎng)絡上的傳播規(guī)則,并結(jié)合微博網(wǎng)絡拓撲結(jié)構(gòu)對傳播行為的影響,初步建立了微博網(wǎng)絡中信息傳播的隨機演化仿真模型。
在微博網(wǎng)絡中,入度越大,說明關注的用戶越多,信息來源越豐富,而出度越大,說明關注自己的人越多,影響力越大。早在20世紀40年代,拉扎斯菲爾德等人在《人民的選擇》中提出了“意見領袖”的概念,所謂意見領袖,維基百科是這樣描述的,在人際傳播網(wǎng)中經(jīng)常為他人提供信息,同時對他人施加影響的“活躍分子”,他們在大眾傳播效果的形成過程中起著重要的中介或過濾的作用。通常而言,大部分微博用戶的粉絲一般是幾十至幾百的數(shù)量級,而少數(shù)用戶的粉絲超過上千乃至上萬,稱其為明星用戶(意見領袖)。文中基于提出的信息傳播模型,探討了明星用戶和小級別用戶在微博網(wǎng)絡信息擴散中扮演的角色,通過仿真實驗,得到了一些有趣的發(fā)現(xiàn)。
微博的每個用戶通常都擁有一定數(shù)量的“粉絲”(跟隨者),其發(fā)布的信息會以廣播的形式通知每個“粉絲”,從而受到關注甚至轉(zhuǎn)發(fā)。以新浪微博為例,它具有4大功能模塊:發(fā)布功能,轉(zhuǎn)發(fā)功能,關注功能及評論功能。發(fā)布功能,用戶可以隨時隨地發(fā)布消息;轉(zhuǎn)發(fā)功能,用戶可以把自己喜歡的消息一鍵轉(zhuǎn)發(fā)到自己的微博,在轉(zhuǎn)發(fā)過程中原帖內(nèi)容不會被篡改,且轉(zhuǎn)發(fā)記錄會以“//@用戶名”的方式保留轉(zhuǎn)發(fā)路徑;關注功能,用戶u可以對自己喜歡的用戶v進行關注,成為用戶v的“粉絲”,這一行為不需要得到受關注用戶的同意,之后用戶 v更新的所有消息便會同步出現(xiàn)在用戶u的微博首頁上;評論功能,用戶可以對任何一條微博進行評論。由此,消息I在微博網(wǎng)絡上的傳播過程可以簡述如下:
1)用戶u發(fā)布消息I,消息的形式可能是一句話,一張照片等。
2)u的粉絲可通過個人首頁上系統(tǒng)的新鮮消息提醒和主動訪問u的微博頁面這兩種途徑來獲知消息 I。
3)對消息I感興趣的粉絲v可能會對該消息進行評論,收藏和轉(zhuǎn)發(fā),從而將信息I進行再次傳播。
4)如此重復過程2)和3)。
將微博網(wǎng)絡中的信息傳播機制和網(wǎng)絡拓撲結(jié)構(gòu)相結(jié)合,提出一種基于微博網(wǎng)絡的信息傳播模型IDM (α, β) , 其中α∈[0,1]表示消息的敏感度,其值是由消息的來源,內(nèi)容及表現(xiàn)形式?jīng)Q定的;β∈{-1,0,1}是模型的另一個參數(shù),用來決定選擇轉(zhuǎn)發(fā)信息的節(jié)點的方式。在這個模型中,網(wǎng)絡中的節(jié)點只可能處于3種狀態(tài),一是未激活狀態(tài),即不知道消息I,記為S0,二是被消息I激活但選擇不作為狀態(tài),記為S1,三是被消息I激活后對消息進行轉(zhuǎn)發(fā)的狀態(tài),記為S2。時間步序列是一個離散的等間隔(如,5 min)時間序列。模型定義如下:
1)初始時刻,將網(wǎng)絡中所有節(jié)點的狀態(tài)初始化為S0。在時間步T=0,隨機選擇一個節(jié)點v作為發(fā)布消息I的源節(jié)點。節(jié)點v的出度是dout_v。
2)在時間步T=T+1,關注節(jié)點v的dout_v個節(jié)點被激活,其中轉(zhuǎn)發(fā)消息 I的節(jié)點數(shù)量為M( M≤dout_v),M計算如下:設PT是時間步 T內(nèi)選擇轉(zhuǎn)發(fā)的節(jié)點的集合,即PT={uj}, 其中uj的狀態(tài)為S2。
3)對關注節(jié)點 v且不屬于集合PT-1的n( n≤dout_v)個節(jié)點的出度進行排序,按照從小到大的順序記為Q={u_(1),u(2),…,u( dout_v )}。若β=1,順序選擇序列Q中前M個節(jié)點,將它們狀態(tài)設為S2,放入集合PT+1;若β=-1,順序選擇序列Q最后M個節(jié)點,將它們狀態(tài)設為S2,放入集合PT+1; 若β=0,從序列Q中隨機選出M個節(jié)點,將它們狀態(tài)設為S2,放入集合PT+1。將節(jié)點v從集合PT中刪去。
4)對每一個節(jié)點v∈PT遞歸執(zhí)行2)和3),直到集合PT為空。
由式(1)可知,微博網(wǎng)絡中節(jié)點v對消息傳播的貢獻是與它的出度及消息的敏感度成正比的,這與現(xiàn)實情況中用戶的粉絲越多,其發(fā)布(轉(zhuǎn)發(fā))的消息被進一步轉(zhuǎn)發(fā)的可能性就越大及消息的敏感度越高,吸引力越大,其轉(zhuǎn)發(fā)率越大是吻合的。在該模型中,利用參數(shù)β來選擇節(jié)點v的“粉絲”節(jié)點中會進一步轉(zhuǎn)發(fā)消息I的節(jié)點,當β=-1時,選擇出度小的節(jié)點對信息進行轉(zhuǎn)發(fā),當β=1時,選擇出度大的節(jié)點對信息進行轉(zhuǎn)發(fā),當β=0時,隨機選擇出轉(zhuǎn)發(fā)節(jié)點。
現(xiàn)利用自動搜索程序,獲得了新浪微博網(wǎng)絡的一個子網(wǎng)絡,該網(wǎng)絡是個有向圖,記為G=(V, E),其中節(jié)點v∈V表示一個微博ID,有向邊(u, v)∈E表示用戶v是用戶u的粉絲, 信息從u流向v。所獲取的子圖的節(jié)點數(shù)N=62 668,平均入度din_mean=248.12, 平均出度dout_mean=329.49。 累積出度的分布如圖1所示,p表示出度值。
圖2顯示的是信息敏感度取不同值時,采取不同的轉(zhuǎn)發(fā)節(jié)點選擇策略,信息在網(wǎng)絡上的擴散面積和擴散耗時的比較,圖2中空心點,倒三角,叉分別代表β取1,0,-1時信息在網(wǎng)絡中的擴散比例,每一條曲線是通過對每對參數(shù) 50次仿真結(jié)果的統(tǒng)計平均得到的。從圖2可以看出當信息敏感度較小時,明星用戶在信息傳播過程中扮演著意見領袖的角色,對輿論的傳播起著絕對的推動作用;但當信息敏感度大于某一臨界值后,明星用戶對提高信息傳播速度、擴大信息傳播面積的作用逐漸減?。划斝畔⒚舾卸融呌?時,明星用戶在信息傳播中的優(yōu)勢趨于0。
圖1 累積出度分布
圖2 信息擴散密度隨時間的演化
微博網(wǎng)絡是復雜網(wǎng)絡在實際人際網(wǎng)絡的一個實例,文中初步構(gòu)建了一個基于微博網(wǎng)絡的信息傳播模型,該模型準確描述了微博網(wǎng)絡中信息傳播的基本特點,以及輿論演化過程中每次節(jié)點的選取、節(jié)點策略的轉(zhuǎn)移。通過在新浪微博的拓撲子網(wǎng)上進行仿真,得到如下結(jié)論:明星用戶在信息擴散的過程中起著著意見領袖的作用,但當信息敏感度大于某一臨界值后,明星用戶對提高信息傳播速度、擴大信息傳播面積的作用逐漸減小,當信息敏感度趨于1時,明星用戶在信息傳播中的優(yōu)勢趨于0。由于輿論傳播過程中存在著許多會影響傳播過程的不確定因素,因此該模型還有很大的改善空間,例如,信息敏感度的劃分需要更多的實證研究來支持。相信隨著這方面研究的深入,復雜網(wǎng)絡中的信息傳播機制會越來越得到重視,進而更好的提升網(wǎng)絡空間的文明度和保障人們對網(wǎng)絡安全的需求。
[1] JAEWON Y, LESKOVEC J. Modeling Information Diffusion in Implicit Networks[C]//IEEE.2010 IEEE 10thInternational Conference on Data Mining.Berlin,Germany: IEEE,2010:599-608.
[2] GOLDENBERG J, LIBAI B, MOLDOVAN S, et al. The NPV of Bad News[J].International Journal of Research in Marketing,2007,24(03):186-200.
[3] LAHIRI M, CEBRIN M. The Genetic Algorithm as a General Diffusion Model for Social Networks[C]//The 24th AAAI Conference on Artificial Intelligence.Atlanta,Georigia,USA:[s.n.],2010:76-81.
[4] SAITO K, KIMURA M, OHARA K, et al. Learning Continuous Time Information Diffusion Model for Social Behavioral Data Analysis[J]. Advances in Machine Learning, Springer,2009(5828): 322-337.
[5] 惠彥濤,吳靜. 互補結(jié)構(gòu)網(wǎng)絡建模與統(tǒng)計特性分析[J].通信技術(shù),2011,44(05): 94-96.
[6] HADDADI H, BENEVENUTO F, GUMMADI K P. Measuring User Influence in Twitter: The Million Follower Fallacy[C]// Proceedings of International AAAI Conference on Weblogs and Social. Washington,DC:ICWSM,2010:97-105.
[7] BHARATHI S, DAVID K, MAYHAR S. Competitive Influence Maximization in Social Networks Internet and Network Economics[J]. Springer, 2007(2315):306-311.