毛艷
(西安文理學(xué)院 陜西 西安710065)
冪律(power-law)來自上世紀(jì)20年代對于英語單詞頻率的分析,語言學(xué)家發(fā)現(xiàn)單詞使用的頻率和它的使用優(yōu)先度是一個常數(shù)次冪的反比關(guān)系。冪律描述的是這樣一組數(shù)據(jù),其第n個位置的秩(rank)是第1個位置的秩的1/n。對于一個純冪律分布,第一位與第二位之間的差距要大于第二位與第三位之間的差距,以此類推。冪律的最顯著特征就是,等級越高則越不均衡[1]。冪律有兩個通俗的定律,一是“長尾”理論,另一個是馬太效應(yīng)。微博宣傳的影響力具有很大彈性,與內(nèi)容質(zhì)量高度相關(guān)。其影響力基于用戶現(xiàn)有的被“關(guān)注”的數(shù)量。用戶發(fā)布信息的吸引力、新聞性越強,對該用戶感興趣、關(guān)注該用戶的人數(shù)也越多,影響力越大[2]。為了對以微博為代表的新型虛擬社區(qū)網(wǎng)絡(luò)上的信息傳播規(guī)律進(jìn)行研究,更好地探討表達(dá)話題和用戶兩個維度的相互聯(lián)系和作用,本文采用超網(wǎng)絡(luò)的研究方法,結(jié)合超圖的數(shù)學(xué)理論,建立超網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖,驗證了微博討論數(shù)符合冪律的結(jié)論。
隨著Web2.0的普及和深入,用戶的主觀能動性在網(wǎng)絡(luò)信息傳播中的重要性大大提升。微博在近幾年剛剛興起,用戶數(shù)量與日俱增,成為重要的社交平臺。
微博,即微型博客(MicroBlog)的簡稱,是一個基于用戶關(guān)系信息分享、傳播以及獲取平臺。用戶可以通過WEB、WAP等各種客戶端組建個人社區(qū),以140字左右的文字更新信息,并實現(xiàn)即時分享。中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)于2013年7月17日發(fā)布《第32次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》,報告顯示,2013年上半年,中國微博用戶從2.02億增至2.29億,增長約2 700萬人。該《報告》指出,中國互聯(lián)網(wǎng)的普及率增至44.1%,較2012年增加2.0%。
輿論在虛擬社區(qū)的傳播屬于復(fù)雜的社會現(xiàn)象,存在著眾多的隨機因素,很難完全重現(xiàn)其演進(jìn)狀況。針對其多層次性和社區(qū)性,可采用超網(wǎng)絡(luò)的研究方法,為虛擬社區(qū)網(wǎng)絡(luò)建立由多端子網(wǎng)絡(luò)組成的超網(wǎng)絡(luò)模型[3],并以超圖理論為基礎(chǔ)研究超網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)和數(shù)值特征。
超大規(guī)模的網(wǎng)絡(luò)系統(tǒng)運行的復(fù)雜性較高,超網(wǎng)絡(luò)模型可用來描述和表示網(wǎng)絡(luò)之間的相互作用和影響[3]。超網(wǎng)絡(luò)的構(gòu)架為研究網(wǎng)絡(luò)之間的相互作用和影響提供了工具。它可以用一些數(shù)學(xué)工具對網(wǎng)絡(luò)上的流量、時間等變量進(jìn)行定量的分析和計算[4]。
在微博這個網(wǎng)絡(luò)中,在已生成的超網(wǎng)絡(luò)中,新加入的一個用戶和已有的若干個舊用戶通過話題評論或轉(zhuǎn)發(fā)生成超邊。
1)初始化 :假設(shè)初始時超網(wǎng)絡(luò)有 m0個用戶,V1,V2,V3,VM0以及包含這 m0個用戶的一條超邊 E1={V1,V2,V3…VM0}
2)超邊增長:在t時間內(nèi),每次進(jìn)入一個新的用戶V,與m(m 3)優(yōu)先連接:從已有的超網(wǎng)絡(luò)中的用戶按照概率優(yōu)先選取m個用戶,與新加入的用戶結(jié)合生成超邊。每次選取連接的用戶 i的概率dH(i)等于用戶 i的超度dH(i)與超網(wǎng)絡(luò)中的已有用戶 j的超度 dH(j)總和比,即: 其中 dH(i)等于包含用戶 i的超邊的個數(shù)。經(jīng)過 t時刻后,超網(wǎng)絡(luò)中有t+1條超邊,m0+t個用戶,所有用戶的超度總和為 m0+t(m+1)。圖1顯示了 m0=3,m=2時超網(wǎng)絡(luò)動態(tài)演化的過程。 圖1 超網(wǎng)動態(tài)演化過程示意圖Fig.1 Chematic diagram of super dynamic evolution process 采用以上的增長和優(yōu)先連接機制所生成的超圖,由于每個時間步內(nèi)生成一個新節(jié)點,和網(wǎng)絡(luò)中已有的m個用戶結(jié)合生成超邊,每條超邊中元素的個數(shù)皆為 m+1,所以得到的是(m+1)均勻超圖。 每個節(jié)點的超度為 1,在 t時間步完成后超網(wǎng)絡(luò)中共包含了 t+1條超邊,m0+t個節(jié)點。 每個時間步內(nèi),新增加的節(jié)點與已有的m個節(jié)點結(jié)合生成一條新的超邊。在選擇舊節(jié)點i的過程中,節(jié)點i有1次被選中的概率大致為 其中 dH(i)表示為節(jié)點 i的超度。 再令 dH(t)表示在 t時間步結(jié)束時節(jié)點i的超度,而節(jié)點i是在第ti時刻加入網(wǎng)絡(luò)的,因此,根據(jù)連續(xù)場理論[5],把 dH(t)看作連續(xù)動力學(xué)函數(shù),節(jié)點i的超度dH(t)應(yīng)該近似的滿足下述動力學(xué)方程: 分母求和是在t時刻超網(wǎng)絡(luò)中所有已有節(jié)點的超度的總和,當(dāng) m0較小,t較大時我們可得 因此 每個節(jié)點加入超網(wǎng)絡(luò)中時節(jié)點的超度的初始值dH(ti)=1,則解上式方程可得 由于超網(wǎng)絡(luò)中加入超邊中的節(jié)點是隨機選擇的,因此節(jié)點具有超度dH的概率為 假設(shè)在相同的時間間隔,添加新的節(jié)點i,則i應(yīng)該在t個新加入的節(jié)點服從均勻分布,即 ti值具有常數(shù)的概率密度p(ti)=1/t,從而代入上式得 于是,網(wǎng)絡(luò)的瞬時超度分布PH(dh,t)為 此超網(wǎng)絡(luò)模型的超度分布是獨立于時間的。說明節(jié)點的超度分布和BA網(wǎng)絡(luò)一樣仍然符合冪率分布,可由冪指數(shù)的冪函數(shù)γ=2+1/m近似描述這個結(jié)果。 本文對2013年11月12日18時約60 000條微博話題進(jìn)行采樣,統(tǒng)計這些話題至18日18時的參與討論的用戶數(shù)。將統(tǒng)計的數(shù)據(jù)進(jìn)行分類匯總,以“討論數(shù)”為縱軸,“話題數(shù)”為橫軸,建立對數(shù)坐標(biāo)系,程序代碼如下: clc; clear; file=’E:course
et6wan.xls’; [data text]=xlsread(file); x=data(:,1); y=data(;.2); loglog(data(;,1),data(:,2),’r*’); hold on; figure(1); title(‘distribution functio’); xlabel(‘討論數(shù)’); ylabel(‘話題數(shù)); x=log10(x); y=log10(y); a=polyfit(x,y,1); x=min(x):0.01:max(x); y=polyval(a,x); 用matlab繪出的散點圖[6]結(jié)果如2所示。 圖2 微博話題數(shù)與討論數(shù)散點分布圖Fig.2 Micro-blog topic numbers and discuss several scatter distribution 用戶參與討論的微博話題數(shù)符合冪律分布。在微博的話題數(shù)較少的時候,即系統(tǒng)規(guī)模不是很大的時候,某一話題被討論概率與超度的關(guān)系并沒有明顯的優(yōu)先連接趨勢,表現(xiàn)為散亂的點;隨著話題數(shù)的不斷添加,由于在選擇加入話題時,仍然遵循按節(jié)點的超度優(yōu)先連接機制,所以對于參與討論人數(shù)較多的話題呈現(xiàn)出一定趨勢的優(yōu)先連接,表現(xiàn)為非線性形式。隨著時間的增加(網(wǎng)絡(luò)規(guī)模的增大),超邊的度與節(jié)點的超度優(yōu)先連接機制的相關(guān)性會變得越來越明顯,超邊度分布最終趨于冪律,驗證了微博話題的討論人數(shù)符合冪律分布。 [1]胡海波,王林.冪律分布研究簡史[J].物理,2005,12(1):81-87.HU Hai-Bo,WANG Lin.The research history of the powerlaw distribution[J].Physics,2005,12(1):81-87. [2]喻國明.微博:一種新傳播形態(tài)的考察——影響力模型和社會性應(yīng)用[M].北京:人民日報出版社,2011. [3]胡海波,王科,徐玲,等.基于復(fù)雜網(wǎng)絡(luò)理論在線社會網(wǎng)絡(luò)分析[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2008,2(1):57-62.HU Hai-Bo,WANG Ke,Xu Ling,et al.Analysis of online social networks based on complex network theory[J].Complex Systems and Complexity Science,2008,2(1):57-62. [4]王志平,王眾托.超網(wǎng)絡(luò)理論及其應(yīng)用[M].北京:科學(xué)出版社,2008. [5]王建方.超圖的理論基礎(chǔ)[M].北京:高等教育出版社,2006. [6]卓金武.MATLAB在數(shù)學(xué)建模中的作用[M].北京:北京航空航天大學(xué)出版社,2011.3 研究方法
4 結(jié)論