◎徐春鳳 葛芳酩 吳雙雙
伴隨著互聯(lián)網(wǎng)和5G的飛速發(fā)展,網(wǎng)絡(luò)和社交媒體已經(jīng)成為人們生活中越來越重要的部分。隨著網(wǎng)絡(luò)的不斷發(fā)展,以微博為主的社交媒體平臺逐漸成為輿情發(fā)展、演變、傳播的主要空間。本文基于突發(fā)事件的意見領(lǐng)袖評價指標分析通過對爬蟲得到的數(shù)據(jù)進行影響力及活躍度分析,通過分析建立關(guān)系圖,發(fā)現(xiàn)它們之中的聯(lián)系,以及最終找出最有影響力的人,即意見領(lǐng)袖。本文從影響力和活躍度兩方面入手,通過度中心性研究影響力的大小,通過點入度、點出度、絕對中心度和相對中心度衡量活躍度的大小。
借助Python工具,采用關(guān)鍵詞搜索的方法對原始微博相關(guān)數(shù)據(jù)進行爬取,爬取的信息包括微博id、用戶id、用戶昵稱、微博正文、轉(zhuǎn)發(fā)數(shù)、評論數(shù)、點贊數(shù)、發(fā)布時間、被轉(zhuǎn)發(fā)微博的id等。對爬取的數(shù)據(jù)進行預(yù)處理。最終得到可以構(gòu)建網(wǎng)絡(luò)的節(jié)點及屬性文件和邊文件。
本文將建立有向關(guān)系網(wǎng)絡(luò)(有箭頭的邊)。例如當一個用戶轉(zhuǎn)發(fā)了另一個用戶的博文時,在轉(zhuǎn)發(fā)關(guān)系網(wǎng)絡(luò)中兩個用戶之間會生成一條單向邊,而不是一條雙向邊。根據(jù)微博用戶的id1→微博用戶的博文id1→其他微博用戶轉(zhuǎn)發(fā)博文id1生成新的博文id2→轉(zhuǎn)發(fā)博文id1的微博用戶id2之間的關(guān)系構(gòu)建微博用戶id1和微博用戶id2轉(zhuǎn)發(fā)關(guān)系網(wǎng)絡(luò)。
網(wǎng)絡(luò)密度即為網(wǎng)絡(luò)中實際的邊數(shù)預(yù)最大可能邊數(shù)的比率,它的取值范圍在0到1之間,用來衡量一個網(wǎng)絡(luò)中各個節(jié)點之間連接的緊密程度。當網(wǎng)絡(luò)中實際的邊數(shù)越接近最大可能邊數(shù)的時候,該網(wǎng)絡(luò)的密度就越大;反之,則越小。公式1為:
其中,g表示關(guān)系網(wǎng)絡(luò)中存在的節(jié)點數(shù),g(g-1)表示g個節(jié)點可能存在的所有不同的線,L代表轉(zhuǎn)發(fā)關(guān)系網(wǎng)絡(luò)實際存在的線條數(shù),密度的最終取值范圍為[0,1]。網(wǎng)絡(luò)密度是介于[0,1]之間,越趨向于0,則說明該網(wǎng)絡(luò)中的聯(lián)系不緊密,網(wǎng)絡(luò)內(nèi)各節(jié)點之間的交往不密切,因此核心人物的存在可能性?。幌喾?,越趨向于1,則說明該網(wǎng)絡(luò)內(nèi)部互動頻繁、聯(lián)系緊密,核心人物存在的可能性很大,因此,網(wǎng)絡(luò)中極易出現(xiàn)一個或幾個意見領(lǐng)袖,推動整個事件的發(fā)展。
意見領(lǐng)袖存在于聯(lián)系緊密的小團體中,小團體是指關(guān)系特別緊密的一小群人。小團體的存在使得意見領(lǐng)袖有了一定的生存環(huán)境,小團體是由網(wǎng)絡(luò)密度進行測量的。從已有學(xué)者的意見領(lǐng)袖識別研究中可以發(fā)現(xiàn),他們所選擇的樣本都是內(nèi)部討論較為積極活躍的。因此并不是所有的網(wǎng)絡(luò)都存在意見領(lǐng)袖,而只有該網(wǎng)絡(luò)的密度較大時才有可能存在核心人物,即網(wǎng)絡(luò)的密度成為該網(wǎng)絡(luò)是否存在意見領(lǐng)袖的衡量指標。
意見領(lǐng)袖是網(wǎng)絡(luò)傳播中的重要角色,是人群中首先或較多接觸大眾傳媒信息,并將經(jīng)過自己再加工的信息傳播給其他人的人。具有影響他人態(tài)度的能力,意見領(lǐng)袖介入大眾傳播,加快了傳播速度并擴大了影響力。
本文結(jié)合微博意見領(lǐng)袖的定義及特征,并通過對所有關(guān)于意見領(lǐng)袖識別指標的分析,可以得出影響力和活躍度2個一級指標、5個二級指標的評價指標體系。具體意見領(lǐng)袖識別指標如表1:
表1 微博意見領(lǐng)袖評價指標體系
(1)影響力指標分析
結(jié)合微博空間中意見領(lǐng)袖影響力指標的分析,將影響力指標分解為:度中心性維度。
“意見領(lǐng)袖”是指活躍在人際傳播網(wǎng)絡(luò)中,頻繁的為他人提供信息、意見等并能夠贏得他人的支持,通過個人的影響力對他人的態(tài)度、行為產(chǎn)生一定改變的領(lǐng)袖者,從其定義的基本描述可以看出,影響力是意見領(lǐng)袖基本的能力。意見領(lǐng)袖在網(wǎng)絡(luò)空間內(nèi)具有引導(dǎo)輿論走向,推動突發(fā)公共問題解決的能力和作用,這都歸功于微博意見領(lǐng)袖具有較大的影響力,結(jié)合微博空間中意見領(lǐng)袖影響力指標的分析,將影響力指標分解為:度中心性維度。
在轉(zhuǎn)發(fā)關(guān)系網(wǎng)絡(luò)中,若某一節(jié)點與其所有他節(jié)點之間都有直接的聯(lián)系,則說明該節(jié)點在該網(wǎng)絡(luò)群體中占據(jù)中心性的位置,因此用戶在微博空間中的位置可以由這一用戶與其他用戶之間的有聯(lián)系的點數(shù)來描述,即度中心性。
度中心性所表示該節(jié)點相連的節(jié)點數(shù),即該節(jié)點與其他節(jié)點之間的聯(lián)系程度,表現(xiàn)為為某一節(jié)點在局部的中心性,能夠測量出該節(jié)點在網(wǎng)絡(luò)中的重要程度。公式2為:
CD(i)為用戶i的度中心性,表示該節(jié)點相連的節(jié)點數(shù);aij為事件微博用戶矩陣,表示微博用戶在事件中的影響力。度中心性越高,說明該用戶的影響力越大。
根據(jù)公式2可以計算出每個微博用戶的度中心性,為了進一步比較微博用戶度中心性的高低,將度中心性進行規(guī)約化處理,使其介于[0,1]之間。公式3為:
數(shù)值越接近于1,代表其度中心性越高,該微博用戶在事件的影響力越大;相反,數(shù)值越接近于0,代表度中心性越低,該微博用戶在事件的影響力越小。
(2)活躍度指標分析
微博用戶憑借其在微博空間的影響力是不足以使其成為意見領(lǐng)袖的,然而要想擴大影響力的覆蓋面不僅要靠發(fā)布大量真實的信息,還要與其他微博用戶形成交流互動,在互動的過程中逐漸的影響到人們的觀點,改變?nèi)藗兊膽B(tài)度,從而使其他用戶成為其忠實的追隨者。因此在識別意見領(lǐng)袖的指標上應(yīng)該充分的考慮到活躍度這一指標,活躍度的具體指標包括:點入度、點出度、絕對中心度、相對中心度四個維度。
點入度
在有向圖中,一個點的點入度是以這個頂點為終點的有向邊的數(shù)量,如圖1所示。在此轉(zhuǎn)發(fā)關(guān)系網(wǎng)絡(luò)分析中,定義點入度表示某一節(jié)點關(guān)注其他節(jié)點的程度,即轉(zhuǎn)發(fā)其他用戶的博文數(shù)量。個體點入度越大,則說明該用戶在群體中轉(zhuǎn)發(fā)的信息越多,積極主動與其他用戶聯(lián)系的次數(shù)越多,參與話題的主動性和積極性越強,傾向于信息接收者的角色。
用戶A的點入度可以用 來表示,則圖1中。
圖1 點入度關(guān)系圖
點出度
在有向圖中,一個頂點的出度是以這個點為起點的有向邊的數(shù)量,如圖2所示。在此轉(zhuǎn)發(fā)關(guān)系網(wǎng)絡(luò)分析中,定義點出度表示的是某一節(jié)點受到其他節(jié)點關(guān)注的程度,具體可以是其他用戶對該用戶所發(fā)博文的轉(zhuǎn)發(fā)、評論等行為。若個體點出度越大,則說明其他用戶對該用戶回復(fù)的次數(shù)越多,該用戶引起的重視越多,該用戶在群體中傳遞的信息越多,傾向于信息發(fā)布者的角色。
用戶A的點出度可以用C(out)來表示,則圖2中C(out)=m。
圖2 點出度關(guān)系圖
絕對中心度
點入度與點出度之和為絕對中心度。某用戶的絕對中心度相對于其他用戶的絕對中心度越大,說明該用戶的接收或傳遞信息能力越強。
用戶A的絕對中心度為:
表示用戶A的絕對中心度。
相對中心度
為針對不同規(guī)模的網(wǎng)絡(luò),可以用相對中心度衡量。某用戶的相對中心度越大,說明該用戶的影響力越大。
用戶A的相對中心度公式為:
為相對中心度,g為網(wǎng)絡(luò)中用戶數(shù)量。
網(wǎng)絡(luò)環(huán)境下,意見領(lǐng)袖在突發(fā)事件的信息傳播過程中發(fā)揮了重要的作用。本文的研究主要從利用爬蟲工具獲取博文開始,獲取點贊數(shù),評論數(shù)及轉(zhuǎn)發(fā)數(shù),在對數(shù)據(jù)進行清洗和預(yù)處理的操作基礎(chǔ)上,通過一些公式計算他們之間的關(guān)系,通過軟件進行網(wǎng)絡(luò)圖、關(guān)系模式的的建立,在此基礎(chǔ)上,通過分析找出最有影響力的人及其對此次事件的影響。
本文接下來的研究方向:一是:根據(jù)本文構(gòu)建的評價指標的基礎(chǔ)上確定各個指標的權(quán)值,通過權(quán)值計算屬性值,找出最有影響力的意見領(lǐng)袖。二是:在詞云和詞頻分析的基礎(chǔ)上,將結(jié)合分詞技術(shù)和樸素貝葉斯分類器,進行情感分析建模,得到公共事件中大眾的態(tài)度和情感值。三是:將輿情的發(fā)展階段和意見領(lǐng)袖相結(jié)合,研究大眾的情感發(fā)展趨勢和意見領(lǐng)袖情感趨勢之間的異同點,并劃分情感類型,將情感分為消極、中立、積極三類情緒。