黃淼,黃佩
(北京郵電大學(xué) 數(shù)字媒體與設(shè)計(jì)藝術(shù)學(xué)院,北京 100876)
互聯(lián)網(wǎng)傳播帶來(lái)了信息的飛沫化、傳者的去中心化、公眾生活的社交媒體化,顛覆了健康傳播“知、信、行”的經(jīng)典范式[1]。健康信息的獲知不再是單向的、一對(duì)眾的,而時(shí)常產(chǎn)生在基于共同話題興趣的交流中,天涯論壇、豆瓣小組、百度貼吧、微博話題、微信群組以及知乎等平臺(tái)支持著開(kāi)放的知識(shí)分享。健康信息的可信度不再依托于傳者權(quán)威,而往往積累于已被采信的數(shù)量和質(zhì)量,評(píng)論傾向、點(diǎn)贊數(shù)、星標(biāo)等級(jí)等指標(biāo)形成了眾籌式的信用標(biāo)準(zhǔn)。在此背景下,健康謠言頻現(xiàn)似乎成為互聯(lián)網(wǎng)時(shí)代難以回避的問(wèn)題。
健康謠言頻現(xiàn)也與網(wǎng)絡(luò)空間的規(guī)制局限有關(guān)。首先,在合法性判定的規(guī)制標(biāo)準(zhǔn)上,我國(guó)政府對(duì)時(shí)政類(lèi)信息的生產(chǎn)和發(fā)布主體都有嚴(yán)格的資質(zhì)審查,而出于對(duì)言論自由和文化多元的尊重和保護(hù),非時(shí)政類(lèi)信息的生產(chǎn)和發(fā)布資質(zhì)較少受限,健康信息即屬于后者。其次,在真實(shí)性核查的技術(shù)難度上,健康謠言牽涉到較多專(zhuān)業(yè)知識(shí),其中更有科研領(lǐng)域尚未定論的問(wèn)題,而科研中常見(jiàn)的“不確定性”結(jié)論恰是謠言傳播的驅(qū)動(dòng)因素之一[2]。再次,健康謠言通常不會(huì)含有明確的涉事主體,而時(shí)政類(lèi)和社會(huì)類(lèi)謠言的受害主體會(huì)主動(dòng)維權(quán),所以,健康謠言的違規(guī)成本較低。最后,我國(guó)正處于社會(huì)轉(zhuǎn)型期,風(fēng)險(xiǎn)議題頻頻成為輿論熱點(diǎn)[3],風(fēng)險(xiǎn)社會(huì)的現(xiàn)實(shí)映射到網(wǎng)絡(luò)空間之中,使后者成為謠言傳播的“沃土”。
微信公眾號(hào)“謠言過(guò)濾器”自2016年7月開(kāi)始發(fā)布《朋友圈十大謠言》報(bào)告。與該平臺(tái)合作的第三方辟謠機(jī)構(gòu)分為兩類(lèi):健康類(lèi)和社會(huì)事件類(lèi),可見(jiàn)健康謠言治理已經(jīng)成為社會(huì)普遍關(guān)注的公共問(wèn)題。今日頭條算數(shù)中心2018年11月公布的數(shù)據(jù)亦顯示,健康謠言文章數(shù)量在謠言庫(kù)中所占比重最高。截至2018年底,今日頭條謠言庫(kù)有2萬(wàn)條謠言數(shù)據(jù),話題分布于健康、民生、娛樂(lè)、科技、收藏、歷史和軍事等領(lǐng)域。其中,健康類(lèi)謠言占比(35.5%)最高。同時(shí),在今日頭條客戶端中的各類(lèi)資訊訂閱數(shù)中,健康話題也名列前茅,反映出此類(lèi)信息需求量較大。
對(duì)微信和今日頭條兩個(gè)平臺(tái)中謠言內(nèi)容進(jìn)行初步分析后,發(fā)現(xiàn)健康謠言通常呈現(xiàn)為科普文章,看似具有科學(xué)性的敘述掩蓋著錯(cuò)誤的知識(shí)關(guān)聯(lián)。那么,這些錯(cuò)誤的知識(shí)關(guān)聯(lián)通常如何表現(xiàn)?筆者結(jié)合今日頭條算數(shù)中心發(fā)布的《健康類(lèi)辟謠資訊新趨勢(shì)報(bào)告》和微信公眾號(hào)“謠言過(guò)濾器”2017至2019年發(fā)布的“朋友圈十大謠言”,歸納了健康謠言中常見(jiàn)的五類(lèi)虛假知識(shí)關(guān)聯(lián)(如表1所示)。
表1 健康謠言的五類(lèi)虛假知識(shí)關(guān)聯(lián)
如表1所示,構(gòu)成健康謠言的虛假知識(shí)關(guān)聯(lián)可分為五種類(lèi)型:歪曲常態(tài)事實(shí)、偷換概念、捏造聯(lián)系、忽略劑量和虛構(gòu)因果。其中,歪曲常態(tài)事實(shí)的案例最多,可根據(jù)效果將其分為積極型和消極型,這類(lèi)謠言主要通過(guò)引起讀者的驚駭達(dá)到二次傳播的目的。但過(guò)度夸張也可能引起更多質(zhì)疑。相較而言,后四類(lèi)謠言的虛假知識(shí)關(guān)聯(lián)更為隱蔽,其判別需要更多科學(xué)知識(shí)。由此可見(jiàn),對(duì)于涉及背景知識(shí)的謠言識(shí)別,知識(shí)關(guān)聯(lián)比文本特征更重要?;诖?,筆者將主要探索如何找到健康謠言中的知識(shí)關(guān)聯(lián)。
在新聞傳播學(xué)領(lǐng)域,針對(duì)謠言內(nèi)容的研究主要關(guān)注文字、情緒、敘事結(jié)構(gòu)等文本特征。謠言常帶有煽動(dòng)和夸張的措辭方式[4],常采用勸服式行文結(jié)構(gòu)[5],謠言的情緒傾向多為負(fù)面[6],尤其體現(xiàn)為恐懼和憤怒的情緒[7]。這些研究發(fā)現(xiàn)的文本特征可以作為識(shí)別謠言的理論參考,但若要應(yīng)用于識(shí)別技術(shù),存在三個(gè)缺陷:其一,既然謠言的目的是欺騙,其作者就有充分動(dòng)機(jī)刻意模仿真實(shí)信息,極力掩蓋措辭、行文和情緒中的“謠言式特征”;其二,文本特征只能表明“虛假”是如何呈現(xiàn)的,卻不能揭示“虛假”是如何形成的;其三,健康謠言多呈現(xiàn)為科普文章,以往研究基于社交媒體個(gè)人言論、新聞文本或其他文體發(fā)現(xiàn)的文本特征不一定適用。
針對(duì)謠言傳播過(guò)程的研究提供了認(rèn)識(shí)其內(nèi)容特征的另一種視角。有學(xué)者發(fā)現(xiàn),謠言的形成與傳播經(jīng)常同時(shí)發(fā)生,新的信息點(diǎn)不斷添加進(jìn)來(lái),“信息拼圖”逐漸形成,信息點(diǎn)及其之間的關(guān)聯(lián)構(gòu)成謠言的說(shuō)服力,決定謠言的傳播效果[8]。信息構(gòu)成是比文本呈現(xiàn)更深層、更穩(wěn)定的內(nèi)容特征,其應(yīng)用于謠言識(shí)別的關(guān)鍵在于找到從信息到內(nèi)容的映射關(guān)系。有學(xué)者通過(guò)分析微信中食品安全類(lèi)謠言的詞頻特征得出結(jié)論——“導(dǎo)致”“產(chǎn)生”“作用”等具有誘導(dǎo)涵義的動(dòng)詞頻率較高,目的就在于引起讀者的憂慮,實(shí)現(xiàn)二次傳播[9]。但該研究只分析了詞頻特征,只解決了信息到內(nèi)容如何映射的問(wèn)題,缺乏對(duì)不同信息之間關(guān)聯(lián)的思考。
在計(jì)算機(jī)領(lǐng)域,基于內(nèi)容特征的網(wǎng)絡(luò)謠言識(shí)別方法包括兩類(lèi):基于內(nèi)容分類(lèi)的機(jī)器學(xué)習(xí)和基于內(nèi)容對(duì)比的檢測(cè)方法[10]。第一類(lèi)方法把謠言內(nèi)容看作機(jī)器學(xué)習(xí)分類(lèi)問(wèn)題,從已標(biāo)記的訓(xùn)練數(shù)據(jù)中訓(xùn)練預(yù)測(cè)函數(shù),即謠言識(shí)別算法。訓(xùn)練數(shù)據(jù)包含多元特征,既可以是顯性的語(yǔ)法特征,也可以是隱形的語(yǔ)義特征。這類(lèi)方法需要大規(guī)模的訓(xùn)練數(shù)據(jù),只適用于歷史數(shù)據(jù)分析。但該方法可以整合多元特征,結(jié)果的精確度較高。第二類(lèi)方法是選擇已判定的謠言和非謠言,從語(yǔ)法、語(yǔ)義和情感等角度進(jìn)行對(duì)比。這類(lèi)方法可以根據(jù)小規(guī)模數(shù)據(jù)提供時(shí)效性強(qiáng)、特征簡(jiǎn)單的判別,但結(jié)果的精確度不高,通常作為其他識(shí)別方式的輔助工具。對(duì)于健康謠言來(lái)說(shuō),如果歷史數(shù)據(jù)充分,就可以先采用基于內(nèi)容分類(lèi)的機(jī)器學(xué)習(xí)方法訓(xùn)練識(shí)別函數(shù),再使用基于內(nèi)容對(duì)比的方法進(jìn)行新數(shù)據(jù)的事實(shí)監(jiān)測(cè)。即便如此,仍然只能識(shí)別已有謠言話題,而無(wú)法識(shí)別由新的信息關(guān)聯(lián)構(gòu)成的新生謠言。
通過(guò)對(duì)新聞傳播學(xué)和計(jì)算機(jī)科學(xué)這兩個(gè)領(lǐng)域相關(guān)研究的回溯,本文的研究問(wèn)題進(jìn)一步明確:其一,如何找到從信息到信息拼圖的關(guān)聯(lián);其二,如何借助現(xiàn)有計(jì)算機(jī)技術(shù)建構(gòu)新生謠言的識(shí)別機(jī)制。
通過(guò)對(duì)今日頭條謠言庫(kù)的全樣本數(shù)據(jù)進(jìn)行高頻詞提取和話題聚類(lèi),發(fā)現(xiàn)“減肥”相關(guān)詞在健康謠言中出現(xiàn)頻率最高且最易形成話題,所以,筆者選擇減肥謠言作為知識(shí)關(guān)聯(lián)特征的具體分析對(duì)象。
今日頭條算數(shù)中心根據(jù)用戶閱讀與搜索行為數(shù)據(jù)總結(jié)出最易產(chǎn)生謠言的“十大知識(shí)點(diǎn)”:減肥、高血壓、糖尿病、腰間盤(pán)突出、戒煙、鼻炎、養(yǎng)生、穴位養(yǎng)生、痛風(fēng)、甲溝炎。這10個(gè)知識(shí)點(diǎn)所對(duì)應(yīng)的關(guān)鍵詞在謠言庫(kù)中的詞頻排序如表2所示。詞頻最高的“減肥”的相關(guān)詞包括減肥法、減肥茶、減肥藥、減肥操、減肥液、減肥粥、減肥湯、香蕉減肥法、中藥減肥、減肥丸、減肥手術(shù)。以上詞匯多為具有減肥功能的產(chǎn)品,反映出謠言生成多伴以商業(yè)營(yíng)銷(xiāo)目的,印證了以往對(duì)微信謠言的分析結(jié)論。
表2 “最易產(chǎn)生謠言的十大知識(shí)點(diǎn)”對(duì)應(yīng)關(guān)鍵詞的詞頻排序 次
數(shù)據(jù)來(lái)源:“最易產(chǎn)生謠言的十大知識(shí)點(diǎn)”出自2018年今日頭條算數(shù)中心發(fā)布的《健康類(lèi)辟謠資訊新趨勢(shì)報(bào)告》,詞頻統(tǒng)計(jì)由今日頭條算數(shù)中心提供。
“減肥”話題的重要性在基于“隱形狄利克雷分布”的話題聚類(lèi)中進(jìn)一步得證。今日頭條算數(shù)中心進(jìn)行了類(lèi)別數(shù)量由少到多的4次聚類(lèi)(128類(lèi)、256類(lèi)、516類(lèi)和1 024類(lèi)),“十大知識(shí)點(diǎn)”對(duì)應(yīng)關(guān)鍵詞中只有“減肥” 可以在4次聚類(lèi)過(guò)程中都形成詞團(tuán),且在1 024類(lèi)中形成了兩個(gè)詞團(tuán)。由此可見(jiàn),“減肥”是健康謠言中較易形成話題的關(guān)鍵詞。此外,在今日頭條客戶端可訂閱的健康資訊范圍內(nèi),“減肥”是訂閱數(shù)位居第三的話題。而排在前兩位的“養(yǎng)生”和“健身”,也是“減肥”詞團(tuán)中的相關(guān)詞。
本文采用社會(huì)網(wǎng)絡(luò)可視化工具Gephi對(duì)“減肥”高頻詞團(tuán)在今日頭條謠言庫(kù)中的相似矩陣和共現(xiàn)矩陣進(jìn)行可視化處理。社會(huì)網(wǎng)絡(luò)可視化是融合社會(huì)網(wǎng)絡(luò)分析和可視化這兩個(gè)不同學(xué)科知識(shí)的研究領(lǐng)域,它通過(guò)網(wǎng)絡(luò)形式呈現(xiàn)被分析數(shù)據(jù)的內(nèi)在關(guān)聯(lián),輔助研究人員發(fā)現(xiàn)存在于網(wǎng)絡(luò)關(guān)系中的特征和規(guī)律[11]。這個(gè)工具可以用直觀圖形表示數(shù)據(jù)集的整體特征和群聚情況,適合于揭示謠言詞團(tuán)內(nèi)部的知識(shí)關(guān)聯(lián)。“減肥”高頻詞團(tuán)是在“隱形狄利克雷分布”的話題聚類(lèi)形成的5個(gè)話題聚類(lèi)詞團(tuán)的基礎(chǔ)上建立的。為獲得不重復(fù)且可解釋的“減肥”相關(guān)詞詞團(tuán),7位研究人員對(duì)5個(gè)詞團(tuán)進(jìn)行去重和篩選,將7份結(jié)果合并后得到由63個(gè)高頻詞構(gòu)成的詞團(tuán)。該詞團(tuán)在今日頭條謠言庫(kù)全樣本數(shù)據(jù)中的相似矩陣和共現(xiàn)矩陣通過(guò)Word2Vec工具獲得。在將相似矩陣和共現(xiàn)矩陣導(dǎo)入社會(huì)網(wǎng)絡(luò)可視化工具Gephi之前,刪除共現(xiàn)度和相似度較低詞匯,保留56個(gè)相關(guān)詞。
由Word2Vec獲得的相似矩陣和共現(xiàn)矩陣可以代表兩類(lèi)不同的知識(shí)關(guān)聯(lián)特征。相似矩陣表示高頻詞團(tuán)在謠言庫(kù)中兩兩詞匯之間的相似程度,共現(xiàn)矩陣表示高頻詞團(tuán)在謠言庫(kù)中兩兩詞匯在一定窗口距離內(nèi)共同出現(xiàn)的頻率。例如,與“減肥”相似度最高的是“瘦身”(0.893),共現(xiàn)頻率最高的是“吃”(2 052);與“營(yíng)養(yǎng)”相似度最高的是“蛋白質(zhì)”(0.818),共現(xiàn)頻率最高的也是“吃”(2 008)。相似關(guān)系已被普遍應(yīng)用于謠言識(shí)別,而共現(xiàn)關(guān)系多應(yīng)用于知識(shí)管理領(lǐng)域,用以呈現(xiàn)較多知識(shí)點(diǎn)之間網(wǎng)絡(luò)狀的復(fù)雜關(guān)聯(lián)。例如,文獻(xiàn)的共引和被引關(guān)系、學(xué)術(shù)話題的知識(shí)圖譜等[12]。由此推知,共現(xiàn)關(guān)系比相似關(guān)系更有助于呈現(xiàn)映射在詞匯關(guān)系上的知識(shí)關(guān)聯(lián)。
為了進(jìn)一步探究共現(xiàn)與相似的差異,筆者使用了社會(huì)網(wǎng)絡(luò)可視化工具Gephi的兩種不同算法——介數(shù)中心度和模塊化,可視化呈現(xiàn)效果如圖1和圖2所示。
在社會(huì)網(wǎng)絡(luò)分析中,介數(shù)中心度(betweenness centrality)是指某個(gè)節(jié)點(diǎn)被其他節(jié)點(diǎn)以最短路徑通過(guò)的數(shù)量與圖中最短路徑總數(shù)之比,該數(shù)值可用于描述節(jié)點(diǎn)在網(wǎng)絡(luò)信息流動(dòng)中的重要性[13]。因此,該數(shù)值越高,某節(jié)點(diǎn)控制其他節(jié)點(diǎn)間聯(lián)系的效力越強(qiáng)。圖1中顏色的深淺代表節(jié)點(diǎn)的介數(shù)中心度高低,對(duì)比左右圖可見(jiàn),共現(xiàn)關(guān)系可顯示出的節(jié)點(diǎn)控制力分為5層,而相似關(guān)系只有兩層,所以,共現(xiàn)關(guān)系可以更有效地發(fā)現(xiàn)詞團(tuán)網(wǎng)絡(luò)中的常用搭配。
在社會(huì)網(wǎng)絡(luò)分析中,模塊化算法是根據(jù)圖的連接關(guān)系對(duì)節(jié)點(diǎn)做歸類(lèi)[13],可用于發(fā)現(xiàn)話題詞團(tuán)內(nèi)部更細(xì)分的社區(qū)(或稱“小世界”)?;谙嗤馕龆?,共現(xiàn)關(guān)系可形成5個(gè)詞團(tuán),相似關(guān)系可形成3個(gè)詞團(tuán)。詞團(tuán)聚類(lèi)可以映射知識(shí)關(guān)聯(lián),所以,共現(xiàn)關(guān)系比相似關(guān)系更易形成具有解釋力的話題聚類(lèi),有助于形成更完備的知識(shí)標(biāo)簽。
綜上所述,使用社會(huì)網(wǎng)絡(luò)分析工具Gephi對(duì)“減肥”高頻詞團(tuán)兩種關(guān)系矩陣進(jìn)行可視化呈現(xiàn),發(fā)現(xiàn)共現(xiàn)關(guān)系比相似關(guān)系更有助于發(fā)現(xiàn)知識(shí)類(lèi)謠言的常用搭配和主要話題。這一發(fā)現(xiàn)可以部分回答在前文提出的第一個(gè)問(wèn)題——如何找到從信息到信息拼圖的關(guān)聯(lián),在共現(xiàn)網(wǎng)絡(luò)中發(fā)現(xiàn)的常用搭配和主要話題可以映射減肥謠言的關(guān)鍵知識(shí),以及知識(shí)之間的關(guān)聯(lián)。下面將探討第二個(gè)問(wèn)題——如何借助現(xiàn)有計(jì)算機(jī)技術(shù)建構(gòu)新生謠言的識(shí)別機(jī)制。
如前所述,現(xiàn)有謠言識(shí)別技術(shù)面臨一個(gè)難題:基于分類(lèi)機(jī)器的方法可以面向多維特征,結(jié)果具有較高精確度,但需要大規(guī)模數(shù)據(jù),只能用作謠言爆發(fā)期之后的歷史數(shù)據(jù)分析;基于內(nèi)容對(duì)比的方法可以用少量數(shù)據(jù)作出高效分析,但特征維度較少,結(jié)果的精確度有限[14]。實(shí)際上,計(jì)算機(jī)領(lǐng)域?qū)W者已經(jīng)意識(shí)到當(dāng)下關(guān)于謠言實(shí)時(shí)識(shí)別的研究較少,但需求緊迫[15]。
依據(jù)對(duì)謠言的知識(shí)關(guān)聯(lián)的分析,結(jié)合對(duì)當(dāng)下信息分發(fā)技術(shù)的考察,筆者認(rèn)為,新生謠言的識(shí)別需要結(jié)合知識(shí)圖譜和標(biāo)簽兩種技術(shù)——知識(shí)圖譜可應(yīng)對(duì)網(wǎng)絡(luò)空間中知識(shí)關(guān)聯(lián)繁復(fù)和更新快速的挑戰(zhàn),標(biāo)簽則可提高知識(shí)數(shù)據(jù)的調(diào)取和更新效率。在新生謠言識(shí)別過(guò)程中,這兩種技術(shù)相輔相成(如圖3所示)。
知識(shí)圖譜是表示知識(shí)發(fā)展進(jìn)程與關(guān)聯(lián)結(jié)構(gòu)的網(wǎng)絡(luò)體系,用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系。其本質(zhì)是語(yǔ)義網(wǎng)絡(luò)(semantic network),即一種用于存儲(chǔ)知識(shí)的數(shù)據(jù)結(jié)構(gòu)。在這個(gè)網(wǎng)絡(luò)中,每個(gè)節(jié)點(diǎn)代表實(shí)體(人名、地名、機(jī)構(gòu)名、概念等),而每個(gè)節(jié)點(diǎn)之間的連線則代表實(shí)體間的關(guān)系。借助知識(shí)圖譜技術(shù),可以建構(gòu)具有復(fù)雜內(nèi)部關(guān)聯(lián)的知識(shí)體系,為新生謠言提供比對(duì)知識(shí)點(diǎn)的依據(jù)。
首先,相比于基于學(xué)科分類(lèi)的傳統(tǒng)知識(shí)分類(lèi)和儲(chǔ)存方式,知識(shí)圖譜有助于突出不同專(zhuān)業(yè)知識(shí)點(diǎn)之間的聯(lián)系,可基于任一知識(shí)點(diǎn)形成網(wǎng)絡(luò)狀、無(wú)限延伸、多個(gè)維度的知識(shí)關(guān)聯(lián),更能適應(yīng)互聯(lián)網(wǎng)空間中大量散在、快速更新的知識(shí)數(shù)據(jù)環(huán)境。
其次,知識(shí)圖譜適合于從非結(jié)構(gòu)化數(shù)據(jù)中轉(zhuǎn)化出結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用場(chǎng)景。例如,從海量文本和圖片中抽取結(jié)構(gòu)化知識(shí)[16]。建構(gòu)知識(shí)圖譜包括三個(gè)步驟:第一步知識(shí)提取,是從特定的文本結(jié)構(gòu)中提取出實(shí)體、關(guān)系、屬性等知識(shí)要素及其間關(guān)聯(lián)關(guān)系;第二步知識(shí)表示,是以深度學(xué)習(xí)為基礎(chǔ)的“分布式表示”,將大規(guī)模散在的知識(shí)點(diǎn)以合理方式關(guān)聯(lián)起來(lái);第三步知識(shí)加工,包括消歧(根據(jù)同一規(guī)范對(duì)不同來(lái)源的知識(shí)進(jìn)行整合),以及推理(根據(jù)已有知識(shí)挖掘隱含知識(shí)關(guān)聯(lián))。概言之,知識(shí)圖譜可以反映海量知識(shí)點(diǎn)之間多維的知識(shí)關(guān)聯(lián),為虛假信息識(shí)別提供更全面的比對(duì)依據(jù)。
標(biāo)簽屬于數(shù)據(jù)庫(kù)技術(shù),實(shí)際上是針對(duì)特定文本或話題的關(guān)鍵詞標(biāo)識(shí)技術(shù)。在目前廣為采用的個(gè)性化信息推薦機(jī)制中,用戶標(biāo)簽和內(nèi)容標(biāo)簽的恰當(dāng)匹配是基礎(chǔ)步驟。在新生謠言識(shí)別中,標(biāo)簽技術(shù)的優(yōu)勢(shì)在知識(shí)儲(chǔ)存和調(diào)取階段都可得到發(fā)揮。在知識(shí)儲(chǔ)存階段,傳統(tǒng)學(xué)科分類(lèi)基于由大到小的主題細(xì)分,而標(biāo)簽技術(shù)支持多維度、多層次的主題區(qū)分。相較于層層嵌套的主題細(xì)分,基于標(biāo)簽技術(shù)的主題區(qū)分可以更高效地響應(yīng)熱點(diǎn)話題帶來(lái)的新類(lèi)型。在知識(shí)調(diào)取階段,人類(lèi)因循學(xué)科分類(lèi)由大到小進(jìn)行主題搜尋,而高速運(yùn)算的程序可依據(jù)標(biāo)簽進(jìn)行遍歷式搜尋。相較于層層向下的主題搜尋,基于標(biāo)簽技術(shù)的遍歷式搜尋可以囊括具有潛在關(guān)聯(lián)的知識(shí)點(diǎn)。簡(jiǎn)言之,標(biāo)簽技術(shù)可以靈活增減話題標(biāo)簽,還可以充分利用知識(shí)圖譜所涵蓋的潛在知識(shí)關(guān)聯(lián)。
本文從健康謠言頻現(xiàn)于網(wǎng)絡(luò)空間的現(xiàn)實(shí)問(wèn)題入手,一方面整合今日頭條算數(shù)中心總結(jié)的健康謠言“套路”和微信公眾號(hào)“謠言過(guò)濾器”判定的年度十大健康謠言案例,另一方面在新聞傳播學(xué)和計(jì)算機(jī)科學(xué)中尋找謠言識(shí)別的理論思路,從對(duì)實(shí)踐的觀察中提出問(wèn)題,在理論成果中尋找解決思路。在分析問(wèn)題的過(guò)程中,采用社會(huì)網(wǎng)絡(luò)分析工具Gephi對(duì)今日頭條謠言庫(kù)的減肥謠言高頻詞團(tuán)進(jìn)行可視化處理,發(fā)現(xiàn)了共現(xiàn)關(guān)系比相似關(guān)系更有助于發(fā)現(xiàn)知識(shí)類(lèi)謠言的常用搭配和關(guān)鍵話題,回應(yīng)了開(kāi)篇提出的第一個(gè)研究問(wèn)題。最后,從規(guī)范性研究的角度,提出結(jié)合知識(shí)圖譜和標(biāo)簽兩項(xiàng)技術(shù)建構(gòu)新生謠言的識(shí)別機(jī)制,回應(yīng)了開(kāi)篇提出的第二個(gè)研究問(wèn)題。
北京郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2020年1期