● 劉靈芝 王孝國(guó) 肖邦明
(1,3,5 華中農(nóng)業(yè)大學(xué)經(jīng)濟(jì)管理學(xué)院 武漢 430070;2,4,6 湖北農(nóng)村發(fā)展研究中心 武漢 430070)
隨著短視頻直播平臺(tái)和微博等新型社交媒體的興起,新型社交媒體逐漸成為人們網(wǎng)上消費(fèi)和獲取信息的重要媒介。以新浪微博為例:2020年9月,新浪微博月活躍用戶為5.11億人次,較2019年9月凈增約1 300萬。2019年《中國(guó)互聯(lián)網(wǎng)發(fā)展報(bào)告》數(shù)據(jù)顯示中國(guó)網(wǎng)絡(luò)零售市場(chǎng)規(guī)模已經(jīng)突破31萬億元。微博作為新型社交媒體,因其具有多元實(shí)時(shí)雙向互動(dòng)的優(yōu)勢(shì),不僅極大地變革了企業(yè)與消費(fèi)者間的互動(dòng)方式,也逐漸演變?yōu)槠髽I(yè)營(yíng)銷的重要平臺(tái)。企業(yè)可以在微博平臺(tái)上收到關(guān)注、點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā)等消費(fèi)者信息反饋,大大提高了信息交流效率。根據(jù)2017年新浪微博企業(yè)白皮書發(fā)布的數(shù)據(jù),其2016年注冊(cè)的微博賬號(hào)已達(dá)130萬?!盎ヂ?lián)網(wǎng)+”時(shí)代的到來正在促使消費(fèi)模式偏好不斷發(fā)生改變。企業(yè)必須適應(yīng)和提前預(yù)測(cè)微博營(yíng)銷的機(jī)制,提升企業(yè)微博互動(dòng)營(yíng)銷的有效性,才能更扎實(shí)地立足于市場(chǎng)。
目前關(guān)于社交媒體的研究主要是研究社交媒體的互動(dòng)內(nèi)容對(duì)網(wǎng)民參與的影響(Castelló et al.,2016;Sundstrom &Levenshus,2017;Gong et al.,2017),也有國(guó)內(nèi)學(xué)者通過社交媒體營(yíng)銷的娛樂性(胡玲,2018)、網(wǎng)絡(luò)口碑(吳敏琦,2013)等研究影響微博營(yíng)銷的因素以及社交媒體的使用意圖。這些研究對(duì)揭示企業(yè)微博如何使用社交媒體吸引消費(fèi)者、與消費(fèi)者進(jìn)行溝通和激勵(lì)提供很多寶貴見解。然而,人們對(duì)社交媒體傳播和消費(fèi)者參與的內(nèi)在影響機(jī)理卻缺乏了解。Aleti等(2019)通過對(duì)推特文本數(shù)據(jù)挖掘得出,不同推特類型主體在社交媒體使用語言風(fēng)格方面具有差異性,因此,更好地了解消費(fèi)者如何對(duì)待品牌信息發(fā)布者發(fā)布微博,以及是什么促使消費(fèi)者頻繁地轉(zhuǎn)發(fā)、點(diǎn)贊和評(píng)論是至關(guān)重要的。
中國(guó)有句俗話“民以食為天”。百度指數(shù)的數(shù)據(jù)顯示,美食在社交媒體上的搜索熱度已經(jīng)超過財(cái)經(jīng)、科技、生活等話題,且搜索熱度不斷上升。此外,與美食相關(guān)的品牌也越來越多,它們對(duì)消費(fèi)產(chǎn)生了很大的影響。然而,目前還沒有關(guān)于消費(fèi)者參與食品品牌互動(dòng)方面的研究,本文希望通過言語行為理論的視角對(duì)社交媒體和消費(fèi)者互動(dòng)的內(nèi)在機(jī)理進(jìn)行研究,對(duì)個(gè)人品牌和產(chǎn)品品牌發(fā)布微博的影響力進(jìn)行預(yù)測(cè),為品牌發(fā)布更具影響力的微博提供科學(xué)指導(dǎo)。以往研究表明,品牌可以控制社交媒體的通信方式和內(nèi)容,但語言的分割差異可能會(huì)在消費(fèi)者中表現(xiàn)出明顯的認(rèn)知效果(Aleti et al.,2019),通過查看關(guān)于語言風(fēng)格元素的微妙變化以及它們?nèi)绾瓮ㄟ^潛意識(shí)影響消費(fèi)者的選擇,我們可能獲得品牌如何構(gòu)建微博影響力預(yù)測(cè)模型的有效見解。因此,本研究以食品領(lǐng)域的企業(yè)微博和相關(guān)網(wǎng)絡(luò)名人微博為對(duì)象,基于機(jī)器學(xué)習(xí)算法和言語行為理論來劃分不同寫作風(fēng)格,以預(yù)測(cè)消費(fèi)者參與社交媒體討論行為(點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā))。
我們的研究是通過觀察用戶對(duì)品牌內(nèi)容生成的參與程度,發(fā)現(xiàn)品牌社交媒體吸引用戶討論的內(nèi)在機(jī)理,為使用社交媒體的公司提供科學(xué)指導(dǎo)。社交媒體的傳播不僅要關(guān)注品牌本身,還應(yīng)該關(guān)注其文本內(nèi)容,從而洞悉品牌應(yīng)如何更好地執(zhí)行其社交媒體傳播策略。文本內(nèi)容是社交媒體用戶進(jìn)行網(wǎng)絡(luò)互動(dòng)的重要載體,大多數(shù)情況下,文本語言在社交媒體中占主導(dǎo)地位,它既可以表達(dá)自己的情緒,也可以向外傳遞信息。以往的研究表明,社交媒體推文的生動(dòng)程度(多媒體手段)、互動(dòng)程度(動(dòng)員方式、號(hào)召性語言、提問和超鏈接)、內(nèi)容的豐富性程度、情感喚起的文字、圖片和視頻材料的使用會(huì)對(duì)用戶的點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā)行為產(chǎn)生正向影響(Ashley &Tuten,2015;青平等,2018;Araujo et al.,2015;Gong et al.,2017)。不僅如此,語言預(yù)期理論(Burgoon &Miller,1985)指出,文本內(nèi)容的外圍要素,如信息發(fā)布者的具體性、嚴(yán)謹(jǐn)性、心理親密性及與觀眾的互動(dòng),會(huì)導(dǎo)致觀眾和訂戶的數(shù)量變化。隨著社交媒體功能的多元化,我們知道非言語交際功能,如表情、圖片、視頻等正在不斷流行和豐富文本內(nèi)容,但是大多數(shù)情況下只能起到對(duì)文本內(nèi)容補(bǔ)充的作用,對(duì)于是否能否定或增強(qiáng)文本內(nèi)容,增加微博影響力傾向還尚未可知。不可否認(rèn)的是,目前非言語交際功能已經(jīng)和文本語言越來越緊密地聯(lián)系在一起。
品牌微博在日常發(fā)布信息過程中使用的語言風(fēng)格可能并不總是在習(xí)慣性思維意識(shí)下產(chǎn)生的,但信息發(fā)布者通過仔細(xì)觀察和分析,可選擇適合自己以及關(guān)注者的風(fēng)格,以此捕捉他們的潛在受眾,來滿足他們的興趣。這些研究對(duì)于認(rèn)識(shí)用戶的點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā)等行為具有非常重要的貢獻(xiàn),對(duì)于微博影響力預(yù)測(cè)模型的構(gòu)建具有十分重要的借鑒作用。目前,多數(shù)文獻(xiàn)將重點(diǎn)放在推文的內(nèi)容和類型上,以了解吸引消費(fèi)者點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā)的原因,而忽略了推文的風(fēng)格。研究將深入探討美食網(wǎng)絡(luò)名人和品牌官方微博的言語行為相關(guān)的語言風(fēng)格元素,即敘事/分析風(fēng)格、內(nèi)部/外部關(guān)注風(fēng)格、積極/消極情感風(fēng)格。
2.2.1 敘事/分析風(fēng)格
社交媒體推文的敘事方式可以分為敘事風(fēng)格和分析風(fēng)格,分析風(fēng)格的微博通常更加注重遵循邏輯來發(fā)布消息,而敘事風(fēng)格的推文更加注重故事的線性發(fā)展。因此,分析風(fēng)格應(yīng)包含對(duì)復(fù)雜組織的對(duì)象和概念的更多引用,而敘事風(fēng)格應(yīng)由更具描述性的單詞組成,例如副詞或輔助動(dòng)詞(Aleti et al.,2019)。“如何說”對(duì)于吸引用戶注意力、激發(fā)好奇心更為關(guān)鍵。這些理論暗示著語言、語氣和魅力,在說服中起著至關(guān)重要的作用。這一觀點(diǎn)擴(kuò)展了心理學(xué)、傳播學(xué)和營(yíng)銷研究,表明敘事是通過注意力、描述和感覺對(duì)說服產(chǎn)生強(qiáng)大影響(Hamby et al.,2015)。以往的證據(jù)表明,與更具分析性和事實(shí)論證的語言風(fēng)格相比,顯現(xiàn)出更強(qiáng)線性敘事風(fēng)格的微博消息往往可以更好地喚起敘事內(nèi)容的傳播,更能帶來故事引人入勝的變革體驗(yàn)(David &Miall,1993)。Allison等(2017)和Van Laer等(2019)發(fā)現(xiàn)社交媒體的說服程度取決于溝通對(duì)故事的講述程度,敘事性的故事講述對(duì)病毒式廣告的傳播具有積極的影響,廣告采用敘事風(fēng)格更有利于消費(fèi)者對(duì)廣告采取積極態(tài)度。然而,在大多數(shù)情況下,在敘事和分析風(fēng)格可以被識(shí)別的基礎(chǔ)上,消費(fèi)者究竟更傾向于哪一種,至今仍未被探索。
2.2.2 內(nèi)部/外部關(guān)注風(fēng)格
社交媒體上的超社會(huì)關(guān)系被描述為消費(fèi)者和品牌建立的友誼感,這種友誼感是在反復(fù)的接觸和互動(dòng)中形成的。由于品牌在某一方面或領(lǐng)域往往具有一定的代表性,再加上在社交媒體上更多的自我披露和曝光,就形成了用戶對(duì)于品牌的一種欽佩,可以激發(fā)自己內(nèi)心的渴望(孟陸等,2020),因此消費(fèi)者和用戶更有可能轉(zhuǎn)發(fā)、評(píng)論和點(diǎn)贊那些表現(xiàn)出更高自信和象征性資本的用戶。Kacewicz(2014)通過文本分析發(fā)現(xiàn),自信由更多的“我們”單詞、社交單詞和更少的“我”單詞表示。也就是說,較高的社會(huì)地位和象征性資本與注重外部風(fēng)格有關(guān),而不是與內(nèi)部注重寫作和演講風(fēng)格有關(guān)。由于名人與消費(fèi)者之間的關(guān)系是不對(duì)稱的,消費(fèi)者似乎更傾向于轉(zhuǎn)推具有外部關(guān)注風(fēng)格的內(nèi)容??梢酝ㄟ^查看作者如何使用功能詞的一種特定選擇來捕獲樣式重點(diǎn):人稱代詞(Cruz et al.,2017)。內(nèi)部聚焦風(fēng)格應(yīng)包含更多的第一人稱單數(shù)代詞,而外部聚焦風(fēng)格應(yīng)包含更多的第二人稱單數(shù)或第一人稱復(fù)數(shù)代詞。
2.2.3 積極/消極情感風(fēng)格
情緒傳染理論(Barsade,2002)指出,影響者的興奮和激情會(huì)產(chǎn)生一種情緒傳染,可能增加意見和訂閱者的數(shù)量(Cohn et al.,2004)。于是我們將關(guān)注點(diǎn)轉(zhuǎn)向第三種語言風(fēng)格元素:情感。積極情緒可以通過諸如“快樂”“興奮”和“激動(dòng)”之類的詞的頻率來捕捉,而消極情緒與諸如“焦慮”“悲劇”和“自私”之類的詞有關(guān)。Rimé(2009)認(rèn)為不管信息的性質(zhì)如何,消費(fèi)者更可能共享以高度激昂的情感方式撰寫的內(nèi)容。一旦觀眾參與模仿行為,他們就會(huì)通過自己內(nèi)部反應(yīng)的生理反饋來體驗(yàn)情緒本身(Breugst et al.,2012)。根據(jù)以往的研究表明,當(dāng)使用情感風(fēng)格的激活度較高(例如,好與不好)或增強(qiáng)(例如,非常好)的單詞時(shí),消費(fèi)者更有可能在網(wǎng)上給出較高的評(píng)分。所以,在社交媒體中,具有更能引起或激發(fā)情緒的風(fēng)格的推文很可能會(huì)被共享。
言語行為理論的概念和相關(guān)實(shí)證研究表明同一條推文中捕獲到的豐富信息,完全有可能觸動(dòng)消費(fèi)者(Austin et al.,1975;Vermunt &Magidson,2016)。為了構(gòu)建更高預(yù)測(cè)精準(zhǔn)度的微博影響力模型,本研究借鑒以往的研究和言語行為理論的相關(guān)概念及實(shí)證研究,編碼了來自食品行業(yè)的236個(gè)產(chǎn)品品牌和個(gè)人品牌的共計(jì)85 858條微博,基于機(jī)器學(xué)習(xí)算法構(gòu)建了食品品牌微博影響力的預(yù)測(cè)模型,并將微博的用戶信息、時(shí)間信息和文本信息進(jìn)行編碼放入微博影響力預(yù)測(cè)模型,很大程度上提高了微博影響力的預(yù)測(cè)準(zhǔn)確率。
微博影響力預(yù)測(cè)的研究涉及領(lǐng)域廣泛,以往的文獻(xiàn)主要分布在公共事件微博影響力的預(yù)測(cè)和政務(wù)微博影響力的預(yù)測(cè)等方面。由研究對(duì)象的不同,微博影響力的研究可以分為以下三種類型:
第一種是有關(guān)微博用戶影響力的研究,例如輿情事件中的意見領(lǐng)袖(Li et al.,2019;Luqiu et al.,2019;Sofya et al.,2019),網(wǎng)絡(luò)社區(qū)中的核心成員等在信息傳播過程中對(duì)于公眾態(tài)度和輿論導(dǎo)向具有顯著影響的微博用戶影響力研究(黃敏學(xué)等,2019;Yi et al.,2018),有關(guān)微博用戶影響力的指標(biāo)包括用戶的粉絲數(shù)、網(wǎng)絡(luò)中心度等,常見的方法是意見領(lǐng)袖識(shí)別方法和社交網(wǎng)絡(luò)算法等。
第二種是關(guān)于微博博文的影響力,例如博文的內(nèi)容形式、情感主題等因素導(dǎo)致微博在社交媒體平臺(tái)上的流行程度(Aleti et al.,2019)、傳播路徑(Zaman et al.,2014)等,主要的指標(biāo)包括微博博文的點(diǎn)贊數(shù)、評(píng)論數(shù)和轉(zhuǎn)發(fā)數(shù),主要的研究方法包括文本挖掘、情感分析等。
第三種是微博話題的影響力,也可以稱之為輿情熱度的相關(guān)研究,是指對(duì)特定主題進(jìn)行討論的微博的影響力研究(安璐等,2019),如事件報(bào)道類、情感表達(dá)類、話題討論類等。
目前,國(guó)內(nèi)外有關(guān)微博影響力研究方興未艾,李軍等(2011)梳理了目前國(guó)內(nèi)關(guān)于微博影響力的研究,提出了關(guān)于微博影響力的評(píng)價(jià)模型;趙阿敏和曹桂全(2014)運(yùn)用因子分析和聚類分析的方法,對(duì)16家省級(jí)政務(wù)微博進(jìn)行了研究,結(jié)果顯示,政務(wù)微博的影響力發(fā)展水平較低,高影響力政務(wù)微博數(shù)量明顯少于低影響力政務(wù)微博數(shù)量,總體來說,政務(wù)微博影響力的分布結(jié)構(gòu)呈“金字塔”狀;安璐等(2019)以恐怖事件為背景,利用多種機(jī)器學(xué)習(xí)模型對(duì)恐怖事件的微博影響力進(jìn)行預(yù)測(cè)研究,結(jié)果表明,微博文本的聚類結(jié)果和情感分析結(jié)果均會(huì)提高微博影響力預(yù)測(cè)模型的預(yù)測(cè)性能。
這些研究對(duì)于人們加深對(duì)微博影響力的了解具有重要貢獻(xiàn),但是研究發(fā)現(xiàn)在市場(chǎng)營(yíng)銷領(lǐng)域,尤其是隨著互聯(lián)網(wǎng)技術(shù)和網(wǎng)絡(luò)經(jīng)濟(jì)的快速發(fā)展,無論個(gè)人品牌還是產(chǎn)品品牌都在依靠吸引粉絲來取得良好的營(yíng)銷效果,如何擴(kuò)大食品品牌微博的影響力對(duì)于品牌網(wǎng)絡(luò)營(yíng)銷的發(fā)展至關(guān)重要。因此,本研究編碼了85 858條食品個(gè)人品牌和產(chǎn)品品牌推文,基于深度機(jī)器學(xué)習(xí)和言語行為理論從微博文本的表達(dá)風(fēng)格入手,從品牌微博中挖掘出影響微博影響力的證據(jù),確定影響微博影響力的重要特征,為個(gè)人品牌和產(chǎn)品品牌預(yù)測(cè)微博影響力,發(fā)布更具影響力的微博提供理論指導(dǎo)。
本研究選擇了兩類微博品牌用戶:個(gè)人品牌(美食博主)和產(chǎn)品品牌(食品品牌官方微博)。兩類微博的明顯區(qū)別在于,個(gè)人主頁(yè)是黃色微博認(rèn)證而企業(yè)主頁(yè)則是藍(lán)色微博認(rèn)證。之所以選擇與食品相關(guān)的個(gè)人品牌和產(chǎn)品品牌,是因?yàn)槭称肥巧缃幻襟w上討論熱度最高的話題之一,這些社交媒體的存在對(duì)食品消費(fèi)產(chǎn)生很大的影響(Cahillane,2015)。
本研究使用Octopus 8.0軟件程序從236個(gè)個(gè)人品牌和產(chǎn)品品牌主頁(yè)收集微博。產(chǎn)品品牌(食品品牌官方微博)的研究樣本選自中國(guó)品牌網(wǎng)食品行業(yè)不同類別產(chǎn)品的品牌榜、人氣榜中排名前十位的企業(yè),并將未開通微博賬戶的品牌進(jìn)行手動(dòng)刪除;個(gè)人品牌(美食博主)的樣本通過關(guān)鍵詞搜索后,選取微博粉絲數(shù)量前100位的個(gè)人賬戶進(jìn)行數(shù)據(jù)抓取。研究?jī)H抓取用戶的原創(chuàng)博文,對(duì)于轉(zhuǎn)發(fā)內(nèi)容不予抓取,這樣可以更加明確每個(gè)賬戶如何發(fā)布自己的內(nèi)容。由于不同用戶發(fā)布的原始微博數(shù)量不同,研究從每個(gè)賬戶中提取的微博數(shù)也各不相同,其中發(fā)布微博最多的為161 730條,最少為109條。從中提取出相應(yīng)的微博特征,包括用戶信息特征(用戶ID、粉絲數(shù)、發(fā)布微博總數(shù)、關(guān)注微博數(shù)量、微博認(rèn)證信息、商品櫥窗信息、成長(zhǎng)速度、成長(zhǎng)值、陽光信用評(píng)級(jí)、所在地、用戶標(biāo)簽等)和博文信息特征(博文全文、圖片數(shù)、視頻時(shí)長(zhǎng)、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)、評(píng)論內(nèi)容、點(diǎn)贊數(shù)、發(fā)博時(shí)間、發(fā)博客戶端等)。
為了更加直觀地展現(xiàn)出各微博特征的影響力傾向,本研究對(duì)各微博特征進(jìn)行了影響力傾向的測(cè)算,采用安璐等(2019)提出的微博影響力傾向測(cè)算指標(biāo)。影響力傾向是指在某一指標(biāo)下高影響力微博占比與總體高影響力微博占微博總數(shù)的比例之差,反映了在某一特征指標(biāo)下微博影響力的高低占比情況,微博影響力傾向的計(jì)算方式如式(1)所示:
(1)
其中I(fi)表示指標(biāo)i的影響力傾向,它等于指標(biāo)i下高影響力微博的數(shù)量比指標(biāo)i下總體微博數(shù)量,減去總數(shù)據(jù)集中高影響力微博的數(shù)量比總數(shù)據(jù)集中微博數(shù)量。I(fi)大于零表示指標(biāo)i具有高影響力傾向,I(fi)小于零則表示具有低影響力傾向,I(fi)的絕對(duì)值越大,表明影響力傾向越明顯。
本研究通過R 3.6.2程序軟件中的jiebaR 3.0中文分詞程序包,對(duì)抓取的微博全文進(jìn)行思維分析。思維分析是一種基于標(biāo)準(zhǔn)功能詞典的捕捉敘事、分析風(fēng)格的常用方法,思維分析結(jié)果反映了文本包含的敘事和分析風(fēng)格的程度(James et al.,2015)。研究表明,更多地使用介詞以及對(duì)復(fù)雜對(duì)象和概念的引用會(huì)獲得更高的風(fēng)格得分,代表更強(qiáng)的分析風(fēng)格(Biber,1991),而更多地使用副詞、助動(dòng)詞、連詞、否定詞和人稱代詞會(huì)獲得更低的風(fēng)格得分,代表更強(qiáng)的敘事風(fēng)格(Jurafsky &Martin,2009;Raphael et al.,2018;Taecharungroj,2016)。
本研究使用R 3.6.2程序軟件中的jiebaR 3.0中文分詞程序包,對(duì)抓取的微博全文進(jìn)行關(guān)注風(fēng)格分析。根據(jù)標(biāo)準(zhǔn)功能詞典,內(nèi)外部關(guān)注風(fēng)格分析反映了文本中包含的內(nèi)部和外部聚焦程度(Kacewicz et al.,2014)。根據(jù)以往研究,第一人稱單數(shù)代詞(我)的使用越多,內(nèi)外部關(guān)注風(fēng)格的分?jǐn)?shù)越低,代表內(nèi)部關(guān)注風(fēng)格越強(qiáng)(Kacewicz et al.,2014),第二人稱單數(shù)代詞(您)和第一人稱復(fù)數(shù)代詞(我們)的使用越多,內(nèi)外部關(guān)注風(fēng)格的分?jǐn)?shù)越高,代表外部關(guān)注風(fēng)格越強(qiáng)(Kacewicz et al.,2014)。
本研究使用R 3.6.2程序軟件中的jiebaR 3.0中文分詞程序包和中科院NLPIR-ICTCLAS漢語分詞系統(tǒng),對(duì)抓取的微博全文進(jìn)行情緒風(fēng)格分析。基于正面(例如,喜歡、偏愛、美好等)和負(fù)面(例如,討厭、丑陋、傷害等)情感詞典,分析文本中包含的正負(fù)面情緒風(fēng)格的程度(Pennebaker et al.,2014)。根據(jù)以往研究,消極情緒詞尤其是高度消極情緒詞的使用越多,情緒風(fēng)格得分越低,代表更高的負(fù)面情緒風(fēng)格(Cohn et al.,2004),積極情緒詞尤其是高度積極情緒詞的使用越多,情緒風(fēng)格得分越低,代表更高的正面情緒風(fēng)格(Cohn et al.,2004)。以往的研究證明,NLPIR-ICTCLAS漢語分詞系統(tǒng)有著非常完善的情緒分析標(biāo)準(zhǔn)詞典和很高的情緒分析效率。
除了微博文本的風(fēng)格特征外,我們還對(duì)文本主題進(jìn)行挖掘,為了將微博劃分為合理的主題數(shù)量,首先通過LDA文檔主題生成模型對(duì)文本向量進(jìn)行聚類,劃分10~20個(gè)主題,得到文本主題的特征詞語,隨后對(duì)不同聚類中的詞語進(jìn)行重要程度排序,并通過觀察進(jìn)行歸類,形成文本主題(節(jié)日推文、美食推薦、產(chǎn)品宣傳、參與抽獎(jiǎng)、美食教程、明星代言、促銷打折、話題討論、心靈雞湯、養(yǎng)生健康)。
本研究還從用戶信息、時(shí)間信息、文本信息三方面入手采集了微博用戶的粉絲等級(jí)特征、活躍度特征(用戶的發(fā)博頻率和關(guān)注的賬戶數(shù))、認(rèn)證類型特征(個(gè)人品牌為黃色認(rèn)證、產(chǎn)品品牌為藍(lán)色認(rèn)證)、發(fā)布時(shí)段信息、字符長(zhǎng)度、圖片和視頻的使用情況。
為了對(duì)變量指標(biāo)的效度進(jìn)行驗(yàn)證,本研究在確保選中每個(gè)微博賬戶的前提下,隨機(jī)抽取60條博文,并提取每個(gè)變量的得分,在實(shí)驗(yàn)人員的指導(dǎo)下,培訓(xùn)40位不熟悉研究目的獨(dú)立編碼者,要求編碼者將每條推文分為“敘事風(fēng)格”和“分析風(fēng)格”、“內(nèi)部關(guān)注風(fēng)格”和“外部關(guān)注風(fēng)格”、“積極情緒”和“消極情緒”。結(jié)果表明,40位編碼者正確分類推文敘事/分析風(fēng)格的平均概率是90.38%;正確分類推文內(nèi)部/外部關(guān)注風(fēng)格的平均概率為89.54%;正確分類積極/消極情緒風(fēng)格的平均概率為93.41%??傮w而言,編碼者正確分類91.11%的博文類型,這個(gè)概率介于人員編碼和自動(dòng)文本分析之間(Krippendorff,2018)。總之,編碼人員的嚴(yán)格驗(yàn)證證明研究的自動(dòng)化文本分析方式是可行的。
本研究使用Octopus 8.0自動(dòng)爬蟲程序從新浪微博平臺(tái)采集了236個(gè)個(gè)人品牌和產(chǎn)品品牌的全部原創(chuàng)微博共計(jì)85 858條作為實(shí)驗(yàn)數(shù)據(jù)。使用RGUI3.6.3程序軟件的tm、NLP等程序包對(duì)采集到的微博文本進(jìn)行文本清洗、分詞處理、情感分析和風(fēng)格分析得到微博的特征數(shù)據(jù),使用weka數(shù)據(jù)挖掘平臺(tái)、隨機(jī)森林算法對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行挖掘。結(jié)合以往研究和本次實(shí)驗(yàn)的數(shù)據(jù)分布,本研究將微博影響力高低的閾值設(shè)置為20,即微博的點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā)數(shù)之和大于20的定義為高影響力微博,為了避免高影響力微博和低影響力微博過于接近,本研究將點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā)數(shù)之和低于5的微博定義為低影響力微博,其中高影響力微博67 294條,低影響力微博11 390條。
隨后,本研究利用weka數(shù)據(jù)挖掘平臺(tái)對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行微博影響力預(yù)測(cè)模型構(gòu)建,使用十折交叉檢驗(yàn)方式對(duì)預(yù)測(cè)模型的性能進(jìn)行驗(yàn)證和選擇,模型預(yù)測(cè)結(jié)果的性能主要由Precision、Recall、F-measure、ROC Area等指標(biāo)進(jìn)行度量。為了構(gòu)建最佳的微博影響力預(yù)測(cè)模型,本研究采用了多種機(jī)器學(xué)習(xí)算法進(jìn)行模型構(gòu)建,包括貝葉斯網(wǎng)絡(luò)(BN)、J48決策樹(J48)、隨機(jī)森林(RF)、隨機(jī)樹(RT)、樸素貝葉斯(NB)、決策樹(DT)、裝袋算法(Bagging)等機(jī)器學(xué)習(xí)算法,各算法模型的預(yù)測(cè)效果如表1所示。
表1 各算法模型的預(yù)測(cè)效果
由表中各算法性能結(jié)果比較可以看出,隨機(jī)森林算法(RF)的預(yù)測(cè)準(zhǔn)確率(Precision)為0.856,比J48決策樹和Bagging提高了0.1個(gè)百分點(diǎn),比貝葉斯網(wǎng)絡(luò)提高了1.9個(gè)百分點(diǎn),比隨機(jī)樹提高了1.8個(gè)百分點(diǎn);在召回率(Recall)上比貝葉斯網(wǎng)絡(luò)算法等其他算法高出1個(gè)百分點(diǎn)以上,在ROC Area上也比其他算法有所提升,因此,隨機(jī)森林算法的整體預(yù)測(cè)效果更佳。
如表2所示,結(jié)果表明,實(shí)驗(yàn)數(shù)據(jù)中有低影響力微博11 390條,高影響力微博67 294條,其中有8 232條低影響力微博和60 820條高影響力微博被正確分類,3 158條低影響力微博被錯(cuò)配到高影響力微博,6 474條高影響力微博被錯(cuò)配到低影響力微博,因此,低影響力微博分類的準(zhǔn)確率為72.27%,高影響力微博分類的準(zhǔn)確率為90.37%,預(yù)測(cè)模型的總體準(zhǔn)確率為87.37%。該模型的預(yù)測(cè)準(zhǔn)確率高于安璐等(2017)恐怖事件的微博影響力預(yù)測(cè)模型的準(zhǔn)確率85.7%。
表2 隨機(jī)森林算法的混淆矩陣
為了探究各個(gè)微博特征的重要性程度,本研究構(gòu)建了若干個(gè)隨機(jī)森林特征缺失模型,用于表示當(dāng)模型缺失某項(xiàng)微博特征時(shí),微博影響力預(yù)測(cè)模型的準(zhǔn)確率損失值,損失值越大,表明在缺少某項(xiàng)特征時(shí)模型的準(zhǔn)確率下降幅度越大,說明該項(xiàng)微博特征越重要,微博特征相對(duì)重要程度的計(jì)算公式如下:
Sigi=ln [EHRF+ELRF-(Ehi+Eli)]
(2)
Sigi表示特征i的相對(duì)重要程度,EHRF表示整體隨機(jī)森林模型中低影響力微博被錯(cuò)分到高影響力微博的個(gè)數(shù),ELRF表示高影響力微博被錯(cuò)分到低影響力微博的個(gè)數(shù);Ehi表示在缺失特征i的模型中低影響力微博被錯(cuò)分到高影響力微博的個(gè)數(shù),Eli表示高影響力微博被錯(cuò)分到低影響力微博的個(gè)數(shù),結(jié)果如圖1所示。
圖1 各微博特征的相對(duì)重要程度
由實(shí)驗(yàn)結(jié)果可見,用于預(yù)測(cè)的8個(gè)微博特征中缺失任何一個(gè)都會(huì)對(duì)預(yù)測(cè)模型的準(zhǔn)確率造成負(fù)面影響,因此本研究認(rèn)為實(shí)驗(yàn)中所采用的所有微博特征對(duì)于預(yù)測(cè)食品品牌微博影響力都是必要的。隨機(jī)森林算法的分類器特點(diǎn)是單個(gè)特征對(duì)于總體模型的影響會(huì)在模型構(gòu)建的過程中被相對(duì)弱化,因此實(shí)驗(yàn)中缺失的微博特征對(duì)模型準(zhǔn)確率造成的負(fù)面影響比實(shí)際數(shù)值可能會(huì)更大,這更能說明實(shí)驗(yàn)中采取的微博特征都是十分必要的。
另外,從圖1不難看出,在各微博特征中,微博用戶的活躍度信息和文本主題缺失對(duì)于整體模型準(zhǔn)確率的負(fù)面影響最大,其次是用戶粉絲信息、情感風(fēng)格、敘事/分析風(fēng)格和內(nèi)外部關(guān)注風(fēng)格,說明在預(yù)測(cè)模型中添加文本的風(fēng)格特征和文本主題非常重要。
為了進(jìn)一步探究食品品牌發(fā)布的高影響力微博的特點(diǎn),本研究使用安璐等(2017)提出的關(guān)于測(cè)量微博特征影響力傾向的方法。該指標(biāo)主要是通過統(tǒng)計(jì)某一特征情況下的高影響力微博所占比重,減去總的高影響力微博在總微博數(shù)中所占的比重,以此來表示微博特征的影響力傾向,計(jì)算方法如公式(1)所示。根據(jù)公式得到所有微博特征的影響力傾向如表4所示,分別基于用戶信息、文本信息、時(shí)間信息對(duì)微博特征的影響力傾向進(jìn)行分析。
表4 微博特征的影響力傾向
續(xù)表特 征特征值影響力傾向文本信息文本內(nèi)容文本風(fēng)格文本主題字符長(zhǎng)度50以下0.002高50~1000.017高100~1500.110高150以上0.156高是否使用圖片是0.202高否-0.032低是否使用視頻是0.098高否-0.040低敘事/分析風(fēng)格敘事-0.041低分析-0.024低內(nèi)部/外部關(guān)注風(fēng)格內(nèi)部-0.012低外部0.091高積極/消極情感風(fēng)格積極0.017高消極0.037高中性0.055高節(jié)日推文0.021高美食推薦0.126高產(chǎn)品宣傳-0.061低參與抽獎(jiǎng)0.105高美食教程0.216高明星代言0.311高促銷打折0.024高話題討論-0.038低心靈雞湯-0.058低養(yǎng)生健康0.102高時(shí)間信息發(fā)布時(shí)段00:01—6:00 深夜0.105高6:01—8:30 清晨-0.140低8:31—12:00 上午-0.008低12:01—14:00 中午0.084高14:01—18:00 下午-0.008低18:01—24:00 晚上0.124高
(1)用戶信息。實(shí)驗(yàn)結(jié)果顯示,粉絲數(shù)等級(jí)越高,微博影響力傾向就越高;食品企業(yè)微博中個(gè)人品牌相對(duì)于產(chǎn)品品牌在網(wǎng)民中具有更高的影響力傾向;用戶活躍度主要通過總發(fā)博量和關(guān)注數(shù)來體現(xiàn),一般總發(fā)博量越多,越容易使信息為用戶捕捉到,從而為關(guān)注和點(diǎn)贊量增加可能性,微博影響力傾向就越高。
(2)文本信息。在文本結(jié)構(gòu)特征中,簡(jiǎn)短的推文很難敘述詳細(xì)的故事,出現(xiàn)情緒高漲或劇情急劇轉(zhuǎn)變,一般而言字符長(zhǎng)度越長(zhǎng),影響力傾向越高;使用圖片或者視頻的微博,相對(duì)于簡(jiǎn)單的微博條文而言更容易被網(wǎng)民關(guān)注;具有敘事和分析風(fēng)格的推文并未產(chǎn)生正向的影響力傾向;外部關(guān)注風(fēng)格微博的影響力傾向高于內(nèi)部關(guān)注風(fēng)格微博;不同文本情感的微博影響力傾向均較高,這說明微博用戶的情感是多樣性的,能夠引起網(wǎng)民廣泛的參與熱情。但是,相對(duì)于情緒化的文本風(fēng)格,網(wǎng)民更愿意參與探討具有消極情緒的微博,對(duì)于食品企業(yè)微博而言,消極情感的文本更容易受到關(guān)注。從主題分類來看,美食推薦、美食教程、養(yǎng)生健康類等與食品密切相關(guān)的微博影響力較高,同時(shí)我們發(fā)現(xiàn),明星代言和設(shè)置轉(zhuǎn)發(fā)抽獎(jiǎng)等微博也會(huì)產(chǎn)生較高的微博影響力。
(3)時(shí)間信息。時(shí)間特征下的發(fā)布時(shí)間段,以日為周期,按照微博用戶的規(guī)律作息,一天24小時(shí)分為6個(gè)時(shí)段。通過實(shí)驗(yàn)可以發(fā)現(xiàn),不同時(shí)間段的微博影響力傾向具有明顯差異,中午、晚上、深夜時(shí)間段發(fā)布微博的影響力傾向高,上午和下午以及清晨時(shí)間段發(fā)布微博的影響力傾向低??傮w而言,在微博發(fā)布的過程中,影響力傾向數(shù)值體現(xiàn)了網(wǎng)民的生活習(xí)慣,合理計(jì)劃發(fā)布微博時(shí)間也是極為重要的。
本文采用基于深度機(jī)器學(xué)習(xí)和言語行為理論的食品品牌微博影響力預(yù)測(cè)模型,通過對(duì)品牌發(fā)布的微博進(jìn)行編碼放入微博影響力預(yù)測(cè)模型,構(gòu)建了若干個(gè)隨機(jī)森林特征缺失模型,發(fā)現(xiàn)各微博特征均會(huì)對(duì)預(yù)測(cè)模型的準(zhǔn)確性產(chǎn)生積極影響。具體而言,對(duì)于食品企業(yè),微博影響力的重要因素從高到低依次為:活躍度信息、文本主題、用戶粉絲信息、文本風(fēng)格、時(shí)間信息、認(rèn)證信息。
通過言語行為理論的視角,具體展示了語言風(fēng)格如何影響消費(fèi)者。首先對(duì)于食品品牌而言,重點(diǎn)必須放在外部,這個(gè)結(jié)果符合Aleti等(2019)認(rèn)為消費(fèi)者很可能轉(zhuǎn)發(fā)外部關(guān)注的推文,以此增強(qiáng)與品牌的社交關(guān)系。其次最常見的推文類型未必是最有效的口碑或形成較高的影響力,例如敘事風(fēng)格推文在食品企業(yè)是最常見的,但是并沒有產(chǎn)生顯著的正向影響力傾向。關(guān)于情感風(fēng)格,對(duì)于食品企業(yè)而言,負(fù)面的信息更容易引起討論和關(guān)注以及轉(zhuǎn)發(fā),網(wǎng)民普遍認(rèn)為它們?cè)谂袛嗪蜎Q策時(shí)有更強(qiáng)的參考價(jià)值。文本主題特征是微博內(nèi)容的細(xì)分特征,從主題分類來看與美食相關(guān)的微博特征會(huì)產(chǎn)生明顯的影響力傾向,不僅如此,促銷打折、明星代言、設(shè)置轉(zhuǎn)發(fā)抽獎(jiǎng)等較高影響力傾向的微博類型表明品牌與消費(fèi)者的互動(dòng)手段正在不斷多元化。
一般來說,食品品牌微博中個(gè)人認(rèn)證類型相對(duì)于企業(yè)認(rèn)證類型在網(wǎng)民中具有更高的影響力傾向。品牌微博在發(fā)布的過程中應(yīng)保證微博發(fā)布頻率和質(zhì)量,才容易使信息落在用戶的視覺帶,從而增加粉絲量和點(diǎn)贊量,提升微博影響力傾向。圖片和視頻通常來說承載更加豐富的信息,相比文字而言具有更強(qiáng)的感性認(rèn)知,網(wǎng)民可以通過自己的觀察提煉出核心內(nèi)容,使記憶更加深刻?!?020微博用戶發(fā)展報(bào)告》顯示,中午和晚上是微博用戶活躍度最高的時(shí)段,我們的研究也證實(shí)了,相對(duì)來說中午和晚上發(fā)布的微博影響力高于其他時(shí)段。
目前有關(guān)食品企業(yè)社交媒體營(yíng)銷的研究尚很匱乏,以往的研究多是關(guān)于社交媒體傳播的內(nèi)容和意圖。本研究豐富了食品品牌社交媒體與消費(fèi)者互動(dòng)的內(nèi)在機(jī)理研究,通過分析食品行業(yè)在網(wǎng)絡(luò)營(yíng)銷領(lǐng)域的信息交流行為,基于言語行為理論對(duì)食品企業(yè)微博的特征進(jìn)行分析,利用機(jī)器學(xué)習(xí)技術(shù)對(duì)食品行業(yè)進(jìn)行影響力預(yù)測(cè),提供了更細(xì)微的推文特征和結(jié)構(gòu),對(duì)于揭示消費(fèi)者在食品營(yíng)銷領(lǐng)域的關(guān)注點(diǎn)、行為方面具有重要的意義,展示了不同的微博文本特征、主題和風(fēng)格是否會(huì)對(duì)消費(fèi)者互動(dòng)產(chǎn)生積極影響,對(duì)于食品行業(yè)的網(wǎng)絡(luò)名人合理地預(yù)見并且有計(jì)劃地開展網(wǎng)絡(luò)營(yíng)銷工作,科學(xué)地發(fā)布微博具有重要的意義,有助于他們更好地執(zhí)行社交媒體傳播的策略。
研究表明,文本主題、語言風(fēng)格、認(rèn)證信息和時(shí)間信息等都會(huì)對(duì)食品企業(yè)微博影響力傾向產(chǎn)生影響。換句話說,食品品牌微博發(fā)布者需要關(guān)注網(wǎng)民所關(guān)注的點(diǎn),學(xué)會(huì)用網(wǎng)民感興趣的方式與他們交流。在營(yíng)銷實(shí)踐中,食品企業(yè)品牌在微博內(nèi)容發(fā)布方面應(yīng)嘗試采用不同的手段:明星代言、發(fā)布促銷打折信息、參與轉(zhuǎn)發(fā)抽獎(jiǎng)等,并且選擇合適的發(fā)博時(shí)間,符合網(wǎng)民的日常生活規(guī)律和使用習(xí)慣;同時(shí)要提高微博發(fā)布頻率,增加網(wǎng)民對(duì)于產(chǎn)品信息的接受頻率。我們的研究表明,個(gè)人品牌的美食博主相對(duì)于企業(yè)微博影響力傾向更高,在網(wǎng)民眼中個(gè)人品牌博主具有客觀性并且?guī)в小熬W(wǎng)絡(luò)名人效應(yīng)”,大眾更樂意接受個(gè)人品牌的評(píng)價(jià),所以食品企業(yè)還要多與個(gè)人品牌進(jìn)行合作,聯(lián)合進(jìn)行產(chǎn)品宣傳,能獲得更高的產(chǎn)品關(guān)注度和更好的產(chǎn)品態(tài)度。對(duì)于食品品牌微博寫作風(fēng)格方面,應(yīng)優(yōu)先考慮外部關(guān)注風(fēng)格,因?yàn)樾枰ㄟ^傳遞自身的感受或者信息來影響他人的選擇;品牌微博合理使用帶有負(fù)面情緒的推文可以增加受眾的關(guān)注、評(píng)論或者轉(zhuǎn)發(fā),從而產(chǎn)生“負(fù)面信息效應(yīng)”。
本研究還存在如下局限,希望在未來進(jìn)一步完善:
首先,微博特征的劃分結(jié)構(gòu)仍需要加以補(bǔ)充,例如文本風(fēng)格方面的二分法的推文類型過于單一,隨著微博功能的多元化和品牌官微作用的多元化,未來可以通過對(duì)相關(guān)變量進(jìn)行聚類分析,嘗試將微博劃分成不同文本風(fēng)格組合,做進(jìn)一步的補(bǔ)充。
其次,發(fā)博時(shí)間以日為周期仍然過于單一,增加對(duì)工作日/節(jié)假日或者以周/月為周期的研究等。
最后,隨著社交媒體形式的豐富,擴(kuò)寬社交媒體平臺(tái)的研究范圍很有必要。當(dāng)然,如果我們需要著重研究某種產(chǎn)品或者某個(gè)企業(yè),未來可以更多地圍繞產(chǎn)品屬性展開,結(jié)合某種產(chǎn)品的特性進(jìn)行具體研究。