張新香 趙彩霞
摘要:[目的/意義]探究影響電影微博互動效果的隱藏主題能發(fā)掘用戶關(guān)注的熱點(diǎn)問題,為企業(yè)提供有效的營銷策略。[方法/過程]從新浪微博上爬取2017年上映的123部電影的熱門微博,采用主題建模方法挖掘電影微博文本中的隱藏主題,利用回歸方法分析隱藏主題對電影微博互動效果的影響。 [結(jié)果/結(jié)論]結(jié)果發(fā)現(xiàn)6個可解釋主題:電影人物、電影宣傳、互動營銷、電影內(nèi)容、電影評價(jià)和線下活動,其中電影宣傳、互動營銷、電影內(nèi)容和電影評價(jià)4個主題正向影響電影微博的互動效果;同時發(fā)現(xiàn)用戶粉絲數(shù)和話題討論熱度正向影響電影微博的互動效果。
關(guān)鍵詞:電影微博? ? 互動效果? ? 主題模型? ? LDA
分類號:G206
DOI:10.13266/j.issn.2095-5472.2020.027
引用格式:張新香, 趙彩霞. 影響電影微博互動效果的隱藏主題探究方法及應(yīng)用[J/OL]. 知識管理論壇, 2020, 5(5): 283-291[引用日期]. http://www.kmf.ac.cn/p/223/.
微博作為新媒體時代的網(wǎng)絡(luò)社交平臺,因具有互動性、公開性、便捷性等優(yōu)點(diǎn)[1]得到了千萬網(wǎng)民的喜愛,發(fā)展迅速。同時微博平臺因其短小而豐厚、平等而互動、快速而價(jià)優(yōu)等優(yōu)勢[2]也得到眾多企業(yè)青睞,其中就包括影視企業(yè)?!?018年度微博電影白皮書》報(bào)告顯示,2018年82部票房過億的電影,100%開通了官方微博,全年累計(jì)電影閱讀點(diǎn)評總量達(dá)568億[3]。事實(shí)數(shù)據(jù)說明微博平臺擁有海量的用戶,同樣正成為影視企業(yè)進(jìn)行產(chǎn)品營銷的重要平臺。
企業(yè)微博營銷效果的一個重要衡量指標(biāo)是微博的互動效果[4],即微博所引發(fā)用戶的點(diǎn)贊、轉(zhuǎn)發(fā)和評論的數(shù)量,故分析電影微博互動效果的影響因素是重要且有意義的。影響微博互動效果的因素有很多,其中,微博主題是一個較難獲取和分析的因素,而用戶往往對關(guān)注度高的主題有更強(qiáng)的互動意愿。鑒于此,本文嘗試找出電影微博中的隱藏主題及其對互動效果影響的一種方法?;谘芯堪l(fā)現(xiàn),為各影視企業(yè)進(jìn)行微博營銷提供實(shí)踐指導(dǎo)。
1? 文獻(xiàn)綜述
關(guān)于影響微博互動效果的探究,席林娜等[5]從情感、時間線、粉絲數(shù)等方面研究影響微博互動效果的因素,結(jié)果表明情感和粉絲數(shù)對微博的互動效果影響顯著,而時間線對微博的互動效果影響不顯著;陳姝等[6]結(jié)合“理性行為”原理探究微博中用戶參與互動的原因,研究發(fā)現(xiàn)微博用戶的興趣、個人影響力、微博活躍程度等顯著影響互動效果,而微博文本的表達(dá)形式對互動效果影響不明顯;謝正霞[7]認(rèn)為微博用戶的粉絲數(shù)量正向影響互動效果,并根據(jù)這種關(guān)系得出使某一微博的互動效果達(dá)到一定程度的最佳粉絲數(shù)量;周慶山等[8]將微博中的精英用戶分為:商業(yè)明星、娛樂明星和文化明星,探究他們是否對用戶的互動意愿產(chǎn)生不同的影響,結(jié)果表明娛樂明星引起用戶的互動意愿最強(qiáng)烈,其次是商業(yè)明星,最后是文化明星;陳娟等[9]基于政務(wù)微博數(shù)據(jù),以轉(zhuǎn)發(fā)和評論數(shù)作為微博互動效果的測量指標(biāo),探究影響辟謠微博互動效果的因素,結(jié)果發(fā)現(xiàn)謠言的方式和類型、微博的原創(chuàng)性、圖片的數(shù)量、微博的互動意愿等對互動效果有顯著影響;魏萌等[10]以點(diǎn)贊數(shù)和轉(zhuǎn)發(fā)數(shù)作為互動效果的測量指標(biāo),探究“網(wǎng)紅”微博內(nèi)容的特征及其對互動效果的影響,結(jié)果表明不同類型的“網(wǎng)紅”的受歡迎程度不同,且微博內(nèi)容在互動性、豐富性、娛樂性和生動性上明顯不同;S. Wu和J. M. Hofman 等[11]研究了Twitter 上不同用戶所發(fā)布微博的互動程度,將Twitter用戶分為2個等級:一般用戶與精英用戶,研究表明精英用戶所發(fā)布的微博更容易引起其他用戶的互動;M. Cha和F. Benevenuto等[12]在探究Twitter中信息的流行時發(fā)現(xiàn)已經(jīng)認(rèn)證過的博主所發(fā)布的文章更容易引起轉(zhuǎn)發(fā);L. Zhanglun和T. Q. Pengtaiquan 等[13]在探究影響微博互動效果的因素時發(fā)現(xiàn)文本長度對互動效果的影響顯著,即較長微博文本能夠促進(jìn)傳播的廣度和速度; J. So和A.Prestin 等[14] 以轉(zhuǎn)發(fā)數(shù)作為微博的互動效果的評測指標(biāo),探究了肥胖在 Twitter中的普遍觀念和態(tài)度,結(jié)果表明貶損內(nèi)容比非貶損能夠更能引起用戶的轉(zhuǎn)發(fā)與關(guān)注,且具有幽默性的微博內(nèi)容也容易引起用戶的轉(zhuǎn)發(fā)與關(guān)注;A. Soboleva和S. Burton等[15]用轉(zhuǎn)發(fā)數(shù)作為微博的互動效果的評測指標(biāo),分析了影響轉(zhuǎn)發(fā)數(shù)的關(guān)鍵因素,結(jié)果表明賬號的使用時長、好友數(shù)量以及博主的粉絲數(shù)量影響轉(zhuǎn)發(fā)數(shù),而微博文本中的標(biāo)簽和URL超鏈接對轉(zhuǎn)發(fā)數(shù)的影響不顯著。
從國內(nèi)外研究現(xiàn)狀上來看,學(xué)者們主要以微博的轉(zhuǎn)發(fā)、評論等數(shù)據(jù)作為互動效果的測量指標(biāo),圍繞信源、信息內(nèi)容和信息接收者等方面探究微博互動效果的影響因素,而從信息內(nèi)容維度出發(fā)探索微博互動效果的影響因素時,多從內(nèi)容的組成形式和內(nèi)容情感等方面進(jìn)行探究,鮮有人探究微博內(nèi)容中的隱藏主題對互動效果的影響。對于電影微博領(lǐng)域,更是少有研究探討主題對微博互動效果的影響。為了彌補(bǔ)上述缺陷,本文嘗試找出電影微博中的隱藏主題及其對互動效果影響的一種方法?;谘芯堪l(fā)現(xiàn),為各影視企業(yè)進(jìn)行微博營銷提供實(shí)踐指導(dǎo)。
2? 影響電影微博互動效果隱藏主題的研究方法
本文嘗試結(jié)合LDA和多層回歸模型探究電影微博中的隱藏主題及其對互動效果的影響。LDA模型是一種常見的主題模型,能夠有效識別短文本數(shù)據(jù)中的隱藏主題[16],而多層回歸模型能夠分析多個層級的影響因素對互動效果的影響[17]。
2.1? LDA
LDA是一種詞袋模型,假設(shè)一篇文檔由一組詞組成,詞和詞之間沒有先后關(guān)系,文檔中潛在的主題將詞和文檔關(guān)聯(lián)起來,即一個文檔由一組不同概率的主題組成,一個主題由一組不同概率的詞組成。在LDA中,文檔中的詞是已知的,主題是未知的,根據(jù)已知的詞和文本的生成規(guī)則,LDA通過概率推測來完成參數(shù)估計(jì)。LDA生成文本的規(guī)則如下:
抽取文檔d中所有主題的分布關(guān)系θd~ Dir(α),Dir(α)是參數(shù)為α的Dirichlet分布,θd是文檔-主題的Multinomial分布;
抽取一個具體的主題zdn ~ θd;
抽取主題zdn中所有詞的分布關(guān)系φk~ Dir(β),Dir(β)是參數(shù)為β的Dirichlet分布,φk是主題-詞的Multinomial分布;
抽取一個具體的詞wdn ~ φk。
重復(fù)上述步驟,不斷迭代直到最終形成文檔。若文檔集中一共有T個主題,則各個主題在文檔d中的分布概率可以表示為一個T維向量,這個T維向量滿足。
文檔中詞和主題間的聯(lián)合概率分布見公式(1):
其中w表示文檔中的詞語。
2.2? 回歸方法
本文使用回歸分析來檢查隱藏主題的解釋能力。一條微博接收到的轉(zhuǎn)發(fā)數(shù)量、點(diǎn)贊數(shù)量、評論數(shù)量和用戶關(guān)注數(shù)量越多,表示其引發(fā)的互動效果越強(qiáng)烈。在微博平臺上,每條微博下面顯示有微博被用戶轉(zhuǎn)發(fā)、點(diǎn)贊和評論的數(shù)量,而某一條微博吸引的新的粉絲數(shù)是不確定的,本文將每條微博的轉(zhuǎn)發(fā)數(shù)量、點(diǎn)贊數(shù)量和評論數(shù)量作為衡量電影微博互動效果的指標(biāo)。
不同電影微博的轉(zhuǎn)發(fā)數(shù)量、點(diǎn)贊數(shù)量和評論數(shù)量存在巨大差異(見表1),可能會引起數(shù)據(jù)的較大波動,產(chǎn)生高異方差性,故本文在指標(biāo)處理時將參考王林等人的處理方法[18],利用自然對數(shù)分別將指標(biāo)進(jìn)行歸一化,意在減小數(shù)據(jù)波動和可能存在的異方差性。最后對每一個指標(biāo)進(jìn)行權(quán)重賦值,則可得出每條電影微博互動效果Y的計(jì)算方法,如公式(2)所示:
其中X1、X2、X3分別為該條微博的轉(zhuǎn)發(fā)數(shù)量、評論數(shù)量和點(diǎn)贊數(shù)量,α1、α2、α3為其對應(yīng)的權(quán)重。
王林和張玥等[18-19]研究認(rèn)為博主的粉絲數(shù)量影響微博的轉(zhuǎn)發(fā)數(shù)量,故本文將指標(biāo)粉絲數(shù)量添加為自變量。話題閱讀量是指在微博上以電影為中心形成的話題被微博用戶訪問的數(shù)量,能夠表示此電影在微博用戶中的歡迎程度。劉彤等[20]指出受眾感興趣的話題能引起更多人的關(guān)注和評論,故本文添加“話題閱讀量”為自變量。
為了確定隱藏主題對電影微博互動性的影響,本文構(gòu)建了因變量相同、自變量不同的兩個回歸模型。第一個回歸模型的自變量僅包括用戶粉絲數(shù)量和話題閱讀量,見公式(3);第二個回歸模型添加了主題虛擬變量,即從LDA模型中訓(xùn)練得到的隱藏主題,見公式(4)。
其中,Yd表示第d條微博的互動效果,F(xiàn)d表示發(fā)布第d條微博的博主粉絲數(shù)量,Rd表示第d條微博所涉及到的電影話題的閱讀量。Tk,d為第k個主題在第d條微博中的分布概率,且k = 1, 2, …, K,。β0為常數(shù)項(xiàng),β1、β2、βk為回歸系數(shù),εd為隨機(jī)擾動因子。
3? 方法實(shí)現(xiàn)
3.1? 數(shù)據(jù)獲取
本文數(shù)據(jù)集來源于電影票房網(wǎng)PC端和新浪微博手機(jī)客戶端,使用Python編程爬取。首先從電影票房網(wǎng)PC端獲取2017年上映的所有電影,共421條,并非所有的電影能夠在微博上形成以“電影名字”為主題的話題頁面,故最終用于實(shí)驗(yàn)分析的電影有123個;其次以“電影名字”為搜索條件在微博上進(jìn)行手動搜索,找到電影在微博上形成的話題討論頁面,選擇熱門微博,獲取話題閱讀量及每條微博的詳情鏈接;最后根據(jù)微博詳情鏈接獲取每條微博的微博ID、微博轉(zhuǎn)發(fā)數(shù)量、微博點(diǎn)贊數(shù)量、微博評論數(shù)量、微博文本以及博主的用戶粉絲數(shù)量,共26 543條,刪除重復(fù)及無用微博后,最終用于實(shí)驗(yàn)的有19 061條。使用stata分析工具對爬取的數(shù)據(jù)進(jìn)行描述統(tǒng)計(jì),結(jié)果見表1。轉(zhuǎn)發(fā)、評論和點(diǎn)贊對應(yīng)的數(shù)量最小值都為0,最大值分別為12 042 061、250 387、1 032 796,兩者之間相差都較大(標(biāo)準(zhǔn)差明顯大于均值),且中位數(shù)明顯偏向最小值的一邊。用戶粉絲數(shù)從1到120 754 022不等,中位數(shù)大于均值。話題閱讀量的最小值為114.3萬,最大值為414 000萬。
3.2? 數(shù)據(jù)預(yù)處理
3.2.1? 微博文本數(shù)據(jù)的預(yù)處理
LDA模型是詞袋模型,即用一組詞向量表示微博文本,而原始的微博文本是由句子組成的,故在模型訓(xùn)練之前,使用Python工具對微博文本進(jìn)行預(yù)處理,處理方式如下:①構(gòu)建所有電影微博文本的語料庫;②過濾掉無關(guān)的微博信息,包括“#話題名#”格式的內(nèi)容、“@用戶”格式的內(nèi)容和文本字?jǐn)?shù)小于一定值的微博文本;③使用停用詞列表刪除不相關(guān)和不常見的術(shù)語(例如“有”“將”“只是”)、數(shù)字和特殊字符;④把意思相近的詞語合并成同一個術(shù)語,例如“笑點(diǎn)”和“笑料”被組合成“笑點(diǎn)”;⑤不同詞性的詞對主題表達(dá)的貢獻(xiàn)程度不同,對主題表達(dá)和辨識作用最大的是名詞和動詞[21],故本文只考慮名詞和動詞作為特征詞;⑥分析發(fā)現(xiàn)詞頻具有明顯的“長尾特征”,即多數(shù)詞出現(xiàn)較小的次數(shù),少數(shù)詞出現(xiàn)較高的次數(shù),這和唐曉波等[22]的結(jié)論一致。本文使用0.99級別的RemoveSparseTerms函數(shù),刪除所有文檔中出現(xiàn)小于1%的動詞和名詞[23],這是一種常見的做法,允許研究人員獲得更短的術(shù)語列表和更多有用的信息。經(jīng)過預(yù)處理,最終用于LDA訓(xùn)練的詞語有393個,使用Python的wordcloud庫繪制了電影微博文本詞頻的詞云圖,如圖1所示:
3.2.2? 變量的預(yù)處理
使用Python工具對變量進(jìn)行預(yù)處理,處理方式如下:將所有變量進(jìn)行歸一化,第i條微博的第j個變量表示為xij,標(biāo)準(zhǔn)化后的
本文使用信息熵計(jì)算轉(zhuǎn)發(fā)、評論和點(diǎn)贊量3個指標(biāo)的權(quán)重[17]。信息熵是刻畫信息無序度的一個指標(biāo),熵值越大,表示信息的無序化程度越高,相對應(yīng)的信息效率越高[24]。計(jì)算變量轉(zhuǎn)發(fā)數(shù)量、評論數(shù)量和點(diǎn)贊數(shù)量的信息熵:
根據(jù)公式(2)計(jì)算出每條微博的互動效果,將其與歸一化后的轉(zhuǎn)發(fā)數(shù)量、評論數(shù)量和點(diǎn)贊數(shù)量這3個指標(biāo)分別做相關(guān)分析,發(fā)現(xiàn)相關(guān)系數(shù)分別為0.91、0.9、0.94,均大于0.9,說明權(quán)重賦值合理[17]。
3.3? 試驗(yàn)結(jié)果
3.3.1? LDA結(jié)果
使用Python中的scikit-learnLDA包訓(xùn)練電影微博文本數(shù)據(jù)。LDA最重要的組成部分之一是確定構(gòu)成所有文本的主題數(shù)量,本文使用perplexity指標(biāo)[25]來確定微博文本的最佳主題數(shù)量,測試主題數(shù)量編號從2到15,結(jié)果表明最佳選擇是6個主題,見圖2。使用pyLDAvis包來可視化主題映射,圖3顯示6個主題都在自己的非重疊區(qū)域中,這表明6個主題之間沒有相關(guān)性,每個主題都是獨(dú)立且信息豐富的。
LDA的結(jié)果中每個主題由一組詞組成。一個好的主題模型不僅取決于模型在可衡量的統(tǒng)計(jì)指標(biāo)中的表現(xiàn),還取決于每個主題的合理性和可解釋性。每個主題中的前15個主題詞見表2。LDA允許一些詞語出現(xiàn)在多個主題中,例如,詞語“導(dǎo)演”出現(xiàn)在主題1和主題6中,詞語“發(fā)布”出現(xiàn)在主題2和主題4中。表2中的結(jié)果顯示主題1包含相關(guān)電影人物介紹方面的術(shù)語,例如“導(dǎo)演”“演員”“角色”“飾演”,因此本文將主題1命名為“電影人物”;主題2的主題詞更可能描述了有關(guān)電影宣傳的微博,例如“預(yù)告”“海報(bào)”“預(yù)告片”“公映”,因此本文將主題2命名為“電影宣傳”;主題3包含互動營銷方面的術(shù)語,例如“轉(zhuǎn)發(fā)”“關(guān)注”“機(jī)會”“贈送”,因此本文將主題3命名為“互動營銷”;主題4更可能是有關(guān)電影主題、情節(jié)、插曲的微博,因此本文將主題4命名為“電影內(nèi)容”;主題5主要包含電影觀后感及評價(jià)方面的術(shù)語,例如“喜歡”“支持”“好看”“搞笑”,因此本文將主題5命名為“電影評價(jià)”;主題6包含電影線下宣傳活動方面的術(shù)語,例如“現(xiàn)場”“發(fā)布會”“路演”“首映禮”,因此本文將主題命名為“線下活動”。審查文本產(chǎn)生的所有6個不同主題都是可解釋和合理的。
3.3.2? 回歸結(jié)果
使用stata分析工具對數(shù)據(jù)進(jìn)行回歸處理,結(jié)果見表3。模型1中,所有變量的系數(shù)在1%水平上具有顯著性,“用戶粉絲數(shù)”和“話題閱讀量”的系數(shù)均為正,這表明“用戶粉絲數(shù)”和“話題閱讀量”正向影響微博的互動效果。在模型2中,變量“用戶粉絲數(shù)”及“話題閱讀量”的系數(shù)和模型1中的結(jié)果基本相當(dāng)。除了模型1中的自變量之外,模型2還添加了LDA中的隱藏變量。由于自變量矩陣X中的項(xiàng)Tk,d滿足,為了避免自變量間的多重共線性的產(chǎn)生,本文參考H. Yan等[25]的做法,將主題1從模型中刪除。對主題1之外的所有自變量進(jìn)行多重共線性檢驗(yàn),結(jié)果見表4,方差膨脹因子VIF的Mean=1.44>1,Max=1.75<10,故變量之間不存在多重共線性。模型2結(jié)果顯示主題2、主題3、主題4和主題5在1%水平上都具有統(tǒng)計(jì)顯著性,且系數(shù)均為正,表明電影微博文本中有關(guān)“電影宣傳”“互動營銷”“電影內(nèi)容”和“電影評價(jià)”的主題正向影響微博的互動效果,可能對微博的互動效果有促進(jìn)作用。
4? 總結(jié)與討論
4.1? 總結(jié)
本文通過結(jié)合LDA和2層回歸模型的方法找出了電影微博中的隱藏主題及其對互動效果的影響。本文研究主要結(jié)論如下:
(1)使用主題挖掘模型LDA發(fā)現(xiàn)了隱藏在電影微博文本中的6個可解釋主題:“電影人物”“電影宣傳”“互動營銷”“電影內(nèi)容”“電影評價(jià)”和“線下活動”,主題可視化映射結(jié)果表明6個主題之間沒有相關(guān)性,每個主題都是獨(dú)特且信息豐富的。
(2)構(gòu)建2層回歸模型分析6個隱藏主題對電影微博互動效果的影響。結(jié)果表明變量“用戶粉絲數(shù)”和“話題閱讀量”正向影響電影微博互動效果。添加主題虛擬變量后增加了模型的解釋能力,主題“電影宣傳”“互動營銷”“電影內(nèi)容”以及“電影評價(jià)”對微博互動效果影響具有顯著性。
4.2? 營銷建議
本研究結(jié)果能夠?yàn)槠髽I(yè)開展電影微博營銷提供一些啟示和建議。
首先,回歸結(jié)果顯示“用戶粉絲數(shù)”和“話題閱讀量”對電影微博互動效果影響顯著。微博大V往往具有龐大的粉絲數(shù)量,企業(yè)可以通過與微博大V合作,使電影得到更廣泛的互動和宣傳。
其次,回歸結(jié)果同時表明主題“電影宣傳”“互動營銷”“電影內(nèi)容”和“電影評價(jià)”正向影響電影微博互動效果。企業(yè)一方面可以在官方微博中發(fā)布一些有獎轉(zhuǎn)發(fā)之類的活動以及和電影有關(guān)的歌曲、海報(bào)、主題、情節(jié)、精彩片段;另一方面,企業(yè)應(yīng)主動邀請一些在微博中有影響力的人物觀看電影并對電影做出相關(guān)評價(jià)。
4.3? 研究不足與展望
本研究有一些限制,希望未來能進(jìn)一步完善這些不足。首先在用perplexity指標(biāo)選擇最佳主題時,只測試了主題數(shù)為2-15的模型困惑度,對主題數(shù)大于15的情況沒有考慮。未來研究可以測試更多主題數(shù),挖掘隱藏在電影微博文本中更細(xì)粒度的主題。其次主題的可解釋性來自主觀判斷,未來將采用專家調(diào)研和內(nèi)容分析等技術(shù)科學(xué)獲取主題的命名,以提升主題的可解釋性。
參考文獻(xiàn):
[1] 夏立新, 張純, 陳健瑤, 等.企業(yè)微博內(nèi)容對網(wǎng)絡(luò)口碑及品牌認(rèn)可度的影響[J].情報(bào)科學(xué), 2019, 37(4):79-85.
[2] 李慧, 王麗婷.基于話題標(biāo)簽的微博熱點(diǎn)話題演化研究[J].情報(bào)科學(xué), 2019, 37(1):30-36.
[3] 新浪微博數(shù)據(jù)中心.2018年度微博電影白皮書[EB/OL].[2019-02-03].https://data.weibo.com/report/reportDetail?id=430.
[4] 李紅, 項(xiàng)子晴.企業(yè)微博營銷效果影響因素分析——以小米公司為例[J].價(jià)格月刊, 2017(11):78-80.
[5] 席林娜, 竇永香.基于計(jì)劃行為理論的微博用戶轉(zhuǎn)發(fā)行為影響因素研究[J].數(shù)據(jù)分析與知識發(fā)現(xiàn), 2019, 3(2):13-20.
[6] 陳姝, 竇永香, 張青杰.基于理性行為理論的微博用戶轉(zhuǎn)發(fā)行為影響因素研究[J].情報(bào)雜志, 2017, 36(11):147-152, 160.
[7] 謝正霞. 基于用戶交互的企業(yè)微博傳播效果評價(jià)研究[D].廣州:華南理工大學(xué), 2019.
[8] 周慶山, 趙雪, 趙需要, 等.我國數(shù)字內(nèi)容產(chǎn)業(yè)研究的主題知識圖譜分析[J].情報(bào)理論與實(shí)踐, 2012, 35(4):56-61.
[9] 陳娟, 劉燕平, 鄧勝利.政務(wù)微博辟謠信息傳播效果的影響因素研究[J].情報(bào)科學(xué), 2018, 36(1):91-95, 117.
[10] 魏萌, 張博.新浪微博“網(wǎng)紅”的微博內(nèi)容特征及傳播效果研究[J].情報(bào)科學(xué), 2018, 36(2):88-94.
[11] WU S, HOFMAN J M, MASON W A, et al. Who says what to whom on twitter[C]//Proceedings of the 20th international conference on world wide Web. Hyderabad: ACM, 2011: 705-714.
[12] CHA M, BENEVENUTO F, HADDADI H, et al. The world of connections and information flow in twitter[J]. IEEE Transactions on Systems, Man, and Cybernetics-Part A: systems and humans, 2012, 42(4): 991-998.
[13] ZHANG L, PENG T Q. Breadth, depth, and speed: diffusion of advertising messages on microblogging sites[J]. Internet research, 2015, 25(3): 453-470.
[14] SO J, PRESTIN A, LEE L, et al. What do people like to “share” about obesity? a content analysis of frequent retweets about obesity on Twitter[J]. Health communication, 2016, 31(2): 193-206.
[15] SOBOLEVA A, BURTON S, MALLIK G, et al. ‘Retweet for a Chance to…: an analysis of what triggers consumers to engage in seeded eWOM on Twitter[J]. Journal of marketing management, 2017, 33(13/14): 1120-1148.
[16] 周煒翔, 張仰森, 張良.面向微博熱點(diǎn)事件的話題檢測及表述方法研究[J].計(jì)算機(jī)應(yīng)用研究, 2019, 36(12):3565-3569, 3578.
[17] 劉艷秋, 方建群, 胡靜, 等.人格因素及家庭環(huán)境對生態(tài)移民青少年冒險(xiǎn)行為的影響[J].中國健康心理學(xué)雜志, 2019, 27(12):1871-1875.
[18] 王林, 潘陳益, 朱文靜, 等. 機(jī)構(gòu)微博傳播力影響因素研究[J]. 現(xiàn)代情報(bào), 2018, 38(4): 35-41.
[19] 張玥, 孫霄凌, 浦正寧, 等. 微博輿情傳播影響因素研究——基于信源特征和信息形式的視角[J]. 情報(bào)資料工作, 2014(3): 59-64.
[20] 劉彤, 尹仔鋒. “可及”環(huán)境與“不可及”環(huán)境——電影微博營銷影響因素探析[J]. 新聞界, 2012(23): 66-70.
[21] 李莉, 林雨藍(lán), 姚瑞波. 基于LDA 模型的交互式文本主題挖掘研究——以客服聊天記錄為例[J]. 情報(bào)科學(xué), 2018, 36(10): 64-70.
[22] 唐曉波, 王洪艷. 基于潛在語義分析的微博主題挖掘模型研究[J]. 情報(bào)學(xué)報(bào), 2013, 56(24): 114-119.
[23] HENG Y, GAO Z, JIANG Y, et al. Exploring hidden factors behind online food shopping from Amazon reviews: a topic mining approach[J]. Journal of retailing and consumer services, 2018 (42): 161-168.
[24] 金堅(jiān).大數(shù)據(jù)時代信息熵的價(jià)值評價(jià)研究[D].長春:吉林大學(xué), 2019.
[25] WANG Y, AGICHTEIN E, BENZI M. TM-LDA: efficient online modeling of latent topic transitions in social media[C]// KDD ‘12: Proceedings of the 18th ACM SIGKDD international conference on knowledge discovery and data mining. New York: Association for Computing Machinery, 2012: 123–131.
作者貢獻(xiàn)說明:
張新香:指導(dǎo)論文構(gòu)思與寫作,提出修改意見并修改終稿;
趙彩霞:負(fù)責(zé)數(shù)據(jù)采集、初稿撰寫及論文修改。