• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于共現(xiàn)網(wǎng)絡(luò)與情感分析的多平臺(tái)消費(fèi)者評(píng)論主題比較研究

      2023-06-14 05:16:52周婷瑋
      知識(shí)管理論壇 2023年2期
      關(guān)鍵詞:情感分析

      摘要:[目的/意義]旨在以實(shí)證分析研究虛擬生活社區(qū)、社交平臺(tái)、購(gòu)物平臺(tái)的用戶對(duì)于同一款產(chǎn)品的評(píng)價(jià)內(nèi)容主題傾向異同。[方法/過程]選取“你今天真好看”App、微博、京東三個(gè)平臺(tái)為實(shí)驗(yàn)對(duì)象,共采集54 071條同一護(hù)膚品的用戶評(píng)論文本,采用LDA主題生成模型、共現(xiàn)網(wǎng)絡(luò),基于機(jī)器學(xué)習(xí)的情感分析方法對(duì)用戶評(píng)論文本進(jìn)行多平臺(tái)比較分析。[結(jié)果/結(jié)論]研究發(fā)現(xiàn)三個(gè)平臺(tái)共八大評(píng)論主題的主題特征詞、共現(xiàn)網(wǎng)絡(luò)、主題情感上各有異同,且內(nèi)容傾向符合各平臺(tái)特點(diǎn)。

      關(guān)鍵詞:多平臺(tái)比較? ? 文本主題聚類? ? 共現(xiàn)網(wǎng)絡(luò)分析? ? 情感分析

      分類號(hào):F724.6

      引用格式:周婷瑋. 基于共現(xiàn)網(wǎng)絡(luò)與情感分析的多平臺(tái)消費(fèi)者評(píng)論主題比較研究[J/OL]. 知識(shí)管理論壇, 2023, 8(2): 79-91[引用日期]. http://www.kmf.ac.cn/p/334/.

      大數(shù)據(jù)移動(dòng)互聯(lián)網(wǎng)時(shí)代,用戶可以在線上交流信息[1],以評(píng)論作為呈現(xiàn)形式的即時(shí)信息也被長(zhǎng)久保留在平臺(tái)上。在此背景下,用戶通過共同的興趣、職業(yè)、目標(biāo)、需求等聚集在一起,形成網(wǎng)絡(luò)虛擬社區(qū)[2]。與實(shí)體傳統(tǒng)社區(qū)相比,網(wǎng)絡(luò)虛擬社區(qū)擺脫了時(shí)間和空間的限制,因而受眾群體十分廣泛[1]。新媒體時(shí)代,虛擬社區(qū)營(yíng)銷逐漸成為電子商務(wù)領(lǐng)域信息傳播和價(jià)值傳遞的主要方式。虛擬社區(qū)可以提供大量信息供消費(fèi)者瀏覽,以滿足其輔助決策的功能需求。其中,在線評(píng)論的文本內(nèi)容對(duì)于消費(fèi)者行為的影響起到了關(guān)鍵作用,但每條評(píng)論的重要性并不相同[3]。有相關(guān)文獻(xiàn)基于用戶需求將虛擬社區(qū)的用戶評(píng)論主題劃分為平臺(tái)推廣、獎(jiǎng)勵(lì)制度、基礎(chǔ)設(shè)施維護(hù)、專業(yè)特色、發(fā)帖規(guī)范、專業(yè)資源建設(shè)、管理團(tuán)隊(duì)建設(shè)、社會(huì)對(duì)接和用戶互動(dòng)等[4]。但該類研究主要基于虛擬社區(qū)建設(shè),研究用戶參與的特點(diǎn)與影響,對(duì)于虛擬社區(qū)內(nèi)的用戶評(píng)論研究則聚焦單一虛擬社區(qū),缺乏關(guān)于虛擬社區(qū)特色化的用戶評(píng)論內(nèi)容主題傾向以及跨平臺(tái)比較研究。

      本研究采集了“你今天真好看”App、微博、京東三種渠道中同一護(hù)膚品類商品的評(píng)論數(shù)據(jù)共計(jì)54 071條,將護(hù)膚虛擬社區(qū)、社交平臺(tái)、購(gòu)物平臺(tái)以護(hù)膚專題為例進(jìn)行對(duì)比,并采用LDA(Latent Dirichlet Allocation)主題生成模型、共現(xiàn)網(wǎng)絡(luò)(Co-Occurrence Network)和情感分析對(duì)用戶評(píng)論文本進(jìn)行多平臺(tái)比較研究。本文旨在分析各平臺(tái)評(píng)論主題傾向異同,比對(duì)同一主題下的內(nèi)容差異,以期為品牌方企業(yè)在新品配方設(shè)計(jì)、已有商品優(yōu)化、用戶適用人群定位、用戶產(chǎn)品需求獲取、實(shí)際使用效果反饋、產(chǎn)品代言人選擇、產(chǎn)品定價(jià)等方面提供精準(zhǔn)的獲取渠道決策參考,并為相關(guān)商業(yè)應(yīng)用提供參考。

      1? 相關(guān)研究

      1.1? 虛擬社區(qū)與用戶

      目前,對(duì)于虛擬社區(qū)的相關(guān)研究主要集中于虛擬學(xué)術(shù)社區(qū)建設(shè)和虛擬品牌社區(qū)中的用戶參與。周陽(yáng)等[5]利用質(zhì)性分析軟件NVIVO 12.0對(duì)小木蟲論壇回帖內(nèi)容進(jìn)行編碼,據(jù)此構(gòu)建虛擬學(xué)術(shù)社區(qū)參與行為的模型,發(fā)現(xiàn)不同等級(jí)的用戶的參與行為具有不同的特點(diǎn)。C. Huaruo等[6]發(fā)現(xiàn)虛擬學(xué)術(shù)社區(qū)持續(xù)知識(shí)共享意愿與知識(shí)共享滿意度呈顯著正相關(guān),而后者受啟發(fā)式因素(知識(shí)共享數(shù)量、知識(shí)源可信度)和系統(tǒng)因素(知識(shí)共享質(zhì)量、知識(shí)共享有用性)的影響。M. Tabish等[7]使用偏最小二乘法(Partial Least Squares,PLS)進(jìn)行分析,研究認(rèn)為虛擬社區(qū)參與對(duì)品牌信任有積極作用,而品牌信任將會(huì)對(duì)品牌選擇產(chǎn)生積極影響。

      為了深入挖掘虛擬社區(qū)用戶評(píng)論中隱藏的用戶需求,相關(guān)文獻(xiàn)對(duì)虛擬社區(qū)的用戶評(píng)論文本進(jìn)行分析。雖然在線評(píng)論的文本內(nèi)容對(duì)于消費(fèi)者行為的影響起到了關(guān)鍵作用,但根據(jù)陳秀秀[3]的研究,每條評(píng)論的重要性并不相同。更有研究發(fā)現(xiàn)了用戶需求與品牌之間的聯(lián)系,并挖掘出含用戶需求內(nèi)容的評(píng)論文本的價(jià)值。例如,P. Cara[8]在研究消費(fèi)者對(duì)在線評(píng)論來源可信度和有用性的感知如何影響與零售商店網(wǎng)絡(luò)社區(qū)接觸的意向和購(gòu)買意向時(shí)發(fā)現(xiàn),消費(fèi)者希望在購(gòu)物情境中與零售店網(wǎng)絡(luò)社區(qū)進(jìn)行接觸。U. Chakraborty[9]利用結(jié)構(gòu)方程模型的bootstrapping方法來檢驗(yàn)品牌資產(chǎn)維度在購(gòu)買意愿與在線評(píng)論之間的中介效應(yīng),最終發(fā)現(xiàn)營(yíng)銷人員應(yīng)該更多地關(guān)注品牌知名度和感知價(jià)值,因?yàn)檫@兩者最終影響消費(fèi)者的購(gòu)買意愿。屈慧君[10]針對(duì)微博品牌社區(qū)中用戶參與動(dòng)機(jī)、互動(dòng)活力、信任、購(gòu)買意愿之間的兩兩關(guān)系進(jìn)行研究,發(fā)現(xiàn)這四者互成正相關(guān)關(guān)系。

      綜上所述,當(dāng)前圍繞虛擬社區(qū)相關(guān)的研究文獻(xiàn)內(nèi)容主要包含兩個(gè)方面:專業(yè)虛擬社區(qū)中不同用戶參與行為的特點(diǎn)、參與意愿和對(duì)虛擬社區(qū)的影響;對(duì)用戶評(píng)論內(nèi)容進(jìn)行文本挖掘分析,研究其中潛藏的用戶對(duì)虛擬社區(qū)和品牌的需求,以及用戶信任、購(gòu)買決策等的影響因素。然而對(duì)于用戶參與在商業(yè)方面的實(shí)際應(yīng)用價(jià)值定義較為籠統(tǒng),且用戶對(duì)于品牌產(chǎn)品的使用反饋是其共創(chuàng)價(jià)值的重要體現(xiàn),而對(duì)此中用戶參與進(jìn)行深入研究的文獻(xiàn)較少。對(duì)于虛擬社區(qū)評(píng)論的研究大多針對(duì)虛擬品牌社區(qū),對(duì)虛擬生活社區(qū)的研究少有涉及。

      1.2? 主題挖掘研究:基于LDA的主題共現(xiàn)網(wǎng)絡(luò)與情感分析

      現(xiàn)有文獻(xiàn)中對(duì)于文本中主題聚類通常采用兩種方式,一種是根據(jù)文本相似度的計(jì)算進(jìn)行聚類的傳統(tǒng)模型[11-12],其作用于原始文本,以兩個(gè)文本的字符匹配程度或距離作為相似度的衡量標(biāo)準(zhǔn),其優(yōu)點(diǎn)是算法原理簡(jiǎn)單且易于實(shí)現(xiàn),但依賴詞向量空間距離[13],存在文本向量維數(shù)過高以及語(yǔ)義敏感度差的問題[14];另一種則是使用LDA主題生成模型。

      LDA模型最早由D. M. Blei等[15]提出,是一種基于貝葉斯概率的、非監(jiān)督機(jī)器學(xué)習(xí)技術(shù),屬于自然語(yǔ)言處理的兩大推力模型之一,可以用來識(shí)別大規(guī)模語(yǔ)料庫(kù)(corpus)中潛藏的主題信息。在LDA主題生成模型中,每份文本被表示為一系列主題的多項(xiàng)分布,而每個(gè)主題則被表示為一系列單詞的多項(xiàng)分布[16]。LDA主題生成模型由于具有較好的處理大規(guī)模語(yǔ)料的能力、降維能力,成為了近年來主題挖掘研究中的一個(gè)熱門方向[17]。

      該模型可應(yīng)用于多種情境。在歷史學(xué)領(lǐng)域,何琳等[18]對(duì)《左傳》等史書中的事件觸發(fā)詞借助LDA實(shí)現(xiàn)了其自動(dòng)識(shí)別和分類;在司法實(shí)踐領(lǐng)域,王慧等[19]使用LDA提取案情三元組信息,解決了現(xiàn)有司法數(shù)據(jù)分析方法與案件數(shù)據(jù)的內(nèi)部信息關(guān)聯(lián)不夠、低效落后的問題;在社交平臺(tái)輿情管控領(lǐng)域,張雷等[20]基于LDA模型構(gòu)建高校師德輿情下微博用戶主題生成模型,通過識(shí)別主題最優(yōu)傳播路徑進(jìn)行輿論引導(dǎo),對(duì)突發(fā)的輿情實(shí)現(xiàn)預(yù)測(cè)和管制優(yōu)化;在電商領(lǐng)域,崔寧等[21]以LDA主題模型和偏序集理論為基礎(chǔ),對(duì)大量在線商品評(píng)論構(gòu)建在線商品評(píng)論分析模型,幫助商家掌握顧客消費(fèi)需求和潛在傾向。綜上可見,LDA主題生成模型應(yīng)用廣泛,且能高效、準(zhǔn)確地挖掘出文本的主題特征。

      基于機(jī)器學(xué)習(xí)的情感分析作為有監(jiān)督學(xué)習(xí),需要人工對(duì)文本庫(kù)進(jìn)行正負(fù)樣本標(biāo)注,再選擇合適的算法對(duì)分類器進(jìn)行訓(xùn)練[22]。自然語(yǔ)言處理的分類算法主要有樸素貝葉斯算法、KNN算法、支持向量機(jī)算、神經(jīng)網(wǎng)絡(luò)算法等。研究表明用機(jī)器學(xué)習(xí)方法對(duì)10萬(wàn)條以下的文本信息進(jìn)行分類時(shí),采用樸素貝葉斯方法能達(dá)到較好的效果[23]。本研究將采用樸素貝葉斯算法訓(xùn)練分類器,對(duì)三個(gè)平臺(tái)的文本情感正負(fù)極性進(jìn)行處理。

      2? 研究方法

      2.1? 數(shù)據(jù)來源

      本研究選取2020年6月—2022年3月護(hù)膚虛擬社區(qū)、社交平臺(tái)、購(gòu)物平臺(tái)的用戶評(píng)論,并選取了“芙麗芳絲凈潤(rùn)洗面霜”作為評(píng)論數(shù)據(jù)的采集目標(biāo)對(duì)象。根據(jù)iMedia Research(艾媒咨詢)數(shù)據(jù)顯示[24],90.4%中國(guó)網(wǎng)民使用洗面奶清潔面部,這表明在消費(fèi)者群體中洗面奶的使用極為普遍。而2021年京東“618”促消活動(dòng)中,芙麗芳絲凈潤(rùn)洗面霜拿下潔面品類銷量第一,且于護(hù)膚虛擬社區(qū)“你今天真好看”App護(hù)膚品潔面榜單中,常年保持在綜合排行榜第一。因此選擇“芙麗芳絲凈潤(rùn)洗面霜”作為采集目標(biāo)對(duì)象得到的研究結(jié)論具有代表性和普遍性。具體數(shù)據(jù)來源如下:

      (1)護(hù)膚虛擬社區(qū)的用戶評(píng)論文本爬取自“你今天真好看”App。“你今天真好看”App于2016年底上線,是世界上首款通過素顏照即可進(jìn)行膚質(zhì)檢測(cè)的手機(jī)端應(yīng)用。作為一個(gè)專業(yè)的護(hù)膚品虛擬社區(qū),其在提供膚質(zhì)檢測(cè)的同時(shí),根據(jù)檢測(cè)結(jié)果為用戶推薦合適的護(hù)膚品,并且擁有200多萬(wàn)種護(hù)膚品的產(chǎn)品庫(kù)、1 500多萬(wàn)條產(chǎn)品評(píng)價(jià)、1 290萬(wàn)的用戶群體,截至2023年1月已提供超過2.37億次拍照測(cè)膚服務(wù)(數(shù)據(jù)來自App官網(wǎng))。本研究爬取“芙麗芳絲凈潤(rùn)洗面霜”產(chǎn)品下的用戶評(píng)論數(shù)據(jù),最終得到31 359條有效評(píng)論文本。

      (2)社交平臺(tái)的用戶評(píng)論文本爬取自微博。微博是一種基于用戶關(guān)系進(jìn)行信息分享、傳播以及獲取,通過關(guān)注機(jī)制分享簡(jiǎn)短實(shí)時(shí)信息的廣播式社交媒體與網(wǎng)絡(luò)平臺(tái)。截至2021年9月,微博月活躍用戶達(dá)5.73億,來自移動(dòng)端比例為94%;日活躍用戶數(shù)達(dá)到2.48億[25]。本研究爬取“芙麗芳絲潔面”話題下用戶博文數(shù)據(jù),最終得到12 404條有效評(píng)論文本。

      (3)購(gòu)物平臺(tái)的用戶評(píng)論文本爬取自京東。京東作為中國(guó)自營(yíng)式電商企業(yè),在線銷售包括化妝品與其他個(gè)人護(hù)理用品在內(nèi)的商品共13大類3 150萬(wàn)種SKU(Stock Keeping Unit,庫(kù)存量單位)。本研究爬取“芙麗芳絲凈潤(rùn)洗面霜”產(chǎn)品下用戶評(píng)論數(shù)據(jù),最終得到10 308條有效評(píng)論文本。

      本研究從以上三個(gè)平臺(tái)中獲得共計(jì)54 071條文本數(shù)據(jù)。

      2.2? 評(píng)論文本主題生成模型

      本研究的主要流程分為以下幾個(gè)步驟:

      (1)在“你今天真好看”App、微博、京東三個(gè)平臺(tái)分別使用Python爬蟲獲取“芙麗芳絲凈潤(rùn)洗面霜”的評(píng)論文本,形成多平臺(tái)評(píng)論文本庫(kù),為后文的文本分析做好準(zhǔn)備工作。

      (2)對(duì)評(píng)論文本進(jìn)行預(yù)處理,即加入領(lǐng)域?qū)S性~,分詞,去除停用詞,標(biāo)注詞性。

      (3)使用LDA主題生成模型對(duì)三種來源的評(píng)論文本分別進(jìn)行聚類,根據(jù)困惑度得出最佳主題數(shù),并由人工對(duì)各主題進(jìn)行定義。

      (4)將各平臺(tái)用戶評(píng)論文本中聚類得出的前150個(gè)特征詞作為關(guān)鍵詞,用于研究各主題內(nèi)及主題間的共現(xiàn)網(wǎng)絡(luò),并對(duì)評(píng)論文本與主題進(jìn)行情感分析。

      (5)對(duì)比三個(gè)平臺(tái)的共現(xiàn)網(wǎng)絡(luò)與情感分析結(jié)果,探索各平臺(tái)的側(cè)重項(xiàng)。

      具體流程如圖1所示:

      本節(jié)將對(duì)研究流程中較為重要的部分進(jìn)行詳述。

      (1)數(shù)據(jù)預(yù)處理。在獲取評(píng)論文本后,參照哈工大停用詞表(767),對(duì)文本進(jìn)行去除停用詞、標(biāo)注詞性、分詞。為了確保本研究分詞效果的完整性與準(zhǔn)確性,加入了閱讀全部評(píng)論后人工定義的流行詞表(97),以協(xié)助補(bǔ)全Python的第三方包Jieba在對(duì)文本進(jìn)行分詞時(shí)使用的詞庫(kù)。

      (2)LDA主題生成模型。本研究使用Python的Latent Dirichlet Allocation函數(shù)對(duì)各平臺(tái)用戶評(píng)論文本分別進(jìn)行LDA聚類并使用第三方包pyLDAvis對(duì)主題生成結(jié)果進(jìn)行可視化分析,以避免過擬合的問題出現(xiàn)。依據(jù)LDA聚類結(jié)果并參照折肘法[26]尋找三個(gè)平臺(tái)的困惑度拐點(diǎn),得出的最佳主題數(shù)見圖2。根據(jù)所有平臺(tái)的結(jié)果,單個(gè)主題下的特征詞去重后,構(gòu)建三者的特征詞總庫(kù)。根據(jù)詞頻分別對(duì)各平臺(tái)進(jìn)行特征詞排序,得到每個(gè)平臺(tái)各自的特征詞詞頻表。

      (3)主題共現(xiàn)網(wǎng)絡(luò)分析。在KH Coder中經(jīng)多次實(shí)驗(yàn),網(wǎng)絡(luò)圖成員為150時(shí)作圖效果最佳,因此依據(jù)LDA的聚類結(jié)果,在特征詞詞頻表中取前150個(gè)單詞進(jìn)行網(wǎng)絡(luò)圖繪制。經(jīng)過驗(yàn)證發(fā)現(xiàn),三個(gè)平臺(tái)有主題編碼的單詞詞頻在總詞頻占比分別為“你今天真好看”App 85.36%、微博95.12%、京東92.7%,結(jié)果具有代表性。最后,根據(jù)各主題特征詞及其在同一條評(píng)論文本中的共現(xiàn)關(guān)系,對(duì)主題名稱進(jìn)行定義。使用KH Coder軟件通過將多個(gè)主題特征詞以同一主題名稱進(jìn)行同義詞替換的方式對(duì)特征詞給予主題編碼,以此為基礎(chǔ)可研究主題之間的共現(xiàn)關(guān)系,即不同主題特征詞在同一條評(píng)論文本中的共現(xiàn)現(xiàn)象。采用余弦距離進(jìn)行文本中詞語(yǔ)與詞語(yǔ),主題與主題的共現(xiàn)分析與語(yǔ)義網(wǎng)絡(luò)構(gòu)建。主題—主題的共現(xiàn)矩陣示例見表1,對(duì)角線元素代表該主題在從該平臺(tái)獲取的用戶評(píng)論文本中出現(xiàn)的總頻次,非對(duì)角線元素代表兩主題在同一條評(píng)論文本中共現(xiàn)的總次數(shù)。本文使用了KH Coder和 Gephi軟件對(duì)各平臺(tái)的共現(xiàn)網(wǎng)絡(luò)的可視化進(jìn)行繪制工作,采用最小生成樹法提取出共現(xiàn)網(wǎng)絡(luò)的主干繪制共現(xiàn)網(wǎng)絡(luò),以達(dá)到精簡(jiǎn)網(wǎng)絡(luò)圖,使結(jié)果更為直觀的目的。

      (4)主題情感分析。根據(jù)主題聚類與定義的結(jié)果,依據(jù)文獻(xiàn)[27]對(duì)詞語(yǔ)情感極性的劃分,分為正面、中性、負(fù)面并標(biāo)注為1、0、-1,以便于訓(xùn)練與統(tǒng)計(jì),并使用Tf-idf方法提取特征,以達(dá)到突出重要單詞、抑制次要單詞的目的[22]。訓(xùn)練數(shù)據(jù)方面,采用樸素貝葉斯方法,根據(jù)已知的先驗(yàn)概率和條件概率,基于詞—類組合概率計(jì)算后驗(yàn)概率的所屬類別[23]。通過轉(zhuǎn)化后的詞向量對(duì)分類器進(jìn)行訓(xùn)練,訓(xùn)練集與測(cè)試集的比例為8:2,并使用Python中的第三方包Sklearn評(píng)價(jià)準(zhǔn)確率,得到“你今天真好看”的結(jié)果準(zhǔn)確率為0.820 1,微博為0.781 2,京東為0.805 9。

      3? 實(shí)證分析

      3.1? LDA主題聚類分析

      本研究使用Python進(jìn)行LDA聚類,根據(jù)主題聚類的結(jié)果,總結(jié)出三個(gè)平臺(tái)下共8個(gè)主題,其中:產(chǎn)品配方(成分/膚感)、適合膚質(zhì)人群(用戶皮膚問題)、產(chǎn)品價(jià)格、用戶使用感受(使用體驗(yàn)、使用搭配)、用戶購(gòu)買原因(為什么購(gòu)買、競(jìng)品、回購(gòu)意愿)、商家活動(dòng)6個(gè)主題為三個(gè)平臺(tái)的共有主題。除此之外,產(chǎn)品代言人為微博平臺(tái)特有的主題,購(gòu)買平臺(tái)/物流為京東平臺(tái)特有的主題。LDA主題聚類結(jié)果如表2所示:

      部分特征詞出現(xiàn)在了兩個(gè)主題下,但考慮到主題定義,特征詞在各主題下實(shí)際含義并不重疊,因此保留。對(duì)三個(gè)平臺(tái)下各主題特征詞在該平臺(tái)評(píng)論文本庫(kù)中的詞頻總占比進(jìn)行統(tǒng)計(jì)分析(即經(jīng)主題編碼處理),如圖3所示,得出各主題在該平臺(tái)評(píng)論中的占比。由于存在主題共現(xiàn)現(xiàn)象,因而各平臺(tái)下各主題占比之和超出百分之一百。選取在各平臺(tái)中均占有較高比重的四項(xiàng)主題,通過詞云對(duì)比用戶評(píng)論文本實(shí)際內(nèi)容進(jìn)行分析。

      (1)產(chǎn)品配方(成分/膚感)主題下的特征詞詞云見圖4。三個(gè)平臺(tái)的用戶評(píng)論對(duì)于洗面奶本身的基本配方屬性如氨基酸與皂基,該類配方對(duì)應(yīng)的洗面奶的基本功能屬性(即清潔度)以及該款產(chǎn)品作為氨基酸類洗面奶的特性(即洗完皮膚不拔干的效果)都有較高的關(guān)注。而“你今天真好看”App在洗面奶基本屬性以外的其他功效成分更為關(guān)注;同時(shí)對(duì)于成分是否對(duì)皮膚具有刺激性、致痘可能性的聚焦是另兩個(gè)平臺(tái)所沒有的。微博平臺(tái)的用戶則更關(guān)注孕婦是否能夠使用該款產(chǎn)品,包括成分是否提取自植物,是否含有香精、色素或防腐劑等。前兩個(gè)平臺(tái)與京東平臺(tái)在該主題下特征詞的被包含關(guān)系。

      (2)適合膚質(zhì)人群(用戶皮膚問題)主題下的特征詞詞云見圖5?!澳憬裉煺婧每础盇pp的特征詞明顯多于并包含了另兩個(gè)平臺(tái)在該主題下的特征詞。該App對(duì)于臉部的區(qū)域劃分更為細(xì)致,如臉頰、額頭、鼻子、t區(qū);對(duì)于膚質(zhì)和皮膚已有問題的描述更為具體,不再僅以毛孔、油、敏感肌等概括,增加了黑頭、痘痘、混油(皮膚部分區(qū)域?yàn)橹行云つw,部分為油性皮膚)、油痘肌等;比之另外兩個(gè)平臺(tái),增加了有關(guān)適用氣候環(huán)境的描述,如換季、秋冬、時(shí)期等。

      (3)用戶使用感受(使用體驗(yàn)、使用搭配)主題下的特征詞詞云見圖6。三個(gè)平臺(tái)的用戶評(píng)論均對(duì)于洗面奶基本功效(即起泡能力和清潔能力)給予了較大的關(guān)注?!澳憬裉煺婧每础盇pp的特征詞明顯多于另兩個(gè)平臺(tái)在該主題下的特征詞?!澳憬裉煺婧每础盇pp傾向使用體驗(yàn),對(duì)于產(chǎn)品的各種功效覆蓋較全,包括控油、水油平衡、減輕皮膚負(fù)擔(dān)、顆粒物添加以及使用后皮膚出現(xiàn)的問題(如爆痘、起閉口、對(duì)眼睛較為刺激等);微博平臺(tái)傾向使用搭配,包括與起泡網(wǎng)一起使用,以及后續(xù)搭配雅詩(shī)蘭黛、cpb等品牌的面膜、面霜等其他類目護(hù)膚品;京東平臺(tái)則對(duì)于產(chǎn)品外包裝的盒子、產(chǎn)品容量、質(zhì)量更為重視。

      (4)用戶購(gòu)買原因(為什么購(gòu)買、競(jìng)品、回購(gòu)意愿)主題下的特征詞詞云見圖7。三個(gè)平臺(tái)用戶購(gòu)買該產(chǎn)品的主要原因均集中于該產(chǎn)品的主要特征屬性,如品牌——芙麗芳絲、護(hù)膚品類目——洗面奶、主打成分——氨基酸、主要功能——潔面等,并且均提到了該產(chǎn)品的競(jìng)品品牌,如旁氏、珂潤(rùn)、elta等?!澳憬裉煺婧每础盇pp對(duì)于回購(gòu)意愿的表達(dá)較為積極,初次購(gòu)買的原因多見于受網(wǎng)絡(luò)媒體傳播的影響;微博與京東平臺(tái)初次購(gòu)買或使用原因則是來自周圍親友的推薦或贈(zèng)送、同平臺(tái)同商品下的評(píng)論以及對(duì)品牌的信賴。

      3.2? 關(guān)鍵詞與主題共現(xiàn)網(wǎng)絡(luò)分析

      各平臺(tái)的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)見圖8,圖中氣泡大小代表詞頻,連線深淺度代表邊的權(quán)重。共現(xiàn)的顏色分區(qū)與LDA主題聚類效果基本保持一致。

      “你今天真好看”App的用戶評(píng)論中,高詞頻并與多個(gè)詞有連接的關(guān)鍵節(jié)點(diǎn)相對(duì)另兩個(gè)平臺(tái)較多,產(chǎn)品配方與使用體驗(yàn)之間的聯(lián)系最受關(guān)注。微博平臺(tái)具有產(chǎn)品代言人這一特色主題。之所以會(huì)出現(xiàn)圖3中微博平臺(tái)用戶購(gòu)買原因中主題占比高達(dá)99.9%這一異常現(xiàn)象,是由于微博作為中國(guó)主流的公共社交媒體平臺(tái),品牌方在該平臺(tái)上投放了大量該產(chǎn)品的廣告,導(dǎo)致品牌與產(chǎn)品名稱相關(guān)的單詞詞頻異常偏高,用戶購(gòu)買原因主題占據(jù)了極高的比重,可見微博在營(yíng)銷方面的特征屬性遠(yuǎn)超出其他屬性。京東平臺(tái)具有購(gòu)買平臺(tái)/物流這一特色主題。根據(jù)關(guān)鍵詞之間的關(guān)系可以得出,用戶在這一主題下最為關(guān)注賣家、快遞的服務(wù)態(tài)度與物流的送貨速度。作為一個(gè)購(gòu)物平臺(tái),京東的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖中也出現(xiàn)了三個(gè)平臺(tái)中僅有的價(jià)格與“雙十一”活動(dòng)、“送人”與“外包裝”、“網(wǎng)上”與“評(píng)論”的強(qiáng)關(guān)聯(lián)。

      各平臺(tái)的主題共現(xiàn)網(wǎng)絡(luò)見圖9,僅以連線的粗細(xì)表示主題之間共現(xiàn)的頻率。①用戶使用感受是“你今天真好看”App最為核心的主題,其與產(chǎn)品配方之間的共現(xiàn)頻率最高,而產(chǎn)品配方與用戶使用體驗(yàn)、用戶購(gòu)買原因、適合膚質(zhì)人群四者之間均存在較強(qiáng)兩兩關(guān)聯(lián)的關(guān)系,這再次證實(shí)了用戶對(duì)于產(chǎn)品配方與使用體驗(yàn)之間的聯(lián)系最為關(guān)注,并且構(gòu)成了用戶購(gòu)買的原因,而用戶使用感受也會(huì)因用戶是否屬于產(chǎn)品配方對(duì)應(yīng)的適合膚質(zhì)人群而受到影響。②微博平臺(tái)中,產(chǎn)品代言人主題雖然在詞頻上具有較高的占比,但是整體較為孤立,僅構(gòu)成用戶購(gòu)買意向的小部分原因。商家活動(dòng)取代了適合膚質(zhì)人群成為了核心主題群中的第四個(gè)元素,且其與用戶購(gòu)買原因高頻共現(xiàn)關(guān)系與圖7中該平臺(tái)下產(chǎn)品價(jià)格主題為三個(gè)平臺(tái)中占比最高的統(tǒng)計(jì)結(jié)果相聯(lián)系,表明微博平臺(tái)用戶對(duì)于商家活動(dòng)與價(jià)格具有更高的信息傳播熱情。③京東平臺(tái)中的特色主題——購(gòu)買平臺(tái)/物流與其他幾個(gè)主題均構(gòu)成了較強(qiáng)的共現(xiàn)關(guān)系,是由京東平臺(tái)本身特有的購(gòu)物平臺(tái)基本屬性以及其在購(gòu)物平臺(tái)中自營(yíng)物流的特征屬性造成的,并非是因?yàn)槠渌黝}會(huì)受到購(gòu)買平臺(tái)/物流這一主題的影響。

      3.3? 主題情感分析

      本研究得出三個(gè)平臺(tái)各主題的情感分布,見表3。以總體占比為權(quán)重,計(jì)算得出三個(gè)平臺(tái)各主題的正面、中性、負(fù)面的加權(quán)平均情感強(qiáng)度,見圖10。

      綜合8個(gè)主題的情感強(qiáng)度,“你今天真好看”App的三極總情感強(qiáng)度分別為0.75、0.1、0.15,微博平臺(tái)的三極總情感強(qiáng)度分別為0.07、0.79、0.05,京東平臺(tái)的三極總情感強(qiáng)度分別為0.83、0.04、0.02。微博的中性評(píng)論占比極高,是由于在機(jī)器學(xué)習(xí)過程中將模型訓(xùn)練數(shù)據(jù)的營(yíng)銷推廣類文本的情感極性設(shè)為中性,這也證實(shí)了微博用戶評(píng)論文本中含有大量營(yíng)銷投放內(nèi)容。而京東的情感值正面占比最高,是由于京東作為購(gòu)物平臺(tái),其用戶具有“習(xí)慣性好評(píng)”的特有屬性,這也是在評(píng)論文本中大量出現(xiàn)一組詞。京東平臺(tái)的中性評(píng)論則相對(duì)略高則是因?yàn)轭愃啤懊舾衅つw應(yīng)該可以用”“還可以”“還行”等的評(píng)論較多,體現(xiàn)了該平臺(tái)用戶對(duì)于詳細(xì)描述自身皮膚問題的積極性相對(duì)較低?!澳憬裉煺婧每础盇pp的用戶評(píng)論文本所有主題的負(fù)面情感比例均偏高,是由于負(fù)面評(píng)論主要集中在使用產(chǎn)品會(huì)導(dǎo)致的皮膚問題。值得注意的是,產(chǎn)品價(jià)格在該平臺(tái)中的負(fù)面評(píng)論占比高達(dá)0.51,即過半用戶認(rèn)為該產(chǎn)品價(jià)格偏高,這是因?yàn)楦鶕?jù)百度指數(shù)統(tǒng)計(jì),截至2022年4月7日,不同于微博有83.21%、京東有85.94%的用戶處于20—39歲,該平臺(tái)用戶顯示出年輕化特征,73.87%的用戶年齡在29歲以下。該年齡段的用戶經(jīng)濟(jì)水平較低,而“芙麗芳絲凈潤(rùn)洗面霜”100g/125元的價(jià)格對(duì)于該年齡段的人群而言屬于較高的消費(fèi)水平??傮w而言,三個(gè)平臺(tái)各主題情感的波動(dòng)基本均趨于穩(wěn)定。

      4? 結(jié)論

      4.1? 主要發(fā)現(xiàn)

      本研究比對(duì)了護(hù)膚虛擬社區(qū)、社交平臺(tái)、購(gòu)物平臺(tái)的評(píng)論文本,根據(jù)LDA主題生成模型的聚類結(jié)果將用戶評(píng)論文本分為產(chǎn)品配方(成分/膚感)、適合膚質(zhì)人群(用戶皮膚問題)、產(chǎn)品價(jià)格、用戶使用感受(使用體驗(yàn)、使用搭配)、用戶購(gòu)買原因(為什么購(gòu)買、競(jìng)品、回購(gòu)意愿)、商家活動(dòng)6個(gè)共有主題,以及產(chǎn)品代言人、購(gòu)買平臺(tái)/物流這兩個(gè)社交平臺(tái)和購(gòu)物平臺(tái)的特有主題。總結(jié)歸納以下兩點(diǎn)主要發(fā)現(xiàn):

      (1)護(hù)膚虛擬社區(qū)對(duì)于產(chǎn)品配方、適合膚質(zhì)人群、用戶使用感受、用戶購(gòu)買原因這6個(gè)主題的評(píng)論內(nèi)容描述最為詳細(xì),涵蓋面最廣,是品牌方獲取用戶需求及其購(gòu)買決策的影響因素的最佳途徑。社交平臺(tái)中匯集了大量的廣告信息,使得真實(shí)的用戶反饋挖掘較為困難。購(gòu)物平臺(tái)用戶對(duì)于在評(píng)論中表達(dá)積極情緒的意愿較高,但詳細(xì)描述自身皮膚問題的積極性相對(duì)較低,即隱私感較強(qiáng),分享欲較低。

      (2)產(chǎn)品配方、用戶使用體驗(yàn)、用戶購(gòu)買原因等3個(gè)主題在三個(gè)平臺(tái)中均構(gòu)成了較強(qiáng)的關(guān)聯(lián)性,是三個(gè)平臺(tái)核心主題組的共有組成部分。產(chǎn)品代言人主題雖然在詞頻上具有較高的占比,但是整體較為孤立,僅構(gòu)成用戶購(gòu)買意向的小部分原因。三個(gè)平臺(tái)各自的核心主題組中,護(hù)膚虛擬社區(qū)的適合膚質(zhì)人群、社交平臺(tái)的商家活動(dòng)、購(gòu)物平臺(tái)的購(gòu)買平臺(tái)/物流與上述三個(gè)主題分別構(gòu)成四元素核心主題組,從側(cè)面體現(xiàn)了三個(gè)平臺(tái)各自的特征:護(hù)膚虛擬社區(qū)中護(hù)膚品用戶的反饋全面且針對(duì)性強(qiáng),社交平臺(tái)購(gòu)買“水軍”發(fā)布廣告信息具有更廣的消費(fèi)者觸達(dá)效果,購(gòu)物平臺(tái)擁有商品送達(dá)這一額外服務(wù),尤其是擁有自建物流的京東平臺(tái),使得這一主題更具有討論度。

      本文的研究貢獻(xiàn)包括:①將虛擬社區(qū)的用戶評(píng)論文本與社交平臺(tái)、購(gòu)物平臺(tái)同一產(chǎn)品下的用戶評(píng)論文本通過主題聚類、關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)、主題共現(xiàn)網(wǎng)絡(luò)、情感分析進(jìn)行對(duì)比研究,得出了內(nèi)容傾向的異同;②填補(bǔ)了對(duì)虛擬生活社區(qū)的研究少有涉及的空缺;③對(duì)用戶參與在商業(yè)方面的實(shí)際應(yīng)用價(jià)值給出了8個(gè)主題,亦可作為衡量指標(biāo)構(gòu)建用戶評(píng)論文本價(jià)值評(píng)定模型進(jìn)行用戶價(jià)值共創(chuàng)方面更為深入的研究。

      4.2? 結(jié)果應(yīng)用

      當(dāng)下,護(hù)膚品行業(yè)正經(jīng)歷著重大改革,自2021年1月1日起施行的《化妝品監(jiān)督管理?xiàng)l例》中強(qiáng)調(diào)了產(chǎn)品功效的實(shí)證和配方的安全性。因此,除護(hù)膚品行業(yè)已有的牛角膜混濁和通透實(shí)驗(yàn)(BCOP)、雞胚絨毛尿囊膜試驗(yàn)(HET-CAM/CAMVA)等產(chǎn)品安全性實(shí)驗(yàn),品牌方企業(yè)在進(jìn)行新品配方設(shè)計(jì)或已有商品優(yōu)化時(shí),應(yīng)正視并積極獲取護(hù)膚虛擬社區(qū)中對(duì)于用戶已有的皮膚問題與反饋產(chǎn)品使用問題的負(fù)面情緒評(píng)論文本??紤]到用戶對(duì)于產(chǎn)品配方與使用體驗(yàn)之間的聯(lián)系最為關(guān)注,并且構(gòu)成了用戶購(gòu)買的原因,而用戶使用感受也會(huì)因用戶是否屬于產(chǎn)品配方對(duì)應(yīng)的適合膚質(zhì)人群而受到影響,品牌方企業(yè)需給予足夠的重視并進(jìn)行相應(yīng)的配方改良,或注明適用人群,從而從根源上降低負(fù)面評(píng)論的出現(xiàn)頻率,提高產(chǎn)品用戶滿意度與品牌信任度,從而提高產(chǎn)品銷量。

      購(gòu)物平臺(tái)本身與消費(fèi)極為密切的特性決定了該平臺(tái)的用戶獲取商家活動(dòng)與價(jià)格變動(dòng)信息十分便利,而護(hù)膚虛擬社區(qū)用戶雖然對(duì)產(chǎn)品價(jià)格較為敏感,卻對(duì)商家活動(dòng)主題少有提及,品牌方可抓住此痛點(diǎn),與護(hù)膚虛擬社區(qū)協(xié)調(diào)在產(chǎn)品詳情頁(yè)加入購(gòu)物平臺(tái)官方旗艦店的鏈接與最新活動(dòng)簡(jiǎn)介,拉動(dòng)護(hù)膚虛擬社區(qū)用戶向購(gòu)物平臺(tái)用戶的轉(zhuǎn)化。

      參考文獻(xiàn):

      [1] 王琳, 梁孟華.基于知識(shí)發(fā)布的網(wǎng)絡(luò)社區(qū)用戶行為規(guī)律研究——以Keep健康社區(qū)為例[J].情報(bào)探索, 2022(1): 1-9.

      [2] 楊瑞仙, 張廣軼.學(xué)術(shù)虛擬社區(qū)知識(shí)交流過程與機(jī)理研究[J].現(xiàn)代情報(bào), 2020, 40(10): 52-61.

      [3] 陳秀秀.基于微博評(píng)論的虛擬社區(qū)互動(dòng)性對(duì)消費(fèi)者品牌態(tài)度的影響及機(jī)制研究[D].江門: 五邑大學(xué), 2019.

      [4] 譚春輝, 李玥澎.基于用戶評(píng)論與Kano模型的虛擬學(xué)術(shù)社區(qū)優(yōu)化策略研究[J].情報(bào)理論與實(shí)踐, 2021, 44(11): 108-115.

      [5] 周陽(yáng), 譚春輝, 朱宸良, 等.基于扎根理論的虛擬學(xué)術(shù)社區(qū)用戶參與行為研究——以小木蟲為例[J].情報(bào)科學(xué), 2022, 40(1): 176-183.

      [6] CHEN H, LIU F, WEN Y, et al. Compilation and application of the scale of sustainable knowledge sharing willingness in virtual academic community during the times of the coronavirus pandemic (COVID-19)[J]. Front psychol, 2021(12): 627833.

      [7] TABISH M, BASHIR M A, ALAM M M, et al. The role of virtual community participation and engagement in building brand trust: evidence from Pakistan business schools[J]. The journal of Asian finance, economics and business, 2022, 9(3): 399-409.

      [8] CARA P, BODKIN D. CHARLES. Online retail store community engagement and its impact on purchase intentions in the context of online reviews[J]. International journal of online marketing, 2022, 12(1): 1-15.

      [9] CHAKRABORTY U. The impact of source credible online reviews on purchase intention[J]. Journal of research in interactive marketing, 2019, 13(2): 401-414.

      [10] 屈慧君.互動(dòng)活力與信任的鏈?zhǔn)街薪樾?yīng)——微博虛擬品牌社區(qū)用戶參與動(dòng)機(jī)對(duì)購(gòu)買意愿的影響[J].鄭州大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版), 2019, 52(2): 113-117.

      [11] 郭恒睿, 王中卿, 朱巧明, 等.基于半監(jiān)督學(xué)習(xí)的中文社交文本事件聚類方法[J].中文信息學(xué)報(bào), 2022, 36(2): 152-159.

      [12] 謝紅.基于詞頻比的改進(jìn)Jaccard系數(shù)文本相似度計(jì)算[J].內(nèi)江科技, 2021, 42(8): 27-28.

      [13] 王春柳, 楊永輝, 鄧霏, 等.文本相似度計(jì)算方法研究綜述[J].情報(bào)科學(xué), 2019, 37(3): 158-168.

      [14] 邱先標(biāo), 陳笑蓉.一種基于特征加權(quán)的文本相似度計(jì)算算法[J].貴州大學(xué)學(xué)報(bào)(自然科學(xué)版), 2018, 35(1): 63-68.

      [15] BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet Allocation[J]. Journal of machine learning research, 2003, 3(4/5): 993-1022.

      [16] HAJJEM M, LATIRI C. Combining IR and LDA topic modeling for filtering microblogs[J]. Procedia computer science, 2017(112): 761-770.

      [17] 李璐萍, 趙小兵.基于主題模型的主題發(fā)現(xiàn)方法研究綜述[J].中央民族大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 30(2): 59-66.

      [18] 何琳, 馬曉雯, 喻雪寒, 等.典籍事件觸發(fā)動(dòng)詞識(shí)別研究:基于《左傳》的文本實(shí)驗(yàn)[J].圖書情報(bào)工作, 2022, 66(5): 133-141.

      [19] 王慧, 孫國(guó)道, 丁偉杰, 等.司法判決文書數(shù)據(jù)中演化模式的挖掘和可視分析[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2022, 34(3): 470-481.

      [20] 張雷, 譚慧雯, 張璇, 等.基于LDA模型的高校師德輿情演化及路徑傳導(dǎo)研究[J].情報(bào)科學(xué), 2022, 40(3): 144-151.

      [21] 崔寧, 趙宗良, 吳瑞雪.基于LDA主題模型和偏序集的在線商品評(píng)論研究[J].情報(bào)探索, 2021(12): 71-76..

      [22] 黃仿元.利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)對(duì)醫(yī)院評(píng)價(jià)的情感分析[J].信息技術(shù)與信息化, 2021(2): 37-39.

      [23] 尚永敏, 趙榆琴.基于機(jī)器學(xué)習(xí)的在線評(píng)論情感分析與實(shí)現(xiàn)[J].大理大學(xué)學(xué)報(bào), 2021, 6(12): 80-86.

      [24] 艾媒數(shù)據(jù)中心.2022年中國(guó)洗面奶消費(fèi)者行為洞察[EB/OL].[2022-04-05]. https: //data.iimedia.cn/ 31026926/31026945/44290232.

      [25] 21經(jīng)濟(jì)網(wǎng).微博回港二次上市:75%用戶為90后 社交“元老”開啟第二春?[EB/OL]. [2022-04-05]. http: //www.21jingji.com/article/20211119/herald/55ae24eb120e9a397954803e832d4ada.html.

      [26] CSDN.折肘法+困惑度確定LDA主題模型的主題數(shù)[EB/OL]. [2022-04-05]. https://blog.csdn.net/weixin_ 43343486/article/details/109255165.

      [27] 池毛毛, 潘美鈺, 王偉軍.共享住宿與酒店用戶評(píng)論文本的跨平臺(tái)比較研究:基于LDA的主題社會(huì)網(wǎng)絡(luò)和情感分析[J].圖書情報(bào)工作, 2021, 65(2): 107-116.

      Abstract: [Purpose/Significance] The purpose of this article is to study the similarities and differences in the evaluation content of users of virtual life communities, social platforms and shopping platforms for the same product. [Method/Process] By selecting the three platforms of You Really Beautiful App, Weibo, and JD.com as the experimental objects, 54 071 user comment texts related to facial cleanser as basic skin care products were collected, using LDA topic generation model, co-occurrence network and machine learning-based sentiment analysis method, a multi-platform comparative analysis of user comment texts is carried out. [Result/Conclusion] The study found that there are similarities and differences in the topic feature words, co-occurrence network and topic sentiment of eight comment topics on the three platforms, and the content tendencies conform to the characteristics of each platform.

      Keywords: multi-platform comparison? ? text topic clustering? ? co-occurrence network analysis? ? emotion analysis

      猜你喜歡
      情感分析
      基于大規(guī)模文本數(shù)據(jù)情感挖掘的企業(yè)輿情研究
      面向應(yīng)用比較的用戶評(píng)論挖掘工具的設(shè)計(jì)與實(shí)現(xiàn)
      基于微博文本的情感傾向分析
      軟件工程(2016年12期)2017-04-14 02:05:53
      基于word2vec擴(kuò)充情感詞典的商品評(píng)論傾向分析
      基于語(yǔ)義的互聯(lián)網(wǎng)醫(yī)院評(píng)論文本情感分析及應(yīng)用
      基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)對(duì)象抽取研究
      基于SVM的產(chǎn)品評(píng)論情感分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
      基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
      在線評(píng)論情感屬性的動(dòng)態(tài)變化
      歌曲《我的深情為你守候》的情感分析與演唱詮釋
      越西县| 滦平县| 武冈市| 荥经县| 永顺县| 五台县| 隆德县| 平湖市| 抚顺县| 麦盖提县| 岳阳市| 保亭| 平度市| 张家界市| 娄底市| 凌云县| 曲周县| 青州市| 平阳县| 沽源县| 大港区| 杭州市| 玉溪市| 龙泉市| 遂平县| 铜梁县| 九寨沟县| 固安县| 中宁县| 牟定县| 龙门县| 岗巴县| 辉南县| 都兰县| 澄城县| 新密市| 林口县| 太仓市| 苏州市| 广平县| 达拉特旗|