◆張郅奕 朱 娟 李永蓮
用戶畫像是指構建在系列數(shù)據(jù)基礎之上的用戶目標模型,是虛擬化的用戶[1];早期被用于產(chǎn)品設計領域,是對特定群體真實狀況的描述,是有效刻畫目標用戶及其需求的有效工具[2]。隨著互聯(lián)網(wǎng)與大數(shù)據(jù)技術的發(fā)展,最初基于虛構視角的用戶畫像[3]逐漸向目標導向、角色視角、參與視角以及數(shù)據(jù)視角[4]轉變。
現(xiàn)有用戶畫像的研究方法主要包括基于用戶行為的方法、基于用戶興趣偏好的方法、基于用戶主題的畫像方法以及基于人格特性與用戶情緒的方法[5]。其中基于用戶興趣偏好的方法是當前學界關注的熱點,也符合網(wǎng)絡負面情緒傳播的情境特征。國內外學者就用戶畫像應用方法進行了大量研究,基于各類模型探討用戶興趣和需求點,以提供更加精準的服務和問題解決方案。既有研究雖然提供了方法基礎,但未關注時間等因素對用戶興趣以及關注度的影響,同時也缺少對情景興趣的關注[6~9]。
網(wǎng)絡負面情緒傳播具有周期性[10],學界早已從生命周期階段研究網(wǎng)絡傳播,如馮湘君等將網(wǎng)絡傳播分為潛伏期、爆發(fā)期、后遺癥期[11];康偉將網(wǎng)絡危機分為形成、發(fā)展、爆發(fā)以及消亡四個階段[12];夏雨禾將網(wǎng)絡危機分為孕育期、傳播期、高漲期與衰退期[13]。其本質就是不同時間、不同階段對某類主體某一方面狀態(tài)的描述與分析??梢姡芷诶碚摫举|包含著時間要素與情景要素,而這可以彌補現(xiàn)有基于用戶興趣研究方法缺少時間、情景要素的不足。因此,本文嘗試從生命周期視角對網(wǎng)絡負面情緒群體用戶畫像構建進行研究,從時間、情景要素出發(fā)分析網(wǎng)絡負面情緒傳播周期與規(guī)律,并基于此探析網(wǎng)絡負面情緒群體用戶畫像的構建過程與方法。
網(wǎng)絡負面情緒群體研究,是網(wǎng)絡虛擬社群中的一部分。網(wǎng)絡虛擬社群,是圍繞相似興趣、需求以及情感,依托于互聯(lián)網(wǎng),通過自媒體平臺等實現(xiàn)社會化互動的、新型社會生活單位與數(shù)字化生存空間[14]。由于缺少社會約束,網(wǎng)絡虛擬社群內的自我規(guī)范意識與其他機制雙重弱化[15],使得虛擬社會中的群體比現(xiàn)實社會中的群體更容易形成情緒場域,感染群體的情緒[16],更容易激發(fā)潛在負面情緒在傳播與宣泄[17]。隨著負面情緒在社群內乘數(shù)效應的惡化與疊加,消極的情緒狀態(tài)更易產(chǎn)生于傳播,提高了群體心理的非理性傾向[18]。因此精準掌握虛擬社區(qū)中網(wǎng)絡負面情緒群體的屬性、行為、偏好以及情緒,具有重要的理論意義與現(xiàn)實意義。
用戶畫像理論為實現(xiàn)網(wǎng)絡負面情緒群體的精準刻畫提供了支持。本文認為網(wǎng)絡負面情緒群體用戶畫像,是為了深入了解網(wǎng)絡負面情緒用戶特征、預測用戶的行為等,依托于海量、真實數(shù)據(jù)描述用戶特征與偏好,構建目標群體用戶模型,主要目標是實現(xiàn)網(wǎng)絡負面情緒傳播的精準預警與對相關群體的行為引導。網(wǎng)絡負面情緒群體用戶畫像構建,主要是通過將“數(shù)據(jù)”映射到“用戶標簽”實現(xiàn)的,這一過程也是典型的以數(shù)據(jù)驅動的用戶畫像構建。網(wǎng)絡負面情緒群體用戶畫像構建的本質如圖1所示。
圖1 網(wǎng)絡負面情緒群體用戶畫像
首先,收集相關數(shù)據(jù)進行融合。主要是指運用物聯(lián)網(wǎng)、5G 等新興技術手段,對涉及到的海量數(shù)據(jù)進行收集。通過數(shù)據(jù)層融合、語義層融合以及服務層融合實現(xiàn)數(shù)據(jù)的融合,將清洗過的數(shù)據(jù)數(shù)字化,將實體從“物理空間”映射到“數(shù)字空間”。其次,用戶畫像的“標簽體系”是一個多維度的、復雜的體系。用戶畫像的本質是“標簽化”,具體過程也是構建“標簽體系”的過程。一般基于用戶的屬性數(shù)據(jù)、行為數(shù)據(jù)、偏好數(shù)據(jù)等,構建用戶不同的標簽體系,實現(xiàn)網(wǎng)絡負面情緒群體相關數(shù)據(jù)的標簽化。再次,通過構建知識圖譜,實現(xiàn)用戶各類“標簽”之間的關聯(lián)。單獨的“標簽”通過知識圖譜相互關聯(lián),從而對用戶情況進行多維分析。最后,運用系列可視化工具,對用戶畫像進行可視化??梢暬菍⒂脩舢嬒襁M行實際運用的最后步驟,也是實現(xiàn)用戶畫像運用的重要手段。
在數(shù)據(jù)驅動背景下,網(wǎng)絡負面情緒群體用戶畫像主要具有可迭代性、實時性與聚類性三大特征??傻灾傅氖蔷W(wǎng)絡用戶的發(fā)文、轉發(fā)、評論行為中,產(chǎn)生的動態(tài)性和交互性特征。實時性指的是網(wǎng)絡用戶在不同時間點可能會發(fā)生偏好轉變的情況,即便是針對同一主題,用戶的偏好程度也有所不同。聚類性指的是用戶與用戶之間雖然存在基本屬性和行為偏好等不同,但仍然存在一定的共性,能夠實現(xiàn)群體化聚類的特點。
信息生命周期是指信息從出現(xiàn)到使用最后到老化消亡的動態(tài)、循環(huán)過程,該過程一般伴隨價值形成與不斷增值[19]。網(wǎng)絡負面情緒也存在一定的生命周期,以此為基礎構建網(wǎng)絡負面情緒群體用戶畫像既有理論深意更有實踐需求?;谏芷诘木W(wǎng)絡負面情緒群體用戶畫像構建,主要包括如下過程:基于生命周期的網(wǎng)絡負面情緒測算,以此為基礎進行用戶活躍度排序,實現(xiàn)網(wǎng)絡負面情緒群體用戶畫像模型構建;根據(jù)構建的用戶畫像模型,結合平臺數(shù)據(jù)鎖定目標用戶群;結合標簽體系對用戶畫像進行分析。具體過程如圖2 所示。
圖2 數(shù)據(jù)畫像構建總體框架
基于生命周期理論,構建網(wǎng)絡負面情緒傳播過程中的用戶模型,如圖3 所示。根據(jù)箭頭了解整個用戶的數(shù)據(jù)走向,把平臺用戶的全部數(shù)據(jù)導入模型中進行分析。這里使用到了COX 生存分析的算法,可以幫助我們分析用戶的生存時間,進而得到平臺全部用戶的生命周期分布。
圖3 基于生命周期模型的網(wǎng)絡負面情緒群體用戶畫像模型構建
1.網(wǎng)絡負面情緒群體生命周期測算
(1)多源異構數(shù)據(jù)收集與融合
網(wǎng)絡大數(shù)據(jù)是包括微博、網(wǎng)絡論壇、微信、微視頻等平臺中體現(xiàn)民眾觀點與態(tài)度的系列數(shù)據(jù),不僅包括文本、圖片、音視頻等生產(chǎn)內容數(shù)據(jù),還包括關注、轉發(fā)、點贊、分享等行為數(shù)據(jù)[20]。除了具有海量、多源異構、低密度等大數(shù)據(jù)一般特征外,還呈現(xiàn)出多維、多層復雜關聯(lián)性、實時交互性和強大描述性等特征?;诖?,針對某一主題,運用Python 進行編程,對微博、網(wǎng)絡論壇、微信、微視頻等平臺中相關主題信息進行搜集,實現(xiàn)多源異構網(wǎng)絡大數(shù)據(jù)的收集與整理。收集后的數(shù)據(jù)在結構、標準等方面存在較大差異,因此需要對多源異構大數(shù)據(jù)進行融合與集成,以進一步進行數(shù)據(jù)處理??梢越梃bDasarathy 信息融合模型[21],從數(shù)據(jù)層融合、語義層融合以及服務層融合實現(xiàn)大數(shù)據(jù)的融合,實現(xiàn)多源異構數(shù)據(jù)的標準性與統(tǒng)一性[22]。
(2)基于COX 模型的生命周期測算
COX 模型,又稱作比例危險度模型(Proportionla Hazard Model),是英國統(tǒng)計學家D R Cox 在1972 年提出的關于生存分析的重要模型,能夠分析不同自變量對生存時間的影響,根據(jù)危險因素的影響可預測生存率。應用于本文,COX 模型可以用來預測網(wǎng)絡負面情緒傳播的周期和爆發(fā)情況。
2.用戶活躍程度排序。結合網(wǎng)絡負面情緒生命周期預測情況,對處于爆發(fā)階段的情緒狀態(tài)進行計算、排序與預測,從而對處于爆發(fā)階段的群體進行精準預警,并分析網(wǎng)絡負面情緒爆發(fā)階段不同用戶的活躍程度。具體操作如下:
(1)負面情緒計算與排序。首先進行負面情緒分析,通過將網(wǎng)絡中民眾情緒分為正面情感、負面情感和中立情感,借鑒Shen 等提出中文網(wǎng)絡情感框架模型,通過構建態(tài)度詞典、權重詞典、否定詞典、程度詞典和鏈接詞詞典來計算網(wǎng)絡情感強度[23]。其次,進行負面情緒計算。根據(jù)Aging Theory 主題生命周期模型[24],一般將事件發(fā)展映射為能量值表示當前狀態(tài)以及預測可能處于的生命狀態(tài)。能力值的延續(xù),需要依托營養(yǎng)素的補充[25]。負面情緒營養(yǎng)素計算式,需要考慮用戶影響力情況,而網(wǎng)絡中這種影響力可以通過轉發(fā)和評論行為來體現(xiàn)[26]。最終,通過情感、用戶影響力以及訓練好的模型實現(xiàn)負面情緒計算,并對其進行排序。
(2)負面情緒預警。情緒狀態(tài)應包括構建預警模式庫以及負面情緒可視化兩部分。預警模式庫通過預先定義負面情緒預警模式,對當前負面情緒進行全方面分析,進而啟動相應預警模式。通過與預警符號與各種顏色,強化當前負面情緒預警的不同狀態(tài)。參考國際慣例與網(wǎng)絡負面情緒的實際情況,可以將負面情緒預警分為初級預警(四級)、中級預警(三級)、高級預警(高級)與特級預警(一級),分別使用藍色、黃色、橙色與紅色對應表示,如圖4 所示。
圖4 負面情緒預警等級示意圖
(3)負面情緒預警用戶活躍度排序
聚類是常見的數(shù)據(jù)挖掘方法,兩步聚類可自動確定最佳類別數(shù)量。通過兩步聚類分別對直接在網(wǎng)絡發(fā)布相關信息用戶,以及通過評論參與討論用戶進行聚類分析,得到直接發(fā)布網(wǎng)絡信息用戶和通過評論參與討論該主題用戶的特征[27]。根據(jù)聚類后的結果,對原始網(wǎng)絡信息用戶的平均等級、關注數(shù)以及平均信息數(shù)計算該用戶在以往實踐中的平均活躍度,計算方法見公式(1),并以此為基礎對不用用戶活躍度進行排列。
其中,Xti表示第i 類原始網(wǎng)絡用戶平均活躍度。Ati表示第i 類原始網(wǎng)絡用戶的平均等級,Atmax表示原始網(wǎng)絡用戶的最高平均等級。Bti表示第i 類原始網(wǎng)絡用戶的平均關注數(shù),表示第i 類原始網(wǎng)絡用戶最高平均關注數(shù)。表示第i 類原始網(wǎng)絡用戶的平均信息總數(shù),Ctmax表示原始網(wǎng)絡用戶的最高平均信息總數(shù)。
3.用戶活躍度數(shù)據(jù)畫像模型?;谏鲜鲇嬎?,可以構建多層面用戶畫像。一般來說,我們關注總體情況與極端情況,因此本部分主要解決總體用戶畫像、高活躍度用戶畫像與低活躍度用戶畫像。
(1)總體用戶標簽體系。用戶畫像的本質是用戶信息標簽化,主要通過用戶社會屬性、行為習慣、偏好特征等對用戶特征進行刻畫,從而進行分析統(tǒng)計。按照用戶畫像數(shù)據(jù)標簽體系,借鑒趙宏田關于數(shù)據(jù)畫像標簽的研究成果[28],本文主要從用戶屬性維度、用戶行為維度與社交屬性維度構建排名后的微博用戶標簽體系。其中,用戶屬性維度是數(shù)據(jù)畫像的基礎,主要包括用戶的年齡、性別、注冊時間、注冊狀態(tài)、城市、活躍登錄地點等。用戶行為維度,主要通過用戶行為挖掘主要偏好與特征,主要包括發(fā)文、轉發(fā)、點贊、評論、高頻活躍時間段等行為。社交屬性維度,是用于了解用戶社交關系、偏好等方面內容,主要包括活躍時間、活躍地點、關注人數(shù)、粉絲人數(shù)、文章被轉載次數(shù)等。
(2)高(低)活躍度用戶畫像。不同活躍度用戶的畫像選取標簽的維度都是相同的,只是不同標簽的數(shù)值有所差異,因此本文統(tǒng)一對兩種極端活躍度用戶畫像的標簽維度進行描述。主要使用年齡、性別、學歷、行為等對其進行描述。年齡、性別、學歷等基本信息描述用戶的基本屬性特征,并以此為基礎確定目標用戶群體。行為維度主要描述網(wǎng)絡平臺用戶發(fā)帖數(shù)量、轉發(fā)數(shù)量、評論、被轉發(fā)數(shù)量等行為,并以此判斷不同活躍度用戶的行為特征,并以此預測該用戶對網(wǎng)絡負面情緒的影響情況。
基于用戶活躍度畫像建模,運用Python 爬取各類網(wǎng)絡平臺用戶數(shù)據(jù),并將這些數(shù)據(jù)與數(shù)據(jù)畫像模型相關聯(lián),運用大數(shù)據(jù)分析方法鎖定目標用戶群。本文將場景設置為微博平臺用戶負面情緒的傳播,研究的目標是提前預測負面情緒爆發(fā)。因此,處于負面情緒爆發(fā)邊界的用戶才是目標群體。
鎖定目標微博用戶后,需要通過分析用戶數(shù)據(jù)畫像、了解用戶行為特征,從而制定具有針對性的負面情緒治理措施。首先,分析各標簽的分布情況,主要對不同活躍度用戶的年齡、性別、學歷以及行為(發(fā)文、轉發(fā)、評論等)進行分析,通過模型輸出,可以獲取目標微博用戶群的畫像特征。其次,基于上述分析的目標微博用戶數(shù)據(jù)畫像特征,給出網(wǎng)絡負面情緒管理的相關信息,如用戶的性別、年齡決定了管理策略與溝通的方式;轉發(fā)時間、評論次數(shù)、發(fā)文數(shù)量決定了介入時機。
基于生命周期模型的用戶畫像構建,能夠發(fā)現(xiàn)并預測負面情緒用戶的動態(tài),及時干預和處理,在網(wǎng)絡安全治理和輿情管控上具有突出的現(xiàn)實意義。
本文將用戶畫像應用于網(wǎng)絡負面情緒用戶精準鎖定中,構成對網(wǎng)絡負面情緒用戶動態(tài)興趣的識別,以及對其需求的預測。結合用戶畫像,通過碎片化挖掘、語義化概述、關聯(lián)化銜接對網(wǎng)絡資源進行處理,深入掌握網(wǎng)絡負面情緒群體特征,從而實現(xiàn)網(wǎng)絡負面情緒群體用戶畫像與網(wǎng)絡資源語義標簽相關聯(lián)、相映射。①建立實時監(jiān)測機制:通過對用戶畫像進行分析與挖掘,實時跟蹤和分析社交媒體上的用戶行為和情緒。政府和相關機構可以建立強大的實時社交媒體監(jiān)測系統(tǒng)。②預測用戶情緒發(fā)展。分析用戶的群體行為,將用戶行為標簽化,通過與其他數(shù)據(jù)的結合分析來提供客觀評價與預測群體情緒發(fā)展趨勢。③及時進行內容投放。對于預測需要治理的負面情緒群體,針對核心用戶采取個性化的精準服務,有效實現(xiàn)精準治理。
網(wǎng)絡負面情緒群體的用戶畫像構建,有利于實現(xiàn)對用戶的個性化與精準化的管理與情緒引導的目的。網(wǎng)絡平臺與政府能夠實現(xiàn)精準鎖定,識別潛在風險。①個性化干預:基于用戶畫像的情緒識別,政府可以制定個性化的情緒引導策略。根據(jù)不同群體的情感特點,為其提供適當?shù)那榫w引導和干預措施。政府可以通過社交媒體、官方網(wǎng)站等渠道向公眾提供情感疏導信息,包括積極情緒的培養(yǎng)、減輕壓力的方法等。②提供心理健康支持:負面情緒對個體的心理健康有一定影響。政府可以建立心理健康支持計劃,通過線上或線下方式為受到負面情緒影響的群體提供專業(yè)心理輔導。用戶畫像分析可以幫助政府更準確地識別出受情緒困擾的群體,有針對性地提供幫助。③建立情感表達平臺:政府可以鼓勵公眾利用情感表達平臺,以多種方式來宣泄情緒,為公眾提供一個安全、積極的情感表達空間,減輕壓力和情緒不良。
通過對用戶畫像的綜合分析,政府可以更準確地捕捉到負面情緒的迅速蔓延,為有效的輿論管理提供便利。①強化信息辟謠:在負面情緒傳播的背景下,政府應采取積極措施來應對虛假信息和不實傳聞。通過用戶畫像分析,政府可以更好地了解公眾關心的問題,迅速提供真實、準確的信息來消除不實傳聞,減少恐慌情緒。②設立專門反饋渠道:政府可以建立專門的反饋渠道,接受公眾關于負面情緒的反饋。借助用戶畫像分析,政府可以深入了解公眾對特定事件或問題的情緒反應和需求。這些反饋可以幫助政府更好地理解公眾的擔憂,并針對性地制定合適的信息傳播和干預策略。③快速消除負面影響:對業(yè)已形成的大范圍負面輿論,既可以通過用戶畫像建構,精準識別負面情緒的癥結并消除影響,又可以借助網(wǎng)絡平臺和社交媒體交互性傳遞真實有效信息。
總之,具體的負面情緒群體用戶畫像,與以人為本的治理理念、以用戶為中心的服務理念結合,使得實踐決策有據(jù)可依,為下一階段的工作提供指導,為社會的信息服務發(fā)展提供科學決策。