邰楊芳 王紫瓊 劉慧芳 李迎娟
山西醫(yī)科大學(xué)管理學(xué)院 太原 030001
用戶標注行為是指互聯(lián)網(wǎng)用戶對網(wǎng)絡(luò)信息資源添加標簽、發(fā)表評論、打分和進行等級評定等過程[1]。在可向用戶提供標注功能的網(wǎng)站或網(wǎng)絡(luò)信息資源管理系統(tǒng)中,不同的用戶可以對同一資源進行標注,并且標注行為的結(jié)果向系統(tǒng)中其他用戶開放。隨著參與資源標注活動的系統(tǒng)用戶數(shù)量的不斷增加,標注所形成的標簽、評論和等級評價結(jié)果反映了網(wǎng)絡(luò)大眾對網(wǎng)絡(luò)信息資源或服務(wù)的共同理解或一致評價,這便使用戶的標注行為具有了社會性。因而,網(wǎng)絡(luò)用戶的標注行為也被稱為社會化標注行為,具有社會化標注功能的網(wǎng)站系統(tǒng)也被稱為社會化標注系統(tǒng)。
從用戶的角度來看,對所分享和關(guān)注的信息資源打標簽或發(fā)表評論等標注行為,是對資源的內(nèi)容、形式等特征的揭示和個人觀點、看法等的表達,這一過程實現(xiàn)了網(wǎng)絡(luò)信息資源的有序化和用戶的自我表達,為今后對信息資源的查找利用和其他用戶發(fā)現(xiàn)該資源提供了便利和有益參考。從社會化標注系統(tǒng)的角度,用戶的標注行為數(shù)據(jù)可反映用戶的興趣偏好、標注行為規(guī)律及用戶對系統(tǒng)功能和服務(wù)(包括所提供的信息資源)的態(tài)度、評價和意見等,為系統(tǒng)功能和服務(wù)的優(yōu)化以吸引更多的用戶訪問和使用該資源平臺提供有價值的信息。因此,對社會化標注系統(tǒng)中用戶標注行為的研究一直是網(wǎng)絡(luò)環(huán)境中用戶信息行為研究的重要內(nèi)容。本文以豆瓣讀書平臺的健康類圖書資源的標簽、短評和用戶對評論文本的點贊支持等標注行為數(shù)據(jù)為分析對象,挖掘用戶的標注行為規(guī)律,為社會化標注系統(tǒng)的有效管理和系統(tǒng)功能優(yōu)化提供參考。
通過文獻調(diào)研發(fā)現(xiàn),目前關(guān)于網(wǎng)絡(luò)用戶標注行為的研究,主要包括兩大類:基于標簽的用戶標注行為分析和基于評論的用戶標注行為分析。
基于標簽的用戶標注行為分析以用戶為資源添加的標簽為數(shù)據(jù)對象分析、推斷用戶的標注行為特征或規(guī)律并加以應(yīng)用。主要內(nèi)容包括:通過標簽的類別或功能分析用戶的標注動機[2,3];分析用戶對標簽的使用特征(如所用標簽的數(shù)量、標注頻次和標簽重用等)并據(jù)此探討當(dāng)所標注的資源類型、個人背景信息甚至使用的社會化標注系統(tǒng)不同時,用戶標簽標注行為的差異及影響因素[4-6];基于標簽的內(nèi)容和形式特征挖掘用戶的興趣偏好和標簽的選擇偏好等信息,據(jù)此探討面向用戶的個性化服務(wù)問題[7,8]。包括向用戶推薦標注某資源時可選用的標簽、推薦符合其興趣偏好的資源、推薦同趣好友,基于用戶標注行為特點進行系統(tǒng)功能的優(yōu)化和發(fā)起相關(guān)活動以吸引更多用戶和增加用戶粘性等。
通過用戶的評論信息可了解用戶對所獲得的資源和服務(wù)等的關(guān)注焦點、評價和滿意度等,因此用戶的評論信息和評論行為的價值也受到業(yè)界和學(xué)界的關(guān)注。在信息資源管理領(lǐng)域,研究者除了關(guān)注用戶評論所反映的資源屬性特征之外,用戶對資源批注評論文本、對已有評論表示支持或反對等的評論行為也成為值得關(guān)注的有價值信息。相關(guān)的評論行為研究主要包括:對用戶發(fā)表、回復(fù)、點贊評論數(shù)據(jù)的統(tǒng)計分析,反映用戶評論行為的活躍度并揭示用戶間的互動行為特征[9,10];基于評論文本的內(nèi)容特征發(fā)現(xiàn)用戶的興趣偏好、進行個性化推薦服務(wù)[11,12];基于評論文本的形式特征(詞匯量、段落數(shù)、文本長度)、情感特征、資源的星級評分及評論者的個人特征等信息探究影響用戶關(guān)于評論的感知有用性的主要因素[13,14];也有少部分學(xué)者關(guān)注用戶評論行為之間的關(guān)系。如,馬松岳等[15]通過分析豆瓣電影版塊中電影的評論文本情感值與用戶對電影標注的星級評分二者之間的量化關(guān)系,發(fā)現(xiàn)用戶評論評價與打分評價行為之間具有一致性。
已有關(guān)于社會化標注系統(tǒng)的用戶標注行為的研究普遍將用戶為資源標注的標簽和對資源進行的評論作為兩項獨立的數(shù)據(jù)進行問題的探討;在評論行為方面,少量涉及評論行為之間關(guān)系的研究還處于初步嘗試階段,僅涉及兩個變量之間的相關(guān)性分析。對社會化標注系統(tǒng)中網(wǎng)絡(luò)用戶標注行為信息的分析和利用有限。
充分利用社會化標注系統(tǒng)中的用戶標注行為信息,全面了解用戶的標注行為特點及內(nèi)在規(guī)律,有利于社會化標注系統(tǒng)對系統(tǒng)中資源的更有效管理和為用戶提供更為滿意的資源和服務(wù)。為此,本文在界定社會化標注系統(tǒng)中用戶標注行為及類型的基礎(chǔ)上,基于用戶為資源標注標簽和進行評論的多類型標注行為數(shù)據(jù),挖掘用戶的標注行為特征及規(guī)律,并在此基礎(chǔ)上提出社會化標注系統(tǒng)功能及服務(wù)的優(yōu)化建議。
社會化標注行為是指用戶與社會化標注系統(tǒng)資源進行交互的具體操作[16]。隨著Web2.0技術(shù)的深入應(yīng)用和社會化標注系統(tǒng)功能的不斷發(fā)展和完善,用戶的標注行為的外延也在不斷發(fā)展。根據(jù)當(dāng)前社會化標注系統(tǒng)中用戶與信息資源的互動關(guān)系,用戶為資源標注標簽、為資源添加評論、對資源的評分或星級評定以及對其他用戶關(guān)于資源的評論所進行的點贊支持或有用性投票行為均屬于標注行為的范疇。按照標注行為形成的標注結(jié)果,本文將其分為用戶的標簽行為和評論行為。
標簽行為即是用戶在網(wǎng)絡(luò)環(huán)境中根據(jù)自己的認知選擇系統(tǒng)中的已有標簽或自定義的標簽標識資源的過程。標簽行為是社會化標注系統(tǒng)用戶最基本和最主要標注行為,其本質(zhì)及出發(fā)點是為了實現(xiàn)大眾參與的對海量網(wǎng)絡(luò)信息資源的有效組織。通過為資源添加的標簽,網(wǎng)絡(luò)用戶不僅可以在個人信息空間內(nèi)組織、管理、檢索信息資源,還可以方便、快捷地獲得與自己使用的標簽相同的其他被標注資源和標注資源的用戶,在促進知識分享的同時,也拓展了用戶之間溝通交流的渠道。
評論行為是指用戶在閱讀資源后表達有關(guān)資源的內(nèi)容、形式或閱讀收獲或閱讀目標達成情況等信息的過程。社會化標注系統(tǒng)中用戶的評論行為主要體現(xiàn)為用戶對感興趣的資源進行文本評論,還包括對資源進行打分(星級評分)、對他人評論文本內(nèi)容的“有用性”感知(選擇其他用戶的評論對自己是否“有用”)。在“豆瓣讀書”系統(tǒng)中,用戶可對感興趣的圖書資源發(fā)表350 字以內(nèi)的短評;以星級評分的形式對圖書資源進行評價,一星到五星分別代表很差、較差、還行、推薦和力薦;還可通過“有用”按鈕對短評文本進行標注,“有用”的個數(shù)也叫短評支持度,是指支持該評論的用戶數(shù),個數(shù)越多說明該短評文本的信息內(nèi)容越有參考價值。
無論是用戶的標簽行為還是評論行為,二者都是用戶的內(nèi)容生成和內(nèi)容共享行為,其標注行為的結(jié)果是為社會化標注系統(tǒng)貢獻了用戶智慧、表達了用戶的觀點和態(tài)度、生成大量用戶行為數(shù)據(jù),這些都成為社會化標注系統(tǒng)中極具價值的信息。本文研究用戶的標注行為數(shù)據(jù),旨在挖掘用戶的標注行為特點及規(guī)律,為社會化標注系統(tǒng)的持續(xù)良性發(fā)展提供優(yōu)化參考。
整合標簽與評論數(shù)據(jù)的社會化標注系統(tǒng)用戶標注行為特征分析框架如圖1 所示,整體研究內(nèi)容包含數(shù)據(jù)收集與預(yù)處理、用戶標簽行為分析,用戶評論行為分析三個模塊。
圖1 用戶標注行為特征研究框架
采用自主編寫的Python 代碼,爬取豆瓣讀書“健康”類目下所有圖書的標注信息,共采集兩類數(shù)據(jù)文本。第一類是標簽數(shù)據(jù)集,具體數(shù)據(jù)項包括:圖書名、ISBN、圖書的URL、用戶標簽;第二類是短評數(shù)據(jù)集,具體數(shù)據(jù)項包括:用戶名、短評時間、短評內(nèi)容、星級評分、短評支持度。數(shù)據(jù)采集時間為2021 年11 月25 日。
對獲取的原始數(shù)據(jù)集進行清洗。首先,統(tǒng)計每本圖書標簽數(shù)及短評文本數(shù),發(fā)現(xiàn)圖書標簽數(shù)平均為8 個,且標簽數(shù)大于8 的圖書其短評數(shù)均大于100,因此,為避免數(shù)據(jù)稀疏性問題,本文篩選標簽數(shù)大于8 且用戶評論數(shù)大于100 的圖書,共計127 本作數(shù)據(jù)源。其次,針對127 本圖書的標簽和短評數(shù)據(jù),刪除無意義字符,進行將繁體轉(zhuǎn)為簡體、縮寫轉(zhuǎn)為全稱、同義詞合并等處理,共計1013 個標簽,21968條短評文本。
本文從標簽長度和標簽詞性這兩個特征對豆瓣健康類圖書標簽的用戶標注行為進行分析。
標簽長度指用戶所使用標簽的字符個數(shù),是一個比較常用的表征用戶標注行為的量化指標[6]。為了方便計算,在對標簽長度進行統(tǒng)計時將1 個漢字/英文字母記為1 個字符,用Len()函數(shù)統(tǒng)計所有標簽的長度。
詞性標注是指對文本數(shù)據(jù)中每個詞的詞性進行標注的過程,是自然語言處理的重要技術(shù)。本文借助Python 中的Spacy 中文版對標簽進行詞性標注;其次,為提高詞性標注準確率,將標簽中包含的部分詞組數(shù)據(jù)放入用戶自定義詞典。
對豆瓣健康類圖書的用戶評論行為分析包括評論文本的情感傾向性分析以及用戶評論行為的相關(guān)性分析。
3.3.1 用戶評論文本的情感分析
文本的情感分析,也稱為情感傾向性分析,是從文本中發(fā)現(xiàn)或挖掘人們對于某種事物、產(chǎn)品或服務(wù)所表達出的情感、意見或情緒[17]。百度AI 情感傾向性分析是基于大規(guī)模數(shù)據(jù)和深度學(xué)習(xí)訓(xùn)練,自動學(xué)習(xí)深層次的語義及語序特征的過程,其具備較強的泛化能力和高精確度,在汽車、餐飲、酒店等領(lǐng)域的情感傾向性分析準確率達95%以上[18]。因此,本文借助百度AI 中的情感傾向分析技術(shù)挖掘用戶關(guān)于圖書資源的態(tài)度和感受。采用Python 自編語言,通過百度自然語言處理情感分析接口(AipNlp)對預(yù)處理后的短評文本數(shù)據(jù)進行情感傾向性分析。該接口反饋的結(jié)果為json 格式的數(shù)據(jù)。其中包含屬于積極情感的概率(positive_prob),屬于消極情感的概率(negative_prob),分類的置信度(confidence)和情感極性分類結(jié)果(sentiment:0 為負向,1 為中性,2 為正向)。為方便分析,本文以短評文本屬于積極情感的概率表示文本的情感傾向值來進行后續(xù)相關(guān)性分析。
3.3.2 用戶評論行為的相關(guān)性分析
評論行為的相關(guān)性分析,是在將用戶的評論行為結(jié)果量化之后分析行為變量兩兩之間的相關(guān)性,即分析用戶對資源的文本評論行為、星級評分行為和對資源的有用性感知行為之間的相關(guān)性。其中,用戶對資源的文本評論行為用評論文本的情感值表示,對資源的星級評分行為用星級賦值表示(一星到五星的分值分別設(shè)置為1、2、3、4、5),對評論有用性感知行為采用該短評的支持用戶數(shù)(支持度)表示。為消除三類數(shù)據(jù)在數(shù)量級上存在的差異,在相關(guān)性分析之前首先采用Z-Score 法對其進行標準化處理,然后采用SPSS26.0 對經(jīng)標準化處理后的數(shù)據(jù)進行相關(guān)性分析。最后,從單本圖書和整體圖書兩個層面對用戶評論行為進行討論。通常情況下:相關(guān)系數(shù)r 在0.8~1.0 為極強相關(guān),0.6~0.8 為強相關(guān),0.4~0.6 為中等程度相關(guān),0.2~0.4 為弱相關(guān),0.0~0.2 為極弱相關(guān)或無相關(guān)。
4.1.1 標簽長度統(tǒng)計分析
對健康類圖書的標簽長度統(tǒng)計分析(表1)發(fā)現(xiàn),用戶使用標簽的長度整體分布在1~7 個字符之間,其中,主要集中在2~5 個字符之間,標簽個數(shù)累計占比98.82%。同時,對標簽數(shù)據(jù)進行人工觀察發(fā)現(xiàn),6~7 個字符長度的標簽數(shù)據(jù)描述的多為人名和書名。該統(tǒng)計結(jié)果在一定程度上反映出用戶標注行為符合最小用力法則,即用戶更傾向于使用較短字符長度的詞語對健康類圖書資源進行標簽標注。
表1 標簽長度統(tǒng)計分析結(jié)果
4.1.2 標簽詞性統(tǒng)計分析
統(tǒng)計每種詞性的標簽個數(shù)及占比情況如表2所示。用戶主要使用名詞、動詞、形容詞這三種詞性的標簽對健康類圖書資源進行標注。其中,名詞占比最大,占總標簽個數(shù)的67.23%,動詞次之,形容詞最少,僅占總標簽個數(shù)的2.07%。結(jié)合標簽內(nèi)容可知,用戶偏向用名詞描述圖書資源中的主題內(nèi)容(睡眠、食品、藥物、基因等)、學(xué)科領(lǐng)域(營養(yǎng)學(xué)、心理學(xué)、醫(yī)學(xué)、中醫(yī)、生物學(xué)、社會學(xué)等)、國家(美國、日本、中國、德國等)、研究對象(兒童、女性等)、作者(徐文兵、武志紅、于娟等);用戶偏向用動詞詞性描述圖書主題內(nèi)容(減肥、跑步、育兒)等信息,使用形容詞詞性標簽描述用戶對圖書的評價信息,比如,用戶會用“好書”“值得一讀”等標簽來表示對圖書資源的認可。
表2 標簽詞性統(tǒng)計分析結(jié)果
4.2.1 評論文本的情感類別統(tǒng)計
統(tǒng)計所有短評文本的情感類別,結(jié)果見表3。整體來看,用戶關(guān)于健康類圖書的評價及看法持積極態(tài)度,表明豆瓣圖書較大程度上滿足了用戶的健康知識閱讀需求。
表3 短評文本的情感類別統(tǒng)計
4.2.2 用戶評論行為的相關(guān)性
(1)單本圖書的用戶評論行為相關(guān)性
首先,本文以圖書《最好的抉擇》為例進行用戶評論行為的相關(guān)分析,結(jié)果如表4;其次,統(tǒng)計127 本健康類圖書的用戶評論行為的顯著性結(jié)果(表5)與相關(guān)性強弱結(jié)果(表6)。
表4 《最好的抉擇》相關(guān)分析結(jié)果
表5 127 本圖書相關(guān)分析顯著性統(tǒng)計結(jié)果
表6 相關(guān)性強弱分級統(tǒng)計結(jié)果
《最好的抉擇》短評數(shù)據(jù)的情感值與星級評分在0.01 水平上顯著相關(guān),且表現(xiàn)為弱正相關(guān);情感值與支持度在0.01 水平上顯著相關(guān),且表現(xiàn)為極弱正相關(guān);星級評分與支持度在0.05 水平上顯著相關(guān),也表現(xiàn)為極弱正相關(guān)。
表5 和表6 顯示,96.85%健康類圖書的短評文本情感值與星級評分在0.05 水平上顯著相關(guān),其中,92.68%的圖書數(shù)據(jù)表現(xiàn)為弱正相關(guān)與中等程度正相關(guān),4.88%的健康類圖書資源表現(xiàn)為極弱正相關(guān),特別地,有3 本圖書數(shù)據(jù)表現(xiàn)為強正相關(guān),說明用戶對圖書的評價和看法與打出的星級評分具有一致性,兩者都能較好地揭示用戶對圖書內(nèi)容的觀點看法與態(tài)度傾向。然而,僅有15 本圖書資源的情感值與支持度在0.05 水平上顯著相關(guān)、26 本圖書的星級評分與支持度顯著相關(guān),且部分圖書資源的短評文本情感值與支持度、星級評分與支持度存在負相關(guān)的情況。
(2)整體圖書的用戶評論行為相關(guān)性
對健康類圖書的全部短評數(shù)據(jù)整體進行相關(guān)分析,結(jié)果如表7,短評文本的情感值、圖書資源星級評分與短評支持度兩兩變量之間在0.01 水平上顯著相關(guān),其中,情感值與星級評分呈弱正相關(guān),再次表明用戶關(guān)于健康類圖書發(fā)表評論的情感態(tài)度與打出的星級評分具有一致性;星級評分與支持度呈極弱正相關(guān),情感值與支持度呈極弱負相關(guān)。
表7 整體圖書相關(guān)分析結(jié)果
(1)用戶在標簽詞的選用上呈現(xiàn)出一定的用詞規(guī)律和詞性偏好。
首先,在用標簽標注資源時,用戶傾向使用字符長度為2~5 的標簽對健康類圖書信息進行標注。在表達文獻內(nèi)容特征的主題檢索語言中,關(guān)鍵詞屬于非受控的主題檢索語言,其一般也為2~5 個字符長度。同時,標簽和關(guān)鍵詞也都屬于自然語言的范疇。這說明,用戶選擇標簽標注資源與選擇關(guān)鍵詞表達文獻資源主題相似。
其次,在選擇標簽時,用戶偏向使用名詞、動詞、形容詞這三種詞性標注健康類圖書資源。名詞和動詞標簽主要用于信息資源進行主題分類、組織以實現(xiàn)網(wǎng)絡(luò)空間中資源的有序化目的,方便自己今后對這些資源的查找和利用。同時,也為他人對信息資源的獲取提供了便利。形容詞標簽主要用于表達用戶對資源內(nèi)容的評價和用戶自身感受,這類標簽在對資源有一定分類作用的同時,可為他人提供資源選擇時的參考價值,利他性更強一些。
(2)用戶對信息資源的文本評論、星級評分和有用感知行為都具有評價資源的作用,并且它們之間具有一定關(guān)聯(lián)性。
在文本評論模塊,用戶關(guān)于資源的評論總會呈現(xiàn)出一定的情感傾向,這可能是由于模塊的評論功能本身的引導(dǎo),使用戶主動愿意將對資源的內(nèi)容、質(zhì)量、感受等方面的內(nèi)容表達出來并給予評價。豆瓣讀書用戶對其中的健康類圖書的評價整體持積極態(tài)度,對該類圖書的認同度較高。星級評分是用戶對于圖書資源最直觀的評價,通過用戶對評論文本的有用性感知,可以篩選出更具有可信度的圖書評論。
從單本圖書來看,用戶評論文本的情感值與對資源的星級評分結(jié)果之間都呈現(xiàn)正向相關(guān)性,兩者都能較好地揭示用戶對圖書內(nèi)容的觀點看法與態(tài)度,一致反映用戶對圖書的評價;資源的星級評分與獲得的評論有用性感知得分之間的相關(guān)性方面,部分圖書資源的內(nèi)容質(zhì)量較差時,用戶對圖書內(nèi)容的不認同或消極情緒會引起其他用戶的共鳴。即,星級評分較低的圖書資源,其評論文本內(nèi)容對于他人的有用性較高,進一步起到區(qū)分出該圖書資源的作用。從整體圖書而言,圖書的星級評分越高,其評論文本內(nèi)容越可能獲得較高的認同度;評論文本的負向情感傾向越明顯,該評論文本越有較高的機會得到他人的共鳴。
在“以人為中心”的web2.0 環(huán)境中,人是最重要的因素。用戶的體驗決定了用戶在網(wǎng)絡(luò)系統(tǒng)平臺中行為的持續(xù)性和創(chuàng)造性,是激發(fā)平臺生命力的最重要源泉。用戶是社會化標注系統(tǒng)中資源的消費者和生產(chǎn)者,是信息資源的管理者和評價者,也是大眾智慧的創(chuàng)造者,源源不斷地創(chuàng)造數(shù)據(jù)、知識及其他價值。社會化標注系統(tǒng)只有不斷地完善其功能和服務(wù),滿足用戶需求并為其提供良好的上網(wǎng)體驗,才能得到持續(xù)發(fā)展?;谟脩魳俗⑿袨樘攸c及規(guī)律的社會化標注系統(tǒng)優(yōu)化建議如下:
(1)完善標簽推薦功能,向用戶推薦符合其使用偏好和更準確的標簽。標簽推薦功能使資源的標注更簡單易行,吸引用戶參與到信息資源組織中,另一方面通過為用戶提供優(yōu)先標簽,可為資源標注質(zhì)量提供一定保障。社會化標注系統(tǒng)在為用戶推薦長度、詞性符合用戶標注習(xí)慣的高頻標簽的同時,也可基于用戶標簽與關(guān)鍵詞具有較高相似性的特點,將資源標題、圖書簡介及用戶評論文本進行詞語切分,提取出具有代表性的關(guān)鍵詞作為候選標簽推薦給用戶。
(2)重視有價值評價信息的篩選,向用戶提供優(yōu)質(zhì)資源。鑒于評論文本的情感傾向與對資源的星級評分正相關(guān),篩選平均星級評分較高的圖書資源使其在用戶檢索結(jié)果中排名靠前或在資源導(dǎo)航主題標簽下位于資源列表靠前的位置。同時,將那些用戶評論有用性感知值高的評論置于該圖書資源評論列表的前列,或者設(shè)置“加精”標識以示醒目。從而,起到引導(dǎo)用戶選用優(yōu)質(zhì)資源和監(jiān)督淘汰劣質(zhì)資源的作用。
(3)提高資源質(zhì)量、建立激勵機制,吸引和鼓勵用戶參與網(wǎng)絡(luò)信息資源的組織與利用。全面、準確、及時、高質(zhì)量的信息資源是影響用戶對社會化標注平臺粘性的最重要因素,社會化標注系統(tǒng)平臺應(yīng)加大信息資源開發(fā)與共享力度,以優(yōu)質(zhì)資源吸引用戶;同時,可建立會員等級制度,對積極共享、標注及評論資源、互動頻率高等類型的活躍用戶建立等級,不同等級的用戶賦予不同的權(quán)限或資源獎勵。激發(fā)用戶參與社會化標注系統(tǒng)中信息資源組織與利用活動的積極性。
本文突破單一類型數(shù)據(jù)的局限,以豆瓣讀書中健康類話題下的圖書標簽和評論數(shù)據(jù)為研究對象,分析用戶的標簽行為和評論行為特征,并探討各評論行為之間的關(guān)系,從用戶標注行為的視角對社會化標注系統(tǒng)平臺提高用戶體驗提出相關(guān)建議。本研究不足之處在于,一是僅以健康類目下的圖書數(shù)據(jù)為研究對象,研究的范圍和納入的數(shù)據(jù)量有限;二是僅從標注行為的角度分析了標簽和評論數(shù)據(jù)。事實上,用戶的部分標簽和評論文本內(nèi)容也包含用戶的行為特征信息。因此后續(xù)的研究應(yīng)考慮擴大標簽的類別范圍,獲取更大規(guī)模的數(shù)據(jù),并進一步考慮將標簽和評論的語義內(nèi)容作為用戶標注行為研究的一個重要維度,提高研究結(jié)果的可信性和普適性的同時,深入挖掘用戶標注行為特征。