徐立萍 何丹 陸元文
摘要:智能技術在用戶畫像分析與內(nèi)容推薦方面的應用已較為廣泛,但在為用戶提供方便的過程中,仍存在一些問題。以覆蓋面最廣、日活躍用戶最多的短視頻平臺抖音APP作為應用案例,通過問卷調(diào)查的形式,以抖音用戶為受訪對象,厘清在基于用戶畫像的智能推薦機制下用戶的使用情況與滿意程度,挖掘和探索智能推薦系統(tǒng)對用戶產(chǎn)生的影響,找出影響用戶使用滿意度的重要因素,提出優(yōu)化智能推薦策略的建議。
關鍵詞:用戶畫像 智能推薦 算法 抖音
自20世紀90年代至今,智能推薦系統(tǒng)已成為用戶提供信息檢索和信息過濾的重要手段。在信息的分發(fā)過程中,智能推薦系統(tǒng)以用戶的身份信息、社交信息、地理位置、歷史瀏覽痕跡等為依據(jù),分析出系統(tǒng)中用戶最感興趣的內(nèi)容,并將其排序呈現(xiàn)在用戶面前,本質(zhì)上是對用戶、環(huán)境和信息進行合理的匹配。抖音就是通過智能推薦系統(tǒng)實現(xiàn)對用戶的內(nèi)容分發(fā),利用智能技術進行用戶畫像,并根據(jù)用戶畫像向其自動推送合適的內(nèi)容,有效地提高了用戶滿意度以及黏性。
抖音是2016年由字節(jié)跳動孵化并上線的短視頻平臺,距今上線已超過5年。根據(jù)抖音發(fā)布的《2020抖音數(shù)據(jù)報告》,2020年抖音日活躍用戶突破6億、日均視頻搜索次數(shù)突破4億。并且從北上廣深等超一線城市向中西部三四線小城鎮(zhèn)逐漸下沉,成為當前中國互聯(lián)網(wǎng)市場上覆蓋面最廣、日活躍用戶最多的短視頻社區(qū)平臺。
抖音的成功離不開它優(yōu)秀的智能內(nèi)容推薦系統(tǒng)。但長期以來,業(yè)界和學界更多的關注個性化內(nèi)容推薦機制,少有人從用戶的角度來思考和探索,即用戶對個性化推薦機制下的應用使用滿意度如何?這套機制給用戶造成了怎樣的影響?帶著這樣的疑問出發(fā),以抖音APP為研究對象,通過問卷調(diào)查,探尋智能推薦算法對用戶產(chǎn)生的影響,并基于調(diào)查結(jié)果提出優(yōu)化智能推薦策略的建議。
用戶畫像與內(nèi)容推薦都是智能技術在內(nèi)容生產(chǎn)過程中得到廣泛應用的環(huán)節(jié)。用戶畫像是溝通內(nèi)容生產(chǎn)者與消費者的一座重要橋梁,通過收集用戶信息、將用戶特征總結(jié)為標簽,構(gòu)建用戶畫像,對選題策劃做出指導,可為用戶量身定制內(nèi)容,也可以利用內(nèi)容推薦系統(tǒng)從已有的優(yōu)質(zhì)內(nèi)容中挑選符合用戶需求的內(nèi)容進行分發(fā),實現(xiàn)內(nèi)容和需求的精準匹配。
1.抖音通過大數(shù)據(jù)多角度進行用戶畫像。用戶畫像在英文中的單詞是Persona,這個詞最早應用于交互設計領域,源于要提高產(chǎn)品的體驗,必須足夠了解用戶,因此通過溝通、觀察用戶的生活來建立起對用戶的同理心。Cooper認為,用戶畫像是對真實用戶的虛擬表示,是基于一系列數(shù)據(jù)建構(gòu)而成的目標用戶模型。本文認為,在內(nèi)容生產(chǎn)語境下,用戶畫像指的是通過收集、分析和處理內(nèi)容消費者的人口統(tǒng)計學特征、行為偏好屬性等信息,形成一系列精煉的特征標識,再將這些特征標識組合成標簽組,成為讓人能夠理解的用戶模型。在內(nèi)容分發(fā)過程中,用戶的興趣點是主要的推送點。
抖音首先關注用戶的歷史瀏覽偏好、使用環(huán)境,以及年齡、職業(yè)、性別等人口統(tǒng)計學特征,便于更加精準地進行內(nèi)容推送。除此之外,抖音也關注用戶對于視頻推薦結(jié)果的行為反饋,如點擊、觀看、收藏、評論等。當用戶使用抖音APP觀看短視頻時,會通過APP的UI界面與內(nèi)容產(chǎn)生交互。短視頻APP的后臺設置用戶行為并上報系統(tǒng)以記錄用戶行為,用戶行為首先被手機記錄下來并上傳到APP的日志系統(tǒng),之后由APP上傳行為數(shù)據(jù)并進行分析,生成推薦數(shù)據(jù)列表,產(chǎn)生用戶畫像。
2.抖音采取多形式智能推薦機制進行內(nèi)容分發(fā)。移動短視頻內(nèi)容上傳都會打上相應的標簽。抖音的智能推薦系統(tǒng)根據(jù)數(shù)百萬維度的用戶標簽以及相關性、環(huán)境、熱度、協(xié)同等模型,了解用戶的狀態(tài)變化,從而推薦最合適的信息。
抖音的短視頻推薦形式主要有以下幾種:第一,智能疊加推薦,系統(tǒng)先把短視頻推薦給少量可能感興趣的用戶,通過用戶評論等數(shù)據(jù)進行校準,若效果好再推送給更多興趣相似的用戶。第二,協(xié)同過濾推薦,通過考慮用戶與用戶之間的相似度來進行內(nèi)容推薦,找出相似用戶喜歡的內(nèi)容后推送給其他相似用戶。第三,社交關系推薦,分為以社交圖譜為代表的強關系推薦,以及以興趣圖譜為代表的弱關系推薦。社交圖譜是以親戚朋友、同學同事、社團成員、朋友的朋友等現(xiàn)實中的熟人為主要關系對象構(gòu)建的社交網(wǎng)絡圖譜。而興趣圖譜是以共同的專業(yè)、興趣、愛好、話題等線索構(gòu)建的社交網(wǎng)絡圖譜。
本研究采用問卷調(diào)查法收集抖音APP用戶的數(shù)據(jù)并進行統(tǒng)計分析。通過問卷星等線上渠道發(fā)放并回收341份問卷。剔除在問卷“您是否使用抖音?”中選擇“否”及完成時間小于60秒的問卷后,共計得到253份有效問卷。問卷共設20題,主要測量和分析了以下幾方面內(nèi)容。
1.抖音的使用情況。本研究調(diào)查用戶對抖音的使用情況,主要從使用時長、天數(shù)、動機、觀看視頻類型和觀看視頻方式幾個方面進行分析。
其中,調(diào)查使用時長從使用總時長和平均每天使用時長兩個維度進行統(tǒng)計;使用動機從學習、娛樂消遣、跟風、追星、社交以及其他幾個維度來統(tǒng)計數(shù)據(jù);用戶觀看的視頻類型根據(jù)抖音APP上常見的視頻內(nèi)容劃分,劃分為時事社會類、表演類(唱歌、舞蹈等)、生活類(美食、美妝、穿搭等)、搞笑類、技能教學類、動漫游戲類、網(wǎng)紅明星類以及其他等類型;用戶觀看視頻的方式按照觀看抖音推送的視頻、根據(jù)個人喜好直接搜索關鍵詞瀏覽、瀏覽熱搜榜單上的內(nèi)容、瀏覽好友發(fā)布的內(nèi)容以及其他這幾種分類進行數(shù)據(jù)收集。
2.用戶使用推薦內(nèi)容的滿意程度。調(diào)查用戶使用抖音通過智能推薦算法推送的視頻內(nèi)容滿意程度,通過李克特五級量表進行信息獲取,掌握用戶對抖音的智能推薦機制的滿意程度。
3.影響用戶使用滿意度的因素分析。分析影響用戶使用滿意度的因素,采用三步走的分析方法。首先,對變量進行正態(tài)分布檢驗;其次,利用回歸分析和T檢驗進行相關性分析;最后,以推薦系統(tǒng)推送不良信息頻率、單一化傾向、推薦內(nèi)容與用戶喜好內(nèi)容匹配程度、持續(xù)觀看意愿、對不同類型視頻推薦的信任程度、推薦視頻的感知價值、隱私提供意愿作為自變量,推薦視頻使用滿意度為因變量,建立線性回歸模型。
4.內(nèi)容推薦對用戶產(chǎn)生的影響。根據(jù)問卷中推薦系統(tǒng)推送不良信息頻率、單一化傾向、推薦內(nèi)容與用戶喜好內(nèi)容匹配程度、持續(xù)觀看意愿、對不同類型視頻推薦的信任程度、推薦視頻的感知價值、隱私提供意愿等問題的調(diào)查結(jié)果,進行抖音個性化內(nèi)容推薦機制對用戶的正面影響和負面影響分析。
5.人口統(tǒng)計學特征變量。人口統(tǒng)計學特征變量包括用戶的性別、年齡、學歷和收入情況。
通過問卷調(diào)查,在抖音用戶特征、用戶對抖音算法推薦的滿意程度、智能算法推薦對用戶的影響具有以下研究結(jié)果。
1.抖音用戶特征。第一,用戶黏性高。在被調(diào)查者中,有77.87%的受訪對象表示使用抖音的時長已超過12個月,60.87%的受訪對象每天都會使用抖音,有超過50%的被訪者每天使用抖音的時長為30分鐘~1小時。由此表明,抖音擁有較大的用戶市場,有很強的用戶黏性。
第二,以“娛樂消遣”為主要使用動機。針對多選題各選項選擇比例分布是否均勻,使用卡方擬合優(yōu)度檢驗進行分析。根據(jù)表1結(jié)果可知,擬合優(yōu)度檢驗呈現(xiàn)出顯著性(χ2=292.549,p=0.000<0.05),各項的選擇比例具有明顯差異性,可通過響應率或普及率具體對比差異性,“消遣”選項的響應率和普及率明顯較高。由此表明,用戶使用抖音的動機多種多樣,但是“消遣”是用戶使用抖音的第一大動機,占比高達93.68%。其次是“社交”和“學習”,分別占比38.74%和34.78%。
第三,生活類、搞笑類視頻更受歡迎。同理進行卡方擬合優(yōu)度檢驗,結(jié)果表明抖音視頻中表演類(唱歌、舞蹈等)、生活類(美食、美妝、穿搭等)、搞笑類共3項的響應率和普及率明顯較高。這說明絕大部分抖音用戶都喜歡生活類和搞笑類視頻,分別占比80.63%和74.70%,其次是表演類視頻和時事社會類視頻,分別占比58.50%和50.20%。同時,性別對于生活類、技能教學類、動漫游戲類、網(wǎng)紅明星類視頻呈現(xiàn)顯著性差異,女性更偏向于觀看生活類、網(wǎng)紅明星類視頻內(nèi)容,而男性則更愛看技能教學類和動漫游戲類視頻。
第四,對算法推薦的視頻接受度較高。通過對用戶觀看視頻的方式的問卷結(jié)果統(tǒng)計發(fā)現(xiàn)抖音用戶對算法推薦的視頻接受度較高。選項“觀看抖音隨機推送的視頻”和選項“根據(jù)個人喜好搜索關鍵詞瀏覽”共2項的響應率和普及率明顯較高。由此可見,雖然用戶瀏覽抖音視頻的方式不同,但是其中90.91%的用戶都會觀看抖音隨機推送的短視頻,說明用戶對抖音算法推薦系統(tǒng)推薦的視頻內(nèi)容接受度較高。除了觀看抖音隨機推送的短視頻之外,抖音用戶也喜歡根據(jù)個人喜好搜索關鍵詞瀏覽視頻、瀏覽熱搜榜單上的內(nèi)容以及瀏覽抖音上好友發(fā)布的內(nèi)容,普及率占比分別為52.57%、50.20%、41.11%。
2.受訪者對抖音算法推薦的滿意程度及其影響因素分析。受訪者對抖音算法推薦的滿意程度調(diào)查結(jié)果顯示,受訪對象對抖音的算法推薦的滿意程度(1-5分),均值3.775,中位數(shù)為4,有71.38%的被調(diào)查者選擇了“比較滿意”。換言之,受訪者對抖音的算法推薦總體上感到比較滿意。
使用K-S檢驗對問卷量表題變量進行正態(tài)性檢驗,結(jié)果表明樣本數(shù)據(jù)基本呈現(xiàn)正態(tài)分布,可以進行回歸分析及T檢驗等方法進行相關性分析。對總體模型進行方差分析可知,推薦系統(tǒng)過濾不良信息能力、單一化傾向、推薦內(nèi)容與用戶喜好內(nèi)容匹配程度、持續(xù)觀看意愿、對不同類視頻推薦的信任程度、推薦視頻的感知價值、隱私提供意愿中至少一項和推薦視頻滿意度的變異的解釋是統(tǒng)計顯著的。通過分別考察每個變量的回歸系數(shù)可知,推薦視頻的感知價值會對推薦視頻的滿意度產(chǎn)生顯著的正向影響關系,而推薦系統(tǒng)推送不良信息的頻率會對推薦視頻的滿意度產(chǎn)生顯著的負向影響關系。
3.智能算法推薦對用戶的影響。第一,算法推薦精準定位用戶需求提升使用滿意度。精準內(nèi)容推薦可以洞察用戶需求與使用習慣,向其推薦合適的內(nèi)容。通過洞察用戶的需求與習慣,可以挑選適合的內(nèi)容對用戶進行精準化引導和訓練。此次調(diào)查中,有超過50%的受訪者表示抖音推薦的視頻精準滿足了他們的觀看需求,幫助他們找到需要的視頻。同時,有53%的受訪者表示他們在抖音推薦的視頻和自己搜索的視頻中都找到了自己喜歡的視頻,38.73%的受訪者表示比起自己搜索,系統(tǒng)推薦的視頻更加符合他們的喜好。由此可見,抖音的算法推薦系統(tǒng)能夠比較精準的定位用戶需求和喜好。根據(jù)前文分析,推薦視頻的感知價值對推薦視頻的滿意度呈顯著正向影響,這說明抖音智能內(nèi)容推薦系統(tǒng)推薦的內(nèi)容越精準越符合用戶需求,則用戶對其滿意度越高。
第二,算法推薦系統(tǒng)生成用戶畫像過程中存在侵犯隱私風險。用戶畫像融合了5種屬性:基本屬性、資源屬性、行為屬性、社會屬性、情境屬性?;谶@些信息利用數(shù)據(jù)挖掘、數(shù)據(jù)分析等技術對用戶群體作多維交互分析,可以洞悉用戶行為特征分布情況、用戶群體的流動趨勢與活躍程度變化態(tài)勢,從而根據(jù)用戶呈現(xiàn)出的不同特征來為其匹配更具針對性的服務資源。
數(shù)字化媒介時代,個人隱私作為敏感信息,具備極高的經(jīng)濟價值。很多互聯(lián)網(wǎng)公司為了掌握用戶需求、提高服務質(zhì)量并節(jié)約服務成本而收集用戶信息。若公司經(jīng)營管理不當,濫用用戶的身份信息、行為數(shù)據(jù)等敏感數(shù)據(jù),或者將用戶數(shù)據(jù)出售給不法商業(yè)機構(gòu),則很可能被不法分子利用,侵害用戶的合法正當權益。調(diào)查結(jié)果表明,在提問受訪者對于向抖音提供個人信息用于內(nèi)容推薦的意愿時,選擇“比較不愿意”和“比較愿意”的被調(diào)查者數(shù)分別占約30%,另有18.48%的被調(diào)查者選擇了“不確定”,平均值為2.968。這表明,抖音用戶對于用戶畫像過程中收集并分析個人數(shù)據(jù)存在一定疑慮。
第三,算法推薦單一化傾向易造成“信息繭房”。在調(diào)查“抖音推薦系統(tǒng)是否存在內(nèi)容單一化傾向”問題中選擇“很少出現(xiàn)這種情況”和“較少出現(xiàn)這種情況”的被調(diào)查者合計僅有39.13%,說明抖音的內(nèi)容推薦系統(tǒng)存在一定的單一化傾向。在調(diào)查抖音用戶對系統(tǒng)推薦的與原來看的視頻主題/類型不同的視頻接受度時,受訪者中有25.36%選擇了“看得比較少”,29.35%選擇了“不確定”,32.61%選擇了“看得比較多”。說明抖音用戶存在一定的選擇性觀看視頻的情況。由于算法推薦往往基于用戶歷史行為數(shù)據(jù)進行,因而會傾向于根據(jù)瀏覽歷史向用戶推薦類型相似的內(nèi)容。長此以往容易造成用戶的興趣面和知識面狹窄,甚至可能使得用戶產(chǎn)生認知偏見。內(nèi)容推薦的單一化傾向潛移默化地培養(yǎng)了用戶有選擇性的觀看某些固定類型的視頻的觀看習慣,容易造成“信息繭房”。
第四,算法推薦造成信息過載,導致用戶沉溺。調(diào)查結(jié)果顯示,71.55%的受訪者表示他們在瀏覽抖音隨機推送的視頻時經(jīng)常會不自覺地刷更多的視頻,從而延長APP使用時間。這表明,用戶對系統(tǒng)推薦的視頻越滿意,用戶使用抖音的頻率越高,并且越有可能刷抖音“上癮”而不由自主地延長使用抖音的時間。長時間使用抖音勢必影響日常生活計劃,打亂生活規(guī)律,造成生活碎片化,甚至導致原本的工作計劃被打亂,影響用戶的正常生活。此外,碎片化的信息吸收也會導致用戶的知識面支離破碎,不利于用戶的身心健康。
根據(jù)以上研究結(jié)果,筆者提出以下幾點優(yōu)化建議。
1.提升定位用戶喜好的準確性,進一步提高算法推薦的精準度。觀察推薦系統(tǒng)分發(fā)的抖音視頻內(nèi)容發(fā)現(xiàn),為了更好地提升用戶體驗感,其算法推薦已經(jīng)實現(xiàn)了根據(jù)用戶長短期的興趣來完成內(nèi)容推薦,更大程度上覆蓋用戶的更多興趣,提高推薦內(nèi)容的多樣性。然而根據(jù)用戶短期興趣進行推薦存在一個問題,即如何界定用戶對某一領域的視頻內(nèi)容是感興趣的?是向用戶推送某一視頻,用戶完成點擊這個動作即表示“感興趣”,還是完成對推送視頻的完整觀看才表示“感興趣”?因此算法推薦在對用戶的興趣方向進行評估的時候,應該引入完播率、觀看時長等維度的數(shù)據(jù),從而更加精準地定位用戶喜好,實現(xiàn)智能推薦的準確性。
2.完善內(nèi)容評估體系,加大人工審核力度。抖音的智能疊加推薦系統(tǒng)對視頻質(zhì)量優(yōu)劣程度的評價取決于點贊、關注、完播率等顯性數(shù)據(jù),忽視內(nèi)容本身。換句話說,智能疊加推薦機制相比于內(nèi)容生產(chǎn),更加注重傳播效果。這就容易導致一些內(nèi)容低俗化但是傳播效果良好的視頻進入更多用戶的推薦頁。前文調(diào)查問卷分析顯示,智能推薦系統(tǒng)推送的不良信息內(nèi)容的頻率對用戶對平臺的使用滿意度產(chǎn)生顯著的負面影響。因此為了使算法推薦系統(tǒng)更好地服務于用戶,應當完善內(nèi)容評估體系,在原有評估數(shù)據(jù)維度上增加負面評價、舉報等數(shù)據(jù),即無論視頻點贊量、轉(zhuǎn)發(fā)量、完播率等各個測量維度的數(shù)據(jù)表現(xiàn)多么優(yōu)越,當它的“點踩”量和舉報量達到一定數(shù)值時,則立刻停止推薦。此外,還可以通過加大人工審核力度的方式,壯大審核團隊,培養(yǎng)更加優(yōu)秀的審核人員,對不良內(nèi)容進行及時有效過濾,防止其進一步傳播。以人工干預的方式彌補算法的不足。
3.調(diào)整興趣內(nèi)容與其他內(nèi)容推送比例,破除“信息繭房”。智能內(nèi)容推薦系統(tǒng)還應該調(diào)整向用戶推送興趣內(nèi)容和其他內(nèi)容的比例,即不完全根據(jù)用戶的興趣愛好來進行智能推薦,適當調(diào)整向用戶推薦其興趣愛好之外的其他內(nèi)容的占比,通過這種方式來打破用戶長期浸泡在同一種或幾種視頻類型中的閉環(huán),從而破除“信息繭房”導致的“回音壁效應”,讓用戶在獲取自己感興趣的內(nèi)容的同時,接收到其他領域的信息。
作者單位 上海理工大學
本文系國家新聞出版署“可信數(shù)字版權生態(tài)與標準重點實驗室”研究成果,2020年上海理工大學人文社科培育項目(項目編號:20SKPY02)的階段性研究成果。
參考文獻
[1]Cooper A.The Inmates are Running the Asylum[M]. California:Sams,2004.
[2]劉珊.大數(shù)據(jù)與新媒體運營[M].北京:中國傳媒大學出版社,2017.
[3]Cooper A,Robert Reimann R,Cronin D.About Face 3:The Essentials of Interaction Design[M].New Jersey:Wiley Publishing Inc.,2007.
[4]劉維.移動短視頻內(nèi)容把關模式研究——以"抖音"為例[D].重慶:西南大學,2019.
[5]王海燕.抖音的算法推薦特點分析[J].新媒體研究,2018(20).
[6]劉海鷗,孫晶晶,蘇妍嫄,等.國內(nèi)外用戶畫像研究綜述[J].情報理論與實踐,2018(11).
【編輯:朱垚穎】