• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于彈幕分析的在線直播平臺(tái)用戶理解①

      2020-03-23 06:05:52黃發(fā)良謝國(guó)慶陳子煒
      關(guān)鍵詞:彈幕主播禮物

      黃發(fā)良, 謝國(guó)慶, 陳子煒

      1(廣西師范大學(xué) 廣西多源信息挖掘與安全重點(diǎn)實(shí)驗(yàn)室, 桂林 541004)

      2(福建省公共服務(wù)大數(shù)據(jù)挖掘與應(yīng)用工程技術(shù)研究中心, 福州 350117)

      3(福建師范大學(xué) 數(shù)學(xué)與信息學(xué)院, 福州 350117)

      近年來(lái), 網(wǎng)絡(luò)直播迅速發(fā)展成為一項(xiàng)新興互聯(lián)網(wǎng)文化產(chǎn)業(yè).據(jù)中國(guó)直播榜網(wǎng)站在線數(shù)據(jù)顯示: 截止2017 年2 月, 直播平臺(tái)主播超39 萬(wàn), 粉絲數(shù)超61 億人次, 財(cái)富總量超3.8 億.網(wǎng)絡(luò)直播一方面為主播達(dá)人們提供了展示與推銷(xiāo)自我的平臺(tái), 另一方面加強(qiáng)了網(wǎng)民的在線體驗(yàn)與及時(shí)感受.為了增加直播趣味性和互動(dòng)性, 各大網(wǎng)絡(luò)直播平臺(tái)紛紛采用彈窗彈幕作為用戶實(shí)時(shí)交流的方式[1,2].內(nèi)容豐富且形式多樣的彈幕數(shù)據(jù)中隱含著復(fù)雜的用戶屬性與用戶行為, 研究并理解在線直播平臺(tái)用戶具有彈幕內(nèi)容審核與監(jiān)控[3,4]、輿論熱點(diǎn)預(yù)測(cè)[5]、個(gè)性化摘要標(biāo)注[6]等多方面的應(yīng)用價(jià)值.

      在線直播用戶理解已經(jīng)引起研究者的廣泛關(guān)注.文獻(xiàn)[7]通過(guò)分析在線視頻評(píng)論格式來(lái)研究用戶評(píng)估與判斷能力, 舉例了分體式和流式的評(píng)論布局特征對(duì)用戶行為動(dòng)機(jī)的影響.文獻(xiàn)[8]則從彈幕文本內(nèi)容入手, 研究彈幕對(duì)網(wǎng)民視頻認(rèn)知的影響, 并利用文本分類(lèi)技術(shù)對(duì)視頻內(nèi)容進(jìn)行快速的語(yǔ)義分析.在自我控制和社交能力上, 用戶可以提升其參與視頻社區(qū)互動(dòng)的活躍度[9],擁有較高的互動(dòng)活躍度可以促進(jìn)用戶自我控制和社交能力的發(fā)展.文獻(xiàn)[10]提出一種基于彈幕文本的視頻片段情感識(shí)別算法, 建立用戶興趣度量模型, 并以此進(jìn)行視頻片段的推薦.文獻(xiàn)[11]利用句子級(jí)別的情感分析方法, 建立基于情感詞典的彈幕情感分析模型, 對(duì)評(píng)論文本進(jìn)行情感詞抽取及情感值計(jì)算, 并結(jié)合時(shí)間序列進(jìn)行分析.文獻(xiàn)[12]利用視頻語(yǔ)義的時(shí)間依賴性、用戶彈幕評(píng)論的交互性與用戶偏好建立個(gè)性化的時(shí)序主題模型, 有效提升視頻標(biāo)簽算法的性能.文獻(xiàn)[13]提出一個(gè)基于數(shù)據(jù)重建原則的時(shí)序概要模型, 選擇與視頻最相關(guān)的代表性彈幕評(píng)論來(lái)生成視頻的動(dòng)態(tài)描述.然而絕大多數(shù)現(xiàn)有研究工作都是對(duì)彈幕的文化背景和社會(huì)影響力進(jìn)行定性分析或利用文本挖掘技術(shù)建立彈幕-視頻相關(guān)度量分析模型, 而在用戶行為的具體量化測(cè)量和用戶活躍度的研究方面還有所欠缺.

      為了對(duì)用戶行為和彈幕語(yǔ)言進(jìn)行更深入的探究,本文針對(duì)主流直播平臺(tái)的彈幕進(jìn)行分析和建模.在用戶屬性測(cè)量方面, 本文根據(jù)用戶的時(shí)空分布和接入設(shè)備的類(lèi)型分析網(wǎng)絡(luò)在線直播對(duì)社會(huì)的影響, 借助彈幕文本長(zhǎng)度分布、用戶發(fā)送彈幕的頻率分布以及用戶個(gè)體的等級(jí)經(jīng)驗(yàn)分布等估計(jì)用戶群體在觀看直播環(huán)境下即興發(fā)言的屬性特征.另一方面利用所抓取的網(wǎng)絡(luò)在線直播中彈幕及用戶行為的相關(guān)數(shù)據(jù), 分析直播平臺(tái)用戶的交互特點(diǎn)和活躍度特征, 提出基于網(wǎng)絡(luò)在線直播的用戶活躍度計(jì)算框架.本文提出的用戶活躍度模型可以較好地適應(yīng)當(dāng)今新興娛樂(lè)活動(dòng)的彈幕直播, 并對(duì)近期的用戶行為理解和網(wǎng)絡(luò)在線直播平臺(tái)的用戶活躍趨勢(shì)做出合理預(yù)測(cè)和分析.

      1 數(shù)據(jù)采集

      本文利用網(wǎng)絡(luò)爬蟲(chóng)程序?qū)?guó)內(nèi)熱門(mén)的3 個(gè)主要直播平臺(tái)(斗魚(yú)、熊貓、戰(zhàn)旗)進(jìn)行彈幕數(shù)據(jù)的抓取.由于彈幕數(shù)據(jù)規(guī)模十分龐大且處于動(dòng)態(tài)變化中, 加之分布不均的特點(diǎn), 獲取整個(gè)實(shí)時(shí)彈幕數(shù)據(jù)非常困難, 因此,在數(shù)據(jù)抓取的過(guò)程中, 不同程度地運(yùn)用了采樣策略.為了保證彈幕數(shù)據(jù)的可靠性、豐富性和有效性, 本研究樣本時(shí)間跨度為2017 年1 月5 日至2017 年2 月5 日,對(duì)3 個(gè)平臺(tái)的6 種主要直播類(lèi)別: 網(wǎng)絡(luò)游戲、手機(jī)游戲、主機(jī)游戲、顏值/歌唱、戶外直播、影視綜藝的房間中隨機(jī)抽取若干熱門(mén)房間進(jìn)行跟蹤抓取.數(shù)據(jù)采集流程包含協(xié)議分析、編制抓包程序、自動(dòng)抓取并存儲(chǔ)于MongoDB 數(shù)據(jù)庫(kù)中, 如圖1 所示.

      圖1 數(shù)據(jù)采集流程

      在各直播平臺(tái)中, 用戶與主播互動(dòng)主要包括“發(fā)送彈幕與贈(zèng)送禮物”兩種方式.其中彈幕內(nèi)容為文本與原設(shè)定emoji 表情; 而禮物則包含了各種價(jià)值不等的禮物種類(lèi).對(duì)于這兩種互動(dòng)形式, 我們對(duì)爬蟲(chóng)程序抓取的數(shù)據(jù)內(nèi)容進(jìn)行分類(lèi)預(yù)處理, 如表1 所示, 得出我們所需的各項(xiàng)數(shù)據(jù): 每場(chǎng)直播的房間信息、彈幕數(shù)據(jù)以及禮物信息.利用彈幕數(shù)據(jù)和打賞信息, 可以方便地獲取用戶的各項(xiàng)特征以便描繪用戶行為屬性并對(duì)彈幕內(nèi)容做出合適的統(tǒng)計(jì)分析.通過(guò)對(duì)3 個(gè)直播平臺(tái)的觀眾人數(shù)與彈幕數(shù)的統(tǒng)計(jì)分析, 繪制了直播平臺(tái)人數(shù)與彈幕數(shù)的關(guān)系.如圖2 所示, 其中深色為1 月5 日起至2 月22 日各平臺(tái)的彈幕總數(shù), 淺色為同期時(shí)間各平臺(tái)觀看直播人數(shù)總和.可以看出, 如今各平臺(tái)的觀眾處于十萬(wàn)級(jí)別, 但是彈幕量卻達(dá)到百萬(wàn)級(jí)別, 彈幕數(shù)與人數(shù)比例接近10:1, 即每個(gè)觀眾平均發(fā)送10 條彈幕.

      表1 數(shù)據(jù)采集信息表

      圖2 3 大直播平臺(tái)數(shù)據(jù)分布圖

      2 分析與討論

      隨著網(wǎng)絡(luò)技術(shù)發(fā)展, 網(wǎng)絡(luò)使用用戶激增, 相關(guān)用戶行為也變得復(fù)雜.根據(jù)網(wǎng)絡(luò)中大量用戶行為相關(guān)數(shù)據(jù),建立相關(guān)用戶行為模型, 對(duì)用戶行為理解進(jìn)行探究, 能夠深入理解用戶行為的特性, 為企業(yè)新?tīng)I(yíng)銷(xiāo)策略提供參考; 同時(shí)能對(duì)用戶行為言論監(jiān)管和相關(guān)部門(mén)監(jiān)管網(wǎng)絡(luò)安全[14]提供重要作用.

      不同于微博的測(cè)量[15], 而彈幕文本的動(dòng)態(tài)時(shí)序特征與微博或者短評(píng)類(lèi)文本相比較更加明顯, 具有更加短小的文體特征和多變的語(yǔ)義行為.在用戶行為理解方面, Thelwall[16]探究了基于YouTube 的用戶和評(píng)論的相關(guān)特征, 僅局限于相對(duì)靜態(tài)的用戶網(wǎng)絡(luò)和YouTube 視頻, 而并未涉及更加復(fù)雜多變彈幕直播中的用戶行為網(wǎng)絡(luò).

      為此, 本文根據(jù)數(shù)據(jù)特點(diǎn), 將已抓取的數(shù)據(jù)分成用戶屬性與彈幕行為兩個(gè)類(lèi)別.用戶屬性包括用戶觀看直播時(shí)間、地點(diǎn)、使用的平臺(tái)以及用戶賬號(hào)等級(jí).用戶行為包含活躍天數(shù)、打賞總額、彈幕數(shù)量以及彈幕長(zhǎng)度與彈幕頻率5 個(gè)方面.在屬性與行為兩個(gè)方面里進(jìn)行分析, 在指定數(shù)據(jù)范圍中總結(jié)出用戶特點(diǎn), 根據(jù)這些特點(diǎn), 建立相關(guān)的用戶行為模型.我們采用如圖3 所示的基于假設(shè)驗(yàn)證思路的研究.

      2.1 用戶屬性驅(qū)動(dòng)的用戶理解

      在社交網(wǎng)絡(luò)中, 用戶屬性對(duì)于研究用戶群體分布和潛在影響力用戶挖掘提供有效的特征依據(jù).對(duì)于網(wǎng)絡(luò)在線直播而言, 用戶屬性是由用戶時(shí)空活躍分布、用戶接入平臺(tái)的類(lèi)型和當(dāng)前用戶的經(jīng)驗(yàn)等級(jí)分布等組成.針對(duì)當(dāng)下網(wǎng)絡(luò)在線直播的宏觀特點(diǎn)以及新形式下大眾娛樂(lè)特點(diǎn), 我們做出如下假設(shè):

      (1) H1a, 用戶觀看網(wǎng)絡(luò)在線直播的時(shí)間分布出現(xiàn)周期性的變化規(guī)律, 活躍時(shí)間大多集中于晚上.

      依據(jù): 彈幕直播作為一種新型的休閑娛樂(lè)方式, 用戶可以自由安排自己的互動(dòng)時(shí)間而主播也可以根據(jù)用戶粉絲的日?;钴S情況設(shè)置工作和直播時(shí)長(zhǎng).隨著網(wǎng)絡(luò)直播行業(yè)的發(fā)展, 全民直播, 人人參與的熱情也在不斷提高, 只要一部智能手機(jī)就可以滿足直播或是接入平臺(tái)參與互動(dòng)的要求, 直播和互動(dòng)門(mén)檻不斷降低.在其他非工作和茶余飯后的休閑時(shí)間里, 觀眾可以自由選擇參與互動(dòng)的時(shí)間, 而晚間時(shí)段成了這些人的最佳選擇之一.主播也根據(jù)粉絲的時(shí)間周期性地安排直播時(shí)長(zhǎng), 主動(dòng)迎合觀眾的需求以吸引更多的粉絲從而增加獲得更多收益的機(jī)會(huì).

      分析: 根據(jù)已采集的數(shù)據(jù)樣本, 構(gòu)建以每5 分鐘為時(shí)間差的時(shí)間序列樣本模型, 并根據(jù)在線用戶數(shù)目構(gòu)建出了用戶人數(shù)的時(shí)間分布情況.如圖4 所示, 在線用戶數(shù)目隨著時(shí)間呈現(xiàn)周期性變化, 每個(gè)周期都會(huì)先后出現(xiàn)兩個(gè)相對(duì)峰值, 且每個(gè)周期的峰值分別出現(xiàn)在午間以及凌晨?jī)蓚€(gè)時(shí)間段, 其中以凌晨時(shí)分的峰值為較高.大部分直播平臺(tái)用戶選擇在下班休息這段時(shí)間進(jìn)行直播或觀看直播, 在線直播作為新型的休閑娛樂(lè)方式已經(jīng)和這部分受眾的日常生活作息相互關(guān)系, 這也就是平臺(tái)用戶在時(shí)間上具有明顯的周期性的原因.在線直播的時(shí)間分布與用戶普遍的休閑娛樂(lè)規(guī)律相重合,與H1a 情況相符.

      圖3 分析流程

      (2) H1b, 用戶區(qū)域性分布不均勻, 有可能集中分布于沿海發(fā)達(dá)城市.

      依據(jù): 用戶可以通過(guò)PC 網(wǎng)頁(yè)或是移動(dòng)客戶端建立與直播平臺(tái)的互動(dòng)模式, 而且對(duì)網(wǎng)絡(luò)依賴度十分強(qiáng)大.其次, 根據(jù)《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[17]顯示, 現(xiàn)如今國(guó)內(nèi)的網(wǎng)絡(luò)覆蓋程度已經(jīng)超過(guò)50%, 沿海省份更是接近網(wǎng)絡(luò)全覆蓋.再加上沿海省份發(fā)達(dá)的經(jīng)濟(jì)現(xiàn)狀, 擁有巨大的人口數(shù)量.綜合以上幾點(diǎn), 可推測(cè)沿海省份的觀眾分布會(huì)大于內(nèi)陸觀眾數(shù)量.

      分析: 將用戶的地域分布劃分為境外、西北、東北、華中、西南、華北、華南以及華東8 大地區(qū), 得到如圖5 所示的用戶地域分布情況.在線直播平臺(tái)用戶主要集中華東和華南地區(qū), 用戶數(shù)量占全體觀眾數(shù)量的56%, 體現(xiàn)了用戶在區(qū)域上分布不均的顯著特點(diǎn).針對(duì)用戶地域分布存在的顯著差異, 我們進(jìn)一步找出了用戶數(shù)量排名靠前的10 個(gè)省份.如圖6 所示, 可以明顯看出, 用戶數(shù)量在廣東浙江這樣的沿海發(fā)達(dá)地區(qū)最多, 這也例證了H1b 的假設(shè).

      圖4 在線用戶數(shù)目的時(shí)間分布

      (3) H1c, 用戶更可能選擇以網(wǎng)頁(yè)端接入方式為主,移動(dòng)設(shè)備登陸為輔的交互觀看方式.

      依據(jù): 如今大部分網(wǎng)絡(luò)直播平臺(tái)的前身是某些電腦社交、視頻、語(yǔ)音網(wǎng)站, 在以往的運(yùn)營(yíng)中擁有一定程度的用戶基礎(chǔ).其次, 電腦網(wǎng)頁(yè)端在使用起來(lái)方便快捷, 并且網(wǎng)頁(yè)設(shè)計(jì)精美, 相對(duì)于其他端運(yùn)行更穩(wěn)定.移動(dòng)端可以隨時(shí)關(guān)注主播信息, 觀看主播的節(jié)目, 并且如今智能手機(jī)的廣泛應(yīng)用, 使得移動(dòng)端擁有巨大市場(chǎng).綜合上述情況, 可推測(cè)用戶觀看直播的方式是以電腦網(wǎng)頁(yè)端為主, 移動(dòng)端為輔的交互方式.

      分析: 為了準(zhǔn)確定量了解用戶在線觀看直播平臺(tái)的分布情況, 利用已采集的用戶發(fā)送彈幕和打賞禮物數(shù)據(jù), 生成在線用戶接入平臺(tái)分布圖.如圖7, PCWeb 平臺(tái)的用戶占比為51%, 擁有較大的觀眾支持度.同時(shí), 47%的用戶使用Android 平臺(tái)與IOS 平臺(tái)觀看直播.在兩個(gè)相對(duì)均衡的選擇方式中, 以電腦網(wǎng)頁(yè)為主移動(dòng)端為輔的觀看模式已經(jīng)是主流模式, H1c 得證.

      圖6 用戶省份分布情況

      圖7 用戶平臺(tái)分布情況

      (4) H1d, 用戶平臺(tái)經(jīng)驗(yàn)等級(jí)分布呈低等級(jí)人數(shù)多,高等級(jí)人數(shù)少的分布特點(diǎn).

      依據(jù): 贈(zèng)送虛擬禮物成了用戶提升等級(jí)的最主要的途徑之一.普通用戶通過(guò)賬戶充值購(gòu)買(mǎi)一定數(shù)額的虛擬禮物打賞主播或者參與平臺(tái)不定期的會(huì)員活動(dòng)獲取一定的經(jīng)驗(yàn)來(lái)提升用戶賬號(hào)等級(jí).從社會(huì)學(xué)和心理學(xué)角度出發(fā), 大多數(shù)用戶傾向于不參與或者是不常參與和主播的禮物互動(dòng)而是發(fā)送彈幕來(lái)參與直播的互動(dòng),而有些富豪或者是主播的忠實(shí)粉絲就會(huì)利用打賞的方式取悅主播以達(dá)到表現(xiàn)自我的目的.因此用戶等級(jí)分布可能呈現(xiàn)從低等級(jí)到高等級(jí)逐步減少的分布狀況.

      分析: 利用所采集的3 個(gè)主流直播平臺(tái)用戶交互數(shù)據(jù), 建立用戶經(jīng)驗(yàn)等級(jí)分布模型.如圖8 所示, 用戶等級(jí)主要集中在低等級(jí)部分, 且用戶數(shù)量隨著等級(jí)的增加而逐漸減少.大部分用戶主要集中于15 級(jí)以下,這也符合用戶使用在線直播平臺(tái)的娛樂(lè)目的: 趨向于直接觀看直播和參與實(shí)時(shí)評(píng)論, 而較少贈(zèng)送高額禮物的特點(diǎn).所贈(zèng)送的禮物總價(jià)值越多等級(jí)上升越快, 經(jīng)驗(yàn)等級(jí)為15 級(jí)以上的用戶雖然所占比例不多但卻是平臺(tái)直播間的忠實(shí)粉絲用戶群體, 直接影響主播的收益高低.

      圖8 用戶等級(jí)分布情況

      2.2 用戶行為驅(qū)動(dòng)的用戶理解

      網(wǎng)絡(luò)直播作為網(wǎng)絡(luò)時(shí)代的一種新風(fēng)尚, 對(duì)人們的生活侵入程度越來(lái)越強(qiáng).用戶群體往往對(duì)直播關(guān)注度高, 收看時(shí)長(zhǎng)長(zhǎng), 彈幕發(fā)送頻繁, 并通過(guò)贈(zèng)送大量虛擬禮物滿足互動(dòng)消費(fèi)需求, 自主性強(qiáng).因此, 用戶行為相比較用戶屬性而言具有較高的靈活性與不確定性.對(duì)于用戶行為, 本文綜合大量數(shù)據(jù), 尋求其普遍規(guī)律, 做出如下假設(shè):

      (1) H2a, 用戶發(fā)送彈幕的頻率隨時(shí)間的增長(zhǎng)而逐步降低.

      (2) H2b, 用戶發(fā)送彈幕的長(zhǎng)度更加短小并呈現(xiàn)集群分布的特點(diǎn).

      依據(jù): 不同于微博文本, 用戶所發(fā)表的彈幕評(píng)論通常小于32 個(gè)字, 結(jié)構(gòu)更加自由、形式更加多樣、內(nèi)容更加豐富, 具有更強(qiáng)的實(shí)時(shí)性.“在網(wǎng)上沒(méi)人知道你是一條狗”, 這句話生動(dòng)地反映了網(wǎng)絡(luò)的虛擬性和隱匿性.匿名機(jī)制的存在, 使得用戶可以肆無(wú)忌憚地發(fā)表自己的看法, 參與直播的實(shí)時(shí)評(píng)論, 因此彈幕更新相當(dāng)頻繁.另一方面, 彈幕在表達(dá)個(gè)人的觀點(diǎn)的同時(shí)利用直播屏幕上的滑動(dòng)效果分享給其他用戶, 這也限制彈幕的有效時(shí)長(zhǎng).彈幕這一講究快捷的特點(diǎn), 無(wú)疑加速了短文本的產(chǎn)生.根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心公布的第38 次全國(guó)互聯(lián)網(wǎng)發(fā)展統(tǒng)計(jì)報(bào)告顯示, 我國(guó)網(wǎng)民以10~39 歲的年輕群體為主.因此, 在內(nèi)容語(yǔ)義上, 彈幕更貼近網(wǎng)絡(luò)化用語(yǔ)以及口語(yǔ), 多使用特殊表達(dá)形式, 如數(shù)字或者表情的組合, 這就滿足了用戶群體實(shí)時(shí)彈幕互動(dòng)的需求.

      分析: 為了探究用戶發(fā)送彈幕頻率的分布情況, 我們對(duì)間隔時(shí)間在10 分鐘以內(nèi)(以每分鐘為間隔單位)的彈幕數(shù)量進(jìn)行了統(tǒng)計(jì).如圖9 所示, 說(shuō)明用戶發(fā)送彈幕頻率高, 在3 分鐘內(nèi)彈幕頻率均高達(dá)百萬(wàn)人次級(jí)別, 并且隨間隔時(shí)間增長(zhǎng)而逐漸減少, H2a 得證.

      圖9 用戶發(fā)送彈幕頻率情況

      同理, 為探究彈幕長(zhǎng)度特征, 我們統(tǒng)計(jì)了彈幕長(zhǎng)度分布情況.如圖10 所示, 彈幕長(zhǎng)度以短文本為主,1~5 字左右的彈幕最為常見(jiàn), 且隨著文本長(zhǎng)度的增長(zhǎng)彈幕數(shù)量出現(xiàn)了明顯的減少, 總體呈現(xiàn)出彈幕集群分布于短小處的特征, 這與H2b 假設(shè)相吻合.

      圖10 彈幕長(zhǎng)度分布情況

      彈幕總體呈現(xiàn)出發(fā)送頻率高, 簡(jiǎn)潔多樣, 即時(shí)性強(qiáng)的特征, 一定程度上也切合了當(dāng)前彈幕文化碎片化和互動(dòng)性強(qiáng)的特點(diǎn).

      (3) H2c, 用戶活躍度與用戶歷史發(fā)送彈幕量、打賞金額以及互動(dòng)天數(shù)正相關(guān).

      依據(jù): 首先對(duì)活躍用戶進(jìn)行定義: 在直播時(shí)間段中,參與在線網(wǎng)絡(luò)直播互動(dòng)的用戶定義為活躍用戶.

      作為直播平臺(tái)的生命線, 用戶活躍度是用戶黏性的反應(yīng), 直接決定著一個(gè)直播平臺(tái)的商業(yè)價(jià)值.用戶活躍度的具體量化指標(biāo)往往因應(yīng)用場(chǎng)景而異, 可以根據(jù)用戶來(lái)訪、互動(dòng)情況、核心功能使用頻率等綜合確定.例如: 吳慧等[18]從用戶背景、社交關(guān)系、發(fā)表內(nèi)容質(zhì)量及社交行為4 個(gè)方面來(lái)設(shè)計(jì)微博用戶活躍度指標(biāo).張效尉等[19]從某社交網(wǎng)站用戶群數(shù)據(jù)中, 選取在一段時(shí)間內(nèi)社交網(wǎng)絡(luò)用戶群中用戶平均發(fā)布消息的數(shù)量作為衡量社交網(wǎng)絡(luò)用戶群用戶活躍度指標(biāo).王錦坤等[20]在設(shè)計(jì)基于協(xié)同過(guò)濾的推薦算法時(shí), 提出用戶活躍度與用戶瀏覽項(xiàng)目數(shù)量成正比的模型.本文選擇用戶發(fā)送彈幕量、用戶打賞金額以及用戶互動(dòng)時(shí)長(zhǎng)(天數(shù))作為直播平臺(tái)用戶的活躍度指標(biāo), 主要出于這樣的考慮:彈幕是直播用戶對(duì)主播人與主播內(nèi)容的評(píng)論, 發(fā)送彈幕是直播用戶觀看的體驗(yàn)與參與度的表現(xiàn); 打賞金額是直播觀眾對(duì)主播服務(wù)質(zhì)量的認(rèn)可與肯定, 是深度參與的重要體現(xiàn); 互動(dòng)時(shí)間越長(zhǎng)說(shuō)明該直播用戶對(duì)此直播平臺(tái)提供的服務(wù)越認(rèn)可, 也是用戶黏性的體現(xiàn).

      為此, 本文假設(shè)用戶歷史發(fā)送彈幕量、打賞金額以及互動(dòng)天數(shù)影響用戶活躍度.

      分析: 為了提取更多的用戶行為特征, 我們統(tǒng)計(jì)了連續(xù)兩周時(shí)間內(nèi)用戶在線天數(shù)、發(fā)送彈幕數(shù)量、贈(zèng)送禮物總額、最大發(fā)送彈幕數(shù)量、最大贈(zèng)送禮物價(jià)值以及這段時(shí)間內(nèi)最大連續(xù)在線天數(shù).由于用戶活躍度存在個(gè)體差異性, 故本文假設(shè)這一組數(shù)據(jù)能夠用來(lái)表征不同的用戶活躍度.為了驗(yàn)證用戶活躍度和這些變量之間的相關(guān)關(guān)系, 我們對(duì)這一組數(shù)據(jù)進(jìn)行了主成分分析.主成分分析法能將較多的數(shù)據(jù)變量通過(guò)刪除變量間的重疊部分得到較少的綜合變量, 從而將用戶活躍度更加準(zhǔn)確直觀地表示出來(lái).從表2 可以看出, 共有5 個(gè)主成分.由于第一主成分相比其它主成分和這些變量之間具有更突出的相關(guān)關(guān)系, 故抽取出第一主成分F1 作為用戶活躍度的表征.根據(jù)主成分分析結(jié)果, 可以得到在線天數(shù)和用戶活躍度、彈幕數(shù)量、禮物總量、最大彈幕量、最大禮物量、最大連續(xù)在線天數(shù)的相關(guān)系數(shù)分別為0.724、0.762、0.218、0.838、0.212 和0.792.因此, 對(duì)于用戶活躍度滿足F1=0.724×T1+0.762×T2+0.218×T3+0.838×T4+0.212×T5+0.792×T6,T1-T6 分別代表在線天數(shù)、彈幕數(shù)量、禮物總量、最大彈幕量、最大禮物量、最大連續(xù)在線天數(shù).在線天數(shù)越長(zhǎng), 發(fā)送彈幕量越大, 贈(zèng)送禮物越多, F1 的值越大,用戶活躍度越高, 這個(gè)結(jié)果與H2c 假設(shè)吻合.

      2.3 用戶屬性與用戶行為相融合的用戶理解

      從H1a 以及H1b 可以看出用戶在線觀看直播的時(shí)間以及地域方面有明顯的時(shí)空分布特征, 從H2a 以及H2b 可以看出彈幕長(zhǎng)度以及頻率特征, 從H2c 可以得到用戶平臺(tái)活躍度相關(guān)因素.在線直播主要給用戶提供了即時(shí)性互動(dòng)(即彈幕禮物)的全新觀看直播體驗(yàn).由于在線直播集中在深夜時(shí)段以及具有消費(fèi)性的特點(diǎn), 用戶人群具有明顯的時(shí)空分布特征.彈幕禮物作為在線直播互動(dòng)體驗(yàn)的媒介, 承載著用戶行為的產(chǎn)出.而用戶平臺(tái)活躍度作為用戶互動(dòng)的產(chǎn)物和在線直播平臺(tái)衡量一個(gè)客戶價(jià)值的重要標(biāo)準(zhǔn), 自然也是刻畫(huà)用戶人群的重要因素.因此, 本文認(rèn)為用戶模型的構(gòu)建可從用戶屬性和用戶行為兩個(gè)方面著手.

      表2 成分相關(guān)性分析表

      3 結(jié)論與展望

      用戶屬性和用戶行為共同驅(qū)動(dòng)用戶理解, 構(gòu)成網(wǎng)絡(luò)在線直播背景下的用戶模型.

      用戶屬性方面, 觀眾觀看網(wǎng)絡(luò)直播的時(shí)間選擇上具有周期性變化規(guī)律, 并且得出這與主播的開(kāi)播時(shí)間與日常作息密切相關(guān)的結(jié)論.在沿海發(fā)達(dá)城市的用戶相對(duì)集中, 特別是人口多, 經(jīng)濟(jì)發(fā)達(dá)同時(shí)擁有眾多外來(lái)人口的城市, 在觀看直播的觀眾中占有較大比重.根據(jù)觀看直播平臺(tái)分布情況來(lái)觀察, 如今觀眾選擇的直播平臺(tái)具有“網(wǎng)頁(yè)端為主移動(dòng)端為輔”的主要特點(diǎn).

      而在用戶行為方面, 用戶在直播平臺(tái)的互動(dòng)方式居多, 其中以發(fā)送彈幕為主.用戶所發(fā)送的彈幕內(nèi)容具有“短文本, 高頻率”的特點(diǎn).彈幕內(nèi)容網(wǎng)絡(luò)語(yǔ)化, 接近口語(yǔ), 貼切生活同時(shí)也容易產(chǎn)生誤解與沖突.根據(jù)用戶等級(jí)可以判斷出贈(zèng)送禮物的比重較少, 并且用戶等級(jí)從低到高呈減少的分布狀態(tài).而這兩種互動(dòng)方式與在線天數(shù)共同支持用戶活躍度的理論推斷.

      為此, 本文針對(duì)具體的活躍度給出定量的活躍度計(jì)算指標(biāo), 提取影響用戶活躍度的主要特征利用PCA 技術(shù)根據(jù)影響力最大化方向提取主成分作為用戶活躍值的參考.

      本次的實(shí)驗(yàn)依舊有存在部分不足.首先, 在抓取數(shù)據(jù)方面, 由于所使用的工具的局限性, 只抓取到監(jiān)測(cè)期間有進(jìn)行互動(dòng)的用戶資料信息, 而這一點(diǎn)就忽略了在監(jiān)測(cè)期只進(jìn)行觀看沒(méi)有參與互動(dòng)的用戶; 其次, 用戶信息只停留在進(jìn)行互動(dòng)時(shí)的狀態(tài), 互動(dòng)后獲得收益狀態(tài)沒(méi)有跟蹤到; 再者, 選取的數(shù)據(jù)源較為局限, 可能會(huì)出現(xiàn)數(shù)據(jù)偏差的問(wèn)題.

      猜你喜歡
      彈幕主播禮物
      彈幕
      HOLLOW COMFORT
      “彈幕”防御大師
      第一次做小主播
      一大撥彈幕正在向你襲來(lái)……
      我是小主播
      禮物里的新年
      大灰狼(2018年1期)2018-01-24 15:30:31
      我是小主播
      我是小主播
      送錯(cuò)的禮物
      汝南县| 安平县| 台前县| 平和县| 通山县| 方正县| 淳化县| 庆城县| 成都市| 沂源县| 留坝县| 望城县| 泽州县| 英吉沙县| 肥西县| 廉江市| 兴宁市| 伊金霍洛旗| 乡城县| 四子王旗| 深圳市| 阿克苏市| 石景山区| 十堰市| 苏尼特左旗| 会理县| 南开区| 营山县| 密云县| 休宁县| 双鸭山市| 宿松县| 汝州市| 南江县| 嘉义县| 师宗县| 山丹县| 湖南省| 京山县| 泌阳县| 丁青县|