• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      用戶評(píng)論對(duì)知識(shí)類(lèi)短視頻關(guān)注熱點(diǎn)分析
      ——以B站知識(shí)區(qū)UP主“無(wú)窮小亮的科普日常”為例

      2022-05-31 02:33:30王雨婷
      視聽(tīng) 2022年4期
      關(guān)鍵詞:詞頻科普文本

      王雨婷

      一、研究背景

      隨著視頻App針對(duì)移動(dòng)端的優(yōu)化與升級(jí),用戶沉浸手機(jī)的時(shí)間大幅度提升,短視頻已經(jīng)成為用戶短時(shí)間娛樂(lè)與多感官滿足的主要選擇。經(jīng)過(guò)2016年短視頻元年與2020年直播元年的助推,短視頻的內(nèi)容已不再局限于娛樂(lè)這一領(lǐng)域,而是根據(jù)用戶多樣化的內(nèi)容期待與需求對(duì)自身進(jìn)行拓展,知識(shí)類(lèi)短視頻應(yīng)運(yùn)而生。知識(shí)類(lèi)短視頻將知識(shí)或科普內(nèi)容以輕松、可視、去抽象化的方式進(jìn)行呈現(xiàn),以期最終達(dá)到降低專業(yè)知識(shí)獲取門(mén)檻、擴(kuò)大學(xué)習(xí)群體、提高傳播效率的效果。這類(lèi)短視頻憑借生動(dòng)有趣、理解門(mén)檻低的特點(diǎn),滿足了用戶的信息需求。2020年年初暴發(fā)的新冠肺炎疫情為知識(shí)類(lèi)短視頻的迅速發(fā)展提供了條件,疫情期間在家辦公和外出受限的狀況也給予了非全職視頻制作者更多的自由時(shí)間,為自由時(shí)間轉(zhuǎn)化為“認(rèn)知盈余”提供了基礎(chǔ)條件。

      知識(shí)類(lèi)短視頻近幾年在各視頻平臺(tái)發(fā)展迅速?!?021 B站創(chuàng)作者生態(tài)報(bào)告》顯示,2021年泛知識(shí)內(nèi)容占B站視頻總播放量的45%,知識(shí)區(qū)UP主數(shù)量增長(zhǎng)92%,泛知識(shí)品類(lèi)活動(dòng)“知識(shí)分享官”中活動(dòng)視頻的總播放量達(dá)182億次。B站、抖音、快手等視頻平臺(tái)更是通過(guò)推出科普內(nèi)容扶持計(jì)劃、引入優(yōu)質(zhì)用戶生成內(nèi)容等手段,積極搶占知識(shí)和科學(xué)類(lèi)傳播這一長(zhǎng)尾市場(chǎng)。B站近幾年突破“二次元”“亞文化”的標(biāo)簽,立足“趣傳播”這一主題,對(duì)自身進(jìn)行板塊拓展,打造多元內(nèi)容,打入更多興趣圈層,突破了原有的用戶群體局限性問(wèn)題。2020年6月5日,B站上線了一級(jí)分區(qū)“知識(shí)區(qū)”,其中包含科學(xué)科普、社科人文、野生技術(shù)協(xié)會(huì)等6個(gè)二級(jí)分區(qū),旨在分享知識(shí)、經(jīng)驗(yàn)、技能、觀點(diǎn)、人文等內(nèi)容。B站已經(jīng)成為Z世代用戶深度使用,進(jìn)行內(nèi)容輸入與輸出的重要場(chǎng)所。知識(shí)類(lèi)短視頻也成為用戶觀看的重要選擇。

      在眾多B站短視頻制作者中,“無(wú)窮小亮的科普日?!保ㄒ韵潞?jiǎn)稱“無(wú)窮小亮”)是名副其實(shí)的知識(shí)區(qū)UP主,其視頻內(nèi)容專注于生物學(xué)相關(guān)知識(shí)和常識(shí)的科普,其發(fā)布的177個(gè)視頻中有166個(gè)投放在知識(shí)區(qū)。他還推出熱門(mén)欄目“亮記生物鑒定”,憑借幽默的語(yǔ)言風(fēng)格和活潑的互動(dòng)方式博得了眾多用戶的關(guān)注,更是創(chuàng)造出“水猴子”和“藏狐”等頗具個(gè)人特色的“?!??!盁o(wú)窮小亮”在B站粉絲數(shù)為589萬(wàn),視頻總播放量為4億,近90天的視頻平均播放量為405.1萬(wàn),在B站的知識(shí)區(qū)用戶中具有相當(dāng)?shù)闹扰c影響力。

      本文以“無(wú)窮小亮”為研究對(duì)象,對(duì)其播放量最高的五個(gè)視頻的評(píng)論文本進(jìn)行詞頻統(tǒng)計(jì)和LDA主題建模,旨在挖掘用戶對(duì)科普短視頻的關(guān)注重點(diǎn),進(jìn)而分析用戶對(duì)科普短視頻的關(guān)注傾向與討論角度。

      二、研究方法與研究框架

      根據(jù)研究實(shí)際需要,本文在分析從B站獲取的相關(guān)評(píng)論文本時(shí),選用詞頻分析法和LDA主題模型作為主要研究方法。這兩種研究方法通過(guò)對(duì)文本進(jìn)行挖掘與分析,可以較為清晰直觀地描述繁復(fù)、模糊的文本數(shù)據(jù),并對(duì)文本的相關(guān)主題進(jìn)行較為客觀的呈現(xiàn)。此方法在國(guó)內(nèi)外相關(guān)研究中已得到較為廣泛的使用。

      (一)詞頻分析法

      詞頻指的是一個(gè)詞語(yǔ)在特定范圍文本內(nèi)的重復(fù)程度或出現(xiàn)頻率的高低,詞頻分析法則是基于此概念來(lái)判斷詞語(yǔ)重要性的研究方法。1917年,文獻(xiàn)學(xué)家科爾和伊爾斯開(kāi)始使用定量的方法對(duì)比較解剖學(xué)文獻(xiàn)進(jìn)行研究,并將相關(guān)圖書(shū)和期刊文章按照國(guó)別進(jìn)行統(tǒng)計(jì)分類(lèi)。20世紀(jì)六七十年代正式形成了文獻(xiàn)計(jì)量學(xué)。在文獻(xiàn)計(jì)量學(xué)的發(fā)展與應(yīng)用過(guò)程中,詞頻一直是重要的統(tǒng)計(jì)項(xiàng)目和研究手段之一。學(xué)者鄧珞華認(rèn)為詞頻的波動(dòng)與社會(huì)現(xiàn)象、情報(bào)現(xiàn)象之間有著內(nèi)在的聯(lián)系,一定的社會(huì)現(xiàn)象和情報(bào)現(xiàn)象要引起一定詞頻波動(dòng)現(xiàn)象①。如今,詞頻已被多次運(yùn)用于國(guó)內(nèi)的文本數(shù)據(jù)分析中。學(xué)者梁立明等運(yùn)用關(guān)鍵詞詞頻分析法,對(duì)我國(guó)8年間的納米科技的研究領(lǐng)域、研究動(dòng)向等現(xiàn)狀進(jìn)行分析,并通過(guò)總結(jié)研究熱點(diǎn)以及研究弱項(xiàng)為我國(guó)納米科技的未來(lái)發(fā)展提供信息②。學(xué)者儲(chǔ)節(jié)旺等基于文獻(xiàn)分析法對(duì)近十年幾種典型的知識(shí)管理研究方法進(jìn)行簡(jiǎn)要描述③。

      (二)LDA主題模型

      LDA主題詞挖掘是自然語(yǔ)言處理中的重要挖掘方法,也是一種完全生產(chǎn)式的模型。LDA主題模型可以對(duì)潛藏在文本內(nèi)容下的主題進(jìn)行挖掘與提取,并對(duì)各個(gè)主題下相關(guān)語(yǔ)項(xiàng)的集合和概率進(jìn)行展示。這種研究方法能夠較為有效地降低研究者個(gè)人因素的影響④。LDA主題模型在國(guó)內(nèi)外的各項(xiàng)研究中已經(jīng)得到了大范圍的使用。學(xué)者唐曉波等發(fā)現(xiàn)LDA模型可以對(duì)微博短文本進(jìn)行有效的主題檢索,并且能清晰地挖掘類(lèi)簇中潛在主題⑤。學(xué)者吳江等認(rèn)為利用LDA進(jìn)行特征提取能顯著地降低數(shù)據(jù)維度,優(yōu)化分類(lèi)模型,提高分類(lèi)準(zhǔn)確率和分類(lèi)效率⑥。學(xué)者婁巖等認(rèn)為L(zhǎng)DA模型能夠分析用戶對(duì)各個(gè)主題的關(guān)注狀況和重視程度,以及關(guān)注熱點(diǎn)和情感態(tài)度隨時(shí)間遷移的變化情況與發(fā)展趨勢(shì)⑦。

      (三)研究框架

      為了解B站用戶對(duì)于知識(shí)類(lèi)短視頻的關(guān)注點(diǎn)和討論點(diǎn),本研究設(shè)計(jì)了以下四個(gè)步驟。首先,選取“無(wú)窮小亮”在B站知識(shí)區(qū)發(fā)布的播放量前五的視頻評(píng)論作為研究對(duì)象,運(yùn)用Python對(duì)數(shù)據(jù)進(jìn)行爬取與采集;其次,進(jìn)一步整理和清洗已獲取到的文本數(shù)據(jù);再次,對(duì)清洗后的文本數(shù)據(jù)進(jìn)行詞頻統(tǒng)計(jì)分析;最后,通過(guò)LDA模型對(duì)數(shù)據(jù)進(jìn)行主題挖掘,對(duì)計(jì)算結(jié)果進(jìn)行描述與分析。

      三、數(shù)據(jù)來(lái)源與結(jié)果分析

      (一)數(shù)據(jù)來(lái)源與數(shù)據(jù)處理

      本文選取B站知識(shí)類(lèi)短視頻評(píng)論作為文本數(shù)據(jù)來(lái)源,旨在挖掘用戶對(duì)科普短視頻的潛在關(guān)注點(diǎn),進(jìn)而分析用戶對(duì)科普短視頻的關(guān)注傾向與討論角度。本文利用Python抓取“無(wú)窮小亮”播放量最高的五個(gè)視頻的評(píng)論內(nèi)容,五個(gè)視頻按照播放量降序排列依次分別為“【亮記生物鑒定】網(wǎng)絡(luò)熱傳生物鑒定29”“【亮記生物鑒定】網(wǎng)絡(luò)熱傳生物鑒定30”“【亮記生物鑒定】網(wǎng)絡(luò)熱傳生物鑒定28”“【亮記生物鑒定】網(wǎng)絡(luò)熱傳生物鑒定23”和“【亮記生物鑒定】網(wǎng)絡(luò)熱傳生物鑒定24”。除去原始數(shù)據(jù)的缺失與重復(fù)數(shù)據(jù),最終獲得的文本量分別為 106200字、95464字、57113字、73429字和58457字。

      為了準(zhǔn)確地展現(xiàn)文本自身所涵蓋與表達(dá)的概念意義,本研究通過(guò)設(shè)置停用詞表對(duì)文本數(shù)據(jù)進(jìn)行清洗,將無(wú)意義或?qū)Ρ狙芯繜o(wú)價(jià)值的詞匯從文本中剔除。最后,對(duì)經(jīng)過(guò)清洗的文本數(shù)據(jù)進(jìn)行詞頻統(tǒng)計(jì)分析和LDA主題模型分析。

      (二)詞頻統(tǒng)計(jì)結(jié)果

      對(duì)清理后的文本進(jìn)行分詞處理,得到文本數(shù)據(jù)中詞匯出現(xiàn)的頻率。隨后根據(jù)詞頻由高到低進(jìn)行排序,排序結(jié)果如表1、表2、表3、表4、表5所示。

      表2 “【亮記生物鑒定】網(wǎng)絡(luò)熱傳生物鑒定30”評(píng)論文本詞頻

      表3 “【亮記生物鑒定】網(wǎng)絡(luò)熱傳生物鑒定28”評(píng)論文本詞頻

      表4 “【亮記生物鑒定】網(wǎng)絡(luò)熱傳生物鑒定23”評(píng)論文本詞頻

      表5 “【亮記生物鑒定】網(wǎng)絡(luò)熱傳生物鑒定24”評(píng)論文本詞頻

      通過(guò)對(duì)5張表格的觀察發(fā)現(xiàn),“藏狐”一詞出現(xiàn)最為頻繁,這一詞是“無(wú)窮小亮”的代名詞,與博主本人密切相關(guān)?!八镒印薄按蛉恕钡仍~出現(xiàn)較為頻繁,這些詞與B站用戶根據(jù)其視頻形成的獨(dú)特“梗文化”息息相關(guān)。將表格內(nèi)容與視頻內(nèi)容進(jìn)行對(duì)比后可以發(fā)現(xiàn),如“兔子”“尾巴”“宿遷”“臭蟲(chóng)”等詞,僅出現(xiàn)在一張表格中,但單次詞頻較高。這類(lèi)詞與當(dāng)期視頻內(nèi)容聯(lián)系緊密,多為視頻中討論度最高片段的關(guān)鍵詞。

      (三)LDA主題模型分析

      本文對(duì)整個(gè)第三方評(píng)論文本數(shù)據(jù)進(jìn)行LDA主題模型分析,運(yùn)用Python語(yǔ)言和gensim庫(kù)進(jìn)行主題生成和主題詞分布的統(tǒng)計(jì)。

      從表6可以看出,在主題一概率最大的前12個(gè)主題詞中,“知識(shí)”“增加”“叮當(dāng)貓”“生產(chǎn)隊(duì)”等反映了評(píng)論文本中鮮明的互聯(lián)網(wǎng)語(yǔ)言特征。其中,“奇怪的知識(shí)增加了”“生產(chǎn)隊(duì)的驢都不敢這么歇”等圈層化、個(gè)性化的表達(dá),突顯了用戶在評(píng)論時(shí)對(duì)自我形象的展示,以及用戶表達(dá)與B站社區(qū)文化的順應(yīng)與融合。在主題二概率最大的前12個(gè)詞中,“藏狐”“水猴子”“打人”“雙節(jié)棍”等主題詞則勾勒出“無(wú)窮小亮”在B站的基本形象?!盁o(wú)窮小亮”本人酷似藏狐的外形,每期視頻必不可少的“水猴子”環(huán)節(jié),以及對(duì)辟謠內(nèi)容感到無(wú)奈與憤怒時(shí)對(duì)著鏡頭甩雙節(jié)棍的經(jīng)典動(dòng)作,成為指代其形象的獨(dú)特符號(hào)。用戶對(duì)這些符號(hào)的反復(fù)記憶與利用,在促進(jìn)評(píng)論區(qū)共鳴情緒的產(chǎn)生與交流互動(dòng)的同時(shí),也間接構(gòu)造出“無(wú)窮小亮”評(píng)論區(qū)差異化的景象。在主題三概率最大的前 12 個(gè)詞中,“宿遷”“臭蟲(chóng)”“放生”“沭陽(yáng)”等主題詞與視頻內(nèi)容緊密相關(guān),用戶在觀看后將科普知識(shí)與自身經(jīng)歷相結(jié)合,提出問(wèn)題,發(fā)表感想,形成了科普知識(shí)在評(píng)論區(qū)的內(nèi)容拓展與二次傳播。

      表6 主題詞分布表

      四、基于詞頻統(tǒng)計(jì)和LDA主題模型的B站知識(shí)類(lèi)短視頻評(píng)論文本內(nèi)容分析

      通過(guò)對(duì)文本數(shù)據(jù)詞頻統(tǒng)計(jì)結(jié)果深入分析發(fā)現(xiàn),用戶在使用B站觀看知識(shí)類(lèi)科普短視頻時(shí),評(píng)論的關(guān)注點(diǎn)主要在于賬號(hào)運(yùn)營(yíng)者本人和科普內(nèi)容本身,同時(shí)評(píng)論的文字表達(dá)具有很強(qiáng)的圈層化與年輕化語(yǔ)態(tài)特征,體現(xiàn)出B站活潑幽默、極具平臺(tái)特征的社區(qū)氛圍。

      結(jié)合詞頻進(jìn)行整體分析,“藏狐”等詞高頻出現(xiàn),顯示出用戶在觀看知識(shí)類(lèi)短視頻時(shí)對(duì)于運(yùn)營(yíng)者本人的高度關(guān)注。運(yùn)營(yíng)者作為該賬號(hào)內(nèi)容的主要生產(chǎn)者,對(duì)視頻內(nèi)容感興趣的用戶也自然會(huì)對(duì)運(yùn)營(yíng)者本身產(chǎn)生興趣。對(duì)于運(yùn)營(yíng)者本人的廣泛討論,反映出運(yùn)營(yíng)者自身的個(gè)人吸引力與影響力,也反映出用戶對(duì)其個(gè)人形象塑造的肯定和認(rèn)同。然而,運(yùn)營(yíng)者過(guò)于突出的個(gè)人特性有時(shí)也會(huì)成為與科普內(nèi)容無(wú)關(guān)的討論對(duì)象,導(dǎo)致討論議題的分散和討論重點(diǎn)的偏移,對(duì)科普知識(shí)的傳播效果造成了一定的影響。

      同時(shí),在部分視頻的評(píng)論區(qū)中,出現(xiàn)了與內(nèi)容相關(guān)的主題詞詞頻超過(guò)與運(yùn)營(yíng)者相關(guān)詞語(yǔ)的詞頻這一情況。這也側(cè)面證明了,當(dāng)視頻內(nèi)容足夠吸引人,能調(diào)動(dòng)起大部分用戶的分享欲和表達(dá)欲,能喚起大部分用戶的廣泛、熱烈討論時(shí),對(duì)運(yùn)營(yíng)者的關(guān)注就會(huì)退居其次,評(píng)論區(qū)也會(huì)在針對(duì)科普知識(shí)的討論中形成一種良性的輿論氛圍和科學(xué)討論環(huán)境。

      結(jié)合主題詞分布表分析,B站用戶對(duì)于知識(shí)類(lèi)短視頻的主要討論與視頻本身聯(lián)系緊密,討論內(nèi)容的集中度較高。而評(píng)論內(nèi)容中網(wǎng)絡(luò)流行語(yǔ)的高頻使用和語(yǔ)言表達(dá)的不規(guī)范體現(xiàn)了評(píng)論區(qū)言論環(huán)境的輕松、隨意和包容。這側(cè)面證明了高理解門(mén)檻的專業(yè)知識(shí),通過(guò)趣味化、輕松化的內(nèi)容表達(dá)和短視頻形式下的娛樂(lè)化、通俗化呈現(xiàn),能夠較為容易地被用戶獲知和攝取,并成為用戶交流討論的主要內(nèi)容。

      五、結(jié)語(yǔ)

      B站是Z世代網(wǎng)絡(luò)化生存與社交的新園地,其逐漸擴(kuò)張的影響范圍和日益增強(qiáng)的影響力,使其成為知識(shí)和科普工作者不容忽視的重要陣地。本文通過(guò)對(duì)詞頻和主題詞的統(tǒng)計(jì)發(fā)現(xiàn),用戶對(duì)知識(shí)類(lèi)短視頻的關(guān)注點(diǎn)主要集中在視頻與視頻制作者本身。在語(yǔ)言表達(dá)上,用戶的討論與交流也脫離了嚴(yán)肅抽象的專業(yè)化表達(dá),而是將B站內(nèi)圈層化的語(yǔ)言習(xí)慣與自身個(gè)性化表達(dá)相融合,在評(píng)論區(qū)形成個(gè)人特色鮮明又兼具共性、交流順暢的和諧景象。另外,評(píng)論區(qū)用戶的積極正向討論也印證了專業(yè)知識(shí)可以通過(guò)通俗化、娛樂(lè)化的方式進(jìn)行有效的傳播。如何進(jìn)一步使用戶的注意力集中在視頻內(nèi)容與知識(shí)科普上,則有待科普工作者進(jìn)行更深入的探索。

      注釋:

      ①鄧珞華.詞頻分析——一種新的情報(bào)分析研究方法[J].大學(xué)圖書(shū)館通訊,1988(02):18-25.

      ②梁立明,謝彩霞.詞頻分析法用于我國(guó)納米科技研究動(dòng)向分析[J].科學(xué)學(xué)研究,2003(02):138-142.

      ③儲(chǔ)節(jié)旺,錢(qián)倩.基于詞頻分析的近10年知識(shí)管理的研究熱點(diǎn)及研究方法[J].情報(bào)科學(xué),2014(10):156-160.

      ④廖海涵,王曰芬,關(guān)鵬.微博輿情傳播周期中不同傳播者的主題挖掘與觀點(diǎn)識(shí)別[J].圖書(shū)情報(bào)工作,2018(19):77-85.

      ⑤唐曉波,房小可.基于文本聚類(lèi)與LDA相融合的微博主題檢索模型研究 [J].情報(bào)理論與實(shí)踐,2013(08):85-90.

      ⑥吳江,侯紹新,靳萌萌,胡忠義.基于LDA模型特征選擇的在線醫(yī)療社區(qū)文本分類(lèi)及用戶聚類(lèi)研究[J].情報(bào)學(xué)報(bào),2017(11):1183-1191.

      ⑦婁巖,楊嘉林,黃魯成,苗紅.基于網(wǎng)絡(luò)問(wèn)答社區(qū)的老年科技公眾關(guān)注熱點(diǎn)及情感分析——以“知乎”為例[J].情報(bào)雜志,2020(03):115-122.

      猜你喜歡
      詞頻科普文本
      基于詞頻分析法的社區(qū)公園歸屬感營(yíng)建要素研究
      園林科技(2021年3期)2022-01-19 03:17:48
      科普達(dá)人養(yǎng)成記
      在808DA上文本顯示的改善
      基于doc2vec和TF-IDF的相似文本識(shí)別
      電子制作(2018年18期)2018-11-14 01:48:06
      科普連連看
      科普連連看
      文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
      詞頻,一部隱秘的歷史
      云存儲(chǔ)中支持詞頻和用戶喜好的密文模糊檢索
      以關(guān)鍵詞詞頻法透視《大學(xué)圖書(shū)館學(xué)報(bào)》學(xué)術(shù)研究特色
      临湘市| 长白| 丰原市| 班玛县| 建宁县| 泸州市| 天津市| 建始县| 漳平市| 罗山县| 隆子县| 彰化市| 桑日县| 房产| 昌江| 南宁市| 洞口县| 晋州市| 鸡西市| 泰宁县| 旬邑县| 始兴县| 泾阳县| 邓州市| 高青县| 长阳| 玉溪市| 昌图县| 普陀区| 盈江县| 万源市| 朝阳区| 福建省| 齐齐哈尔市| 德兴市| 旬阳县| 大同市| 巴中市| 阿坝县| 桐乡市| 二手房|