• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于網(wǎng)絡(luò)爬蟲和社會(huì)網(wǎng)絡(luò)分析的嗶哩嗶哩用戶關(guān)注行為研究

      2022-05-30 03:29:09高悅
      關(guān)鍵詞:網(wǎng)絡(luò)爬蟲意見領(lǐng)袖社會(huì)網(wǎng)絡(luò)分析

      摘要:文章利用網(wǎng)絡(luò)爬蟲,通過“滾雪球”的方法在嗶哩嗶哩官網(wǎng)爬取了42位百萬粉絲以上的up主的關(guān)注列表,經(jīng)提取和整理,將其繪制成42x42的up主關(guān)注矩陣,并利用社會(huì)網(wǎng)絡(luò)分析法和Ucinet軟件對(duì)其進(jìn)行了密度和意見領(lǐng)袖分析。

      關(guān)鍵詞:網(wǎng)絡(luò)爬蟲;社會(huì)網(wǎng)絡(luò)分析;意見領(lǐng)袖;嗶哩嗶哩

      中圖法分類號(hào):G25文獻(xiàn)標(biāo)識(shí)碼:A

      Research on user attention behavior of bilibili based onWeb crawler and social network analysis

      GAO Yue

      (College of Information Management, Nanjing Agricultural University,Nanjing 210095,China)

      Abstract:This paper uses the Web crawler to climb the attention list of 42 up masters with more than one million fans on bilibili official website through the “snowball” method. After extraction and sorting, it is drawn into a 42x42 up master attention matrix, and its density and opinion leader are analyzed by using social network analysis method and Ucinet software.

      Key words: Web crawler, social network analysis, opinion leaders, bilibili

      嗶哩嗶哩( bilibili)簡(jiǎn)稱 B 站,創(chuàng)建于2009年6月,是當(dāng)下最受歡迎的彈幕網(wǎng)站,其主要面向中國年輕一代,并將其核心用戶群體定義為 Generation Z ( Z 世代),即1995~2009年出生的一代,也指喜歡玩樂、喜歡學(xué)習(xí)和喜歡分享生活的年輕一代。起初,嗶哩嗶哩主打動(dòng)漫二次元分化和視頻分享,近年來,逐漸發(fā)展成集動(dòng)漫、視頻、游戲、直播等于一體的綜合性網(wǎng)站。2018年末,其被 QuestMobile 研究院評(píng)為了“Z 世代偏愛 APP”和“Z 世代偏好泛娛樂 APP ”的首位,可見嗶哩嗶哩已經(jīng)成為中國青年一代喜愛的一個(gè)高度集中的文化社群和視頻平臺(tái)。嗶哩嗶哩用戶可分為 up 主用戶和普通用戶,其主要是基于關(guān)注、點(diǎn)贊、投幣、收藏、評(píng)論和分享等關(guān)系構(gòu)建社會(huì)網(wǎng)絡(luò),用戶通過對(duì) up 主投遞的視頻進(jìn)行觀看、點(diǎn)贊、投幣、收藏和分享等行為進(jìn)行傳播,也可以通過評(píng)論與 up 主或其他用戶進(jìn)行交流。因此,關(guān)注數(shù)多的 up 主也會(huì)像微博“黃 V “紅 V 的用戶一樣具有名人效應(yīng)。同時(shí),根據(jù)嗶哩嗶哩于2020年8月27日發(fā)布的“2020年第二季度財(cái)報(bào)(2020Q2財(cái)報(bào))顯示,其月活躍用戶數(shù)已上億,其中移動(dòng)端占了絕對(duì)的比重,日活躍用戶數(shù)達(dá)到五千萬以上,平均用戶年齡為21.5歲。由此可知,嗶哩嗶哩用戶所產(chǎn)生的信息量是十分巨大的,且對(duì)年輕人具有很大的影響力,如何高效、快速的獲取有價(jià)值的內(nèi)容以及發(fā)現(xiàn)具有名人效應(yīng)的用戶是值得探究的。因此,本文從用戶的關(guān)注行為出發(fā),利用網(wǎng)絡(luò)爬蟲,通過“滾雪球”的方式爬取了 up 主的關(guān)注列表,并選取了42位100萬粉絲數(shù)以上的 up 主,利用社會(huì)網(wǎng)絡(luò)分析法對(duì)他們的互關(guān)注情況進(jìn)行了密度和意見領(lǐng)袖分析。

      1相關(guān)概念

      1.1網(wǎng)絡(luò)爬蟲

      網(wǎng)絡(luò)爬蟲,也就是所謂的“網(wǎng)絡(luò)蜘蛛”或“Web 機(jī)器人”,是一種能夠根據(jù)特定的規(guī)律,自動(dòng)獲取網(wǎng)絡(luò)上的信息的一種程序或腳本,是網(wǎng)絡(luò)信息收集的基礎(chǔ)[1],是目前搜索引擎和大數(shù)據(jù)分析的技術(shù)基礎(chǔ),其爬取內(nèi)容主要包括網(wǎng)絡(luò)上的文本、圖片、音頻等數(shù)據(jù)。根據(jù)網(wǎng)絡(luò)爬蟲的體系結(jié)構(gòu)及實(shí)現(xiàn)技術(shù),可以把爬蟲劃分為一般型、聚焦型、增量型和 Deep Web 型[2]。網(wǎng)絡(luò)爬蟲的基本結(jié)構(gòu)包括:(1)爬蟲調(diào)度。它啟動(dòng)、執(zhí)行、停止和監(jiān)控爬蟲的運(yùn)行;(2)爬蟲核心模塊。主要包括 URL 管理器、網(wǎng)頁下載器、網(wǎng)頁分析器3個(gè)部分, URL 管理器用于管理正在等待爬行的 URL,網(wǎng)頁下載者負(fù)責(zé)下載與 URL 相關(guān)的網(wǎng)頁,網(wǎng)頁分析器則負(fù)責(zé)分析網(wǎng)頁中有價(jià)值的數(shù)據(jù),或者將網(wǎng)頁中的 URL 解析并添加到 URL 管理器中;(3)有價(jià)值的資料存儲(chǔ)。本系統(tǒng)不但對(duì)網(wǎng)絡(luò)爬行器進(jìn)行了詳細(xì)描述,同時(shí)對(duì)其工作流程進(jìn)行了詳細(xì)闡述。

      1.2社會(huì)網(wǎng)絡(luò)分析

      社會(huì)網(wǎng)絡(luò)是指社會(huì)行動(dòng)者及他們之間關(guān)系的集合,是由多個(gè)節(jié)點(diǎn)(社會(huì)行動(dòng)者)和各個(gè)節(jié)點(diǎn)(關(guān)系)之間的連線所組成的集合[3]。在本文中,up 主就是節(jié)點(diǎn),up 主之間是否存在關(guān)注與被關(guān)注就是節(jié)點(diǎn)之間的連線,由 up 主和他們之間的關(guān)注情況構(gòu)成本次研究的社會(huì)網(wǎng)絡(luò)。

      社會(huì)網(wǎng)絡(luò)分析是一種用圖論工具來分析社會(huì)關(guān)系結(jié)構(gòu)和性質(zhì)的一系列標(biāo)準(zhǔn)與方法,群體成員之間的關(guān)系網(wǎng)絡(luò)被概念化為代表成員的節(jié)點(diǎn)之間的連接網(wǎng)絡(luò)[4],經(jīng)常表現(xiàn)為社群圖的形式。其分析內(nèi)容有很多,本文主要對(duì)其包含的以下內(nèi)容進(jìn)行分析。

      密度是衡量個(gè)體與社群中其他個(gè)體之間聯(lián)系程度的指標(biāo),通過測(cè)量社群密度可以確定一個(gè)社群是否由相互作用形成。在一個(gè)社群分析中,密度可以用來判斷一個(gè)社群關(guān)系是否緊密。

      中心性是衡量參與者在自己的社交網(wǎng)絡(luò)中的核心地位和影響力的一個(gè)評(píng)價(jià)指標(biāo),反映的是他們?cè)谏缃痪W(wǎng)絡(luò)中的位置和影響傳播能力的不同。在一個(gè)社群分析中,中心度可以判斷出一個(gè)社群中處于核心地位的行動(dòng)者。

      結(jié)構(gòu)洞是一種通過三個(gè)行為體的關(guān)系而獲得“信息利益”與“控制利益”的特定結(jié)構(gòu),因而在結(jié)構(gòu)洞位置上的行為體比在社交網(wǎng)絡(luò)中其他地方的行為體更有競(jìng)爭(zhēng)力。在一個(gè)社群的社會(huì)網(wǎng)絡(luò)分析中,結(jié)構(gòu)洞可以和中心度一起分析社群中的意見領(lǐng)袖。

      2數(shù)據(jù)獲取與處理

      2.1數(shù)據(jù)獲取

      本文的數(shù)據(jù)來源于嗶哩嗶哩官網(wǎng),利用網(wǎng)絡(luò)爬蟲,通過“滾雪球”的抽樣方法爬取了百萬粉絲以上的 up 主關(guān)注列表,即隨機(jī)爬取一位關(guān)注人數(shù)在100萬以上的 up 主所關(guān)注的用戶及其關(guān)注用戶的粉絲數(shù)和關(guān)注列表,觀察其關(guān)注用戶,經(jīng)篩選保存粉絲數(shù)在100萬以上 up 主的獲取數(shù)據(jù),得到第一組數(shù)據(jù);然后從該組數(shù)據(jù)中再隨機(jī)抽取一位關(guān)注人數(shù)在100萬以上的 up 主重復(fù)上述過程。為了便于分析,本文最初擬定爬取夠40位百萬粉絲以上的 up 主關(guān)注情況,經(jīng)過上述方法,最終爬取了42位百萬粉絲以上的 up 主關(guān)注列表。其中,爬取數(shù)據(jù)以“被關(guān)注者名稱”“關(guān)注者名稱”“關(guān)注者粉絲數(shù)”的形式保存至 Excle 文檔中,共爬取8631條數(shù)據(jù),經(jīng)去重與篩選后,剩余2581條數(shù)據(jù)。

      2.2數(shù)據(jù)處理

      通過對(duì)最終保存的2581條數(shù)據(jù)進(jìn)行提取和整理后,將42位 up 主的互關(guān)注情況統(tǒng)計(jì)為42×42的 Excle 矩陣形式。其中,矩陣的行代表被關(guān)注者,列代表關(guān)注者,矩陣中的元素代表關(guān)注情況,即如果某一位 up 主被另一位 up 主所關(guān)注,則對(duì)應(yīng)行列的矩陣元素值取1,否則取0。

      3結(jié)果分析與討論

      本節(jié)主要通過使用社會(huì)網(wǎng)絡(luò)分析軟件— Ucinet,對(duì)所獲取的42×42的二值矩陣進(jìn)行密度、意見領(lǐng)袖及小團(tuán)體分析。在進(jìn)行上述分析之前,首先將42×42的二值矩陣導(dǎo)入進(jìn)社會(huì)網(wǎng)絡(luò)分析軟件 Ucinet 中,然后利用 Ucinet 的可視化繪圖軟件工具 Netdraw 繪制出該矩陣社群內(nèi)交流網(wǎng)絡(luò)的社群圖,其中箭頭指向的方向是由關(guān)注者指向被關(guān)注者,雙箭頭表示兩人是互相關(guān)注的狀態(tài)。社群圖顯示,該社會(huì)網(wǎng)絡(luò)中沒有孤立點(diǎn),所有人都存在關(guān)注與被關(guān)注關(guān)系,即社會(huì)網(wǎng)絡(luò)成員之間關(guān)系較為緊密,而且“老番茄”“中國 boy 超級(jí)大猩猩”“小潮院長(zhǎng)”等人更是處于該圖的核心位置,且擁有很多的關(guān)注者,有可能為該社會(huì)網(wǎng)絡(luò)的意見領(lǐng)袖,但仍需進(jìn)行后續(xù)研究分析。

      3.1密度分析

      首先,使用 Ucinet 軟件,選擇“變換→轉(zhuǎn)換→ Maximum”路徑對(duì)42×42的二值矩陣進(jìn)行對(duì)稱化處理,以便后續(xù)研究分析。然后選擇“網(wǎng)絡(luò)→凝聚力→密度→密度”路徑對(duì)由42位 up 主組成社會(huì)網(wǎng)絡(luò)進(jìn)行密度分析,得出該社會(huì)網(wǎng)絡(luò)密度為0.3171。在社會(huì)網(wǎng)絡(luò)分析之中,密度的取值范圍為[0,1],值越接近1則代表社會(huì)網(wǎng)絡(luò)中的行動(dòng)者彼此間關(guān)系越緊密,但在實(shí)際網(wǎng)絡(luò)中能得出的最大網(wǎng)絡(luò)密度為0.5[5]。相較之下,本文所研究的社會(huì)網(wǎng)絡(luò)成員之間的關(guān)系緊密。

      3.2意見領(lǐng)袖分析

      在網(wǎng)絡(luò)環(huán)境中,意見領(lǐng)袖是社會(huì)網(wǎng)絡(luò)中傳播信息的橋梁,具有一定的影響力。在社交網(wǎng)絡(luò)中,通常處于中間位置的行為主體為觀點(diǎn)領(lǐng)導(dǎo)者,而處于結(jié)構(gòu)空穴狀態(tài)的行為主體,因其在社會(huì)網(wǎng)絡(luò)中能在信息傳遞過程中獲取信息利益和控制利益,具有成為意見領(lǐng)袖的優(yōu)勢(shì)。所以,在社交網(wǎng)絡(luò)中,對(duì)網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行中心分析和結(jié)構(gòu)洞分析即可。

      3.2.1中心性分析

      關(guān)于社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)中心性的度量,共有三個(gè)度量指標(biāo):點(diǎn)度中心度、中介中心度和接近中心度,在本文中,僅采取點(diǎn)度中心度和中介中心度進(jìn)行分析。

      點(diǎn)度中心度用來衡量社交網(wǎng)絡(luò)中參與者和其他參與者之間的聯(lián)系數(shù)目,以描述各個(gè)參與者在社交網(wǎng)絡(luò)中的位置中心指標(biāo),進(jìn)而衡量出每個(gè)行動(dòng)者在社會(huì)網(wǎng)絡(luò)中的地位。點(diǎn)度中心度的值越大,行動(dòng)者就越處于社會(huì)網(wǎng)絡(luò)的核心地位。在 Ucinet 軟件中,選擇“網(wǎng)絡(luò)→中心度→度”路徑對(duì)42×42的對(duì)稱矩陣進(jìn)行點(diǎn)度中心度分析可知,本文所研究的社會(huì)網(wǎng)絡(luò)中點(diǎn)度中心度值排在前五位的成員分別為“中國 boy 超級(jí)大猩猩”“老番茄”“某幻君”“小潮院長(zhǎng)”和“逍遙散人”。其中,“中國 boy 超級(jí)大猩猩”的點(diǎn)度中心度值為28.000,是社會(huì)網(wǎng)絡(luò)成員中最高的,排在第一位,“老番茄”以25.000位居第二位,其余三人均以22.000并列第三。所以,通過點(diǎn)度中心度分析可知,“中國 boy 超級(jí)大猩猩”處于該社會(huì)網(wǎng)絡(luò)的核心位置,“老番茄”“某幻君”“小潮院長(zhǎng)”和“逍遙散人”處于較中心的位置。

      中介中心度是通過計(jì)算社會(huì)網(wǎng)絡(luò)中一個(gè)行動(dòng)者處在其他兩個(gè)行動(dòng)者直接連接之間的數(shù)量,用來測(cè)量社交網(wǎng)絡(luò)中參與者是否處于中心位置的測(cè)量方法。正如點(diǎn)度中心度,中介中心度值愈大,參與者在社交網(wǎng)路中的地位愈高。在 Ucinet 軟件中,選擇“網(wǎng)絡(luò)→中心度→ Freeman 中間度→節(jié)點(diǎn)中間度”路徑對(duì)42×42的對(duì)稱矩陣進(jìn)行中介中心度分析可知,本文所研究的社會(huì)網(wǎng)絡(luò)的中介中心度值排在前五位的成員分別為“某幻君”“中國 boy 超級(jí)大猩猩”“逍遙散人”“老番茄”和“陳睿”。其中,“某幻君”以75.170的中介中心度值排在第一位,“中國 boy 超級(jí)大猩猩”和“逍遙散人”分別以63.727和57.561中介中心度值位居第二和第三。所以,在中介中心度分析中,“某幻君”處于該社會(huì)網(wǎng)絡(luò)的核心位置,“中國 boy 超級(jí)大猩猩”“逍遙散人”“老番茄”和“陳?!眲t處于較中心的位置。

      綜合上述中心性分析結(jié)果,“中國 boy 超級(jí)大猩猩”“某幻君”和“逍遙散人”均處于社會(huì)網(wǎng)絡(luò)的中心位置,但“中國 boy 超級(jí)大猩猩”和“某幻君”更靠近核心位置。

      3.2.2結(jié)構(gòu)洞分析

      對(duì)社交網(wǎng)絡(luò)中的節(jié)點(diǎn)結(jié)構(gòu)空洞的度量,主要是通過對(duì)網(wǎng)絡(luò)中參與者的網(wǎng)絡(luò)限制和有效規(guī)模的測(cè)算。其中,網(wǎng)絡(luò)限制系統(tǒng)的大小決定了結(jié)構(gòu)空洞的存在與否,而網(wǎng)絡(luò)限制系統(tǒng)的越小,則其存在的可能性也就越大。而網(wǎng)絡(luò)的有效規(guī)模愈大,則更有可能存在結(jié)構(gòu)空洞。處在結(jié)構(gòu)洞位置的行動(dòng)者能影響社會(huì)網(wǎng)絡(luò)中的信息共享,并具有成為意見領(lǐng)袖的優(yōu)勢(shì)。

      根據(jù)結(jié)構(gòu)洞分析結(jié)果,按限制度從小到大排序,排名前三的成員為“中國 boy 超級(jí)大猩猩”“老番茄”“某幻君”和“逍遙散人”,其限制度值分別為0.134、0.150、0.162和0.162。而按有效規(guī)模從大到小排在前三的成員仍為“中國 boy 超級(jí)大猩猩”“老番茄”“某幻君”和“逍遙散人”,其有效規(guī)模值分別為16.929、14.840、14.818和14.818。其中,“中國 boy 超級(jí)大猩猩”的限制度值為0.134,有效規(guī)模值為16.929,分別是限制度最小值和有效規(guī)模最大值,所以“中國 boy 超級(jí)大猩猩”占據(jù)該社會(huì)網(wǎng)絡(luò)中大量的結(jié)構(gòu)洞位置。而“老番茄”“某幻君”和“逍遙散人”也占據(jù)了較多的結(jié)構(gòu)洞位置。

      經(jīng)過上述中心性分析和結(jié)構(gòu)洞分析可知,“中國 boy 超級(jí)大猩猩”不僅在社會(huì)網(wǎng)絡(luò)中更接近核心位置,還占據(jù)著大量的結(jié)構(gòu)位置。因此,“中國 boy 超級(jí)大猩猩”為本文所研究的社會(huì)網(wǎng)絡(luò)中的一級(jí)意見領(lǐng)袖,在該社會(huì)網(wǎng)絡(luò)中影響力很大,具有更多的威望和權(quán)利。而“某幻君”和“逍遙散人”也因其在社會(huì)網(wǎng)絡(luò)中處于較為中心的位置和占據(jù)較多的結(jié)構(gòu)洞位置,成為該社會(huì)網(wǎng)絡(luò)中的二級(jí)領(lǐng)袖,也具有較大的影響力。

      4結(jié)語

      本文利用網(wǎng)絡(luò)爬蟲,爬取了42位嗶哩嗶哩百萬粉絲以上的 up 主的關(guān)注列表,經(jīng)提取和整理,將獲取的數(shù)據(jù)繪制成了42×42的關(guān)注矩陣,進(jìn)而對(duì)其進(jìn)行了社會(huì)網(wǎng)絡(luò)分析,分析了由這42位 up 主所構(gòu)成的社會(huì)網(wǎng)絡(luò)的密度和其中的意見領(lǐng)袖。結(jié)果顯示,該社會(huì)網(wǎng)絡(luò)成員間關(guān)系緊密,且具有多位意見領(lǐng)袖。但研究仍存在些許局限:一是人數(shù)較少,僅分析了42位百萬粉絲以上的 up 主,但在嗶哩嗶哩 up 主中百萬粉絲以上的有很多,今后可進(jìn)一步爬取全面的百萬粉絲以上的 up 主的關(guān)注列表或爬取嗶哩嗶哩年度評(píng)選的百位最具影響力的 up 主的關(guān)注列表進(jìn)行分析;二是本研究?jī)H對(duì)密度和意見領(lǐng)袖進(jìn)行了分析,而社會(huì)網(wǎng)絡(luò)分析中的小團(tuán)體分析也具有重要意義,今后可對(duì)嗶哩嗶哩 up 主進(jìn)行小團(tuán)體分析,進(jìn)而綜合本次研究提出相應(yīng)建議。

      參考文獻(xiàn):

      [1]黃岷昊,丁浪,張雪蓮.基于 Python 的網(wǎng)絡(luò)爬蟲及文本可視化[J].電腦編程技巧與維護(hù),2020(7):24?25.

      [2]溫佐承,侯帥.基于 Python 的網(wǎng)絡(luò)爬蟲設(shè)計(jì)與實(shí)現(xiàn)[ J].電腦編程技巧與維護(hù),2020(7):21?23+42.

      [3]姜鑫.社會(huì)網(wǎng)絡(luò)分析方法在圖書情報(bào)領(lǐng)域的應(yīng)用研究[M].北京:知識(shí)產(chǎn)權(quán)出版社,2015.

      [4] Pollack J ,Matous P.Testing the impact of targeted team building on project team communication using social network analysis[ J ].International Journal of Project Management,2019,37(3):473?484.

      [5]田麗麗,趙穎.基于社會(huì)網(wǎng)絡(luò)分析的學(xué)習(xí)者在線交互行為研究[J].軟件導(dǎo)刊,2018,17(4):222?226.

      作者簡(jiǎn)介:

      高悅(1997—),碩士,研究方向:用戶信息行為。

      猜你喜歡
      網(wǎng)絡(luò)爬蟲意見領(lǐng)袖社會(huì)網(wǎng)絡(luò)分析
      煉鐵廠鐵量網(wǎng)頁數(shù)據(jù)獲取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
      傳播學(xué)視角下應(yīng)用型專業(yè)思想政治教育有效性研究
      亞太教育(2016年34期)2016-12-26 21:02:15
      微博動(dòng)員、維權(quán)倡議與記者的利益表達(dá)機(jī)制
      新聞界(2016年13期)2016-12-23 14:32:59
      境外公益旅游研究進(jìn)展與啟示
      新形勢(shì)下高校網(wǎng)絡(luò)文化建設(shè)管理機(jī)制研究
      新浪微博娛樂明星的社會(huì)網(wǎng)絡(luò)分析
      基于社會(huì)網(wǎng)絡(luò)分析的青島市產(chǎn)學(xué)研專利合作網(wǎng)絡(luò)結(jié)構(gòu)研究
      微信營(yíng)銷意見領(lǐng)袖培養(yǎng)現(xiàn)狀研究
      今傳媒(2016年10期)2016-11-22 11:38:32
      基于社會(huì)網(wǎng)絡(luò)分析的我國微課研究探析
      基于社會(huì)網(wǎng)絡(luò)分析的權(quán)威網(wǎng)頁挖掘研究
      墨玉县| 浦东新区| 大名县| 启东市| 乌鲁木齐市| 高青县| 惠州市| 榆社县| 长乐市| 三亚市| 绥德县| 宜丰县| 禹州市| 洛川县| 旬阳县| 年辖:市辖区| 呈贡县| 康定县| 上蔡县| 黔西县| 灵山县| 西贡区| 双桥区| 安国市| 大庆市| 双江| 马山县| 上蔡县| 淳化县| 宁国市| 称多县| 新乡县| 望江县| 广河县| 莱阳市| 安康市| 关岭| 肥东县| 丹寨县| 阜平县| 宜丰县|