• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      新浪微博與Twitter的特性對(duì)比研究

      2018-09-29 02:38秦海龍劉挺

      秦海龍 劉挺

      摘 要:隨著微博客服務(wù)的流行,越來(lái)越多的用戶在微博上用其在線賬號(hào)進(jìn)行交流,使真實(shí)世界的人們和微博中的用戶形成了一一映射。無(wú)論是新浪微博本身還是新浪微博中的用戶都有很多獨(dú)特的特性。本文利用新浪微博用戶關(guān)系網(wǎng)絡(luò)中的弱連接組件(Weakly Connected Component)對(duì)新浪微博的很多重要特性進(jìn)行了討論。同時(shí),又進(jìn)一步分析了新浪微博與Twitter在網(wǎng)絡(luò)結(jié)構(gòu)和同質(zhì)性方面的相同點(diǎn)和區(qū)別。與Twitter相比,新浪微博的關(guān)系分布指數(shù)不對(duì)稱,同質(zhì)性也更低,并且本次研究還在新浪微博中發(fā)現(xiàn)了中國(guó)用戶的“北漂”現(xiàn)象,這些都反映出中國(guó)社會(huì)和用戶獨(dú)有的特征。

      關(guān)鍵詞:社會(huì)特征; 社交網(wǎng)絡(luò)結(jié)構(gòu); 關(guān)系網(wǎng)絡(luò)分析

      Abstract: As the blooming of microblog services, users are favorable to communicate with each other using their virtual accounts. Therefore, the mapping between the real world and the social network is established through interactions among users on microblog. On Sina Weibo, there are many special features and distinct characteristics on the microblog platform, the user scale and the user habit. This paper aims to explore important properties and analyzes relationship networks on Sina Weibo using the Weakly Connected Component(0.12 billion users) of relationship networks as clues. The paper proposes similarities and differences of features between Twitter and Sina Weibo about network structures. Comparing with Twitter, the paper concludes that there are more asymmetric degree distributions, low reciprocity and the phenomenon of gathering toward Beijing and so on. Meanwhile, these properties can also implicate several characteristics of Chinese society and user habits.

      Key words: social characteristics; social network topology; relationship network analysis

      引言

      近年來(lái),多種類型的社交網(wǎng)絡(luò)遍布全球,在這些社交網(wǎng)絡(luò)中,可以隨時(shí)隨地看到朋友和喜歡的明星發(fā)布的最新消息。和傳統(tǒng)媒體相比,社交網(wǎng)絡(luò)中信息的傳播速度要快很多,用戶可以用文本、圖片、地理位置等信息隨時(shí)分享身邊發(fā)生的事情。

      微博客是最流行社交網(wǎng)絡(luò)服務(wù)之一,簡(jiǎn)稱微博,通常用戶在微博中的關(guān)注關(guān)系都是單向的。用戶可以在微博上關(guān)注任何人,用戶發(fā)布的信息也可以被追隨支持其本人的所有粉絲看到[1]。目前為止,有上億用戶每天在微博中發(fā)布信息、同時(shí)關(guān)注著各類好友,其中包括很多名人、媒體、政府機(jī)構(gòu)等,因此用戶在和朋友交流的同時(shí)還可以閱讀大量的新聞。全球范圍來(lái)看,Twitter是最大的微博客服務(wù),在中國(guó),新浪微博則是最流行的微博服務(wù)。在2012年的全球移動(dòng)互聯(lián)網(wǎng)大會(huì)上,新浪微博官方宣布旗下的用戶已經(jīng)超過(guò)了3億。

      大量的新浪微博用戶在互聯(lián)網(wǎng)中形成了各種社區(qū),用戶在線上的很多關(guān)系和線下的真實(shí)社交關(guān)系保持一致,比如同學(xué)、同事等。另外,用戶發(fā)布的微博也可以反映用戶的個(gè)人興趣。因此可以通過(guò)分析微博中的社交關(guān)系來(lái)總結(jié)一些社會(huì)因素。這種方法不僅比傳統(tǒng)社會(huì)研究方法收集數(shù)據(jù)的速度更顯快捷,而且通過(guò)研究還可以提取得到微博中的一些獨(dú)特性質(zhì)。

      學(xué)術(shù)界已經(jīng)針對(duì)微博客服務(wù)開(kāi)展了大量研究,特別是基于Twitter平臺(tái)的研究。這些研究重點(diǎn)分析Twitter中的用戶網(wǎng)絡(luò)結(jié)構(gòu)以及結(jié)構(gòu)屬性對(duì)用戶行為的影響。一些研究對(duì)比了新浪微博和Twitter的特性,但是Twitter中很多獨(dú)有特性卻并未在新浪微博中得到充分的驗(yàn)證和分析。中西方的文化不同導(dǎo)致了2種微博客服務(wù)中的關(guān)系網(wǎng)絡(luò)也存在一定差異,理解這些差別是新浪微博中用戶分析和社會(huì)化營(yíng)銷的基礎(chǔ)。本文分析了新浪微博中的大規(guī)模用戶網(wǎng)絡(luò),總結(jié)了新浪微博和Twitter在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)上的差別,同時(shí)也進(jìn)一步分析了導(dǎo)致這些差別的原因,而且這些差別也可以反映中國(guó)用戶的很多特性。本次研究的數(shù)據(jù)集中包括1.2億新浪微博用戶,這個(gè)數(shù)據(jù)規(guī)模遠(yuǎn)遠(yuǎn)大于已有的Twitter和新浪微博相關(guān)研究的數(shù)據(jù)量,所以本文的最終結(jié)論更能反映出新浪微博的真實(shí)特性,而且,大規(guī)模數(shù)據(jù)也能夠保證新浪微博中的用戶多樣性。

      1 相關(guān)工作

      近年來(lái),關(guān)于社交網(wǎng)絡(luò)中拓?fù)浣Y(jié)構(gòu)的相關(guān)研究已成為學(xué)界焦點(diǎn)。Newman歸納了學(xué)術(shù)網(wǎng)絡(luò)中一些獨(dú)有的結(jié)構(gòu)特性[2-3]。Donato分析了萬(wàn)維網(wǎng)的結(jié)構(gòu)特征[4],Holme對(duì)一家在線約會(huì)網(wǎng)站中網(wǎng)絡(luò)結(jié)構(gòu)隨時(shí)間的變化進(jìn)行了討論[5]。Liben-Nowell為社交網(wǎng)絡(luò)中的用戶行為建立了理論模型[6],Ahn則深入剖析了Cyworld、MySpace和Orkut中的網(wǎng)絡(luò)屬性[7]。而且,Alan又將社交網(wǎng)絡(luò)的結(jié)構(gòu)與其它類型的網(wǎng)絡(luò)設(shè)計(jì)提出了應(yīng)用比較,這項(xiàng)工作的主要平臺(tái)是Orkut、YouTube和Flickr,并不包括微博客服務(wù)[8]。文獻(xiàn)[9]探討了Twitter中用戶的增長(zhǎng)率和用戶分布,并用HITS算法對(duì)用戶進(jìn)行了分類。而且文獻(xiàn)[1]還分析了Twitter中的網(wǎng)絡(luò)結(jié)構(gòu)和用戶特征,包括關(guān)注人數(shù)量、粉絲數(shù)量和微博數(shù)的關(guān)系,也研究了微博的轉(zhuǎn)發(fā)特征。

      新浪微博引發(fā)使用熱潮后,與其有關(guān)的研究工作也在不斷涌現(xiàn)。Louis對(duì)比了Twitter和新浪微博的文本內(nèi)容[10],同時(shí)還高效甄別了新浪微博中的一些虛假賬號(hào)[11]。文獻(xiàn)[12]闡述了2個(gè)微博客服務(wù)中訪問(wèn)行為的不同點(diǎn),文獻(xiàn)[13]則比較了2種微博客服務(wù)中不同的功能。然而,新浪微博中很多可以表征中國(guó)用戶習(xí)慣的重要特性并未得到應(yīng)有重視和充分分析。

      2 數(shù)據(jù)采集

      如文獻(xiàn)[8]描述的那樣,獲得一個(gè)社交網(wǎng)絡(luò)的全網(wǎng)數(shù)據(jù)并不現(xiàn)實(shí)。為此,研究爬取了新浪微博中用戶關(guān)系網(wǎng)絡(luò)中的弱連接組件(Weakly Connected Component,WCC)來(lái)代替全網(wǎng)數(shù)據(jù)。新浪微博的WCC包含123 683 313名用戶和與其對(duì)應(yīng)的個(gè)人資料以及好友列表,在此基礎(chǔ)上也特別證明了未包括在WCC之中的用戶并不是新浪微博的活躍用戶,當(dāng)然缺少這些用戶就不會(huì)對(duì)分析結(jié)果產(chǎn)生影響。

      由于新浪微博API的限制,研究中只能獲取每個(gè)用戶的最后5 000個(gè)粉絲,為了提供現(xiàn)實(shí)完整數(shù)據(jù),同時(shí)還獲取了用戶的關(guān)注者信息,后者可以反過(guò)來(lái)對(duì)用戶粉絲進(jìn)行補(bǔ)全。

      其后,即隨機(jī)選擇了10 000個(gè)用戶ID來(lái)驗(yàn)證數(shù)據(jù)中的用戶完全性,結(jié)果顯示將近一半的用戶已在本文提取的數(shù)據(jù)集中,而且又繼續(xù)分析了那些不在數(shù)據(jù)集中的用戶ID,結(jié)果表明其中的絕大多數(shù)均為不活躍用戶。

      3 用戶關(guān)系與用戶資料分析

      共有123 683 313名用戶在本文研究的數(shù)據(jù)集中,不是每名用戶都有完整的資料,以下分析中即挑選了具有相對(duì)完整資料的用戶。

      3.1 關(guān)注好友與粉絲

      研究時(shí),獲得了新浪微博WCC中用戶的所有關(guān)注好友和粉絲,新浪微博中每名用戶的關(guān)注人數(shù)上限為2 000。圖1為關(guān)注用戶的累積概率分布曲線,結(jié)果表明用戶人數(shù)和其關(guān)注的人數(shù)是呈反比的。其中,69.5%的用戶的關(guān)注數(shù)量多于10個(gè)人。將近30%的用戶為不活躍用戶,并且只關(guān)注很少的幾個(gè)好友。

      另外,僅僅27%的用戶關(guān)注了超過(guò)50個(gè)好友,是關(guān)注好友超過(guò)100個(gè)的人數(shù)的2倍。關(guān)注好友超過(guò)100人的用戶明顯減少,這表明大多數(shù)用戶的關(guān)注好友均將少于100,很多用戶只是關(guān)注現(xiàn)存的真實(shí)好友和一些權(quán)威媒體。

      圖2為用戶粉絲的累積概率分布曲線,可以看出,用戶數(shù)量和其粉絲數(shù)量是呈反比的,這說(shuō)明新浪微博的大多數(shù)用戶都是草根用戶,權(quán)威用戶和名人只占很少的一部分。只有0.08%的用戶粉絲超過(guò)了1萬(wàn),只有9個(gè)人的粉絲數(shù)超過(guò)了1 000萬(wàn)。

      新浪微博中的關(guān)注好友和粉絲好友都符合冪律分布,并且微博中的關(guān)系網(wǎng)絡(luò)都屬于無(wú)標(biāo)度網(wǎng)絡(luò)。關(guān)注好友分布的冪指數(shù)為1.574,粉絲好友分布擬合曲線的冪指數(shù)為1.041。與此同時(shí)又計(jì)算了數(shù)據(jù)集中認(rèn)證用戶的2個(gè)好友分布,結(jié)果和上面2個(gè)冪指數(shù)保持一致。由此則說(shuō)明了一些認(rèn)證用戶的關(guān)注好友也遠(yuǎn)遠(yuǎn)多于粉絲。

      3.2 互粉率

      有針對(duì)性地,研究又設(shè)計(jì)對(duì)比了新浪微博和Twitter的用戶互粉率,一個(gè)用戶的互粉率為互粉好友占關(guān)注好友和粉絲好友的比例。為此研究分析了95 489 041名用戶的互粉好友,結(jié)果如圖3所示,用戶數(shù)隨著互粉率的增多而迅速下降。新浪微博中的用戶互粉率只有17.30%,說(shuō)明了大部分社交關(guān)系都是單向關(guān)系。

      3.3 同質(zhì)性

      文獻(xiàn)[1]指出社交網(wǎng)絡(luò)中的互粉好友都存在一定的同質(zhì)性,本文在新浪微博中也證明了這一結(jié)論,具體可如圖4、圖5所示。

      由圖4、圖5可知,這2個(gè)圖表明了用戶的好友數(shù)量(關(guān)注和粉絲)與其互粉好友的朋友數(shù)量是正相關(guān)的。這表明對(duì)于一個(gè)擁有很多好友的用戶來(lái)說(shuō),該人的朋友也擁有很多好友。就是說(shuō),新浪微博中好友之間的社會(huì)地位是相似的。

      3.4 地理分布

      由表1所示,通過(guò)所有用戶的地理信息可以看出,發(fā)達(dá)地區(qū)的用戶要遠(yuǎn)遠(yuǎn)多于不發(fā)達(dá)地區(qū)的用戶,沿海地區(qū)的用戶數(shù)量明顯多于內(nèi)陸地區(qū),東部的用戶數(shù)量明顯多于西部(“其它”為省份不明)。新浪微博的這種性質(zhì)反映出中國(guó)整體的經(jīng)濟(jì)發(fā)展?fàn)顩r。其中,用戶最多的省份為廣東省。

      此外,研究也對(duì)海外用戶進(jìn)行了分析,統(tǒng)計(jì)中僅占新浪微博全部用戶的5%左右,表2為這些海外用戶地理位置的排名??梢钥闯鰜喼迖?guó)家的用戶相對(duì)較多,并且發(fā)達(dá)國(guó)家的用戶明顯多于發(fā)展中國(guó)家。

      綜上可知,通過(guò)用戶的地理信息發(fā)現(xiàn)了新浪微博好友之間具有很強(qiáng)的地理同質(zhì)性,根據(jù)用戶互粉好友依照省份的排序來(lái)看,互粉好友省份第一的地理位置跟用戶的省份相同,海外用戶的互粉好友大多也都在海外。有趣的是,各個(gè)省份用戶互粉好友地理位置排名第二位的都是北京(北京用戶互粉好友排名第一地理位置為北京)。這就說(shuō)明用戶與其互粉好友具有很強(qiáng)的地理同質(zhì)性,同時(shí)可以看出,大量的用戶從全國(guó)各地到北京學(xué)習(xí)和工作,這種同質(zhì)性可以體現(xiàn)出中國(guó)的大城市聚集現(xiàn)象(北漂)。

      4 新浪微博與Twitter對(duì)比

      盡管新浪微博與Twitter都屬于微博客服務(wù),但是用戶習(xí)慣導(dǎo)致了二者之間還是呈現(xiàn)很大的區(qū)別。研究中總結(jié)了這些主要區(qū)別,最終設(shè)計(jì)結(jié)果可見(jiàn)表3。

      新浪微博的好友分布的2個(gè)冪指數(shù)比傳統(tǒng)網(wǎng)絡(luò)和其它社交網(wǎng)絡(luò)都要小[8-9],說(shuō)明了研究選取數(shù)據(jù)集中的用戶分布更加均勻。在Twitter中,關(guān)注好友和粉絲好友的分布冪指數(shù)是一樣的,而新浪微博中關(guān)注好友的冪指數(shù)更大,這是由新浪微博中2 000人的關(guān)注上限導(dǎo)致的,而粉絲數(shù)量是沒(méi)有上限的,所以關(guān)注好友分布的擬合曲線更加陡峭。而Twitter對(duì)關(guān)注和粉絲都沒(méi)有設(shè)置上限。通過(guò)結(jié)果,還并行分析了新浪微博中的互粉率要低于Twitter,同質(zhì)性方面,新浪微博更加突出了中國(guó)用戶的大城市聚集現(xiàn)象。

      5 結(jié)束語(yǔ)

      本文用新浪微博中用戶網(wǎng)絡(luò)的弱連接組件對(duì)用戶的行為進(jìn)行了分析,由于本次研究的數(shù)據(jù)集遠(yuǎn)遠(yuǎn)大于已有工作,所以文中的分析結(jié)果更能代表新浪微博中用戶的真實(shí)特性。

      本文證明了新浪微博的用戶關(guān)系網(wǎng)絡(luò)為無(wú)尺度網(wǎng)絡(luò),相對(duì)于Twitter的互粉率較低,并且可以體現(xiàn)出地域同質(zhì)性和中國(guó)的大城市聚集現(xiàn)象。新浪微博的國(guó)內(nèi)用戶更多地分布在發(fā)達(dá)地區(qū),海外用戶占比大約5%左右。

      同時(shí),一般社交網(wǎng)絡(luò)用戶的關(guān)注和粉絲分布的冪指數(shù)相當(dāng),而由于新浪微博對(duì)關(guān)注好友設(shè)置了上限,所以關(guān)注好友的冪指數(shù)相對(duì)較大。

      在今后的工作中,將會(huì)對(duì)新浪微博的文本和社區(qū)展開(kāi)后續(xù)深入研究,嘗試發(fā)現(xiàn)更多有價(jià)值的用戶性質(zhì)。

      參考文獻(xiàn)

      [1] HAEWOON K, CHANGHYUN L, HOSUNG P, et al. What is Twitter, a social network or a news media [C]//Proceedings of ACM International Conference on WWW. Raleigh:ACM, 2010: 591-600.

      [2] NEWMAN M E J. Scientific collaboration networks. I. Network construction and fundamental results[J]. Physical Review E, 2001, 64:016131/1-016131/8.

      [3] NEWMAN M E J, PARK J. Why social networks are different from other types of networks[J]. Physical Review E, 2003, 68:031622/1-031622/9.

      [4] DONATO D, LAURA L, LEONARDI S, et al. Large scale properties of the webgraph[J]. European Physical Journal B, 2004, 38:239-243.

      [5] HOLME P, EDLING C, LILJEROS F. Structure and time evolution of an Internet dating community[J]. Social Networks, 2004, 26:155-174.

      [6] LIBEN-NOWELL D, NOVAK J, KUMAR R, et al. Geographic routing in social networks[J]. Proceedings of the National Academy of Sciences, 2005, 102(33):11623-11628.

      [7] AHN Y, HAN S, KWAK S, et al. Analysis of topological characteristics of huge online social networking services[C] //Proceedings of ACM International Conference on WWW. Banff:ACM, 2007: 835-844.

      [8] ALAN M, MASSIMILIANO M, KRISHNA P, et al. Measurement and analysis of online social networks[C] //Proceedings of the 7th ACM SIGCOMM Conference on Internet measurement. San Diego:ACM, 2007: 29-42.

      [9] AKSHAY J, XIAODAN S, TIM F, et al. Why we Twitter: Understanding microblogging usage and communities[C] //Proceedings of Joint 9th WEBKDD and 1st SNAKDD Workshop ′07. New York:ACM, 2007: 56-65.

      [10]LOUIS Y, SITARAM A, HUBER MAN B A. What trends in Chinese social media[C]//Proceedings of the 5th SNAKDD Workshop'11. San Diego:ACM, 2011:1-10.

      [11]LOUIS Y, SITARAM A, HUBERMAN B A. Artificial inflation: The true story of trends in Sina Weibo[J]. arXiv preprint arXiv: 1202.0327,2012.

      [12]QI G, FABIAN A, GEERT-JAN H, et al. A comparative study of users' microblogging behavior on Sina Weibo and Twitter[C]//Proceedings of International Conference on User Modeling and Personalization. Montreal:ACM, 2012: 88-101.

      [13]CHEN Shaoyong, ZHANG Huanmin, LIN Min, et al. Comparision of microblogging service between Sina Weibo and Twitter[C]//International Conference on Computer Science and Network Technology. Harbin:IEEE, 2011: 2259-2263.

      北碚区| 张家川| 安阳县| 金溪县| 米林县| 东海县| 庆城县| 凌云县| 巴中市| 社旗县| 达拉特旗| 通河县| 古浪县| 梁山县| 汽车| 潼关县| 涡阳县| 海晏县| 阜阳市| 米脂县| 铜陵市| 志丹县| 湖北省| 秦安县| 昆明市| 西青区| 砀山县| 大埔区| 东宁县| 西城区| 澄迈县| 双柏县| 麟游县| 固原市| 西贡区| 无极县| 郎溪县| 兴国县| 霞浦县| 石阡县| 广宁县|