□ 唐魁玉 張 旭
國(guó)外Twitter相關(guān)研究進(jìn)展及其對(duì)我國(guó)微博研究的啟示
——兼論未來微博媒介社會(huì)學(xué)研究的幾點(diǎn)設(shè)想
□ 唐魁玉 張 旭
2006年Twitter(推特)在美國(guó)建立,此后短短幾年間便風(fēng)靡全世界,我國(guó)的微博平臺(tái)在此種浪潮之下也隨之產(chǎn)生并獲得極大發(fā)展。目前,國(guó)外有關(guān)Twitter的研究相對(duì)成熟,就研究方法而言主要存在定性與定量?jī)煞N方法,就研究數(shù)據(jù)的收集而言主要為研究者親自收集,或者使用一些機(jī)構(gòu)和研究者已經(jīng)收集好的數(shù)據(jù)集。國(guó)外Twitter的研究存在不少的問題,研究前提方面主要包括Twitter研究數(shù)據(jù)的代表性、倫理性問題,數(shù)據(jù)收集階段會(huì)面臨數(shù)據(jù)收集技術(shù)、權(quán)限等瓶頸,在數(shù)據(jù)的整理上會(huì)遭遇數(shù)據(jù)的異質(zhì)性問題。近年來,國(guó)內(nèi)有關(guān)微博研究也取得了較大發(fā)展,但仍存在一定不足,需要積極借鑒國(guó)外Twitter的研究的有益成果。對(duì)于未來的微博媒介社會(huì)學(xué)研究,要更加注重社會(huì)學(xué)研究中分析手段和實(shí)驗(yàn)手段的結(jié)合,注重多種數(shù)據(jù)收集分析方法和策略的結(jié)合,注重微博數(shù)據(jù)與其他社交平臺(tái)數(shù)據(jù)的結(jié)合。
Twitter 微博 互聯(lián)網(wǎng) 社交網(wǎng)絡(luò)
眾所周知,互聯(lián)網(wǎng)自20世紀(jì)90年代興起以來,已經(jīng)歷“大爆炸”式發(fā)展。即使是作為“互聯(lián)網(wǎng)之父”的Tim Berners-Lee爵士在20幾年前也無法想象互聯(lián)網(wǎng)會(huì)在人們的生活中扮演如此重要的角色——人們熱衷于通過互聯(lián)網(wǎng)與全世界的民眾進(jìn)行交流,分享自己的觀點(diǎn)、經(jīng)歷與生活。毫無疑問,近些年來隨著互聯(lián)網(wǎng)的迅猛發(fā)展和普及,一些里程碑式的軟件和網(wǎng)頁被創(chuàng)造出來,極大地改變了人們的日常生活。以聯(lián)絡(luò)工具為例,從最初的電子郵件到即時(shí)通訊軟件,再到現(xiàn)在的社交網(wǎng)絡(luò)平臺(tái),這些工具使得人和人之間的聯(lián)絡(luò)變得極為便利?,F(xiàn)如今手機(jī)網(wǎng)絡(luò)的快速發(fā)展更是使這種聯(lián)絡(luò)變得隨時(shí)隨地、觸手可及。
網(wǎng)絡(luò)化生活的便利將人們從傳統(tǒng)的“真實(shí)世界”的互動(dòng)轉(zhuǎn)向了新的在線聯(lián)絡(luò)。這種轉(zhuǎn)變也同時(shí)影響了社會(huì)研究者的興趣,越來越多的研究者正傾向于將人們?cè)诰W(wǎng)絡(luò)上的行為納入到他們自身的研究范圍之中。[1]社交網(wǎng)絡(luò)平臺(tái)(如外國(guó)的Facebook、Twitter和我國(guó)的人人網(wǎng)、新浪微博等)又由于具有更大的開放性和實(shí)時(shí)性,更是吸引了大量社會(huì)研究者的目光。微博作為一種交流渠道,它是由原來的博客(Blog)進(jìn)化而來的自媒體平臺(tái)。具體說來,人們通過在微博平臺(tái)上發(fā)布少于140字的文字、圖片和鏈接等信息分享他們的看法和動(dòng)態(tài)。美國(guó)人Evan Williams于2006年10月創(chuàng)建了Twitter網(wǎng)站,開創(chuàng)了全球微博服務(wù)的先河。自此以后,Twitter用戶數(shù)急劇增長(zhǎng),現(xiàn)如今月活躍用戶已經(jīng)達(dá)到了3.02億。[2]相比Twitter在世界其他各國(guó)的寡頭式發(fā)展,微博平臺(tái)在中國(guó)的發(fā)展則顯得“百家爭(zhēng)鳴”。中國(guó)的微博服務(wù)從早期的飯否、滔滔開始,逐漸發(fā)展為門戶網(wǎng)站微博,如新浪微博和騰訊微博。新浪微博和騰訊微博都在開通不到一年半的時(shí)間內(nèi)達(dá)到了1億的用戶數(shù)。[3]
微博平臺(tái)在全世界的高速發(fā)展也聚焦了許多社會(huì)研究者的目光。截止2013年12月,關(guān)于Twitter的英文論文數(shù)已經(jīng)達(dá)到1537篇,其中與人文社會(huì)科學(xué)相關(guān)的有370篇。[4]又比如,截止2015年4月30日,通過中國(guó)知網(wǎng)搜索關(guān)鍵詞“微博”,可以獲得7711個(gè)結(jié)果,其中更有一些文章獲得了較多次數(shù)的引用。從學(xué)科分布角度來看,這些研究多分布于計(jì)算機(jī)、政治、傳媒、教育和安全等方面,[5]鮮有專門的社會(huì)學(xué)研究。但即使如此,這些研究對(duì)于關(guān)于微博以及其他社交平臺(tái)的社會(huì)學(xué)研究而言仍然具有很大的借鑒意義。
鑒于目前學(xué)界對(duì)微博的研究已較多,因此我們有必要借助國(guó)外Twitter研究的文獻(xiàn)闡述Twitter研究的發(fā)展,分析其中的問題,并結(jié)合當(dāng)前社會(huì)學(xué)研究者們對(duì)于自媒體平臺(tái)的研究成果,對(duì)于未來微博演變的歷程和社交網(wǎng)絡(luò)遺產(chǎn)加以總結(jié)。
在對(duì)國(guó)外Twitter研究進(jìn)行綜述之前,我們簡(jiǎn)要介紹一下關(guān)于微博和微博平臺(tái)的源流。2006年Twitter的創(chuàng)始人Evan Williams首次提出了微博這一概念。爾后,美國(guó)學(xué)者高恩卡和喬杜里從技術(shù)應(yīng)用的角度對(duì)微博進(jìn)行了定義:一種集合了手機(jī)傳感器、無線網(wǎng)絡(luò)、信息處理和空間可視4種元素的多媒體博客;[6]Kaplan和Haenlein則從傳播學(xué)角度對(duì)微博給出了另外的定義:“微博是一種基于互聯(lián)網(wǎng)的交換工具,允許用戶之間交換短片內(nèi)容,如句子、圖像和視頻鏈接等。”[7]微博主要提供以下幾種基本功能操作:一是針對(duì)微博內(nèi)容,有發(fā)表(發(fā)表文字、圖像、視頻和鏈接等)、轉(zhuǎn)發(fā)(將他人的某條微博轉(zhuǎn)載到自己的主頁下)、回復(fù)(在他人微博下發(fā)表觀點(diǎn))、贊(表示贊同微博中的觀點(diǎn)或者贊揚(yáng)微博中描述的行為)等四種功能操作;二是針對(duì)微博用戶,有關(guān)注(幫助隨時(shí)關(guān)注某特定用戶的動(dòng)態(tài))、取消關(guān)注(不再隨時(shí)關(guān)注某特定用戶的動(dòng)態(tài)),@(在自己的微博中提到他人并通知被提到的人)、站內(nèi)信(與其他用戶進(jìn)行其他人不可見的對(duì)話)等四種功能操作;三是針對(duì)熱門話題的標(biāo)簽功能(用戶在發(fā)布微博的時(shí)候加上標(biāo)簽表示該條微博與某一熱門話題相關(guān))。可以說,無論是Twitter還是我國(guó)的新浪微博、騰訊微博所具有的上述技術(shù)社會(huì)功能,都將以技術(shù)認(rèn)識(shí)論的方式成為我們探索微博演變規(guī)律的方法或策略。
1.研究進(jìn)展
自從2007年第一篇關(guān)于Twitter的研究論文發(fā)表,研究者們逐漸增加了對(duì)Twitter的研究興趣,來自政治、語言、傳媒、計(jì)算機(jī)科學(xué)、信息科學(xué)和文化研究等學(xué)科的研究者都紛紛加入到對(duì)這一問題的研究中來。自2007年以來,每年有關(guān)Twitter研究的新增英文論文較上一年度都有所增長(zhǎng)。[8]截止2013年12月,通過Scopus檢索,關(guān)于Twitter的研究論文有1537篇,其中在計(jì)算機(jī)科學(xué)學(xué)科下有919篇,在社會(huì)科學(xué)學(xué)科下有370篇。這些社會(huì)科學(xué)學(xué)科下的論文又分屬于語言、政治、傳播、教育等學(xué)科,[4]同時(shí),這些論文的學(xué)科類屬并不單一,一篇論文可能同時(shí)分屬于兩個(gè)或更多的學(xué)科。由此可以看出有關(guān)Twitter的社會(huì)科學(xué)研究已經(jīng)模糊了學(xué)科之間的界限,一篇社會(huì)科學(xué)范疇內(nèi)的關(guān)于Twitter的研究可能同時(shí)使用多個(gè)學(xué)科的研究路徑。
從方法上來講,對(duì)Twitter的研究大體上可以分為定性與定量?jī)煞N類型。有些研究者們認(rèn)為通過社交網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)進(jìn)行研究的方法只是傳統(tǒng)定性和定量研究方法的附屬品;也有研究者認(rèn)為,通過計(jì)算機(jī)技術(shù)手段在社交網(wǎng)絡(luò)平臺(tái)上收集數(shù)據(jù)進(jìn)行研究是社會(huì)學(xué)研究的新方法。[9]如果采用這后一種說法,社會(huì)科學(xué)的研究方法又可以被大體分為三類:民族志方法、統(tǒng)計(jì)學(xué)方法以及計(jì)算機(jī)方法。[10]民族志方法為定性研究方法,通過文獻(xiàn)研究以及訪談獲得信息;統(tǒng)計(jì)學(xué)方法為傳統(tǒng)的定量研究方法;而計(jì)算機(jī)方法則主要為通過使用計(jì)算機(jī)技術(shù)手段進(jìn)行定量的統(tǒng)計(jì)以及定性的分析。在網(wǎng)絡(luò)社會(huì)行為的研究中,人種志方法往往出現(xiàn)在統(tǒng)計(jì)學(xué)方法和計(jì)算機(jī)方法之前,而在Twitter研究中,計(jì)算機(jī)方法卻是最先出現(xiàn)的。[11]計(jì)算機(jī)方法之所以最早出現(xiàn)在Twitter研究中,不僅僅是由于Twitter是基于計(jì)算機(jī)技術(shù)而產(chǎn)生的,而且還因?yàn)樵赥witter開始興起的時(shí)候,計(jì)算機(jī)技術(shù)已經(jīng)發(fā)展到可以進(jìn)行大數(shù)據(jù)分析的程度。[12]
無論使用哪一種研究方法,Twitter研究的第一步必定是收集數(shù)據(jù)。而研究中的數(shù)據(jù)可以是研究者親自收集的,也可以來源于一些機(jī)構(gòu)和研究者已經(jīng)收集好的數(shù)據(jù)集。如果研究者并沒有計(jì)算機(jī)的相關(guān)背景,以至于無法親自收集數(shù)據(jù),他們也可以使用Twitter和一些數(shù)據(jù)機(jī)構(gòu)已經(jīng)收集好的數(shù)據(jù)集,[13]而后根據(jù)自己的目的,進(jìn)行整理和篩選。應(yīng)該說,最初這種提供數(shù)據(jù)的服務(wù)極為有限,數(shù)據(jù)收集也往往成為一些不具備計(jì)算機(jī)背景的研究者們的瓶頸。同時(shí),一些商業(yè)公司也需要這些數(shù)據(jù)為基礎(chǔ)進(jìn)行市場(chǎng)調(diào)查和評(píng)估。Twitter和一些機(jī)構(gòu)正是通過這些需求看到了數(shù)據(jù)的商業(yè)價(jià)值,因而才有計(jì)劃地收集、開發(fā)這些數(shù)據(jù),以方便研究者和商業(yè)公司使用。而對(duì)于那些有相當(dāng)計(jì)算機(jī)技術(shù)的研究者或者與有計(jì)算機(jī)背景研究者合作的研究者而言,Twitter數(shù)據(jù)的收集通常可以采用不同的方法。比如使用某些現(xiàn)有軟件[14]或者創(chuàng)造一個(gè)新的數(shù)據(jù)收集程序。一些研究者使用了Twitter提供的開放平臺(tái)端口(API),但是這種方法只能夠在一定時(shí)間范圍內(nèi)進(jìn)行關(guān)鍵詞的檢索,并且搜索結(jié)果的數(shù)目被限制在1500條以內(nèi),這使得通過API收集的數(shù)據(jù)體積極為有限。[15]當(dāng)然,這對(duì)于有些研究者來講并不算是障礙,因?yàn)椴皇撬醒芯空叨纪ㄟ^API收集Twitter數(shù)據(jù),也不是所有研究都需要體積龐大的數(shù)據(jù)。
對(duì)于之后的數(shù)據(jù)整理和分析,則主要還是依靠計(jì)算機(jī)手段。因?yàn)槌艘恍┦褂蒙倭繑?shù)據(jù)的研究,Twitter研究的數(shù)據(jù)量對(duì)于人工整理和分析都是幾乎不可能的。這無疑也需要研究者們擁有相當(dāng)?shù)挠?jì)算機(jī)技術(shù)或者有計(jì)算機(jī)背景的合作者。
當(dāng)Twitter的用戶數(shù)達(dá)到了一定程度之后,許多政治學(xué)研究者的一個(gè)重要應(yīng)用是試圖使用Twitter數(shù)據(jù)去預(yù)測(cè)選舉結(jié)果。這些研究都擁有一個(gè)共同的前提性假設(shè):Twitter用戶已經(jīng)發(fā)展到足夠規(guī)模,這些大規(guī)模用戶的政治交流可以作為代表整體的樣本。[16]同時(shí),Twitter的發(fā)展也使Twitter成為了一個(gè)被廣泛選擇的社交平臺(tái)和一個(gè)更大傳媒生態(tài)學(xué)的組成部分,從而,研究者的研究對(duì)象也從整個(gè)Twitter網(wǎng)絡(luò)轉(zhuǎn)變?yōu)門witter社區(qū)中主導(dǎo)的各種社會(huì)現(xiàn)象。
由于Twitter的開放性方針,Twitter用戶在理論上可以查看其他所有用戶的基本信息和發(fā)布的動(dòng)態(tài),這也使得Twitter研究比Facebook研究在參與者保護(hù)問題上更加為人所詬病。因?yàn)镕acebook可以選擇信息和動(dòng)態(tài)僅對(duì)好友可見,而且事實(shí)上越來越多的用戶確實(shí)也正在選擇信息僅對(duì)好友可見。[17]但是同時(shí),這也使得Facebook的信息開放性變得極為有限,增加了研究者收集信息的難度。而研究者們也逐漸意識(shí)到Twitter研究在一定程度上損害了用戶的隱私權(quán)。用戶隱私權(quán)的保護(hù)僅僅依靠用戶注冊(cè)時(shí)簡(jiǎn)單的用戶協(xié)議是遠(yuǎn)遠(yuǎn)不夠的,現(xiàn)如今,一些研究者正在思考根據(jù)原有社會(huì)科學(xué)研究參與者的保護(hù)條例,結(jié)合現(xiàn)如今網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)的普遍研究方法,起草適用于網(wǎng)絡(luò)平臺(tái)研究的參與者保護(hù)條例。而這將為日后的網(wǎng)絡(luò)平臺(tái)研究,尤其是Twitter研究的發(fā)展產(chǎn)生巨大的推動(dòng)作用。
2.Twitter相關(guān)研究中的問題
Twitter的相關(guān)研究雖然對(duì)學(xué)者研究網(wǎng)絡(luò)生態(tài)和網(wǎng)絡(luò)社會(huì)行為產(chǎn)生了巨大的推動(dòng)作用,但在這些研究中也同時(shí)出現(xiàn)了一些亟待解決的問題。國(guó)外使用Twitter數(shù)據(jù)的社會(huì)科學(xué)研究雖然涵蓋了多個(gè)學(xué)科,但這些研究具有一些共性的問題值得我們關(guān)注,這些問題往往會(huì)限制關(guān)于Twitter的社會(huì)學(xué)研究的發(fā)展。本部分將這些共性問題大體分為兩方面敘述,分別是研究前提中的問題和研究實(shí)際操作步驟中的問題。
許多研究者認(rèn)為,Twitter研究得以成立的基礎(chǔ)在于Twitter極大的用戶數(shù),這使得使用Twitter數(shù)據(jù)的研究結(jié)果具有推廣到更廣大群體的可能性。但要將Twitter研究的結(jié)果應(yīng)用于更廣大群體須具有一個(gè)非常重要的前提,即Twitter相關(guān)研究的樣本是否可以代表其他民眾。即使使用Twitter數(shù)據(jù)進(jìn)行分析已經(jīng)被驗(yàn)證可以預(yù)測(cè)選舉的結(jié)果,但是這并不代表其他的Twitter研究也具有相同的效果。學(xué)者們對(duì)于Twitter數(shù)據(jù)代表性的質(zhì)疑主要體現(xiàn)在兩點(diǎn):(1)Twitter用戶是否可以代表全體民眾;(2)樣本中的Twitter用戶是否能夠代表全體Twitter用戶。[18]這兩點(diǎn)的不確定降低了Twitter研究結(jié)果的可推廣性。當(dāng)然,這種質(zhì)疑本身的有效性也缺乏進(jìn)一步的研究支持,因?yàn)橐恍㏕witter研究本身已經(jīng)使用了極大的數(shù)據(jù),研究者們無法獲得更大量的數(shù)據(jù)用以驗(yàn)證Twitter研究的結(jié)果是否具有代表性。
對(duì)于Twitter研究結(jié)果的有效性問題,事實(shí)上已經(jīng)有很多學(xué)者討論過。但是在Katrin·Weller的研究中,她所選取并分析了應(yīng)用排行前25位的英文研究論文,發(fā)現(xiàn)基本沒有論文在其中討論Twitter相關(guān)研究中的倫理問題。[4]現(xiàn)今很多學(xué)者忽略了對(duì)用戶隱私的保護(hù),認(rèn)為社交網(wǎng)絡(luò)平臺(tái)的數(shù)據(jù)理所當(dāng)然是可以隨意取用的。而且一些專注于社交網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)收集的機(jī)構(gòu),也完全沒有在收集數(shù)據(jù)之前告知用戶。誠(chéng)然現(xiàn)在并沒有針對(duì)社交網(wǎng)絡(luò)平臺(tái)用戶數(shù)據(jù)安全性的研究保護(hù)條例,但是研究者應(yīng)該對(duì)其予以重視。社交網(wǎng)絡(luò)平臺(tái)的用戶也逐漸意識(shí)到了在大數(shù)據(jù)時(shí)代,自己在網(wǎng)絡(luò)上的信息安全正在受到威脅,而這種意識(shí)覺醒將影響學(xué)者對(duì)數(shù)據(jù)的可接近性或網(wǎng)絡(luò)文化的接近性。比如在Facebook平臺(tái)上,越來越多的用戶選擇信息僅對(duì)好友開放?,F(xiàn)如今Twitter數(shù)據(jù)可以作為研究者們的數(shù)據(jù)來源,很大一部分原因是由于Twitter極大的開放性。如果Twitter用戶也要求Twitter平臺(tái)對(duì)個(gè)人信息進(jìn)行動(dòng)態(tài)的保護(hù),日后使用Twitter數(shù)據(jù)的研究將更加難以達(dá)成。
在Twitter研究的實(shí)際操作步驟中,也存在許多問題限制著Twitter研究的發(fā)展。在數(shù)據(jù)收集階段,研究者一般使用一些程序來收集數(shù)據(jù)。而設(shè)計(jì)和使用這些軟件成為了一些研究者收集Twitter數(shù)據(jù)的障礙。因?yàn)檫@些軟件的使用群體并不十分廣泛,在使用上常常需要一些高級(jí)的計(jì)算機(jī)知識(shí),而社會(huì)科學(xué)研究者往往不具備計(jì)算機(jī)學(xué)科的背景。這使得許多研究者退而求其次不再追求自己收集數(shù)據(jù),轉(zhuǎn)而使用一些機(jī)構(gòu)和研究者已經(jīng)收集好的數(shù)據(jù)。而這些數(shù)據(jù)往往不具有實(shí)時(shí)性,對(duì)研究信息的實(shí)時(shí)傳播方向等方面作用較小。此外,一些研究者雖然不具備相應(yīng)的計(jì)算機(jī)背景,但是仍然想要實(shí)時(shí)的數(shù)據(jù),就往往傾向于使用Twitter開放平臺(tái)的API端口。但是Twitter的API只能收集相對(duì)于整體來講極小部分的數(shù)據(jù)。[18]而且,Twitter的API的使用權(quán)限經(jīng)常變化,研究者們所能收集到的數(shù)據(jù)體積也會(huì)隨之變化。要想收集全部數(shù)據(jù),只有和Twitter合作的一些機(jī)構(gòu)才能獲得完整的數(shù)據(jù)收集權(quán)限。[19]
當(dāng)獲得了數(shù)據(jù)收集的權(quán)限,開始了數(shù)據(jù)收集,研究者們又會(huì)發(fā)現(xiàn)新的問題。Twitter數(shù)據(jù)的收集包含很多方面,不僅僅是發(fā)布的微博內(nèi)容本身,更包含了用戶的信息如地理位置以及所關(guān)注的用戶和關(guān)注這個(gè)用戶的其他用戶。其中地理位置的信息具有最大的不確定性。在發(fā)布微博的過程中,一些用戶可以選擇標(biāo)出當(dāng)前的地理位置,而另一些用戶則可能選擇隱藏地理位置信息。對(duì)于這些隱藏地理位置信息的用戶,研究者們只能通過用戶個(gè)人信息中所填寫的城市等信息獲得大致的地理位置,而這些信息由用戶自行填寫,可能出現(xiàn)非真實(shí)地理位置的填寫或者用戶并未填寫這些信息。這對(duì)于研究在一定地理范圍之內(nèi)出現(xiàn)的社會(huì)現(xiàn)象會(huì)造成比較大的影響。對(duì)于通過GPS定位標(biāo)志出的地理位置,也可能由于與其他城市或地區(qū)同名而產(chǎn)生誤解。[20]同時(shí),用戶所發(fā)表的動(dòng)態(tài)經(jīng)常具有時(shí)效性。比如,用戶在微博中發(fā)表了一個(gè)鏈接,并對(duì)鏈接的內(nèi)容發(fā)表了看法。當(dāng)研究者們收集數(shù)據(jù)時(shí),這個(gè)鏈接可能已經(jīng)失效,這會(huì)導(dǎo)致研究者們無法得知用戶的看法究竟是對(duì)哪些社會(huì)現(xiàn)象產(chǎn)生的。
當(dāng)完成收集數(shù)據(jù)或者找到已經(jīng)收集好的數(shù)據(jù)后,研究者開始對(duì)數(shù)據(jù)進(jìn)行整理。在這個(gè)過程中,處理數(shù)據(jù)的異質(zhì)性是一個(gè)很重要的步驟。在Twitter平臺(tái)上,用戶發(fā)布的動(dòng)態(tài)可以包括文字、圖片、鏈接和視頻。這些因素綜合在一起,構(gòu)成了用戶當(dāng)時(shí)的動(dòng)態(tài)。用戶在一條微博中,綜合了四個(gè)因素中的越多因素,對(duì)這條微博信息的整理就會(huì)越困難。如果只單單分析其中的文字因素,就很有可能產(chǎn)生對(duì)用戶看法的誤解。而數(shù)據(jù)量越大,綜合了多種因素的微博數(shù)目越大,數(shù)據(jù)的異質(zhì)性也就越高。[21]
一些使用已經(jīng)收集好的數(shù)據(jù)集的研究者們,往往需要在這些數(shù)據(jù)集中進(jìn)行隨機(jī)抽樣以形成研究樣本。但是這在Twitter研究中也是比較困難的。因?yàn)闊o法在已經(jīng)收集好的數(shù)據(jù)中辨別出想要研究的整體。[22]比如,研究者想要研究某一職業(yè)的人對(duì)一個(gè)特定社會(huì)現(xiàn)象的看法,就首先需要在這些數(shù)據(jù)中找出從事這個(gè)職業(yè)的全部用戶。一些從業(yè)者可能在個(gè)人信息或者動(dòng)態(tài)中標(biāo)注了自己的職業(yè),而另外一些從業(yè)者可能從未在個(gè)人信息或者動(dòng)態(tài)中提到過自己的職業(yè)。即使用戶在個(gè)人信息或者地理位置方面顯示出自己的職業(yè),這些信息也極有可能由于權(quán)限問題無法被研究者所獲得。假如僅僅在已經(jīng)知曉職業(yè)的用戶中進(jìn)行抽樣,則這個(gè)樣本極有可能相對(duì)于整體不具有較高的代表性,換言之,這個(gè)研究的結(jié)果極有可能無法推廣到整體。即使假設(shè)所有用戶都曾在個(gè)人信息或者動(dòng)態(tài)中標(biāo)注過自己的職業(yè),研究者們也很有可能因?yàn)榧夹g(shù)上的限制無法保證整體的完全性。另外,由于數(shù)據(jù)量龐大而無法使用人工處理,將關(guān)于某個(gè)特定社會(huì)現(xiàn)象看法的微博樣本進(jìn)一步細(xì)化分類也基本沒有實(shí)現(xiàn)的可能。[23]
需要指出的是,以上所提出的還只是一些研究者在論文中所反映出來的一些普遍性問題,并不能涵蓋有關(guān)Twitter研究中所存在的全部問題。至于更多的網(wǎng)絡(luò)社會(huì)事實(shí)和問題,則有待于相關(guān)學(xué)者在以后的研究中陸續(xù)發(fā)現(xiàn)和解釋。
截止至2015年4月30日,通過中國(guó)知網(wǎng)檢索,關(guān)鍵詞中含有微博的論文共有7711篇,其中社會(huì)學(xué)與統(tǒng)計(jì)學(xué)學(xué)科下共有63篇。其中第一篇論文出現(xiàn)在2011年5月。[5]在這63篇論文中,2011年發(fā)表有7篇,2012年有10篇,2013年有22篇,2014年有22篇,剩余2篇為2015年發(fā)表。
在社會(huì)學(xué)界,對(duì)微博有興趣的研究者正在逐漸增加。在這63篇論文中,大部分論文都是非實(shí)證性研究,作者在論文中對(duì)微博中發(fā)生的一些事件或現(xiàn)象表達(dá)看法,或者通過一些社會(huì)學(xué)理論去嘗試解釋微博中發(fā)生的社會(huì)現(xiàn)象,并提出對(duì)一些不良現(xiàn)象的解決辦法。比如,陳爽等人的文章初步探討了微博信息的情緒效應(yīng)與喚起程度對(duì)信息傳播的影響問題。[24]這個(gè)研究雖然應(yīng)用到了微博的元素,但并沒有使用微博的數(shù)據(jù),并且依然使用著傳統(tǒng)的社會(huì)學(xué)研究方法。微博的介入僅僅是作為區(qū)分對(duì)照組和實(shí)驗(yàn)組的影響性因素。一般來說,在開始的幾年里,微博研究還沒有多少學(xué)術(shù)含量。許多研究往往停留在對(duì)微博現(xiàn)象的描述和功能的解釋上,發(fā)表的論文層次也不高。自2014年開始,中國(guó)社會(huì)學(xué)界正式開始了對(duì)微博數(shù)據(jù)的使用。對(duì)于微博數(shù)據(jù)的收集,研究者們主要依靠三種方式:一是從微博頁面觀察到的微博、轉(zhuǎn)發(fā)以及回復(fù)數(shù)量;二是通過API端口的簡(jiǎn)單收集和通過爬蟲技術(shù)收集到一些復(fù)雜數(shù)據(jù);三是使用已經(jīng)收集好的數(shù)據(jù)集和語料庫。同時(shí),一些使用微博開放平臺(tái)API端口數(shù)據(jù)的研究者表示,在API端口是無法進(jìn)行搜索操作的,因?yàn)槲⒉﹥H對(duì)于商業(yè)合作伙伴開放此類權(quán)限。[25]這些實(shí)證研究主要是通過建立模型和算法對(duì)微博內(nèi)容、微博信息傳播等進(jìn)行分析,或者發(fā)現(xiàn)和分類微博社區(qū)中的特定團(tuán)體。[26]這些研究在計(jì)算機(jī)和數(shù)學(xué)技術(shù)上極為專業(yè),是無其他背景和合作者的社會(huì)學(xué)家很難達(dá)到的。這也在一定程度上限制了我國(guó)微博社會(huì)學(xué)研究的發(fā)展。而且這些論文主要只是為社會(huì)學(xué)研究者提供了一種方法,社會(huì)學(xué)家要怎樣應(yīng)用這些方法則還需要更深入的研究。另外,在全部63篇論文中,并沒有研究提及微博用戶的問題,可見中國(guó)的社會(huì)學(xué)家還未重視這一研究領(lǐng)域。
應(yīng)該說明的是,國(guó)外有關(guān)Twitte研究給國(guó)內(nèi)微博相關(guān)研究帶來的啟示很多,主要包括以下幾點(diǎn):一是研究方法的混合性(兼有定量和定性方法)和多樣性,為國(guó)內(nèi)的微博研究提供了方法論和認(rèn)識(shí)論的借鑒;二是研究成果在商業(yè)、政治和文化上的應(yīng)用導(dǎo)向,為國(guó)內(nèi)微博研究成果的運(yùn)用提供了廣闊前景;三是研究的社交網(wǎng)絡(luò)意義建構(gòu)重點(diǎn)和問題意識(shí),為國(guó)內(nèi)的微博研究提供了媒介社會(huì)學(xué)或數(shù)碼符號(hào)學(xué)方面的意義啟示;四是研究所展示的全球化背景,為國(guó)內(nèi)的微博研究提供了進(jìn)行不同微博平臺(tái)比較研究的可能性;第五,即使Twitter和微博的演變規(guī)律和必將出現(xiàn)的式微狀況,決定了微博是有生命周期的,但是外域社交網(wǎng)絡(luò)的研究仍將有助于國(guó)內(nèi)微博研究的學(xué)術(shù)積累,同時(shí)對(duì)網(wǎng)絡(luò)民族志或文化遺產(chǎn)的社會(huì)記憶保留有著重要作用。
我們對(duì)微博研究的成果雖然已經(jīng)非常可觀,然而對(duì)于微博的相關(guān)研究并不會(huì)就此終止。當(dāng)各大微博平臺(tái)經(jīng)歷了爆炸式的用戶增長(zhǎng)及用戶流失之后,穩(wěn)定下來的用戶群具有更加明顯的群體特征(例如面向大眾的傾訴欲),并且會(huì)形成更加一致的群體行為(比如更愿意發(fā)表某方面的動(dòng)態(tài))。而這些對(duì)于未來的自媒體研究有著十分重要的意義。對(duì)于未來的微博媒介社會(huì)學(xué)研究,有以下的設(shè)想和建議:
(1)將社會(huì)學(xué)研究中的分析手段和實(shí)驗(yàn)手段結(jié)合起來。現(xiàn)在世界上對(duì)于微博的研究主要體現(xiàn)在使用微博的大量數(shù)據(jù)建立數(shù)學(xué)模型,進(jìn)而可以簡(jiǎn)單地分析更多的數(shù)據(jù)。如果將傳統(tǒng)社會(huì)學(xué)研究中的實(shí)驗(yàn)方法與現(xiàn)如今主要使用的分析手段結(jié)合在一起,可能對(duì)網(wǎng)絡(luò)社會(huì)行為學(xué)產(chǎn)生更加深入的了解。如2009年在百度貼吧中出現(xiàn)的一篇名為“賈君鵬,你媽媽喊你回家吃飯”的帖子獲得了網(wǎng)友的大量關(guān)注和回復(fù)。最后此貼被證實(shí)與魔獸世界的游戲運(yùn)行方有關(guān),賈君鵬是一個(gè)虛構(gòu)的人物。但作為一個(gè)突發(fā)性的網(wǎng)絡(luò)事件,這個(gè)帖子突顯出了中國(guó)網(wǎng)民的許多特點(diǎn)。如果在微博用戶中選出實(shí)驗(yàn)組和對(duì)照組,并對(duì)其使用微博的過程給予不同的事件,然后觀察兩組用戶的不同反應(yīng),則對(duì)更加深入了解微博用戶的行為模式有一定意義。但是在實(shí)驗(yàn)過程中要保護(hù)參與者不受傷害,具體的實(shí)驗(yàn)將如何操作則有待于研究者們進(jìn)一步探索。
(2)將多種數(shù)據(jù)收集和分析的方法和策略結(jié)合起來。微博平臺(tái)以互聯(lián)網(wǎng)為基礎(chǔ),又同時(shí)影響人們生活的許多方面。如前文所述,微博研究的興起已經(jīng)使各學(xué)科之間的界限越來越模糊。微博研究會(huì)呈現(xiàn)出越來越多的多元性和交叉性趨向。例如,若分析一個(gè)大數(shù)據(jù)集內(nèi)微博的情緒指數(shù),就需要數(shù)學(xué)知識(shí)進(jìn)行建模分析,然后再使用計(jì)算機(jī)技術(shù)進(jìn)行機(jī)器學(xué)習(xí)并結(jié)合語言學(xué)知識(shí)進(jìn)行語義分析,從而獲得用戶對(duì)意見事情的情緒反應(yīng)。如果再將這些情緒反應(yīng)與事件的分類相連,則可以應(yīng)用社會(huì)學(xué)研究方法得出事件分類與情緒指數(shù)的普遍聯(lián)系。當(dāng)然,要完成這類研究,僅僅依靠一個(gè)學(xué)科的知識(shí)是遠(yuǎn)遠(yuǎn)不夠的,而學(xué)者們往往無法同時(shí)兼顧如此多的學(xué)科背景。因此,想要在微博平臺(tái)上完成更大的研究,就需要多學(xué)科學(xué)者之間的合作,將多學(xué)科的方法和策略結(jié)合在一起。
(3)將微博數(shù)據(jù)與其他社交平臺(tái)的數(shù)據(jù)結(jié)合起來。要知道,無論我們多努力,可以被收集的微博數(shù)據(jù)依然無法脫離微博的功能架構(gòu)。在經(jīng)過研究者長(zhǎng)時(shí)間的多次研究而無法獲得更加有創(chuàng)新性結(jié)果的時(shí)候,我們要做的事情就是要學(xué)會(huì)融合其他媒體的數(shù)據(jù)。如果將微博數(shù)據(jù)與其他社交平臺(tái)的數(shù)據(jù)加以比較分析,比如我國(guó)的人人網(wǎng)、微信和國(guó)外的Facebook,YouTube等結(jié)合起來一起分析,則不僅可以在網(wǎng)絡(luò)社交平臺(tái)之間進(jìn)行對(duì)比性研究,比如研究不同網(wǎng)站活躍用戶的不同網(wǎng)絡(luò)行為模式,或者對(duì)不同事物分類的情緒指數(shù)等;還可以獲得比單一平臺(tái)用戶信息更加廣泛的甚至可以擴(kuò)展到全部網(wǎng)民的數(shù)據(jù)信息。
總體來看,微博在我國(guó)的迅速發(fā)展引起了包括社會(huì)學(xué)者在內(nèi)的研究者的廣泛關(guān)注,其相關(guān)研究雖然時(shí)間短,但就深度和廣度而言已經(jīng)達(dá)到了一定的水準(zhǔn)。當(dāng)然,微博并不是單獨(dú)存在的,而是我國(guó)網(wǎng)絡(luò)社會(huì)環(huán)境的一部分,與社會(huì)環(huán)境和其他網(wǎng)絡(luò)平臺(tái)有著千絲萬縷的聯(lián)系。結(jié)合多種研究方法,結(jié)合多個(gè)網(wǎng)絡(luò)平臺(tái)將為網(wǎng)絡(luò)社會(huì)學(xué)的研究打開一扇新的大門。而為了更好地研究這些數(shù)據(jù),網(wǎng)絡(luò)平臺(tái)也應(yīng)該適當(dāng)改變一下當(dāng)前對(duì)于普通研究者的數(shù)據(jù)獲取權(quán)限。當(dāng)然,一些機(jī)構(gòu)也可以參考外國(guó)的機(jī)構(gòu)的做法,將一些數(shù)據(jù)收集好之后作為數(shù)據(jù)集提供給研究者。在這些有利條件下,我國(guó)的微博和自媒體研究必將進(jìn)入一個(gè)更高的水平。
[1]FRY A.Helping the Public See the Value of Social Research Using Social Media [J].International Journal of Market Research,2014,56(4).
[2]Twitter使用情況.https://about.twitter.com/zh-hans/company[2015-04-30].
[3]陽淼.新浪微博用戶數(shù)突1億,今年將加大投入——中新網(wǎng)http://www.chinanews.com/it/2011/03-03/2880117.shtml[EB/OI].[2015-04-30].
[4]WELLER K.What Do We Get from Twitter—and What Not? A Close Look at Twitter Research in the Social Sciences [J].Knowledge Organization,2014,41(3).
[5]中國(guó)知網(wǎng)搜索結(jié)果.http://epub.cnki.net/kns/brief/default_result.aspx[2015-04-30].
[6]GAONKAR S.and CHOUDHURY R R.Micro-blog: Map-casting from Mobile Phones to Virtual Sensor Maps [Z].2007.
[7]KAPLAN M A.and HAENLEIN M.Users of the World,Unite! The Challenges and Opportunities of Social Media [J].Business Horizons,2010,53(1).
[8]TINATI R.,HALFORD S.,CARR L.and POPE C.Big Data: Methodological Challenges and Approaches for Sociological Analysis [J].Sociology,2014,48(4).
[9]ACKLAND.Web Social Science: Concepts,Data,and Tools for Social Scientists in the Digital Age [M].Los Angeles: SAGE,2013.
[10]GIGLIETTO F.,ROSSI L.and BENNATO D.The Open Laboratory: Limits and Possibilities of Using Facebook,Twitter,and YouTube as a Research Data Source [J].Journal of Technology in Human Services,2012(30).
[11]HUBERMAN.,ROMERO D M.and WU F.Social Networks that Matter: Twitter under the Microscope [R].First Monday,2009,14(1),Retrieved from http://firstmonday.org/ojs/index.php/fm/article/view/2317/2063.
[12]JAVA A,SONG X.,FININ T.and TSENG B.Why We Twitter: Understanding Microblogging [J].Network,2007(1).
[13]THORSON K.,DRISCOLL K.,EKDALE B.,EDGERLY S.,GAMBER L.,THOMPSON L G.,SCHROCK A.,SWARTZ L.,VRAGA E.and WELLS C.[J].YouTube,Twitter and the Occupy Movement: Connecting Content and Circulation Practices.Information,Communication & Society,2013(16).
[14]ALEXANDRA S.and LANCE B W.Social Media and the Organization of Collective Action: Using Twitter to Explore the Ecologies of Two Climate Change Protests [J].Communication Review,2011(14).
[15]RYONG L.and EDEN L.Measuring Geographical Regularities of Crowd Behaviors for Twitter-Based Geosocial Event Detection [A].ZHOU X.,LEE W C.,PENG W C.and XIE X.GIS’ 10 18thSIGSPATIAL International Conference on Adrances in Geographic Information Systems San Jose,CA,USA—November 03-05,2010 [C].New York: ACM,2010.
[16]LASSEN D S.and BROWN A R.Twitter: The Electoral Connection? [J].Social Science Computer Review,2010,29(4).
[17]BOYD D.and ELLISON N B.Social Network Sites: Definition,History,and Scholarship [J].Journal of Computer-Mediated Communication,2008,13(1).
[18]BRUNS A.and STIELITZ S.Twitter Data: What Do They Represent? [J].Information Technology,2015,57,Retrieved from http://snurb.info/files/2014/Twitter%20Data.pdf.
[19]TAKHTEYEV Y.,GRUZD A.and Wellman B.Geography of Twitter Networks [J].Social Networks,2012.
[20]LEETARU K H.,WANG S.,CAO G.,PADMANABHAN A.and SHOOK E.Mapping the Global Twitter Heartbeat: the Geography of Twitter.First Monday,2013,18(5),Retrieved from http://firstmonday.org/ojs/index.php/fm/article/view/4366/3654.
[21]PETROV C S.Osborne M.and LAVRENKO V.Streaming First Story Detection with Application to Twitter [A].Kaplan R M.HLT’ 10 Human Language Technology: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics [C].Stroudsburg,PA: Association for Computational Linguistics,2010.
[22]LASORSA D L.,LEWIS S C.and HOLTON A E.Normalizing Twitter: Journalism Practice in an Emerging Communication Space[J].Journalism Studies,2012,13.
[23]RITTER A.,COLIN C.and DOLAN B.Unsupervised Modeling of Twitter Conversation [A].Kaplan R M.HLT’ 10 Human Language Technology: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics [C].Stroudsburg,PA: Association for Computational Linguistics,2010.
[24]陳爽、周明潔、張建新.微博信息的情緒效價(jià)與喚起程度對(duì)信息傳播的影響 [A].第十五屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集 [C].2012.
[25]葛彥菲.基于社會(huì)網(wǎng)絡(luò)分析的涉農(nóng)微博交流特性研究——以新浪“農(nóng)業(yè)行業(yè)”微群為例 [D].南京農(nóng)業(yè)大學(xué),2012.
(責(zé)任編輯:黃鵬進(jìn))
國(guó)家社會(huì)科學(xué)基金重點(diǎn)項(xiàng)目“社會(huì)范疇重釋與中國(guó)社會(huì)發(fā)展模式研究”(10ASH001)、教育部人文社科項(xiàng)目“同妻社群生活適應(yīng)問題的虛擬社會(huì)人類學(xué)研究”(12YJA840022)的階段性成果。
C913
A
1243(2017)01-0082-007
作者:唐魁玉,哈爾濱工業(yè)大學(xué)社會(huì)學(xué)系教授、博士生導(dǎo)師,兼任中國(guó)社會(huì)學(xué)會(huì)理事、中國(guó)網(wǎng)絡(luò)社會(huì)學(xué)會(huì)副會(huì)長(zhǎng)、中國(guó)生活方式研究會(huì)副會(huì)長(zhǎng),主要研究方向:網(wǎng)絡(luò)社會(huì)學(xué)及虛擬社會(huì)人類學(xué);張旭,哈爾濱工業(yè)大學(xué)博士研究生,University of Maryland,Baltimore County(馬里蘭大學(xué)巴爾地摩分校)實(shí)用社會(huì)學(xué)碩士,主要研究方向:網(wǎng)絡(luò)社會(huì)學(xué)和社會(huì)信息系統(tǒng)。郵編:150090