• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      微博媒介使用中的用戶趨同化現(xiàn)象與路徑
      ——基于新浪微博用戶的實證分析

      2021-11-11 08:30:00
      關鍵詞:趨同化全局層級

      徐 翔

      (同濟大學 藝術與傳媒學院,上海 201804)

      社交媒體時代的強勢崛起,產(chǎn)生了微博、Twitter、Facebook等典型新媒介平臺和“用戶生成內(nèi)容”(User Generated Content,UGC)網(wǎng)絡應用。社交媒體的使用和傳播,是生成和促進用戶在表達內(nèi)容上的多樣性、“部落化”?還是減少內(nèi)容異質(zhì)性與多樣性,增強用戶同質(zhì)性和趨近性? 這個問題,在多種媒介理論和經(jīng)驗視點的碰撞下,存在著持續(xù)而且復雜的論爭。

      一方面,就互聯(lián)網(wǎng)及社交網(wǎng)絡平臺特性而言,有學者認為,互聯(lián)網(wǎng)能夠促進多元意見的表達,提升公共討論[1]。Lee 等[2]進行的一次全美概率抽樣調(diào)查結果表明,在Facebook、Twitter和其他社交網(wǎng)站上,人們的交往網(wǎng)絡更為多元化,回聲室效應并不顯著;在社交媒體中,獲取新聞、發(fā)布新聞等與新聞、信息相關的活動能夠促進社交網(wǎng)絡的異質(zhì)性。Barberá 研究得出:總體而言,社交媒體用戶接收的觀點是多元化的,并且隨時間推移,那些嵌入在多樣化網(wǎng)絡中的美國用戶會逐漸關注較少意識形態(tài)同質(zhì)性的群體[3]。Brundidge 提出,人們在線上互動依據(jù)的是不經(jīng)意原則(inadvertency),最終會導致多元化個人網(wǎng)絡的形成[4]。另一方面,對立的觀點和分析,則反對社交媒體過度理想化的“公共領域”和異質(zhì)性。有研究者認為,互聯(lián)網(wǎng)只是便利了選擇性接觸和近似觀點的強化[5-7]。Freelon 等根據(jù)有關敘利亞的轉發(fā)帖子衡量社交網(wǎng)絡同質(zhì)性是增加還是減少,發(fā)現(xiàn)研究的9個組整體上呈現(xiàn)出高度同質(zhì)化和碎片化特征,并且8個組都直接形成同質(zhì)化分組[8]。Leskovec 分析具有時態(tài)信息的四個大型社交網(wǎng)絡,證實同質(zhì)性的存在[9]。

      本研究的主要觀點是:(1)微博帖子或許存在著“碎片化”的異質(zhì)性,但是如果將某個用戶所有發(fā)帖從“碎片”組裝還原為該用戶的“內(nèi)容整體”,那么用戶會表現(xiàn)出越來越減少獨特性、越來越趨同化的現(xiàn)象。(2)對于微博媒介的使用是用戶“越使用、越趨同”的重要驅(qū)動機制。(3)微博中的媒介使用對用戶產(chǎn)生的多種趨同化作用具有內(nèi)在統(tǒng)一性。

      一、文獻綜述與問題分析

      微博與社交媒體的用戶內(nèi)容同質(zhì)化,可以回溯媒介文化、媒介技術的文化考察及其理論資源。20世紀中葉,法蘭克福學派對于大眾傳媒、現(xiàn)代意義上“文化工業(yè)”的批判中,提出著名的“文化工業(yè)”概念,指出在規(guī)模化、商業(yè)化的文化生產(chǎn)和流通中,文化逐漸同一化、非個性化[10]107-152。“文化工業(yè)”的批判理論視角中,蘊含著文化內(nèi)容及其生產(chǎn)、消費、趣味中的一系列同質(zhì)化、同一化,乃至主體性被同質(zhì)化文化內(nèi)容所侵蝕之憂思。馬爾庫塞提出“單向度的人”[11]提出“單向度的人”,從另一個角度反思技術影響下的去異質(zhì)化。對此,今天面對社交媒體需思考的是,在表層“碎片化”帖子信息和“肉眼可見”的個體差異中,“提煉”所謂的多樣化、去中心性以及“人人時代”[12]的媒介賦權,有可能忽視豐富內(nèi)容流動之下潛藏著的深層趨同性與同一化。對于微博用戶的分析,理論上需要回應的基本問題包括:(1)作為媒介文化的重要領域,微博媒介場中的用戶內(nèi)容趨同化,是否的確存在?(2)如果趨同化是存在的,那么用戶的趨同程度是均等化的還是有著內(nèi)在差異?何種條件下生成趨同程度的差異?(3)批判理論之所以遭受到強力攻擊,尤其是來自堅持意義多樣性、受眾主動性的一些經(jīng)驗研究攻擊,其重要原因之一是在自身關于“文化工業(yè)”的同一性框架中,對于多樣性、異質(zhì)性過于簡單粗暴地“視而不見”,而未能將后者很好地融合到理論整體中。因此待重視的問題是:即使微博用戶“趨同”是可驗證的,但用戶實際上“肉眼可見”廣泛顯現(xiàn)的內(nèi)容差異性和多樣性需要很好地兼容于趨同性架構,而不應只是把兩者強行并置為“既A且B”的生硬統(tǒng)一。

      由于社交網(wǎng)絡中用戶的共同興趣偏好、內(nèi)容偏向、選擇性接觸和傳播,導致“用戶社群”或“用戶網(wǎng)絡連接”中形成和表現(xiàn)出同質(zhì)化,它是用戶趨同的原因中被關注的主要方面之一。Himelboim等[13]通過社會網(wǎng)絡分析和聚類的方法分析了在Twitter上全球變暖、赤字問題、移民改革等10個爭議性話題發(fā)表看法的500位用戶,發(fā)現(xiàn)從集群內(nèi)角度看,其觀點、立場同質(zhì)化明顯。朱慶華、袁園及孫霄凌[14]以新浪微博為研究對象,隨機選取 500 個微博達人樣本,篩選出他們關注的其中 32 位明星微博,結合社會網(wǎng)絡分析方法和聚類分析,充分顯示出微博社區(qū)的社會關系中具有很強的中心集中趨勢,大多數(shù)微博用戶存在著某些共同微博使用目的和關注習慣。陳福平和許丹紅點[15]使用皮尤“互聯(lián)網(wǎng)與美國生活項目”2012年發(fā)布的調(diào)查數(shù)據(jù)研究指出,在社交網(wǎng)絡的技術、媒介和社會網(wǎng)絡三重特性的相互作用下,使用者會選擇觀點的隔離并轉而鏈接同質(zhì)群體,這一構建過程最終導致網(wǎng)絡群體極化產(chǎn)生;在政治觀點表達更為活躍的社交網(wǎng)絡中,人們認知到相異觀點幾率反而下降;社交網(wǎng)絡的使用頻率越高,使用者越傾向?qū)ο喈愑^點保持沉默,越傾向隔離相異觀點。王曉光[16]通過對微博用戶社會網(wǎng)絡分析后指出:普通微博用戶在線上更容易陷入特定主題交流社區(qū),關注對象通常集中在特定的核心微博上。Lawrence[17]發(fā)現(xiàn)微博鏈接中意識形態(tài)隔離,跨黨派產(chǎn)生實質(zhì)交流的機會很少??傮w來看,用戶傾向于和具有共同內(nèi)容和興趣的用戶、群體形成選擇性的連接,帶來觀念和內(nèi)容隔離甚至形成“回音室”,這些都是微博用戶同質(zhì)化形成的關鍵組成部分之一。

      從表層而言,在這些網(wǎng)絡“回音室”、觀念隔離、選擇性接觸等同質(zhì)化效應中,驗證了用戶會產(chǎn)生相似意見與態(tài)度。但用戶在部分意見、態(tài)度、帖子內(nèi)容的相似化,并不等于用戶整體內(nèi)容的相似化。還隱含著的重大問題是:用戶因共同觀點、內(nèi)容偏向而形成的連接與聚合,在現(xiàn)有研究中大部分是局部或微觀的,也即研究個體和個體的微觀之間或有限規(guī)模社群內(nèi)的相似化。這對于另一個重要問題則關注度不夠:社交網(wǎng)絡全局范圍內(nèi)的趨同化,或是批判理論意義上的“宏觀”同一化。其中隱含著的理論緊張是:局部個體、群體的網(wǎng)絡“回音室”“觀念隔離”,在加強局部化趨同的同時,它是使整體陷入一個個微小趨同局部、“巴爾干化”,還是可能伴隨和催動整體趨同化?

      微博和社交媒體用戶的內(nèi)容生產(chǎn)過程中,一些內(nèi)容、主題帶有偏向,會引起用戶朝特定類型內(nèi)容偏倚與分布,從而限制用戶“自由”生成內(nèi)容的異質(zhì)性。盡管“人人都有麥克風”,社交媒體、自媒體賦予了“用戶生成內(nèi)容”很大自主和“草根”性,但是內(nèi)容生產(chǎn)中蘊含著趨同化的內(nèi)在動力,被研究者所注意。被卷入到平臺規(guī)則體系中的用戶內(nèi)容生產(chǎn)中,以召回率(Recall Rate)為目標的內(nèi)容推薦算法帶來了內(nèi)容選題、類型和風格的系統(tǒng)化傾向,直接影響到內(nèi)容生產(chǎn)者的旨趣;內(nèi)容召回和用戶留存的前提在于內(nèi)容的高效產(chǎn)出,這促使內(nèi)容生產(chǎn)活動變得愈加職業(yè)化和標準化[18]。有學者強調(diào),“合法性危機”是造成傳媒機構和組織出現(xiàn)“同質(zhì)化”現(xiàn)象的根本原因,這一危機導致“強迫機制”“模仿機制”和“社會規(guī)范機制”相互作用,最終使得傳媒出現(xiàn)相當程度的同質(zhì)化[19]。張志安等[20]24-30的研究則顯示,微博輿論場中,營銷類、娛樂類用戶成為微博意見領袖群體的主流。這也意味著,大量用戶朝向“娛樂至死”“營銷致死”的類型偏倚會減少微博中的用戶內(nèi)容豐富性,加強在少數(shù)類型上的集中化和相似化。就微博信息、資訊的主題類別而言,有研究支持,不同主題類別微博被轉發(fā)的概率存在顯著差異,平均轉發(fā)數(shù)相差可達10倍,各類主題在微博信息擴散效果和用戶擴散能力方面都表現(xiàn)出強弱分化的特征[21],從而使得用戶的內(nèi)容生產(chǎn)、傳達表現(xiàn)出在特定主題上的偏倚。這些建基于用戶內(nèi)容生產(chǎn)和內(nèi)容擴散過程中的研究,關系到用戶內(nèi)容在邏輯上的趨同可能性和應然性。在此基礎上,仍有待進一步探及的問題包括:用戶的內(nèi)容生產(chǎn)過程和微博使用過程,如何以及以怎樣的程度影響著用戶內(nèi)容同質(zhì)性?

      在線用戶之間社會關系和社會網(wǎng)絡是影響和加強用戶同質(zhì)化信息傳播的重要因素之一。用戶自主構建的個性化信息獲取網(wǎng)絡首先與其社交關系網(wǎng)絡相關,當人們以社交關系構建起自己的信息網(wǎng)絡時,也就建立了一道無形的墻,將一些信息阻擋在外面[22]。用戶社會關系和信息的同質(zhì)性選擇、同質(zhì)性擴散之間存在著相關性。Colleoni等[23]對Twitter使用者的考察發(fā)現(xiàn),具有共和黨和民主黨傾向的人群互動中的“普遍同質(zhì)性”(某個用戶的關注同黨派人的連接數(shù)除以他的全部關注數(shù)量,數(shù)值在區(qū)間[0,1])都超過了0.8。Conover等[24]使用聚類方法分析超過25萬條Twitter消息的轉發(fā)網(wǎng)絡和評論網(wǎng)絡,其中出現(xiàn)了隔離結構,高度模塊化的社群圖被分隔為簇狀,這種簇狀連接被認為是同質(zhì)化甚至群體極化。在這些因素的影響下,用戶接觸、連接異質(zhì)信息的用戶存在一定的用戶間壁壘。信息更多的在同質(zhì)用戶圈層中流動而難以“出圈”,不同圈層間的態(tài)度、立場的分歧甚至對立可能會增加[25]。這類研究確證了網(wǎng)絡“強關系”“弱關系”中可能存在的信息同質(zhì)化。但與此不同的是:微博空間不只是由用戶的社會連接關系構成的在線社會,也可能是由某些具有共同在線特征、微博話語特征的“用戶階層”“用戶層級”構成的在線社會。例如,具有相近的粉絲量或帖子影響力的“大V”“頂部用戶”用戶層級,亦或具有相近微博使用度的“淺度用戶”“重度用戶”層級,這些具有不同的媒介化等級和“能量”的用戶可能并無共同的好友關系或群體紐帶,但是它們可能具有共同的信息趨同特征。微博使用端的用戶作為“媒介的延伸”,其媒介使用本身、使用過程中“媒介化”程度和結果需要加以細致考量,而不是在過度重視社會學、人口學、網(wǎng)絡行為學等外在因素中忽略“回到媒介”的本體論向度。用戶在微博的媒介使用中如何形成、表征其內(nèi)容趨同化,是現(xiàn)有研究中尚挖掘不充分的。

      有研究指出,微博中的內(nèi)容存在對特定主題如娛樂、營銷的偏向[20]24-30。但是這種朝向特定內(nèi)容域的偏倚并不能推導出用戶必須趨同。在任何一個社會文化系統(tǒng)中,無論該系統(tǒng)如何偏重于某些局部主題,都和系統(tǒng)中主體之間的差異性、波動性并不矛盾。另一方面,在顯而易見的帖子豐富性、個體主題和興趣差異化背景下,微博用戶是否以及如何體現(xiàn)其趨同邏輯?綜合現(xiàn)有研究,并關注微博、社交媒體現(xiàn)實,以下相關聯(lián)問題值得繼續(xù)思考:

      A.關于社交媒體用戶連接、用戶行為、傳播行為的研究,尤其是其中的大量實證研究,雖然不斷觸及用戶的觀念、內(nèi)容、態(tài)度和立場的同質(zhì)化,但是這些研究范式基本的指向都是用戶是否以及如何形成局部、微觀、個體尺度的同質(zhì)化。例如具有強關系或弱關系的個體之間的相似性,群體內(nèi)部的“回音室”和群體意見極化、“巴爾干化”,關注和被關注、轉發(fā)和被轉發(fā)過程中的信息同質(zhì)性。與之不同的是,宏觀媒介場和全體用戶群,是否以及如何表現(xiàn)出趨同化?

      B.和A相關,微博用戶如果在宏觀尺度表現(xiàn)出內(nèi)容趨同化,由于“肉眼可見”的內(nèi)容差異,那么這種整體上的趨同化必然是不均等、不均衡的,它不同于批判學派意義上“抽象”的標準化和籠統(tǒng)的同一性。與此相關的是,不同用戶的趨同,是否以及在怎樣的條件下體現(xiàn)著強弱、程度的差異?相比較于社會經(jīng)濟地位、亞文化和社會群體背景、人口學特征等更為顯見的變量,微博使用程度看似更為間接,也往往被前者所轉移注意力。但如果趨同是在微博使用中發(fā)生的,那么對微博的使用度就是最為直接關聯(lián)的變量之一,關系到用戶“越使用,越趨同”的問題。

      C.對于由多行動者(agent)構成的系統(tǒng)而言,其趨同策略包括平滑擴散趨同(Flat Diffusion Convergence)和非平滑擴散趨同。前者中每個行動者的地位是平等的,由于沒有優(yōu)先的策略值[26];而非平滑的擴散趨同中,存在著具有優(yōu)越性的趨同策略,使得系統(tǒng)最后的趨同結果會聚集于這些高地位的agent的策略值[27]。對微博用戶組成的系統(tǒng)而言,是否存在朝向這些更高優(yōu)先性的趨同方向和趨同標的?例如,微博系統(tǒng)中具有更高使用度的用戶。

      D.除了高優(yōu)先性的趨同方向差異,還存在著全局擴散趨同和鄰域擴散趨同。其一,在鄰域擴散趨同中,每個agent逐步根據(jù)其領域的agent策略平均值來進行自我調(diào)整,從而最后實現(xiàn)整個系統(tǒng)的趨同[28]。其二,在其他一些情況下,行動者不僅只是感知到鄰域的影響,還會受到其他非鄰居的作用,形成全局擴散趨同(Global Diffusion Convergence)[29]。當前研究主要集中于各種形式、條件的鄰域趨同,而對全局趨同則關注不足。因此對于微博用戶,還需關注兩方面:他們是否以及如何體現(xiàn)和全局用戶趨于一致的全局趨同化?是否以及如何體現(xiàn)和相近用戶的“鄰域”趨同化?

      E.由A、C、D可推知的是,如果用戶隨著其微博使用度的提升,而和某些或全局用戶變得趨于相似,那么最接近“標的”甚至約等于“標的”的(無論該“標的”是什么樣,在此并不重要)用戶,也就是最高使用度的那批用戶。從而,帶來用戶和“最高使用度”的“頂部用戶”趨同的態(tài)勢。這不是獨立的假設,而是基于C和D的推斷。

      F.微博用戶在C、D、E中所涉及的多種趨同路徑,是統(tǒng)一、同步的,還是矛盾、對立的?亦或獨立、無關聯(lián)的?例如,趨向于全局用戶的同化和趨向于鄰近用戶的同化,兩者是矛盾的或至少是獨立并行的效果嗎?而全局趨同、鄰域趨同和趨向優(yōu)勢用戶的趨同,又是何種關系?一方面,基于A、C、D尤其是E可以推斷,趨于和“最高使用度”頂部“標的用戶”的趨同是和其他某些趨同性具有同步性的。但這種同步性廣泛到什么程度,能否強烈到能使看似“風馬牛不相及”的全局趨同性和鄰域趨同性之間同步,甚至使全部的趨同化程度表現(xiàn)出同步性,理論尚難以推斷,還有待實證的繼續(xù)研究。

      基于上述可資借鑒的成果和對于微博中實際問題的分析和推斷,提出相互關聯(lián)的核心觀點。在此首先要予以說明的是,全文分析和研究中,把微博用戶按照相同或相近的使用度進行社會“分層”,采取了數(shù)據(jù)挖掘中常用的等頻“分箱化”預處理,例如社會區(qū)分下的“用戶層級”。這種分箱化或分層的預處理,可以減少個體的過大隨機“噪音”,更為清晰地分析自變量條件下的趨同化演變規(guī)律。如果不是要精確地根據(jù)某些條件去預測個體,而只是試圖考察在這些條件下的用戶的變化態(tài)勢和機制,那么對用戶的“分層”研究就可以達成后者的目的。而且,通過具有相同特征的用戶分層捕捉某種、某類個體的共同特征,可增強計算與結果關聯(lián)的穩(wěn)定性,同時有利于加強對微博用戶階層和群體特征的社會考察而非個體考察。尤其對于“意見階層”內(nèi)部高同質(zhì)化關系的分析,更需要把用戶群作為分層后的整體來考察。這些是本文研究以用戶“社會層級”為單位而不是以“個體”為對象的多方面原因。

      首先,整體研究的基本觀點為,用戶的微博使用程度存在著和其內(nèi)容趨同化程度之間的正相關。其中,把微博用戶作為一個個“帖子內(nèi)容單元體”,也即由該用戶所生產(chǎn)、發(fā)布的所有帖子內(nèi)容構成的一個基本單元。這個問題可以轉換到用戶“分層”的社會學群體視域,也即,使用度越高的用戶層級,則該層級人群的平均趨同化程度就越高。在此基礎上,進一步分析。

      (Q1)用戶內(nèi)容趨同化。用戶在微博使用中,消減自身的獨特內(nèi)容,變得和某些用戶“模板”或“社會層級”越來越相似,從而發(fā)生趨同化:Q1.1.受到全局媒介場的作用,和全體用戶越來越相似與同質(zhì)化(可稱為全局趨同化);Q1.2.趨向和最高使用度的“典范”用戶層級越來越相似 (可稱為頂部趨同化);Q1.3.朝向具有和自身相同或相近的媒介使用度的“鄰近”用戶的趨同化(可稱為近鄰趨同化);Q1.4.趨向和自身使用度相同的本層級用戶的趨同化(層內(nèi)趨同化)。對這些可能的路徑進行綜合考察,這四種趨同化的指向與內(nèi)涵如圖1所示。

      圖1 基于媒介使用度的用戶分層及其趨同化路徑

      對于全體用戶中任一使用度水平的用戶層級m,面臨著幾種不同的削弱自身內(nèi)容的個性、趨同于他人的路徑:(1)層級m內(nèi)的用戶的彼此間的平均相似度(層內(nèi)趨同化);(2)用戶層級m與使用度最為接近的近鄰層級(m?1)和(m?1)發(fā)生趨似(近鄰趨同化);(3)m可能朝向使用度最頂層的用戶層級MAX發(fā)生趨似(頂部趨同化);(4)m和全體用戶發(fā)生的趨似(全局趨同化)。至于這四個層面是全部成立還是部分成立,亦或全部不成立,則留待后文的實證檢驗。

      (Q2)用戶內(nèi)容趨同化的四種路徑的一致性。Q1.1(全局趨同化)、Q1.2(頂部趨同化)、Q1.3(近鄰趨同化)、Q1.4(層內(nèi)趨同化)這四種不同標的的趨同路徑,不是矛盾的、相互掣肘的,也不是互不相關的,而是一致的、同步的。全文的邏輯結構和內(nèi)在關系如圖2所示。

      圖2 整體邏輯結構

      二、研究設計

      (一)概念與指標界定

      Weng[30]在分析Twitter用戶同質(zhì)性時,將同質(zhì)化定義為共享相似內(nèi)容并因此表現(xiàn)出相似興趣的趨勢。在群體行為的“趨同”現(xiàn)象中,每個行動者都具有一定行為策略值;行動者在初步階段可以任意選擇自己的策略值,但是隨著時間的發(fā)展他們最后會選擇同一種策略值[31]。本文將微博用戶內(nèi)容“趨同化”定義為:用戶在微博媒介使用程度較低時,其發(fā)布的內(nèi)容較為獨特化和異質(zhì)化;而隨著對微博使用度的不斷加深,用戶會減少內(nèi)容的獨特性和個性化差異,增加與他人的相似性。

      1.全局相似度層面,也即用戶和全體用戶、“蕓蕓眾生”的平均相似度越來越高,“泯然眾人矣”而越來越磨滅自己的內(nèi)容個性與獨特性。

      2.趨頂相似度層面,也即用戶和某種使用度最高的用戶群體(可理解為社會聚光燈下、遠在普通人之上的那部分“典范”人群),其平均相似度越來越高。例如,注冊時長越久的用戶,他們會和注冊時長最長的那部分用戶越來越相似。

      3.近鄰相似度層面,也即用戶和具有相近使用度的用戶,其平均相似度越來越高。用戶不僅在趨似于“蕓蕓眾生”和典范性的“頂部用戶”,也在趨似于媒介使用度方面和自己最為“鄰近”的用戶和社會層級。

      4.層內(nèi)相似度層面,也即用戶所處的具有相同使用度的層級內(nèi)部,其平均相似度會越來越高。例如,如果用戶劃分為“最低使用度”和“最高使用度”的不同的“階層”,則“最低使用度”的階層內(nèi)部會比較松散,大家彼此各不相同的程度很高;但是“最高使用度”的階層內(nèi)部的各人則彼此更為相似,相互趨近的“密度”和“黏稠度”比“低使用度”階層高。本段所述的層內(nèi)相似度,既是一個相對獨立的猜測,同時也是來自第1個和第3個假設的自然延伸:如果用戶隨著微博媒介的使用,而在內(nèi)容生產(chǎn)上受到各種“消磨個性”“泯然眾人矣”的作用,他們進行內(nèi)容生產(chǎn)的“自我彈性”越來越小。這樣能預期的是,初級、低級使用度的層級雖然是“大流”“主流”的用戶層級,但是該層級反而是更為異質(zhì)化的,而不是缺乏差別和個性的“群氓”。而與一般的直覺不同的是,高使用度的用戶、各垂直領域的精英用戶等中、高“社會層級”內(nèi)部反而是越來越高度同質(zhì)化。這一點也是本文對用戶樣本采取“分層”研究而不是個體研究的重要原因之一。

      樣本選取自新浪微博。作為中國互聯(lián)網(wǎng)2.0時代的代表性社交媒體和自媒體平臺,新浪微博發(fā)展至今,活躍用戶數(shù)量超4億,用戶覆蓋范圍廣。對于新浪微博使用程度的衡量,從以下方面進行。

      1.最基本的層面,是對微博的媒介接觸和“浸泡”、卷入,這里采取用戶的微博賬戶注冊天數(shù)來反映。

      2.最基本的媒介接觸并不意味著對媒介的使用活性,因此進一步考察其使用的活性,這里采用微博用戶的賬戶經(jīng)驗值、微博用戶關注他人數(shù)量來衡量。其中,各微博賬戶的經(jīng)驗值來自新浪微博的公開數(shù)據(jù),直觀地反映了用戶在新浪微博的使用活躍性和經(jīng)驗,獲得經(jīng)驗值的方式主要為:發(fā)微博,連續(xù)登錄賬號。而用戶關注他人,反映了用戶在新浪微博使用中的主動性,積極尋求和其他用戶的信息傳播、關注和建立一定社會連接。用戶關注他人數(shù)存在大量低關注數(shù)的“長尾”,取常用的對數(shù)函數(shù)轉換法,也即:xnew=log2(x+1)。

      3.有媒介接觸、媒介使用活性,并不就意味著擁有使用的效果,那么這種使用即使很持續(xù)、很活躍,但也可能只是一種低效的、低顯示度的使用。因此,進一步考察新浪微博用戶的使用效果和影響,一是采用該用戶所有發(fā)帖的平均熱度,也即某用戶各帖子的被點贊數(shù)、被轉發(fā)數(shù)及被評論數(shù),分別由對數(shù)函數(shù)轉換后在[0,1]區(qū)間歸一化,并等權求均值,作為該用戶的帖子平均熱度值,即:xnew=[minmaxlog2(x1+1)+minmaxlog2(x2+1) +minmaxlog2(x3+1)]/3,其中x1、x2、x3分別指用戶的帖子平均轉發(fā)數(shù)、平均評論數(shù)及平均點贊數(shù),minmax()將數(shù)據(jù)在[0,1]區(qū)間予以最小最大歸一化。二是采用用戶的粉絲數(shù)作為直觀指標之一,漲粉、粉絲量是微博用戶影響力和網(wǎng)絡話語地位的一個簡單而有高區(qū)分度的指標,該指標和關注他人數(shù)一樣符合大量長尾的冪律分布,也取對數(shù)函數(shù)轉換得到,即:xnew=log2(x+1)。微博的使用度指標從三大方面、五個子指標構成,如表1所示。

      表1 微博使用度指標

      用戶使用程度的上述指標量綱不一致,而且分布不一致,各個指標的隨機波動也很大。為了簡化研究,采用常用的“分箱化”策略,對用戶在每一種使用度指標下,劃分為等頻(等人數(shù))的由低到高的30個“社會層級”。

      (二)數(shù)據(jù)獲取和預處理

      運用開源網(wǎng)頁文本抓取工具“八爪魚”,以及自行用python和selenium編寫的動態(tài)網(wǎng)頁抓取程序,抓取新浪微博用戶資料及其發(fā)帖。從新浪微博首頁 47 個內(nèi)容版塊(分別是:社會、國際、科技、科普、數(shù)碼、財經(jīng)、股市、明星、綜藝、電視劇、電影、音樂、汽車、體育、運動健身、健康、瘦身、養(yǎng)生、軍事、歷史、美女模特、美圖、情感、搞笑、辟謠、正能量、政務、游戲、旅游、育兒、校園、美食、房產(chǎn)、家居、星座、讀書、三農(nóng)、設計、藝術、時尚、美妝、動漫、宗教、萌寵、法律、視頻、上海)中,持續(xù)一個月每天抓取2次帖子,從這些樣帖整理得到 10 037 個發(fā)布者。本研究出于規(guī)模和成本所限,未采用大規(guī)模隨機漫步等抽樣方法,但采樣時間持續(xù)了一個月,并非某個短時間內(nèi)的抽取; 而且結合了新浪微博自身的內(nèi)容分發(fā)系統(tǒng),廣泛而大致均衡地分布在 47 個大內(nèi)容類型版塊,因而也體現(xiàn)出較大覆蓋面和良好程度的代表性。2018年10—12月期間,采集這些發(fā)布者用戶的URL信息,并在此基礎上進一步采集 10 037 個用戶的用戶名、性別、所在地、粉絲數(shù)、關注數(shù)、發(fā)布微博數(shù)、注冊時間、等級及會員信息等多種信息;根據(jù)用戶URL地址,對用戶發(fā)帖進行抓取,得到去重后的微博數(shù)量 34 892 987 條。由于帖子過少可能難以充分反映出用戶內(nèi)容特征,所有只保留樣本帖在 3 000 條以上的用戶,剩下 7 825個用戶用于最終分析,并且每個用戶一律隨機抽取其中 3 000 條帖子,以增強口徑的統(tǒng)一與橫向可比較性。用 python 編程語言對文本進行繁體字簡化,采用在學界和業(yè)界較為常用的 jieba 模塊完成中文分詞。

      (三)基于潛在語義分析(LSA)的文本表示與用戶內(nèi)容向量化

      潛在語義分析(Latent Semantic Analysis,LSA)是一種文本降維和分布式語義表示方法[32]。一般的向量空間模型(Vector Space Model,VSM)高維、稀疏的文本表示方法不同的是,LSA利用在文本數(shù)據(jù)挖掘中廣泛應用的奇異值分解(Singular Value Decomposition,SVD)技術,將文檔的高維詞頻表示投影到低維的潛在語義空間中,通??梢园褦?shù)萬、數(shù)十萬以上的高維、稀疏表示降到數(shù)千、數(shù)百的低維表示,而且這種低維向量反映著詞匯在語義上的內(nèi)在聯(lián)系。其中,對于文檔-詞項的矩陣X進行奇異值分解可得:X=TΣDT。LSA通過奇異值分解,保留前k個最大奇異值,通過降維后的k個潛在語義主題以代替、表示原有全部詞項的信息;也即,通過TkΣkDkT來近似地表示原文檔-詞項構成的矩陣X。

      本研究對每個微博用戶,其所有樣本帖{x1,x2,x3,…,xn}拼接為一個長文檔,每個用戶之間是有其區(qū)分度的。7 825 個用戶共得到 7 825 個長文檔,并通過向量空間模型將其轉換為一個詞頻矩陣X,其中剔除出現(xiàn)頻次少于30的詞,降低噪音的干擾,也保留更為主要和有價值的信息。并對這個矩陣X通過LSA算法降為7 825×500 的矩陣。LSA 降維工具采用 sklearn 中的 TruncatedSVD 模塊。選擇降到 500維,是通過實驗顯示500 維處于一個誤差的“拐點”,再增加維數(shù)對于保留原始信息已大幅放緩(如圖3所示);而且降到 500 維時已達到 0.90 的解釋方差比(explained_variance_ratio_,降維后各維數(shù)的方差值占總方差值的比例,最大值為1),對于原始信息已有足夠充分的保留和反映,如表2所示。

      圖3 潛在語義分析(LSA)降到不同維數(shù)時的解釋比變化情況

      表2 LSA降到不同維數(shù)時的解釋比

      (四)用戶內(nèi)容相似度計算

      對用戶的內(nèi)容相似度計算,選擇在文本挖掘、語句相似度計算及自然語言處理中比歐氏距離更常用、也具有高度穩(wěn)健性的余弦相似度。將用戶的諸條帖子拼接為一條文檔,并通過LSA的降維、轉換后,將這個文檔轉為一個低維度向量。

      任意兩個用戶m和n之間的內(nèi)容相似度表示為R(m,n)。其中R(m,n)的計算方法為:將這兩個用戶m、n分別轉換得到兩個向量A、B之后,余弦相似度也即兩個向量A、B之間夾角的余弦cos(θ)

      該值范圍在[-1,1],值越大表明這兩個用戶之間內(nèi)容越相似。

      在上述R(m,n)的基礎上,任意一組用戶G1(包含n1個用戶)和另一組用戶G2(包含n2個用戶)的內(nèi)容相似度表示為

      式(2)是在式(1)的基礎上,采用衡量兩組對象間的平均距離、平均相似度所常用的“類平均法”(或稱“簇平均法”,Average Group Linkage)而得到。其中G1或G2都可以有且僅有一個用戶,這種情況下也即:式(1)中所計算的個體與個體之間的兩兩相似度成為式(2)中n1和n2分別都為1時的特例。本研究中,由于用戶分層后的層內(nèi)人數(shù)通常不為1個,所以文中被直接應用的還是式(2)。

      H(G1,G2)的值越大,表明兩組用戶之間兩兩的趨近、類同乃至重復程度越高;若兩組用戶的異質(zhì)化內(nèi)容越大,則平均相似度就會越低,也即H(G1,G2)的值越小。

      將全體用戶樣本按照使用程度的高度分層后,任意一個用戶層級Gi的不同的“趨同化”程度,計算方法如下:

      1.全局趨同化程度。Gi與全體用戶G的平均相似度為

      2.趨頂趨同化程度。Gi與頂部層級用戶Gmax的平均相似度為

      3.近鄰趨同化程度。Gi與高一層級的用戶Gi+1的、低一層級的用戶Gi-1,其相似度的平均值為

      4.層內(nèi)趨同化程度。Gi內(nèi)部的本層級用戶之間的平均相似度為

      (五)可操作化的假設

      根據(jù)前文提出的問題以及研究設計、整體研究路線,將問題(Q1,Q2,Q3)轉換為如下可操作化的假設:

      設新浪微博的用戶樣本集合(N=7 825)為G,G中的每個用戶Ui將其全部樣帖聚合為一條文本Ti,通過文檔-詞項矩陣、潛在語義分析(LSA)方法,得到每個用戶內(nèi)容經(jīng)降維、提取主要信息后的文本特征向量Vi。按照用戶對于微博媒介使用度(媒介接觸/使用活性/使用效果中的一個子指標)的高低程度,將全體用戶G等頻劃分為m個具有相同或相近使用度的不同用戶層級{G1,G2,G3,…,Gm}。并結合式(2)及其推演得到式(3)~式(6),計算各個用戶層級與其他用戶層級或全體用戶的平均相似度,轉換后的假設如表3所示。

      表3 研究假設及其操作化的表述

      將表3 中 H1、H2 的計算過程,在五種使用度子指標下分別計算一遍,即可以分析H1、H2 在這不同使用度指標下是否都成立。

      三、實證分析

      (一)微博媒介使用度與四種相似度的相關系數(shù)分析

      將 7 825 個用戶,按照其使用度等級的高低不同,將等使用度或相近使用度的用戶劃分到一個“用戶層級”中,等頻切分為30層。對假設H1.1、H1.2、H1.3、H1.4分別在5種媒介使用度指標下檢驗:對每一層的用戶,取其使用度的平均值作為該層用戶的使用度“質(zhì)心”,再計算質(zhì)心和該層用戶的趨同化相似度之間的皮爾遜相關系數(shù)。例如,計算“微博用戶經(jīng)驗值”是否和用戶的全局相似度有相關性,是對30層用戶每層得到其經(jīng)驗值的均值作為該層質(zhì)心,得到數(shù)組A=[a1,a2,a3,…,a30];30層用戶每層同樣能計算得到該層和全體用戶的“全局相似度”,得到順序相對應的數(shù)組B=[b1,b2,b3,…,b30],然后對A、B求皮爾遜相關系數(shù),結果為0.906(表中第2列第3行)。其他的變量也都依次類推。得到相關系數(shù),如表4所示。

      表4 用戶的微博使用度和趨同化程度的皮爾遜相關系數(shù)表

      在新浪微博中注冊時長越久、“浸泡”越久的“老”用戶,他們和以下4種用戶的相似度、趨同度就越高:(1)和全局用戶相似;(2)和注冊時長最久的最頂一層用戶相似;(3)和相鄰正負一個層級的用戶相似;(4)和具有相同或相近注冊時長的本層用戶相似。根據(jù)皮爾遜相關系數(shù),注冊時長指標和全局相似度的正相關系數(shù)高達0.925,已經(jīng)幾乎是直線增長。和其他幾種相似度的正相關系數(shù)也都達到了0.714以上不等。

      隨著用戶使用微博的經(jīng)驗值日益提升,它們是不是也會表現(xiàn)出相應的四種相似度增加呢?皮爾遜相關系數(shù)分析顯示,用戶經(jīng)驗值和4種相似度全部呈正相關,相關系數(shù)最低也達到了0.877(層內(nèi)相似度),其他三種相似度全部高達0.9以上,P值全部都小于0.001。這在社會科學研究中是比較突出的正相關。

      新浪微博用戶越是主動關注他人、顯現(xiàn)出在社交媒體中的互動性和活性,是否就越是表現(xiàn)出更高的“趨同”度呢?結果是肯定的且是非常鮮明的。關注他人數(shù)和4種相似度,皮爾遜相關系數(shù)全部顯著,而且均在0.915以上。

      發(fā)帖平均熱度越高的用戶層級,他們的趨頂相似度、近鄰相似度、層內(nèi)相似度就都顯著地越高,而全局相似度的增加不明顯。

      粉絲數(shù)越高的用戶層,盡管在全局相似度方面的增加不顯著,但是在剩下的幾個指標中全部顯著,甚至和趨頂相似度的皮爾遜相關系數(shù)高達0.959。

      之所以發(fā)帖熱度、粉絲數(shù)與全局相似度的相關系數(shù)不夠顯著,推測是由于過于“隨大流”、與全局用戶過于相似的用戶,難以得到很高的粉絲量和帖子傳播效果。但是即使這兩個微觀條件下不符合,也必須看到:其一,這兩個指標下的其他三種趨同化依然是顯著的,部分甚至是很高的相關;其二,至少這兩個不顯著相關系數(shù)未表現(xiàn)為負的相關系數(shù),也即用戶不會因為要達到高粉絲量、高帖子傳播效果而保持一種“特立獨行”的反趨同化。

      總體而言,用戶的使用度變量(5種)和趨同化程度變量(4種)之間具有正相關性,5×4=20組的相關系數(shù)分析中有18組(90%)的皮爾遜相關系數(shù)顯著,而且這些顯著的相關系數(shù)平均值達到+0.78,有9組相關系數(shù)達到了+0.9以上的高度正相關。

      (二)不同的趨同化程度是否具有一致性

      根據(jù)上文的分析,在根據(jù)5種微博使用度指標的切分中,用戶在絕大多數(shù)情況下,隨著微博使用程度的提升而表現(xiàn)出對總體用戶、頂部用戶、近鄰用戶和本層級用戶的趨同程度增加。相關聯(lián)的問題是:用戶的4種“趨同化”作用,是各自獨立、互不相關的;亦或相互制約和掣肘的;還是統(tǒng)一、同步的作用?

      為了考察4種不同的“趨同化”路徑和方向之間是否具有內(nèi)部一致性,采用Cronbach’s α 系數(shù)進行考察。盡管學術界對于Cronbach’s α 系數(shù)能否很好地反映量表的內(nèi)部一致性還存在一些不同看法,但是該方法在當前仍是普遍使用的簡單有效方法之一。Cronbach’s α 值如果達到0.6以上是通??山邮艿慕Y果,達到0.8或0.9以上是很理想的值。

      在5種分層指標下,分別對用戶等頻分層為30個“用戶層級”,每個層級分別都能計算出4種趨同化的程度,也即能得到30行×4列的數(shù)據(jù)表。對這4列變量計算Cronbach’s α系數(shù),最終結果如表5所示。

      表5 趨同化程度之間的一致性分析

      無論按照哪種“使用度”作為依據(jù),不同等級用戶所朝向的全局趨同化、頂部趨同化、鄰近趨同化、層內(nèi)趨同化這四種“趨同化”的路徑是一致、同步的,不存在“此消彼長”或“互不相干”等情況。5種使用度指標下,即使按照“帖子平均熱度”這個最不理想的情況,4種趨同化程度的 Cronbach’sα系數(shù)也達到了0.807,而在注冊時長、微博經(jīng)驗值、關注他人數(shù)這三種指標下,Cronbach’sα系數(shù)甚至到0.967乃至0.974的高值。不同的趨同化路徑與方向盡管“殊途”,但卻顯現(xiàn)出“同向”和“同步”。

      四、結語

      社交媒體的使用本身作為一個直接變量,會不會帶來用戶在內(nèi)容生產(chǎn)、表達上的趨同化?又是帶來怎樣的趨同化?總體來看,假設H1中,除了媒介使用效果的兩個指標(帖子平均熱度、粉絲量)條件下用戶沒有表現(xiàn)出顯著的“全局趨同化”,在剩下其他的情況下,5種使用度和4種趨同度之間的相關系數(shù)全部顯著,而且絕大多數(shù)相關系數(shù)值是0.8乃至0.9以上的高值。用戶的內(nèi)容生產(chǎn)在微博中“越使用、越趨同”的現(xiàn)象,是存在并且是顯著的。這種“趨同化”,并非簡單地意指個體之間發(fā)生內(nèi)容同質(zhì)化傳遞,亦或只是某個群體范圍內(nèi)的“回音室”效應、信息的“選擇性接觸”。它包括具有統(tǒng)計顯著性的路徑與方向:和全體用戶越來越相似,和最高使用度的“頂部用戶”越來越相似,和使用度相近的鄰近“社會層級”越來越相似,同使用度“社會層級”內(nèi)的用戶彼此之間越來越相似。

      實證數(shù)據(jù)表明,這幾種不同的趨同化,同時都是成立的。在微博中上述4種趨同化路徑的基礎上,本研究首次明確指出,這4種看似差異很大的趨同化向度,不是“此消彼長”“南轅北轍”等負相關或不相關關系,而是在實證分析中,表現(xiàn)出高度統(tǒng)一的同步性和一致性。與此相關的假設H2得到了很理想的證實和支持。在5種使用度指標下,其 Cronbach’sα系數(shù)無一例外都處于高位值,分別在0.807~0.974之間,大大高于通常的0.6以上的可接受閾值范圍。4種趨同化程度兩兩之間相關系數(shù)全部顯著。這也打消了容易產(chǎn)生的一些疑慮:一種是擔心這幾種趨同路向可能只是部分成立、甚至可能全部不成立,但是事實顯示,用戶比預想的更容易消解內(nèi)容上的“特立獨行”色彩,并且“迷失自我個性”的方式豐富而有效;二是認為這些趨同化的方向和標的由于存在著明顯差異,所以擔心會帶來趨同作用效果的割裂和“相沖相克”,但是事實顯示看似區(qū)別很大的趨同化“殊途”卻是同步的。微博系統(tǒng)在用戶的媒介使用中,如同一個“媒介工業(yè)”或“媒介機器流水線”,生產(chǎn)著符合??乱饬x上的話語“規(guī)訓”的單元體。

      當前關于中觀、微觀的好友信息同質(zhì)性、網(wǎng)絡“回音室”“巴爾干化”、群體意見極化等的研究中,全局相似度問題得到的重視不足。但是它卻指向全局意義上的“微博機器”或“社交媒體文化工業(yè)”塑造“標準化”、重復化的“人”的可能性以及現(xiàn)實性。阿爾都塞曾提出著名的“意識形態(tài)國家機器”(Ideological State Apparatuses,ISAs)[33]320-375的概念,意指傳媒、文化等方面對于國家、社會系統(tǒng)的維系和對于“主體性”(subjectivity)的再生產(chǎn)。媒介中或許不僅發(fā)生著波茲曼所謂的“童年的消逝”[34]162-301,也可能發(fā)生著“成年的消逝”和用戶“主體性”的標準化再生產(chǎn)。

      趨頂相似度同樣也是一個重視不夠的維度:在微博中的注意力主要集中在高粉絲量、發(fā)文高熱度的“頭部用戶”,例如粉絲過百萬、千萬或被評論、點贊達“100 000+”的用戶。但是除了這些高度吸引聚光燈的“頭部用戶”,微博中還存在大量雖然未必有高粉絲量、高轉發(fā)量,但是卻具有高使用度、高使用活性的“頂部用戶”。實證結果發(fā)現(xiàn),這些“頂部用戶”和其他用戶的“趨頂相似化”是顯著的;五種使用度指標下,趨頂趨同化全部顯著,而且平均相關系數(shù)達到 0.872 (如表4所示)。趨頂趨同化的顯著程度和強度,超過了另外幾種趨同化的作用。在此意義下,高粉絲量“頭部用戶”可視作“頂部用戶”在使用效果指標下的特例,頂部用戶對微博生態(tài)中的用戶內(nèi)容整體面貌和趨同化的影響有待繼續(xù)思考。微博的高使用度“頂部用戶”或許不能直接發(fā)生擴散意見、吸引粉絲的效力,但是對于塑造微博中的用戶趨同化、消解“獨特用戶”具有高度重要的作用。在此需要針對理論和現(xiàn)實中重視度不夠的狀況,強調(diào)從“頭部用戶”到“頂部用戶”的理論視域擴展甚至明確的“理論自覺”。

      這些趨同化路徑的統(tǒng)一性,部分意義上是反經(jīng)驗直觀的。例如,趨于全局“蕓蕓眾生”的全局相似度,似乎和趨于精英化的“頂部用戶”的相似度本應難以具有高度正相關性,后者看起來更為“陽春白雪”和遠離“普羅大眾”。又比如,趨于身邊“近處”的鄰近層級的相似,和趨于“高遠處”頂部用戶的相似度,似乎本也不應是一個同步的變化過程,它們發(fā)生“相似化”的標的是完全不同的。再比如,層級內(nèi)部的彼此可以變得越來越相似,但是這并不意味著他們同時也和全體用戶也變得越來越相似,有時甚至截然相反。然而,實證結果和經(jīng)驗直觀并不符合。這留待繼續(xù)思考,不同的趨同化力量和變化軌跡之間,為何以及如何具有這種高度的一致性?本研究的初步猜想是:用戶趨向于頂部用戶的趨同化有可能是一個基本作用力,在趨于“頂部典范”的共同標的過程中,不同用戶越來越共同朝這個目標前進;盡管前進的程度有強有弱、有遠有近,但是共同“范本”的存在使得全局用戶增強“全局相似度”;而相同或相近使用度層級的用戶由于前進的程度相近,所以帶來“近鄰相似度”和“層內(nèi)相似度”增強。但這些推測,有待繼續(xù)分析。

      猜你喜歡
      趨同化全局層級
      高校來華留學生趨同化管理問題與對策
      Cahn-Hilliard-Brinkman系統(tǒng)的全局吸引子
      量子Navier-Stokes方程弱解的全局存在性
      軍工企業(yè)不同層級知識管理研究實踐
      基于軍事力量層級劃分的軍力對比評估
      落子山東,意在全局
      金橋(2018年4期)2018-09-26 02:24:54
      制度環(huán)境視角下高?;饡呁绊懷芯?/a>
      任務期內(nèi)多層級不完全修復件的可用度評估
      趨同是否正在發(fā)生?——歐盟公司治理趨同化研究
      東南法學(2015年2期)2015-06-05 12:21:35
      新思路:牽一發(fā)動全局
      历史| 东乡族自治县| 乐至县| 茌平县| 乌拉特中旗| 丹寨县| 宁陕县| 行唐县| 资溪县| 石首市| 茂名市| 水城县| 新龙县| 乐业县| 鄢陵县| 罗山县| 濮阳县| 界首市| 姜堰市| 平和县| 永定县| 交口县| 临江市| 瑞昌市| 凉城县| 中西区| 兴安县| 松阳县| 承德县| 遵义市| 印江| 郧西县| 甘洛县| 平乡县| 威远县| 清徐县| 梧州市| 当雄县| 霸州市| 泰宁县| 仪陇县|