肖蒙蒙
(鄭州大學,鄭州 450001)
互聯(lián)網(wǎng)發(fā)展迅速,互聯(lián)網(wǎng)上每個頁面都包含著各種各樣的信息,頁面與頁面之間的鏈接關系更是包含了大量的、潛在的信息。鏈接是網(wǎng)絡的顯著特征,網(wǎng)站、網(wǎng)頁以及網(wǎng)頁上的任何信息都可以通過網(wǎng)絡鏈接的方式與其他相關信息聯(lián)系起來,是實現(xiàn)Web2.0平臺上知識交流的重要方式和手段[1]。鏈接分析,即鏈接分析法,或稱網(wǎng)絡鏈接分析或超鏈分析,是以鏈接解析工具、統(tǒng)計分析軟件等為工具,對鏈接數(shù)量、類型、鏈接集中與離散規(guī)律、共鏈現(xiàn)象等的分析,用于 Web網(wǎng)絡中的信息挖掘及質(zhì)量評價的一種方法[2]。
社會網(wǎng)絡分析是用于描述和測量行動者之間關系或通過這些關系流動的各種有形或無形東西(如信息、資源等)的一種方法。社會網(wǎng)絡研究的是節(jié)點以及節(jié)點之間各種各樣的關系。從1996年開始,產(chǎn)生了很多社會網(wǎng)絡分析在Web上的應用例子,通過鏈接簇或者核心節(jié)點標明網(wǎng)絡中的核心資源。近幾年,國內(nèi)圖情領域的學者運用社會網(wǎng)絡分析方法研究博客、微博、企業(yè)以及網(wǎng)站之間的鏈接網(wǎng)絡,來分析鏈接網(wǎng)絡的結構特征,研究網(wǎng)絡環(huán)境下的知識交流網(wǎng)絡以及評價網(wǎng)站的競爭力、影響力等。在這些研究中,學者們用SNA測度對鏈接網(wǎng)絡的整體網(wǎng)絡結構特征、節(jié)點特征以及子網(wǎng)絡結構特征等進行分析,從而對鏈接網(wǎng)絡的結構,網(wǎng)站的地位與作用以及信息交流的規(guī)律與特征等有了更加全面和清晰的認識。本文從網(wǎng)絡整體結構、節(jié)點結構以及子網(wǎng)絡結構三個方面對SNA測度在鏈接分析領域的應用進行歸納和總結,以期對SNA測度在鏈接分析領域的應用有更加整體、全面的認識。
筆者對CNKI和萬方數(shù)據(jù)庫中圖情領域的文章進行主題為“社會網(wǎng)絡分析”并含“鏈接分析”的檢索,截止到2017年,共得到文獻46篇。本文將對這46篇文獻進行內(nèi)容分析,總結社會網(wǎng)絡分析方法的測度在鏈接分析領域的應用。
本文通過對檢索到的46篇文獻進行內(nèi)容分析,并進行歸納總結,將SNA測度在鏈接分析中的應用分為:整體網(wǎng)絡結構、節(jié)點結構以及子網(wǎng)絡結構這三個方面。以下筆者將這三個方面詳細展開,進行分析。
整體網(wǎng)絡分析主要是分析整體網(wǎng)絡的規(guī)模、緊密型、凝聚性、信息傳輸性能和效率以及網(wǎng)絡的集中趨勢等特征。
①密度。密度是網(wǎng)絡中的現(xiàn)有連線數(shù)量和一切可能連線數(shù)量的比值,它用來揭示整個網(wǎng)絡節(jié)點之間聯(lián)系的緊密性,反映整個網(wǎng)絡的凝聚力水平。②直徑、聚類系數(shù)和平均路徑長度。直徑是網(wǎng)絡中全部節(jié)點間最長的最短路徑長度。聚類系數(shù)是與某個節(jié)點相連接的鄰點之間的連線數(shù)和這些節(jié)點間能連出的最大邊數(shù)的比值。平均路徑長度是網(wǎng)絡中存在的路徑相連接的全部節(jié)點對之間的平均最短距離。這三個指標考察了網(wǎng)絡的連通情況以及信息在網(wǎng)絡中傳遞的效率與性能。③距離與凝聚力指數(shù)。距離是點與點之間構成的最短路徑的長度。凝聚力指數(shù)是依賴于“距離”而計算得出的,取值在0~1之間。距離和凝聚力指數(shù)都可以表明整體網(wǎng)絡的凝聚力。④中心勢。中心性有兩種指標:中心勢和中心度。中心勢是整個網(wǎng)絡的內(nèi)聚性圍繞一些特定的點而聚集起來的程度,它描述了網(wǎng)絡的整體集中趨勢。中心勢有三類:點度中心勢可以分析網(wǎng)絡的向心性和集中趨勢;中間中心勢可以看出一個網(wǎng)絡中的資源被某些節(jié)點控制的程度;接近中心勢能衡量整體網(wǎng)中節(jié)點獨立性的集中趨勢。
對鏈接網(wǎng)絡進行整體性的結構分析,可以了解企業(yè)間、網(wǎng)群中、微博或博客用戶間形成的鏈接網(wǎng)絡的整體狀況,分析節(jié)點在網(wǎng)絡中的聯(lián)系是否緊密,信息是否能高效、通暢的在網(wǎng)絡中傳遞,以及網(wǎng)絡中節(jié)點的整體趨勢。整體網(wǎng)絡結構分析就是為了對現(xiàn)實中存在的企業(yè)間、網(wǎng)群中、微博或博客用戶間的社會關系進行客觀的展示和說明。
節(jié)點分析可以從個體角度分析單個節(jié)點在網(wǎng)絡中所處的位置、地位和角色。包括中心度、結構洞和核心-邊緣分析。
①中心度。中心度可以分析網(wǎng)絡節(jié)點所處的位置,是個體權利的量化指標。中心度有三種:點度中心度是與一個節(jié)點直接鏈接的所有節(jié)點的數(shù)量,值越大,該節(jié)點在網(wǎng)絡中的影響力就越大。中間中心度是一個節(jié)點位于網(wǎng)絡中其余節(jié)點之間的程度,可以衡量該節(jié)點對網(wǎng)絡中資源的控制程度以及對其他節(jié)點間聯(lián)系的影響力。接近中心度是一個節(jié)點不受控制的程度,即該節(jié)點的獨立性。②結構洞。結構洞,即社會網(wǎng)絡中的一些個體無直接聯(lián)系或關系間斷的現(xiàn)象,從網(wǎng)絡整體看好像網(wǎng)絡結構中出現(xiàn)了洞穴,在結構洞中,將無直接聯(lián)系的兩者連接起來的第三者擁有信息優(yōu)勢和控制優(yōu)勢。所以,處于結構洞中第三者位置的節(jié)點具有更多的社會資本和資源優(yōu)勢。③核心-邊緣。核心-邊緣結構是由若干元素相互聯(lián)系構成的一種中心緊密相連、外圍稀疏分散的特殊結構。它可以分析網(wǎng)絡中處于核心位置和邊緣位置的節(jié)點。
對鏈接網(wǎng)絡中的單個節(jié)點做分析,可以找出企業(yè)間、網(wǎng)群中、微博或博客用戶間核心的、影響力大的企業(yè)、網(wǎng)站和用戶,發(fā)揮他們的積極作用;也可以分析哪些企業(yè)、網(wǎng)站或用戶對整個網(wǎng)絡中的資源、節(jié)點之間的聯(lián)系有較大的控制力,要對它們進行積極的引導,促進網(wǎng)絡中的信息、知識的流動和共享;對于邊緣位置的企業(yè)、網(wǎng)站或用戶,要鼓勵它們積極的和網(wǎng)絡中的其他節(jié)點進行溝通和聯(lián)系,提高自身的地位,獲取網(wǎng)絡中的信息,促進自身發(fā)展。
凝聚子群是滿足如下條件的一個行動者子集合,即在此集合中的行動者之間具有相對較強的、直接的、緊密的、經(jīng)常的或積極的關系。在鏈接分析中的應用主要集中于凝聚子群密度分析、成分分析、派系分析、k-核分析和k-叢分析。
凝聚子群的密度可以分析網(wǎng)絡中的小團體,如果小團體現(xiàn)象嚴重,會影響整個網(wǎng)絡的信息溝通,不利于管理。成分分析、派系分析、k-核分析和k-叢分析都是將整體網(wǎng)絡劃分為多個小團體,只是它們的劃分依據(jù)不同。成分分析是根據(jù)子群內(nèi)外節(jié)點關系的緊密度將網(wǎng)絡劃分為成分;派系是網(wǎng)絡中最大的完備子圖;k-核與k-叢都是建立在點度數(shù)基礎上的凝聚子群,k-叢要求各個點都至少與除了k個點之外的其他點相連,而k-核要求任何點至少與k個節(jié)點相連。
通過對企業(yè)間、網(wǎng)站間、微博或博客用戶間的鏈接關系做凝聚子群分析,可以看出企業(yè)之間、網(wǎng)站之間或微博、博客用戶之間的派系林立的情況,找出核心團體、中介團體,進而分析整個企業(yè)群、網(wǎng)站群、用戶群對核心團體的依賴程度;除此之外也可以揭示團體內(nèi)、外部的信息交流傳播模式,進而可以為發(fā)揮核心團體的引導作用,改善整個網(wǎng)絡的信息交流效率而做出努力,從而提高企業(yè)、網(wǎng)站的競爭力,促進企業(yè)、網(wǎng)站或用戶間的信息交流和傳播。
本文對社會網(wǎng)絡分析方法在鏈接關系網(wǎng)絡中的應用進行了歸納和總結,從整體網(wǎng)絡結構、節(jié)點結構以及子網(wǎng)絡結構三個方面詳細分析了SNA測度在鏈接網(wǎng)絡分析中的作用,并對這些分析的現(xiàn)實意義做了闡述。社會網(wǎng)絡分析方法是鏈接網(wǎng)絡分析的重要方法之一,但是隨著信息多樣化、網(wǎng)絡復雜化的趨勢越來越明顯,SNA不能很好地適用于新的研究問題,如何在鏈接分析領域引入新的分析方法,對其進行更深入、有效的分析,是一個值得思考的問題。