• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于復雜網絡的開源軟件社區(qū)的結構異質性*

      2013-08-16 07:58:46楊建梅曾進群張建功
      關鍵詞:冪律生產者異質性

      楊建梅 曾進群 張建功

      (1.華南理工大學 工商管理學院,廣東 廣州 510640;2.華南理工大學 環(huán)境與能源學院,廣東 廣州 510006)

      《科學》雜志近期發(fā)表了知識團隊生產的相關研究成果[1],而物理學界從本世紀初開始就一直重視科學家的合作結構與功能的研究[2].開源軟件社區(qū)就是一種網絡上的基于團隊合作的知識生產組織,但是對開源社區(qū)的研究才剛剛起步[3].按照筆者的定義[4-5],這種社區(qū)是一個人類活動系統,其結構不再是層級部門的結構,而是由其基本活動形成的活動結構.在這種思想的指導下,文中的社區(qū)組織結構包含以下3 種類型:人員參與項目開發(fā)活動而形成的生產結構,伴隨生產活動的與bug 有關的質量保障活動結構,以及搜集對軟件產品需求及其他信息的溝通活動結構.生產、質量保障與了解需求的活動,是非商業(yè)的、開放的大眾生產社區(qū)的最為重要的活動,從這3 個維度可以揭示出這種組織結構的特點.

      1 異質性探討

      近年來異質性一詞頻頻在文獻中出現,但是較多的是口語化采用,即使是專業(yè)性采用,也往往局限在各自學科的語境下,對何為異質性、異質性分類以及如何測量異質性鮮有一般性的簡明闡述.在復雜網絡學界,有的人認為冪率分布指數的絕對值大時異質性強,有的人卻有完全相反的看法.下面先給出筆者對異質性的一些思考.

      1.1 帕累托世界

      長期以來,人們認為我們生活的世界僅僅是高斯正態(tài)分布的世界.在高斯世界,事件之間具有加法獨立性.這些事件的數據點產生的鐘形分布曲線由均值與方差就可以完全描述.因為其數據點以99.7%的概率落在均值加減3 倍標準差的范圍內,而標準正態(tài)分布的期望為0,標準差僅為1,所以可以認為在高斯世界,事件的屬性是同質的,就像人的身高那樣,存在一個典型的高度,也就是說具有代表性的尺度.

      1897年意大利經濟學家帕累托研究個人收入時,發(fā)現20%的人口占據了80%的社會財富的所謂帕累托分布.帕累托分布完全不同于正態(tài)分布,由于研究對象的數據極不均勻,其均值和方差失去意義,這樣在個人收入中就不存在一個財富值可以作為個人財富的代表尺度.帕累托分布不僅存在于經濟領域,還廣泛地存在于其他領域,因此我們生活的世界不僅有高斯世界,還包括異質的無代表性尺度的帕累托世界,在今天的互聯網與大數據時代尤其如此.

      1.2 異質性含義與分類

      異質性來源于帕累托分布,受帕累托分布以及各種專業(yè)文獻的啟發(fā),文中認為異質性具有多樣性與非均勻性兩方面的含義.這里的多樣性指的是對象的某個指標的取值范圍廣因而差異大,非均勻性指的是各種取值出現的頻率具有較大的差異.這樣,對象的某種指標僅取值的范圍廣還不能說具有異質性,因為它可能是均勻分布的;同樣,僅取值的頻率有較大差異,也不能說具有異質性,因為它的取值范圍可能很窄.因此,對于一個研究對象來說,只有當其某種指標的取值范圍廣,而且其分布也不均勻時,才能稱得上在某方面具有異質性.簡言之,異質性等于多樣性加非均勻性.

      互聯網時代造就了更多的連接關系.統計物理學家巴拉巴斯發(fā)現,由實際連接關系形成的大規(guī)模網絡,不像隨機網絡那樣,節(jié)點具有大致相同的連接,而是少數節(jié)點具有大量的連接、大量的節(jié)點僅具有少數的連接[6].這樣,節(jié)點之間連接關系的多寡就具有了異質性.基于巴拉巴斯的發(fā)現,筆者將異質性分為兩類:屬性異質性與關系異質性.比反映財富屬性異質性的帕累托分布大約晚100年的巴拉巴斯的無尺度復雜網絡模型,為分析關系的異質性提供了工具.

      1.3 基本測量方法

      對象屬性的異質性可直接用帕累托分布來測量.在帕累托分布中X 是隨機變量,對X 的累積分布函數,復雜網絡學界常用以下形式:

      概率密度函數

      式中,x 為任何一個大于xmin的數,xmin為X 最小的可能值(正數),k 為正的參數.圖1 所示的累積分布的示意圖摘自維基百科,這里畫的是常見的累積分布表達式F(x)=P(X≤x)的曲線.帕累托分布屬于冪律分布,冪律分布在雙對數坐標下是一條斜率為負數的直線,因此屬性的異質性可通過累積分布圖,尤其是雙對數坐標下的累積分布圖是否是長尾的冪律分布來確定.由圖1 可以看出:k 越小分布越均勻,但取值的范圍廣、差異大;k 越大分布越不均勻,但取值的范圍窄、差異小.兼顧多樣性(取值有數量級的差別)與非均勻性兩個條件,并考慮復雜網絡有關度分布冪指數的研究,這里用k 是否在1~3 之間來判斷異質性(概率密度的冪指數比k 大1,若用概率密度指數,則是在2~4 之間),這意味著屬性的冪律分布并不總是表示其存在著異質性.

      圖1 帕累托累積分布示意圖[7]Fig.1 Pareto cumulative distribution function[7]

      與屬性不同,在測量大規(guī)模活動關系的異質性時,首先要確定關系是什么,并建立描述此關系的復雜網絡模型[8-11],在找到復雜網絡的相關特征參數后,再使用分析屬性變量異質性的方法去分析這些特征參數,以測量關系的異質性.

      下面以CodePlex 為例,分析開源軟件大眾生產社區(qū)結構的異質性.由于結構是關系的總合,因此用到的是關系的異質性測量方法,不同的關系可以從不同的角度來揭示結構的異質性.此外,在數據缺少時還可使用傳統的定性方法作為輔助分析手段.

      2 數據來源及說明

      CodePlex 是微軟建置的開源軟件社區(qū)(http:∥www.codeplex.com),2006年開始運作,截至2012年11月,社區(qū)共有32118 個項目,其中最活躍的有C#、Sharepoint 等子社區(qū),每個子社區(qū)的主頁都分8 個欄目記錄了所有數據.我們用火車頭軟件,挖掘了Codeplex C#子社區(qū)(下文簡稱社區(qū))從2006年5月至2012年7月間的下列數據:1)所有生產記錄,共計198616 條,包含項目2136 個,參與者3233 人;2)所有bug 討論記錄,共計6 萬多條;3)所有溝通記錄,共144342 條.社區(qū)組織的結構是由其基本活動形成的網絡結構,將參與者與項目看成節(jié)點,將活動形成的聯系看成邊,就得到了相關活動結構的復雜網絡模型.這里的靜態(tài)復雜網絡模型基于2006年5月至2012年7月的全部記錄,而動態(tài)網絡模型以半年為一期,基于2006年下半年到2012年上半年的記錄.由于篇幅所限,復雜網絡模型的大量數學計算在下文中將不予列出.

      3 生產結構的異質性

      從生產模式與網絡結構兩個方面來分析生產結構的異質性.

      3.1 生產模式的異質性—— 洞穴與網絡式并存

      (1)模型構建 為分析生產模式,首先建立了生產者與項目的二分布爾復雜網絡模型.網絡是點與邊的集合,將Codeplex C#社區(qū)的所有生產者定義為底部節(jié)點,所有項目定義為頂部節(jié)點,如果一個生產者在2006年5月至2012年7月之間開發(fā)過某個項目,那么就在他們之間連一條邊,這樣就得到了該社區(qū)的2006-2012年間的生產者與項目的二分布爾復雜網絡模型,簡稱2006-2012 二分布爾網絡.2006-2012 二分布爾網絡共有5 369 個節(jié)點,其中頂部節(jié)點2136 個、底部節(jié)點3233 個,3785 條邊.為動態(tài)分析生產結構,文中還按照同樣的思路,建立了從2006年下半年到2012年上半年、以半年為一期的、生產者與項目的二分布爾網絡序列模型.

      (2)分析思路 筆者認為,生產模式體現在生產者對項目的生產關系所形成的生產圈子中,而連通圖是生產圈子的數學描述,因此通過分析二分布爾網絡的連通圖來尋找開源社區(qū)的生產模式.

      (3)連通圖的發(fā)現 網絡中的連通圖是其內部任意節(jié)點對之間都有路徑相連的網絡子圖,網絡常常含有多個獨立的連通子圖.經計算,2006-2012二分布爾網絡共有1614 個連通圖,其中的1 039 個連通圖是由1 個項目與1 個生產者形成的(見圖2中的A 型);299 個是1 個項目與多個生產者節(jié)點形成的(見圖2 中的B 型),這樣含有1 個項目的連通圖共有1338 個;而130 個連通圖則是由多個項目節(jié)點形成的(見圖2 中的C 型),剩下的146 個連通圖是1 個生產者開發(fā)2 個及以上項目形成的(見圖2中的D 型).

      圖2 洞穴式與網絡式生產模式Fig.2 Cave and network-based pattern

      圖2 中A 型生產模式就像1 個人在挖1 個洞,B 型就像多個人在挖1 個洞,它們都僅含1 個項目“洞”,因此都可形象地稱為洞穴式生產模式[12];而C 型與D 型(尤其是C 型)與A、B 型截然不同,是多個項目的多“洞”網絡化生產模式,在網絡化模式中不同項目節(jié)點之所以能夠相連,是因為有人開發(fā)了2 個及以上的項目.2006-2012 二分網絡中,規(guī)模最大的C 型含有239 個節(jié)點,其中項目節(jié)點29個,生產者節(jié)點211 個.

      (4)結論 對2006-2012 二分布爾網絡連通圖的分析說明,開源大眾生產模式是洞穴與網絡式并存的,1614 個生產圈子中有82.9%(1388/1614)的生產方式是洞穴式.進一步統計分析還顯示,2006-2012 二分布爾網絡1 614 個連通圖規(guī)模的累積分布,是k 為1.5 的冪律分布(可決系數R2=0.89),也就是說,大多數連通圖包含的節(jié)點很少,少數的連通圖包含的節(jié)點很多,而節(jié)點數很少的連通圖都是僅有1 個項目節(jié)點的洞穴式生產圈子,因此可以說,開源大眾生產模式是洞穴與網絡式共存,具有明顯的異質性,但是以洞穴式為主.

      時間序列的二分布爾網絡根據每半年實際發(fā)生的生產行為建立.從2006年7月到2012年6月,實際有開發(fā)行為的人數從140 人增加到828 人,涉及的項目數從81 個增加到566 個,但是在生產圈子中,網絡型占有的比例卻基本穩(wěn)定在10%~12%左右.網絡型的比例雖然不高,但是畢竟占有10%以上,因此支持了2006-2012 二分布爾網絡模型的分析結論(即開源大眾生產模式是洞穴式與網絡式并存,具有明顯的異質性).

      3.2 網絡結構的異質性

      3.2.1 二分網絡的異質性

      在2006-2012 生產者與項目的二分布爾網絡模型的基礎上,以生產者參與相應項目的累計次數作為相關邊的權重就得到生產者與項目的二分加權網絡模型.節(jié)點的邊權之和就是該節(jié)點的權重.二分網絡頂部節(jié)點度值表示項目的生產者人數,底部節(jié)點度值表示生產者參加的項目數.二分網絡頂部節(jié)點的權值表示項目被生產的次數,底部節(jié)點的權值表示生產者對所有項目的生產次數.圖3 顯示出二分網絡的度或權的累積分布與隨機網絡零模型有明顯不同,加權網絡與布爾網絡的累積權和度都呈現冪律分布,除底部節(jié)點的度之外,它們的取值都有數量級的差別,且k 大約在1~3 之間,因此可以說二分網絡的結構具有異質性.

      圖3 二分網絡節(jié)點度與權的累積分布Fig.3 Cumulative distribution of node degree and weight in bipartite network

      底部節(jié)點度表示生產者開發(fā)的項目的個數,由于人的能力的同質性,雖然仍是冪律分布,但按文中的標準就不具有異質性了.

      3.2.2 合作網絡的異質性

      3.2.1 節(jié)是從生產者與生產任務的關系來看生產結構,下面將從生產者之間的合作關系來看生產結構,這需要建立生產者合作關系的網絡模型.

      (1)模型構建 將2006-2012 生產者與項目的二分布爾網絡向底部生產者節(jié)點投影,就得到生產者的布爾合作網絡.布爾合作網絡節(jié)點間的連邊表示這對生產者至少共同開發(fā)過一個項目.進一步找出兩個生產者共同開發(fā)的每一個項目各自的生產次數,然后以較小的生產次數作為他們在這個項目上的合作強度,并以他們共同開發(fā)的所有項目的合作強度之和作為兩個生產者之間連邊的權重,這樣就得到生產者的加權合作網絡.

      (2)從權與度值看異質性 加權合作網絡的節(jié)點最大權值為5221,權值為0 的節(jié)點共有1185 個,占節(jié)點總數的36.7%,累積權值呈k 為0.85(R2=0.90)的冪律分布;而度呈分段冪律分布.以上說明,36.7%的節(jié)點的合作強度為0,而節(jié)點的最大合作強度為5221,因此從合作強度來看網絡近似具有異質性(圖4).

      圖4 合作網絡的累積度與權的分布Fig.4 Cumulative distribution of node degree and weight in cooperation network

      (3)從拓撲指標看異質性 布爾合作網絡反映了合作關系的結構.經計算3233 節(jié)點布爾合作網絡的介數呈現k 為0.36 的冪律分布(R2= 0.86),而緊密度值較集中,集聚系數大多分布在0 或1.點的介數表示通過該點的最短路的條數,介數的計算結果表示從中介位置來看網絡存在著多樣性但不具有非均勻性,因此布爾合作網絡從3 個拓撲指標來看都不具有異質性.

      (4)從連通圖看異質性 加權合作網絡共有3233 節(jié)點、25 188 條邊,其中1 185 個孤立點.除過孤立點外,共有429 個連通圖,最大連通圖有210 個節(jié)點,占非孤立點的比例為10.25%,6 632 條邊,這些連通圖所含節(jié)點的數量呈冪律分布,累積分布的k 為1.27(R2=0.95),因此從連通圖的規(guī)模來看網絡具有異質性.

      (5)從社團結構看異質性 從連通圖規(guī)??串愘|性,是從節(jié)點之間有無連接通路的角度來看的,而從社團結構看異質性,則進一步從連通圖內部連接關系的多寡與強弱來看.社團內部節(jié)點之間的聯系比社團之間節(jié)點的聯系既多又強.經分析發(fā)現,社團的實際背景就是項目的團隊.社團劃分有許多算法[13],最新算法是與隨機圖比較的Potts 算法[14].Potts 算法有0 階(保持平均度不變)與1 階(保持度序列不變)零模型算法.Q 值是衡量社團性強弱的指標,一般以Q=0.3 作為網絡具有明顯社團結構的最低標準.采用Potts 的1 階零模型算出布爾與加權合作網絡的最大連通圖分別有10 個與11 個社團,最大社團含有50 或51 個節(jié)點,而最小的社團僅有2 個節(jié)點,所以不同社團之間在規(guī)模上也存在著多樣性(如表1 所示).

      表1 合作網絡社團結構1)Table 1 Community structure in the cooperation network

      (6)從富人俱樂部看異質性 社會上富人和富人來往多的現象被稱為富人俱樂部現象,通常采用以下指標來判斷[15]:

      式中:r 表示財富,財富大于等于r 的富人為俱樂部成員;Wl,rank是邊權(交往強度),表示排序為第l 大的邊的權值,W>r是俱樂部內的邊權之和;E>r是俱樂部成員之間的邊數;φw(r)表示俱樂部內的邊權之和與整個網絡邊權從大到小排列的同樣邊數的邊權之和的比值.進一步以相應的隨機化網絡為比較對象就得到ρw(r),若ρw(r)大于1,則表明實際的加權網絡存在富人俱樂部現象.

      以節(jié)點權表示財富指標r,從圖5 可以看出,加權合作網絡存在著明顯的富人俱樂部現象,尤其是在r 大于2000 以后.這說明合作活躍的生產者主要是在彼此之間進行合作的,因此活躍者之間的合作強度與其他類型的合作強度之間存在著差異性.

      圖5 加權合作網絡的富人俱樂部系數Fig.5 Rich club coefficient curve of the weighted cooperative network

      開源軟件的生產必然伴隨著信息的流通,因此開源社區(qū)不僅是生產的平臺,也是信息溝通的平臺.Codeplex C#社區(qū)有兩個信息溝通的版塊:issues 欄目下的bug 討論版塊與discussions 欄目下的更一般的信息溝通版塊.

      4 bug 討論結構的異質性

      4.1 模型構建

      為分析bug 討論結構的異質性,首先需要建立bug 討論關系的復雜網絡模型.與生產、項目的二分關系不同,bug 帖子與討論人的二分關系主要是網絡模式,而且對于社區(qū)結構來說,帖子遠沒有項目重要,因此不需要建立帖子與討論人的二分網絡模型.這樣Bug 討論網絡以參與bug 討論的人為節(jié)點(刪除了僅提交了bug 但沒有人回應的人),在bug 的提交人與回復人之間建立有向邊,方向指向回復人,有向邊的權等于這種提交與回復關系的次數.按照上述規(guī)則,2006年5月至2012年7月整個時間段的bug 討論加權有向網絡共有5842 個節(jié)點、5741 條邊.

      4.2 從度與權值看異質性

      bug 討論有向加權網的節(jié)點的入度表示該節(jié)點回復過多少人所提出的bug,入權表示該節(jié)點回復過多少次別人所提出的bug;出度表示回復過該節(jié)點所提交的bug 的人數,出權表示回復過該節(jié)點提交的bug 的次數.一般來說,入度或入權越大,表示節(jié)點所解決的bug 越多;出度或出權越大,表明節(jié)點所提出的bug 越多.

      2006-2012年bug 討論有向加權網的5 842 個節(jié)點中,入度為0 的節(jié)點共有2 876 個,占總數的49.2%,最大的入度與入權值分別為49 與89;出度為0 的節(jié)點共有2377 個,占總數的40.6,最大的出度與出權值分別為117 與344.剔除這些出度或入度為0 的節(jié)點后,累積度和權的冪律分布如圖6 所示.從圖6 可見,節(jié)點的度或權的取值都有著數量級的差異,且出度與出權的k 在1~2 之間,入權的k為1.91,而入度的k 接近2,因此bug 討論結構從節(jié)點討論廣度(度)與強度(權)來看都具有異質性,不過節(jié)點的回復bug 的多樣性略小于提交的,與強度有關的異質性大于廣度.

      圖6 bug 討論有向加權網的累積度和權的分布Fig.6 Cumulative distribution of node degree and weight in directed and weighted bug discussion network

      4.3 從拓撲指標看異質性

      經計算5842 個節(jié)點的bug 討論網絡,其節(jié)點的介數呈冪律分布,累積分布的k 為0.48(R2=0.88);緊密度分布與布爾合作網絡的相似,而集聚系數與布爾合作網絡的雙峰不同,呈多峰分布,且多在0.5 以下.bug 討論網絡從介數來看具有多樣性,而從3 個拓撲指標來看都不具有異質性(如圖7所示).

      圖7 bug 討論網絡拓撲指標的直方圖Fig.7 Topology index histogram of bug discussion network

      4.4 從連通圖看異質性

      5842 個節(jié)點的bug 討論有向加權網絡共有860 個連通圖(有邊就算連通).最大連通圖有2 630 個節(jié)點,占總節(jié)點數的45%,規(guī)模最小的含2 個節(jié)點(不包括孤立節(jié)點),但連通圖的規(guī)模呈指數分布(指數為-0.00167,R2=0.81),說明從連通圖規(guī)模來看bug 討論網不具有異質性.另外,生產結構的二分網絡與加權合作網絡的最大連通圖的節(jié)點比例分別僅為4.45%與10.25%,可見生產結構有較大的碎片性,而bug 討論網絡的整體性較強,這進一步說明開源社區(qū)的bug 討論結構與生產結構之間也有差異:bug 討論的圈子大而生產合作的圈子小.這是由生產的專業(yè)性與信息溝通的廣泛性造成的.

      5 信息溝通結構的異質性

      5.1 模型構建

      為分析信息溝通結構的異質性,首先需要建立溝通關系的復雜網絡模型.文中不僅建立了2006年5月至2012年7月的整個時間段的溝通關系網絡模型,也建立了以半年為一期的時間序列溝通網絡模型,后者具體的時段劃分與生產者和項目的時間序列二分網絡一樣.模型中溝通者為節(jié)點,如果兩個溝通者討論過共同的主題,則它們之間就有一條邊,這樣得到的是無權的溝通網絡模型;進一步以討論次數代替生產次數,采用與加權合作網絡同樣的邊權生成方法,就得到加權的溝通網絡模型.2006-2012 時段的溝通關系網絡共有個26481 個節(jié)點(包括孤立節(jié)點)、467622 條邊.

      5.2 從度與權值看異質性

      溝通網絡節(jié)點的度表示溝通者溝通過的人數,26481 個節(jié)點2006-2012 溝通關系網絡的度呈冪律分布,累積分布的k 為1.52(R2=0.86)(見圖8).邊權表示兩人之間溝通的強度,節(jié)點權是邊權之和,代表了節(jié)點的總溝通強度.從時間序列溝通網絡分布的相關數據可知,各時段網絡的節(jié)點權也都呈現冪律分布,累積分布的k 值接近,從1.01~2.00(R2從0.92~0.97),且各有數量級的差別.權值最大的溝通者是項目的核心人員或者項目的發(fā)起人.以上說明,溝通網絡的節(jié)點在溝通的廣度與強度方面都存在異質性,核心成員與一般成員之間的差異最大.

      圖8 2006-2012 溝通網絡累積度分布圖Fig.8 Cumulative distribution of node degree in communication network in 2006-2012

      5.3 從拓撲指標看異質性

      26481 個節(jié)點2006-2012 溝通關系網絡的介數、緊密度與集聚系數的分布見圖9.介數呈冪律分布,累積分布的k 為0.39(R2=0.74),說明溝通網絡在中介位置方面存在多樣性.同樣,溝通網絡從這3 個拓撲指標來看不存在異質性.

      圖9 2006-2012 溝通網絡拓撲指標的直方圖Fig.9 Topology index histogram of communication network in 2006-2012

      5.4 從連通圖看異質性

      以2011年上半年為例,其溝通網絡共4 125 個節(jié)點、14690 條邊,經計算共分為833 個連通圖(包含孤立點),833 個連通圖中最大規(guī)模的含有2458 個節(jié)點,占總節(jié)點數的59.6%.規(guī)模最小的僅含1 個節(jié)點(但有577 個),連通圖節(jié)點個數呈冪律分布,累積分布的k 為0.94(R2=0.80).這說明溝通網絡從連通圖規(guī)模來看近似具有異質性.但與bug 討論網絡一樣,與生產網絡相比,信息溝通網絡的整體性也較強,這也是由生產的專業(yè)性與信息溝通的廣泛性造成的.

      5.5 從社團結構看異質性

      采用Potts 算法,得到每半年溝通網絡最大連通圖的社團分析結果,發(fā)現無權溝通網絡存在社團(Q大于0.3),但從各種零模型的Q 值在0.1 附近可知,與加權生產網絡不同,加權溝通網絡沒有社團,這說明生產與溝通的強度結構存在差異性.

      5.6 從富人俱樂部看異質性

      采用與加權生產網絡同樣的分析方法,發(fā)現加權溝通網絡也具有顯著的富人俱樂部現象.2008年下半年的分析結果如圖10 所示.圖10 說明活躍的溝通者主要是在彼此之間進行溝通,活躍者之間的溝通與其他類型的溝通之間存在著異質性.

      圖10 加權溝通網絡的富人俱樂部現象Fig.10 Rich club phenomenon in weighted communication network

      在對異質性進行思考的基礎上,建立了開源社區(qū)結構的復雜網絡模型,在對復雜網絡的參數進行分析中,找出可反映社區(qū)結構異質性的參數.以上結果匯集在表2 中.

      6 結語

      Codeplex C# 開源社區(qū)結構的異質性.首先,連通圖分析反映出,存在兩種性質不同的生產模式:洞穴式與網絡式,且生產的二分與合作網絡的連通圖規(guī)模都呈現出異質性與碎片性;bug 討論結構與溝通結構則不同,它們以網絡式為主且大多數成員都處于最大連通圖內,從而具有整體性;信息溝通連通圖的規(guī)模具有異質性,但bug 討論網絡的連通圖規(guī)模具有同質性,由此可見,從連通圖來看,生產結構的異質性最強,信息溝通結構次之.其次,3 種活動結構網絡的節(jié)點的權都有很好的冪律擬合且滿足異質性標準,因此從節(jié)點的各種強度來看社區(qū)都具有異質性,而bug 討論結構的節(jié)點強度最符合異質性的標準.度的冪律分布說明,社區(qū)從項目的參與人數、bug 發(fā)帖人數與回帖人數以及溝通的人數方面也具有異質性.再次,社區(qū)的各種結構的介數盡管存在多樣性,但是介數、緊密度與集聚系數這些重要的拓撲指標都不具有異質性.最后,加權合作網絡與加權溝通網絡都具有顯著的富人俱樂部現象;生產網絡、無權溝通網絡的最大連通圖存在著社團結構,這些也反映出社區(qū)結構的異質性.

      開源社區(qū)結構異質性復雜網絡分析的具體步驟如下:開源社區(qū)結構的異質性常常體現在復雜網絡模型的度、權等指標以及連通圖、社團結構與富人俱樂部等方面,所以在建立社區(qū)結構的復雜網絡模型后,先用生產者與項目的二分網絡連通圖去分析生產結構在生產模式方面的異質性,然后從度、權等指標的分布去探討其他各種網絡結構在節(jié)點關系的廣度、強度以及信息中介地位方面表現出的異質性,再從連通圖的規(guī)模以及最大連通圖內社團的規(guī)模,分別看關系有無以及關系的密切性反映出的結構異質性,最后用富人俱樂部方法從節(jié)點強度與成對關系的強度(邊權)來看結構的異質性.

      我們認為,有關Codeplex C#社區(qū)的結論對開源社區(qū)是否具有普遍意義還需要多個案例的驗證,但由此社區(qū)總結出的開源社區(qū)結構異質性的復雜網絡分析步驟卻具有普適性.

      文中用冪律分布來測量異質性,另一方面,物理學的自組織臨界態(tài)(復雜態(tài),相變態(tài))也是由冪律分布體現的,這樣通過冪律分布,異質性與物理學的自組織臨界性就聯系在一起了.我們認為這就是組織異質性研究的物理背景.另外,世界上,有的組織是他組織的,有的組織是自組織的,大眾生產社區(qū)是一種典型的自組織的組織.自組織的組織會自發(fā)地向臨界態(tài)(吸引子)進化,所以臨界性是自組織進化程度的判據,由此可知組織異質性研究的意義.

      [1]Wuchty S,Jones B F,Uzzi B.The increasing dominance of teams in production of knowledge[J].Science,2007,316(5827):1036-1039.

      [2]Newman M.Scientific collaboration networks network construction and fundamental results [J].Physical Review E,2001,64:016131.

      [3]Crowston K,Wei K,Howison J,et al.Free/libre open source software development:what we know and what we do not know[J].ACM Computing Surveys,2012,44(2):7-35.

      [4]楊建梅.組織的系統結構定義探討[J].系統工程學報,2002,17(5):441-444.Yang Jian-mei.Research on definition of system structure of organization[J].Journal of System Engineering,2002,17(5):441-444.

      [5]楊建梅.人類活動系統的復雜性[J].華南理工大學學報:社會科學版,2011,13(4):1-1.Yang Jian-mei.Complexity of human activity systems[J].Journal of South China University of Technology:Social Science Edition,2011,13 (4):1-1.

      [6]Barabasi A.Emergence of scaling in random networks[J].Science,1999,286(5439):509-512.

      [7]維基百科.Pareto distribution [EB/OL].http:∥zh.wikipedia.org/wiki/Pareto DistributionCDF.png.

      [8]方衛(wèi)東,李坤,張建功.香港恒生指數的波動性分析[J].華南理工大學學報:自然科學版,2008,36(12):138-141.Fang Wei-dong,Li Kun,Zhang Jian-gong.Analysis of fluctuation of Hong Kong Hang Seng index[J].Journal of South China University of Technology:Natural Science Edition,2008,36(12):138-141.

      [9]Yang Jianmei,Lu Lvping,Xie Wangdan,et al.On competitive relationship networks:a new method for industrial competition analysis[J].Physica A,2007,382(2):704-714.

      [10]Yang Jianmei,Wang Wenjie,Chen Guanrong.A two-level complex network model and its application[J].Physica A,2009,388(12):2435-2449.

      [11]Yang Jianmei,Yao Canzhong,Ma Weicheng,et al.A study of the spreading scheme for viral marketing based on a complex network model[J].Physica A,2010,389(4):859-870.

      [12]Krishnamurthy S.Cave or community an empirical exa-mination of 100 mature open source projects [J/OL].First Monday,2002,7(6).http:∥www.firstmonday.dk/issues/issue7_6/krishnamurthy

      [13]Lancichinetti A,Radicchi F,Ramasco J.Statistical significance of communities in networks[J].Physical Review E ,2010,81(4):046110.

      [14]Reichardt J,Bomholdt S.Detecting fuzzy community structures in complex networks with a Potts model[J].Phys Rev Lett,2004,93(21):218701.

      [15]Opsahl T,Colizza V.Prominence and control:the weighted rich-club effect[J].Phys Rev Lett,2008,101(6):168702.

      猜你喜歡
      冪律生產者異質性
      1月巴西生產者價格指數上漲3.92%
      基于可持續(xù)發(fā)展的異質性債務治理與制度完善
      2019德國IF設計大獎
      家禽福利的未來:生產者能期待什么?
      四川地區(qū)降水冪律指數研究
      一場大風帶給生產者的思考
      新農業(yè)(2016年17期)2016-08-16 12:02:38
      冪律流底泥的質量輸移和流場
      現代社區(qū)異質性的變遷與啟示
      對抗冪律
      1949年前譯本的民族性和異質性追考
      普宁市| 康马县| 改则县| 威远县| 班玛县| 陆丰市| 西畴县| 桦甸市| 大丰市| 炉霍县| 简阳市| 广德县| 运城市| 黄山市| 绥滨县| 玉山县| 根河市| 台中市| 大同县| 武邑县| 马尔康县| 涟水县| 来安县| 绍兴市| 新密市| 鹿泉市| 赤城县| 皋兰县| 凌源市| 子洲县| 岗巴县| 运城市| 隆昌县| 天峻县| 景泰县| 许昌县| 清徐县| 新河县| 岳池县| 固始县| 三亚市|