安沈昊,于榮歡
(航天工程大學 復雜電子系統(tǒng)仿真實驗室,北京 101400)
復雜網(wǎng)絡理論研究最早可追溯到18世紀由數(shù)學家歐拉提出的“七橋問題”,將陸地抽象為點,將連接陸地的橋梁抽象為邊,點與連接點的邊就組成了網(wǎng)絡.隨著復雜系統(tǒng)的快速發(fā)展,復雜網(wǎng)絡的分析方法被廣泛應用于社會、經(jīng)濟、軍事等領域,如在線社交網(wǎng)絡、國際貿(mào)易、現(xiàn)代化信息作戰(zhàn)系統(tǒng)等.
目前,復雜網(wǎng)絡各分支方向的研究已引起廣泛關注,國內(nèi)多名學者先后對復雜網(wǎng)絡的相關理論、研究和應用方向進行系統(tǒng)的整理和總結[1-6].朱涵等最早介紹了復雜網(wǎng)絡理論[7],何宇等從部件、權重、機制、動態(tài)變化及側重條件5 個方面整理其演化模型并分類[8],周濤等詳述大數(shù)據(jù)時代下復雜網(wǎng)絡亟需解決的十大問題[9].隨著復雜網(wǎng)絡理論研究的發(fā)展,有必要繼續(xù)對其理論進行歸納和整理,以推動進一步研究.
關于什么是復雜網(wǎng)絡,目前還沒有一個統(tǒng)一的定義.錢學森先生認為具有自組織、自相似、吸引子、小世界、無標度中部分或全部性質(zhì)的網(wǎng)絡可稱為復雜網(wǎng)絡.在研究網(wǎng)絡時,人們往往只關注節(jié)點之間是否存在連邊,忽視節(jié)點位置、邊的性質(zhì)等因素.復雜網(wǎng)絡就可看作復雜系統(tǒng)的高度抽象,將網(wǎng)絡中的節(jié)點抽象為復雜系統(tǒng)中的個體,網(wǎng)絡中的邊抽象為復雜系統(tǒng)中個體之間的關系,這樣由大量的節(jié)點及節(jié)點間相互連接的邊所構成的網(wǎng)絡就可稱為復雜網(wǎng)絡.
節(jié)點的度定義為與該節(jié)點相連的邊的個數(shù),反映該節(jié)點在網(wǎng)絡中的重要程度.網(wǎng)絡中所有節(jié)點的度的平均值是該網(wǎng)絡的平均度.網(wǎng)絡中節(jié)點的度分布表示為分布函數(shù)P(k),代表該節(jié)點的度等于k的概率,也可代表網(wǎng)絡中度為k的節(jié)點數(shù)在總節(jié)點數(shù)中所占的比例.
連接兩個節(jié)點的最短路徑所用邊的個數(shù)為兩節(jié)點之間的距離,網(wǎng)絡中所有節(jié)點對之間距離的平均值為網(wǎng)絡的平均路徑長度.平均路徑長度反映了節(jié)點之間聯(lián)系的緊密程度和網(wǎng)絡的大小.
節(jié)點的集聚系數(shù)表示為鄰居節(jié)點之間實際存在的邊數(shù)與最大可能邊數(shù)之比,反映一個節(jié)點的相鄰節(jié)點之間相互連接的情況.網(wǎng)絡的集聚系數(shù)表示為所有節(jié)點集聚系數(shù)的平均值,反映了網(wǎng)絡的社團結構特性.
介數(shù)分為點介數(shù)和邊介數(shù).點介數(shù)表示為經(jīng)過該節(jié)點的最短路徑數(shù)目占所有最短路徑數(shù)目的比例,邊介數(shù)表示為所有經(jīng)過該邊的最短路徑數(shù)目占所有最短路徑數(shù)目的比例.介數(shù)反映了相應節(jié)點或邊在整個網(wǎng)絡中的作用和地位.
網(wǎng)絡的結構與功能聯(lián)系緊密,拓撲結構決定功能,功能影響拓撲結構演化.為研究復雜網(wǎng)絡拓撲結構特性,Erdos 與Renyi 最早根據(jù)隨機圖理論構建了隨機網(wǎng)絡模型(ER 模型)[10],但ER 模型的連接規(guī)則與節(jié)點分布的隨機性使其不適合研究真實復雜網(wǎng)絡.因此,基于已有網(wǎng)絡模型的缺陷與真實網(wǎng)絡研究的需求,學者們提出了大量不同的復雜網(wǎng)絡模型.
通常認為如果網(wǎng)絡的平均路徑長度L與節(jié)點數(shù)N的對數(shù)成正比,則稱該網(wǎng)絡具有小世界效應.絕大部分真實復雜網(wǎng)絡都具有小世界效應,即具有較小的平均路徑長度和較大的集聚系數(shù).
基于此,Watts 和Strogatz 提出了小世界網(wǎng)絡模型(WS 模型)[11].在一個包含N個節(jié)點的環(huán)狀規(guī)則網(wǎng)絡中,以順時針方向訪問每個節(jié)點并選取與當前節(jié)點連接的邊,以概率p對每條邊進行刪除和重連,將邊的另一端隨機連接到其他節(jié)點上,在這個過程中可能會出現(xiàn)長程邊從而減小網(wǎng)絡的平均路徑長度,以概率1-p保留原有邊,整個過程中不允許出現(xiàn)重復連接和自環(huán).可以改變p值來調(diào)節(jié)網(wǎng)絡的隨機性,并保持網(wǎng)絡中邊數(shù)的平衡,p=0 時對應規(guī)則網(wǎng)絡,p=1 時對應隨機網(wǎng)絡.通過這種方法構造出來的小世界網(wǎng)絡具有較小的平均路徑長度和較大的集聚系數(shù).
考慮到WS 模型的構造方法可能會破壞網(wǎng)絡的連通性,Newman 和Watts 對其進行了改進,提出了NW模型[12].NW 模型的改進之處在于用隨機化加邊取代了隨機化重連,即以概率p在隨機選取的節(jié)點對之間添加連接邊,不改動原有連接邊,且不允許出現(xiàn)重復連接和自環(huán).當網(wǎng)絡規(guī)模N足夠大而p足夠小時,WS 模型與NW 模型在本質(zhì)上是一樣的.
在隨機網(wǎng)絡和小世界網(wǎng)絡中,節(jié)點的度分布近似為泊松分布.但研究者發(fā)現(xiàn)大多數(shù)真實復雜網(wǎng)絡的度分布服從冪律分布,即隨著節(jié)點度k增大,分布函數(shù)P(k)衰減速度變小.
針對這種情況,Barabas 和Albert 提出了無標度網(wǎng)絡模型(BA 模型)[13]從兩方面來描述其產(chǎn)生機制,即網(wǎng)絡增長和優(yōu)先連接.網(wǎng)絡增長意味著網(wǎng)絡中不斷有新節(jié)點加入并連接到已存在的節(jié)點上,初始網(wǎng)絡包含m0個節(jié)點和m1條邊,每個時間步增加一個新節(jié)點和m(m≤m0)條邊,連接到m個已有的節(jié)點上;優(yōu)先連接意味著新增加的節(jié)點會優(yōu)先連接度值較大的節(jié)點,將節(jié)點i的度ki和所有節(jié)點度的總和k的比值作為新增加的節(jié)點連接到節(jié)點i的概率,新增加的節(jié)點根據(jù)此概率選擇所要連接的m個節(jié)點.經(jīng)過t個時間步后初始網(wǎng)絡就會演化成具有m0+t個節(jié)點和m1+mt條邊的網(wǎng)絡,其中大多數(shù)節(jié)點度值較小,少數(shù)節(jié)點度值很大.結果顯示,BA 網(wǎng)絡不僅兼具小世界效應和較大的集群系數(shù),其度分布也滿足冪律分布.
BA 模型中的優(yōu)先連接機制存在于全局網(wǎng)絡,然而Li 等通過對真實復雜網(wǎng)絡的研究,發(fā)現(xiàn)優(yōu)先連接機制僅存在于局部網(wǎng)絡,因此在BA 模型的基礎上提出一種簡單局域世界網(wǎng)絡模型(LC 模型)[14].該模型首先隨機選取m個節(jié)點作為新增節(jié)點的局域世界,新增節(jié)點會優(yōu)先連接所對應的局域世界中度值較大的節(jié)點,而不是選擇全局網(wǎng)絡中度值較大的節(jié)點進行連接.
在BA 模型中,新增節(jié)點擁有全局信息;在LC 模型中,新增節(jié)點僅擁有局部信息.在真實復雜網(wǎng)絡中,總是存在少數(shù)節(jié)點擁有全局信息,大部分節(jié)點僅擁有局部信息.基于此,Qin 等對LC 模型進行了改進,建立了一種新的局域世界網(wǎng)絡模型[15].該模型引入了全局節(jié)點數(shù)與總結點數(shù)的比值作為新增節(jié)點屬于全局節(jié)點的概率p.當p=0 時,該模型對應于LC 模型;當p=1時,對應于BA 模型.
上述網(wǎng)絡模型均將網(wǎng)絡視為無權網(wǎng)絡,忽略了節(jié)點之間的相互作用程度或節(jié)點和邊的物理量等信息.而真實網(wǎng)絡往往為節(jié)點或邊具有權重的有權網(wǎng)絡,相比于無權網(wǎng)絡,有權網(wǎng)絡更能反映真實情況.
Yook 提出了一種基于BA 模型的簡單加權網(wǎng)絡模型[16],通過賦予邊權重來描述節(jié)點之間的相互作用強度與連接邊之間的異質(zhì)性.
Barrat 等提出了具有較強代表性的BBV 模型[17].該模型綜合考慮了拓撲結構和權重在網(wǎng)絡動態(tài)演化過程中的影響,隨著網(wǎng)絡規(guī)模的增大,其度分布、邊權分布和節(jié)點權分布都具有無標度特性.
周健等把局域世界特征引入到BBV 模型中,提出了一種基于局域世界演化的BBV 模型[18].該模型的構建考慮了局域世界內(nèi)新節(jié)點和新連接的產(chǎn)生、局域世界內(nèi)舊連接的消亡、局域世界外新連接的產(chǎn)生、權值優(yōu)先連接這4 個方面.
周鵬堯等在BBV 模型的基礎上,提出一種廣義的加權網(wǎng)絡演化(FBBV)模型[19].該模型與BBV 模型的不同之處在于,當網(wǎng)絡中加入新節(jié)點時,網(wǎng)絡中所有邊權都會發(fā)生變化,變化程度取決于各邊所處的實際位置.
在現(xiàn)實生活中人們可能因各種因素處于不同的團體中,成員之間聯(lián)系頻繁,而團體之間僅偶爾有往來.在復雜網(wǎng)絡中同樣有著類似的社團現(xiàn)象,社團結構是復雜網(wǎng)絡的一個重要特征.
關于社團結構的定義,根據(jù)連接密度可理解為社團是對網(wǎng)絡內(nèi)節(jié)點的分組,組內(nèi)節(jié)點之間聯(lián)系緊密,組間節(jié)點聯(lián)系稀疏;根據(jù)連通性可將社團看作一個派系,即由兩個以上的節(jié)點組成的全連通子圖,其中任意兩個節(jié)點之間都存在連接邊.
復雜網(wǎng)絡中的社團根據(jù)不同的標準可分為不同的類型.根據(jù)社團內(nèi)部節(jié)點聯(lián)系的緊密程度,可分為強社團和弱社團;根據(jù)社團之間是否有重疊節(jié)點,可分為重疊社團與非重疊社團.
如何對隱藏在復雜網(wǎng)絡中的社團結構進行檢測與劃分,是復雜網(wǎng)絡研究中的一個重要內(nèi)容.關于社團結構的檢測算法,汪小帆等首先介紹了計算機科學中的譜平分法和Kernighan-Lin 算法、社會學中具有代表性的分裂算法和凝聚算法[20].
復雜網(wǎng)絡中多數(shù)節(jié)點的“多屬性”特征使重疊社團的檢測算法具有更高的實用性.為準確檢測出權重網(wǎng)絡中的重疊社團,賈鄭磊等提出了一種基于Jaccard系數(shù)的BGLL 模塊密度優(yōu)化算法,相比于傳統(tǒng)BGLL算法,該算法能充分利用局部、全局信息,將有權節(jié)點與社團相似度相結合,具有更高準確率[21].李歡等從不同角度將重疊社團檢測算法分為基于派系過濾的算法、基于局部拓展的算法、基于邊劃分的算法、基于動力學的算法和基于模糊檢測的算法[22].
針對無權無向網(wǎng)絡中非重疊社團的檢測,張鵬改進了密度峰值聚類算法,通過自定義加權集合密度算法尋找聚類中心,然后計算節(jié)點之間的相似性,最終完成社團劃分[23].
網(wǎng)絡的抗毀性可理解為當網(wǎng)絡受到攻擊或出現(xiàn)故障時所表現(xiàn)出的恢復性或適應性,或在部分節(jié)點或邊失效的情況下仍能繼續(xù)提供服務的能力.如果一個網(wǎng)絡在受到攻擊而被移除少量節(jié)點后,剩余節(jié)點之間仍然是連通的,那么該網(wǎng)絡對這種攻擊具有較強抗毀性.
Albert 等最早開始研究復雜網(wǎng)絡在節(jié)點失效情況下的抗毀性[24].他們用隨機攻擊與選擇性攻擊兩種不同策略分別對隨機網(wǎng)絡和無標度網(wǎng)絡進行攻擊.隨機攻擊指的是隨機移除網(wǎng)絡中的節(jié)點,選擇性攻擊即按照節(jié)點度從大到小的順序移除節(jié)點.結果表明:無標度網(wǎng)絡在隨機攻擊下表現(xiàn)出較強的抗毀性,在選擇性攻擊下卻非常脆弱,若移除有大量連接的關鍵節(jié)點,網(wǎng)絡將立刻崩潰.
與最初基于圖論的研究方法不同,目前復雜網(wǎng)絡抗毀性的研究方法已發(fā)展為基于統(tǒng)計物理的方法,其方向包括抗毀性指標測度和抗毀性策略優(yōu)化.
在抗毀性指標測度方面,孫成雨等對二進制粒子群算法的概率映射函數(shù)和位置更新式進行改進,并結合適應度函數(shù)求解算法,設計出點韌性度算法,該算法能夠快速獲取網(wǎng)絡點韌性度以衡量其抗毀性性能,還可用于求解邊韌性度[25].
有關研究顯示,根據(jù)網(wǎng)絡實際情況選擇合適的、包含多種信息的抗毀性指標,對抗毀性策略的優(yōu)化有重要的意義[26,27].此外,張煜等從拓撲結構、網(wǎng)絡容量和路由策略等3 個方面介紹了抗毀性優(yōu)化策略的研究進展[28],并指出除了拓撲結構,網(wǎng)絡的防御與故障修復策略都將成為重要研究方向.
小世界效應與無標度特性使得復雜網(wǎng)絡中的節(jié)點分布呈現(xiàn)不均勻的現(xiàn)象,少數(shù)節(jié)點具有大量連接,處于重要地位,例如在國際貿(mào)易中對整個貿(mào)易體系有重要影響的一些國家,相比于大多數(shù)普通節(jié)點,這些少數(shù)節(jié)點對于整體網(wǎng)絡有著更大的影響.因此準確識別復雜網(wǎng)絡中的重要節(jié)點,對于優(yōu)化復雜網(wǎng)絡的結構與功能具有重要意義.
節(jié)點影響力研究包括節(jié)點重要性排序和影響力最大化,李夢甜對二者進行了深入研究,提出了一種中心性方法對節(jié)點傳播力進行評估與排序,該方法將本節(jié)點聚類系數(shù)與相鄰節(jié)點度值結合,具有良好的分辨率與排序準確性,運用該方法找出的節(jié)點集合能夠影響更多的節(jié)點[29].
考慮到節(jié)點影響力指標受節(jié)點屬性、網(wǎng)絡結構等因素影響,張應青等將節(jié)點影響力測度方法分為基于節(jié)點多屬性的多指標測度方法、基于節(jié)點局部信息和基于網(wǎng)絡全局信息的單屬性指標測度,并介紹了貪心算法、啟發(fā)式算法和滲流方法3 種尋找影響力節(jié)點集合的方法[30].
上述重要節(jié)點的識別方法僅局限于尋找在靜態(tài)網(wǎng)絡中具有深刻拓撲特征的節(jié)點,而真實復雜網(wǎng)絡的規(guī)模與結構時刻都在變化.基于此,任卓明討論了節(jié)點影響力算法在增長網(wǎng)絡、實時動態(tài)網(wǎng)絡與結構突變或微擾的動態(tài)網(wǎng)絡中遇到的問題,對于動態(tài)網(wǎng)絡的節(jié)點影響力研究有重要的意義[31].
如今網(wǎng)絡已成為信息的主要傳播渠道,這使得人們的社交網(wǎng)絡從線下接觸式拓展至線上非接觸式.對信息在社交網(wǎng)絡上傳播的動力學機理進行研究,是有效實施風險管控的基礎.建立合適的信息傳播模型能準確反映網(wǎng)絡個體之間信息傳播情況隨時間產(chǎn)生的變化.
典型的信息傳播模型主要參照流行病傳播模型,包括SI 模型、SIS 模型、SIR 模型、SEIR 模型、SIRS模型等.李丹丹等從經(jīng)典謠言傳播模型到社會網(wǎng)絡上的謠言傳播模型、從微觀機制和宏觀機制,分別評述了謠言傳播模型的發(fā)展歷程[32].錢亞飛分析了元胞自動機模型、多數(shù)決定模型、Ising 模型、有界信任模型、Sznajd 模型這5 種輿情演化模型,將其分為離散與連續(xù)兩類觀點模型,指出網(wǎng)絡輿情研究應當注重真實數(shù)據(jù)集的獲取與多學科的有機結合[33].
謠言在實際社交網(wǎng)絡中的傳播率是非一致性的,每個用戶對謠言的抵抗力不同,用戶之間的親密程度也會影響謠言的傳播.翟倩倩等建立了一種S2IR 網(wǎng)絡謠言傳播模型,該模型充分考慮謠言傳播的差異性與謠言免疫策略,更加符合實際網(wǎng)絡中的謠言傳播,不足之處是未能進一步對謠言未知節(jié)點進行細分[34].
無論是在日常生活中還是在專業(yè)領域內(nèi),同步都是一種常見的現(xiàn)象,例如魚群中每條魚的同時擺動、超導體中電子的一致前進等.由于同步既會產(chǎn)生有益結果也會產(chǎn)生有害結果,因此有必要對復雜網(wǎng)絡中的同步進行控制.復雜網(wǎng)絡中的同步控制就是指通過對網(wǎng)絡施加外力對其進行控制,使內(nèi)部多個節(jié)點動力系統(tǒng)達到相同狀態(tài)并保持穩(wěn)定.如何實現(xiàn)復雜網(wǎng)絡的同步控制,從而維持有益同步規(guī)避有害同步,已成為當前研究的熱點問題.
信息在網(wǎng)絡中的傳播速度會受到各種因素的影響與限制,這就導致在控制器接受與發(fā)送節(jié)點狀態(tài)信息的過程中出現(xiàn)滯后現(xiàn)象[35].針對復雜動態(tài)網(wǎng)絡節(jié)點本身可能存在的滯后現(xiàn)象,王亞楠分別從馬爾可夫切換轉(zhuǎn)移率部分已知和完全已知兩種情況出發(fā)研究復雜動態(tài)網(wǎng)絡系統(tǒng)的同步控制問題[36].
由于網(wǎng)絡中節(jié)點數(shù)量眾多,對所有節(jié)點進行控制顯然是不切實際的,因此牽制控制策略的研究受到廣泛關注,即僅對一部分節(jié)點進行控制進而使全局網(wǎng)絡保持同步.王瑞峰等引入事件激發(fā)函數(shù)實現(xiàn)牽制節(jié)點集的實時更新,依據(jù)合適的節(jié)點集選取規(guī)則,有效提高了同步效率與資源使用率[37].曹進德等從控制條件、節(jié)點選取策略、影響因素、算法、應用等方面概述了復雜網(wǎng)絡牽制同步的研究進展[38],在目前大多數(shù)牽制控制策略依賴全局信息的背景下,如何利用局部信息實現(xiàn)分布式的牽制控制值得深入研究.
隨機行走是復雜網(wǎng)絡領域研究的諸多動力學行為之一,并且與信息傳播、同步等其它動力學行為存在緊密聯(lián)系.復雜網(wǎng)絡上的隨機行走是指隨機行走粒子以復雜網(wǎng)絡結構為載體,從初始節(jié)點出發(fā),在每個時間步以一定概率選擇當前節(jié)點的鄰居節(jié)點進行傳輸最終到達目的節(jié)點的過程.
景興利等運用圖譜理論,給出一般網(wǎng)絡上隨機行走平均到達時間的精確解,對加權網(wǎng)絡的平均首到達時間和平均陷阱時間進行分析,發(fā)現(xiàn)二者與網(wǎng)絡規(guī)模、陷阱點度值、權重系數(shù)、平均度有密切關系[39].
本文從復雜網(wǎng)絡的基本概念、網(wǎng)絡模型、研究現(xiàn)狀3 個層面簡要介紹了近幾年復雜網(wǎng)絡領域的研究成果和進展.從中可以看到:大多數(shù)復雜網(wǎng)絡模型是在BA 模型的基礎上,通過新的機制演化而來,BA 模型將繼續(xù)為復雜網(wǎng)絡模型研究提供重要的參考價值;當前復雜網(wǎng)絡的研究更側重于結構特性和網(wǎng)絡動力學兩個領域,并且兩個領域間的研究相互影響,如何描述并分析網(wǎng)絡結構特性與動力學行為之間的關系,將是眾多學者面臨的難題.
隨著科技發(fā)展與眾多復雜巨系統(tǒng)的出現(xiàn),復雜網(wǎng)絡的結構和動力學行為趨向復雜化.人們僅依靠數(shù)字、表格等傳統(tǒng)形式已無法有效對復雜網(wǎng)絡進行全局性的規(guī)劃與管理,需要運用可視化技術全面、直觀、清晰、實時地描述復雜網(wǎng)絡拓撲結構與動力學行為,以便對其進行分析、管理與評估.對復雜網(wǎng)絡進行可視化處理,既可以幫助人們從視覺層面上理解復雜網(wǎng)絡的結構,也便于學者研究復雜網(wǎng)絡拓撲結構變化對其動力學行為的影響.因此,復雜網(wǎng)絡可視化將是未來復雜網(wǎng)絡研究的熱點之一,具體有以下幾個方向:
(1)可視化算法
可視化算法按照適用規(guī)模,可分為布點算法和可視化壓縮算法[40];按照布局方式,可分為基于節(jié)點-鏈接的可視化方法、基于鄰接矩陣的可視化方法和基于圖嵌入的可視化方法[41].隨著大數(shù)據(jù)的興起與節(jié)點關系的復雜化,可視化算法在性能與可觀性等方面遇到了巨大的挑戰(zhàn).對此,一是可以對現(xiàn)有算法進行改進,提高計算效率,以減少計算資源的占用;二是可以引入“可視化分層”的概念,將運算壓力與可視化結果隨著用戶的交互操作分配到不同的層面上.
(2)網(wǎng)絡拓撲可視化
網(wǎng)絡拓撲可視化是一種將點和線構成圖形、圖像來對網(wǎng)絡中的拓撲信息進行描述與分析的技術[42].在大數(shù)據(jù)處理與云計算等技術的推動下,能夠合理運用有限資源,高效地管理大量關系復雜的節(jié)點,并簡潔、直觀地展示其運行狀態(tài)等信息,具有重要的意義.因此,如何實現(xiàn)拓撲特性、布局算法和可視化方式三者的結合,是當前面臨的難點.
(3)動態(tài)網(wǎng)絡可視化
復雜網(wǎng)絡所具有“無標度”特性使其處在一個數(shù)據(jù)不斷更新的狀態(tài),且新數(shù)據(jù)會對原始可視化效果帶來不可控、不可估計的影響,為其可視化帶來了巨大的挑戰(zhàn)[43].目前的可視化算法與工具大多用于靜態(tài)網(wǎng)絡的可視化,無法準確描述持續(xù)演變的真實動態(tài)網(wǎng)絡,怎樣有效實現(xiàn)動態(tài)網(wǎng)絡可視化也是一個值得關注的問題.
時至今日,復雜網(wǎng)絡的應用已遠遠超出物理學和數(shù)學的范疇,其分析與應用也為諸多學科提出了新的具有挑戰(zhàn)性的難題.把復雜網(wǎng)絡理論與實際問題聯(lián)系起來,增強其實用性,進而應用到實際復雜系統(tǒng)中,將是復雜網(wǎng)絡理論研究未來的發(fā)展趨勢.