• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      學(xué)科合作網(wǎng)絡(luò)鏈路預(yù)測結(jié)果的排序魯棒性

      2018-11-12 07:14:50李亞婷
      信息資源管理學(xué)報 2018年4期
      關(guān)鍵詞:網(wǎng)絡(luò)結(jié)構(gòu)排序鏈路

      張 斌 李亞婷

      (1.武漢大學(xué)中國傳統(tǒng)文化研究中心; 2.武漢大學(xué)信息資源研究中心,武漢,430072)

      對于研究者來講,組建一個科研團隊,要面對的首要問題是如何找到合適的科研合作對象。在科研起步階段,大多數(shù)研究者是通過與導(dǎo)師或所在師門的同學(xué)來完成首次合作;在參加工作階段,就會和自己所在的科研團隊進行合作。有時,研究者會碰到這樣的情況,因為某些研究工作的需要,主動想要在本學(xué)科領(lǐng)域里進行跨團隊合作,甚至是跨學(xué)科合作,而這目前主要是靠研究者自身的社會關(guān)系和經(jīng)驗判斷來解決。如果研究者能了解到相關(guān)內(nèi)容的研究和合作現(xiàn)狀,那么他會很容易知道自己的合作對象應(yīng)該是誰。即使在實際合作中,研究者之間沒有聯(lián)系或者是聯(lián)系較弱,但這些信息對于他們來講也是非常重要的,至少可以提個醒,是否忽略了一些很重要的或者是具有潛在意義的合作關(guān)系,而鏈路預(yù)測在這方面可以發(fā)揮重要作用[1]。

      相較于學(xué)科整體合作面貌,對學(xué)科核心作者之間的鏈路挖掘會更有針對性,對于理解未來科研合作走向也是至關(guān)重要的。但是,當(dāng)抽取核心作者并構(gòu)建網(wǎng)絡(luò)時,該網(wǎng)絡(luò)相較于原網(wǎng)絡(luò)可能會出現(xiàn)結(jié)構(gòu)上的變化,而網(wǎng)絡(luò)結(jié)構(gòu)的改變勢必會影響到最終的預(yù)測結(jié)果和預(yù)測效果。基于此,本文針對圖書館情報文獻(xiàn)學(xué)合作網(wǎng)絡(luò),抽取整體作者合作網(wǎng)絡(luò)和核心作者合作網(wǎng)絡(luò),分析兩者應(yīng)用場景的差異,初步探討由實驗網(wǎng)絡(luò)結(jié)構(gòu)的改變而帶來預(yù)測結(jié)果的排序魯棒性(robustness)問題。

      1 相關(guān)研究回顧

      如何刻畫復(fù)雜網(wǎng)絡(luò)中節(jié)點之間的相似性是數(shù)學(xué)和物理學(xué)里的一個重要理論問題,并不容易解決?;诮Y(jié)構(gòu)相似性的鏈路預(yù)測指標(biāo)和算法只涉及到網(wǎng)絡(luò)的結(jié)構(gòu)信息。不同的相似性指標(biāo)會側(cè)重從網(wǎng)絡(luò)結(jié)構(gòu)的某一個方面來刻畫,如果目標(biāo)網(wǎng)絡(luò)在此方面的結(jié)構(gòu)特征顯著,那么就可以得到較好的預(yù)測效果,反之,則較差。數(shù)據(jù)規(guī)模[2]、聚集系數(shù)[3-4]、同配系數(shù)[5]、網(wǎng)絡(luò)效率[5]等結(jié)構(gòu)參數(shù)會對不同預(yù)測指標(biāo)的預(yù)測結(jié)果產(chǎn)生重要影響。從統(tǒng)計分析視角來看,基于鄰居節(jié)點的預(yù)測指標(biāo)和基于拓?fù)浣Y(jié)構(gòu)的預(yù)測指標(biāo)在各自內(nèi)部之間具有相當(dāng)程度的一致性,而擇優(yōu)連接(PA)指標(biāo)則和其他指標(biāo)之間差異性非常大[6]。從應(yīng)用效果來看,AA指標(biāo)和Katz指標(biāo)都是很有效的預(yù)測指標(biāo),能準(zhǔn)確快速地識別未知鏈路,預(yù)測結(jié)果可以用于識別共同興趣偏好和發(fā)現(xiàn)歷史合作經(jīng)歷[7]。同時,對目標(biāo)網(wǎng)絡(luò)的不同抽取策略和方案會造成網(wǎng)絡(luò)結(jié)構(gòu)的擾動(perturbation),這種擾動會影響到鏈路預(yù)測的排序結(jié)果。

      在網(wǎng)絡(luò)科學(xué)研究中,如果在移走少量節(jié)點后,網(wǎng)絡(luò)中的絕大部分節(jié)點仍然是連通的,那么稱該網(wǎng)絡(luò)的連通性對節(jié)點故障具有魯棒性。Albert等[8]比較了隨機網(wǎng)絡(luò)(ER網(wǎng)絡(luò))和無標(biāo)度網(wǎng)絡(luò)(BA網(wǎng)絡(luò))的連通性對節(jié)點去除的魯棒性,發(fā)現(xiàn)在ER網(wǎng)絡(luò)中,隨機去除網(wǎng)絡(luò)中大量節(jié)點,則會使得網(wǎng)絡(luò)破碎成很多孤立的子網(wǎng)絡(luò);而在同樣規(guī)模的BA網(wǎng)絡(luò)中,隨機去除同樣多的節(jié)點,網(wǎng)絡(luò)卻能保持基本的連通性,但若蓄意去除少量大度節(jié)點就可以破壞網(wǎng)絡(luò)的連通性。Iyer等[9]考察了在無標(biāo)度網(wǎng)絡(luò)、指數(shù)網(wǎng)絡(luò)以及部分真實網(wǎng)絡(luò)中,按照度中心性、中介中心性、接近中心性、特征向量中心性等四種節(jié)點排序算法以及隨機移除節(jié)點方法,進行節(jié)點移除后對網(wǎng)絡(luò)巨片的影響,結(jié)果顯示,在高能物理合作網(wǎng)絡(luò)和網(wǎng)絡(luò)科學(xué)合作網(wǎng)絡(luò)中,度中心性和中介中心性在識別重要節(jié)點上都比較有效。

      移除節(jié)點會帶來網(wǎng)絡(luò)結(jié)構(gòu)的改變。反過來看,真實復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)一般都會隨著時間而發(fā)生變化,通常表現(xiàn)在兩個方面:一是節(jié)點數(shù)量的增減,二是連邊數(shù)量的增減。真實復(fù)雜網(wǎng)絡(luò)的演化過程往往還是加速增長的,連邊的數(shù)量比節(jié)點的數(shù)量增長得更快[10-11]。而在實際數(shù)據(jù)采集和分析中,由于數(shù)據(jù)源、數(shù)據(jù)處理等方面的問題,研究者很難甚至無法獲取到完整的網(wǎng)絡(luò)數(shù)據(jù)。因此,一方面是真實網(wǎng)絡(luò)在不斷演化,另一方面是獲取到的網(wǎng)絡(luò)數(shù)據(jù)并不完整,這就造成了所構(gòu)建網(wǎng)絡(luò)的結(jié)構(gòu)本身會發(fā)生擾動。相應(yīng)地,在進行鏈路預(yù)測時,自然希望關(guān)于節(jié)點對之間相似性的某種排序能夠?qū)W(wǎng)絡(luò)結(jié)構(gòu)的擾動具有一定的魯棒性。

      2 研究設(shè)計

      2.1 實驗網(wǎng)絡(luò)結(jié)構(gòu)

      研究選擇中文社會科學(xué)引文索引(CSSCI)數(shù)據(jù)庫收錄圖書館情報文獻(xiàn)學(xué)的來源期刊,獲取在2008—2013年期間該學(xué)科一直被連續(xù)收錄的14本期刊上發(fā)表文章的題錄數(shù)據(jù)[12],構(gòu)建整體作者合作網(wǎng)絡(luò)G0,作為初始研究對象。為了構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)擾動的實驗環(huán)境,需要采用節(jié)點移除策略,并完整的保留余下部分,相關(guān)實驗網(wǎng)絡(luò)見表1。具體的處理過程如下:

      (1)將網(wǎng)絡(luò)G0按照節(jié)點度值從小到大進行抽取,即移除節(jié)點度小于或等于該度值的節(jié)點,形成實驗網(wǎng)絡(luò)。比如:按“節(jié)點度>1”策略,表示抽取整體作者合作網(wǎng)絡(luò)中節(jié)點度大于1的節(jié)點,即移除節(jié)點度小于或等于1的節(jié)點,之后余留下的網(wǎng)絡(luò),以此類推。

      (2)研究假定年均發(fā)文在一篇以上的作者為核心作者。針對網(wǎng)絡(luò)G0,考慮時間跨度六年,設(shè)定節(jié)點度大于或等于6的節(jié)點為核心作者節(jié)點,即“節(jié)點度>5”策略,由此抽取出核心作者合作網(wǎng)絡(luò)G0′。

      表1 按不同節(jié)點度標(biāo)準(zhǔn)抽取的實驗網(wǎng)絡(luò)

      2.2 鏈路預(yù)測指標(biāo)

      由于本次實驗所構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)會發(fā)生擾動,處于相同角色的節(jié)點,即使沒有相同的鄰居節(jié)點,也有可能因為角色的相似而產(chǎn)生連接。預(yù)測合作關(guān)系時,既要考慮結(jié)構(gòu)等價的相關(guān)指標(biāo),同時也要考慮一般等價的相關(guān)指標(biāo)。因此,這里使用的是較為常見的六種鏈路預(yù)測指標(biāo),包括基于節(jié)點的相似性指標(biāo)(CN指標(biāo)、AA指標(biāo)和PA指標(biāo))和基于路徑的相似性指標(biāo)(Katz指標(biāo)、RootedPageRank指標(biāo)和SimRank指標(biāo))[6]。

      CN指標(biāo)[13]:sxy=Γx∩Γy。一個給定的網(wǎng)絡(luò),節(jié)點vx的鄰居集合為Γx,節(jié)點vy的鄰居集合為Γy,則它們之間的相似性定義為共同的鄰居數(shù)。

      Adamic-Adar(AA)指標(biāo)[14]:

      擇優(yōu)連接(PA)指標(biāo)[15]:sxy=kxky。其思想是如果參照無標(biāo)度網(wǎng)絡(luò)產(chǎn)生的原理,認(rèn)為新加入的節(jié)點更傾向于與大度節(jié)點相連接,那么可認(rèn)為兩節(jié)點間產(chǎn)生連邊的可能性與兩節(jié)點的度均有關(guān),也就是說,可認(rèn)為相似性正比于兩端點度的乘積(Product)。因此,PA指標(biāo)又稱為度積(DegreeProduct)指標(biāo)。

      RootedPageRank(RPR)指標(biāo)[15]:受網(wǎng)頁排序算法PageRank的啟發(fā),RootedPageRank指標(biāo)假設(shè)隨機游走粒子在每走一步的時候,都以一定概率返回初始位置,該指標(biāo)又稱為帶重啟的隨機游走(RandomWalkwithRestart,RWR)。

      SimRank指標(biāo)[17]:

      3 分析與結(jié)果

      3.1 預(yù)測結(jié)果的比較

      在實際預(yù)測時,AA指標(biāo)和Katz指標(biāo)是很有效的預(yù)測指標(biāo),能準(zhǔn)確快速地識別未知鏈路[7,15]。因此,這里將鏈路預(yù)測指標(biāo)AA和Katz應(yīng)用在整體作者合作網(wǎng)絡(luò)G0的連通巨片和核心作者合作網(wǎng)絡(luò)G0′,分別得到相似性計算結(jié)果的排序前10的合作組合,見表2和表3。

      表2 AA指標(biāo)預(yù)測結(jié)果排名前10對比

      表3 Katz指標(biāo)預(yù)測結(jié)果排名前10對比

      易于理解,核心作者在科研產(chǎn)出上的能力會很強,如果依此假定核心作者的科研活躍度也很高,會積極主動地進行科學(xué)交流并建立合作關(guān)系,則所挖掘出來的核心作者組合在未來便具有更高的可能性進行科研合作,這些合作組合是應(yīng)該被挖掘出來并進行推薦的。利用可視化工具Gephi(版本0.82)可以呈現(xiàn)出這些挖掘出來的作者組合所在的局域網(wǎng)絡(luò),從而進行應(yīng)用場景討論。在具體方法上,選擇相應(yīng)的作者節(jié)點及其鄰居網(wǎng)絡(luò),將這些子網(wǎng)絡(luò)過濾出來。圖示中節(jié)點的不同著色,表明其所歸屬的社區(qū),節(jié)點的大小代表著度值的大小。

      圖1所示為AA指標(biāo)下G0′網(wǎng)絡(luò)中核心作者“初景利”所在的局域網(wǎng)絡(luò),設(shè)鄰居網(wǎng)絡(luò)的深度為2,過濾出來的子網(wǎng)絡(luò)包含117個節(jié)點300條連邊。此時,對于給定的作者節(jié)點“初景利”,利用AA指標(biāo)得到的短的排序的候選鄰居列表,就可以作為合作推薦建議給出了。

      當(dāng)然,在這個推薦過程中,如果能將相關(guān)作者的研究興趣進行關(guān)聯(lián)分析并突出出來,則會更有說服力。事實上,由于合作網(wǎng)絡(luò)的結(jié)構(gòu)形成本就會受到很多外界主客觀因素的影響,如地理距離、經(jīng)濟環(huán)境、社會信任等[18],換句話說,基于結(jié)構(gòu)相似性的預(yù)測結(jié)果也會涵蓋研究興趣這一維度,因此,依據(jù)預(yù)測結(jié)果排序構(gòu)建推薦列表也是合適的。

      圖2所示為AA指標(biāo)下作者組合“初景利”和“劉細(xì)文”所在的局域網(wǎng)絡(luò)。其中,a圖為網(wǎng)絡(luò)G0的連通巨片中的局域網(wǎng)絡(luò),鄰居網(wǎng)絡(luò)的深度為1,包含60個節(jié)點163條連邊;而b圖為G0′網(wǎng)絡(luò)中的局域網(wǎng)絡(luò),鄰居網(wǎng)絡(luò)的深度為1,過濾出來的子網(wǎng)絡(luò)包含31個節(jié)點82條連邊。對比分析,b圖所示網(wǎng)絡(luò)在規(guī)模上比a圖所示網(wǎng)絡(luò)減少了一半,但所呈現(xiàn)出的鄰居節(jié)點則更加清晰明確,更易挖掘出潛在合作對象。

      作者節(jié)點“初景利”和“劉細(xì)文”歸屬于同一個社區(qū),兩者之間并未建立過合作關(guān)系。在CSSCI數(shù)據(jù)庫中查找這兩人在1998—2007年所發(fā)表的論文信息,顯示兩人在這個時間段內(nèi)也沒有共同發(fā)表過論文。在2008—2013年間,初景利發(fā)表論文28篇,劉細(xì)文發(fā)表論文25篇,與這兩人都有過合作的作者(共同合作者)共有9人。這些合作論文的主題都與開放存取相關(guān),也就是說,初景利和劉細(xì)文的共同興趣偏好是有關(guān)開放存取的話題?;谝粋€熟人網(wǎng)絡(luò)的假設(shè),同時這兩人又具有共同的興趣偏好,他們具有很高的潛在合作的可能性,這不僅是對過去,而且對未來也是有效的。事實上,初景利和劉細(xì)文目前同在中國科學(xué)院國家科學(xué)圖書館工作,兩人相互之間是同事關(guān)系,即為熟人關(guān)系。進一步地,如果要解讀合作關(guān)系是否成立,則需要更多的節(jié)點屬性信息。

      圖1 核心作者“初景利”所在局域網(wǎng)絡(luò)的可視化

      圖2 “初景利”和“劉細(xì)文”所在局域網(wǎng)絡(luò)的可視化對比

      對比表2和表3中相應(yīng)指標(biāo)排序前10作者組合的排序位置,可以發(fā)現(xiàn),AA指標(biāo)下的作者組合不僅在結(jié)果上產(chǎn)生了變化,而且相同結(jié)果的排序位置也有了變化;但Katz指標(biāo)下的作者組合卻保持了一致,且得分?jǐn)?shù)值及其排序位置也都基本一致,因此,本次研究不再對Katz指標(biāo)下的預(yù)測結(jié)果進行可視化分析。由于整體作者合作網(wǎng)絡(luò)G0的連通巨片和核心作者合作網(wǎng)絡(luò)G0′的結(jié)構(gòu)有所不同,于是,這種網(wǎng)絡(luò)結(jié)構(gòu)的改變會給排序結(jié)果造成多大影響,就是需要關(guān)注的問題了。

      3.2 排序魯棒性分析

      在上述實驗中,當(dāng)抽取核心作者并構(gòu)建網(wǎng)絡(luò)時,實驗網(wǎng)絡(luò)會出現(xiàn)結(jié)構(gòu)上的變化,這種結(jié)構(gòu)上的改變也確實影響到了最終預(yù)測結(jié)果。不妨計算AA指標(biāo)和Katz指標(biāo)在整體作者合作網(wǎng)絡(luò)G0中的預(yù)測結(jié)果,將其與核心作者合作網(wǎng)絡(luò)G0′進行比較,計算預(yù)測結(jié)果在相同規(guī)模下的重疊情況,結(jié)果見表4。此時,從重疊比例上看,Katz指標(biāo)相比AA指標(biāo),對網(wǎng)絡(luò)結(jié)構(gòu)的改變更具有抗干擾性。

      表4 整體作者合作網(wǎng)絡(luò)與核心作者合作網(wǎng)絡(luò)預(yù)測結(jié)果的重疊情況

      表1所示是2008—2013年間圖書館情報文獻(xiàn)學(xué)合作網(wǎng)絡(luò)按照不同抽取策略所形成網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)特征。隨著抽取節(jié)點度值的增大,網(wǎng)絡(luò)結(jié)構(gòu)會發(fā)生劇烈變化,同時網(wǎng)絡(luò)的同配系數(shù)也隨之增大,這意味著大度節(jié)點之間產(chǎn)生聯(lián)系的概率會升高。這種抽取網(wǎng)絡(luò)的行為可以看作成一種節(jié)點移除策略,即按照節(jié)點度值從小到大批量移除指定度值的節(jié)點。需要說明的是,研究所使用的實驗網(wǎng)絡(luò)是無標(biāo)度網(wǎng)絡(luò)。

      相比于隨機網(wǎng)絡(luò)而言,無標(biāo)度網(wǎng)絡(luò)對于隨機節(jié)點故障具有極高的魯棒性。按照表1的節(jié)點移除策略,每次選取的節(jié)點都是度值很小的節(jié)點,批量移除這些節(jié)點對整個網(wǎng)絡(luò)的連通性不會產(chǎn)生大的影響,見圖3,其中f為去除的節(jié)點數(shù)占原始網(wǎng)絡(luò)總節(jié)點數(shù)的比例。

      圖3 批量移除節(jié)點后合作網(wǎng)絡(luò)的魯棒性

      雖然批量移除度值很小的節(jié)點仍可以保證網(wǎng)絡(luò)的基本連通性,但卻很容易造成共同鄰居節(jié)點的缺失,這對基于共同鄰居的相似性指標(biāo)(如:CN、AA)非常不利。將表4的計算過程重新應(yīng)用到“節(jié)點度>3”和“節(jié)點度>5”的網(wǎng)絡(luò)上,以“節(jié)點度>5”的網(wǎng)絡(luò)為基準(zhǔn),計算基于節(jié)點的指標(biāo)(CN、AA、PA)和基于路徑的指標(biāo)(Katz、RootedPageRank、SimRank)的預(yù)測結(jié)果的重疊情況,見圖4。

      圖4 不同預(yù)測指標(biāo)排序結(jié)果的重疊比例發(fā)展趨勢

      隨著比較規(guī)模的擴大,CN、AA、Katz指標(biāo)的重疊比例呈現(xiàn)出下降趨勢,而PA、RootedPageRank、SimRank指標(biāo)的重疊比例則呈現(xiàn)出上升趨勢。一般來講,預(yù)測結(jié)果規(guī)模通常并不會很大,不妨取值為1000個。當(dāng)預(yù)測結(jié)果規(guī)模在1000個以內(nèi)時,Katz指標(biāo)的重疊比例是這六個指標(biāo)中最高的,RootedPageRank指標(biāo)的重疊比例是最低的;當(dāng)預(yù)測結(jié)果規(guī)模超過1000個時,Katz指標(biāo)的重疊比例下降到約60%并保持穩(wěn)定,RootedPageRank指標(biāo)的重疊比例也還是最低的。從這六個指標(biāo)的重疊比例數(shù)值和發(fā)展趨勢看,網(wǎng)絡(luò)結(jié)構(gòu)的擾動對于Katz指標(biāo)的預(yù)測結(jié)果影響最小,對RootedPageRank指標(biāo)的預(yù)測結(jié)果影響最大。值得注意的是,當(dāng)預(yù)測結(jié)果規(guī)模超過300個時,PA指標(biāo)的重疊比例上升到約70%并保持穩(wěn)定;當(dāng)預(yù)測結(jié)果規(guī)模超過1000個時,PA指標(biāo)的重疊比例超過Katz指標(biāo)。這表明,網(wǎng)絡(luò)結(jié)構(gòu)的擾動對于PA指標(biāo)的預(yù)測結(jié)果影響也較小。

      3.3 預(yù)測效果的分析

      本研究所構(gòu)建的核心作者合作網(wǎng)絡(luò),其基本假設(shè)是將年均發(fā)文在一篇以上的作者視為核心作者。這里將整體作者合作網(wǎng)絡(luò)G0進行時間快照劃分,得到兩個快照網(wǎng)絡(luò),分別是2008—2011年間快照下作者合作網(wǎng)絡(luò)G1和2012—2013年間快照下作者合作網(wǎng)絡(luò)G2;之后,按節(jié)點度值抽取核心作者,將核心作者合作網(wǎng)絡(luò)過濾出來,分別設(shè)為G1′和G2′[6]。表5設(shè)置了四種作者數(shù)據(jù)集抽取方案,始終保持G1′的節(jié)點度比G2′的節(jié)點度的值多2。

      表5 作者數(shù)據(jù)集方案

      不同的作者數(shù)據(jù)集抽取方案會造成網(wǎng)絡(luò)結(jié)構(gòu)發(fā)生不同程度的擾動。針對不同方案下的G1′和G2′進行鏈路預(yù)測,觀察預(yù)測效果的變化幅度。預(yù)測效果的評價指標(biāo)采用F-score,其最大值記為fmax[6],方案1至方案4的評價結(jié)果對比如圖5所示。顯然,六種鏈路預(yù)測指標(biāo)在方案1和方案2下,預(yù)測效果變化不大;而從方案3開始,預(yù)測效果出現(xiàn)了較大變化,特別是方案4,預(yù)測效果變化幅度最大。

      從預(yù)測效果的穩(wěn)定程度來看,AA、Katz和SimRank顯得較為穩(wěn)定,它們受到網(wǎng)絡(luò)結(jié)構(gòu)擾動的影響相對較小。但需要指出的是,方案4對網(wǎng)絡(luò)結(jié)構(gòu)造成的破壞最大,而結(jié)果是預(yù)測效果取得了大幅提升。因此,實驗網(wǎng)絡(luò)結(jié)構(gòu)的改變應(yīng)當(dāng)有一定限制,否則預(yù)測效果會出現(xiàn)大幅改變,即預(yù)測結(jié)果的排序魯棒性也就無從談起了。

      圖5 不同作者數(shù)據(jù)集方案下fmax的比較

      4 結(jié)束語

      學(xué)科合作網(wǎng)絡(luò)屬于高凝聚性的稀疏網(wǎng)絡(luò)。在實際操作中,會根據(jù)不同研究目的采取不同抽取網(wǎng)絡(luò)的方案。由此帶來實驗網(wǎng)絡(luò)結(jié)構(gòu)的改變,是否影響到鏈路預(yù)測指標(biāo)的預(yù)測結(jié)果和預(yù)測效果,影響程度又是怎樣的,這是本文所關(guān)注的。研究通過比較在網(wǎng)絡(luò)結(jié)構(gòu)發(fā)生擾動時,不同預(yù)測指標(biāo)的預(yù)測結(jié)果和排序情況,以及在相同規(guī)模下的重疊情況可以粗略判斷出排序魯棒性的好壞。研究發(fā)現(xiàn),網(wǎng)絡(luò)結(jié)構(gòu)的擾動對于Katz指標(biāo)的預(yù)測結(jié)果影響最小,對RootedPageRank指標(biāo)的預(yù)測結(jié)果影響最大。研究網(wǎng)絡(luò)結(jié)構(gòu)的改變對鏈路預(yù)測效果產(chǎn)生的影響,發(fā)現(xiàn)AA、Katz和SimRank在預(yù)測效果方面顯得較為穩(wěn)定,它們受到網(wǎng)絡(luò)結(jié)構(gòu)擾動的影響相對較小。

      嚴(yán)格來講,本研究使用的計算重疊比例方法,對于分析排序結(jié)果對網(wǎng)絡(luò)結(jié)構(gòu)的擾動具有魯棒性還是顯得比較粗糙,但卻具有統(tǒng)計學(xué)意義。通過計算重疊比例,可以快速定位出在實驗網(wǎng)絡(luò)中那些特別穩(wěn)定的且相似性得分?jǐn)?shù)值又很高的節(jié)點對,并用作推薦目的。更精確的魯棒性評價通常需要考慮排序結(jié)果的位置是否出現(xiàn)了變化[19]。而在實際應(yīng)用場景中,會首先關(guān)注量(重疊數(shù)量和比例)的變化,再關(guān)注質(zhì)(排序位置)的變化。

      此外,在本研究中,對核心作者的發(fā)文數(shù)量的設(shè)定是否會影響到預(yù)測效果,換句話說,就是對核心作者形成的合作網(wǎng)絡(luò)的預(yù)測是否會比一般情況下的合作網(wǎng)絡(luò)顯得更容易的問題??梢詮耐湫越嵌壬蟻硭伎?。隨著抽取節(jié)點度值的增大,網(wǎng)絡(luò)的同配性系數(shù)也隨之增大,這意味著大度節(jié)點之間產(chǎn)生聯(lián)系的概率會升高。也就是說,若將度值大的節(jié)點視為核心作者,則核心作者之間會有更大的概率建立合作關(guān)系。當(dāng)然,這一觀點是否具有普遍性,還需要在更多的真實網(wǎng)絡(luò)中加以檢驗。

      猜你喜歡
      網(wǎng)絡(luò)結(jié)構(gòu)排序鏈路
      家紡“全鏈路”升級
      排序不等式
      天空地一體化網(wǎng)絡(luò)多中繼鏈路自適應(yīng)調(diào)度技術(shù)
      移動通信(2021年5期)2021-10-25 11:41:48
      恐怖排序
      節(jié)日排序
      刻舟求劍
      兒童繪本(2018年5期)2018-04-12 16:45:32
      基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
      知識網(wǎng)絡(luò)結(jié)構(gòu)維對于創(chuàng)新績效的作用機制——遠(yuǎn)程創(chuàng)新搜尋的中介作用
      滬港通下A+ H股票網(wǎng)絡(luò)結(jié)構(gòu)演化的實證分析
      復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)比對算法研究進展
      绥江县| 讷河市| 台中市| 库伦旗| 宁都县| 游戏| 安国市| 潍坊市| 临漳县| 鄂尔多斯市| 孝昌县| 呼玛县| 毕节市| 康马县| 陕西省| 资中县| 于田县| 娱乐| 新平| 绵阳市| 宝丰县| 鹰潭市| 利川市| 兴宁市| 增城市| 德庆县| 蚌埠市| 潢川县| 合水县| 安国市| 孟津县| 汾阳市| 康马县| 朝阳县| 眉山市| 高雄市| 延吉市| 新竹市| 七台河市| 桃源县| 襄汾县|