金 飛, 謝 勰, 鄭 亮, 雎 悅, 王 浩
(1. 江蘇金智教育信息技術(shù)有限公司, 江蘇 南京 211100; 2. 西安郵電大學(xué) 通信與信息工程學(xué)院, 陜西 西安 710121)
基于物理關(guān)聯(lián)的學(xué)術(shù)期刊引用網(wǎng)絡(luò)影響力分析
金 飛1, 謝 勰2, 鄭 亮2, 雎 悅2, 王 浩2
(1. 江蘇金智教育信息技術(shù)有限公司, 江蘇 南京 211100; 2. 西安郵電大學(xué) 通信與信息工程學(xué)院, 陜西 西安 710121)
從網(wǎng)絡(luò)科學(xué)的視角分析學(xué)術(shù)期刊的影響力。針對(duì)傳統(tǒng)方案忽視網(wǎng)絡(luò)結(jié)構(gòu)緊密度的缺陷,以物理關(guān)聯(lián)作為期刊選擇的依據(jù)。利用期刊之間的引用關(guān)系建立引用網(wǎng)絡(luò),基于頂點(diǎn)強(qiáng)度進(jìn)行統(tǒng)計(jì)分析以評(píng)估期刊的影響力情況。引入頂點(diǎn)權(quán)重因子改進(jìn)影響力度量,并以地緣性比較緊密的若干高校學(xué)報(bào)為例進(jìn)行測(cè)算評(píng)估。數(shù)據(jù)分析表明引用網(wǎng)絡(luò)方案可以較好地進(jìn)行學(xué)術(shù)期刊影響力評(píng)估,特別是具備同一物理屬性的期刊群。
網(wǎng)絡(luò)科學(xué);引用網(wǎng)絡(luò);學(xué)術(shù)期刊;影響力分析
網(wǎng)絡(luò)科學(xué)[1-2]是目前的熱門研究領(lǐng)域,它發(fā)現(xiàn)并解決了很多問題,也因此變得越發(fā)重要和流行。學(xué)術(shù)研究的影響力評(píng)估是一個(gè)古老但一直困擾學(xué)界的難題,而網(wǎng)絡(luò)科學(xué)為其提供了一些非常好的解決方案[3]。
網(wǎng)絡(luò)科學(xué)應(yīng)用于學(xué)術(shù)期刊的影響力分析其原因是現(xiàn)代學(xué)術(shù)合作越來越密切,而學(xué)術(shù)期刊正是聯(lián)系學(xué)者的重要媒介,由此形成的網(wǎng)絡(luò)結(jié)構(gòu)研究非常豐富[3]。簡單來說,期刊中論文的被引用情況直接表明了該期刊的影響力水平,期刊被引用論文的次數(shù)越多,說明它的學(xué)術(shù)影響力越大,期刊質(zhì)量越高。而期刊之間連接關(guān)系形成網(wǎng)絡(luò)結(jié)構(gòu),因此使用網(wǎng)絡(luò)科學(xué)評(píng)估研究對(duì)象的影響力分析是一個(gè)非常合適的方案。
基于網(wǎng)絡(luò)結(jié)構(gòu)評(píng)價(jià)影響力的問題則是有些學(xué)術(shù)期刊的結(jié)構(gòu)關(guān)系非常松散,單從形式上選取的一組期刊難以獲得較好的影響力評(píng)估。為此可引入期刊之間的物理關(guān)聯(lián),基于此給出新的期刊選取策略,從而更好的進(jìn)行學(xué)術(shù)期刊影響力評(píng)估。
可以將所有要評(píng)價(jià)的對(duì)象看作是在一個(gè)圖(或網(wǎng)絡(luò))中的頂點(diǎn),頂點(diǎn)之間用邊相連接。這些對(duì)象可以是若干學(xué)者,或若干論文。對(duì)象所組成的圖形稱為影響力圖,并通過函數(shù)來計(jì)算所有對(duì)象的影響力的值。在我們的模型中,頂點(diǎn)v的影響力值不再僅由其自身決定,而是與網(wǎng)絡(luò)中的其他頂點(diǎn)相互之間有影響,尤其是那些直接與v連接的頂點(diǎn)。首先,我們構(gòu)建影響力網(wǎng)絡(luò)模型,然后,通過對(duì)象之間的關(guān)聯(lián)關(guān)系建立影響力網(wǎng)絡(luò),并從中獲得影響力最大的個(gè)體。
對(duì)于一群相互關(guān)聯(lián)的對(duì)象,我們使用圖作為模型來評(píng)估其中每個(gè)對(duì)象的影響力。設(shè)圖G為(V,E),其中對(duì)象的集合構(gòu)成頂點(diǎn)集V,而對(duì)象之間的關(guān)系構(gòu)成邊集E。對(duì)于每一個(gè)v∈V,有自權(quán)重R(v),每一條邊e=(u,v)∈E,有邊權(quán)重W(u,v)。
為簡單起見,先定義初始頂點(diǎn)強(qiáng)度為
(1)
考慮到每個(gè)頂點(diǎn)有其自身的權(quán)重,可將頂點(diǎn)強(qiáng)度S(v)改進(jìn)為
(2)
其中最具影響力頂點(diǎn)v*的獲得可通過公式
v*=argmaxQ(v)。
(3)
為了衡量各個(gè)期刊之間的影響力關(guān)系,可考察期刊中發(fā)表的論文。通過論文的引用關(guān)系來決定期刊之間的關(guān)系,根據(jù)引用度量值的累加計(jì)算期刊之間的權(quán)值,并最終獲得所有期刊的影響力圖GJ。
首先建立論文的引用關(guān)系網(wǎng)絡(luò)。需要明確論文與論文之間的引用關(guān)系,通過檢索相關(guān)期刊文獻(xiàn)數(shù)據(jù)庫,可以得到所有論文的引用情況。且由于論文之間可能存在相互引用關(guān)系,故該引用關(guān)系網(wǎng)絡(luò)圖為有向圖中的雙向圖。假定所有的論文構(gòu)成了頂點(diǎn)集V,對(duì)于任意的論文u和v,若論文u引用了論文v,則它們之間存在一條有向邊(u, v),并定義邊的初始權(quán)重W(u, v) = 1,否則它們之間不存在邊。
考慮期刊的影響力圖。設(shè)有期刊{J1,J2,…,Jt},由此定義了V的一個(gè)劃分為{V1, V2, …, Vt},其中Vi中所有論文發(fā)自同一期刊Ji(1≤ i≤t),因此它們滿足
Vi∩Vj=? (1≤i,j≤t),
(4)
于是期刊{J1,J2, …,Jt}形成了GJ= (VJ,EJ),可將Jp與Jq之間的邊權(quán)重定義為
(5)
可以基于頂點(diǎn)強(qiáng)度[4-6]來計(jì)算期刊的影響力,對(duì)于期刊Jp(1≤p≤t),定義其影響力S為
(6)
于是即可得到所有期刊的影響力度量。
還可以對(duì)上述模型進(jìn)行改進(jìn),檢索每個(gè)期刊的論文總數(shù)n,并用它的倒數(shù)作為期刊的自權(quán)重R(Jp)(1≤p≤t)的值,即R(Jp) = 1/n,再與相應(yīng)期刊的邊權(quán)重進(jìn)行運(yùn)算,得到其影響力Q為
(7)
學(xué)術(shù)期刊的物理關(guān)聯(lián)性可以有多種選擇,傳統(tǒng)上研究人員通常選擇專業(yè)性較緊密的期刊形成網(wǎng)絡(luò),但實(shí)際上地緣性等物理指標(biāo)更為適合。例如某地區(qū)的高校學(xué)報(bào)是該地區(qū)高校學(xué)術(shù)交流的一種體現(xiàn)方式,由于物理關(guān)聯(lián)緊密,高校研究人員相互關(guān)聯(lián)較強(qiáng),從而讓對(duì)應(yīng)的高校學(xué)報(bào)的網(wǎng)絡(luò)結(jié)構(gòu)更為緊密,因此可以此為準(zhǔn)則選擇期刊并評(píng)估其影響力。
從某地區(qū)高校中選取15所具有代表性的理工類高校,并通過查閱中國期刊全文數(shù)據(jù)庫中對(duì)應(yīng)高校學(xué)報(bào)J1到J15,分別將2011-2013年各學(xué)報(bào)引用其他學(xué)報(bào)的情況進(jìn)行統(tǒng)計(jì)(表1),在統(tǒng)計(jì)過程中不考慮自引的情況。表1中橫向表示所選取的15所高校學(xué)報(bào),縱向表示被引用的高校學(xué)報(bào),矩陣數(shù)據(jù)表示三年內(nèi)橫向高校學(xué)報(bào)引用縱向高校學(xué)報(bào)中論文的總次數(shù)。
表1 某地區(qū)理工類高校學(xué)報(bào)2011-2013年總引用情況
使用Pajek軟件[7]將表1中的數(shù)據(jù)繪成引用關(guān)系網(wǎng)絡(luò)圖(圖1),圖中的頂點(diǎn)代表所選的15所高校學(xué)報(bào),頂點(diǎn)上的數(shù)據(jù)表明入度和出度之和,頂點(diǎn)越大表明數(shù)據(jù)值越大,相同的數(shù)據(jù)頂點(diǎn)大小相同,箭頭指向的是被引用的學(xué)報(bào)所在高校。由此也可以看出,J4所在頂點(diǎn)最大,即具有最高的影響力其次依次是J7,J5,J1等,說明這些高校學(xué)報(bào)具有較高的影響力,其論文具有較高的參考價(jià)值。
圖1 某地區(qū)理工類高校學(xué)報(bào)論文引用網(wǎng)絡(luò)
計(jì)算這些期刊的影響力S和Q,并對(duì)比傳統(tǒng)的復(fù)合影響因子[8],具體統(tǒng)計(jì)數(shù)據(jù)如表2所示。由于本方案更強(qiáng)調(diào)網(wǎng)絡(luò)結(jié)構(gòu)的關(guān)聯(lián)性,因此比傳統(tǒng)的單純強(qiáng)調(diào)影響因子的評(píng)價(jià)更貼近實(shí)際。
表2 期刊影響力評(píng)分排名
根據(jù)物理關(guān)聯(lián)性合理選取了學(xué)術(shù)期刊,并對(duì)其進(jìn)行影響力評(píng)估,相比于傳統(tǒng)的評(píng)估方案更為合理。具有較強(qiáng)物理關(guān)聯(lián)的期刊之間能形成較緊密的網(wǎng)絡(luò)結(jié)構(gòu),這有助于合理評(píng)估學(xué)術(shù)影響力。
未來需要對(duì)物理關(guān)聯(lián)性指標(biāo)進(jìn)一步量化,并納入較多的因素以改善模型的合理性。例如有些學(xué)報(bào)被一些特定學(xué)報(bào)引用次數(shù)相對(duì)較多,其主要原因是由于這些學(xué)校之間專業(yè)對(duì)口性稍強(qiáng),這需要對(duì)模型進(jìn)一步修正。
[1]LewisTG.NetworkScience:TheoryandApplications[M].NewJersey:Wiley, 2009: 1-22.
[2]EasleyDA,KleinbergJM.Networks,Crowds,andMarkets:ReasoningAboutaHighlyConnectedWorld[M].NewYork:CambridgeUniversityPress, 2010: 1-20.
[3]LiEY,LiaoCH,YenHR.Co-authorshipnetworksandresearchimpact:Asocialcapitalperspective[J].ResearchPolicy, 2013, 42(9): 1515-1530.
[4] 譚躍進(jìn), 吳俊, 鄧宏鐘.復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)重要度評(píng)估的節(jié)點(diǎn)收縮方法[J]. 系統(tǒng)工程理論與實(shí)踐, 2006, 26(11): 79-83.
[5] 周璇, 張鳳鳴, 李克武, 等.利用重要度評(píng)價(jià)矩陣確定復(fù)雜網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)[J]. 物理學(xué)報(bào), 2012, 61(5): 1-7.
[6] 張琨, 李配配, 朱保平, 等.基于PageRank的有向加權(quán)復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)重要性評(píng)估方法[J]. 南京航空航天大學(xué)學(xué)報(bào), 2013, 45(3): 429-434.
[7]BatageljV,MrvarA.Pajek:ProgramforLargeNetworkAnalysis[CP/OL].(2014-03-04)[2014-03-15].http://pajek.imfm.si/doku.php?id=pajek.
[8] 中國知網(wǎng).期刊復(fù)合影響因子[DB/OL].(2008-01-12)[2014-03-15].http://cpas.cnki.net/OldCore/.
[責(zé)任編輯:王輝]
Influence citation network analysis of academic journals based on physical relations
JIN Fei1, XIE Xie2, ZHENG Liang2, JU Yue2, WANG Hao2
(1. Jiangsu Wisedu Information Technology Co., Ltd, Nanjing 211100, China;2. School of Communication and Information Engineering, Xi’an University of Posts and Telecommunications, Xi’an 710121, China)
Influence of academic journals is analysed in the perspective of network science. Journals are chosen based on their physical relations to fix the problem of omitting network structure connection strength in traditional methods. The citation network of journals is established by the citation relationship between them, and the citation statics of the journals is obtained based on the vertexes strength, which is used to evaluate the influence of journals. The weight of vertexes is introduced to improve the measurement of influence, and university journals with closely geopolitical relation are taken as an example to measure influence. Data analyses show that the citation network method can evaluate the journal influence effectively, especially for the journal group with the same physical attribute.
network science, cictation network, academic journals, influence analysis
10.13682/j.issn.2095-6533.2014.05.022
2014-03-15
陜西省教育廳專項(xiàng)科研計(jì)劃基金資助項(xiàng)目(2013JK1131)
金飛(1979-),男,碩士研究生,工程師,從事大數(shù)據(jù)處理研究。E-mail:kimfly@163.com 謝勰(1981-),男,副教授,從事算法設(shè)計(jì)與分析研究。E-mail:xiexiexx@xupt.edu.cn
TP393
A
2095-6533(2014)05-0112-04