,
自然界中許多復(fù)雜系統(tǒng)都可以通過構(gòu)建網(wǎng)絡(luò)加以描述。一個(gè)典型的網(wǎng)絡(luò)是由許多節(jié)點(diǎn)與連接兩個(gè)節(jié)點(diǎn)的邊組成的,其中節(jié)點(diǎn)用來代表真實(shí)系統(tǒng)中的不同個(gè)體,而邊則用來表示個(gè)體之間的關(guān)系[1]
在情報(bào)學(xué)界,許多研究者通過構(gòu)建網(wǎng)絡(luò)的方法來研究知識(shí)的流動(dòng)關(guān)系(通過引文網(wǎng)絡(luò))或科研合作關(guān)系(通過合著網(wǎng)絡(luò))。為了深入研究知識(shí)的結(jié)構(gòu)和演化過程,研究者往往選擇構(gòu)建共詞網(wǎng)絡(luò)。共詞網(wǎng)絡(luò)是一種具有認(rèn)知意義的知識(shí)網(wǎng)絡(luò),其節(jié)點(diǎn)是最基本的知識(shí)單元——關(guān)鍵詞。共詞網(wǎng)絡(luò)的形成與演化既反映了科學(xué)知識(shí)單元的生產(chǎn)過程,又反映了科學(xué)共同體對(duì)科學(xué)知識(shí)結(jié)構(gòu)的認(rèn)知狀態(tài)[2]。
以往的詞共現(xiàn)網(wǎng)絡(luò)分析主要是基于作者關(guān)鍵詞,這些詞是作者投稿時(shí)添加的自然語言詞匯,用于揭示論文主題?!白髡哧P(guān)鍵詞”雖然反映了作者對(duì)研究課題最的理解,但不一定是最適合論文主題標(biāo)引的詞匯,缺乏準(zhǔn)確性和規(guī)范性,不同作者在表達(dá)同一語義時(shí)可能選擇不同的詞。而主題詞(也稱敘詞)是指以規(guī)定概念為基準(zhǔn),經(jīng)過規(guī)范化和優(yōu)選處理,具有組配功能,并能顯示詞間語義關(guān)系的動(dòng)態(tài)性的詞或詞組。美國國立醫(yī)學(xué)圖書館(NLM)即依據(jù)MeSH主題詞表對(duì)MEDLINE中的每篇文獻(xiàn)進(jìn)行主題詞標(biāo)引,以保證相對(duì)完整且精煉地揭示該文獻(xiàn)的主題內(nèi)容。MEDLINE文獻(xiàn)記錄中標(biāo)引兩種不同的主題詞信息,分別是該文獻(xiàn)的主要主題詞+副主題詞、特征詞。主要主題詞+副主題詞能表達(dá)文獻(xiàn)的主要論點(diǎn);而特征詞是代表某些特殊概念的一組標(biāo)引詞,是專門為生物醫(yī)學(xué)的基礎(chǔ)或臨床科研人員設(shè)置的具有特殊意義的詞匯[3]。這兩種MeSH詞在文獻(xiàn)內(nèi)容揭示方面具有不同的信息含量和重要性。
因此,本文從MEDLINE中收集文獻(xiàn)記錄,提取主題詞+副主題詞、特征詞,分別構(gòu)建主題詞共現(xiàn)網(wǎng)絡(luò)。比較這兩種知識(shí)網(wǎng)絡(luò)屬性上的差異,有利于準(zhǔn)確探索知識(shí)網(wǎng)絡(luò)的基本結(jié)構(gòu)與特征,為進(jìn)一步開展網(wǎng)絡(luò)演化研究奠定基礎(chǔ)。首先檢驗(yàn)節(jié)點(diǎn)中心性指標(biāo),然后根據(jù)節(jié)點(diǎn)的度分布,檢驗(yàn)兩種網(wǎng)絡(luò)的節(jié)點(diǎn)度分布的無標(biāo)度性,同時(shí)通過兩種網(wǎng)絡(luò)的整體屬性(平均距離和聚集系數(shù))檢驗(yàn)其小世界效應(yīng),便于根據(jù)不同的分析目的選擇合適的詞共現(xiàn)網(wǎng)絡(luò)。
本文選取發(fā)展較為成熟的學(xué)科藥理學(xué)作為研究主題。在Journal Citation Records(JCR)中以“PHARMACOLOGY & PHARMACY”為學(xué)科主題,選取其中在2013年影響因子排名前5的期刊:Pharmacological Reviews,Advanced Drug Delivery Review,Trends in Pharmacological Science,Pharmacology & Therapeutics,Drug Metablism Review。在PubMed中分別檢索這5種期刊2009-01-01至2013-12-31刊發(fā)的全部文獻(xiàn),共得到2044篇文獻(xiàn),下載并保存為XML格式。
將收集到的2 044篇文獻(xiàn)導(dǎo)入BICOMB(Bibliographic Item Co-Occurrence Matrix Builder,書目共現(xiàn)分析系統(tǒng)),提取并統(tǒng)計(jì)全部主題詞+副主題詞、主要主題詞+副主題詞的詞頻信息,按出現(xiàn)頻次從高到低排列,分別選取前970個(gè)詞構(gòu)建兩種共詞矩陣。為了顯示具體的提取結(jié)果,以文獻(xiàn)Purinergic Signaling and Blood Vessels in Health and Disease(PMID:24335194)為例,顯示這兩種不同的主題詞提取結(jié)果(表1),最左側(cè)的一列為該文獻(xiàn)在MEDLINE中主題詞標(biāo)引信息。
表1 示例文獻(xiàn)的不同主題詞提取結(jié)果
分別將上述兩種共詞矩陣導(dǎo)入社會(huì)網(wǎng)絡(luò)分析軟件UCINET,并用UCINET內(nèi)置的NetDraw生成詞共現(xiàn)網(wǎng)絡(luò),保存為Pajek可分析的網(wǎng)絡(luò)格式,用于下一步詞共現(xiàn)網(wǎng)絡(luò)屬性分析。為了簡(jiǎn)便起見,將全部主題詞+副主題詞共詞矩陣生成的詞共現(xiàn)網(wǎng)絡(luò)稱為詞共現(xiàn)網(wǎng)絡(luò)1,主要主題詞+副主題詞共詞矩陣生成的詞共現(xiàn)網(wǎng)絡(luò)稱為詞共現(xiàn)網(wǎng)絡(luò)2。
1.4.1 兩種網(wǎng)絡(luò)節(jié)點(diǎn)中心性分析方法
將上一步生成的兩種詞共現(xiàn)網(wǎng)絡(luò)分別導(dǎo)入社會(huì)網(wǎng)絡(luò)分析軟件Pajek,分別計(jì)算兩種網(wǎng)絡(luò)的各個(gè)節(jié)點(diǎn)的3種中心性(centrality)指標(biāo):點(diǎn)度中心度(degree)、接近中心度(closeness)、中介中心度(betweenness)。
1.4.2 兩種網(wǎng)絡(luò)無標(biāo)度性的分析方法
通過Pajek計(jì)算出每個(gè)網(wǎng)絡(luò)的節(jié)點(diǎn)的度值,并且使用R語言畫出每個(gè)網(wǎng)絡(luò)的度分布圖和累積度分布圖,用Python的powerlaw包[3]計(jì)算度值大于某個(gè)值時(shí)的冪指數(shù)γ的值,并進(jìn)行統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)。
1.4.3 兩種網(wǎng)絡(luò)小世界效應(yīng)的分析方法
采用Mark等[4]提出的復(fù)雜網(wǎng)絡(luò)小世界效應(yīng)的判斷方法,網(wǎng)絡(luò)G的平均距離記為Lg,聚集系數(shù)記為Cg。聚集系數(shù)采用Watt和Strogatz定義的算法[5],節(jié)點(diǎn)的聚集系數(shù)為該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)之間的連邊數(shù)占該節(jié)點(diǎn)所有鄰居節(jié)點(diǎn)之間最大連邊數(shù)的比例,網(wǎng)絡(luò)的聚集系數(shù)為所有度值大于1的節(jié)點(diǎn)聚集系數(shù)的均值。與該網(wǎng)絡(luò)有相同節(jié)點(diǎn)數(shù)和連邊數(shù)目的隨機(jī)網(wǎng)絡(luò)的平均距離記為Lrand,聚集系數(shù)記為Crand。如果Lg>=Lrand且Cg>>Crand,則認(rèn)為網(wǎng)絡(luò)G具有小世界效應(yīng)。
為了消除產(chǎn)生隨機(jī)網(wǎng)絡(luò)時(shí)的誤差,用Pajek軟件分別為兩種共詞網(wǎng)絡(luò)產(chǎn)生與其節(jié)點(diǎn)數(shù)目和平均度值相等的1 000個(gè)隨機(jī)網(wǎng)絡(luò),并計(jì)算共詞網(wǎng)絡(luò)和隨機(jī)網(wǎng)絡(luò)的平均距離和聚集系數(shù),最后用小世界效應(yīng)測(cè)度S判斷共詞網(wǎng)絡(luò)是否有小世界效應(yīng)。
一個(gè)節(jié)點(diǎn)的點(diǎn)度中心度就是它的點(diǎn)度,即直接與它相連的節(jié)點(diǎn)的個(gè)數(shù)。節(jié)點(diǎn)的點(diǎn)度中心度是衡量節(jié)點(diǎn)重要性最簡(jiǎn)單最直接的方法,一般而言,一個(gè)節(jié)點(diǎn)的度越大,就意味著這個(gè)節(jié)點(diǎn)越重要,但并不是所有網(wǎng)絡(luò)中度大的節(jié)點(diǎn)都是重要的[1]。Kitsak等人指出,節(jié)點(diǎn)的傳播影響力與節(jié)點(diǎn)所處的網(wǎng)絡(luò)的位置有關(guān)。如果節(jié)點(diǎn)處于網(wǎng)絡(luò)的核心位置,即使其連接度很小,也往往具有高的影響力;相反,即使大度節(jié)點(diǎn),如果它處于網(wǎng)絡(luò)的邊緣,也不會(huì)有高的影響力[6]。于是人們又提出了其他用于衡量節(jié)點(diǎn)重要性的指標(biāo),如接近中心度就是一種與最短路徑相關(guān)的中心性指標(biāo)。有文獻(xiàn)將它定義為節(jié)點(diǎn)與網(wǎng)絡(luò)中其他所有節(jié)點(diǎn)最短距離的平均值[7],也有文獻(xiàn)將它定義為該節(jié)點(diǎn)與網(wǎng)絡(luò)中其他各個(gè)節(jié)點(diǎn)之間最短距離之和[8]。這兩種定義方法都提示,如果一個(gè)節(jié)點(diǎn)到達(dá)網(wǎng)絡(luò)其他節(jié)點(diǎn)的最短距離均值(或之和)越小,即其接近中心度的值越小,該節(jié)點(diǎn)可能更加重要。為了使節(jié)點(diǎn)的接近中心度值與其重要性看上去“正相關(guān)”,本文采取另一種接近中心性的定義方法,即一個(gè)節(jié)點(diǎn)的接近中心度為其他節(jié)點(diǎn)數(shù)除以該節(jié)點(diǎn)與其他節(jié)點(diǎn)的最短距離之和[9]。此外,還有一種與最短距離有關(guān)的節(jié)點(diǎn)中心性指標(biāo)為節(jié)點(diǎn)的中介中心度。一個(gè)節(jié)點(diǎn)的中介中心度為經(jīng)過該節(jié)點(diǎn)最短距離的數(shù)量與網(wǎng)絡(luò)中所有其他節(jié)點(diǎn)之間最短距離的數(shù)量之比。
兩種詞共現(xiàn)網(wǎng)絡(luò)的以上3種中心性指標(biāo)排名前10的節(jié)點(diǎn)信息分別見表2和表3。
比較詞共現(xiàn)網(wǎng)絡(luò)1和詞共現(xiàn)網(wǎng)絡(luò)2的3種中心度指標(biāo),發(fā)現(xiàn)詞共現(xiàn)網(wǎng)絡(luò)1的3種中心性指標(biāo)較高的詞都是比較籠統(tǒng)和宏觀的詞,如Humans、Animals、Drug Delivery Systems、Drug Design等,尤其是中心性指標(biāo)最高的詞Humans和Animals,它們?cè)谥黝}標(biāo)引時(shí)作為特征詞。由于本文選擇的研究主題為藥理學(xué),藥理學(xué)又屬于生物醫(yī)學(xué),在進(jìn)行文獻(xiàn)標(biāo)引時(shí),大部分文獻(xiàn)都需要標(biāo)引這種特征詞。由于詞共現(xiàn)網(wǎng)絡(luò)1是由全部主題詞和副主題詞構(gòu)成的,含有不能表述文獻(xiàn)主要論點(diǎn)的特征詞,而這些特征詞又是大部分生物醫(yī)學(xué)文獻(xiàn)標(biāo)引時(shí)都會(huì)用到的,使得中心性指標(biāo)最高的詞為特征詞。因此在詞共現(xiàn)網(wǎng)絡(luò)1中,Humans和Animals不僅出現(xiàn)頻次最高,中心性指標(biāo)也是最高的。但從分析研究主題的角度來看,Humans和Animals卻不能表示該研究主題的主要研究方向。而詞共現(xiàn)網(wǎng)絡(luò)2是僅由主要主題詞和副主題詞構(gòu)成的,其3種中心性較高的詞就較為具體和專指,并且由于有副主題詞限定,使得這些詞在表述研究?jī)?nèi)容方面更加詳細(xì)。例如詞共現(xiàn)網(wǎng)絡(luò)2的3種中心性指標(biāo)排名前4位的詞為Drug Delivery Systems,Drug Delivery Systems / methods,Neoplasms / drug therapy,Drug Design。從這些詞可看出,藥理學(xué)研究熱點(diǎn)具體為藥物傳遞系統(tǒng)、腫瘤的藥物治療、藥物設(shè)計(jì)等,與實(shí)際研究情況較為相符。根據(jù)對(duì)詞共現(xiàn)網(wǎng)絡(luò)1和詞共現(xiàn)網(wǎng)絡(luò)2的中心性指標(biāo)較高的詞的分析,可以發(fā)現(xiàn)在有的網(wǎng)絡(luò)中,中心性指標(biāo)最高的節(jié)點(diǎn)或許是對(duì)網(wǎng)絡(luò)結(jié)構(gòu)較為重要的節(jié)點(diǎn),但在具體的專業(yè)背景下,這些節(jié)點(diǎn)可能并不是最重要的或是最能為我們帶來一定啟發(fā)的節(jié)點(diǎn)。因此,在采用構(gòu)建網(wǎng)絡(luò)的方法來分析某一研究領(lǐng)域的問題時(shí),不能盲目地認(rèn)為中心性指標(biāo)最高的節(jié)點(diǎn)就一定是最關(guān)鍵的節(jié)點(diǎn),對(duì)中心性指標(biāo)較高的節(jié)點(diǎn)的分析應(yīng)結(jié)合一定的專業(yè)知識(shí)才能得出可靠的結(jié)論。
表2 詞共現(xiàn)網(wǎng)絡(luò)1節(jié)點(diǎn)中心性指標(biāo)排名前10的節(jié)點(diǎn)信息
表3 詞共現(xiàn)網(wǎng)絡(luò)2節(jié)點(diǎn)中心性指標(biāo)排名前10的節(jié)點(diǎn)信息
近年來的實(shí)證研究表明,很多真實(shí)網(wǎng)絡(luò)的度分布都近似地遵從冪函數(shù)形式,即P(k)~k-γ,γ稱為冪指數(shù)[10]。由于這類冪函數(shù)是標(biāo)度不變的,因此這類網(wǎng)絡(luò)也被稱作無標(biāo)度網(wǎng)絡(luò)。Barabási和Albert的開創(chuàng)性研究激起了無標(biāo)度網(wǎng)絡(luò)研究的熱潮[11]。Barabási發(fā)現(xiàn),冪指數(shù)γ決定網(wǎng)絡(luò)的性質(zhì);γ的值越小,大度值節(jié)點(diǎn)在網(wǎng)絡(luò)中越重要;當(dāng)γ>3時(shí),度值的大小與該節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要性與否則關(guān)系不大;當(dāng)2<γ<3時(shí),度值最大的節(jié)點(diǎn)與整個(gè)網(wǎng)絡(luò)中一小部分節(jié)點(diǎn)相連;當(dāng)γ=2時(shí),易形成中心輻射狀網(wǎng)絡(luò),度值最大的節(jié)點(diǎn)與網(wǎng)絡(luò)中大部分節(jié)點(diǎn)相連[12]。網(wǎng)絡(luò)無標(biāo)度性質(zhì)的發(fā)現(xiàn)掀起了一場(chǎng)大規(guī)模的針對(duì)實(shí)際網(wǎng)絡(luò)的實(shí)證研究。研究者發(fā)現(xiàn),在自然界、工程界以及社會(huì)界中幾乎所有的實(shí)際網(wǎng)絡(luò)都具有無標(biāo)度特性,并且絕大多數(shù)實(shí)際網(wǎng)絡(luò)的度分布冪指數(shù)γ均位于2-3[13]。需要注意的是,冪律分布僅適用于點(diǎn)度分布的右側(cè)尾部,即點(diǎn)度較高的取值區(qū)間,且無標(biāo)度特征只會(huì)出現(xiàn)在大型網(wǎng)絡(luò)中。
詞共現(xiàn)網(wǎng)絡(luò)1和詞共現(xiàn)網(wǎng)絡(luò)2都只有970個(gè)節(jié)點(diǎn),節(jié)點(diǎn)數(shù)量較少,不能算作大型網(wǎng)絡(luò),且詞共現(xiàn)網(wǎng)絡(luò)1的度值在3-996之間,詞共現(xiàn)網(wǎng)絡(luò)2的度值在0-154之間,度值的變異范圍不夠大,以至于無法確定它們是否為無標(biāo)度分布。但本文還是按照正常分析流程作圖(圖1,圖2),并計(jì)算度值分布右側(cè)尾部?jī)缰笖?shù)γ的值。
圖1 詞共現(xiàn)網(wǎng)絡(luò)1的度分布圖(左)和累計(jì)度分布圖(右)
圖2 詞共現(xiàn)網(wǎng)絡(luò)2的度分布圖(左)和累計(jì)度分布圖(右)
冪律分布曲線在雙對(duì)數(shù)坐標(biāo)軸上是一條向右下方傾斜的直線。詞共現(xiàn)網(wǎng)絡(luò)1和詞共現(xiàn)網(wǎng)絡(luò)2的度分布圖和累計(jì)度分布圖都采用雙對(duì)數(shù)坐標(biāo)軸。詞共現(xiàn)網(wǎng)絡(luò)1的度分布圖(圖1)似乎是一條向右下傾斜的線,由于收集的數(shù)據(jù)不夠多,本文僅收了詞頻排名前970的詞用于構(gòu)成詞共現(xiàn)網(wǎng)絡(luò),且這些詞中度值最低的詞Xenobiotics的度值為3。因此無法顯示小于3的低點(diǎn)度區(qū)的節(jié)點(diǎn)的度值分布特征,且高點(diǎn)度值區(qū)域由于度值的變異程度較大,所以度分布圖不直觀,故采用累積度分布圖。累積度分布圖的縱坐標(biāo)為點(diǎn)度值大于某值的所有節(jié)點(diǎn)的累積頻數(shù),可以看到,在度值大于40左右時(shí),累積度分布近似呈一條向右下方的直線。 Python的powerlaw包可自動(dòng)計(jì)算出詞共現(xiàn)網(wǎng)絡(luò)1在最小度值為45時(shí)冪律分布擬合較好,對(duì)應(yīng)的冪指數(shù)γ的值為2.843180。Python的powerlaw還可以比較冪律分布和其他幾種重尾分布,檢驗(yàn)冪律分布是否為最優(yōu)擬合。
詞共現(xiàn)網(wǎng)絡(luò)1冪律分布的統(tǒng)計(jì)推斷結(jié)果見表4。從表4可看出,冪律分布和指數(shù)分布相比,更契合數(shù)據(jù),且p值(0.005337)小于0.05,有統(tǒng)計(jì)學(xué)意義,而其他三種重尾分布雖然比冪律分布契合數(shù)據(jù),但無統(tǒng)計(jì)學(xué)意義,所以可以得出詞共現(xiàn)網(wǎng)絡(luò)1在度值大于45的尾部符合冪律分布。詞共現(xiàn)網(wǎng)絡(luò)2的度分布圖(圖2)在度值在10-20之間近似為一條向右下方傾斜的直線,高點(diǎn)度區(qū)和低點(diǎn)度區(qū)的變異程度較大,可能也是由于數(shù)據(jù)不足造成的。它的累積度分布圖在度值大于10左右的區(qū)域近似呈一條向右下傾斜的直線。在用Python的powerlaw包計(jì)算得最小度值為9,對(duì)應(yīng)的冪指數(shù)γ為2.845157。
表4 詞共現(xiàn)網(wǎng)絡(luò)1冪律分布的統(tǒng)計(jì)推斷結(jié)果
詞共現(xiàn)網(wǎng)絡(luò)2冪律分布的統(tǒng)計(jì)推斷結(jié)果見表5。根據(jù)表5的結(jié)果,分析方法同詞共現(xiàn)網(wǎng)絡(luò)1,可以認(rèn)為詞共現(xiàn)網(wǎng)絡(luò)2在度值大于9的的尾部符合冪律分布。表5顯示,即使分析所用的詞共現(xiàn)網(wǎng)絡(luò)1和詞共現(xiàn)網(wǎng)絡(luò)2不是大型網(wǎng)絡(luò),但其冪指數(shù)γ的值類似于許多實(shí)測(cè)網(wǎng)絡(luò)的γ值,在2-3之間,因此可近似認(rèn)為詞共現(xiàn)網(wǎng)絡(luò)1和詞共現(xiàn)網(wǎng)絡(luò)2具有無標(biāo)度特征。
表5 詞共現(xiàn)網(wǎng)絡(luò)2冪律分布的統(tǒng)計(jì)推斷結(jié)果
兩種詞共現(xiàn)網(wǎng)絡(luò)小世界測(cè)度S見表6。從表6可看出,兩種詞共現(xiàn)網(wǎng)絡(luò)的小世界效應(yīng)測(cè)度S的平均值、最大值、最小值都大于1,因此可以認(rèn)為這兩種詞共現(xiàn)網(wǎng)絡(luò)都具有小世界效應(yīng)。
兩種詞共現(xiàn)網(wǎng)絡(luò)的各屬性值詳見表7。若將平均距離和聚集系數(shù)相比,詞共現(xiàn)網(wǎng)絡(luò)1的比值約為4.0257,詞共現(xiàn)網(wǎng)絡(luò)2的比值約為7.8696,提示詞共現(xiàn)網(wǎng)絡(luò)1比詞共現(xiàn)網(wǎng)絡(luò)2的小世界效應(yīng)更強(qiáng)。詞共現(xiàn)網(wǎng)絡(luò)1的平均距離約為2,詞共現(xiàn)網(wǎng)絡(luò)1的任意兩個(gè)詞之間的語義相關(guān)性只需要跨過兩個(gè)詞;詞共現(xiàn)網(wǎng)絡(luò)2的平均距離約為3,詞共現(xiàn)網(wǎng)絡(luò)2的任意兩個(gè)詞的語義相關(guān)性則需要跨過3個(gè)詞??赡苁窃~共現(xiàn)網(wǎng)絡(luò)1中有表述較為宏觀且非專指的特征詞如Humans、Animals等,這些詞和其他主題詞共同來標(biāo)引一篇文獻(xiàn),使得這些高中心性值的詞將詞共現(xiàn)網(wǎng)絡(luò)1中的其他詞(即節(jié)點(diǎn))凝結(jié)到一起,所以顯示出較強(qiáng)的小世界效應(yīng)。
表6 兩種詞共現(xiàn)網(wǎng)絡(luò)小世界測(cè)度S
表7 兩種詞共現(xiàn)網(wǎng)絡(luò)各屬性值
本文根據(jù)主題詞構(gòu)建了兩種詞共現(xiàn)網(wǎng)絡(luò),詞共現(xiàn)網(wǎng)絡(luò)1由全部主題詞+副主題詞構(gòu)成,詞共現(xiàn)網(wǎng)絡(luò)2由主要主題詞+副主題詞構(gòu)成。通過比較這兩種詞共現(xiàn)網(wǎng)絡(luò)的節(jié)點(diǎn)中心性指標(biāo)發(fā)現(xiàn),詞共現(xiàn)網(wǎng)絡(luò)1高中心性指標(biāo)的節(jié)點(diǎn)都是較為宏觀和籠統(tǒng)的詞,而詞共現(xiàn)網(wǎng)絡(luò)2高中心性指標(biāo)的詞較為專指,由于與副主題詞組配,更能顯示高中心性指標(biāo)的詞的具體表述內(nèi)容,較詞共現(xiàn)網(wǎng)絡(luò)1更適合構(gòu)建學(xué)科專業(yè)知識(shí)網(wǎng)絡(luò),并用于分析該學(xué)科的研究熱點(diǎn)和關(guān)鍵詞匯。對(duì)這兩種詞共現(xiàn)網(wǎng)絡(luò)中心性指標(biāo)較高的詞的對(duì)比分析發(fā)現(xiàn),選用不同的數(shù)據(jù)集構(gòu)建的不同網(wǎng)絡(luò),其中心性指標(biāo)較高的節(jié)點(diǎn)對(duì)于我們進(jìn)行分析有不同意義。有的網(wǎng)絡(luò)中,中心性指標(biāo)較高的節(jié)點(diǎn)不一定就是對(duì)研究分析最有貢獻(xiàn)或最關(guān)鍵的節(jié)點(diǎn),對(duì)中心性指標(biāo)較高的節(jié)點(diǎn)的分析應(yīng)根據(jù)一定的專業(yè)知識(shí)來分析,才能得出較為可靠的結(jié)論。
最后,本文就網(wǎng)絡(luò)的無標(biāo)度特性和小世界效應(yīng)進(jìn)行了分析。由于網(wǎng)絡(luò)的無標(biāo)度特性只出現(xiàn)在大型網(wǎng)絡(luò)中,節(jié)點(diǎn)的冪律分布僅適用于點(diǎn)度分布的右側(cè)尾部。本文所研究的兩種網(wǎng)絡(luò)都不算大型網(wǎng)絡(luò),且節(jié)點(diǎn)的度值變異范圍較小,故無法得出網(wǎng)絡(luò)是否具有無標(biāo)度特性。但本文還是按照正常分析流程計(jì)算出了冪指數(shù)γ的值,發(fā)現(xiàn)兩個(gè)網(wǎng)絡(luò)的γ在2-3之間,因此可以近似認(rèn)為這兩個(gè)詞共現(xiàn)網(wǎng)絡(luò)均具有無標(biāo)度特征。
為了分析網(wǎng)絡(luò)的小世界效應(yīng),本文采用Mark等人定義的小世界效應(yīng)測(cè)度S,發(fā)現(xiàn)兩種詞共現(xiàn)網(wǎng)絡(luò)都具有小世界效應(yīng)。而詞共現(xiàn)網(wǎng)絡(luò)1的小世界效應(yīng)較詞共現(xiàn)網(wǎng)絡(luò)2的更強(qiáng),可能因?yàn)槭窃~共現(xiàn)網(wǎng)絡(luò)1中有Humans、Animals等詞,大部分文獻(xiàn)的其他主題詞都需要和這些特征詞共同標(biāo)引一篇文獻(xiàn),這些較為宏觀和籠統(tǒng)的詞將網(wǎng)絡(luò)中其他節(jié)點(diǎn)連在一起,使得詞共現(xiàn)網(wǎng)絡(luò)1的平均距離較小。因此可以認(rèn)為詞共現(xiàn)網(wǎng)絡(luò)1較詞共現(xiàn)網(wǎng)絡(luò)2更適用于復(fù)雜網(wǎng)絡(luò)的屬性分析,網(wǎng)絡(luò)2適用于學(xué)科主題內(nèi)容分析。
本文僅選擇了藥理學(xué)這一專業(yè)構(gòu)建詞共現(xiàn)網(wǎng)絡(luò),且選擇的是近5年的數(shù)據(jù),可以嘗試用其他專業(yè),收集較大的時(shí)間跨度的數(shù)據(jù),構(gòu)建不同詞共現(xiàn)網(wǎng)絡(luò),分析網(wǎng)絡(luò)的節(jié)點(diǎn)中心性指標(biāo)等屬性。另外,本文構(gòu)建網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)選擇較少,可以嘗試選擇較多的節(jié)點(diǎn)構(gòu)建詞共現(xiàn)網(wǎng)絡(luò),分析大型網(wǎng)絡(luò)的無標(biāo)度特征等,或許會(huì)得到不同的結(jié)果,這將為進(jìn)行學(xué)科熱點(diǎn)分析和關(guān)鍵詞分析以及進(jìn)行復(fù)雜網(wǎng)絡(luò)屬性分析提供不同的詞共現(xiàn)網(wǎng)絡(luò)構(gòu)建方法。