李燕波
摘 要 論文對目前常用的兩種文獻計量可視化工具CiteSpace和HistCite的功能進行比較分析。通過設計八個文獻計量學指標作為兩種工具的實驗分析指標,以SCI中2003—2012年電子政務主題的1388篇研究性文獻為實驗文獻樣本,對這兩種工具在事先設定好的八個文獻計量學指標中的功能表現(xiàn)進行分析。最終從具體分析功能、圖譜可讀性和支持的數(shù)據(jù)格式三個角度對這兩個工具的功能進行了對比。
關(guān)鍵詞 文獻計量學 可視化分析 CiteSpace HistCite 電子政務
分類號 G250.252
Analysis of the Functions of the Two Bibliometrics Visualization Softwares based on the E-government Research
Li Yanbo
Abstract Under the purpose of the two bibliometric visualization tools CiteSpace and HistCite comparative analysis, eight bibliometric indicators are designed as the comparative indicators for the functions, and 1388 papers on e-government research are download from the Web of Science during 2003-2012 as the experimental literature sample. Based on these, functions of these two tools are compared by this paper. It compares their functions from the analysis functions, the knowledge mapping readability and the data format.
Keywords Bibliometric. Visualization analysis. CiteSpace. HistCite. E-government.
1 文獻計量可視化工具研究現(xiàn)狀
從1926年洛特卡定律的發(fā)現(xiàn)[1],到美國化學家格羅斯兄弟文獻學史上的第一次引文分析研究[2],再到1934年布拉德福定律[3]和1948年齊普夫定律[4],國外學者二十世紀二十年代到六十年代為文獻的定量研究做出了重要貢獻,但這些先驅(qū)者早期的定量研究均是分散、不系統(tǒng)的。直到1969年,英國情報學家阿倫·普里查德發(fā)表《文獻統(tǒng)計學還是文獻計量學?》一文[5],首次使用“文獻計量學”這一術(shù)語,取代了“文獻統(tǒng)計學”。這就將研究對象從期刊擴展到所有的書刊文獻,使有關(guān)文獻的定量研究統(tǒng)一在文獻計量學學科之下,至此文獻計量學研究逐漸走向系統(tǒng)化、廣泛化。為適應文獻信息量的增加,計算機、數(shù)學等方法在文獻計量學中的應用研究逐漸展開,由此便產(chǎn)生了文獻計量可視化的研究。20世紀50年代開始,加爾菲德開發(fā)的科學引文索引開始大規(guī)模的商業(yè)性應用,為文獻計量可視化的發(fā)展奠定了堅實的基礎(chǔ)。大量的文獻計量學研究轉(zhuǎn)向基于引文分析的可視化研究中,這其中的先驅(qū)當屬加爾菲德對DNA研究歷史圖的產(chǎn)生,是在1964年用手工繪制的[6]。從那以后,文獻計量可視化研究逐漸成為計算機科學、圖書情報學研究的熱點。經(jīng)過近70 年的發(fā)展,在引文分析理論、復雜網(wǎng)絡與社會網(wǎng)絡分析理論、信息可視化技術(shù)的推動下,信息可視化逐漸成為國內(nèi)外文獻計量學一個嶄新的研究熱點[7]。文獻計量可視化工具是文獻計量可視化研究的具體實現(xiàn)手段,總體來說,時下常用的文獻計量可視化工具主要源于三大領(lǐng)域。一是計算機科學領(lǐng)域的數(shù)據(jù)、信息、知識與知識域可視化研究;二是圖書情報領(lǐng)域的引文分析可視化、知識地圖和知識網(wǎng)絡等研究;三是復雜網(wǎng)絡系統(tǒng)和社會網(wǎng)絡分析的研究。目前三者的研究方向和內(nèi)容正在走向融合。文獻計量可視化工具可以分為兩類:一類為各種文獻數(shù)據(jù)庫附帶的文獻計量工具,(如Web of Science、中文社會科學引文索引、中國知網(wǎng)等),但可視化功能較弱;另一類為提供文獻計量功能的軟件,如美籍華人陳超美開發(fā)的CiteSpace、加菲爾德開發(fā)的HistCite、佩爾松開發(fā)的Bibexcel、Vladimir Batage lj和Andrej Mrvar開發(fā)的Pajek、印第安納大學開發(fā)的Science of Science、荷蘭萊頓大學開發(fā)的VOSViewer等,而這其中CiteSpace、HistCite由于其較強的可視化功能被國內(nèi)外學者所廣泛使用。
2 CiteSpace與HistCite功能分析
2.1 CiteSpace核心功能
CiteSpace軟件主要基于共引分析理論和尋徑網(wǎng)絡算法等,對特定領(lǐng)域文獻(集合)進行計量,以探尋出學科領(lǐng)域演化的關(guān)鍵路徑及其知識拐點(以關(guān)鍵論文為代表),并通過一系列可視化圖譜的繪制來形成對學科演化潛在動力機制的分析和學科發(fā)展前沿的探測。其所應用的主要數(shù)據(jù)包括Web of Science論文、Derwent 專利、Scopus等外文數(shù)據(jù)庫論文,近幾年由于國內(nèi)用戶的廣泛使用,該軟件又通過增加數(shù)據(jù)格式轉(zhuǎn)換模塊而實現(xiàn)了中文CSSCI、CNKI數(shù)據(jù)庫格式的計量分析。CiteSpace軟件的核心功能是探測和分析學科研究前沿的歷時性變化趨勢以及研究前沿與其知識基礎(chǔ)之間的關(guān)系,陳超美博士在軟件中設計了四個核心分析指標以實現(xiàn)這一功能,見表1。
表1 CiteSpace核心分析指標
2.2 HistCite功能
該軟件系SCI的發(fā)明人加菲爾德開發(fā),能夠用圖示的方式展示某一領(lǐng)域不同文獻之間的關(guān)系??梢钥焖賻椭覀兝L制出一個領(lǐng)域的發(fā)展歷史,定位出該領(lǐng)域的重要文獻,以及最新的重要文獻。HistCite目前用于分析的文獻信息只能來源于Web of Science數(shù)據(jù)庫(以下簡稱WoS),HistCite核心分析指標見表2。
表2 HistCite核心分析指標
3 CiteSpace與HistCite功能實驗比較研究:以國際電子政務主題文獻為例
3.1 數(shù)據(jù)來源
在WoS數(shù)據(jù)庫中獲取電子政務相關(guān)的研究性論文(包括期刊論文、會議論文和綜述)1388篇。本文主要采用CiteSpace與HistCite兩種可視化軟件對電子政務這一主題的八種文獻計量學指標進行比較分析,見表3。
表3 文獻計量學指標
3.2 作者、機構(gòu)和國家及其合作分布
3.2.1 CiteSpace的發(fā)文量和合作關(guān)系分析功能
(1)發(fā)文量及合作關(guān)系分析功能。CiteSpace可以形成作者、機構(gòu)和國家及其合作分布可視化分析圖譜。其中每一個結(jié)點代表一個作者、機構(gòu)或國家,結(jié)點大小反映的是發(fā)文量的多少,結(jié)點年輪顏色反映的是發(fā)文時間分布,色調(diào)由暖及冷指的時間由近及遠,點擊在任何一個結(jié)點上通過點擊鼠標右鍵,便可具體了解某個結(jié)點所代表的作者、機構(gòu)或國家的發(fā)文按時間分布的具體數(shù)值。結(jié)點之間的連線反映的是作者、機構(gòu)或國家具有合作關(guān)系。CiteSpace的這些功能不僅有助于研究者發(fā)現(xiàn)相關(guān)主題的權(quán)威研究作者、機構(gòu)或國家,而且對研究者挖掘該主題的研究團隊、跨越機構(gòu)或國家的合作具有十分有效的幫助,這為考察該主題的知識流動及共享提供了一個清晰的線索。而且由CiteSpace生成的圖譜顏色豐富、信息量大。
(2)作者共被引分析。CiteSpace可以根據(jù)作者發(fā)文被引及共被引情況,生成作者共被引分析圖譜。其中結(jié)點大小反映的是該結(jié)點所代表的作者被引頻次的高低,結(jié)點的年輪顏色反映的是該作者被引歷史,通過在該結(jié)點點擊右鍵可以具體了解該作者的被引頻次隨年度變化數(shù)值;結(jié)點之間的連線代表作者之間具有共被引關(guān)系(以下同)。結(jié)點外圈的顏色若是紫色,則代表該結(jié)點的中心性≥0.1(以下同),點的中心性是一個用以量化點在網(wǎng)絡中地位重要性的圖論概念,它是指網(wǎng)絡中經(jīng)過某點并連接這兩點的最短路徑占這兩點之間的最短路徑線總數(shù)之比。中間中心性高(在CiteSpace可視化圖譜中,中心性≥0.1便認為較高)的點往往位于連接兩個不同聚類的路徑上,是十分重要的結(jié)點,需重點考察其研究內(nèi)容。CiteSpace的作者共被引分析可以使眾多的著者按照同被引關(guān)系形成一個著者相關(guān)群,揭示出學科專業(yè)人員的組織結(jié)構(gòu)、聯(lián)系程度,進而反映出學科專業(yè)之間的聯(lián)系及其發(fā)展變化狀況[1]。
3.2.2 HistCite的發(fā)文量及其被引分析功能
HistCite可以顯示閾值范圍內(nèi)(即本研究中設置的被引頻次≥30次的論文)的總作者數(shù)、機構(gòu)數(shù)和國家數(shù)。也可以對作者、機構(gòu)和國家的發(fā)文量、作者發(fā)文當前主題內(nèi)被引頻次、WoS被引頻次三個文獻計量學指標的分布進行分析,而且通過點擊■、■、■三個按鈕可以分別對這三個指標進行排序,這些功能有助于研究者通過不同指標識別電子政務研究的發(fā)文情況、相關(guān)重要論文以及在WoS范圍內(nèi)具有較高影響力的論文,為發(fā)現(xiàn)重要的作者、機構(gòu)和國家和經(jīng)典文獻提供線索。但是該工具無法直接對作者、機構(gòu)、國家發(fā)文的文獻計量學指標進行可視化圖形分析,只能在數(shù)據(jù)基礎(chǔ)上借助EXCEL作圖分析。而且該工具無法進行合作分析。為節(jié)省篇幅,僅列出作者發(fā)文分布分析,見表4。
表4 HistCite的作者分析二維表
3.3 期刊及其共被引分布
3.3.1 CiteSpace的共被引分析功能
期刊的共被引關(guān)系強弱反映了期刊的親疏遠近關(guān)系,通過期刊共被引分析可以挖掘?qū)W術(shù)期刊之間的關(guān)系并且進行期刊分類,考察學科的內(nèi)部知識結(jié)構(gòu)和聯(lián)系情況[9]。CiteSpace可以按期刊被引情況生成期刊共被引分析圖譜,由此可以揭示對某一主題研究具有重要推動作用的期刊以及期刊的共被引關(guān)系。但是,CiteSpace無法實現(xiàn)期刊載文量分析。
3.3.2 HistCite的載文量及其被引分析功能
表5顯示了HistCite對電子政務研究主題的期刊載文分布結(jié)果。這一功能與前述作者、機構(gòu)和國家分布分析所具有的功能一致。但該工具只提供了期刊的主題內(nèi)和WoS范圍內(nèi)的被引分析,未能提供期刊的共被引分析。
表5 HistCite的期刊發(fā)文及被引分析二維表
3.4 學科分布及共現(xiàn)關(guān)系
CiteSpace是根據(jù)WoS數(shù)據(jù)庫的學科劃分標準而對相關(guān)主題的研究學科進行劃分的,而WoS數(shù)據(jù)庫的學科劃分是依據(jù)期刊所屬學科進行劃分的。因此,CiteSpace學科共現(xiàn)圖譜中結(jié)點較大的學科說明這個學科的相關(guān)期刊上發(fā)表這一主題的論文較多。學科之間的連線同樣是學科共現(xiàn)關(guān)系的揭示,通過這種學科共現(xiàn)考察可以了解跨學科研究情況。
3.5 關(guān)鍵詞及其共現(xiàn)分布
3.5.1 CiteSpace的關(guān)鍵詞頻及其共現(xiàn)分析功能
一般認為詞匯對在同一篇文獻中出現(xiàn)的次數(shù)越多,則代表這兩個主題的關(guān)系越緊密。統(tǒng)計一組文獻的關(guān)鍵詞或主題詞兩兩之間在同一篇文獻出現(xiàn)的頻率,便可形成由這些詞對關(guān)聯(lián)所組成的關(guān)鍵詞共現(xiàn)網(wǎng)絡,關(guān)鍵詞共現(xiàn)分析可應用于研究領(lǐng)域的識別和熱點分析、橫向和縱向分析領(lǐng)域、識別學科的發(fā)展過程和特點、找出領(lǐng)域或?qū)W科之間的關(guān)系等[10],同時可以了解某一特定主題的微觀研究領(lǐng)域。CiteSpace不僅能夠揭示高頻關(guān)鍵詞,還能夠揭示具有共現(xiàn)關(guān)系的關(guān)鍵詞,這為深入、細致的研究某一主題提供了十分有效的途徑。CiteSpace生成的關(guān)鍵詞共現(xiàn)圖譜可以將具有共現(xiàn)關(guān)系的關(guān)鍵詞按其研究的主題進行人工聚類分析。
3.5.2 HistCite的關(guān)鍵詞頻分析功能
HistCite的關(guān)鍵詞分布分析是以“words”(即單個關(guān)鍵詞)進行統(tǒng)計分析的,而且不具備“words”之間共現(xiàn)關(guān)系的分析,只能按“words”的詞頻數(shù)、當前主題內(nèi)被引頻次、WoS被引頻次三項指標定量統(tǒng)計(見表6),而且無可視化的圖譜,只能以二維表格的形式呈現(xiàn)。HistCite由于不能反映關(guān)鍵詞的共現(xiàn)關(guān)系,因此在微觀主題揭示方面具有較明顯的缺陷,如表3列出了按詞頻排序的前5位電子政務有關(guān)的“Word”,其中的很多單詞專指性很低,如GOVERNMENT、BASED、INFORMATION等,這使得無法通過這些高頻詞進行微觀主題的分析。
表6 HistCite的關(guān)鍵詞詞頻及被引分析二維表
3.6 文獻被引分析
3.6.1 CiteSpace的文獻共被引分析功能
CiteSpace除可以生成文獻共被引圖譜以揭示文獻被引頻次高低和文獻間的共被引關(guān)系外,還可以生成時間線圖譜和時區(qū)圖譜。時間線圖譜可以將研究主題各微觀知識領(lǐng)域進行聚類,同一聚類排在同一水平線上,并根據(jù)時間順序進行排列,從而展示研究主題各微觀知識領(lǐng)域的歷史成果,從中可以研究主題的重要奠基性文獻。時區(qū)圖是另一種側(cè)重于從時間維度上來表示知識演進的視圖,可以清晰地展示出文獻的更新和互相影響情況,它將結(jié)點定位在一個二維坐標系中。根據(jù)結(jié)點首次被引用的時間,結(jié)點被放在不同的時區(qū)中,并且所放位置的高度依次增加。一個從左到右,自下而上的知識演進圖就直觀的展示出來,位于坐標系靠左、靠上的結(jié)點可以認為是該知識領(lǐng)域的研究前沿。
3.6.2 HistCite的文獻被引分析功能
HistCite可以通過對從WoS下載的文獻依據(jù)被引頻次編制引文編年圖,這也是該工具的主要功能。點擊HistCite主界面最上方的“Tools”-“Graph Maker”-“Make Graph”按鈕,即可得到相應的引文編年圖。引文編年圖可以從GCS和LCS兩個角度進行編制,如果引文編年圖編制時選擇所有文獻,則用GCS和LCS編制的結(jié)果是一樣的;在實際繪制過程中,以 LCS 為依據(jù)編制引文編年圖更能體現(xiàn)研究的外延和分析的針對性,因此選擇LCS較為合適。圖1為采用HistCite編制的引文編年圖,每一個圓圈表示一篇文獻,圓圈大小代表文獻被引頻次的多少。被引頻次越高,圓圈就越大。帶箭頭的連線代表文獻節(jié)點之間的引用關(guān)系,箭頭指向的文獻是被引文獻,圓圈內(nèi)所標數(shù)字指明該節(jié)點文獻在文獻集合中的順序號。引文編年圖以從上到下的空間順序表示由先到后的時間順序,各文獻按照其發(fā)表年份的先后給予序號并安排在圖中相應位置。通過HistCite生成的引文編年圖,可以清楚地觀察到電子政務研究的歷史沿革、研究文獻之間的繼承關(guān)系以及在各研究階段的發(fā)展程度。圖中,2010—2012年的文獻節(jié)點是空白,表明在這個時間段內(nèi)沒有具有一定影響力的經(jīng)典文獻,這與文獻被引與時間的累積性相關(guān)。而較大的結(jié)點如158、220、324、343、225等代表的文獻具有較高的被引頻次,因此可以認為是電子政務研究中較經(jīng)典的文獻,通過對這些經(jīng)典文獻的分析,可以一定程度上了解電子政務研究的知識基礎(chǔ)與研究前沿。
然而,被引頻次僅僅是文獻影響力高低的反映,而文獻的共被引卻能夠反映文獻與文獻之間的研究方向或研究主題的關(guān)聯(lián),兩篇文獻共被引的頻次越多,說明它們學術(shù)研究方向的關(guān)聯(lián)性越強。由此推而廣之,由多篇文獻間的共被引關(guān)系形成的文獻共被引聚類,反映了聚類文獻之間共同的研究方向和關(guān)注的熱點主題[11]。HistCite無法實現(xiàn)文獻共被引分析,因此通過該軟件提供的引文編年圖不能夠?qū)崿F(xiàn)文獻的聚類,也就無法從引文分析的角度揭示解釋熱點主題以及知識結(jié)構(gòu)。
3.7 兩種工具比較結(jié)果
表7 兩種可視化工具的比較結(jié)果
CiteSpace和HistCite均是基于引文分析的文獻計量可視化分析工具,因此其基本的原理依據(jù)是一致的。CiteSpace的核心特色是可以實現(xiàn)文獻計量學指標網(wǎng)絡結(jié)構(gòu)的揭示(共現(xiàn)、共被引網(wǎng)絡),相對而言,HistCite無法揭示網(wǎng)絡結(jié)構(gòu),其核心特色表現(xiàn)在可以實現(xiàn)各文獻計量學指標的文獻集內(nèi)和WoS兩種范圍的被引頻次分析,而CiteSpace的被引頻次分析只限于考察主題的文獻集內(nèi)。具體來講兩種工具在功能上存在以下差異,如表7所示。
4 結(jié)語
通過CiteSpace和HistCite兩種可視化工具的比較可知,CiteSpace的功能更加豐富,而HistCite功能較為單一。但無論使用多么智能的可視化工具,在進行某一主題研究時,可視化工具只能提供我們一個研究線索,在具體研究時需要我們輔以深入、全面的文獻調(diào)研和專家咨詢才能使研究結(jié)果更科學。筆者認為,未來文獻計量可視化研究重點一方面要在知識單元間的測度更加精確與合理上下功夫。例如,通過計算機語義理解,解決一詞多義和一義多詞等詞形與詞性問題等;另一方面要進一步實現(xiàn)方法的融合與改進,進一步完善相關(guān)算法。例如,在共引分析中,根據(jù)兩被引文獻(或作者等)在同一文獻中的共被引強度給予不同的權(quán)值。
參考文獻:
[ 1 ] Lotka A J. The frequency distribution of scientific pr-
oductivity[J]. Journal of the Washington Academy of Sciences,1926,16(12):317-323.
[ 2 ] Gross P L K, Gross E M. College libraries and chemical education[J].Science,1927,66(1713):383-406.
[ 3 ] Bradford S C. Sources of information on specific subj-
ects[J]. Engineering,1934,23(3):85-88.
[ 4 ] Zipf G K. Selected studies of the principle of relative frequencies of language[M].Cambridge:Harvard Univ-
ersity Press,1932.
[ 5 ] Pritchard A. Statistical bibliography or bibliometrics?[J]. Journal of Documentation, 1969,25(4):348-349.
[ 6 ] Garfield E, Sher I H,Torpie R J. The Use of Citation Data in Writing the History of Science[M]. Philadelphia:Institute for Scientific Information,1964.
[ 7 ] Milgram S. The Small World Prolem[J].Psychology Today,1967 (2):60-67.
[ 8 ] 邱均平.信息計量學[M].武漢:武漢大學出版社,2007:408-409.
[ 9 ] 王賢文,劉則淵.基于共被引率分析的期刊分類研究[J].科研管理,2009(5):187-195.
[10] 吳曉秋,呂娜.基于關(guān)鍵詞共現(xiàn)頻率的熱點分析方法研究[J].情報理論與實踐,2012(8):115-119.
[11] 潘黎,侯劍華.國際高等教育研究的熱點主題和研究前沿:基于8種SSCI高等教育學期刊2000—2011年文獻共被引網(wǎng)絡圖譜的分析[J].教育研究,2012(6):136-143.
表6 HistCite的關(guān)鍵詞詞頻及被引分析二維表
3.6 文獻被引分析
3.6.1 CiteSpace的文獻共被引分析功能
CiteSpace除可以生成文獻共被引圖譜以揭示文獻被引頻次高低和文獻間的共被引關(guān)系外,還可以生成時間線圖譜和時區(qū)圖譜。時間線圖譜可以將研究主題各微觀知識領(lǐng)域進行聚類,同一聚類排在同一水平線上,并根據(jù)時間順序進行排列,從而展示研究主題各微觀知識領(lǐng)域的歷史成果,從中可以研究主題的重要奠基性文獻。時區(qū)圖是另一種側(cè)重于從時間維度上來表示知識演進的視圖,可以清晰地展示出文獻的更新和互相影響情況,它將結(jié)點定位在一個二維坐標系中。根據(jù)結(jié)點首次被引用的時間,結(jié)點被放在不同的時區(qū)中,并且所放位置的高度依次增加。一個從左到右,自下而上的知識演進圖就直觀的展示出來,位于坐標系靠左、靠上的結(jié)點可以認為是該知識領(lǐng)域的研究前沿。
3.6.2 HistCite的文獻被引分析功能
HistCite可以通過對從WoS下載的文獻依據(jù)被引頻次編制引文編年圖,這也是該工具的主要功能。點擊HistCite主界面最上方的“Tools”-“Graph Maker”-“Make Graph”按鈕,即可得到相應的引文編年圖。引文編年圖可以從GCS和LCS兩個角度進行編制,如果引文編年圖編制時選擇所有文獻,則用GCS和LCS編制的結(jié)果是一樣的;在實際繪制過程中,以 LCS 為依據(jù)編制引文編年圖更能體現(xiàn)研究的外延和分析的針對性,因此選擇LCS較為合適。圖1為采用HistCite編制的引文編年圖,每一個圓圈表示一篇文獻,圓圈大小代表文獻被引頻次的多少。被引頻次越高,圓圈就越大。帶箭頭的連線代表文獻節(jié)點之間的引用關(guān)系,箭頭指向的文獻是被引文獻,圓圈內(nèi)所標數(shù)字指明該節(jié)點文獻在文獻集合中的順序號。引文編年圖以從上到下的空間順序表示由先到后的時間順序,各文獻按照其發(fā)表年份的先后給予序號并安排在圖中相應位置。通過HistCite生成的引文編年圖,可以清楚地觀察到電子政務研究的歷史沿革、研究文獻之間的繼承關(guān)系以及在各研究階段的發(fā)展程度。圖中,2010—2012年的文獻節(jié)點是空白,表明在這個時間段內(nèi)沒有具有一定影響力的經(jīng)典文獻,這與文獻被引與時間的累積性相關(guān)。而較大的結(jié)點如158、220、324、343、225等代表的文獻具有較高的被引頻次,因此可以認為是電子政務研究中較經(jīng)典的文獻,通過對這些經(jīng)典文獻的分析,可以一定程度上了解電子政務研究的知識基礎(chǔ)與研究前沿。
然而,被引頻次僅僅是文獻影響力高低的反映,而文獻的共被引卻能夠反映文獻與文獻之間的研究方向或研究主題的關(guān)聯(lián),兩篇文獻共被引的頻次越多,說明它們學術(shù)研究方向的關(guān)聯(lián)性越強。由此推而廣之,由多篇文獻間的共被引關(guān)系形成的文獻共被引聚類,反映了聚類文獻之間共同的研究方向和關(guān)注的熱點主題[11]。HistCite無法實現(xiàn)文獻共被引分析,因此通過該軟件提供的引文編年圖不能夠?qū)崿F(xiàn)文獻的聚類,也就無法從引文分析的角度揭示解釋熱點主題以及知識結(jié)構(gòu)。
3.7 兩種工具比較結(jié)果
表7 兩種可視化工具的比較結(jié)果
CiteSpace和HistCite均是基于引文分析的文獻計量可視化分析工具,因此其基本的原理依據(jù)是一致的。CiteSpace的核心特色是可以實現(xiàn)文獻計量學指標網(wǎng)絡結(jié)構(gòu)的揭示(共現(xiàn)、共被引網(wǎng)絡),相對而言,HistCite無法揭示網(wǎng)絡結(jié)構(gòu),其核心特色表現(xiàn)在可以實現(xiàn)各文獻計量學指標的文獻集內(nèi)和WoS兩種范圍的被引頻次分析,而CiteSpace的被引頻次分析只限于考察主題的文獻集內(nèi)。具體來講兩種工具在功能上存在以下差異,如表7所示。
4 結(jié)語
通過CiteSpace和HistCite兩種可視化工具的比較可知,CiteSpace的功能更加豐富,而HistCite功能較為單一。但無論使用多么智能的可視化工具,在進行某一主題研究時,可視化工具只能提供我們一個研究線索,在具體研究時需要我們輔以深入、全面的文獻調(diào)研和專家咨詢才能使研究結(jié)果更科學。筆者認為,未來文獻計量可視化研究重點一方面要在知識單元間的測度更加精確與合理上下功夫。例如,通過計算機語義理解,解決一詞多義和一義多詞等詞形與詞性問題等;另一方面要進一步實現(xiàn)方法的融合與改進,進一步完善相關(guān)算法。例如,在共引分析中,根據(jù)兩被引文獻(或作者等)在同一文獻中的共被引強度給予不同的權(quán)值。
參考文獻:
[ 1 ] Lotka A J. The frequency distribution of scientific pr-
oductivity[J]. Journal of the Washington Academy of Sciences,1926,16(12):317-323.
[ 2 ] Gross P L K, Gross E M. College libraries and chemical education[J].Science,1927,66(1713):383-406.
[ 3 ] Bradford S C. Sources of information on specific subj-
ects[J]. Engineering,1934,23(3):85-88.
[ 4 ] Zipf G K. Selected studies of the principle of relative frequencies of language[M].Cambridge:Harvard Univ-
ersity Press,1932.
[ 5 ] Pritchard A. Statistical bibliography or bibliometrics?[J]. Journal of Documentation, 1969,25(4):348-349.
[ 6 ] Garfield E, Sher I H,Torpie R J. The Use of Citation Data in Writing the History of Science[M]. Philadelphia:Institute for Scientific Information,1964.
[ 7 ] Milgram S. The Small World Prolem[J].Psychology Today,1967 (2):60-67.
[ 8 ] 邱均平.信息計量學[M].武漢:武漢大學出版社,2007:408-409.
[ 9 ] 王賢文,劉則淵.基于共被引率分析的期刊分類研究[J].科研管理,2009(5):187-195.
[10] 吳曉秋,呂娜.基于關(guān)鍵詞共現(xiàn)頻率的熱點分析方法研究[J].情報理論與實踐,2012(8):115-119.
[11] 潘黎,侯劍華.國際高等教育研究的熱點主題和研究前沿:基于8種SSCI高等教育學期刊2000—2011年文獻共被引網(wǎng)絡圖譜的分析[J].教育研究,2012(6):136-143.
表6 HistCite的關(guān)鍵詞詞頻及被引分析二維表
3.6 文獻被引分析
3.6.1 CiteSpace的文獻共被引分析功能
CiteSpace除可以生成文獻共被引圖譜以揭示文獻被引頻次高低和文獻間的共被引關(guān)系外,還可以生成時間線圖譜和時區(qū)圖譜。時間線圖譜可以將研究主題各微觀知識領(lǐng)域進行聚類,同一聚類排在同一水平線上,并根據(jù)時間順序進行排列,從而展示研究主題各微觀知識領(lǐng)域的歷史成果,從中可以研究主題的重要奠基性文獻。時區(qū)圖是另一種側(cè)重于從時間維度上來表示知識演進的視圖,可以清晰地展示出文獻的更新和互相影響情況,它將結(jié)點定位在一個二維坐標系中。根據(jù)結(jié)點首次被引用的時間,結(jié)點被放在不同的時區(qū)中,并且所放位置的高度依次增加。一個從左到右,自下而上的知識演進圖就直觀的展示出來,位于坐標系靠左、靠上的結(jié)點可以認為是該知識領(lǐng)域的研究前沿。
3.6.2 HistCite的文獻被引分析功能
HistCite可以通過對從WoS下載的文獻依據(jù)被引頻次編制引文編年圖,這也是該工具的主要功能。點擊HistCite主界面最上方的“Tools”-“Graph Maker”-“Make Graph”按鈕,即可得到相應的引文編年圖。引文編年圖可以從GCS和LCS兩個角度進行編制,如果引文編年圖編制時選擇所有文獻,則用GCS和LCS編制的結(jié)果是一樣的;在實際繪制過程中,以 LCS 為依據(jù)編制引文編年圖更能體現(xiàn)研究的外延和分析的針對性,因此選擇LCS較為合適。圖1為采用HistCite編制的引文編年圖,每一個圓圈表示一篇文獻,圓圈大小代表文獻被引頻次的多少。被引頻次越高,圓圈就越大。帶箭頭的連線代表文獻節(jié)點之間的引用關(guān)系,箭頭指向的文獻是被引文獻,圓圈內(nèi)所標數(shù)字指明該節(jié)點文獻在文獻集合中的順序號。引文編年圖以從上到下的空間順序表示由先到后的時間順序,各文獻按照其發(fā)表年份的先后給予序號并安排在圖中相應位置。通過HistCite生成的引文編年圖,可以清楚地觀察到電子政務研究的歷史沿革、研究文獻之間的繼承關(guān)系以及在各研究階段的發(fā)展程度。圖中,2010—2012年的文獻節(jié)點是空白,表明在這個時間段內(nèi)沒有具有一定影響力的經(jīng)典文獻,這與文獻被引與時間的累積性相關(guān)。而較大的結(jié)點如158、220、324、343、225等代表的文獻具有較高的被引頻次,因此可以認為是電子政務研究中較經(jīng)典的文獻,通過對這些經(jīng)典文獻的分析,可以一定程度上了解電子政務研究的知識基礎(chǔ)與研究前沿。
然而,被引頻次僅僅是文獻影響力高低的反映,而文獻的共被引卻能夠反映文獻與文獻之間的研究方向或研究主題的關(guān)聯(lián),兩篇文獻共被引的頻次越多,說明它們學術(shù)研究方向的關(guān)聯(lián)性越強。由此推而廣之,由多篇文獻間的共被引關(guān)系形成的文獻共被引聚類,反映了聚類文獻之間共同的研究方向和關(guān)注的熱點主題[11]。HistCite無法實現(xiàn)文獻共被引分析,因此通過該軟件提供的引文編年圖不能夠?qū)崿F(xiàn)文獻的聚類,也就無法從引文分析的角度揭示解釋熱點主題以及知識結(jié)構(gòu)。
3.7 兩種工具比較結(jié)果
表7 兩種可視化工具的比較結(jié)果
CiteSpace和HistCite均是基于引文分析的文獻計量可視化分析工具,因此其基本的原理依據(jù)是一致的。CiteSpace的核心特色是可以實現(xiàn)文獻計量學指標網(wǎng)絡結(jié)構(gòu)的揭示(共現(xiàn)、共被引網(wǎng)絡),相對而言,HistCite無法揭示網(wǎng)絡結(jié)構(gòu),其核心特色表現(xiàn)在可以實現(xiàn)各文獻計量學指標的文獻集內(nèi)和WoS兩種范圍的被引頻次分析,而CiteSpace的被引頻次分析只限于考察主題的文獻集內(nèi)。具體來講兩種工具在功能上存在以下差異,如表7所示。
4 結(jié)語
通過CiteSpace和HistCite兩種可視化工具的比較可知,CiteSpace的功能更加豐富,而HistCite功能較為單一。但無論使用多么智能的可視化工具,在進行某一主題研究時,可視化工具只能提供我們一個研究線索,在具體研究時需要我們輔以深入、全面的文獻調(diào)研和專家咨詢才能使研究結(jié)果更科學。筆者認為,未來文獻計量可視化研究重點一方面要在知識單元間的測度更加精確與合理上下功夫。例如,通過計算機語義理解,解決一詞多義和一義多詞等詞形與詞性問題等;另一方面要進一步實現(xiàn)方法的融合與改進,進一步完善相關(guān)算法。例如,在共引分析中,根據(jù)兩被引文獻(或作者等)在同一文獻中的共被引強度給予不同的權(quán)值。
參考文獻:
[ 1 ] Lotka A J. The frequency distribution of scientific pr-
oductivity[J]. Journal of the Washington Academy of Sciences,1926,16(12):317-323.
[ 2 ] Gross P L K, Gross E M. College libraries and chemical education[J].Science,1927,66(1713):383-406.
[ 3 ] Bradford S C. Sources of information on specific subj-
ects[J]. Engineering,1934,23(3):85-88.
[ 4 ] Zipf G K. Selected studies of the principle of relative frequencies of language[M].Cambridge:Harvard Univ-
ersity Press,1932.
[ 5 ] Pritchard A. Statistical bibliography or bibliometrics?[J]. Journal of Documentation, 1969,25(4):348-349.
[ 6 ] Garfield E, Sher I H,Torpie R J. The Use of Citation Data in Writing the History of Science[M]. Philadelphia:Institute for Scientific Information,1964.
[ 7 ] Milgram S. The Small World Prolem[J].Psychology Today,1967 (2):60-67.
[ 8 ] 邱均平.信息計量學[M].武漢:武漢大學出版社,2007:408-409.
[ 9 ] 王賢文,劉則淵.基于共被引率分析的期刊分類研究[J].科研管理,2009(5):187-195.
[10] 吳曉秋,呂娜.基于關(guān)鍵詞共現(xiàn)頻率的熱點分析方法研究[J].情報理論與實踐,2012(8):115-119.
[11] 潘黎,侯劍華.國際高等教育研究的熱點主題和研究前沿:基于8種SSCI高等教育學期刊2000—2011年文獻共被引網(wǎng)絡圖譜的分析[J].教育研究,2012(6):136-143.