姜鑫 馬海群
〔摘 要〕本文以CSSCI收錄的18種圖書情報學期刊發(fā)表于2014年的4 407篇期刊論文作為數(shù)據(jù)來源,通過共詞聚類分析、戰(zhàn)略坐標分析、作者合作分析和作者-關鍵詞耦合分析方法探討了2014年我國圖書情報學領域的研究進展。本文通過共詞聚類分析和戰(zhàn)略坐標分析確定了2014年我國圖書情報學研究的17個重要主題及其演變趨勢,通過作者合作分析確定了2014年我國圖書情報學領域的科學合作狀況及主要合作團體,通過作者-關鍵詞耦合分析確定了高產(chǎn)作者的主要研究領域。
〔關鍵詞〕圖書情報學;研究進展;文獻計量分析;共詞分析;聚類分析;戰(zhàn)略坐標圖;作者合作;作者-關鍵詞耦合分析;綜述;述評
DOI:10.3969/j.issn.1008-0821.2016.04.032
〔中圖分類號〕G252.8 〔文獻標識碼〕A 〔文章編號〕1008-0821(2016)04-0170-08
〔Abstract〕Based on 4407 articles published in 18 journals of Library and Information Science(LIS)in 2014,which were covered by the Chinese Social Science Citation Index(CSSCI),this paper discussed the research progress in LIS research in China with the methods of co-word analysis,cluster analysis,drawing strategic diagram,co-authorship and author-keyword coupling analysis.This paper determined 17 important research themes and their revolution trend in LIS research in China by using co-word clustering analysis and drawing strategic diagram,found status quo of scientific collaboration and main cooperative groups by analyzing co-authorship network,and determined prolific authors main research fields through author-keyword coupling analysis.
〔Key words〕library and information science(LIS);research progress;bibliometric analysis;co-word analysis;cluster analysis;strategic diagram;co-authorship;author-keyword coupling analysis;summary;review
圖書情報學領域的眾多學者歷來非常重視學科的回顧和展望,也更加注重學科領域的研究熱點與前沿演進的追蹤與探測,以期能夠深入地揭示學科發(fā)展的軌跡、特征和規(guī)律,并有助于科研人員更好地把握本學科的研究動態(tài)和發(fā)展趨勢[1]。本文以2014年發(fā)表的CSSCI來源期刊論文中的作者和關鍵詞兩個特征項作為分析單元,綜合運用共現(xiàn)、耦合、聚類等多種文獻計量分析方法并輔以信息可視化軟件工具,從主題分析和作者分析兩個視角對2014年我國圖書情報學領域的研究進展及發(fā)展趨勢進行了系統(tǒng)的梳理。
1 數(shù)據(jù)來源
本文選取CSSCI(2014-2015)收錄的18種圖書情報學期刊發(fā)表于2014年的全部期刊論文作為數(shù)據(jù)來源。由于我國圖書情報學領域的研究成果絕大多數(shù)是以期刊論文的形式首發(fā)在國內期刊上,并且本領域具有較高學術認可度和代表性的期刊論文大多發(fā)表于CSSCI來源期刊上,因此CSSCI來源期刊論文可以比較全面、完整地反映出我國圖書情報學領域的研究動態(tài)。上述18種CSSCI來源期刊分別是:《中國圖書館學報》、《大學圖書館學報》、《國家圖書館學刊》、《圖書情報工作》、《圖書情報知識》、《情報資料工作》、《圖書與情報》、《情報學報》、《情報科學》、《情報雜志》、《情報理論與實踐》、《現(xiàn)代圖書情報技術》、《圖書館工作與研究》、《圖書館學研究》、《圖書館論壇》、《圖書館建設》、《圖書館雜志》和《圖書館》。利用Note Express文獻管理軟件通過CNKI和萬方數(shù)據(jù)兩個數(shù)據(jù)庫獲取論文題錄數(shù)據(jù)。刪除通知、簡訊、評論等不相關的非學術文獻,共計得到了4 407篇我國圖書情報學研究相關文獻。
2 數(shù)據(jù)分析
下面分別以4 407篇文獻的關鍵詞和作者兩個特征項作為分析單元,從主題分析和作者分析兩個視角系統(tǒng)梳理2014年我國圖書情報學領域的研究進展。
2.1 主題分析
下面以4 407篇文獻的關鍵詞作為分析單元,通過共詞聚類分析和戰(zhàn)略坐標分析兩種研究方法,從研究主題的視角揭示2014年我國圖書情報學研究的主題分布及發(fā)展狀況。
2.1.1 共詞聚類分析
在上述4 407篇文獻中共計出現(xiàn)了17 677個關鍵詞,從中選取詞頻≥22的高頻關鍵詞70個(見表1)。
通過VBA編程計算上述70個高頻關鍵詞在4 407篇文獻中的共現(xiàn)頻次,得到一個70×70的高頻關鍵詞共現(xiàn)矩陣Zij(Co-word Matrix),并將其導入社會網(wǎng)絡分析軟件Ucinet 6.2,然后通過Ucinet的繪圖軟件工具NetDraw直接展現(xiàn)其關鍵詞之間的共現(xiàn)關系(見圖1)。圖中的節(jié)點大小代表關鍵詞的點度中心性,連線的粗細代表關鍵詞之間的共現(xiàn)頻次。為了更清晰地展現(xiàn)出關鍵詞之間的共現(xiàn)關系,圖1只保留了關鍵詞之間共現(xiàn)頻次≥3的全部連線。
本研究采用系統(tǒng)聚類法對高頻關鍵詞相關矩陣進行聚類分析。將原始共詞矩陣通過Salton指數(shù)法轉換為相關矩陣(Correlation Matrix)。Salton指數(shù)法的計算公式是:S=Cij/(Ci×Cj)1/2,其中Ci、Cj分別表示關鍵詞i和關鍵詞j的詞頻,Cij表示關鍵詞i與關鍵詞j的共現(xiàn)頻次。通過SPSS 21.0對高頻關鍵詞相關矩陣進行系統(tǒng)聚類,“聚類方法”選擇“組間聯(lián)結”,“度量標準”選擇“平方Euclidean距離”,分析結果如圖2所示。由圖2可見,上述70個高頻關鍵詞可劃分成17個聚類,分別對應著2014年我國圖書情報學研究的17個重要主題(見表2)。
從高頻關鍵詞系統(tǒng)聚類分析結果來看,2014年我國圖書館情報學研究的重要主題包括:用戶信息行為、文獻計量分析、館藏資源建設、信息資源整合與共享、關聯(lián)數(shù)據(jù)、MOOCs/信息素養(yǎng)教育、圖書館學科服務/信息服務/知識服務、圖書館移動服務、科學數(shù)據(jù)管理(管護、策管)、機構知識庫/開放存取、競爭情報、數(shù)據(jù)挖掘/專利分析、圖書館聯(lián)盟/戰(zhàn)略規(guī)劃、圖書館閱讀推廣、微博輿情;此外,公共圖書館法人治理也是重要研究主題之一。其中,用戶信息行為、圖書館移動服務、MOOCs、科學數(shù)據(jù)管理、機構知識庫/開放存取、關聯(lián)數(shù)據(jù)、知識服務、數(shù)據(jù)挖掘/專利分析、圖書館閱讀推廣、公共圖書館法人治理是熱門主題與研究前沿,也是2015年我國圖書情報學研究深化拓展的重點主題。接下來通過戰(zhàn)略坐標分析探討各研究主題的發(fā)展狀況及演變趨勢。
2.1.2 戰(zhàn)略坐標分析
戰(zhàn)略坐標圖是基于研究主題或聚類基礎上的一種研究方法,可以用來描述各研究主題的發(fā)展狀況和演變趨勢。戰(zhàn)略坐標圖以向心度為橫坐標,以密度為縱坐標,以兩者的中位數(shù)或均值為坐標原點,將研究主題簇表示在平面直角坐標系中(見圖3)。密度指標反映了一個研究主題簇的內部聚合能力,向心度指標反映了一個主題簇與其他主題簇的連接能力。一個研究主題簇的密度指標越大,說明該研究主題簇的內部結構穩(wěn)定性越高,其所代表的研究領域發(fā)展越成熟;一個研究主題簇的向心度越大,說明它與其他研究主題簇的連接能力越強,在整個研究領域中越處于中心地位[2]。
研究主題簇在戰(zhàn)略坐標圖中分布在4個象限,第Ⅰ象限的主題簇為“核心,成熟類”(Central and Developed),是學科領域研究的熱點和重點,受到廣泛關注,內部結構穩(wěn)定;第Ⅱ象限的主題簇為“邊緣,成熟類”(Peripheral and Developed),內部結構穩(wěn)定,但與其他主題聯(lián)系松散,可能被邊緣化;第Ⅲ象限的主題簇為“邊緣,不成熟類”(Peripheral and Undeveloped),內部結構松散,研究不成熟;第Ⅳ象限的主題簇為“核心,不成熟類”(Central and Undeveloped),也是學科領域研究和關注的活躍領域,但內部結構不穩(wěn)定[3]。
本文采用的密度(Density)和向心度(Centrality)的計算方法如下:對于i≠j,Density=∑i,j∈ΦsEijn-1;Centrality=∑i∈Φs,j∈(Φ-Φs)Eij〖〗N-n;其中,Eij是包容系數(shù),其計算公式為:Eij=C2ij/Ci·Cj,其中Ci、Cj分別表示關鍵詞i和關鍵詞j的詞頻,Cij表示關鍵詞i與關鍵詞j的共現(xiàn)頻次;n是某一聚類中的關鍵詞數(shù)目,N是整個共詞網(wǎng)絡中關鍵詞的總數(shù);Φs是指某一聚類,Φ是指整個共詞網(wǎng)絡[5]。根據(jù)圖3所示的系統(tǒng)聚類分析所確定的17個聚類,計算其密度和向心度的均值分別為0.0661和0.0014,通過Excel散點圖的形式繪制2014年我國圖書情報學研究主題簇的戰(zhàn)略坐標圖(見圖4)。
從圖4所示的研究主題簇的戰(zhàn)略坐標圖來看,第Ⅰ象限中包括以下3個研究主題:3(文獻計量分析)、5(信息資源整合與共享)和7(高校圖書館學科服務),這些研究主題的密度和向心度都比較高,密度高說明這些研究主題的內部聯(lián)系緊密,向心度高說明它們與其余研究主題之間具有廣泛聯(lián)系,它們處于所有研究主題的核心位置,受到學者們的關注比較多,并且其研究狀況也比較成熟。
第Ⅱ象限中包括以下5個研究主題:1(用戶信息行為)、2(圖書館學/情報學比較研究)、4(館藏資源建設)、16(微博輿情)和17(知識管理),這些研究主題的密度較高但向心度較低,處于所有研究主題的邊緣位置,但其研究狀況還是比較成熟的,作為相對獨立的研究主題目前表現(xiàn)不活躍;其中有3個研究主題涉及交叉學科研究,分別是:1(用戶信息行為)、16(微博輿情)和17(知識管理)。
第Ⅲ象限中包括以下5個研究主題:8(公共圖書館閱讀服務)、10(科學數(shù)據(jù)管理)、11(知識服務)、13(情報分析)和14(圖書館聯(lián)盟),這些研究主題的密度和向心度都比較低,說明這些研究主題的內部聯(lián)系松散,與其余研究主題之間的聯(lián)系也不夠緊密,它們處于所有研究主題的邊緣位置,并且其研究狀況也不夠成熟,這些主題還有待于進一步研究;其中主題10(科學數(shù)據(jù)管理)是2014年我國圖書情報學研究的新興熱點與研究前沿。
第Ⅳ象限中包括以下4個研究主題:6(信息素養(yǎng)教育)、9(圖書館移動服務)、12(數(shù)字圖書館信息服務)和15(圖書館閱讀推廣),這些研究主題的密度較低但向心度較高,說明它們雖處于所有研究主題的核心位置,但其研究狀況目前尚不成熟,還具有較大的發(fā)展空間;與其余研究主題之間的聯(lián)系也比較廣泛,但由于其內部聯(lián)系松散、不穩(wěn)定,在后續(xù)發(fā)展過程中容易分解或演化為相關主題;其中有3個研究主題在2014年引起了較為廣泛的研究關注,分別是:6(信息素養(yǎng)教育)、9(圖書館移動服務)和15(圖書館閱讀推廣)。
2.2 作者分析
下面以4 407篇文獻的作者作為分析單元,通過作者合作分析和作者-關鍵詞耦合分析兩種研究方法,從研究人員的視角揭示2014年我國圖書情報學領域的主要研究團體及其重要研究領域。
2.2.1 作者合作分析
在上述4 407篇文獻中共計出現(xiàn)了8 815位作者,如果僅統(tǒng)計前三署名的作者的發(fā)文數(shù),可以得到發(fā)文數(shù)≥5的205位高產(chǎn)作者,其中發(fā)文數(shù)≥7的85位高產(chǎn)作者如表3所示。
在全部4 407篇文獻中合著論文共計2 643篇,其中,2人合著論文共計1 432篇,3人合著論文共計808篇,4人合著論文共計294篇,5人及5人以上合著論文共計109篇。由此可見,2014年我國圖書情報學領域的科學合作比較廣泛,并已成為影響科學生產(chǎn)力的重要因素。如果統(tǒng)計全部署名的作者的發(fā)文數(shù),則可得到發(fā)文數(shù)≥5的230位高產(chǎn)作者,通過VBA編程構建230位高產(chǎn)作者之間的合作關系矩陣,再利用NetDraw軟件工具直觀展現(xiàn)高產(chǎn)作者之間的合作關系(見圖5)。圖5中的節(jié)點大小代表高產(chǎn)作者的點度中心性,連線的粗細代表高產(chǎn)作者之間的合作頻次,并且已刪去與其他作者無合作關系的孤立節(jié)點。
在全部230位高產(chǎn)作者中合作頻次為1的作者對共計83對,合作頻次為2的作者對共計26對,合作頻次為3的作者對共計21對,合作頻次為4的作者對共計19對,合作頻次為5的作者對共計23對,合作頻次≥6的作者對包括邱均平-余厚強、陳雅-孫寧、李綱-毛進、邱均平-劉國徽、邱均平-呂紅、李綱-葉光輝、謝陽群-王文韜、李長玲-魏緒秋、鄭建明-徐文哲、劉春年-張曼、李湘東-黃莉??梢姡?014年我國圖書情報學領域高產(chǎn)作者之間的科學合作更加廣泛,并且以師生之間、同事之間、校友之間的合作關系為主。由圖5可見,高產(chǎn)作者構成的合作團體中有較多僅由2~3位成員構成的小團體。從圖5中還可以發(fā)現(xiàn)幾個成員人數(shù)較多的合作團體,這些合作團體主要來自于武漢大學、南京大學和中科院系統(tǒng),其中有兩個合作關系較為密切的合作團體:以武漢大學邱均平教授為核心的合作團體、以國家科學圖書館張智雄教授為核心的合作團體。
2.2.2 作者-關鍵詞耦合分析
作者-關鍵詞耦合分析能夠揭示出作者和關鍵詞這兩個重要特征項的關聯(lián)關系。通過VBA編程構建230位高產(chǎn)作者與85個高頻關鍵詞之間的耦合關系矩陣,再利用NetDraw軟件工具直觀展現(xiàn)作者-關鍵詞耦合關系網(wǎng)絡(見圖6)。圖中的圓形節(jié)點●代表作者,方形節(jié)點■代表關鍵詞,節(jié)點大小代表作者或關鍵詞的點度中心性,連線的粗細代表作者-關鍵詞的耦合強度。為了更清晰地展現(xiàn)出作者-關鍵詞的耦合關系,圖6只保留了作者-關鍵詞的耦合強度≥3的全部連線。由圖6可見,通過繪制作者-關鍵詞2-模網(wǎng)絡的可視化圖,能夠直觀揭示作者的主要研究領域,反映出作者研究興趣的多樣性,并能顯示出不同作者的相同研究領域,對學科領域結構的解讀具有顯性、直觀的特點[6]。
圖6清楚地展示出高產(chǎn)作者所涉及的主要研究領域,主要包括主題3:文獻計量分析(文獻計量學、社會網(wǎng)絡分析、共詞分析、知識圖譜、可視化)、主題5:信息資源整合與共享(數(shù)字資源、資源整合、資源共享)、主題8:公共圖書館閱讀服務(公共圖書館、圖書館服務)、主題9:圖書館移動服務(移動圖書館、移動服務、微信、服務質量)、主題10:科學數(shù)據(jù)管理(科學數(shù)據(jù)、機構知識庫、開放存取、元數(shù)據(jù))、主題11:知識服務(知識服務、知識組織)、主題13:情報分析(大數(shù)據(jù)、競爭情報、專利分析)、主題14:圖書館聯(lián)盟(圖書館聯(lián)盟、指標體系)、主題15:圖書館閱讀推廣(圖書館、著作權、社會化媒體)、主題16:微博輿情(微博、網(wǎng)絡輿情、突發(fā)事件)。上述10個研究主題也是2014年我國圖書情報領域備受關注的重點研究領域。
圖6能夠直觀地揭示出高產(chǎn)作者的主要研究領域,如與邱均平教授直接相連的關鍵詞有:文獻計量學、知識圖譜、可視化、社會網(wǎng)絡分析、情報學和數(shù)字圖書館,表明邱均平教授涉及的主要研究領域是主題3:文獻計量分析(文獻計量學、知識圖譜、可視化、社會網(wǎng)絡分析);與黃如花教授直接相連的關鍵詞有:MOOCs、信息檢索、科學數(shù)據(jù)和元數(shù)據(jù),表明黃如花教授涉及的主要研究領域包括主題6:信息素養(yǎng)教育(MOOCs、信息檢索)和主題10:科學數(shù)據(jù)管理(科學數(shù)據(jù)、元數(shù)據(jù));與施國洪教授直接相連的關鍵詞有:移動圖書館、公共圖書館、移動服務和服務質量,表明施國洪教授涉及的主要研究領域是主題9:圖書館移動服務(移動圖書館、移動服務、服務質量)。
圖6也可直觀地展現(xiàn)出高產(chǎn)作者共同的研究領域,如涉及“科學數(shù)據(jù)”研究的高產(chǎn)作者包括:黃如花、司莉、邱春艷、李鑫和王晴;涉及“機構知識庫”研究的高產(chǎn)作者包括:顧立平、聶華、姚曉娜、祝忠明和張旺強;涉及“知識服務”研究的高產(chǎn)作者包括:蘇新寧、蔣勛、鄧仲華和徐緒堪;涉及“移動圖書館”研究的高產(chǎn)作者包括:施國洪、夏前龍和過仕明;涉及“網(wǎng)絡輿情”研究的高產(chǎn)作者包括:朱慶華、陳福集、陸和建、曾潤喜、孫寧、陳雅和孫霄凌。
3 結 語
本文以18種圖書情報學領域CSSCI來源期刊發(fā)表于2014年的期刊文獻作為數(shù)據(jù)來源,以作者和關鍵詞這兩個重要特征項的共現(xiàn)、耦合、聚類等多種分析方法作為研究方法,從主題分析和作者分析兩個視角探討了2014年我國圖書情報學領域的研究進展。通過共詞聚類分析確定了2014年我國圖書情報學研究的17個重要主題,通過繪制戰(zhàn)略坐標圖分析了17個重要研究主題的發(fā)展狀況及其演變趨勢,通過作者合作分析確定了2014年我國圖書情報學領域的科學合作狀況及主要合作團體,通過作者-關鍵詞耦合分析揭示了高產(chǎn)作者的主要研究領域以及高產(chǎn)作者的共同研究領域。本文旨在為圖書情報學科的科研人員進行科研選題、選擇科研合作對象提供有效指導;也為本學科的科研管理者準確把握學科發(fā)展方向,預測新的學科生長點,正確制定學科發(fā)展政策,有效規(guī)避科研投資風險提供參考。
本文的研究不足及后續(xù)研究需關注的重點主要體現(xiàn)于以下兩個方面:①由于本文的數(shù)據(jù)源僅限于期刊論文,沒有統(tǒng)計學術專著、研究報告等其他類型的文獻,此外由于共詞聚類分析方法本身存在一定缺欠,因而對2014年我國圖書情報學研究的主題分析難免有片面和疏漏之處;②由于本文僅以作者和關鍵詞兩個特征項作為分析單元,未能全面反映2014年我國圖書情報學領域的研究狀況,后續(xù)研究需考慮增加“機構”這一特征項作為分析單元,通過機構合作分析和機構-關鍵詞耦合分析兩種方法,揭示2014年我國圖書情報領域的機構合作狀況及主要研究機構的重要研究主題。筆者在后續(xù)研究中將致力于改進上述兩個不足之處,以期更客觀全面地揭示我國圖書情報領域的研究進展。
參考文獻
[1]邱均平,溫芳芳.近五年來圖書情報學研究熱點與前沿的可視化分析——基于13種高影響力外文源刊的計量研究[J].中國圖書館學報,2011,37(2):51-60.
[2]韓紅旗,安小米.科技論文關鍵詞的戰(zhàn)略圖分析[J].情報理論與實踐,2012,35(9):86-90.
[3]鐘偉金,李佳.共詞分析法研究(二)——類團分析[J].情報雜志,2008,(6):141-143.
[4]Callon M,Courtial J P,Laville F.Co-word analysis as a tool for describing the network of interactions between basic and technological research:The case of polymer chemistry[J].Scientometrics,1991,22(1):155-205.
[5]Bangrae Lee,Yong-Il Jeong.Mapping Koreas national R&D domain of robot technology by using the co-word analysis[J].Scientometrics,2008,77(1):3-19.
[6]孫海生.作者關鍵詞共現(xiàn)網(wǎng)絡及實證研究[J].情報雜志,2012,31(9):63-67.
(本文責任編輯:馬 卓)