胡雅 張露
摘要:Bibexcel軟件是重要的文獻(xiàn)計量分析工具,本文從Bibexcel軟件在關(guān)鍵詞共詞矩陣構(gòu)建中產(chǎn)生的文件類型及操作步驟兩個方面介紹了如何分析某一領(lǐng)域中關(guān)鍵詞及關(guān)鍵詞共詞矩陣構(gòu)建的方法,以期指導(dǎo)科研工作者了解某一領(lǐng)域的學(xué)科主題。
關(guān)鍵詞:Bibexcel;關(guān)鍵詞;共詞矩陣
中圖分類號:TP393? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)25-0257-01
共詞分析法主要用來統(tǒng)計一對詞同時出現(xiàn)在同一篇文獻(xiàn)中的次數(shù),用于反映詞組之間的關(guān)聯(lián)程度。利用共詞分析法分析某一關(guān)鍵詞在某一領(lǐng)域中出現(xiàn)的頻次高低,經(jīng)聚類分析后揭示該領(lǐng)域主題結(jié)構(gòu)[1,2]。BibExcel文獻(xiàn)分析軟件能夠處理集成在ISI Web of Knowledge數(shù)據(jù)庫上的數(shù)據(jù)[3],對數(shù)據(jù)庫中的作者、關(guān)鍵詞、引文做頻次分析和頻次排序,產(chǎn)生的作者、關(guān)鍵詞、引文的共現(xiàn)矩陣,具有強(qiáng)大的知識單元共現(xiàn)分析能力[4]。本文簡單介紹了Bibexcel軟件在關(guān)鍵詞共詞矩陣構(gòu)建中產(chǎn)生的文件類型及操作步驟,以期為科研工作者提供主題結(jié)構(gòu)分析的方法。
1 Bibexcel在關(guān)鍵詞共詞矩陣構(gòu)建中產(chǎn)生的文件類型
利用Bibexcel文獻(xiàn)信息統(tǒng)計分析軟件進(jìn)行關(guān)鍵詞的抽取、共詞矩陣構(gòu)建以及相異矩陣的轉(zhuǎn)換過程中文件類型如表1所示。
2 Bibexcel在關(guān)鍵詞共詞矩陣構(gòu)建中需要的分析步驟
2.1 題錄導(dǎo)出
通過Web of Science數(shù)據(jù)庫的題錄信息導(dǎo)出功能,對所有文獻(xiàn)信息進(jìn)行標(biāo)記,將所有文獻(xiàn)記錄以Txt格式導(dǎo)出包括標(biāo)題、作者、摘要、關(guān)鍵詞的文獻(xiàn)題錄信息,每500條記錄分成一批進(jìn)行下載,保留首批數(shù)據(jù)開頭符“FN Clarivate Analytics Web of ScienceVR 1.0”和結(jié)束符“EF”,刪除其余批次開頭符合結(jié)束符,將所有批次的txt整合至同一純文本中。
2.2關(guān)鍵詞顯示
選中Keywords.doc文件,點(diǎn)擊View file按鈕,The list窗口就會顯示這個文件的內(nèi)容。在Old Tag中填寫關(guān)鍵詞對應(yīng)的標(biāo)簽代號DE,在Select field to beanalysed下拉列表框中選擇“Any; Separated field”,然后點(diǎn)擊Prep按鈕,在彈出的對話框中點(diǎn)擊“確定”,生成后綴名為Keywords.out文件。在The List窗口顯示每一個關(guān)鍵詞出現(xiàn)的頻次以及關(guān)鍵詞名稱。
2.3關(guān)鍵詞頻次降序排列
選中Keywords.out,在Frequency distribution下拉列表框中選擇Whole string,在下面的復(fù)選框中選擇“Sorted descending”,點(diǎn)擊Start按鈕,在彈出的窗口中,點(diǎn)擊“確定”,生成后綴名為 Keywords.cit文件。The List窗口顯示按照出現(xiàn)頻次由高到低依次排列的關(guān)鍵詞。
2.4產(chǎn)生關(guān)鍵詞共詞次數(shù)
選中Keywords.out文件,在Frequency distribution下面的復(fù)選框中選擇“Remove dup licate”和“make new out-file”,點(diǎn)擊Start按鈕,在彈出的窗口中,點(diǎn)擊“確定”,生成后綴名為Keywords.oux文件。然后選中Keywords.cit文件,點(diǎn)擊“view file”,在The List顯示窗口中選擇頻次大于等于2的前50個關(guān)鍵詞作為分析對象,然后點(diǎn)擊“Analyze→Co-occurrence→Select unitsvialistbox”,選中Keywords.oux文件,點(diǎn)擊“Analyze→Co-occurrence→Make pairs via listbox”,在彈出的窗口中點(diǎn)擊“否”,再彈出的窗口選擇確定,此時生成Keywords.coc文件。
2.5產(chǎn)生關(guān)鍵詞共詞矩陣
選中Keywords.Coc文件,在Analyze下面選擇“List Units in pairs”,點(diǎn)擊確定,產(chǎn)生Keywords.ccc文件。選中Keywords.ccc文件,在Analyze下面選擇“Make a matrix for MDS etc”,點(diǎn)擊“確定”,若僅需要產(chǎn)生下三角矩陣,則在“Do you wish to make a lower left matrix”對話框中選擇“是”,若需要產(chǎn)生全矩陣,則選擇“否”。點(diǎn)擊“確定”,產(chǎn)生表示關(guān)鍵詞共現(xiàn)的下三角矩陣或者全矩陣Keywords.ma2。
2.6可視化分析
將Keywords.ma2文件中的矩陣復(fù)制粘貼至excel文件中,把excel文件導(dǎo)入Ucinet軟件,利用Ucinet做可視化知識圖譜分析。
參考文獻(xiàn):
[1] 趙麗梅, 張花. 我國大數(shù)據(jù)時代數(shù)字圖書館研究前沿分析——基于共詞分析的視角[J]. 情報科學(xué), 2019, 37(03):99-106.
[2] 傅柱, 王曰芬, 陳必坤. 國內(nèi)外知識流研究熱點(diǎn):基于詞頻的統(tǒng)計分析[J]. 圖書館學(xué)研究, 2016(14):2-12.
[3] 劉齊平. Bibexcel在文獻(xiàn)計量分析中的應(yīng)用例說[J]. 湖北第二師范學(xué)院學(xué)報, 2011(8):83-84.
[4] 姜春林, 陳玉光. CSSCI數(shù)據(jù)導(dǎo)入Bibexcel實現(xiàn)共現(xiàn)矩陣的方法及實證研究[J]. 圖書館雜志, 2010(4):58-63.
【通聯(lián)編輯:光文玲】