摘要:當今社會信息技術發(fā)展日新月異,互聯(lián)網(wǎng)技術、數(shù)據(jù)庫技術、人工智能技術等在各個領域的應用日臻成熟;信息化數(shù)字化時代的到來,信息的獲取和利用日益方便和快捷,為科學研究提供了不可或缺的分析基礎,這些都為科學計量學的研究奠定了發(fā)展基礎。
關鍵詞:圖書情報學知識圖譜聚類分析
1. 緒論
知識圖譜(Mapping Knowledge Domains)是顯示科學知識的發(fā)展進程與結(jié)構(gòu)關系的一種圖形,它以科學知識為計量研究對象,屬于科學計量學范疇[1]。它是基于內(nèi)容分析、引文網(wǎng)絡分析和信息可視化的一種可視化顯示知識以及相互關系的一種圖形,已經(jīng)成為當前科學計量學中比較熱門的研究方法。知識圖譜在圖書情報學領域也稱為知識域可視化或知識領域映射地圖,是現(xiàn)實知識發(fā)展進程與結(jié)構(gòu)關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系[2]。
2. 圖書情報學知識圖譜的構(gòu)建
2.1 數(shù)據(jù)獲取和處理
對于高頻主題詞的提取,目前國內(nèi)外還未形成統(tǒng)一權威的標準。大多數(shù)學者在選擇小樣本主題詞時都是按照詞頻大于某個特定值的方法,認為大于這個特定值即可認定該主題詞是高頻主題詞。此外還需要考慮提取的高頻主題詞占所有主題詞詞頻的比重,根據(jù)主題詞累積詞頻的變化截取高頻主題詞。
2.2 共詞分析
共詞分析是一種內(nèi)容分析技術,它通過分析在同一個文本主題中的款目對共同出現(xiàn)的形式,確認文本所代表的學科領域中相關主題的關系,進而探索學科的發(fā)展。共詞分析的主要作用是通過對高頻主題詞的聚類,發(fā)現(xiàn)研究對象的分析熱點和主要內(nèi)容,深入揭示相對應的研究結(jié)構(gòu),進而系統(tǒng)探討其研究維度、學科背景和理論基礎,以期進一步把握其研究現(xiàn)狀、學術熱點及發(fā)展趨勢。
2.3 相關分析
相關分析是研究現(xiàn)象之間是否存在某種依存關系,是以分析變量間的線性關系為主,是研究它們之間線性相關密切程度的一種統(tǒng)計分析方法[3]。通過相關分析,界定任意兩個主題詞之間的距離,以及這種距離所代表的關系,從而進一步確定主題與主題直接或正或負的聯(lián)系。
相關分析是整個數(shù)據(jù)處理過程中比較簡單的一步,卻至關重要。SPSS的統(tǒng)計分析是建立在相關系數(shù)的基礎上,需要基于相關矩陣表進行。因此,須將以上共詞矩陣經(jīng)過特定的相關性轉(zhuǎn)化為相關矩陣,以便SPSS統(tǒng)計分析。共詞矩陣轉(zhuǎn)化為相關矩陣通過Excel來完成,具體步驟是:在Excel中加載宏,導入分析工具庫-VBA函數(shù),使用Excel中自帶的數(shù)據(jù)分析模塊進行相關系數(shù)的計算,通過“工具”-“數(shù)據(jù)分析”-“相關系數(shù)”,對共詞表中的每一列進行相關系數(shù)的運算,由此可以得到完整的100*100的相關矩陣表。得到100*100主題詞相關矩陣后,就可以通過SPSS統(tǒng)計分析工具進行因子分析,聚類分析以及多維尺度分析,并構(gòu)建圖書情報學知識圖譜。然后通過SPSS對主題詞進行了一系列的因子分析、聚類分析和多維尺度分析,在此基礎上得到圖書情報學研究的各個大類,
3. 圖書情報學知識圖譜的解讀
3.1 基于主題詞的總體分析
對主題詞的總體分析主要是對研究范圍內(nèi)選取的樣本進行SPSS分析后獲取的前100位的主題詞上,在圖譜構(gòu)建中主題詞對應的百分比就表示在這一年該主題詞出現(xiàn)的次數(shù)占該年所有提取的主題詞總詞頻數(shù)的比重?!捌骄戎亍眲t表示該主題詞在研究年限范圍內(nèi)的平均值;“變化狀態(tài)”表示研究年限范圍內(nèi)的變化情況,會有“持續(xù)上升”和“持續(xù)下降”兩種情況;“無顯著規(guī)律”則表示該主題詞在研究年限內(nèi)變化比較反復;研究年限中的“末年比初年增長幅度”表示末年比初年的增長比例,用以衡量該主題詞在末年的關注度和熱度相較初年的情況,比例越高,增速越大,發(fā)展越快。
3.2 學科發(fā)展的現(xiàn)狀與熱點
通過前文的統(tǒng)計分析和當前科學研究趨勢可以將圖書情報學研究的結(jié)果進行具體分類,當前對于圖書情報學研究的文獻顯示,通過對2005-2011年的主要樣本進行分析后能夠?qū)D書情報學圖譜分為11個大類,從而得出當前圖書情報學的科學發(fā)展現(xiàn)狀與熱點分別是:醫(yī)學信息學、信息計量學與出版、圖書館系統(tǒng)、計算機技術與管理、網(wǎng)絡信息資源、信息管理與信息系統(tǒng)理論、電子資源、網(wǎng)絡資源與醫(yī)學圖書館、數(shù)字圖書館、教育與信息素養(yǎng)、信息行為與信息共享。
3.3 科學發(fā)展態(tài)勢
綜合以上對圖書情報學11大類研究主題的內(nèi)容剖析和現(xiàn)狀分析,可以看出,現(xiàn)階段的學科發(fā)展主要集中在圖書館實體研究、資源對象以及學科基本信息理論三個方面[4]。而在每個方面下,又有不同的發(fā)展側(cè)重點,如在實體研究中,主要是根據(jù)系統(tǒng)的觀點,將圖書館劃分為結(jié)構(gòu)、職能、作用、類型、表現(xiàn)形式各不同的子元素,研究多集中在學術圖書館、圖書館人員和圖書館的地域研究上;在資源對象方面,主要是將圖書情報學的研究對象——信息資源作為研究主導,尤其是針對目前網(wǎng)絡信息資源迅猛發(fā)展的情況,因此研究多集中在網(wǎng)絡資源的檢索與評價方面;在學科基本信息理論方面,研究則多集中在管理和技術兩大方面,其中管理側(cè)重于對信息資源管理和知識管理的研究,而技術更多的是面向檢索技術和存儲技術的研究[5]。
4. 結(jié)論
在知識經(jīng)濟發(fā)展的大環(huán)境下,知識圖譜的應用受到了越來越多的關注,而關注的增多必將會帶來更深入的研究。如今對知識圖譜的研究多數(shù)還只是局限在對某個特定主題的分析之上,對學科和領域的研究不是很多。因此,各個學科在審視自身發(fā)展的同時,可以借助知識圖譜的分析,可視化地顯示學科發(fā)展的態(tài)勢和走向,為研究方向提供參考。
參考文獻
[1] 肖明李國俊楊楠. 基于詞頻分析的國內(nèi)情報學研究熱點(1998~2007)[J]. 情報雜志,2009(28): 21-25.
[2] 陳蘭杰. 國內(nèi)情報學理論2008年研究熱點及發(fā)展趨勢[J]. 情報雜志, 2009(28(8)): 55-58.
[3] 嚴怡民. 現(xiàn)代情報學理論[M]. 武漢: 武漢大學出版社,1996.
[4] 梁戰(zhàn)平. 開創(chuàng)情報學的未來——爭論的焦點問題研究[J]. 情報學報, 2007(26(1)): 14-19.
[5] 周承聰. 信息生態(tài)鏈中的信息流轉(zhuǎn)[J]. 情報理論與實踐,2007(30(6)): 725-727.
作者簡介:
金葉(1982-),女,山西長治人,學歷:中南大學醫(yī)藥信息系2009 級碩士研究生在讀,職務:長治醫(yī)學院信息管理系教師。