張曼曼 張丹 朱光亞 何雨
[摘 要] 情報(bào)學(xué)是一門新興的綜合性學(xué)科,在信息化發(fā)展的社會(huì)中其發(fā)揮的作用日益突出。以CNKI為數(shù)據(jù)源,以2010-2014年發(fā)表的情報(bào)學(xué)領(lǐng)域的文獻(xiàn)為研究對(duì)象,以共詞分析法為理論依據(jù),以SPSS19.0為分析工具,研究了近5年來(lái)情報(bào)學(xué)領(lǐng)域的研究熱點(diǎn)及演進(jìn)趨勢(shì)。經(jīng)研究分析歸納出情報(bào)學(xué)領(lǐng)域的四大研究熱點(diǎn):基礎(chǔ)理論研究、社會(huì)網(wǎng)絡(luò)分析法研究、共詞分析法研究、文獻(xiàn)計(jì)量學(xué)研究。并預(yù)測(cè)情報(bào)學(xué)未來(lái)的研究方向是以理論研究為主、圖書館學(xué)研究和定量的分析法。
[關(guān)鍵詞] 情報(bào)學(xué);研究熱點(diǎn);演進(jìn)趨勢(shì);分析
[中圖分類號(hào)] F79 [文獻(xiàn)標(biāo)識(shí)碼] B
一、引言
隨著信息化社會(huì)的到來(lái),情報(bào)學(xué)已經(jīng)滲透到我們的生活中,其社會(huì)重要性日益增強(qiáng)。情報(bào)學(xué)的研究熱點(diǎn)隨社會(huì)的不斷發(fā)展而變化,因此對(duì)其研究熱點(diǎn)及演進(jìn)趨勢(shì)的分析,有利于我們了解情報(bào)學(xué)領(lǐng)域的關(guān)注重點(diǎn)及其未來(lái)的發(fā)展方向。詞頻分析法能夠利用文獻(xiàn)關(guān)鍵詞或者主題詞在某一研究領(lǐng)域文獻(xiàn)中出現(xiàn)的頻次高低來(lái)確定該領(lǐng)域的研究熱點(diǎn)及發(fā)展方向。本論文即采用共詞分析法來(lái)探析近五年來(lái)情報(bào)學(xué)領(lǐng)域的研究熱點(diǎn)及其演進(jìn)趨勢(shì),為科研人員選擇研究課題提供借鑒方向。
二、數(shù)據(jù)收集和整理
(一)原始文獻(xiàn)的選定
本研究的文獻(xiàn)源于CNKI數(shù)據(jù)庫(kù),檢索主題為“情報(bào)學(xué)”,年限為“2010.1-2014.12”,期刊為“《情報(bào)學(xué)報(bào)》、《情報(bào)科學(xué)》、《情報(bào)雜志》、《情報(bào)理論與實(shí)踐》、《情報(bào)資料工作》”。結(jié)果得到397篇文獻(xiàn),去除如無(wú)著者的,主要包括征稿啟事﹑來(lái)稿須知等,經(jīng)整理之后共得到文獻(xiàn)數(shù)321篇。將其按作者、題名、文獻(xiàn)來(lái)源、年份、關(guān)鍵詞順序?qū)С龅絜xcle表格中。
(二)高頻關(guān)鍵詞的選定
一篇論文的關(guān)鍵詞能夠大致反映出該論文的研究?jī)?nèi)容及其研究方法,是整篇文章的縮影。同樣一個(gè)研究領(lǐng)域文獻(xiàn)的高頻關(guān)鍵詞在一定程度上能夠折射出本領(lǐng)域的研究熱點(diǎn)及發(fā)展趨勢(shì)?;诖吮狙芯繉⒃嘉墨I(xiàn)表中的關(guān)鍵詞列復(fù)制到一張新表中,對(duì)其進(jìn)行處理:一是對(duì)其進(jìn)行分列處理,將所有列的關(guān)鍵詞合并為一列,即A列,共得到有效關(guān)鍵詞1406個(gè),刪除一些與本研究無(wú)關(guān)的非實(shí)質(zhì)性的關(guān)鍵詞,如創(chuàng)新﹑分析﹑內(nèi)涵等。處理后共得到關(guān)鍵詞1329個(gè);二是將A列復(fù)制到B列,并對(duì)B列的關(guān)鍵詞刪除重復(fù)項(xiàng),共得到612個(gè)單一關(guān)鍵詞。用COUNTIF函數(shù)計(jì)算B列關(guān)鍵詞在A列中出現(xiàn)的次數(shù),即C列。將C列的詞頻按照降序排列,選取頻次大于10的關(guān)鍵詞,一共是14個(gè),繪制高頻關(guān)鍵詞表。
三、情報(bào)學(xué)領(lǐng)域研究熱點(diǎn)分析
(一)構(gòu)造高頻關(guān)鍵詞矩陣
高頻關(guān)鍵詞表中“情報(bào)學(xué)”出現(xiàn)的頻次最高,但是其與本研究的內(nèi)容完全重合,故舍棄;圖書情報(bào)學(xué)與圖書館學(xué)情報(bào)學(xué)的意義相同,故將它們合并為圖書情報(bào)學(xué)。在此基礎(chǔ)上共計(jì)得到12個(gè)高頻詞作為共詞分析的原始數(shù)據(jù)。
將這12個(gè)高頻關(guān)鍵詞進(jìn)行兩兩組合,統(tǒng)計(jì)出它們同時(shí)出現(xiàn)在一篇文獻(xiàn)中的次數(shù),形成共詞矩陣。該矩陣為對(duì)角矩陣,對(duì)角線上的數(shù)字代表任一關(guān)鍵詞自身出現(xiàn)的頻次,非對(duì)角線上的數(shù)字代表兩個(gè)關(guān)鍵詞同時(shí)出現(xiàn)的次數(shù)。為了更清晰地表示關(guān)鍵詞之間的關(guān)系,我們將用Ochiia系數(shù)計(jì)算關(guān)鍵詞相似矩陣,“Ochiia系數(shù)等于AB兩詞共同出現(xiàn)的頻次除以AB各頻次乘積的開(kāi)方[1]。”“此相關(guān)矩陣中0值太多,以后做統(tǒng)計(jì)分析時(shí)容易造成較大誤差,因此為了方便統(tǒng)計(jì),將相似矩陣轉(zhuǎn)化為相異矩陣,即用1與相似矩陣中所有值相減[1]?!?/p>
(二)因子分析
因子分析簡(jiǎn)單地說(shuō)就是用少數(shù)幾個(gè)因子來(lái)描述原始多個(gè)變量因子之間的聯(lián)系,能反映原始資料的大部分信息?!耙蜃臃治鲇幸韵?個(gè)特點(diǎn):提取的因子個(gè)數(shù)小于原有變量數(shù);因子可代替原有變量參與數(shù)據(jù)建模,減少了計(jì)算量;因子能夠反映原有變量的大部分信息;因子之間的線性關(guān)系不顯著;因子具有命名解釋性[2]?!?/p>
本研究用SPSS19.0對(duì)共詞矩陣進(jìn)行因子分析,具體操作步驟為:將高頻關(guān)鍵詞的相異矩陣導(dǎo)入到SPSS19.0中,選擇分析——降維——因子分析,在出現(xiàn)的對(duì)話框中把左邊的所有要分析的變量選入右邊變量處,依次按照提示設(shè)置分析內(nèi)容及方法,即描述統(tǒng)計(jì)﹑抽取(本次采用主成分抽取法并且特征值大于1)、旋轉(zhuǎn)(最大方差法)、得分、選項(xiàng)。最后點(diǎn)擊確定即可生成因子分析的各類圖表。
相關(guān)系數(shù)矩陣圖中多數(shù)高頻關(guān)鍵詞的相關(guān)系數(shù)較高,并且每個(gè)變量都具有較強(qiáng)的線性關(guān)系,因此我們能夠從中提取公共因子,進(jìn)行因子分析。
1.提取公因子
本研究采用的是主成分分析法提取公因子,并要求選取的因子特征根大于1。
公因子方差表中多數(shù)因子的方差都比較高,說(shuō)明這些因子能夠反映原始變量的大部分信息,如引文分析的因子方差為86.9%,說(shuō)明提取的公因子對(duì)關(guān)鍵詞引文分析的方差作出了86.9%的貢獻(xiàn),表明原有矩陣轉(zhuǎn)化為公因子矩陣后保留了原始數(shù)據(jù)的大部分信息,因此因子分析的效果整體比較好。因子變量的總方差圖中旋轉(zhuǎn)后的公因子累計(jì)方差貢獻(xiàn)率為63.078%,表明公因子能夠涵蓋原有變量63.078%的信息,信息丟失較少。碎石圖清晰地描述了因子特征值的變化情況,圖中前四個(gè)因子特征值的變化較為明顯并且都大于1,之后因子特征值的變化趨于平緩。根據(jù)以上分析,我們將提取的公因子數(shù)定為四個(gè)。
2.因子的命名解釋
因子載荷矩陣表示的是提取的公因子對(duì)原有變量的解釋比例,該矩陣中公因子變量在多數(shù)變量上都有較高的載荷值,所以公因子代表的含義就比較模糊,故我們按照方差極大法對(duì)因子載荷矩陣進(jìn)行旋轉(zhuǎn),旋轉(zhuǎn)后的每個(gè)公因子的含義大致清晰,因子1基本反映了研究熱點(diǎn)、知識(shí)圖譜、共詞分析;因子2基本反映了圖書館學(xué)、文獻(xiàn)計(jì)量學(xué)、核心期刊;因子3基本反映了社會(huì)網(wǎng)絡(luò)分析、合著研究;因子4基本反映了被引分析、圖書情報(bào)學(xué)、引文分析。這些因子的關(guān)鍵詞代表了他們的研究?jī)?nèi)容概況,可以用來(lái)總結(jié)出情報(bào)學(xué)研究領(lǐng)域的幾個(gè)主要部分及其相互關(guān)系。endprint
(三)聚類分析
聚類分析是研究“物以類聚”這類問(wèn)題的一種有效方法,“它的實(shí)質(zhì)是建立一種分類方法,將一批樣本數(shù)據(jù)按照它們?cè)谛再|(zhì)上的親密程度在沒(méi)有先驗(yàn)知識(shí)的情況下自動(dòng)進(jìn)行分類,同類間較為相似,不同類之間區(qū)別較大[3]?!本唧w操作步驟為:一是將相異矩陣導(dǎo)入SPSS19.0中,選擇分析——分類——系統(tǒng)聚類(即是層次聚類);二是將所有變量選擇到右邊的變量列表中,依次設(shè)置聚類分析的選項(xiàng),包括統(tǒng)計(jì)量﹑繪制﹑方法,輸出內(nèi)容為統(tǒng)計(jì)量和圖。
生成的聚類表中第一列表示聚類分析的第幾步;第二、三列表示本步聚類中哪兩個(gè)變量或者小類聚為一類;第四列表示變量距離或者小類距離;第五﹑六列表示本步聚類中參與的是變量還是小類,0表示變量,非0表示由第幾步聚類生成的小類參與本步聚類;第七列表示本步聚類結(jié)果將在以下第幾步中用到。如:首先進(jìn)行合并的是第九和第十二個(gè)變量,他們之間的相關(guān)系數(shù)為0.886,此聚類結(jié)果將在以下第四步聚類中用到。
樹狀圖更加客觀清晰地展現(xiàn)了聚類分析中每一次類合并的情況,首先合并為一類的是研究熱點(diǎn)和知識(shí)圖譜,依次按照距離大小合并為一類的是圖書館學(xué)和文獻(xiàn)計(jì)量學(xué),圖書情報(bào)學(xué)和被引分析,合著網(wǎng)絡(luò)和社會(huì)網(wǎng)絡(luò)分析,各變量合并之后,就是變量與小類及小類與小類之間的合并,最終所有小類合并為一類,此時(shí)類間的距離已經(jīng)非常大了。
(四)多維尺度分析
“多維尺度分析和因子分析一樣都是
降維分析,在多維尺度分析中,各數(shù)據(jù)點(diǎn)在空間中的位置是分析解釋的重要內(nèi)容,聚類分析可以確定組別,但是無(wú)法在空間中標(biāo)出觀測(cè)值,因此可以用多維尺度分析對(duì)聚類分析進(jìn)行補(bǔ)充說(shuō)明[4]?!本唧w操作步驟為:將相異矩陣導(dǎo)入SPSS19.0中,選擇分析——度量——多維尺度;將所有變量選擇到右邊的變量列表中,對(duì)模型,選項(xiàng)依次進(jìn)行設(shè)置。
二維圖中這12個(gè)變量分布于四個(gè)象限,大致分為四類:研究熱點(diǎn)﹑知識(shí)圖譜﹑共詞分析;圖書館學(xué)﹑文獻(xiàn)計(jì)量學(xué)﹑核心期刊;社會(huì)網(wǎng)絡(luò)分析﹑合著研究;被引分析﹑圖書情報(bào)學(xué)﹑引文分析。需要指出的是理論研究這個(gè)因子,其與其他因子間幾乎沒(méi)有任何關(guān)系,自行一類,結(jié)合原始的數(shù)據(jù)表可以發(fā)現(xiàn)基礎(chǔ)理論研究與情報(bào)學(xué)聯(lián)系最為緊密,共現(xiàn)的頻次也較高,由于數(shù)據(jù)處理時(shí)將情報(bào)學(xué)舍棄,故而導(dǎo)致理論研究成為孤立的一個(gè)關(guān)鍵詞。為整體研究的合理性,將在下文研究熱點(diǎn)及趨勢(shì)的分析中添加上情報(bào)學(xué)理論研究。
經(jīng)以上研究本文將情報(bào)學(xué)領(lǐng)域的研究熱點(diǎn)分為以下四類,一是基礎(chǔ)理論研究。理論研究是其學(xué)科確立的根本,5年來(lái),情報(bào)學(xué)基礎(chǔ)理論研究成果不斷豐富。二是社會(huì)網(wǎng)絡(luò)分析法研究。社會(huì)網(wǎng)絡(luò)分析法通過(guò)定量分析方法,擴(kuò)散到社會(huì)的各個(gè)領(lǐng)域中,目前合著網(wǎng)絡(luò)的研究是情報(bào)學(xué)領(lǐng)域的研究熱點(diǎn)。三是共詞分析法研究。共詞分析法屬于內(nèi)容分析法的一種,其原理為統(tǒng)計(jì)一組詞兩兩出現(xiàn)在一篇文獻(xiàn)中的次數(shù),對(duì)其進(jìn)行聚類等分析,得到研究領(lǐng)域的主題。四是文獻(xiàn)計(jì)量學(xué)研究。引文分析及被引分析都屬于文獻(xiàn)計(jì)量分析法,引文分析一直以來(lái)都是文獻(xiàn)計(jì)量學(xué)方法的一個(gè)重要研究方向,隨著計(jì)算機(jī)網(wǎng)絡(luò)的快速發(fā)展,為其提供了可視化支持,使研究結(jié)果更加科學(xué)直觀。
四、情報(bào)學(xué)領(lǐng)域演進(jìn)趨勢(shì)探析
結(jié)合以上研究熱點(diǎn)的分析及計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,本文預(yù)測(cè)情報(bào)學(xué)未來(lái)的研究方向。一是以理論研究為主。理論是實(shí)踐的基礎(chǔ),對(duì)理論的深入研究能夠促進(jìn)該學(xué)科的長(zhǎng)久發(fā)展。因此廣大情報(bào)學(xué)工作者重視對(duì)情報(bào)學(xué)理論的研究,并且有的學(xué)者將其他領(lǐng)域的理論知識(shí)與情報(bào)學(xué)相結(jié)合,使得情報(bào)學(xué)的內(nèi)容更加豐富。二是圖書館學(xué)研究。圖書館學(xué)一直以來(lái)都是情報(bào)學(xué)研究的重點(diǎn)內(nèi)容之一,從高頻關(guān)鍵詞表可以看出,其居于第三位。基于此可以預(yù)測(cè)圖書情報(bào)研究依然是未來(lái)情報(bào)學(xué)研究的熱點(diǎn)。三是定量的分析法。無(wú)論是文獻(xiàn)計(jì)量法還是社會(huì)網(wǎng)絡(luò)分析法都是定量研究法,當(dāng)前隨著計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,越來(lái)越多的分析軟件被廣泛應(yīng)用于情報(bào)學(xué)的研究之中,鑒于此定量的研究方法與計(jì)算機(jī)技術(shù)的結(jié)合必將成為日后研究人員的主要科研領(lǐng)域。
[參 考 文 獻(xiàn)]
[1]劉濤.關(guān)于我國(guó)圖書館學(xué)研究熱點(diǎn)分析[D].東北師范大學(xué),2012
[2]余建英,何旭紅.數(shù)據(jù)統(tǒng)計(jì)分析與SPSS應(yīng)用[M].北京:人民郵電出版社,2003
[3]邱均平,呂紅.近五年國(guó)際圖書情報(bào)學(xué)研究熱點(diǎn)、前沿及其知識(shí)基礎(chǔ)——基于17種外文期刊知識(shí)圖譜的可視化分析[J].圖書情報(bào)知識(shí),2013(3):4-15+58
[4]儲(chǔ)節(jié)旺,郭春俠.共詞分析法的基本原理及EXCEL實(shí)現(xiàn)[J].情報(bào)科學(xué),2011(6):931-934
[責(zé)任編輯:王鳳娟]endprint