梁美宏(中國科學(xué)技術(shù)信息研究所,北京 100038)
基于信息熵的國家社科基金圖書館·情報與文獻(xiàn)學(xué)領(lǐng)域課題指南主題演化分析
梁美宏
(中國科學(xué)技術(shù)信息研究所,北京 100038)
摘要:運(yùn)用信息熵方法對國家社科基金圖書館·情報與文獻(xiàn)學(xué)歷年課題指南主題進(jìn)行定量處理,從時間和主題兩方面進(jìn)行演化分析,得出圖書館·情報與文獻(xiàn)學(xué)課題指南主題的總體演化特征,結(jié)合學(xué)科發(fā)展實際,探討課題指南對圖書館·情報與文獻(xiàn)學(xué)發(fā)展的指導(dǎo)作用及指南設(shè)立的合理性,并對指南設(shè)立提出建議。分析表明,我國社科基金圖書館·情報與文獻(xiàn)學(xué)課題指南熵值整體呈上升趨勢,學(xué)科研究范圍越來越廣,指南涉及主題分布越來越均衡,指南對學(xué)科發(fā)展有積極導(dǎo)向作用,但在整體及某些具體主題的把握上仍有待進(jìn)一步加強(qiáng)。
關(guān)鍵詞:信息熵;國家社科基金;主題演化;圖書館·情報與文獻(xiàn)學(xué);課題指南
國家社會科學(xué)基金(簡稱“社科基金”)設(shè)立于1991年,其課題指南包括了社科基金建議的研究方向和題目,通常是該領(lǐng)域的研究熱點,具有很強(qiáng)的方向指導(dǎo)性,每年發(fā)布一次。課題指南作為重要的研究領(lǐng)域指導(dǎo)性資源,通過研究課題指南中的主題變化和趨勢,可以把握領(lǐng)域研究熱點的演化規(guī)律以及學(xué)科領(lǐng)域間的關(guān)聯(lián)關(guān)系。目前,研究人員對社科基金課題指南的研究主要通過基本的統(tǒng)計學(xué)、文獻(xiàn)學(xué)方法得出現(xiàn)狀、趨勢、導(dǎo)向作用等結(jié)論,研究缺乏整體宏觀性、系統(tǒng)性,如喬玉成[1]用主題詞頻數(shù)統(tǒng)計和相似度統(tǒng)計法對1999—2009年體育學(xué)社科基金課題指南進(jìn)行統(tǒng)計分析,僅對指南涉及主題的出現(xiàn)頻次進(jìn)行統(tǒng)計分析;郜正亞[2]將2011年社科基金項目課題指南從理論、方法、技術(shù)、業(yè)務(wù)4個角度進(jìn)行歸類來統(tǒng)計分析圖書館學(xué)的研究熱點,從指南條目數(shù)量及主題特征等方面進(jìn)行分析探討;林艷麗、李堅[3]描述與分析1999—2011年社科基金課題指南數(shù)量特征,探索我國社會保障領(lǐng)域研究動態(tài)及發(fā)展軌跡。
信息熵是用來衡量系統(tǒng)不確定性、有序性和信息量多少的尺度,學(xué)者已將信息熵用于領(lǐng)域的主題及趨勢研究中,如雷會珠[4]等利用信息熵對我國競爭情報進(jìn)行研究,并指出信息熵原理對系統(tǒng)研究有重大意義;王居平[5]用信息熵方法結(jié)合組合預(yù)測方法對中國數(shù)字圖書館進(jìn)行定量趨勢分析;王莉亞等[6]運(yùn)用信息熵理論對信息整合主題進(jìn)行深入分析,得出主題演化規(guī)律。社科基金歷年課題指南可看作一個有耗散結(jié)構(gòu)特征的綜合系統(tǒng),因此,可以用信息熵來研究該系統(tǒng)的演化特征。熵值變化與社會環(huán)境變化、學(xué)科自身的發(fā)展等都有很大的關(guān)系,通過對熵進(jìn)行分析,可在量化分析的基礎(chǔ)上挖掘產(chǎn)生變化的原因,為下一步工作提供參考。
本文擬用信息熵方法對社科基金圖書館·情報與文獻(xiàn)學(xué)(簡稱“圖情檔”)課題指南中的主題,從時間、主題兩方面進(jìn)行統(tǒng)計分析,結(jié)合學(xué)科的發(fā)展,探討課題指南的指導(dǎo)作用,并對指南設(shè)立提出建議。
“熵”是熱力學(xué)中的度量名詞,它用來衡量系統(tǒng)中不可逆的能量消耗程度大小。熵定律表明,一個絕熱系統(tǒng)的全部熵值不會自動減少,即一個孤立系統(tǒng)傾向于增加混亂程度。在一定環(huán)境下,系統(tǒng)的熵存在一個極大值,此時系統(tǒng)達(dá)到相對穩(wěn)定狀態(tài)[7]。正因為熵的這種系統(tǒng)性特點,熵廣泛用于自然科學(xué)、社會科學(xué)各領(lǐng)域,利用其參考值和變化值進(jìn)行分析研究,可以得出研究對象的發(fā)展演化情況。
Shannon將熱力學(xué)的熵引入到信息論中,作為對不確定性的測量,熵越高表示能傳輸?shù)男畔⒃蕉?,熵越低表示能傳輸?shù)男畔⒃缴?。信息熵的計算公式為?/p>
其中,H(x)表示變量x的熵值;p(xi)為第i個變量xi發(fā)生的概率;對數(shù)使用的底為10,熵值單位是dit[8]。
利用信息熵可以判斷和度量系統(tǒng)發(fā)展過程中有序性、規(guī)則性、多樣性的狀態(tài)轉(zhuǎn)化過程及程度。通過信息熵來分析國家社科基金課題指南的主題演化情況,可以得到該系統(tǒng)在發(fā)展過程中的主題序化狀態(tài)、研究主題范圍及熱點的演變情況等,從而可定量闡述學(xué)科發(fā)展的規(guī)律及趨勢。
對社科基金歷年課題指南所涉及主題的熵值從以下3個維度進(jìn)行計算并分析:(1)從時間維度計算歷年主題熵值,整體把握我國社科基金課題指南的發(fā)展演化情況,并依據(jù)每年熵值大小討論影響熵值變化的原因,分析課題指南演化的具體情況。(2)計算歷年主題的熵變值(熵值之差),通過熵變值分析熱點變化狀態(tài)。(3)從主題維度,分別計算各主題歷年熵值,對比不同主題熵值大小,探索學(xué)科研究熱點,分析課題指南對學(xué)科發(fā)展的指導(dǎo)情況。
對全國哲學(xué)社會科學(xué)規(guī)劃辦公室官網(wǎng)公布的1999—2014年“圖書館·情報與文獻(xiàn)學(xué)”歷年社科基金課題指南中圖情檔案課題數(shù)的統(tǒng)計,如表1[9]所示。
(1)主題詞切分:對歷年社科基金課題指南中課題的名稱進(jìn)行分詞,并將其中的虛詞、連詞、標(biāo)點符號去掉,合并同義詞,得到495個主題詞。
表1 1999—2014年社科基金圖情檔案課題名稱數(shù)統(tǒng)計
(2)主題詞共現(xiàn)關(guān)系獲?。核^主題詞共現(xiàn)關(guān)系,就是利用文獻(xiàn)中共同出現(xiàn)的關(guān)鍵詞之間的關(guān)聯(lián)強(qiáng)度,兩兩統(tǒng)計一組關(guān)鍵詞在同一篇文獻(xiàn)中共同出現(xiàn)的頻率,利用包容系數(shù)、聚類分析等方法,把分析對象之間錯綜復(fù)雜的共詞網(wǎng)狀關(guān)系進(jìn)行簡化,以數(shù)值、圖形直觀地表示出來,從而可確定某一學(xué)科或領(lǐng)域的研究熱點變化趨勢。
(3)主題識別:將共現(xiàn)對轉(zhuǎn)化為共現(xiàn)矩陣,通過對共現(xiàn)矩陣進(jìn)行聚類以獲取主題分布情況。為提高聚類結(jié)果的準(zhǔn)確度,對共現(xiàn)矩陣進(jìn)行降維處理,去除了共現(xiàn)次數(shù)較低的關(guān)系對。最終將主題聚為15個類,每一類包含該主題相關(guān)的主題詞。例如:“檔案管理”類包含的主題是與檔案管理相關(guān)的研究內(nèi)容,有電子文件、安全管理、檔案法等;“資源建設(shè)與共建共享”類下的主題有資源開發(fā)利用,資源共建、共享等。每個類的主題類標(biāo)簽及類中部分主題詞如表2所示。
根據(jù)主題提取結(jié)果計算各類主題歷年頻率(當(dāng)年出現(xiàn)頻次占當(dāng)年所有主題頻次之和的比率),精確度到小數(shù)點后兩位數(shù),計算公式為:
其中,p(xi)表示第i個主題xi在某年的頻率,tj表示第j個主題在該年的頻次,n表示該年主題個數(shù)。i=1,2,…,n;j=1,2,…,n。
利用信息熵公式計算出各主題熵值,如表3所示。
4.1歷年主題熵值變化
歷年主題的熵值如圖1所示。通過圖1可看到,16年來社科基金圖情檔學(xué)科的課題指南涉及主題的信息熵熵值整體隨時間呈上升趨勢,這表明課題指南包含的主題范圍越來越廣,涉及內(nèi)容越來越多,不同主題之間課題的數(shù)量也趨于均衡。具體來看1999年熵值為歷年最低,2000年熵值相比上一年增加0.17,2000年以后一直到2005年,熵值每年穩(wěn)步增加,每年的增長值在0.07左右,2006年熵值出現(xiàn)第一次下降,比上一年下降0.03,2007年熵值大小比2006年下降0.01,2008年熵值再次開始上升,上升幅度為0.06,此后一直都保持緩慢增長趨勢,增長值在0~0.03。2013年前后為高熵值分布區(qū)域。
表3 各類主題頻率及信息熵值
圖1 歷年主題熵值
根據(jù)圖1及表3,結(jié)合各年熵值波動的情況及主題頻率分布,得出圖情檔學(xué)科課題指南歷年演化路線(圖2):1999—2005年熵值歷年上升趨勢較為迅速。2005年至今熵值的上升趨勢較之前相對緩慢,說明社科基金圖情檔學(xué)科課題指南內(nèi)容設(shè)定上;2005年以前每年信息流動較大,涉及內(nèi)容變化較大,主題較多集中于某幾個主題;2005年以后信息流動較小,每年涉及內(nèi)容分布比較穩(wěn)定;2013年熵值最大,說明該年主題比例為近16年最佳,系統(tǒng)最穩(wěn)定??傮w來看,整個系統(tǒng)不斷向著主題越來越豐富,各主題數(shù)量越來越相對均衡的高熵狀態(tài)發(fā)展。
與相關(guān)年份圖情領(lǐng)域?qū)W者研究情況的對比分析結(jié)果如下。
1999年主題熵值為歷年最低,指南主題主要集中在資源建設(shè)與共建共享、數(shù)字資源與開放獲取、圖書館服務(wù)方面,這與文獻(xiàn)中描述的規(guī)律一致:1998—1999年我國圖情界正逢知識經(jīng)濟(jì)熱潮,1999年迎頭趕上文獻(xiàn)資源建設(shè)問題新變化,研究者對未來發(fā)展趨勢及資源建設(shè)的問題積極展開研究[10-11]。
2002年指南主題多集中在圖書館服務(wù)、大數(shù)據(jù)和圖書館組織機(jī)構(gòu)等方面,這也與王欣、鐘萍等[12]的研究基本一致。2003年、2004年熵值增加到0.9以上,指南主題內(nèi)容開始增多,并廣泛分布在各個類目下,當(dāng)時我國圖情領(lǐng)域研究內(nèi)容變廣、學(xué)科融合交叉研究增強(qiáng),馬恒通[13]指出,新技術(shù)革命對學(xué)科的研究內(nèi)容、前沿領(lǐng)域產(chǎn)生很大變革。
2005年熵值達(dá)到短期內(nèi)最高點,指南主題已分布在14個類目下,主要集中于數(shù)字資源與開放獲取、圖書館組織機(jī)構(gòu)、信息生態(tài)等方面,這與耿波等[14]通過對圖情學(xué)科高頻引文進(jìn)行統(tǒng)計分析得出的2005年領(lǐng)域研究熱點問題相符合。2006—2007年主題熵值稍有下降,但下降值不大。2006年圖書館服務(wù)、信息生態(tài)、高校教育與人才培養(yǎng)等主題信息量有所下降,資源建設(shè)與共建共享、大數(shù)據(jù)、競爭情報等主題信息量有所增加。2007年數(shù)字資源與開放獲取、知識管理、大數(shù)據(jù)等主題信息量下降較多,圖書館服務(wù)、網(wǎng)絡(luò)輿情、高校教育與人才培養(yǎng)方面信息量增加較多,說明課題指南內(nèi)容設(shè)定較為穩(wěn)定,同時,在一些主題上略有調(diào)整,閱讀相關(guān)文獻(xiàn)也發(fā)現(xiàn)這兩年學(xué)科熱點研究較穩(wěn)定,在主題側(cè)重上稍有變化[15-16]。
2007年以后,指南涉及的主題分布越來越均勻,主題信息熵逐年平穩(wěn)增加,主題主要集中在數(shù)字資源與開放獲取、資源建設(shè)與共建共享、圖書館服務(wù)、知識管理、競爭情報、知識組織、網(wǎng)絡(luò)輿情等方面??傊ㄟ^分析可發(fā)現(xiàn),采用信息熵對課題指南主題分析得出的結(jié)論與學(xué)科發(fā)展情況基本吻合。
(1)社科基金圖情檔學(xué)科課題指南的主題內(nèi)容不斷增加,研究范圍不斷擴(kuò)大,學(xué)科的交叉融合越來越廣泛、專業(yè)面越來越寬,主題分布越來越均勻。
(2)課題指南內(nèi)容設(shè)立與學(xué)科研究重點、熱點基本保持一致,對科研人員研究方向、學(xué)科發(fā)展方向有良好的指導(dǎo)作用,但一些主題的分配仍需進(jìn)一步合理化。
(3)主題范圍暫時接近飽和狀態(tài),主題分布比例逐漸均衡,今后指南在設(shè)立研究課題時,有關(guān)專家在保持與往年主題穩(wěn)定的同時,要關(guān)注整個學(xué)科發(fā)展的背景環(huán)境,根據(jù)實際情況做適當(dāng)調(diào)整,制定出更加合理的指南來引導(dǎo)學(xué)科發(fā)展。
(4)社科基金在設(shè)立指南時可根據(jù)學(xué)科發(fā)展現(xiàn)狀,在一定時期形成以某些主題為主導(dǎo)、其他主題靈活設(shè)置的有序穩(wěn)定的課題指南,給予學(xué)科發(fā)展更好的指導(dǎo),保證學(xué)科健康發(fā)展。
4.2歷年主題熵差變化
根據(jù)信息熵變理論,熵差大于0表示演化向無序狀態(tài)轉(zhuǎn)變,熵差為0表示演化過程沒有實質(zhì)變化,熵差小于0表示演化向有序狀態(tài)轉(zhuǎn)變。歷年來主題的熵差如圖2所示。從圖2可知,2000—2014年每一年的熵差都有變化,除2006年、2007年、2009年及2014年熵差小于0外,其余每年熵差都大于0,說明基金課題指南主題內(nèi)容幾乎每年都有增加。從整體上來看,在熵差大于0的區(qū)域內(nèi),2000—2005年間的熵差值大于2008—2014年間的熵差值,說明近幾年指南涉及的主題內(nèi)容變化幅度小于指南設(shè)立初期,這與表3主題頻率分布情況保持一致。熵差值在同一變化方向的轉(zhuǎn)折程度較小,在不同變化方向的轉(zhuǎn)折程度很大,課題指南在研究內(nèi)容出現(xiàn)變化之后能夠及時吸納并做出調(diào)整。
圖2 歷年主題熵差
2000年主題熵變最大,說明基金指南設(shè)立最初兩年指南內(nèi)容信息流動較大,從主題頻率分布情況可知1999年和2000年指南涉及主題個數(shù)分別為5、6,其中共同出現(xiàn)的主題有資源建設(shè)與共建共享、圖書館服務(wù)圖書館職業(yè)規(guī)范,雖然涉及主題總數(shù)相差不大。但相比1999年,2000年的主題分布較為均衡,除圖書館組織機(jī)構(gòu)頻率為28.57%,其余主題頻率均為14.29%,而1999年資源建設(shè)與共建共享占主要內(nèi)容,頻率為47.06%,圖書館服務(wù)次之,占23.53%,其余主題則頻率相對較低,檔案管理為5.88%,數(shù)字資源與開放獲取和圖羽館職業(yè)規(guī)范均為11.76%等。
2001—2004年,每年熵差值在0.03~0.11,說明這幾年熵值上升的幅度在穩(wěn)步下降。指南內(nèi)容信息流動幅度較為穩(wěn)定。每年指南涉及7~10個主題,主題個數(shù)變化較大,但主題分布情況穩(wěn)步調(diào)整。從主題頻率分布可看到,由開始的某主題頻率較高,其余主題頻率基本相同逐漸轉(zhuǎn)變?yōu)楦髦黝}頻率都有一定差值且差值不大。
2005—2007年,2005年熵差值又有所增加,涉及主題增加到14個,主題頻率分布在2%~17%,涉及的內(nèi)容越來越多,主題分布更為均衡。2006年與2007年熵差出現(xiàn)負(fù)值,熵值減小,是因為這兩年主題分布略有側(cè)重點。2006年指南涉及的13個主題中數(shù)字資源與開放獲取、資源建設(shè)與共建共享這兩個主題所占比重較大,頻率分別為18.18%和15.15%,其他有4個主題頻率為3.03%,1個為1.52%,其余5個主題頻率在6%~12%。在2007年12個主題中資源建設(shè)與共建共享和圖書館組織機(jī)構(gòu)主題為主要方向,頻率為21.33%和13.33%,其他有5個主題頻率為5.33%,1個主題頻率為2.67%,其余4個主題頻率在6%~11%。
2010—2014年熵差又開始正值波動,且波動幅度要小于2005年以前,涉及主題個數(shù)保持在12~15個,主題分布更為均衡,例如:2014年涉及的14個主題頻率均勻分布在1.6%~13%,說明圖情領(lǐng)域主題內(nèi)容趨于穩(wěn)定,新主題出現(xiàn)也較為穩(wěn)定,且新主題出現(xiàn)后基金指南能夠及時作出調(diào)整,指導(dǎo)科研走向。
上述分析表明,現(xiàn)有流程制度下設(shè)立的社科基金課題指南,能夠較好地指導(dǎo)學(xué)科發(fā)展,但在整體上還可加強(qiáng)。首先,可以考慮結(jié)合學(xué)科發(fā)展特點和社會需求設(shè)立比較合理的主題數(shù)量,避免部分主題數(shù)量過多或過少,以保證各主題在合理研究范圍內(nèi)穩(wěn)定而又快速地發(fā)展。其次,要加強(qiáng)對學(xué)科發(fā)展影響因素的關(guān)注與研究,強(qiáng)化對未來變化趨勢的判斷,使相關(guān)研究主題連續(xù)、更快地發(fā)展。
圖3 近16年各主題詞熵值
主題熵值柱狀圖如圖3所示。從圖3可知,16年來熵值排名前三的主題是資源建設(shè)與共建共享、數(shù)字資源與開放獲取、圖書館服務(wù),這與它們研究范圍較為廣泛多樣且每年指南中公布的題目名稱變化較為平穩(wěn)有關(guān)。熵值較高的主題還有大數(shù)據(jù)、圖書館組織機(jī)構(gòu)、檔案管理等,說明國家社科基金在對圖書情報檔案學(xué)科的指導(dǎo)上,一直重視領(lǐng)域事業(yè)發(fā)展、資源建設(shè)等傳統(tǒng)基礎(chǔ)工作和用戶服務(wù)等實踐工作,同時注重關(guān)注大數(shù)據(jù)等領(lǐng)域熱點問題,這與劉孝文[17]在2007年的研究結(jié)論大體相同。熵值最低的是全民閱讀,較低的還有用戶研究、圖書館職業(yè)規(guī)范、高校教育與人才培養(yǎng),這些主題熵值偏低的原因眾多,如國家政策環(huán)境、人才素質(zhì)、學(xué)科關(guān)注情況等。另外,熵值最高的主題詞與熵值最低的主題詞熵差較大,說明社科基金圖情檔課題指南在不同主題課題的數(shù)量持續(xù)性研究導(dǎo)向上有明顯的差別。
結(jié)合表3各主題歷年頻率分布的分析表明,熵值高的幾個主題包含的內(nèi)容較為豐富,而熵值低的幾個主題較為具體?!百Y源建設(shè)與共建共享”涉及與圖書情報檔案學(xué)資源建設(shè)與管理相關(guān)的各項研究內(nèi)容,從指南設(shè)立之初到現(xiàn)在一直分布穩(wěn)定,除2000年頻率出現(xiàn)一次低值(0.0%)外,其余各年頻率都在10%~20%左右波動?!皵?shù)字資源與開放獲取”、“圖書館服務(wù)”、“大數(shù)據(jù)” 和“圖書館組織機(jī)構(gòu)”等主題的分布情況也比較均衡。16年間,除有一到兩年出現(xiàn)較低頻率外,其他各年都在一定范圍內(nèi)穩(wěn)定波動?!案偁幥閳蟆庇?0世紀(jì)80年代進(jìn)入我國,自2006年以來研究進(jìn)入高峰期,2010年以后研究趨于平緩,其熵值處于中等水平,在歷年課題指南中有所波動。這與競爭情報在我國遇到的政府環(huán)境、社會環(huán)境以及人員素質(zhì)不夠強(qiáng)、人才培養(yǎng)缺乏等都有很大關(guān)系[18-20]?!案咝=逃c人才培養(yǎng)”主題的熵值處于中等偏下位置,說明該主題歷年課題數(shù)量差別較大?!坝脩粞芯俊敝黝}熵值排名靠后,一方面說明課題指南在此方面的重視程度有所偏低,另一方面與該主題研究易向其他主題擴(kuò)散也有關(guān)系。“全民閱讀”近幾年來越來越受社會關(guān)注,但在基金指南中其每年出現(xiàn)數(shù)量差異較大,所占比例較低與整體主題的安排有關(guān),另外也反映出該主題研究內(nèi)容較具體,信息流動不大。
此外,分析表明歷年指南主題重心有所轉(zhuǎn)移:1999—2000年主題重心主要在資源建設(shè)與共建共享、圖書館組織機(jī)構(gòu)、圖書館服務(wù)等方面,2001年主題重心轉(zhuǎn)移到“網(wǎng)絡(luò)輿情”,2002—2003年指南主題重心與1999年、2000年相吻合,2004年主題重心增加“圖書館職業(yè)規(guī)范”,2005年“信息生態(tài)”上升為重心之一,2006—2008年重心又與1999年、2000年一樣回歸基礎(chǔ)建設(shè)工作,2009年主題重心轉(zhuǎn)移到“知識組織”,2010—2013年指南主題主要重心分布更為均勻,2014年主題重心主要在“數(shù)字資源與開放獲取”、“圖書館組織機(jī)構(gòu)”、“競爭情報”等方面。
通過對主題熵值的分析,可知課題指南一直重視對 “資源建設(shè)與共建共享”及“圖書館服務(wù)”主題的研究并且導(dǎo)向平穩(wěn),緊隨其后的是基礎(chǔ)業(yè)務(wù)工作以及跨領(lǐng)域問題、前沿?zé)狳c問題等,這種指導(dǎo)模式有利于學(xué)科的健康發(fā)展。但通過對主題熵值的分析,也發(fā)現(xiàn)一些問題,如用戶研究和人才培養(yǎng)均是圖情檔學(xué)科發(fā)展重要環(huán)節(jié),但指南對這些主題的導(dǎo)向性差異較為明顯,波動性較大,連續(xù)性不夠。根據(jù)歷年指南主題重心轉(zhuǎn)移變化情況可預(yù)測未來課題指南主題內(nèi)容設(shè)立情況。在以后的主題設(shè)立中應(yīng)關(guān)注主題設(shè)立的連續(xù)性及分布情況,在了解主題涉及內(nèi)容情況的前提下合理布局各主題數(shù)量,更好地引導(dǎo)科研方向及學(xué)科發(fā)展方向。
信息熵將數(shù)據(jù)進(jìn)行定量化處理,從多角度對問題進(jìn)行分析可以產(chǎn)生不同的分析結(jié)果,其應(yīng)用對我國社科基金課題指南設(shè)立的結(jié)構(gòu)調(diào)整具有指導(dǎo)意義。本文基于信息熵原理從時間、主題兩方面對國家社科基金圖情檔學(xué)科近16年的課題指南進(jìn)行分析,力求為社科基金指南設(shè)立提供參考建議,為領(lǐng)域的科研發(fā)展提供幫助。國家社科基金應(yīng)強(qiáng)化課題指南設(shè)立的規(guī)范及流程建設(shè),在設(shè)立指南前加強(qiáng)定性定量研究,將研究基礎(chǔ)分析數(shù)據(jù)提供給專家,再由專家提出指南,確保能及時體現(xiàn)對最新熱點主題的敏感性。此外,在部分主題的連續(xù)性及穩(wěn)定性方面,有待加強(qiáng),如人才培養(yǎng)、圖書館職業(yè)規(guī)范、用戶研究等。
信息熵的分析表明,社科基金圖情檔學(xué)科課題指南對學(xué)科的發(fā)展導(dǎo)向作用明顯,符合學(xué)科發(fā)展規(guī)律,但也存在一定改進(jìn)的空間。
(1)基金指南主題內(nèi)容分布要保持相對均衡。從歷年主題熵值變化情況來看,基金指南整體熵值的上升趨勢表明圖情檔學(xué)科研究范圍越來越廣,內(nèi)容分布越來越均衡,與學(xué)科發(fā)展趨勢基本符合。近幾年主題熵值緩慢升高,預(yù)測主題范圍暫時接近飽和狀態(tài),但一些主題設(shè)立上存在不合理性。例如:近年來一直強(qiáng)調(diào)“以人為本”的圖書館思想,“圖書館服務(wù)”在2006年以后基金指南內(nèi)容中一直占很大比重,但“用戶研究”、“人才培養(yǎng)”這幾個主題則沒有明顯上升趨勢。在設(shè)立課題指南時,應(yīng)考慮結(jié)合定量分析、學(xué)科發(fā)展情況及社會環(huán)境調(diào)整主題分布。
(2)基金指南主題內(nèi)容應(yīng)保持一定連續(xù)性。通過歷年主題熵變分析和主題熵值分析,部分主題歷年分布差異較大,對一些重要主題導(dǎo)向差異性比較明顯,歷年波動性大,連續(xù)性不夠,如“高校教育與人才培養(yǎng)”、“圖書館職業(yè)規(guī)范”、“全民閱讀”等主題?;鹬改显O(shè)立前應(yīng)加強(qiáng)關(guān)注學(xué)科發(fā)展環(huán)境及對未來趨勢的判斷,保證指南主題內(nèi)容的連續(xù)性與穩(wěn)定性,結(jié)合主題涉及的內(nèi)容范圍、所處社會環(huán)境及自身價值與意義合理設(shè)置主題數(shù)量。例如:根據(jù)主題熵差變化情況來推測未來熵差變化,結(jié)合社會發(fā)展、學(xué)科發(fā)展動態(tài),提出數(shù)量更適宜、指導(dǎo)性更強(qiáng)的課題指南,更好地發(fā)揮基金指南作用,促進(jìn)學(xué)科發(fā)展。
(3)基金指南應(yīng)重視領(lǐng)域重點熱點問題。通過主題熵值分析,課題指南始終關(guān)注學(xué)科事業(yè)發(fā)展、資源建設(shè)等研究,重視跨領(lǐng)域、前沿?zé)狳c問題。但從歷年主題熵值變化來看,熵值整體只升不降,說明在熱點、新問題方面的關(guān)注度仍有提升空間。在指南設(shè)立時,可根據(jù)學(xué)科影響因素及自身發(fā)展現(xiàn)狀,在特定時間段設(shè)立以某些主題為主導(dǎo)、其他主題靈活設(shè)置的有序穩(wěn)定的課題指南,指導(dǎo)學(xué)科在整個社會環(huán)境下有序健康發(fā)展。
(4)歷年基金指南主題重心有一定變化趨勢。隨著研究內(nèi)容逐漸增多、新主題出現(xiàn),基金指南主題重心逐漸開始轉(zhuǎn)移,從最初幾年以“資源建設(shè)與共建共享”、“圖書館服務(wù)”等為主要主題重心的局面,轉(zhuǎn)變到近幾年的主題重心歷年均有變化的局面。其中除上述主題外,歷年成為主題重心的主題依次有“網(wǎng)絡(luò)輿情”、“圖書館職業(yè)規(guī)范”、“信息生態(tài)”、“知識管理”、“知識組織”,這與學(xué)科的發(fā)展趨勢相符合。根據(jù)指南主題重心年度變化趨勢可預(yù)測未來指南主題設(shè)立情況,結(jié)合學(xué)科所處環(huán)境,設(shè)立更為合理的課題指南,可將“大數(shù)據(jù)”、“網(wǎng)絡(luò)輿情”、“人才培養(yǎng)”等熱點、重點問題適當(dāng)調(diào)整為主題重心,促進(jìn)學(xué)科發(fā)展。
本研究中尚存一些問題需在將來作進(jìn)一步探討和改進(jìn)。例如:主題熵值趨勢分析可從歷年熵值變化率等多角度進(jìn)行分析,得出更深入的結(jié)論;在驗證結(jié)論時除依據(jù)相關(guān)文獻(xiàn)研究外,應(yīng)結(jié)合更全面的其他相關(guān)信息,以得出更準(zhǔn)確的結(jié)論。
參考文獻(xiàn):
[1] 喬玉成. 我國體育社會科學(xué)發(fā)展導(dǎo)向研究:1999—2009年體育學(xué)國家社會科學(xué)基金課題指南的統(tǒng)計學(xué)分析[J]. 體育學(xué)刊,2010(5):12-20.
[2] 郜正亞. 我國圖書館學(xué)學(xué)科研究熱點分析:基于2011年國家社科基金項目及課題指南的統(tǒng)計[J]. 圖書館工作與研究,2012(5):8-12.
[3] 林艷麗,李堅. 我國社會保障問題研究進(jìn)展綜述:基于國家社會科學(xué)基金課題指南及資助項目的統(tǒng)計分析[J]. 社會保障研究,2012(1):97-109.
[4] 雷會珠,陳桂榮,琚彤軍. 信息熵在競爭情報計量分析中的應(yīng)用[J]. 情報雜志,2008(5):73-75.
[5] 王居平. 中國數(shù)字圖書館發(fā)展趨勢的組合預(yù)測方法[J]. 數(shù)字圖書館論壇,2007(12):41-44.
[6] 王莉亞,張志強(qiáng). 基于信息熵的信息整合主題演化研究[J]. 圖書情報工作,2012,56(6):102-106.
[7] 維基百科. 熵[EB/OL].[2015-03-04].http://zh.wikipe dia.org/wiki/%E 7%86%B5.
[8] 維基百科.熵(信息論)[EB/OL].[2015-03-04].http:// zh.wikipedia.org/wiki/%E7%86%B5_(%E4%BF%A1 E6%81%AF%E8 %AE%BA).
[9] 全國哲學(xué)社會科學(xué)規(guī)劃辦公室網(wǎng)站[EB/OL].[2015-03-04].http://www.npopss-cn.gov.cn/.
[10] 廖劍嵐,范并思. 感受知識經(jīng)濟(jì)走近數(shù)字化時代:1998—1999年圖書館學(xué)情報學(xué)研究綜述(上)[J].圖書館雜志,2000,19(2):18-22.
[11] 廖劍嵐,范并思. 感受知識經(jīng)濟(jì)走近數(shù)字化時代:1998—1999年圖書館學(xué)情報學(xué)研究綜述(下)[J].圖書館雜志,2000,19(3):6-8,10.
[12] 王欣,鐘萍. 1993—2002年我國圖書館學(xué)文獻(xiàn)的計量分析[J]. 大學(xué)圖書情報學(xué)刊, 2004(2):85-86,8.
[13] 馬恒通. 圖書館學(xué)情報學(xué)研究的新進(jìn)展:《當(dāng)代圖書館學(xué)情報學(xué)前沿探尋》述評[J]. 中國圖書館學(xué)報,2003,29(2):80-81.
[14] 耿波,劉寧,秦玉蓉,等. 2002—2006年我國圖書館學(xué)情報學(xué)高頻引文統(tǒng)計分析[J]. 情報資料工作, 2008 (1):78-81.
[15] 李品,周金元. 中國圖情領(lǐng)域2005至2009年研究熱點透視:基于國內(nèi)外期刊發(fā)文詞頻統(tǒng)計的分析[J].國家圖書館學(xué)刊,2010,19(4):36-40.
[16] 劉曉波. 2006—2010年我國圖書館學(xué)、情報學(xué)研究特征及比較分析[J]. 圖書情報工作,2012,56(23):54-58,85.
[17] 劉孝文. 試論我國圖書館學(xué)研究熱點及走向:基于國家社科基金課題指南和研究生培養(yǎng)方向的分析[J].情報資料工作,2007(1):30-33.
[18] 姜曉曦. 2000—2005年我國競爭情報研究述評[J]. 情報雜志,2006,25(10):109-112.
[19] 尹麗棠. 我國競爭情報研究的動態(tài)及發(fā)展趨勢研究[J]. 圖書館學(xué)研究,2012(22):2-6.
[20] 麥?zhǔn)缙?,鄒薇,顏慶佳,等. 2006—2010年我國競爭情報論文的計量分析[J]. 圖書館工作與研究, 2012 (2): 24-29.
中圖分類號:G350
文獻(xiàn)標(biāo)識碼:A
DOI:10.3772/j.issn.1674-1544.2016.01.011
作者簡介:梁美宏(1991—),女,中國科學(xué)技術(shù)信息研究所碩士研究生,研究方向:知識組織。
基金項目:國家自然科學(xué)基金面上項目“基于海量數(shù)字資源的科研關(guān)系網(wǎng)絡(luò)構(gòu)建研究”(71273251)。
收稿時間:2015年11月25日。
Theme Evolution Analysis of “Library, Information and Archival Science” in National Social Science Fund Subject Guide by Information Entropy Method
LIANG Meihong
(Institute of Scientific and Technical Information of China, Beijing 100038)
Abstract:This article analyzes quantificationally the subjects of the CY Theme guide which come library,information and archival science on national social science fund by information entropy method from evolution of time and theme, so obtain all of evolution features from the subjects of theme guide of library, information and archival science. According to the results and development situation of disciplines, the paper discusses the subject guide’s effect on disciplines development and the reasonable of subject guide’s setting and puts forward some recommendations for subject guide’s setting. It is found that the entropy of overall “l(fā)ibrary, information and archival science” in national social science fund presents increasing trend, the range of study is more and more broader, the theme of subject guide is more and more balanced. The subject guide has positive effect on disciplineoriented, but the grasp of the overall topics and some specific topics still to be further strengthened.
Keywords:information entropy, national social science fund, theme evolution, library information and archival science, subject guide