嚴(yán)承希 張皓玨
(北京大學(xué)信息管理系 北京 100871)
圖書館聯(lián)盟的理論研究起步較早且發(fā)展較為成熟。圖書館合作可以追溯到19 世紀(jì)80 年代,但“聯(lián)盟”這個詞直到20 世紀(jì)50—60 年代才在圖書館及科教領(lǐng)域的專業(yè)文獻(xiàn)中出現(xiàn)。圖書館聯(lián)盟的概念是用來形容多個圖書館為協(xié)調(diào)信息服務(wù)供應(yīng)商,共享資源與服務(wù),并游說政府以獲得更多資金開展的圖書館合作[1]。1940—2017 年全球圖書館聯(lián)盟相關(guān)研究的引文數(shù)和平均引用次數(shù)在1990 年后逐年呈現(xiàn)指數(shù)遞增趨勢;出版文獻(xiàn)數(shù)的遞增趨勢則符合Price 提出的科學(xué)發(fā)展出現(xiàn)的“飽和現(xiàn)象”,2007 年后出現(xiàn)近10 年的停滯(局部出現(xiàn)衰退),說明圖書館聯(lián)盟研究需要新的驅(qū)動引發(fā)下一個發(fā)展周期[2]。
2013 年,習(xí)近平總書記提出構(gòu)建“一帶一路”倡議,圖書館作為文化交流與傳播的主陣地,加強(qiáng)與“一帶一路”倡議合作國家圖書館的合作,建立高效、實(shí)際的圖書館聯(lián)盟,是“一帶一路”文化交流合作機(jī)制的重要內(nèi)容。近兩三年來,以“一帶一路”為主題的圖書館聯(lián)盟應(yīng)運(yùn)而生,由我國圖書館牽頭構(gòu)建的聯(lián)盟就有金磚國家圖書館聯(lián)盟、中國—中東歐國家圖書館聯(lián)盟等。一方面,圖書館聯(lián)盟實(shí)踐界的這一趨勢將會影響和推動理論研究的發(fā)展;另一方面,對圖書館聯(lián)盟的理論探討也會助推實(shí)踐工作。因此,本文通過提取以圖書館聯(lián)盟為主題的文獻(xiàn)中的關(guān)鍵詞,構(gòu)建共詞網(wǎng)絡(luò)并進(jìn)行聚類分析與Burst 激增分析,旨在識別“一帶一路”倡議視閾下圖書館聯(lián)盟的研究熱點(diǎn)及未來趨勢,為圖書館聯(lián)盟的研究發(fā)展提供實(shí)證支持,也為“一帶一路”倡議下的圖書館合作提供借鑒。
本文數(shù)據(jù)采集于Web of Science 平臺,數(shù)據(jù)庫選擇為SCI-Expanded、SSCI、A&HCI、CPCI-S、CPCI-SSH,檢索時間區(qū)間為1940—2018 年,以“主題:(library consorti*) OR主 題:(library alliance)OR 主 題:(library cooperation)OR主 題:(library collaborat*) OR 主 題:(collaborative librar*)OR 主題:(cooperative librar*)”為高級檢索式,精煉條件為“文獻(xiàn)類型:(ARTICLE OR PROCEEDINGS PAPER),類別:(INFORMATION SCIENCE LIBRARY SCIENCE)”,學(xué)科類別為情報(bào)與圖書館科學(xué),共2 527 篇文獻(xiàn),記作All。筆者將政府公布的“一帶一路”官網(wǎng)收錄的68 個國家或地區(qū)作為篩選依據(jù),得到相關(guān)文獻(xiàn)共380 篇,記作B&R(數(shù)據(jù)采集截止時間為2018 年7 月31 日)。
2.2.1 研究路徑
第一步,對All 數(shù)據(jù)集與B&R 數(shù)據(jù)集中的文獻(xiàn)分別提取關(guān)鍵詞;第二步,利用Sati 軟件進(jìn)行關(guān)鍵詞詞頻統(tǒng)計(jì),得出高頻關(guān)鍵詞列表并構(gòu)建高頻關(guān)鍵詞共現(xiàn)矩陣;第三步,構(gòu)建共詞矩陣;第四步,在共詞矩陣的基礎(chǔ)上,進(jìn)行聚類分析和Burst 激增檢測;最后,根據(jù)聚類結(jié)果和Burst 激增結(jié)果,對“一帶一路”倡議下圖書館聯(lián)盟研究的熱點(diǎn)、主題和發(fā)展趨勢進(jìn)行比較、分析。
2.2.2 技術(shù)基礎(chǔ)
(1)共詞分析
共詞網(wǎng)絡(luò)是傳統(tǒng)文獻(xiàn)計(jì)量學(xué)中“詞”層面的內(nèi)容特征分析方法。共詞分析從本質(zhì)上屬于內(nèi)容分析方法的一種[3],通過對高頻主題詞之間的關(guān)系強(qiáng)度進(jìn)行計(jì)算,反映熱點(diǎn)詞匯之間的關(guān)聯(lián)情況。
本文采用相互包容指數(shù)法,即通過Equivalence 系數(shù)來度量術(shù)語的共現(xiàn)情況,具體公式如下:
其中,Cij為Ci和Cj同時出現(xiàn)的頻次,Ci和Cj分別是主題詞i 和j 出現(xiàn)的頻次,Eij代表Ci和Cj之間的相似系數(shù)[4]。
采用Donohue 高低頻詞分界算法對已有的全量共詞網(wǎng)絡(luò)進(jìn)行范圍控制[5],具體計(jì)算公式如下:這里I1表示出現(xiàn)1 次的詞頻數(shù)量,n 為臨界指數(shù),即待選擇的最優(yōu)參數(shù)。
(2)聚類分析
共詞網(wǎng)絡(luò)研究一般對高被引的特征項(xiàng)進(jìn)行聚類,從而生成獨(dú)立的概念團(tuán)。團(tuán)簇包含的聚類術(shù)語可以作為類別特征,結(jié)合類中的高頻術(shù)語可以在一定程度上發(fā)現(xiàn)學(xué)科領(lǐng)域熱點(diǎn)和前沿方向。本文采用“GN”社區(qū)檢測算法[6],并引入模塊度Q[7],通過不同的聚類參數(shù)對聚類模型進(jìn)行評價(jià),選取最優(yōu)參數(shù)聚類結(jié)果。模塊度Q 值的計(jì)算公式如下:
其中,m 表示邊數(shù),ki表示節(jié)點(diǎn)i 的度數(shù),A 則為鄰接矩陣,δ 為狄拉克脈沖函數(shù)。
(3)Burst 激增檢測
Burst 激增檢測算法最早由John Kleinberg 在2003 年國際頂級年會知識挖掘與發(fā)現(xiàn)會議(KDD’03)上提出的[8],主要用于解決和抽取離散或者連續(xù)數(shù)據(jù)流出現(xiàn)的序列信號突變問題,常用于主題追蹤與檢測應(yīng)用[9]。本文采用的批量檢測公式具體如下:
其中,σ 表示狀態(tài)qi(這里僅存在q0——非激增狀態(tài)和q1——激增狀態(tài))的狀態(tài)成本,而burstWeight 則為時間戳t1 到t2 之間的突發(fā)度,表現(xiàn)為狀態(tài)成本遷移差值。
本文選取以研究圖書館聯(lián)盟為主題的文獻(xiàn)中的關(guān)鍵詞作為熱點(diǎn)發(fā)現(xiàn)的分析對象,通過自然語言處理和數(shù)據(jù)過濾,對“圖書館聯(lián)盟”的All 數(shù)據(jù)集按照關(guān)鍵詞詞頻大小和分布進(jìn)行統(tǒng)計(jì),總計(jì)2 466 個關(guān)鍵術(shù)語,并運(yùn)用式1 和式2 構(gòu)建共詞矩陣,結(jié)果見表1。
表1…………關(guān)鍵詞共詞矩陣(部分)
根據(jù)共詞矩陣,本文采用式3 選取最佳聚類參數(shù),圖1結(jié)果顯示,對于總體樣本數(shù)據(jù),當(dāng)聚類數(shù)目為19 時,Q 達(dá)到全局峰值0.291;對于“一帶一路”國家的相關(guān)共詞網(wǎng)絡(luò)而言,最佳聚類數(shù)為7(Qmax=0.361)。本文在相應(yīng)最佳聚類數(shù)目的條件下,對兩個網(wǎng)絡(luò)進(jìn)行GN 聚類。
圖1…………Girvan-Newman 聚類模塊度Q 評價(jià)
文章按照類簇由大至小,選出All 數(shù)據(jù)集和B&R 數(shù)據(jù)集中排名前5 名的聚類,結(jié)果如表2 所示。聚類結(jié)果顯示:按照聚類大小排序和聚類術(shù)語之間的知識關(guān)聯(lián),目前關(guān)于圖書館聯(lián)盟的研究熱點(diǎn)分布主要涵蓋信息管理與技術(shù)應(yīng)用、信息服務(wù)與出版?zhèn)鞑?。不同國家研究的主要?nèi)容基本相同,但具體方向呈現(xiàn)差異。
3.2.1 信息管理與新技術(shù)應(yīng)用(1)B&R:圖書館聯(lián)盟的館際互借和文獻(xiàn)傳遞的運(yùn)營模式受到較多關(guān)注
從B&R 數(shù)據(jù)集中的聯(lián)盟(Consotia)、資源共享(Resource Sharing)、館際互借(Interlending Interlibrary Loan)、文獻(xiàn)傳遞(Document Delivery)、中國高等教育文獻(xiàn)保障系統(tǒng)(CALIS)、評價(jià)(Evaluation)、市場(Marketing)等熱點(diǎn)詞匯可以看出,中國高等教育文獻(xiàn)保障系統(tǒng)(China Academic Library & Information System,簡稱CALIS)是“一帶一路”合作國家圖書館聯(lián)盟的典型實(shí)踐,并在理論研究界獲得了較多關(guān)注,71 個成員館的館際互借和文獻(xiàn)傳遞運(yùn)營模式已成為中國圖書館協(xié)作與互聯(lián)的代表作[10]。
(2)All:圖書館聯(lián)盟的信息管理與新技術(shù)應(yīng)用結(jié)合緊密
從All 數(shù)據(jù)集的熱點(diǎn)詞匯萬維網(wǎng)(Worldwide Web)、數(shù)字圖書館(Digital Libraries)、數(shù)字貯存(Digital Storage)可以看出,以英國、加拿大學(xué)者等為代表的研究團(tuán)隊(duì)在分類法(Cataloguing)、信息檢索(Information Retrieval)、信息管理(Information Management)等領(lǐng)域與新技術(shù)應(yīng)用結(jié)合,不斷取得極具影響力的成果。例如,加拿大學(xué)者Detlor B 討論了智能代理在網(wǎng)絡(luò)圖書館環(huán)境下信息檢索與信息搜尋中的促進(jìn)作用,提出了一種通用代理模型,以支持圖書館聯(lián)盟中館藏的跨庫檢索功能[11];思克萊德大學(xué)基于“使所有公民隨時獲得電子信息、學(xué)習(xí)和研究材料”這一愿景成立了大學(xué)數(shù)字圖書館研究中心,運(yùn)用網(wǎng)絡(luò)技術(shù)建立協(xié)作效率高、操作性便捷、便于訪問的圖書館聯(lián)盟服務(wù)體系[12]。
表2…………GN 聚類知識熱點(diǎn)(部分)
對比All 數(shù)據(jù)集和B&R 數(shù)據(jù)集發(fā)現(xiàn),“一帶一路”成員國尤以中國學(xué)者為代表,其研究方向側(cè)重于圖書館聯(lián)盟館際互借和文獻(xiàn)傳遞的運(yùn)營模式,而非成員國家如英國、加拿大學(xué)者的研究方向則側(cè)重于圖書館聯(lián)盟中的新技術(shù)應(yīng)用,這也符合“一帶一路”成員國大多是發(fā)展中國家,圖書館聯(lián)盟起步較晚、發(fā)展相對滯后的背景。另外,不同于圖書館聯(lián)盟發(fā)展較成熟的英國、加拿大等國,“一帶一路”成員國更為關(guān)注的是如何做好館際互借、文獻(xiàn)傳遞等基礎(chǔ)服務(wù),這也是構(gòu)建新的聯(lián)盟首先要解決的問題。
3.2.2 信息服務(wù)與出版?zhèn)鞑?/p>
(1)B&R:“網(wǎng)絡(luò)分析”大量應(yīng)用于圖書館聯(lián)盟的科學(xué)評價(jià)和知識管理與服務(wù)研究
在B&R 數(shù)據(jù)集中,從資源(Resources)、信息服務(wù)(Information Services)、社會網(wǎng)絡(luò)分析(Social Network Analysis)、信息素養(yǎng)(Information Literature)、萬維網(wǎng)(Worldwide Web)、文獻(xiàn)計(jì)量(Bibliometrics)、作者共著分析(Co-authorship)、圖書情報(bào)學(xué)(Library and Information Science)等熱點(diǎn)詞匯來看,中國、印度、韓國等學(xué)者關(guān)于信息服務(wù)的研究將“網(wǎng)絡(luò)分析”的量化研究方法大量應(yīng)用于圖書館聯(lián)盟的科學(xué)評價(jià)和知識管理與服務(wù)研究中。例如,Lee 基于社會網(wǎng)絡(luò)分析構(gòu)建出韓國公共圖書館的關(guān)鍵詞網(wǎng)絡(luò),以評價(jià)韓國公共圖書館間的科研合作[13];Kirlidog M 通過wos 的文獻(xiàn)資源統(tǒng)計(jì)、引文量和出版物數(shù)量等來研究土耳其的科學(xué)產(chǎn)出水平,特別是在電子資源獲取和圖書館聯(lián)盟方面所取得的進(jìn)展情況[14]。
(2)All:將開放存取與圖書館聯(lián)盟的服務(wù)創(chuàng)新緊密聯(lián)系
開放存取已經(jīng)成為世界各國關(guān)注的重點(diǎn)前沿問題。在All 數(shù)據(jù)集中,從開放存取(Open Access)、創(chuàng)新(Innovation)、通訊(Communication)、出版(Publishing)和圖書館服務(wù)(Library Services)等熱點(diǎn)詞匯來看,加拿大、英國、德國等研究團(tuán)隊(duì)將圖書館聯(lián)盟的服務(wù)創(chuàng)新與開放存取緊密聯(lián)系。在國際圖書館聯(lián)盟聯(lián)合體(International Coalition of Library Consortia, ICOLC)網(wǎng)站公布的188 個圖書館聯(lián)盟中,參與數(shù)字出版的有88 個,占47%[15]。例如德國Karlsruhe大學(xué)圖書館開發(fā)了可檢索26 個德國大學(xué)機(jī)構(gòu)典藏的“科學(xué)文獻(xiàn)的開放存取”[16]。
對比All 數(shù)據(jù)集和B&R 數(shù)據(jù)集發(fā)現(xiàn),“一帶一路”合作國家中國、印度、韓國等國家的學(xué)者們關(guān)于圖書館聯(lián)盟的信息服務(wù)與傳播研究側(cè)重于科學(xué)評價(jià)和知識管理與服務(wù)研究,說明重視科研合作、提高用戶信息素養(yǎng),既是“一帶一路”圖書館聯(lián)盟的重要任務(wù),也可以為聯(lián)盟開展其他服務(wù)奠定良好基礎(chǔ)。而對于大多數(shù)非“一帶一路”國家的圖書館聯(lián)盟來說,自身發(fā)展的深度、廣度及用戶素養(yǎng)都要優(yōu)于發(fā)展中國家,因此他們的關(guān)注點(diǎn)也反映出信息傳播與出版模式的轉(zhuǎn)變,即由紙質(zhì)版文獻(xiàn)收費(fèi)模式,不斷向電子化期刊公開免費(fèi)的發(fā)展過程。
主題詞的詞頻增長率的變化本質(zhì)上體現(xiàn)了研究前沿中熱點(diǎn)信息的動態(tài)走向。因此知識領(lǐng)域的科學(xué)發(fā)展趨勢和變化可以根據(jù)主題術(shù)語和突現(xiàn)詞的共現(xiàn)關(guān)系來實(shí)現(xiàn)[17]。本文運(yùn)用式4 對圖書館聯(lián)盟文獻(xiàn)數(shù)據(jù)集All 進(jìn)行數(shù)據(jù)建模(兩類分別為“是”或者“否”突發(fā)詞),其中s 為(0,1]區(qū)間的常參,率參數(shù)比系數(shù)α 取默認(rèn)經(jīng)驗(yàn)值2,突發(fā)權(quán)重取前5%(突發(fā)度大于3),python 代碼所獲取的激增術(shù)語結(jié)果如下:
表3…………不同S 權(quán)值下的Top5%…Burst 激增檢測結(jié)果
由表3 分析可得:突發(fā)詞的突發(fā)起始時間多是近5、6 年之前(即2011 年后),隨著參數(shù)s 的調(diào)整,模型結(jié)果保持一定的穩(wěn)定性,此時突發(fā)詞如館際互借(Interlibrary Loan)、知識服務(wù)(Knowledge Service)、科學(xué)合作(Scientific Collaboration)、模式(Pattern)等無論在突發(fā)時間或者突發(fā)度上都排名靠前,表明它們是近5 年以來圖書館聯(lián)盟發(fā)展的重要研究領(lǐng)域和主題。其中館際互借、知識服務(wù)、出版模式、科學(xué)合作等詞一直以來都是圖書館聯(lián)盟研究的熱點(diǎn)詞匯,而文獻(xiàn)采購模式與出版模式的改變、“超級聯(lián)盟”的出現(xiàn)、大數(shù)據(jù)時代的來臨與近年來各國圖書館越發(fā)意識到提供深層次知識服務(wù)的重要性等都可能是引發(fā)上述詞匯突變的原因,因此,如關(guān)于讀者決策采購模式(Patron Driven Acquisition,PDA)[18]、開放存取[19]、超級聯(lián)盟[20]、運(yùn)用MapReduce 挖掘有效知識等研究[21],成為未來圖書館聯(lián)盟的發(fā)展趨勢之一。
表3 所示的突變詞只反映出圖書館聯(lián)盟研究未來的主題領(lǐng)域,對于圖書館聯(lián)盟研究趨勢和方向的預(yù)測,仍需更具意義和專業(yè)指向的突變詞。因此,在表3 的基礎(chǔ)上,筆者進(jìn)一步選擇s 為0.8 時的突變詞作為分析對象,并通過專家識別出解讀性較強(qiáng)的突變詞匯,如表4 陰影所示,主要包括:
(1)科研合作研究
從文獻(xiàn)計(jì)量分析(Bibliometric Analysis)、學(xué)科交叉度(Interdisciplinarity)、共詞分析(Co-word Analysis)和共引分析(Co-citation Analysis)等突變詞可以看出,圖書館聯(lián)盟科研合作研究是未來的研究趨勢之一。主要方向有:利用內(nèi)容分析法和作者共著分析法探索圖書館實(shí)踐者與研究者的異化和合作問題[22],運(yùn)用直接引用、引文耦合和合著分析三種文獻(xiàn)分析方法對圖書情報(bào)領(lǐng)域進(jìn)行跨學(xué)科度分析[23],采用Brillouin's 系數(shù)分析對信息科學(xué)領(lǐng)域進(jìn)行交叉學(xué)科度分析[24],通過共詞分析方法進(jìn)行知識結(jié)構(gòu)分析[25]、圖書情報(bào)機(jī)構(gòu)研究核心識別[26]、作者共引分析[27]等。
(2)學(xué)科服務(wù)研究
學(xué)術(shù)交流(Scholarly Communication)、科研數(shù)據(jù)管理(Research Data Management)等突變詞為代表的學(xué)科服務(wù)研究是未來圖書館聯(lián)盟研究的趨勢之一。例如研究型圖書館未來的發(fā)展策略研究[28],大學(xué)數(shù)字化學(xué)術(shù)交流中的電子出版合作研究[29],建立為教學(xué)和科研提供線上數(shù)據(jù)支持的新型圖書館聯(lián)盟研究[30],對圖書館與科研數(shù)據(jù)管理實(shí)踐探索的梳理和趨勢預(yù)測[31]等。
(3)信息服務(wù)研究
突變詞為代表的信息服務(wù)研究也是未來圖書館聯(lián)盟研究的重要趨勢。例如公共圖書館聯(lián)合參考咨詢中關(guān)于問題分類回答的有效性研究[32],用戶對于聯(lián)合虛擬參考咨詢服務(wù)的推薦服務(wù)滿意度研究[33],通過大學(xué)公布的培訓(xùn)計(jì)劃進(jìn)行信息素養(yǎng)水平分析研究[34],運(yùn)用iSkills 標(biāo)準(zhǔn)化技術(shù)評估學(xué)生的信息能力[35],探索圖書館信息能力培養(yǎng)的新模式[36]等。
表4…………Burst 激增監(jiān)測(s=0.8)
本文基于共詞網(wǎng)絡(luò)分析,探討了近70 年圖書館聯(lián)盟研究的熱點(diǎn)與趨勢,并選取“一帶一路”國家文獻(xiàn)作比較分析,識別“一帶一路”倡議下圖書館聯(lián)盟研究的側(cè)重點(diǎn)??傮w來說,圖書館聯(lián)盟的研究熱點(diǎn)主要涉及信息管理與新技術(shù)應(yīng)用、信息服務(wù)與出版?zhèn)鞑?。“一帶一路”合作國家圖書館聯(lián)盟的研究相對滯后于全球范圍內(nèi)圖書館聯(lián)盟研究,但中國、印度、韓國等國家發(fā)展迅速,尤其是中國CALIS、CASHL、NSTL 等圖書館聯(lián)盟的成立,推動了圖書館聯(lián)盟研究的快速發(fā)展,在“一帶一路”合作國家中處于領(lǐng)先地位。而“一帶一路”國家對館際互借、文獻(xiàn)傳遞、信息素養(yǎng)等研究方向的側(cè)重,也體現(xiàn)出在目前形勢下建立跨區(qū)域跨文化的圖書館協(xié)作交流機(jī)制,亟待解決信息資源共建共享等核心問題。圖書館聯(lián)盟未來的研究趨勢向科研合作、學(xué)科服務(wù)和信息服務(wù)的方向發(fā)展,體現(xiàn)了圖書館聯(lián)盟的服務(wù)從文獻(xiàn)服務(wù)到信息服務(wù)再到知識服務(wù)的過渡與升級。對于“一帶一路”倡議下的圖書館聯(lián)盟來說,其發(fā)展既需要打破政策、體制、文化、語言的壁壘,也離不開傳統(tǒng)圖書館服務(wù)協(xié)作的沉淀與積累。
本文對實(shí)證模型的參數(shù)等均采用了優(yōu)化選擇排序,并圍繞“一帶一路”倡議下的“圖書館聯(lián)盟”展開多角度逐層量化分析,對探索和理解“圖書館聯(lián)盟”這一重要圖書館學(xué)研究課題提供了新的視角和參考。但是這種方式是初探性質(zhì)的,不免存在一定局限性。未來我們將結(jié)合引文分析、期刊分析等分析維度,力爭對“一帶一路”倡議下圖書館聯(lián)盟體系的構(gòu)建進(jìn)行進(jìn)一步闡述。