黃 東
(菏澤市圖書館,山東 菏澤274000)
隨著大數據時代的來臨,圖書情報領域的研究主題發(fā)生了一定變化,為了從宏觀上及時了解國際圖書情報領域的發(fā)展狀況、研究主題發(fā)展方向,筆者對該領域國內外權威期刊文獻進行梳理,采用文獻計量方法分析已有研究成果,總結熱門研究主題,以便為我國圖書情報領域后續(xù)研究提供一些參考。
關鍵詞是文章核心內容的提煉與濃縮[1],可在較大程度上反映文章的研究重點,通過統(tǒng)計某一領域的高頻關鍵詞,并以此構建共詞網絡圖譜及聚類分析,可反映此領域的研究重點及熱點。因此,筆者在分析圖書情報領域研究主題時,選取Web of Science核心合集為數據源,檢索近五年有關此領域的文章,基于領域科研文獻題錄數據構建高頻關鍵詞共詞網絡,并在共詞網絡基礎上進行高頻關鍵詞可視化分析與文獻聚類分析。
為全面系統(tǒng)獲得該研究領域的發(fā)展狀況,筆者以Web of Science核心合集為數據源進行了相關文獻檢索。在“高級檢索”下將檢索式設置為“WC=Information Science&Library Science”;語種:(English);文獻類型:(Article);檢索時間跨度設置為2016—2020年;索 引=SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、ESCI、CCR-EXPANDE;檢索時間為2021年3月5日,共計檢索得到28538篇文獻。
在檢索得到文獻題錄數據的基礎上,使用共詞分析軟件Bibexcel抽取關鍵詞,參考Donohue[2]提出的高低頻詞分界公式:T=(-1+1+8*I1)/2劃分高頻詞與低頻詞,其中T表示詞頻分界值,I1表示頻次為1的關鍵詞數量。經過關鍵詞抽取后共得到作者關鍵詞53790個,累計出現頻次173760,其中頻次為1的關鍵詞共41071個。使用以上公式計算可得T=286,此時符合條件的關鍵詞僅11個,詞頻數量較少,無法據此進行可視化知識圖譜分析。因此,根據關鍵詞的頻次排序,取30次以上的466個關鍵詞為高頻關鍵詞,它們的累計出現頻次為34772,占所有關鍵詞出現頻次的20%。在詞頻統(tǒng)計的基礎上進行數據清洗:同義詞合并如“Academic libraries”“Academic library”“university library”僅保留“Academic libraries”“Bibliometrics”“Bibliometric analysis”僅保留“Bibliometrics”等,去除無分析意義的詞匯如“classification”“review”“Usability”“Learning”等,去除各個國家詞匯如“China”“Ghana”“Europe”“North America”等,最終共得到346個高頻關鍵詞,以此進行后續(xù)的詞頻統(tǒng)計、可視化分析及聚類分析。
筆者在此列舉出頻次大于100的57個關鍵詞,具體見表1。
通過表1可知,“Academic libraries(高校圖書館)”“social media(社交媒體)”“Qualitative research(定性研究)”“Bibliometrics(文獻計量學)”“Citation analysis(引文分析)”依次位于高頻關鍵詞的前5位,頻次均超過700,且數量遠高于其他關鍵詞。其中,“高校圖書館”頻次最高,表明其是圖書情報領域研究的重點與熱點,其作為圖書館系統(tǒng)的重要組成部分,發(fā)揮著與公共圖書館同樣重要的作用,承擔著為在校師生提供資源服務、空間服務、科技查新、情報咨詢、論文寫作培訓等多項職能;在圖書情報領域,“social media(社交媒體)”常被作為重要的數據來源,研究者通過技術手段收集某一類別的社交媒體數據,挖掘數據之間的關聯,以支撐研究結論或預測事件的發(fā)展趨勢等?!癚ualitative research(定性研究)”“Bibliometrics(文獻計量學)”“Citation analysis(引文分析)”均是圖書情報領域常用的研究方法,雖然數學方法、統(tǒng)計學方法、關聯性分析等定量分析方法在相關研究中所占比例不斷提高,但觀察法、訪談法、田野調查法、理性思辨法等定性研究方法依然是圖書情報領域常用的研究方法。“Bibliometrics(文獻計量學)”起源于情報學領域,于1969年由英國情報學學家阿倫·普理查德[3]首次提出,標志著文獻計量學正式誕生,通過應用數學與統(tǒng)計學知識,以定量方式分析一切知識載體,其中,“Citation analysis(引文分析)”是計量分析法中應用最廣泛的一種,1956年普賴斯發(fā)表的《科學論文的網絡》[4]為引文分析奠定了理論基礎,其通過分析科學期刊、論文、著者、機構等之間的引用與被引用關系,反映某一學科的知識結構及科學交流模式,經過多年發(fā)展,計量分析法已在生物學、金融學等多個學科得到廣泛應用,較大程度上提高了圖書情報學科的社會價值。
表1 圖書情報領域高頻關鍵詞
此外,“Knowledge management(知識管理)”“information literacy(信息素養(yǎng))”的頻次也較高,知識管理作為知識經濟時代的產物,已成為一種新的管理理念,“知識”作為“信息”的下位類概念,是信息深加工的成果,知識管理與信息管理具有天然聯系,因此,自知識管理出現以來就一直受到圖書情報界的關注;“information literacy(信息素養(yǎng))”包括文化素養(yǎng)、信息意識、信息技能3個層面,指能夠自覺判斷自身何時需要何種信息,并具備一定的信息技能獲取所需信息的能力,圖書情報學作為以“信息”為主要分析對象的學科,一直將信息素養(yǎng)作為研究重點。
對高頻關鍵詞的詞頻統(tǒng)計僅能展示圖書情報領域研究幾大主題,無法體現各高頻關鍵詞之間的內在聯系,因此,筆者基于抽取的346個高頻關鍵詞,使用VOSviewer構建高頻關鍵詞共詞網絡,得到如下共詞網絡圖譜,共詞網絡圖譜見圖1。
圖1 圖書情報領域高頻關鍵詞共詞網絡
共詞網絡圖譜中,節(jié)點代表關鍵詞,節(jié)點大小表示關鍵詞的總出現次數,節(jié)點越大代表出現次數越多,此關鍵詞的影響力就越強;節(jié)點之間的連線代表關鍵詞之間的共現關系,連線越粗表示兩關鍵詞的共現次數越多,聯系越緊密。圖1中“Academic libraries(高校圖書館)”“information literacy(信息素養(yǎng))”“social media(社交媒體)”“knowledge management(知識管理)”“bibliometrics(文獻計量學)”這些關鍵詞的節(jié)點較大,說明與之相關的研究較多,是圖書情報學領域關注的重點。
“Academic libraries(高校圖書館)”與“information literacy(信息素養(yǎng))”“l(fā)ibrary instruction(圖書館指導)”“Reference services(參考服務)”“scholarly communication(學術交流)”“open access(開放獲?。薄皊ocial media(社交媒體)”“knowledge management(知識管理)”“higher education(高等教育)”等詞之間的連線較粗,說明“Academic libraries(高校圖書館)”與以上詞匯共同出現的次數較多。高校圖書館與以上詞匯的高關聯性,主要由高校圖書館承擔的職能決定。首先,高校圖書館作為高校重要的文化服務高地,承擔著借閱指導、參考咨詢、科研培訓等職能,師生多樣化、個性化的信息需求,促使圖書館不斷改變服務思路,逐步由傳統(tǒng)的被動型信息服務向主動型知識服務轉變,作為對信息進行深加工的知識管理,理所當然成為了圖書館實現精細化服務的必備手段。其次,高校圖書館因其師資優(yōu)勢、科研優(yōu)勢承擔著為高校搭建學術交流平臺的職能。美國大學與研究圖書館協(xié)會[5]提出“學術交流是一個提供研究和創(chuàng)作學術作品、衡量學術價值、傳播到學術界進行學術研究的共享系統(tǒng)”。開放獲取作為學術交流的新發(fā)展趨勢,使高校圖書館不斷探索如何轉變其現有服務模式,以更好地促進信息交流及信息共享。最后,社交媒體作為圖書館與讀者互動的主要媒介,其數據可在一定程度上作為評價圖書館服務水平的參考。
“social media(社交媒體)”與“knowledge management(知識管理)”“bibliometrics(文獻計量學)”“scholarly communication(學術交流)”“sentiment analysis(情感分析)”“natural language processing(自然語言處理)”“machine learning(機器學習)”“text mining(文本挖掘)”等詞之間的連線較粗。社交媒體作為當今社會人與人之間交流的主要工具,同時也是各類非正式學術交流的主要平臺,可為圖書情報領域的知識管理、文獻計量分析、情感分析等研究提供數據來源,研究者借助文本挖掘、自然語言處理、機器學習、深度學習等數據挖掘工具挖掘所需數據,再進一步借助計量分析工具、情感分析工具進行數據加工,以實現復雜數據的計量分析及情感分析。
此外,“bibliometrics(文獻計量學)”與“citation analysis(引文分析)”“open access(開放獲?。?,“information literacy(信息素養(yǎng))”與“l(fā)ibrary instruction(圖書館指導)”,“open access(開放獲?。迸c“scholarly communication(學術交流)”之間的連線也較粗,說明上述各個詞匯之間也常共同出現。
在統(tǒng)計圖書情報領域高頻關鍵詞,并進行高頻關鍵詞可視化分析的基礎上,為了更好地理解各關鍵詞之間的共現關系,在高頻關鍵詞網絡圖譜的基礎上聚類得到以下7個類群,通過分別檢索每個聚類下的文章以總結每個類群的研究主題。
2.3.1 聚類一:以圖書館服務、用戶信息需求、信息素養(yǎng)、圖書情報學教育研究為主
聚類一共89個詞匯,主題集中在圖書館服務、用戶信息需求、信息素養(yǎng)、圖書情報教育4個方面。有關圖書館服務的研究主要有兩個研究角度:首先,從圖書館角度出發(fā),通過案例研究分析某一圖書館的服務現狀、服務中存在的問題、特色服務、創(chuàng)新性的技術應用。如研究針對視障用戶、孤獨癥用戶[6]、國際學生、具有金融背景的用戶等特殊群體提供的專門服務;采取內容分析法、問卷調查法、訪談法、數學評估模型等方法評估圖書館現有服務水平、內部管理等;通過問卷調查分析大學圖書館的知識管理水平[7],通過訪談法分析公共圖書館系統(tǒng)利用率低的原因[8]等。其次,從圖書館館員角度出發(fā),針對館員的再教育、服務水平評估、績效考核分析以及館員在學術交流、資源利用、輔助教學等方面的價值研究,如高校圖書館館員借助圖書館平臺協(xié)助高校開展遠程教育[9]。
針對用戶信息需求的研究主要有4類:影響用戶信息需求的因素、信息獲取行為、信息需求模型構建、用戶信息需求滿意度研究。
如社會環(huán)境、教育背景、收入水平等均會影響用戶的信息需求;微博、微信等新媒體拓寬了用戶信息獲取渠道,使用戶不再僅依靠傳統(tǒng)的人際交往獲取信息;在構建用戶信息需求模型時更注重反饋環(huán)節(jié)及模型的自我調節(jié)功能;關于信息需求滿意度的研究以案例分析為主,調研用戶對政務網站、高校圖書館、公共圖書館的信息提供行為滿意度。
信息素養(yǎng)是公眾對信息社會的適應能力,包括信息意識、信息能力、信息應用[10]。圖書情報界對信息素養(yǎng)的研究集中于兩個方面:一是關于信息素養(yǎng)教育與信息素養(yǎng)能力評價的案例研究,如將信息素養(yǎng)類課程納入護理學教育中,以培養(yǎng)護理人員利用信息的能力[11],分析評價一所大學信息科學系學生的信息素養(yǎng)能力[12]。二是探討如何在學校教育、日常工作中提高信息素養(yǎng),如設置信息素養(yǎng)實踐課程、在工作中進行專門培訓等。圖書情報學教育研究主要通過案例分析的形式梳理高校相關學科的課程設置、課時分配、實習項目,其中高校主要來源于iSchool聯盟。
2.3.2 聚類二:以知識管理研究為主
聚類二共71個詞匯,聚類六共37個詞匯,這兩個聚類的研究主題較為分散,既有知識管理相關研究,也有電子商務、社會網絡分析、用戶信息需求、健康信息學、信息管理在醫(yī)療領域的應用等主題。與知識管理相關的研究主要集中于以下兩個方面:一是圖書館與信息服務機構如何借助知識管理理論進行知識服務,如通過知識挖掘、知識組織發(fā)現隱形知識,以提高信息價值、服務用戶;二是知識管理理論在開展競爭情報活動中的應用,如以知識管理為基礎構建競爭情報模型和平臺,加強大數據環(huán)境下的競爭情報挖掘、分析、整合。
2.3.3 聚類三、聚類五:以“圖書情報理論+新興技術”共同服務于實踐,健康信息學研究為主
聚類三共57個詞匯,聚類五共39個詞匯,以上兩個聚類的研究主題具有一定相似性,均側重于區(qū)塊鏈、云計算、自然語言處理、人工智能、語義分析、文本挖掘、機器學習等新興技術與圖書情報知識的結合,以此服務于生物、醫(yī)療、材料科學等領域,同時也均關注健康信息學知識。如借助自然語言處理算法挖掘醫(yī)療系統(tǒng)中醫(yī)護人員較為感興趣的內容,以開發(fā)提供臨床決策支持、護理教育、臨床質量控制等多種功能的推薦系統(tǒng)[13]、借助機器學習算法基于過去數據進行快速預測,以確定由傳統(tǒng)方法難以測量或計算的材料屬性、利用語義網技術開發(fā)基于本體的國家衛(wèi)生數據字典,以消除醫(yī)學信息學標準之間的語義差異[14],在本體Web語言中實現納米顆粒本體的設計與開發(fā),以實現數據的共享與集成等[15]。健康信息學是指借助現代信息技術以滿足用戶健康信息需求的新興交叉學科。隨著公眾健康意識提高及現代信息技術的發(fā)展,健康信息學受到廣泛關注,如健康信息在公共衛(wèi)生防護應急中的價值、用戶健康信息需求、健康信息搜尋行為、健康信息評價等。同時,關于健康信息學教育的研究也不斷增加,此類研究可輔助公共政策制定、預測疾病暴發(fā)、分析公眾在互聯網中檢索或瀏覽健康信息的行為[16]等。此外,聚類三也較關注電子政務、大數據環(huán)境下的信息安全、信息保護政策、智慧城市建設等主題。
2.3.4 聚類四:以文獻計量學、社會網絡分析、學術交流、開放獲取、機構知識庫研究為主
聚類四共53個詞匯,主題集中在文獻計量學、社會網絡分析、學術交流、開放獲取、機構知識庫方面。1981年White、Griffith[17]指出“文獻計量學幾乎構成了整個信息科學的一半,而且是生機勃勃的一半”,近40年的時間過去了,文獻計量學依然是圖書情報領域研究的重點與熱點。文獻計量學主要有兩大研究主題:合作關系研究、引用關系研究,其中合作關系研究包括作者合作、機構合作;引用關系研究分為作者引用、期刊引用。社會網絡分析是一門起源于數學領域的圖論及矩陣理論的學科[18],因其對知識結構關系的高度關注,對文獻計量學的發(fā)展產生巨大影響。基于社會網絡分析對文獻背后知識結構的揭示,其對以統(tǒng)計描述為主的文獻計量學兩大研究主題產生了巨大影響,如引入社會網絡分析知識后,可以更好地探討期刊之間的引用模式及期刊在知識傳播中的情況、更好地評價科研機構的學術能力及為科研機構制定科研政策提供指導,也使以可視化呈現為主的文獻計量學逐漸向知識計量學方向發(fā)展。
關于學術交流的研究主題分為以下3個方面:一是學術交流過程中涉及的開放存取、出版服務、機構知識庫建設問題。因開放存取、開放倉儲、資源共享已成為學術交流的新發(fā)展趨勢,如何協(xié)調現有出版模式使其促進知識流通、構建更利于開放存取的機構知識庫成為學者關注的重點。如Tsay[19]從搜索引擎、機構存儲庫、開放源代碼3個角度出發(fā)促進開放存取系統(tǒng)建設的全面性和多樣性,Ejikeme[20]梳理了尼日利亞國內現存的機構知識庫發(fā)展現狀,認為其還存在缺少政府支持、科學生產力低、科研成果種類少等問題。二是圖書館服務轉型問題。Mounier[21]提出歐洲國家圖書館之間應圍繞OPERAS(歐洲各地36個機構組成的圖書館聯盟)開展更多合作、分享資源、共建學術交流基礎設施,在大學圖書館內部建設專門的機構知識庫開放存取職位,助力高校圖書館開放存取服務。三是非正式學術交流研究,即借助社交媒體進行的學術交流。如對36位阿拉伯學者學術交流行為訪談,大多數學者常使用ResearchGate、Facebook交流他們的學術成果[22]。
2.3.5 聚類七:以基于社交媒體的網絡虛假信息傳播及政治交流研究為主
聚類七僅3個詞匯:虛假新聞(Fake news)、政治交流(Political communication)、推特(Twitter),以基于社交媒體的網絡虛假信息傳播及政治交流兩個主題研究為主。如Al-Rawi[23]通過數據挖掘抽取Twitter中的虛假信息與訪談活躍用戶相結合的方式,討論社交媒體與虛假信息之間的關系,發(fā)現虛假信息與CNN等新聞組織、政黨人士常共同出現;Montesi[24]從網絡用戶的信息行為角度出發(fā)研究Covid-19健康危機期間在西班牙傳播的虛假信息,發(fā)現其對社會道德及政治生活產生了較大的無形傷害。
通過對Web of Science核心合集中圖書情報領域近五年的科研文獻進行計量分析發(fā)現,國際圖書情報界既注重圖書館服務、信息素養(yǎng)、知識管理、文獻計量學、學術交流、圖書情報教育等傳統(tǒng)研究,也較關注機器學習、自然語言處理、人工智能等新興技術的應用及跨學科研究,同時國際圖書情報學界也較為重視健康信息學、醫(yī)學信息學相關研究,將其作為輔助臨床決策、保障患者安全的重要信息來源。
基于以上研究及國內學者關于我國圖書情報領域的研究發(fā)現[25-31],國內圖書情報與國際圖書情報研究主題既堅守了學科基礎理論、文獻計量、信息服務、知識管理、用戶服務、學科教育等相同點,同時,其研究主題也具有以下不同點:首先,國際圖書情報領域以情報學研究為主,而國內領域以圖書館學內容研究為主;其次,國際圖書情報界更傾向于圖書情報知識管理及服務特性本質研究,而國內更傾向于具體工作、業(yè)務研究,如提升信息素養(yǎng)、開展閱讀推廣、評價信息服務水平、推進空間改造等,而突出學科基礎理論本質的研究較少;最后,與國際圖書情報研究相比,國內圖書情報領域對機器學習、自然語言處理等新興技術更多集中于理念影響及計量分析研究,缺少對新技術的深入分析及應用研究。
我國圖書情報學界應借鑒國際領域相關研究,在堅守傳統(tǒng)研究重點的基礎上適當拓寬研究外延,在提升業(yè)務工作的同時豐富學科基礎理論知識,在關注新技術發(fā)展的同時更多注重其在圖書情報領域的應用,以提高學科理論知識的應用價值及學科的社會價值。