李素梅
摘 要:文章以2012―2016年CNKI數(shù)據(jù)庫中收錄的主題為大數(shù)據(jù)的相關(guān)文獻為研究對象,借助信息可視化軟件CiteSpace和VOSviewer軟件繪制出科學知識圖譜,通過對作者及其機構(gòu)合著網(wǎng)絡(luò)視圖的解讀,分析了該領(lǐng)域的代表作者、研究力量分布的相互關(guān)系,又通過對知識圖譜的研讀,探析了該領(lǐng)域的研究熱點及研究主題。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2017)05-0124-03
關(guān)鍵詞:大數(shù)據(jù);知識圖譜;可視化分析;CiteSpace;VOSviewer
“大數(shù)據(jù)”不僅是海量的、類型多樣的結(jié)構(gòu)化數(shù)據(jù)(如圖片、聲音、視頻、地理位置信息等)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)的集合,它更是一種技術(shù)和理念,宗旨就是從海量、多樣性的數(shù)據(jù)資源中,進行深層次的挖掘,快速獲得有價值的信息,以創(chuàng)造巨大的經(jīng)濟、社會及科研價值[1]。
1 數(shù)據(jù)來源和研究方法
近年來,大數(shù)據(jù)的研究與應(yīng)用已經(jīng)引起IT界、政府及科研部門等相關(guān)行業(yè)的廣泛關(guān)注,國內(nèi)圖書館界也掀起了大數(shù)據(jù)的研究熱潮,涌現(xiàn)出一大批相關(guān)研究成果和文獻。筆者以中國知網(wǎng)(CNKI)為數(shù)據(jù)源,以主題為檢索項,以大數(shù)據(jù)(BigData)為檢索詞,不限刊發(fā)時間,檢索專輯名稱為圖書情報與數(shù)字圖書館,共檢索出原始文獻2,069篇(檢索日期2016年9月10日),通過手工篩選,剔除89篇非學術(shù)性論文及關(guān)聯(lián)性不大的文章,共搜集到從2012―2016年刊發(fā)的有效文獻1,980篇。因此,筆者選取了2012―2016年這5年間的文獻數(shù)據(jù)做大數(shù)據(jù)領(lǐng)域的知識圖譜進行分析。由于VOSviewer在聚類技術(shù)、圖譜繪制等方面有獨特優(yōu)勢,因此,筆者綜合運用了CiteSpace和VOSviewer來繪制相應(yīng)的科學知識圖譜,綜合運用二者的優(yōu)勢,對近幾年國內(nèi)圖書館大數(shù)據(jù)研究領(lǐng)域的作者、機構(gòu)、熱點主題及前沿領(lǐng)域進行探究,準確地挖掘該研究主題的本質(zhì)。
2 數(shù)據(jù)分析
2.1 文獻發(fā)表時間分布
2007―2016年,國內(nèi)圖書館大數(shù)據(jù)研究文獻總發(fā)文量為1,986篇,其中2007―2011年的發(fā)文量較少,僅有6篇。2007年,隨著云計算、物聯(lián)網(wǎng)、機構(gòu)倉儲、語義網(wǎng)絡(luò)等相關(guān)領(lǐng)域的快速發(fā)展,大規(guī)模數(shù)據(jù)的挖掘、整合、存儲成為學術(shù)界研究的熱點,為后來大數(shù)據(jù)主題的相關(guān)研究孕育了基礎(chǔ)。筆者通過分析文獻發(fā)現(xiàn),國內(nèi)圖書館關(guān)于大數(shù)據(jù)的確切概念研究的第一篇文獻發(fā)表于2012年,同時,2012年隨著大數(shù)據(jù)的技術(shù)優(yōu)勢及價值被廣泛認知,大數(shù)據(jù)迅速成為各學科領(lǐng)域研究的重點和熱點。此后,國內(nèi)圖書館對大數(shù)據(jù)的研究日益活躍起來,自2013年以后,大數(shù)據(jù)進入快速發(fā)展階段,相關(guān)研究文獻量呈現(xiàn)急劇增長的態(tài)勢,這充分表明了大數(shù)據(jù)已經(jīng)成為國內(nèi)圖書館研究的又一熱點。
2.2 文獻代表作者及其機構(gòu)綜合分析
2.2.1 綜合考慮發(fā)文量和突現(xiàn)值的代表作者。在CiteSpace界面中,時間設(shè)置為2012―2016年,分段時間為1年,節(jié)點類型為作者,采用CiteSpace提供的突現(xiàn)詞檢測(Burst Detection)算法,得到發(fā)表論文數(shù)≥6篇以及突現(xiàn)值排名前10的作者(見表1、圖1),并初步確定這些作者為圖書館大數(shù)據(jù)研究領(lǐng)域的核心作者。
從圖1可以看出,組成的3人以上的小團體比較多,但子網(wǎng)間的聯(lián)系較少,彼此之間的合作關(guān)系不是很緊密。在3人以上的團體中,最大的是以桂林理工大學圖書館的張興旺為中心的研究團體,核心成員包括李晨暉、黃曉斌等;發(fā)文量最多的是由馬曉亭、陳臣等組成的團體,該團體共發(fā)表文獻41篇。
2.2.2 研究機構(gòu)知識圖譜分析。國內(nèi)圖書館大數(shù)據(jù)研究領(lǐng)域發(fā)文量≥8篇的機構(gòu)共有12個(見表2),這12個機構(gòu)共發(fā)表文獻229篇,占發(fā)文總量的11.53%。其中發(fā)文量最多的機構(gòu)是武漢大學信息管理學院,其次是南京大學信息管理學院,這兩個機構(gòu)是目前國內(nèi)公認的圖情教育規(guī)模最大、實力最強的高校院系。網(wǎng)絡(luò)節(jié)點類型選擇“機構(gòu)”,運行CiteSpace得到該主題研究的機構(gòu)聚類知識圖譜(見圖2)。由圖2可知,各個機構(gòu)間的合作不是很緊密,存在的合作關(guān)系中大多局限于區(qū)域內(nèi)的機構(gòu)合作,且合作頻次較低,表明該主題領(lǐng)域研究機構(gòu)眾多,但研究實力不強,還處于相對封閉且分散的狀態(tài)。
2.3 研究熱點聚類結(jié)果分析
通過繪制關(guān)鍵詞共現(xiàn)知識圖譜,根據(jù)關(guān)鍵詞出現(xiàn)頻次的高低可以確定一個領(lǐng)域的研究熱點[2]。首先,將出現(xiàn)頻次10次以上(含10次)的78個有效關(guān)鍵詞構(gòu)建成“78*78”的共詞矩陣;其次,利用Ucinet及其內(nèi)嵌的Netdraw工具處理過程性數(shù)據(jù)[3];最后,把生成的NET文件導入VOSviewer進行共詞聚類分析,生成如圖3所示的關(guān)鍵詞聚類標簽圖譜。從圖3可以看出,每一種顏色代表了一個類別,擁有相同顏色的節(jié)點屬于同一個聚類。此外,筆者通過去除一些邊緣類別,整理出國內(nèi)圖書館大數(shù)據(jù)研究領(lǐng)域7大類關(guān)鍵詞類簇(見表3)。
3 國內(nèi)圖書館大數(shù)據(jù)研究領(lǐng)域分析
3.1 大數(shù)據(jù)時代圖書館信息服務(wù)創(chuàng)新
大數(shù)據(jù)時代,為使用戶隨時隨地都能獲得具有實時性、全面性、交互性、決策性、個性化的信息服務(wù),圖書館應(yīng)充分采集該地區(qū)與讀者相關(guān)的數(shù)據(jù),通過數(shù)據(jù)了解用戶的行為、意愿及信息服務(wù)需求,借助當前的信息技術(shù),為用戶提供適應(yīng)大數(shù)據(jù)時代用戶信息需求的知識發(fā)現(xiàn)服務(wù)。
3.2 “互聯(lián)網(wǎng)+”與圖書館的融合
“互聯(lián)網(wǎng)+”時代的到來,給圖書館帶來了全新的發(fā)展機遇[4],依托大數(shù)據(jù)技術(shù)和“互聯(lián)網(wǎng)+”思維,圖書館各項服務(wù)(如:學科服務(wù)、嵌入式服務(wù)、閱讀推廣等服務(wù))的開展也將更加便利、高效及更具有針對性。圖書館應(yīng)將“互聯(lián)網(wǎng)+”思維應(yīng)用到圖書館工作實踐之中,加強二者的深度融合與創(chuàng)新驅(qū)動,才能更好地發(fā)揮其作用。
3.3 大數(shù)據(jù)價值的挖掘
大數(shù)據(jù)時代的到來引發(fā)了人們對數(shù)據(jù)價值的重新認識,數(shù)據(jù)將成為圖書館的核心資產(chǎn)[5],如何對這些結(jié)構(gòu)復雜、形式多樣的數(shù)據(jù)進行分析與處理,最終變成有價值的信息,這對圖書館提出了挑戰(zhàn)。所以,圖書館工作人員應(yīng)借助云計算、大數(shù)據(jù)及各種智能技術(shù),從用戶日常的信息行為乃至生活行為數(shù)據(jù)中挖掘出具有潛在價值的知識和規(guī)律,進而為圖書館的科學化管理及智能化決策提供相關(guān)支持。
3.4 大數(shù)據(jù)下的競爭情報研究
大數(shù)據(jù)環(huán)境下,大數(shù)據(jù)給競爭情報研究提供了更加全面、真實的數(shù)據(jù)資源,同時給競爭情報的數(shù)據(jù)存儲與管理提供了技術(shù)支持。企業(yè)通過利用大數(shù)據(jù)的數(shù)據(jù)處理手段及大數(shù)據(jù)分析技術(shù),通過對競爭環(huán)境、競爭對手、競爭策略中的大量原始數(shù)據(jù)的獲取、加工、挖掘和分析,獲取其潛在的知識,為企業(yè)打造可持續(xù)的重要競爭優(yōu)勢提供智力支持[6]。
3.5 大數(shù)據(jù)時代的智慧圖書館
智慧圖書館是在數(shù)字圖書館及移動圖書館的基礎(chǔ)上,為適應(yīng)社會化、泛在化服務(wù)需求及互聯(lián)互通的發(fā)展需要,通過云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù)支撐圖書館發(fā)展的創(chuàng)新形態(tài)[7]。大數(shù)據(jù)時代,不斷產(chǎn)生的海量數(shù)據(jù)為圖書館智慧服務(wù)的開展提供了取之不盡的資源,智慧圖書館通過數(shù)據(jù)分析對館藏資源、用戶的行為及意愿、用戶的知識需求等進行全面、系統(tǒng)的了解,挖掘讀者的潛在需求,在此基礎(chǔ)上為用戶提供高效、便利的智慧服務(wù),同時為管理者提供了科學的決策依據(jù)。
3.6 大數(shù)據(jù)環(huán)境下圖書館的數(shù)據(jù)素養(yǎng)教育研究
數(shù)據(jù)素養(yǎng)是信息素養(yǎng)在大數(shù)據(jù)環(huán)境下的延續(xù)和拓展,是人們有效且正當?shù)厥占⒐芾?、處理與分析、評估和使用信息及數(shù)據(jù)的一種意識和能力[8]。大數(shù)據(jù)時代,數(shù)據(jù)逐漸滲透到人們生活的各個環(huán)節(jié)中,人們的學習、工作等都離不開數(shù)據(jù)的支撐。良好的數(shù)據(jù)素養(yǎng)是大數(shù)據(jù)環(huán)境下人們必備的技能素養(yǎng)之一,數(shù)據(jù)素養(yǎng)的教育與培養(yǎng)在當今這個網(wǎng)絡(luò)時代也顯得十分重要。圖書館以提高人們的文化素養(yǎng)為己任,因此,應(yīng)充分發(fā)揮自身的優(yōu)勢及教育職能,在人們的數(shù)據(jù)素養(yǎng)教育中承擔起相應(yīng)的職責。
3.7 大數(shù)據(jù)的信息安全
大數(shù)據(jù)在帶來巨大價值的同時,也加大了信息安全風險,數(shù)據(jù)的大量匯集和集中存儲很容易成為黑客攻擊和竊取的目標。圖書館在為用戶提供高質(zhì)量個性化服務(wù)的過程中,需要利用大數(shù)據(jù)技術(shù)對用戶行為和社會關(guān)系數(shù)據(jù)進行采集、分析與處理,這個過程顯然對讀者的隱私帶來了威脅和侵犯,在給用戶帶來危害的同時也導致了讀者流失。大數(shù)據(jù)環(huán)境下的信息安全和個人隱私保護問題已經(jīng)成為眾多研究者努力探索的難題。
參考文獻:
[1]方巍,鄭玉,徐江.大數(shù)據(jù):概念、技術(shù)及應(yīng)用研究綜述[J].南京信息工程大學學報,2014(5):405-419.
[2]吳曉秋,呂娜.基于關(guān)鍵詞共現(xiàn)頻率的熱點分析方法研究[J].情報理論與實踐,2012(8):115-119.
[3]陳琴,蔣合領(lǐng).我國知識管理研究學派、知識基礎(chǔ)及熱點的可視化分析[J].情報雜志,2016(2):88-92,174.
[4]張興旺,李晨暉.當圖書館遇上“互聯(lián)網(wǎng)+”[J].圖書與情報,2015(4):63-70.
[5]韓翠峰.大數(shù)據(jù)時代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1):121-122.
[6]娜日,朱淑珍,洪賢方,等.基于金融創(chuàng)新過程的競爭情報保障機制研究[J].情報雜志,2014(1):23-26,71.
[7]李浩.云計算、大數(shù)據(jù)、數(shù)字圖書館與智慧圖書館關(guān)聯(lián)研究:用大數(shù)據(jù)打造智慧圖書館的思考[J].四川圖書館學報,2014(6):31-34.
[8]金兼斌.財經(jīng)記者與數(shù)據(jù)素養(yǎng)[J].新聞與寫作,2013(10):5-9.
(編校:崔 萌)