李詔然
摘要:隨著時(shí)代的發(fā)展,社會(huì)已然進(jìn)入大數(shù)據(jù)和云計(jì)算時(shí)代。人們可以通過數(shù)據(jù)的收集、分析和處理,挖掘出數(shù)據(jù)背后的價(jià)值,進(jìn)而利用數(shù)據(jù)的價(jià)值去創(chuàng)造更大的價(jià)值,這對(duì)高校圖書館服務(wù)來說也是一樣的。高校圖書館可通過對(duì)讀者數(shù)據(jù)的挖掘,再通過有效的算法分析處理,判斷出讀者興趣以及讀者與圖書資源的聯(lián)系,進(jìn)行合理的資源安排,并且給讀者提供個(gè)性化的服務(wù)。本文首先分析數(shù)據(jù)時(shí)代的內(nèi)涵以及高校圖書館數(shù)據(jù)挖掘的相關(guān)算法,其次分析數(shù)據(jù)挖掘在高校圖書館服務(wù)中的應(yīng)用途徑,以期將圖書館服務(wù)的潛力徹底釋放,創(chuàng)造出更多的價(jià)值。
關(guān)鍵詞:數(shù)據(jù)挖掘;高校圖書館服務(wù);應(yīng)用
中圖分類號(hào):G251文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1673-7164(2021)05-0127-02
近年來,高校圖書館的圖書資源利用率不斷下降。針對(duì)這種現(xiàn)象,高校要不斷挖掘高校圖書館的服務(wù)數(shù)據(jù),從這些數(shù)據(jù)中挖掘出潛在的價(jià)值,更好地進(jìn)行圖書資源采購、編目等,為學(xué)生提供個(gè)性化的圖書資源服務(wù),順應(yīng)時(shí)代的變化,提高圖書資源的利用率,更好地為高校學(xué)生服務(wù),為社會(huì)培育出更優(yōu)秀的人才。
一、數(shù)據(jù)挖掘
(一)挖掘數(shù)據(jù)的內(nèi)涵
在當(dāng)前的大數(shù)據(jù)時(shí)代,人們的衣食住行等各方面行為都被數(shù)據(jù)化改造,“挖掘數(shù)據(jù)”是指對(duì)人們的行為數(shù)據(jù)進(jìn)行收集、轉(zhuǎn)換分析和模型化處理,挖掘出數(shù)據(jù)背后的價(jià)值,從而為圖書館服務(wù)的各項(xiàng)決策提供數(shù)據(jù)支持,大數(shù)據(jù)“4V”特征包括數(shù)據(jù)體量大(Volume)、數(shù)據(jù)類型繁多(Variety)、價(jià)值密度低(Value)、利用速度快(Velocity)。
(二)挖掘數(shù)據(jù)的過程
挖掘數(shù)據(jù)可以從采集與存儲(chǔ)、計(jì)算與處理、智能運(yùn)營三方面分析。首先是采集和存儲(chǔ),其中最關(guān)鍵的就是“學(xué)生”與“圖書”兩個(gè)數(shù)據(jù)主體,高校圖書館利用自動(dòng)化圖書系統(tǒng)中的大量借閱業(yè)務(wù)數(shù)據(jù),能夠輕松采集到學(xué)生的借閱數(shù)據(jù),再將其存儲(chǔ)在云端;
其次是計(jì)算與處理,需要運(yùn)用到精細(xì)的算法,而高校圖書館可以利用開源的云計(jì)算框架或軟件對(duì)學(xué)生借閱數(shù)據(jù)進(jìn)行處理,例如Hadoop、Mapreduce、Spark、Pentaho BI等開源框架,也可與社會(huì)第三方專業(yè)云計(jì)算企業(yè)尋求合作,需要根據(jù)實(shí)際情況而定;最后是智能運(yùn)營,簡單來說就是根據(jù)挖掘的數(shù)據(jù)價(jià)值做好圖書館各項(xiàng)事宜的規(guī)劃,從而為圖書館服務(wù)的各項(xiàng)決策提供數(shù)據(jù)支持。
二、圖書館數(shù)據(jù)挖掘的常見算法
圖書館對(duì)學(xué)生借閱數(shù)據(jù)的收集較好處理,而如何從雜亂且繁多的數(shù)據(jù)中找出有效的信息則是重點(diǎn)問題,要考慮到方方面面的因素。高校圖書館數(shù)據(jù)挖掘的算法有很多,通常包括以下幾類:
(一)關(guān)聯(lián)規(guī)則
兩個(gè)或多個(gè)數(shù)據(jù)具有關(guān)聯(lián)性就是關(guān)聯(lián)規(guī)則,關(guān)聯(lián)分析即找出數(shù)據(jù)中的關(guān)聯(lián)性,例如一名臨床醫(yī)學(xué)的學(xué)生借閱了《解剖學(xué)圖譜》和《細(xì)胞生物學(xué)》,這有可能只是小概率事件,而很多名臨床醫(yī)學(xué)的學(xué)生借閱了這兩本書,說明這兩本書具有關(guān)聯(lián)性。分析兩本書的關(guān)聯(lián)性,就能夠?yàn)橄乱晃慌R床醫(yī)學(xué)生進(jìn)行推薦。
(二)分類算法
學(xué)生的借閱數(shù)據(jù)多樣且煩瑣,高??赏ㄟ^對(duì)借閱樣本數(shù)據(jù)庫的多種行為數(shù)據(jù)進(jìn)行細(xì)致的劃分,等于按照標(biāo)簽進(jìn)行分層次、分類別的劃分,通過劃分找到學(xué)生精細(xì)的借閱需求和借閱特征的信息,后期可以根據(jù)學(xué)生的借閱需求進(jìn)行科學(xué)采購,也可以對(duì)借閱特征進(jìn)行圖書資源的高效化存檔[1]。
(三)聚類算法
聚類算法也叫群分析,即以“學(xué)生”這一數(shù)據(jù)來源為主體,將借閱數(shù)據(jù)庫中劃分出不同的借閱群體,通過相對(duì)應(yīng)的數(shù)據(jù)分析,概括出每一類借閱群體的借閱模式或者借閱習(xí)慣,是挖掘算法中的重要類別之一。
(四)時(shí)間序列法
高校圖書館可將若干的借閱數(shù)據(jù)資料按時(shí)間序列排列成數(shù)據(jù)序列,在眾多數(shù)據(jù)的集合下,其變化趨勢和相互關(guān)系較為明顯,可以利用過去的變動(dòng)趨勢預(yù)測未來,不過受到偶然因素的影響也很大,要盡可能消除偶然因素影響,常用算術(shù)平均、加權(quán)平均和指數(shù)平均等來減少偶然因素。
三、數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用途徑
(一)加強(qiáng)圖書館規(guī)劃。互聯(lián)網(wǎng)時(shí)代下,對(duì)讀者信息、圖書條碼進(jìn)行掃描,其借閱信息會(huì)立刻匯集到后臺(tái)海量數(shù)據(jù)庫中。通過對(duì)數(shù)據(jù)的分析,可以加強(qiáng)圖書館的規(guī)劃,例如將借閱量大的圖書類別放在易于查找的樓層和書架上,為學(xué)生提供更好的服務(wù)。圖書館可將兩本具有關(guān)聯(lián)性的圖書放在一起,將全部圖書進(jìn)行最優(yōu)化的規(guī)劃安排,或許看起來很亂,利用起來卻更加有效;或通過數(shù)據(jù)挖掘發(fā)現(xiàn)館藏中破損、編目不正確、索引關(guān)鍵詞有誤的圖書,對(duì)其適當(dāng)調(diào)整,充分發(fā)揮圖書價(jià)值。
(二)根據(jù)需求合理采購
以往圖書館的圖書采購是粗放型的,由采購人員決定采購的類型和數(shù)量,而在互聯(lián)網(wǎng)時(shí)代下,高校圖書館采購則是根據(jù)需求而定,根據(jù)學(xué)生的借閱圖書數(shù)據(jù),采購借閱需求高、借閱次數(shù)多的圖書,再結(jié)合實(shí)際館藏決定采購的類型,分清哪些是必需的,哪些是可以稍后補(bǔ)充的,采購人員在做好充分預(yù)算,做好計(jì)劃,拓寬采購渠道后,才能做到擇優(yōu)采購,提升采購質(zhì)量。例如,通過對(duì)圖書資源流通的記錄,一類圖書明明很多,但借閱的人數(shù)還是很多,借閱流通很快,就需要相關(guān)人員再擴(kuò)增采購量[2]。
(三)做好圖書館人事安排
圖書館借閱數(shù)據(jù)是海量的,學(xué)生到圖書館借閱的數(shù)據(jù)也是有規(guī)律的,應(yīng)根據(jù)對(duì)圖書借閱時(shí)間序列算法的分析,找出學(xué)生圖書館借閱的時(shí)間規(guī)律,精確到每一天、每一周、每一月,確定最優(yōu)的開館閉館時(shí)間,修整時(shí)間和人事安排等。圖書館工作繁多且細(xì)碎,管理人員短缺是常見的現(xiàn)象,將圖書館的人事安排精細(xì)劃分,并且提供相應(yīng)的勤工儉學(xué)崗位,在圖書館借閱高峰期,設(shè)置勤工儉學(xué)崗位,多配置幾位勤工儉學(xué)的學(xué)生,減輕新工作人員的負(fù)擔(dān)[3]。
(四)數(shù)據(jù)挖掘催動(dòng)人工智能落地
圖書館可利用數(shù)據(jù)挖掘,加強(qiáng)對(duì)人工智能的開發(fā),讓人工智能代替?zhèn)鹘y(tǒng)人力,進(jìn)行一些簡單的編目、新書通報(bào)、圖書歸整、引導(dǎo)、圖書查詢、簡單交互咨詢等工作,為高校學(xué)生提供更好的服務(wù)。
例如,2017年5月,由南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系、計(jì)算機(jī)軟件新技術(shù)國家重點(diǎn)實(shí)驗(yàn)室陳力軍教授課題組研發(fā)的智慧圖書館二期(智能機(jī)器人)在南京大學(xué)杜廈圖書館正式發(fā)布,名為“圖寶”的機(jī)器人融合了超高頻RFID、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、人工智能等技術(shù),可對(duì)整個(gè)圖書館藏書進(jìn)行自動(dòng)化盤點(diǎn),檢查是否存在錯(cuò)架圖書、藏書和丟失等現(xiàn)象,實(shí)時(shí)更新圖書位置信息,并可以和人簡單交流,做出指示,與圖書館系統(tǒng)形成無縫對(duì)接,成為智慧化的資深機(jī)器人館員。
(五)提供個(gè)性化服務(wù)
高校圖書館的圖書資源服務(wù),最終對(duì)象是高校學(xué)生和教師,因此引導(dǎo)讀者借閱,為讀者提供更好的借閱服務(wù)才是根本。
對(duì)此,圖書館可以將所有的借閱數(shù)據(jù)匯總,根據(jù)不同專業(yè)群體進(jìn)行大致劃分,根據(jù)圖書借閱的規(guī)律性,給學(xué)生和教師推薦相應(yīng)的讀物,實(shí)現(xiàn)個(gè)性化服務(wù),進(jìn)而加大圖書資源的可利用率。這會(huì)讓高校圖書館的服務(wù)變得更具質(zhì)量,滿足大多數(shù)人的需求[4]。
(六)將數(shù)據(jù)挖掘作用在身份驗(yàn)證和支付上
高校引入各類圖書或文獻(xiàn)索引,投入了大量的經(jīng)費(fèi),低價(jià)有償提供圖書借閱服務(wù),才能促進(jìn)圖書館可持續(xù)發(fā)展。對(duì)數(shù)據(jù)的挖掘也可以作用在身份驗(yàn)證和支付等多方面,例如在借書、還書、查閱等環(huán)節(jié)應(yīng)用身份驗(yàn)證技術(shù),提升效率,以方便讀者。例如2017年4月11日,浙江理工大學(xué)宣布將百度云人臉識(shí)別等技術(shù)應(yīng)用到圖書館管理中,讀者進(jìn)行人臉識(shí)別,查閱圖書情況,查自己名下的借閱請(qǐng)款、支付情況、借閱身份等,更加方便快捷。
四、數(shù)據(jù)挖掘技術(shù)支持下未來高校圖書館空間建設(shè)趨勢
首先,高校圖書館需要合理增值智能化設(shè)施設(shè)備,除了配備傳統(tǒng)工作設(shè)備以及各種數(shù)字制作工具之外,還可以在空間中配置智能機(jī)器人以及數(shù)據(jù)管理與分析系統(tǒng)、室內(nèi)定位系統(tǒng)等,提供更好的感知體驗(yàn)[5]。其次,高校圖書館需要合理利用數(shù)據(jù)挖掘?yàn)橛脩敉扑椭腔劬珳?zhǔn)的服務(wù)。移動(dòng)端的推送內(nèi)容應(yīng)該為用戶提供更精準(zhǔn)以及智慧的信息服務(wù),從而滿足用戶的復(fù)雜需求。最后,在數(shù)據(jù)挖掘技術(shù)下,高校圖書館的服務(wù)必然會(huì)越來越精細(xì)化,對(duì)館員的要求也更高,所以未來高校圖書館還需要培養(yǎng)高素養(yǎng)的智慧館員。他們除了要具備基本的素質(zhì)技能要求外,還應(yīng)該掌握更多先進(jìn)的技術(shù)。
從高校圖書館空間的發(fā)展趨勢來看,在未來,其物理空間質(zhì)量會(huì)越來越高,而虛擬空間是一個(gè)關(guān)鍵點(diǎn),在未來這項(xiàng)功能會(huì)越來越強(qiáng)大[6]。而圖書館的服務(wù)也會(huì)不斷轉(zhuǎn)型,變得更加智能。在未來,智慧空間將是圖書館空間發(fā)展的新類型,也是最終的建設(shè)趨勢。
五、結(jié)語
綜上所述,在互聯(lián)網(wǎng)時(shí)代下,高校圖書館需主動(dòng)轉(zhuǎn)變服務(wù)模式,利用海量資源優(yōu)勢,注重技術(shù)與服務(wù)的深度融合,挖掘數(shù)據(jù),找出數(shù)據(jù)背后的價(jià)值,讓數(shù)據(jù)在圖書館規(guī)劃、采購以及提供個(gè)性化服務(wù)等方面發(fā)揮作用,提升圖書館的價(jià)值,為學(xué)生提供更好的圖書借閱服務(wù),助力高校“雙一流”建設(shè)。
參考文獻(xiàn):
[1]柳益君,何勝,馮新翎,等.大數(shù)據(jù)挖掘在高校圖書館個(gè)性化服務(wù)中應(yīng)用研究[J].圖書館工作與研究,2017,1(05):23-29.
[2]張佳琴.數(shù)據(jù)挖掘在高校圖書館個(gè)性化服務(wù)中的應(yīng)用[J].漯河職業(yè)技術(shù)學(xué)院學(xué)報(bào),2013,12(06):188-189.
[3]于永清.數(shù)據(jù)挖掘在高校圖書館讀者服務(wù)中的應(yīng)用[J].佳木斯大學(xué)社會(huì)科學(xué)學(xué)報(bào),2008,26(02):176-177.
[4]黃麗娟.數(shù)據(jù)挖掘在高校圖書館個(gè)性化服務(wù)中應(yīng)用探討[J].吉林廣播電視大學(xué)學(xué)報(bào),2019(11):106-107.
[5]宋愛香,胡西民,李丹莎.基于聚類與GRNN算法的圖書館讀者借閱行為分析[J].電子設(shè)計(jì)工程,2020,28(11):1-4.
[6]羅昊.數(shù)據(jù)挖掘下的高校圖書館信息資源管理探討[J].食品研究與開發(fā),2020,41(08):2.
(薦稿人:樊桂蘭,河北工業(yè)職業(yè)技術(shù)學(xué)院科長,副研究館員)(責(zé)任編輯:鄒宇銘)