王最 王立宏 劉斌
摘要:高校數(shù)字信息化建設(shè)快速發(fā)展,圖書館數(shù)據(jù)呈爆炸性增長,對相關(guān)數(shù)據(jù)進行統(tǒng)計分析有助于優(yōu)化圖書館管理,提高服務(wù)水平。但圖書館大數(shù)據(jù)研究過程中存在概念不統(tǒng)一、研究對象單一、認識不全面等問題,嚴重制約了圖書館現(xiàn)代化管理水平的提高。針對上述問題,提出應(yīng)采取規(guī)范統(tǒng)一概念、擴大研究內(nèi)容范圍、采用多維度分析等措施,促進高校圖書館大數(shù)據(jù)研究科學(xué)健康快速發(fā)展。
關(guān)鍵詞關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計分析;圖書館
DOIDOI:10.11907/rjdk.171727
中圖分類號:TP391
文獻標(biāo)識碼:A文章編號文章編號:16727800(2017)011020002
0引言
大數(shù)據(jù)(Big data)是在一定時間內(nèi)無法使用現(xiàn)有技術(shù)進行收集、運輸、處理和分析的數(shù)據(jù)集合,需要新理論、新技術(shù)才能發(fā)現(xiàn)和挖掘出其價值的高增長率和多樣化的信息資產(chǎn)[1](研究機構(gòu)Gartner觀點),它通常具有數(shù)據(jù)規(guī)模大、數(shù)據(jù)增長快、數(shù)據(jù)類型多樣和價值密度低4大特征[2]。大數(shù)據(jù)的價值在于對數(shù)據(jù)進行深度分析,挖掘出其中的規(guī)律,進而運用規(guī)律服務(wù)于人們的生產(chǎn)生活,而不在于數(shù)據(jù)規(guī)模是否龐大。假如將大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這個產(chǎn)業(yè)能夠盈利的關(guān)鍵之處就在于提高數(shù)據(jù)“加工能力”,通過“加工”實現(xiàn)“增值”。
高校圖書館大數(shù)據(jù)指高等學(xué)校在圖書館運作過程中產(chǎn)生的海量數(shù)據(jù),如采訪、編目、典藏、流通等環(huán)節(jié)積累和產(chǎn)生的數(shù)據(jù)[3]。通過對數(shù)據(jù)進行采樣和統(tǒng)計分析,能為圖書館采訪剔舊管理工作提供統(tǒng)計基礎(chǔ),為領(lǐng)導(dǎo)決策提供科學(xué)依據(jù),優(yōu)化借閱規(guī)則、深化讀者服務(wù)、提高圖書利用率。
1圖書館大數(shù)據(jù)研究現(xiàn)狀
圖書館大數(shù)據(jù)統(tǒng)計分析在優(yōu)化圖書館職能方面地位十分重要,吸引了諸多學(xué)者進行研究。熊哲夫[4]針對圖書館數(shù)據(jù)服務(wù)現(xiàn)狀,提出基于數(shù)據(jù)運營平臺對現(xiàn)有業(yè)務(wù)流程和服務(wù)模式進行重構(gòu),促使圖書館服務(wù)水平更加智能化,管理工作更高效;陳學(xué)文[5]采用文獻分類、讀者排行榜、文獻借閱排行榜以及文獻年借閱量等維度,對襄樊學(xué)院圖書館2008-2010年的流通數(shù)據(jù)進行了統(tǒng)計分析,總結(jié)出讀者閱讀規(guī)律和特征,有助于優(yōu)化館藏文獻結(jié)構(gòu),調(diào)整文獻布局,提高文獻利用率,為上層領(lǐng)導(dǎo)決策提供有力支撐;袁紅軍[6]針對大數(shù)據(jù)環(huán)境下圖書館參考咨詢服務(wù)內(nèi)容和形式進行了研究分析,提出了基于大數(shù)據(jù)思維的圖書館參考咨詢服務(wù)創(chuàng)新機制研究框架,為圖書館咨詢模式的形成和咨詢服務(wù)水平的提高提供了新方法和新途徑;王蘭英[7]提出大數(shù)據(jù)是高校圖書館的財富,也是服務(wù)創(chuàng)新的依據(jù)和源泉,采用大數(shù)據(jù)能掌握讀者閱讀需求,創(chuàng)新服務(wù)策略;吳玉等[8]針對大數(shù)據(jù)時代特點,提出高校要把握大數(shù)據(jù)時代機遇,通過對圖書館產(chǎn)生的海量數(shù)據(jù)進行統(tǒng)計,分析讀者預(yù)約情況,評估已有文獻結(jié)構(gòu)是否合理,從而促進圖書館采訪水平的提升。
圖書館大數(shù)據(jù)在分析讀者閱讀喜好、揭示閱讀規(guī)律、統(tǒng)計熱門書籍、分析圖書利用率和借閱量等方面具有舉足輕重的地位,為圖書館圖書采購行為、服務(wù)策略、管理和服務(wù)水平、數(shù)據(jù)圖書館建設(shè)、用戶信息化服務(wù)和個性化服務(wù)等提供科學(xué)依據(jù)。作為圖書館大數(shù)據(jù)的關(guān)鍵問題和核心問題,圖書館大數(shù)據(jù)統(tǒng)計分析在提升圖書館應(yīng)用和服務(wù)水平方面有著至關(guān)重要的作用。
2存在的問題
伴隨著圖書館信息化和圖書館資源數(shù)字化進程的加快,圖書館管理系統(tǒng)每天都會產(chǎn)生龐雜的表單信息。
通過大數(shù)據(jù)統(tǒng)計分析圖書利用率、讀者排行榜、圖書借閱率等情況,可以客觀反映讀者的借閱傾向、館藏資源質(zhì)量等問題,為圖書館資源建設(shè)及設(shè)備合理配置提供重要依據(jù)。筆者2017年3月21日登陸CNKI數(shù)據(jù)庫,用“大數(shù)據(jù)”、“統(tǒng)計分析”及“圖書館”為關(guān)鍵詞進行檢索,得到結(jié)果為14篇,可見國內(nèi)在這方面的研究甚少,還處于起步階段。
目前關(guān)于圖書館大數(shù)據(jù)統(tǒng)計分析的研究主要集中在以下3個方面:①使用文獻借閱率指標(biāo)預(yù)測讀者閱讀需求和閱讀傾向;②采用文獻利用率統(tǒng)計分析館藏文獻和圖書布局結(jié)構(gòu)是否合理;③基于借閱量、入館率等統(tǒng)計數(shù)據(jù)揭示借閱量不足等問題,并提出相應(yīng)解決措施。
圖書館大數(shù)據(jù)統(tǒng)計分析研究問題主要表現(xiàn)在以下幾個方面:
(1)概念不統(tǒng)一。對 “文獻利用率”概念定義較少,只有河北聯(lián)合大學(xué)在《基于文獻利用率的館藏分析》中對其進行了定義和說明[9]。關(guān)于文獻利用率,同樣的普通高校,同樣用中圖法分類統(tǒng)計出來的文獻利用率差別很大。比如:山東農(nóng)業(yè)大學(xué)2010~2012三年平均利用率為38.96%,塔里木大學(xué)的綜合利用率為12.9%,而伊犁師范學(xué)院統(tǒng)計的利用率則超過了100%[10]。之所以會出現(xiàn)這種情況,是由于該作者將文獻利用率概念與其它概念混淆。
(2)研究對象單一。圖書館大數(shù)據(jù)統(tǒng)計分析中值得研究的數(shù)據(jù)較多,比如:借閱人次統(tǒng)計、文獻外借周期統(tǒng)計、圖書借還周轉(zhuǎn)統(tǒng)計、讀者借閱排行統(tǒng)計、圖書預(yù)約排行統(tǒng)計等。但目前關(guān)于這方面的研究都集中在文獻利用率、借閱量這兩個統(tǒng)計指標(biāo)上,對于圖書館其它有價值的數(shù)據(jù)研究幾乎沒有涉及,而這些沒有涵蓋到的圖書館大數(shù)據(jù),往往能夠揭示出高校圖書館的運行規(guī)律。
(3)認識不全面。館藏結(jié)構(gòu)包括館藏規(guī)模結(jié)構(gòu)、館藏時間結(jié)構(gòu)、種冊及經(jīng)費比例結(jié)構(gòu)、館藏學(xué)科結(jié)構(gòu)、館藏等級結(jié)構(gòu)、館藏語種結(jié)構(gòu)、文獻類型結(jié)構(gòu)(圖書、期刊、專利文獻、科技報紙、學(xué)位論文等)、書刊比例結(jié)構(gòu)、讀者知識結(jié)構(gòu)(文化程度、研究范圍等)。從館藏結(jié)構(gòu)所包含的內(nèi)容來看,它受多種因素影響。因此,研究如何優(yōu)化館藏結(jié)構(gòu)是較復(fù)雜的問題,應(yīng)從多維度進行分析研究,但現(xiàn)有的研究方法僅僅只是通過分析文獻利用率來推測館藏結(jié)構(gòu)是否合理,可能走入以偏概全的誤區(qū)。
3對策措施
為保證高校圖書館能夠有效利用大數(shù)據(jù)進行統(tǒng)計分析,優(yōu)化圖書館管理職能、提高服務(wù)水平,針對以上問題,筆者提出以下措施:
(1)規(guī)范統(tǒng)一概念。比如:文獻利用率的計算方法是:在指定時間段內(nèi),某館藏地的文獻借閱冊次或種次/本館或全館指定時間段入藏的文獻總冊數(shù)或種數(shù)(同一冊書或刊被借閱多次,仍記為一冊),所以文獻利用率不可能超過100%。而文獻借閱率的計算方法是圖書借閱次數(shù)與其復(fù)本數(shù)之比。通過比較兩者計算方法可以看出,文獻利用率是針對某類圖書的借閱情況,而文獻借閱率是針對某冊圖書的借閱情況。endprint
(2)擴大研究范圍。目前,圖書館數(shù)據(jù)的研究基本集中在文獻利用率、借閱量上,而圖書館值得研究的數(shù)據(jù)非常多。比如:采用文獻預(yù)約情況統(tǒng)計分析可知哪些圖書最炙手可熱;借閱外界周期統(tǒng)計可分析當(dāng)前圖書的借閱規(guī)則是否合理,是否符合讀者需求;圖書借閱排行榜可以得出哪些圖書或哪類圖書最受歡迎等等。所以應(yīng)該擴大研究數(shù)據(jù)范圍,而不應(yīng)只限定在某一個或兩個數(shù)據(jù)特征上。通過全面分析,有助于了解、掌握圖書館運行現(xiàn)狀和規(guī)律,進而對圖書館館藏結(jié)構(gòu)進行優(yōu)化,合理安排業(yè)務(wù)流程。
(3)針對特定問題,進行多維度分析。在研究比較復(fù)雜的問題時,不應(yīng)僅分析一兩個因素就得出結(jié)論,應(yīng)該全面分析得出有效結(jié)論。比如:前文提到的館藏結(jié)構(gòu)受館藏規(guī)模結(jié)構(gòu)、館藏時間結(jié)構(gòu)、種冊比例及結(jié)構(gòu)、經(jīng)費比例結(jié)構(gòu)、館藏學(xué)科結(jié)構(gòu)、館藏等級結(jié)構(gòu)、館藏語種結(jié)構(gòu)等方面的影響,應(yīng)從多維度進行深入分析研究,提出一種綜合或加權(quán)的評價標(biāo)準,才能出客觀規(guī)律,進而采取有效的解決方案。
4結(jié)語
大數(shù)據(jù)時代給圖書館管理和服務(wù)帶來新的發(fā)展機遇,圖書館界應(yīng)正確認識大數(shù)據(jù),充分挖掘大數(shù)據(jù)的價值,利用大數(shù)據(jù)分析結(jié)果,有效預(yù)測圖書館事業(yè)發(fā)展過程中的新變化和新趨勢,科學(xué)預(yù)測和判斷讀者需求,為圖書館的科學(xué)管理提供依據(jù),最大限度地滿足讀者需求。
參考文獻參考文獻:
[1]蘇明偉.圖書館大數(shù)據(jù)體系構(gòu)建的探討[J].科技創(chuàng)新與應(yīng)用,2015(21):8788.
[2]張宏.我國高校圖書館大數(shù)據(jù)研究現(xiàn)狀分析[J].圖書館工作與研究,2015(5):4650.
[3]蒲虹穎,閆智.論大數(shù)據(jù)時代以及給圖書館帶來的挑戰(zhàn)[J].吉林廣播電視大學(xué)學(xué)報,2016(8):124128.
[4]熊哲夫.淺談圖書館大數(shù)據(jù)的服務(wù)模式創(chuàng)新[J].電腦知識與技術(shù),2016(6):1112.
[5]陳學(xué)文.高校圖書館流通數(shù)據(jù)的統(tǒng)計分析[J].科教文化,2012(6):166167.
[6]袁紅軍.大數(shù)據(jù)時代下圖書館參考咨詢服務(wù)創(chuàng)新機制探究[J].圖書館工作與研究,2017(1):1619.
[7]王蘭英.高校圖書館大數(shù)據(jù)時代數(shù)據(jù)建設(shè)及功能轉(zhuǎn)型探析[J].圖書館界,2014(1):6163.
[8]吳玉,張作來,苗永菊.大數(shù)據(jù)時代高校圖書館面向?qū)W科建設(shè)的中文圖書采訪機制[J].中國冶金教育,2015(6):8185.
[9]趙鴻雁,馮鑫,李秀鳳,等.基于文獻利用率統(tǒng)計的館藏分析——以河北聯(lián)合大學(xué)主校區(qū)圖書館為例[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2014(2):7779.
[10]祁瑞.我院圖書館中文圖書流通數(shù)據(jù)統(tǒng)計分析及提高文獻利用率的措施[J].伊犁師范學(xué)院學(xué)報:社會科學(xué)版,2010(3):137140.
責(zé)任編輯(責(zé)任編輯:杜能鋼)endprint