荊有廣
摘 要:大數(shù)據(jù)已經(jīng)影響著社會的各個方面,圖書館擁有大量的數(shù)據(jù),不可避免地受其影響。面對大數(shù)據(jù)對圖書館數(shù)據(jù)存儲分析能力等各方面的挑戰(zhàn),圖書館不得不提高自身的數(shù)據(jù)處理和分析能力,提高數(shù)據(jù)管理的服務(wù)能力和圖書館員的業(yè)務(wù)素質(zhì)。
關(guān)鍵詞:大數(shù)據(jù);圖書館;數(shù)據(jù)服務(wù);管理人才
中圖分類號:G251 文獻標(biāo)識碼:A DOI:10.15913/j.cnki.kjycx.2015.05.028
大數(shù)據(jù)時代的到來改變了傳統(tǒng)的數(shù)據(jù)存儲和分析方式,也必然影響著提供信息服務(wù)知識、服務(wù)為重要服務(wù)方式的圖書館業(yè)務(wù)。圖書館的數(shù)據(jù)存儲、分析和挖掘的發(fā)展?fàn)顩r與大數(shù)據(jù)的發(fā)展緊密聯(lián)系,多種多樣的數(shù)據(jù)概念或模型被提出,例如云計算、虛擬化、MapReduce(hadoop)等。正如馬云所說,我們正在從信息科技時代走向數(shù)據(jù)科技時代。
1 認(rèn)識大數(shù)據(jù)
美國《紐約時報》曾宣稱,“大數(shù)據(jù)時代”已經(jīng)降臨,龐大的新數(shù)據(jù)來源所帶來的量化轉(zhuǎn)變將引發(fā)一場革命,大數(shù)據(jù)正對每個領(lǐng)域都造成影響。麥肯錫報告也指出,數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)要素。大數(shù)據(jù)也稱海量數(shù)據(jù),指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工在合理時間內(nèi)截取、管理、處理,并整理成為人類所能解讀的信息。
大數(shù)據(jù)與我們的日常生活息息相關(guān),酷狗音樂可以通過相似的用戶群體推斷出每個年齡階段的用戶最喜歡哪首歌,甚至喜歡什么樣的電影;迪卡儂可以通過各地店鋪銷售數(shù)據(jù)的整合分析,準(zhǔn)確地判斷出各地消費者對運動品牌的不同偏好,從而智能地調(diào)配各地的庫存?zhèn)湄洸呗?;淘寶網(wǎng)更是能夠預(yù)測每位用戶可能感興趣的商品是什么,由此可以針對每位用戶進行個性化的推薦服務(wù)。簡單地針對某一用戶行為分析可能產(chǎn)生的價值不大,但是針對一個極大群體的用戶進行行為分析,往往可以從趨勢上得到價值較大的預(yù)測結(jié)果。
圖書館正好需要針對龐大的讀者規(guī)模,利用大數(shù)據(jù)技術(shù)去挖掘、識別、組織與分析讀者行為中的結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)信息,尋找他們的隱性訴求,以此改進服務(wù),滿足讀者的知識挖掘、知識評價、數(shù)據(jù)分析等增值服務(wù)需求,這樣可以達到圖書館資源、服務(wù)與讀者需求的雙向理想控制,這已成為大數(shù)據(jù)時代提高圖書館服務(wù)體系的一條捷徑。
2 大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)
大數(shù)據(jù)是復(fù)雜的,社交網(wǎng)絡(luò)的興起給信息文本的挖掘增加了難度。信息大多以短文本格式存在,這使數(shù)據(jù)類型更加復(fù)雜。非結(jié)構(gòu)化數(shù)據(jù)成為大數(shù)據(jù)交流的主流形式,增加了存儲與分析的難度。大部分?jǐn)?shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),例如各種文本、圖片、報表、圖像、音頻視頻、XML等,對于圖書館來說,讀者的借閱數(shù)據(jù)、圖書書目檢索服務(wù)、參考咨詢服務(wù)等大多是以結(jié)構(gòu)化數(shù)據(jù)存在,所以大數(shù)據(jù)時代圖書館的服務(wù)方式和手段要隨著數(shù)據(jù)的特點而變化。
大數(shù)據(jù)時代,各類信息資源迅猛發(fā)展,圖書館的數(shù)字資源也在迅速增長,電子圖書、電子期刊、音視頻資源和網(wǎng)絡(luò)資源形成了海量的數(shù)字資源,不管是在數(shù)量上,還是在電子資源的種類上,都為圖書館提供了豐富的數(shù)據(jù)。面對復(fù)雜的數(shù)據(jù),圖書館也要依賴于大數(shù)據(jù)的分析和挖掘技術(shù)。
目前的圖書館,不管是信息技術(shù)人才,還是數(shù)據(jù)處理技術(shù)和硬件基礎(chǔ)設(shè)施等,都難以滿足當(dāng)前大數(shù)據(jù)應(yīng)用的要求,大數(shù)據(jù)的挖掘、分析和存儲對圖書館提出新的挑戰(zhàn)。圖書館本身擁有海量數(shù)據(jù),但其分析和運算能力落后,使得高質(zhì)量的數(shù)據(jù)難以被利用。因此,需要配備處理復(fù)雜數(shù)據(jù)的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,分析和挖掘大數(shù)據(jù)信息的軟硬件設(shè)備,尤其是擁有處理數(shù)據(jù)能力的信息館員是當(dāng)前圖書館面臨的最大挑戰(zhàn)。
3 大數(shù)據(jù)時代下圖書館的發(fā)展策略
3.1 提高圖書館對數(shù)據(jù)的處理和分析能力
一直以來,圖書館的數(shù)據(jù)處理僅限于對紙質(zhì)文獻電子書刊等進行數(shù)字化處理,購買一些數(shù)據(jù)庫資源,處理的大部分?jǐn)?shù)據(jù)都是結(jié)構(gòu)化形式。結(jié)構(gòu)化數(shù)據(jù)可供我們分析的信息不多,難以獲得有深度、有價值的信息。隨著大數(shù)據(jù)時代的到來,讀者用戶越來越迫切地需要圖書館提供更深入的、更大范圍的知識服務(wù),讀者需要更加智能化、個性化的圖書信息。大數(shù)據(jù)為圖書館的發(fā)展提供了發(fā)展契機,圖書館應(yīng)抓住機遇,改變原有的數(shù)據(jù)處理范圍和方式,利用自身條件優(yōu)勢,根據(jù)自己擁有的大量讀者數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù),對讀者的借閱記錄、留言、信息咨詢以及查詢記錄等各類數(shù)據(jù)進行分析,挖掘出有價值的信息,根據(jù)讀者的需求改善服務(wù)方式,提高服務(wù)質(zhì)量。對大數(shù)據(jù)分析和處理能力的提升將會成為新時代圖書館業(yè)務(wù)的主要內(nèi)容。
3.2 提升圖書館的數(shù)據(jù)服務(wù)能力
大數(shù)據(jù)時代意味著獲取數(shù)據(jù)的競爭將越來越激烈,圖書館不僅要了解讀者需要什么樣的數(shù)據(jù)、什么樣的服務(wù),還要利用數(shù)據(jù)對圖書館與科研機構(gòu)在合作交互、知識服務(wù)過程中的趨向進行分析和預(yù)測。在大數(shù)據(jù)時代,圖書館應(yīng)提高知識服務(wù)標(biāo)準(zhǔn),利用新型的服務(wù)模式。圖書館可以為讀者提供推送服務(wù),根據(jù)讀者借閱記錄和查詢資料的頻率分析他們的興趣愛好,預(yù)測讀者的數(shù)據(jù)需求,采集和更新圖書館現(xiàn)有資源,提前將有用的信息推送給讀者,引導(dǎo)讀者的數(shù)據(jù)需求。圖書館還可以為讀者提供個性化服務(wù),根據(jù)每一位讀者的不同需要及時收集整合數(shù)據(jù),將讀者需要的數(shù)據(jù)靈活地推送給讀者。
3.3 培養(yǎng)高素質(zhì)的數(shù)據(jù)管理人才
大數(shù)據(jù)環(huán)境下,圖書館傳統(tǒng)的管理和工作模式都發(fā)生了本質(zhì)的變化,不斷增長的數(shù)據(jù)信息在給圖書館的服務(wù)管理帶來機遇的同時,也對圖書館員的業(yè)務(wù)素質(zhì)提出了更高的要求。圖書館員應(yīng)該改變工作方式,提高自身的專業(yè)素質(zhì),通過自學(xué)專業(yè)知識、對外交流進修、聽相關(guān)講座等方式,將自己培養(yǎng)成合格的數(shù)據(jù)管理人才。高素質(zhì)的數(shù)據(jù)管理人才不僅圖書館緊缺,受大數(shù)據(jù)影響,各行業(yè)都急需專業(yè)的高技術(shù)數(shù)據(jù)人才。所以圖書館員更要努力拓寬自己的知識面,盡快成為圖書館信息資源的組織者、傳播者、導(dǎo)航者、教育者,促進圖書館事業(yè)的蓬勃發(fā)展。
4 結(jié)束語
大數(shù)據(jù)已經(jīng)逐步深入到圖書館的各項工作中,各種大數(shù)據(jù)技術(shù)將不斷涌現(xiàn),圖書館將開啟數(shù)據(jù)服務(wù)的新時代。本文僅僅探討了大數(shù)據(jù)給圖書館帶來的影響和挑戰(zhàn)以及圖書館應(yīng)用大數(shù)據(jù)的策略建議,至于圖書館應(yīng)用大數(shù)據(jù)的實踐,仍需我們進一步努力。
參考文獻
[1]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(5):37-40.
〔編輯:王霞〕
Abstract: Big Data has affected all aspects of society, the library has a large amount of data, will inevitably be affected. Faced with the challenge of big data analysis of all aspects of library data storage capacity, the library had to improve their data processing and analysis capabilities, improve the professional quality of service data management capabilities and librarians.
Key words: big data; library; data services; management personnel