賈 輝
(青島市圖書館,山東 青島 266034)
國務(wù)院總理李克強(qiáng)在全國人大十三屆一次會議上做政府工作報告,三次提到大數(shù)據(jù)。大數(shù)據(jù)的發(fā)展對于社會的政治、經(jīng)濟(jì)、文化都將產(chǎn)生巨大的變革,也必將對圖書館的管理和服務(wù)產(chǎn)生深刻影響。隨著信息技術(shù)日新月異的發(fā)展,尤其是移動互聯(lián)網(wǎng)的廣泛覆蓋和智能手機(jī)的普及,公眾的閱讀習(xí)慣正在發(fā)生翻天覆地的變化,越來越多的人不需要到圖書館就可以利用碎片化的時間獲得所需的閱讀信息。傳統(tǒng)圖書館的服務(wù)模式,面臨著用戶大量流失的挑戰(zhàn)和困難。因此,在信息化的大環(huán)境下,如何利用新的技術(shù),發(fā)揮用戶的主體作用,為公眾創(chuàng)造更為便利的讀書環(huán)境,真正落實(shí)“讀者第一,服務(wù)至上”這一宗旨,是新時期圖書館建設(shè)面臨的一項(xiàng)重要任務(wù)。而大數(shù)據(jù)技術(shù)的發(fā)展和成熟,則為實(shí)現(xiàn)圖書服務(wù)的多元化、智能化、精準(zhǔn)化,提供了有效的技術(shù)支撐手段。
大數(shù)據(jù)技術(shù)波及廣泛、影響深遠(yuǎn),遠(yuǎn)非一般的信息技術(shù)可比。自大數(shù)據(jù)誕生以來,不同的研究機(jī)構(gòu)給出了各種不同的定義。麥肯錫全球研究所是研究大數(shù)據(jù)的先驅(qū),在其報告《Big data: The nextfrontier for innovation, competition,and productivity》中對大數(shù)據(jù)定義為:大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫工具獲取、存儲、管理和分析能力的數(shù)據(jù)集。國際數(shù)據(jù)公司從大數(shù)據(jù)的四個特征來定義,即海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)和動態(tài)的數(shù)據(jù)體系(Velocity)、多樣的數(shù)據(jù)類型(Variety)、巨大的數(shù)據(jù)價值(Value)。中國計算機(jī)學(xué)會大數(shù)據(jù)專委會委員趙國棟則從大數(shù)據(jù)的功能上給出了自己的定義:大數(shù)據(jù)是在多樣的或者大量數(shù)據(jù)中,迅速獲取信息的能力。強(qiáng)調(diào)大數(shù)據(jù)的核心能力,是發(fā)現(xiàn)規(guī)律和預(yù)測未來。即利用大數(shù)據(jù)技術(shù),能夠廣泛采集各種各樣的數(shù)據(jù)類型,進(jìn)行統(tǒng)計分析,從而預(yù)測未來。
伴隨著物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、云計算的快速發(fā)展,全球數(shù)據(jù)總量每年以40%以上的速度在飛速增長,大數(shù)據(jù)正在從道德、文化、制度、產(chǎn)業(yè)和生活的各個方面對現(xiàn)實(shí)社會進(jìn)行重構(gòu)。大數(shù)據(jù)的發(fā)展和應(yīng)用已經(jīng)引起國際社會的高度重視,世界各國都在加快推進(jìn)大數(shù)據(jù)戰(zhàn)略布局。2015年,國務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(國發(fā)[2015]50號),將大數(shù)據(jù)發(fā)展提升到了國家戰(zhàn)略層面。因此,借助時代發(fā)展之勢,科學(xué)合理地運(yùn)用大數(shù)據(jù)技術(shù),構(gòu)建圖書、讀者、從業(yè)人員等多層面的數(shù)據(jù)集合,重構(gòu)圖書館服務(wù)與管理模式,增強(qiáng)公共圖書館在信息時代的競爭力,是大勢之所趨。
基于大數(shù)據(jù)技術(shù),公共圖書館可以從服務(wù)和管理兩個層面實(shí)現(xiàn)質(zhì)的飛躍。
有別于靜態(tài)的、被動的,讀者自己去尋找書籍和活動的傳統(tǒng)服務(wù)模式,大數(shù)據(jù)應(yīng)用是動態(tài)的、主動的,是通過數(shù)據(jù)產(chǎn)品的產(chǎn)生自動迎合讀者的需求。即通過對讀者的行為與特征進(jìn)行分析,繼而采取相應(yīng)的對策,為其提供優(yōu)質(zhì)的圖書和活動資源。
因此,無論讀者是在現(xiàn)實(shí)場景中還是在網(wǎng)上虛擬場景中,利用信息化平臺以及物聯(lián)網(wǎng)技術(shù),可以對讀者每一次閱讀行為和活動軌跡進(jìn)行詳細(xì)的記錄,再通過與讀者間的不斷互動反饋,積累獲得讀者的閱讀過程、閱讀背景、閱讀習(xí)慣、閱讀風(fēng)格,乃至讀者的個人信息等大量的多維度數(shù)據(jù),結(jié)合館藏大數(shù)據(jù),利用數(shù)據(jù)挖掘、學(xué)習(xí)分析等數(shù)據(jù)模型,即可從大數(shù)據(jù)中提取有價值的信息,發(fā)現(xiàn)規(guī)律特點(diǎn)、預(yù)測未來需求,形成每個讀者的“微數(shù)據(jù)”,并隨之提出個性化服務(wù)策略。這樣,就如同在淘寶購物一樣,當(dāng)讀者進(jìn)入網(wǎng)上或?qū)嶓w圖書館時,系統(tǒng)會以此為依據(jù)自動精準(zhǔn)推送其所喜愛的館藏和對應(yīng)的活動,讓讀者在第一時間就能夠收到針對他定制的閱讀和活動大餐,使豐富的圖書館資源得以有的放矢的利用。
無論是對紙質(zhì)圖書還是電子資源,公共圖書館的管理和工作流程基本可以概括為:采購、分類、編目、上架、使用、剔舊等幾個階段。各個階段的工作既需要為大數(shù)據(jù)環(huán)境下的讀者服務(wù)提供基礎(chǔ)支撐,又可以利用大數(shù)據(jù)技術(shù)進(jìn)行其自身業(yè)務(wù)的改造和完善。
采購環(huán)節(jié)作為圖書館資源建設(shè)最為重要的部分,需要充分考慮讀者的需求。但傳統(tǒng)的采購模式,讀者很難參與其中,且受采購人員的能力制約,很容易導(dǎo)致采購與需求的脫鉤。即使現(xiàn)在部分圖書館采取了一些讓讀者選擇、圖書館買單等服務(wù)模式,但在規(guī)模和范圍上很難擴(kuò)大,也無法避免因讀者個人喜好造成的采購資源不均衡等問題。而大數(shù)據(jù)技術(shù)則為圖書采購提供了極為科學(xué)有效的手段。通過對圖書館藏數(shù)據(jù)、流通數(shù)據(jù)和讀者的需求偏好等數(shù)據(jù)進(jìn)行大數(shù)據(jù)綜合分析和挖掘,可以有效地預(yù)測和推薦所需的書目、數(shù)量,形成適用于本圖書館的個性化采購書單和復(fù)本數(shù)目,特別是其中的一些冷門的、特殊的文獻(xiàn)類型,采購人員很難進(jìn)行把握,交由數(shù)據(jù)說話,既能夠提高選書的質(zhì)量和精度,保證了圖書入館后的使用效率,還能夠降低采購人員工作強(qiáng)度,提高工作績效,真正實(shí)現(xiàn)以讀者為中心的采購理念。
分類和編目環(huán)節(jié)是大數(shù)據(jù)應(yīng)用的基礎(chǔ)。大數(shù)據(jù)環(huán)境下,編目產(chǎn)品不僅要提供傳統(tǒng)的信息資源的書目檢索功能,還要滿足資源導(dǎo)航、知識組織、對象數(shù)據(jù)管理等多方面的需求。因此,面對海量且多類型的大數(shù)據(jù)編目工作,在聯(lián)機(jī)聯(lián)合編目基礎(chǔ)上,更多的是要借助于新的技術(shù)手段,通過與圖書流通數(shù)據(jù)、讀者行為數(shù)據(jù)的不斷互動,反復(fù)校對和回溯,實(shí)現(xiàn)對編目數(shù)據(jù)的規(guī)范和整合,建立起編目數(shù)據(jù)與流通數(shù)據(jù)、讀者數(shù)據(jù)間有效的關(guān)聯(lián)關(guān)系,為給讀者提供精準(zhǔn)化服務(wù)奠定基石。
而上架、使用、剔舊則是直接面向讀者服務(wù)的圖書管理階段。利用大數(shù)據(jù)分析,可以獲得各類資源面向的群體、受歡迎程度、上架時間等系列統(tǒng)計性數(shù)據(jù),進(jìn)一步通過調(diào)整書架的擺放、布局以及資源的組織、調(diào)配等各個細(xì)微環(huán)節(jié),為讀者打造貼心服務(wù),實(shí)現(xiàn)精細(xì)化管理。
多年來,通過數(shù)字圖書館工程,我國公共圖書館的信息化建設(shè)取得了一定的成就。但大數(shù)據(jù)應(yīng)用有別于傳統(tǒng)信息化系統(tǒng)的應(yīng)用。公共圖書館要實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用落地,仍然面臨著基礎(chǔ)技術(shù)支撐、數(shù)據(jù)庫建設(shè)、人才配備等各個方面的挑戰(zhàn),因此,亟待建立起適應(yīng)于大數(shù)據(jù)環(huán)境下的圖書館管理與服務(wù)的體制機(jī)制。
從大數(shù)據(jù)的特征可以看到,大數(shù)據(jù)應(yīng)用面對的是數(shù)據(jù)量巨大、多源異構(gòu)的數(shù)據(jù)集,其存儲、處理、分析的方式都有別于傳統(tǒng)的技術(shù)架構(gòu)。在數(shù)據(jù)管理方面涉及分布式存儲與計算、內(nèi)存數(shù)據(jù)庫技術(shù)、列式數(shù)據(jù)庫技術(shù)、云數(shù)據(jù)庫、非關(guān)系型的數(shù)據(jù)庫等技術(shù);在數(shù)據(jù)處理方面涉及流處理和批處理;在數(shù)據(jù)分析方面涉及關(guān)聯(lián)分析、聚類分析、分類、預(yù)測、時序模式和偏差分析等。傳統(tǒng)的圖書館IT技術(shù)架構(gòu)存儲和處理大數(shù)據(jù)成本高昂,不能適應(yīng)大數(shù)據(jù)應(yīng)用。因此,需要加強(qiáng)對基礎(chǔ)技術(shù)平臺的頂層設(shè)計,可以采用服務(wù)外包的模式,通過成熟的商業(yè)化運(yùn)作,搭建圖書管理與服務(wù)云平臺,構(gòu)建基于分布式技術(shù)的圖書大數(shù)據(jù)存儲與處理分析平臺,為大數(shù)據(jù)應(yīng)用提供有效技術(shù)支撐。
數(shù)據(jù)是應(yīng)用的基礎(chǔ)。只有海量數(shù)據(jù)的形成,才可能從其甄別與篩選有價值的數(shù)據(jù),進(jìn)行科學(xué)系統(tǒng)的挖掘,實(shí)現(xiàn)真正意義上的大數(shù)據(jù)應(yīng)用。從公共圖書館的歷史積累和大數(shù)據(jù)的應(yīng)用場景看,公共圖書館涉及圖書資源的數(shù)字化與用戶資源的數(shù)字化兩個方面的數(shù)據(jù)建設(shè)。其中,圖書資源的數(shù)字化已經(jīng)取得了一定成績,但用戶資源的采集和處理仍然相當(dāng)欠缺,讀者行為特征與分析數(shù)據(jù)庫尚未建立,現(xiàn)有數(shù)據(jù)庫間的數(shù)據(jù)缺乏有效的關(guān)聯(lián)。因此,需要借助互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等手段,建立和完善與讀者的互動反饋平臺,廣泛、實(shí)時采集讀者的行為數(shù)據(jù)和特征數(shù)據(jù),將圖書、讀者、應(yīng)用場景由點(diǎn)到線、由線到面,建立起符合大數(shù)據(jù)應(yīng)用的數(shù)據(jù)組織關(guān)系,從而窺探閱讀活動的全貌和本質(zhì),并對未來的服務(wù)需求進(jìn)行預(yù)測。
數(shù)據(jù)開放是互聯(lián)網(wǎng)發(fā)展的新趨勢,是大數(shù)據(jù)應(yīng)用的重要領(lǐng)域,也是公共圖書館利用自身資源實(shí)現(xiàn)高層次數(shù)據(jù)服務(wù)的一項(xiàng)重要創(chuàng)新內(nèi)容。目前,上海市圖書館作為全國首個推出關(guān)聯(lián)數(shù)據(jù)開放服務(wù)的公共圖書館,又率先開展了一項(xiàng)重要的眾創(chuàng)活動——“上海圖書館2016開放數(shù)據(jù)應(yīng)用開發(fā)競賽”,通過將館藏數(shù)據(jù)開放出來,讓讀者在這些平臺上創(chuàng)造出更大的自己的價值。可以說,公共圖書館在數(shù)據(jù)開放方面具有得天獨(dú)厚的優(yōu)勢,應(yīng)在確保數(shù)據(jù)安全可控的條件下,以開放為原則,以館藏資源、用戶資源等圖書大數(shù)據(jù)為基礎(chǔ),以信息資源生產(chǎn)者、采集者、處理者、利用者為鏈條,突破本館本系統(tǒng)的限制,實(shí)現(xiàn)圖書數(shù)據(jù)與外部數(shù)據(jù)互聯(lián)互通,擴(kuò)充共享對象,縮小公共圖書館與讀者的信息不對稱,實(shí)現(xiàn)信息資源更高效的發(fā)現(xiàn)和利用,以高層次的需求驅(qū)動促進(jìn)圖書館的精準(zhǔn)化服務(wù)。
大數(shù)據(jù)時代,對我們圖書館人提出了更高的要求。首先要轉(zhuǎn)變傳統(tǒng)的經(jīng)驗(yàn)思維和習(xí)慣思維,樹立大數(shù)據(jù)觀,用大數(shù)據(jù)的思維去謀劃發(fā)展、推動工作;其二是切實(shí)掌握大數(shù)據(jù)基本知識和技能,用大數(shù)據(jù)創(chuàng)新工作方式方法,讓讀者真切地參與到圖書館工作的各個方面,推動圖書館治理現(xiàn)代化。逐步打造一支既懂業(yè)務(wù)又懂技術(shù)的復(fù)合型人才隊(duì)伍。
正如上海圖書館館長吳建中在他的著作《轉(zhuǎn)型與超越:無所不在的圖書館》中所寫的:圖書館能力大小不在于其規(guī)模,而在于其智慧。在讀者需求日趨多元化、豐富化的今天,圖書館要想在競爭中保有一席之地,必須適應(yīng)新的時代要求,通過技術(shù)手段實(shí)現(xiàn)功能再造與服務(wù)創(chuàng)新,以引領(lǐng)的高度,成為傳播教育、文化和信息的主陣地。