摘 要:隨著現(xiàn)代社會計算機網(wǎng)絡技術的飛速發(fā)展,成千上萬的計算機與移動設備在不停地生產(chǎn)出海量的信息,整個世界已經(jīng)逐步轉(zhuǎn)移到以數(shù)據(jù)為中心的范式——“大數(shù)據(jù)時代”。本文首先介紹了大數(shù)據(jù)的含義與特點,然后分析了大數(shù)據(jù)在圖書館服務中的重要性以及和圖書館之間的關系,探討了在大數(shù)據(jù)時代下,高職院校的圖書館如何發(fā)揮自己的優(yōu)勢,針對企業(yè)開展個性化服務。
關鍵詞:大數(shù)據(jù);圖書館;企業(yè);個性化服務
“大數(shù)據(jù)”的概念最早是由美國的麥肯錫公司提出的,麥肯錫公司早在2011年的發(fā)布的大數(shù)據(jù)報告中提出:數(shù)據(jù)已經(jīng)滲透到現(xiàn)代社會的各行各業(yè)中,逐漸演變成了最重要的生產(chǎn)要素,隨著科技的發(fā)展,大數(shù)據(jù)的發(fā)展也漸漸成為政府以及其它信息科技行業(yè)所關注的重要問題。在大數(shù)據(jù)時代下,如何充分發(fā)揮高職院校圖書館的服務職能,為企業(yè)及用戶提供個性化的服務,下面本文對此進行深入研究分析。
1 大數(shù)據(jù)的含義及特點
關于大數(shù)據(jù)的具體含義,迄今為止還未形成統(tǒng)一規(guī)范的定義,暫時可以將其理解為超越以往所有數(shù)據(jù)管理工具的巨大規(guī)模、很復雜的大型數(shù)據(jù)集合。根據(jù)美國IBM公司的相關人士研究分析,提出了大數(shù)據(jù)具有三個重要特點:種類多、速度快、容量大;同時業(yè)界的其它公司認為大數(shù)據(jù)具有四個重要特點:海量、多樣性與高速、易變性[1]。其含義主要包括以下特點:①數(shù)據(jù)量巨大,這主要是指數(shù)據(jù)規(guī)模。②數(shù)據(jù)種類多種多樣,能夠把數(shù)據(jù)系統(tǒng)分成結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)兩種。且隨著先進網(wǎng)絡技術的飛速發(fā)展,當前的數(shù)據(jù)類型發(fā)展成為多種多樣的文本格式,其中包括數(shù)不清的圖片、微博,網(wǎng)絡日志以及視頻等或者半結(jié)構(gòu)化、或者非結(jié)構(gòu)化化的數(shù)據(jù)。③大數(shù)據(jù)對數(shù)據(jù)處理的速度較快,在大數(shù)據(jù)體系中有大量的實時數(shù)據(jù),比如:社交網(wǎng)絡等這些信息數(shù)據(jù),都需要快速分析處理。④大數(shù)據(jù)的價值密度很低,這和數(shù)據(jù)總量大小是呈反比關系的[2]。在大數(shù)據(jù)這個龐大的數(shù)據(jù)體系中,一般會出現(xiàn)很多沒有用的信息,只有很少一部分信息只隱藏在大數(shù)據(jù)信息體系中的。例如:一個長約1小時的視頻監(jiān)控過程,可能有用的數(shù)據(jù)只是其中的1秒或者2秒。
2 圖書館和大數(shù)據(jù)的關系
網(wǎng)絡信息時代,社會各地高職院校的圖書館除了囊括大量數(shù)字資源以外,不斷增長的云計算、社交網(wǎng)絡等新興起的技術為高職院校圖書館數(shù)據(jù)的來源提供了更加廣泛的渠道。這促使圖書館的信息資源發(fā)展也邁入大數(shù)據(jù)時代。
2.1電子書刊及多媒體資源等為圖書館提供了大量數(shù)據(jù)
新時期,新興的信息技術的發(fā)展大大促進了圖書館數(shù)字資源的誕生,在新技術的大力推動下,出現(xiàn)了許多電子書刊、巨型數(shù)據(jù)庫以及音視頻資源等種類繁多的數(shù)字資源,這使得電子信息資源的數(shù)量遠遠超過了紙質(zhì)文本資源。據(jù)最新的調(diào)查結(jié)果表明:在現(xiàn)代社會,全球新創(chuàng)造出的信息數(shù)量每隔三年都要翻一倍,并且其中95%以上的信息都是以數(shù)據(jù)形式存在的[3]。與此同時,文獻出版方式也發(fā)生了翻天覆地的變化,數(shù)字出版開始越來越普遍,至2010年年底,我國電子書的總量已經(jīng)達到115多萬中,每年新增約18萬種,其中單獨出版的數(shù)字報已經(jīng)高達700多份以上,電子期刊上萬種,我國國家級別的圖書館文獻資源總量已經(jīng)接近470TB,這所有的資源都分布在不同的網(wǎng)絡系統(tǒng)中,分布的形態(tài)各不相同,其組織方式也大相徑庭,其中有傳統(tǒng)文獻資源的數(shù)字化,同時也有各種原生態(tài)的數(shù)字資源以及各種不同的虛擬多媒體資源等等,隨著這些電子資源的不斷積累,給高職院校的圖書館提供了豐富的數(shù)據(jù)資源[4],其中圖書館大數(shù)據(jù)架構(gòu)圖如下圖1所示。
2.2 移動圖書館、智能手機及高速網(wǎng)絡的普及,增加數(shù)據(jù)量
隨著電子網(wǎng)絡信息技術的發(fā)展,高速寬帶網(wǎng)絡慢慢普及,數(shù)字電視等現(xiàn)代先進的網(wǎng)絡業(yè)務迅速發(fā)展。根據(jù)最新數(shù)據(jù)統(tǒng)計,我國網(wǎng)民人數(shù)已經(jīng)超過5.21億,手機用戶已經(jīng)超過9億,互聯(lián)網(wǎng)的普及率達到39.5%,數(shù)字電視用戶已經(jīng)超過了一千萬用戶,這為數(shù)字圖書館提供了多條網(wǎng)絡平臺的信息輸送與服務途徑[5-6]。尤其是最近幾年以來,移動設備的快速普及,比如:智能手機的興起這為現(xiàn)代人們隨時隨地學習提供了很大便利,且他具有傳統(tǒng)移動設備所不能相比的優(yōu)勢,在某種程度上,大大了豐富了學習主體的體驗,也讓數(shù)據(jù)業(yè)務得到了飛速的發(fā)展。我國從2003年以來,社會各地的高職院校陸續(xù)出現(xiàn)了移動圖書館,并且隨后移動閱讀、移動搜索等很多種服務類型不斷地出現(xiàn),預計不久的將來,移動設備所創(chuàng)造的數(shù)據(jù)量將以更快的速度增長。
2.3 新興網(wǎng)絡技術的發(fā)展,為大數(shù)據(jù)提供多樣化的數(shù)據(jù)來源
隨著計算機技術越來越先進,云計算時代即將到來,這在某種程度上打破了傳統(tǒng)圖書館發(fā)展的局限性,云計算超強的數(shù)據(jù)分析處理能力,及時的動態(tài)信息資源整合、分配能力,簡單的IT結(jié)構(gòu)等,這都為大數(shù)據(jù)數(shù)據(jù)來源提供了必要條件。利用RFID技術,可確保圖書的自動借還、分揀,實時跟蹤導航圖書位置和信息等[7]。以微博、Facebook為代表的社交網(wǎng)絡由于體現(xiàn)了開放、共享以及個性化的特點而深受用戶的青睞。此外,人們經(jīng)過認真研究語義網(wǎng),促使信息發(fā)生新的革命,出現(xiàn)了新的知識技術。就在2009年,美國的康奈爾大學聯(lián)合多家科技網(wǎng)絡機構(gòu)成立了一個以Facebook風格為主的專業(yè)化社交網(wǎng)絡平臺——VIVO網(wǎng)絡,能夠開發(fā)數(shù)據(jù)語義Web。并且各個國家的科學家們可以利用這個網(wǎng)絡平臺看到有關研究人員正是進行的科學研究活動,然后可以在最短的時間內(nèi)和同行取得聯(lián)系,獲得新發(fā)現(xiàn)或者創(chuàng)新[8]。由上述可知,在大數(shù)據(jù)時代下,高職院校的圖書館具有大數(shù)據(jù)的特點。并且科技創(chuàng)新以及科學研究等將會對數(shù)據(jù)管理利用的程度越來越高,需要對大數(shù)據(jù)進行深入的分析挖掘。
3 大數(shù)據(jù)時代下圖書館對企業(yè)提供個性化服務模式研究
在大數(shù)據(jù)時代下,高職院校的圖書館已經(jīng)從傳統(tǒng)物理意義中的圖書館涵義轉(zhuǎn)化成數(shù)據(jù)圖書館。并且圖書館的服務模式、途徑等都發(fā)生了一系列深刻的變化,圖書館開始轉(zhuǎn)變服務理念,開始以大數(shù)據(jù)為基礎,從起初的數(shù)據(jù)匯集直至信息加工、知識升級以及提供針對性的智慧服務等各個方面。如下圖2所示。
3.1 依據(jù)數(shù)據(jù)整合的一體化信息資源服務
在即將到來的大數(shù)據(jù)時代,社會各行各業(yè)產(chǎn)生了巨大的數(shù)據(jù)資源量。從目前來講,一所高職院校圖書館所能收集的數(shù)據(jù)資源包括很多種,既有各種不同的文獻資源、學術交流成果、以及社交網(wǎng)絡等各種不同的豐富的網(wǎng)絡資源。并且所有的數(shù)據(jù)資源都是來自社會不同機構(gòu)組建的新型數(shù)據(jù)知識庫或者是個人的數(shù)據(jù)信息。從整體來看,高職院校的圖書館是可以利用自身擁有海量的數(shù)據(jù)信息優(yōu)勢,首先通過定位,連接各種不同種類的數(shù)據(jù)源,完成數(shù)據(jù)的采集、輸送與匯聚。同時還可以鼓勵佛山市廣大中小型企業(yè)以及用戶對所存取的各種數(shù)據(jù)資源實現(xiàn)共享,讓自身企業(yè)不但是資源的學習利用者,同時也是資源的發(fā)布者、共享者[9]。而數(shù)據(jù)資源原本就具有數(shù)量巨大、類型繁多、以及變化速度很快的特點,因此,必須建立統(tǒng)一規(guī)范的數(shù)據(jù)標準,才能不斷滿足日新月異的異構(gòu)系統(tǒng)對高效運行的需求。把資源與資源之間進行無縫對接,加工元數(shù)據(jù),實現(xiàn)數(shù)據(jù)的共享、存儲備份等相關數(shù)據(jù)管理服務。在種類繁多的數(shù)據(jù)體系中,如果將不同結(jié)構(gòu)分布的不同數(shù)據(jù)資源進行統(tǒng)一的集合,形成中心知識庫,通過索引的方式,就可以為企業(yè)提供很高效實用的信息資源服務,進一步建立一體化信息資源服務平臺。
3.2 依據(jù)數(shù)據(jù)分析提供新知識服務
現(xiàn)代社會,高職院校的圖書館是一個公共程度較高的知識服務系統(tǒng),圖書館相關研究人員可以對集合在一起的數(shù)據(jù)進行系統(tǒng)的加工處理,然后建模以提高數(shù)據(jù)價值密度。在充分研究數(shù)據(jù)知識的基礎上,研究分析各種不同門類的學科知識,把數(shù)據(jù)的增值服務作為基礎,把服務對象面向整個社會,針對他們對各門學科知識的深入分析,為企業(yè)提供相關的知識服務 [10]。例如:對不同學科進行分析分類,將不同的學科用戶在瀏覽下載各種信息數(shù)據(jù)進行科學分類:按照摘要、主旨等特點,添加進與之相匹配的時間維度,分析出某一門學科在不同時間段內(nèi)用戶比較感興趣的主題。再通過挖掘、檢驗數(shù)據(jù),進行回歸聚類分析等分析研究學科熱點,以更好地為佛山市中小企業(yè)的發(fā)展提供知識服務。同時,可以建立圖書借閱數(shù)據(jù)倉庫維度模型,然后充分利用大數(shù)據(jù)分析之間的關系,找到期刊、文章之間的各相關知識體系網(wǎng)絡,對大數(shù)據(jù)的學科發(fā)展前景進行科學預測,有序處理紛繁復雜的大數(shù)據(jù),不斷提升圖書館的服務水平。
3.3 依據(jù)數(shù)據(jù)應用為用戶提供可視化服務
大數(shù)據(jù)體系中囊括了海量的信息,其中也不乏重要信息,現(xiàn)代人們都希望通過深入分析,從海量的數(shù)據(jù)資源中創(chuàng)新知識。其中信息可視化作為一種先進的技術手段,在分析結(jié)構(gòu)復雜的大型圖書館數(shù)據(jù)信息時具有很大的優(yōu)勢,可以為各種中小型企業(yè)提供便捷的知識服務。比如:通過分析檢索過程與結(jié)果之間的聯(lián)系,實現(xiàn)主題可視化,進一步會實現(xiàn)數(shù)據(jù)庫分布的可視化等,同時也能把信息可視化技術和現(xiàn)代先進的計量方法相結(jié)合,解釋不通知識模塊之間的聯(lián)系,把握某一方知識領域的未來發(fā)展方向,以方便企業(yè)更容易獲取所需信息[11]。知識和之間存在不同的結(jié)構(gòu)聯(lián)系,并且在一些不易看得見的抽象數(shù)據(jù)之間的語義關系完全能夠以一種可視化的方式出現(xiàn)在企業(yè)的實際運營中,讓企業(yè)發(fā)現(xiàn)信息資源的潛在利用價值,以更好利用信息。信息可視化是一種把信息有效組織分析的新型技術,能夠為大數(shù)據(jù)提供新型服務方式。
3.4 依據(jù)維基系統(tǒng)構(gòu)建專題知識庫
高職院校的圖書館作為一個知識傳播的中心地區(qū),在促進知識共享、提高高校競爭力方面發(fā)揮著不可替代的作用。
在促進知識共享的過程中,人們習慣于轉(zhuǎn)移顯性知識,忽略轉(zhuǎn)移隱性知識,而隱性知識具有不便言傳的特性,這使得隱性知識的共享比較困難,但是進行知識共享單單停留在顯性知識層面是遠遠不夠的,必須同時推動隱性知識的轉(zhuǎn)化,才能實現(xiàn)有意義的知識共享。通過維基技術構(gòu)建專題知識庫,是圖書館促使個人隱性知識傳播共享的重要手段。不管是圖書館用戶還是圖書館內(nèi)的工作人員在日常的學習過程中都會慢慢積累大量的個人化隱性知識,主要包括社會經(jīng)驗類型的知識、個人認識行為以及個人日常利用圖書館檢索資料的經(jīng)驗、心得等等。高職院校圖書館通過維基的自由組織性能可以讓每一位用戶擁有有的各種隱性知識或者資料進行知識整序,進而擁有更多有價值的知識[12]。通過維基技術成立的個人知識庫能夠為圖書館資源的組織成員或者企業(yè)相關使用人員提供良好的學習平臺,進一步完成個人對知識的高效利用。同時能夠為個人的自我提升以及職業(yè)發(fā)展提供更加清晰的脈絡,幫助每個人規(guī)劃出科學的職業(yè)發(fā)展方向。加入圖書館維基組織成員的個人知識庫通過合作共享形成了邏輯嚴密的圖書館知識庫,就會進一步形成濃厚的知識共享文化氛圍,讓維基組織中的每位參與人員在知識共享中不斷提高自己。
4 結(jié)束語
總而言之,知識經(jīng)濟時代,數(shù)據(jù)信息的快速增長促使“大數(shù)據(jù)”概念的產(chǎn)生,并且開始蔓延到整個IT行業(yè)。目前,大數(shù)據(jù)已經(jīng)開始滲透到圖書館情報工作中,據(jù)此預測未來,大數(shù)據(jù)技術將會不斷出現(xiàn),對高職院校圖書館知識服務的拓展、延伸產(chǎn)生重大的影響。但圖書館的大數(shù)據(jù)技術以及服務是一項較復雜的系統(tǒng)工程,關涉到數(shù)據(jù)管理的水平、數(shù)據(jù)服務創(chuàng)新等,這需要和圖書館相關的各界人士共同努力,才能不斷提高高職院校圖書館的服務質(zhì)量,進而提高為企業(yè)提供個性化服務的能力。
參考文獻
[1]韓翠峰.大數(shù)據(jù)時代圖書館的服務創(chuàng)新與發(fā)展[J].圖書館. 2013,2(01):13-14.
[2]張文彥,武瑞原,于潔等.大數(shù)據(jù)時代的圖書館初探[J].圖書與情報. 2012,5(06):325-326.
[3]樊偉紅,李晨暉.圖書館需要怎樣的“大數(shù)據(jù)”[J]. 圖書館雜志. 2012,5(11):589-591.
[4]Geoffrey Little.MANAGING TECHNOLOGY.Managing the Data De-luge. The Journal ofAcademicLibrarianship .2012.
[5]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報. 2012,5(05):368-369.
[6]楊海燕.大數(shù)據(jù)時代的圖書館服務淺析[J].圖書與情報. 2012,8(04):445-446.
[7]Walton Graham.Data Curation and The Academic Li-brary. New Review of Academic Librarianship . 2010
[8]Corral,S.Roles and responsibilities:Libraries,librariansand data. Managing Research Data . 2012.
[9]袁紅梅.用戶信息需求分析與圖書館知識服務[J].內(nèi)蒙古科技與經(jīng)濟. 2006,5(18):633-634.
[10]P.Bryan Heidorn.The Emerging Role of Libraries in Cu-ration and E-science. Journal of Library Administra-tion . 2011
[11]陳雅,譚華軍.圖書館個性化服務中的Web日志分析技術研究[J].圖書館雜志. 2011,5(07):325-326.
[12]黃曉露,吳莉.基于WAP的紙質(zhì)圖書個性化服務的研究[J].出版廣角. 2011,2(05):225.
作者簡介
劉雪飛(1972-)山東濱州人,山東省惠民縣圖書館館員。