王潔
摘 要:本文對大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)進行了探討,文章從闡述大數(shù)據(jù)的概念入手,進一步分析了大數(shù)據(jù)對圖書館的有利影響、大數(shù)據(jù)對圖書館造成的挑戰(zhàn),最后提出了大數(shù)據(jù)時代圖書館建設(shè)對策。
關(guān)鍵詞:大數(shù)據(jù);圖書館;概念;有利影響;建設(shè)對策
大數(shù)據(jù)的出現(xiàn),對圖書館事業(yè)發(fā)展起到重要作用,它提高了效率、降低了圖書館管理成本,優(yōu)化了讀者閱讀體驗,推動了數(shù)字圖書館的建立;但同時,大數(shù)據(jù)的復雜性、不確定性、先進性也對圖書館的運營和管理造成了巨大挑戰(zhàn),對此,相關(guān)單位要抓住機遇,迎接挑戰(zhàn)。
1 大數(shù)據(jù)的具體定義
2011年5月,麥肯錫咨詢公司(Mckinsey and Company)發(fā)布報告,首次提出了“大數(shù)據(jù)”的概念——“大數(shù)據(jù)”是指其大小超出了典型數(shù)據(jù)庫軟件的采集、儲存、管理和分析等能力的數(shù)據(jù)集。該定義的重點在于——其一,符合大數(shù)據(jù)標準的數(shù)據(jù)集大小是變化的;其二,不同部門符合大數(shù)據(jù)標準的數(shù)據(jù)集大小存在差別。
2 大數(shù)據(jù)的特征
在信息技術(shù)快速更新?lián)Q代的今天,數(shù)據(jù)信息的采集、存儲和利用都表現(xiàn)出火山式噴發(fā)的特征。大數(shù)據(jù)的特點最初被歸結(jié)為“3V”——即Variety、Velocity、Volume;后來在此基礎(chǔ)上增加“Value”概念,至今則進一步提出“1C”(Complexity)使其完善至“4V+1C”。這是指大數(shù)據(jù)具有五個方面的特征,其一是類型多樣,涵蓋結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化等多種類型,且其各自對應的運行和分析方法是互不相同的;其二,容量大,隨著互聯(lián)網(wǎng)在群眾生活的覆蓋面越來越廣,所衍生的數(shù)據(jù)也越來越多,導致各種復雜信息成倍增長,形成海量信息數(shù)據(jù)庫;其三,速度快,由于社會的運轉(zhuǎn)速度不斷加快,對數(shù)據(jù)分析和處理的速度和效率也提出了更為嚴格的要求;其四,價值高,總體來說,某一條數(shù)據(jù)或許不會有太大的價值,但信息庫的價值卻是不可估量的,而對其中的各種數(shù)據(jù)進行有效整合與利用,還能生成更多實用信息;其五,復雜性,為了從大量數(shù)據(jù)中獲取有價值的部分,就需要經(jīng)過一個相對復雜的分析和提取過程,具有一定的難度。
3 大數(shù)據(jù)對圖書館的有利影響
1)提高效率,降低圖書館管理成本。在大數(shù)據(jù)時代,在處理海量數(shù)據(jù)資料時,可以借助計算機對數(shù)據(jù)的高效處理功能完成工作,在處理圖書資料時同樣如此,目前各個工作領(lǐng)域都離不開各種數(shù)據(jù)信息等內(nèi)容,若是單純利用紙質(zhì)檔案的形式進行管理和分析,不僅無法完整可靠地保存好檔案。還會因為需要大量紙張記錄而導致成本增加。以計算機這種先進的設(shè)備實現(xiàn)檔案存儲和整合,避免了大量的紙張消耗和大面積的存放空間,也減少了人力投入,具有實惠的特征。
2)優(yōu)化讀者閱讀體驗。因為大數(shù)據(jù)的支持,圖書館得以以一種全新的面貌呈現(xiàn)在讀者面前,讀者進入圖書館后,不再需要借助引導標識、建筑內(nèi)部構(gòu)造地圖和咨詢員答疑等導航方式,而是依靠百度地圖等所建成的圖書館導航體系,在該體系內(nèi)文本以二維、三維的模式歸整為導航信息;讀者還可以利用計算機快速找到目標圖書,享受高度精確的定位服務,或者借助手機、掌上電腦等掃描書架,得到多種書籍的影像資料。
3)推動數(shù)字圖書館的建立。在大數(shù)據(jù)時代,我國的很多地區(qū)都陸陸續(xù)續(xù)地建成了數(shù)字圖書館,在該過程中,高校圖書館的文獻資料得以用一種全新的形式進行承載和傳遞,比如傳統(tǒng)的紙質(zhì)材料得以用諸如光盤、硬盤、U盤的一系列電子媒介做載體,這在很大程度上擴展了存儲的容量和存取效率。而且,目前的很多圖書館都開展了館藏文獻資料數(shù)字化處理,這也大大提升了資料數(shù)據(jù)的處理速度和便捷度。
4 大數(shù)據(jù)對圖書館造成的挑戰(zhàn)
1)大數(shù)據(jù)復雜性所造成的挑戰(zhàn)。在大數(shù)據(jù)的背景下,因為數(shù)據(jù)具有海量和復雜性特征,將大數(shù)據(jù)技術(shù)運用到圖書館領(lǐng)域,圖書館的運營管理難度將隨之增大。首先,就數(shù)據(jù)形式看,現(xiàn)代社會微博、微信等社交媒體的廣泛運用,使得信息數(shù)據(jù)以短文本形式呈現(xiàn),而這種文本形式的控制是極為困難的。而且,在數(shù)據(jù)結(jié)構(gòu)方面,因為社交媒體、移動終端和傳感器等技術(shù)和設(shè)備的利用,導致非結(jié)構(gòu)化的數(shù)據(jù)在日常生活中占據(jù)越來越重要的地位,而這種數(shù)據(jù)結(jié)構(gòu)的組織相對散亂,且含有許多無價值信息內(nèi)容,這會對數(shù)據(jù)的查詢、儲存、提取造成干擾。此外,因為數(shù)據(jù)模式具有一定的復雜性,就要求圖書館的管理人員在日常工作中注意數(shù)據(jù)的彼此作用,把握數(shù)據(jù)的內(nèi)在聯(lián)系,使信息處于有序狀態(tài)。
2)大數(shù)據(jù)的不確定性所造成的挑戰(zhàn)。由于數(shù)據(jù)具有明顯的不確定特征,就使得網(wǎng)路數(shù)據(jù)無法迅速建成固定掛的模型,無法準確分析出其蘊含的規(guī)律,最終無法對數(shù)據(jù)價值進行準確判斷和有效利用。數(shù)據(jù)的不確定性首先表現(xiàn)在原數(shù)據(jù)方面,因為數(shù)據(jù)的分析處理不到位,造成后期網(wǎng)絡數(shù)據(jù)在維度、尺度等層面都表現(xiàn)出不準確性;其次,數(shù)據(jù)在被處理分析的環(huán)節(jié)必須運用非常規(guī)方法,因此工作人員必須構(gòu)想出科學的建模方式,并且在模型的表達和復雜程度間達到一種平衡狀態(tài);而在數(shù)據(jù)建模的整個階段,工作人員必須對模型的相關(guān)參數(shù)加以研究,而在后期的學習階段,通常會采用最接近最優(yōu)解的近似值,用不確定的方法確定一個較為精準的解。而結(jié)合實際看,這種傳統(tǒng)的、近似的、不確定性的方法已經(jīng)難以適應新時代的要求。
3)大數(shù)據(jù)的先進性對管理人員造成挑戰(zhàn)。因為傳統(tǒng)的管理觀念及方式遺留的問題,現(xiàn)在許多圖書館內(nèi)部管理人員在處理數(shù)據(jù)時,不能充分利用大數(shù)據(jù)技術(shù);加上大數(shù)據(jù)本身是一種新興技術(shù),具有一定的專業(yè)性和操作難度,部分不能跟上信息時代的步伐的管理者,會面臨挑戰(zhàn),導致管理工作長期舉步不前。而在大數(shù)據(jù)的形勢下,需要記錄的數(shù)據(jù)、保存的檔案數(shù)目增加,管理工作在客觀上會存在任務繁重、工作量大的問題,單純采取舊的人力操作模式,無疑會面臨巨大的工作壓力。
5 大數(shù)據(jù)時代圖書館建設(shè)對策分析
1)建立超大型倉儲數(shù)據(jù)庫。在傳統(tǒng)的倉儲模式中,采取的是將數(shù)據(jù)抽取到數(shù)字倉庫后對信息進行存儲和管理、隨后對信息進行搜索、提取、分析和利用的方法。而在新的時代背景下,圖書館的數(shù)據(jù)路倉儲更多的包含有大量非結(jié)構(gòu)化數(shù)據(jù),還按照傳統(tǒng)的思路和倉儲方式,無疑會拉低數(shù)據(jù)利用質(zhì)量。所以,在圖書館運營管理中,需要考慮到用戶的實際需求,打造符合時代發(fā)展潮流的大數(shù)據(jù)倉儲,對數(shù)據(jù)資源進行有效利用。
2)構(gòu)建復合型人才隊伍。在圖書館管理工作中,人才是最核心的要素,是確保管理效果和效率的關(guān)鍵,所以單位需要聘請專業(yè)人才專門負責信息技術(shù)操作、綜合管理等業(yè)務內(nèi)容。在日常中,要對目前的工作團隊進行適當?shù)哪芰ε嘤?,設(shè)置考核培訓制度,通過合理的獎懲措施來鼓勵員工積極學習、對工作負責。同時,有組織地開展圖書館運營管理、信息技術(shù)操作的專業(yè)培訓活動,活動應結(jié)合圖書館工作從原有的圖書文獻建設(shè)功能向數(shù)字資源建設(shè)發(fā)展的現(xiàn)實情況,幫助工作人員樹立新的意識,迅速轉(zhuǎn)變角色,掌握新的工作技能。
6 結(jié)語
綜上所述,加強對大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)的探討,意義重大。相關(guān)工作人員需要明確大數(shù)據(jù)的具體定義及特征;同時把握大數(shù)據(jù)對圖書館的有利影響及其對圖書館造成的挑戰(zhàn);在此基礎(chǔ)上,對大數(shù)據(jù)時代圖書館建設(shè)對策展開分析,建立超大型倉儲數(shù)據(jù)庫,構(gòu)建復合型人才隊伍。
參考文獻
[1]馬建玲,祝忠明,王楠,楊敏.美國高校圖書館參與研究數(shù)據(jù)管理服務研究[J].圖書情報工作,2012(21).
[2]張曉林,李麟,劉細文,曾燕.開放獲取學術(shù)信息資源:逼近“主流化”轉(zhuǎn)折點[J].圖書情報工作,2012(09).
[3]王學勤,Amy Stout,Howard Silver.建立數(shù)據(jù)驅(qū)動的e-Science圖書館服務:機遇和挑戰(zhàn)[J].圖書情報工作,2011(13).