羅佩玲
摘 要:圖書館數(shù)據(jù)服務(wù)工作具有重要的意義,隨著大數(shù)據(jù)技術(shù)的發(fā)展,圖書館數(shù)據(jù)服務(wù)工作出現(xiàn)了許多變化,面對這些變化,圖書館工作人員需要思索圖書館數(shù)據(jù)服務(wù)工作創(chuàng)新發(fā)展的路徑。以大數(shù)據(jù)為切入口,首先界定大數(shù)據(jù)和圖書館數(shù)據(jù)服務(wù)的概念,然后分析圖書館數(shù)據(jù)服務(wù)的意義以及大數(shù)據(jù)對圖書館數(shù)據(jù)服務(wù)的影響,最后重點分析在大數(shù)據(jù)環(huán)境下圖書館數(shù)據(jù)服務(wù)創(chuàng)新發(fā)展的路徑。
關(guān)鍵詞:大數(shù)據(jù);圖書館;數(shù)據(jù)服務(wù)
中圖分類號:G258.7? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2022)16-0127-03
在大數(shù)據(jù)時代,數(shù)據(jù)規(guī)模是海量的,數(shù)據(jù)量呈現(xiàn)出指數(shù)級的增長速度。數(shù)據(jù)作為一種生產(chǎn)要素,它的價值得到了社會的廣泛關(guān)注,于圖書館而言,同樣如此。圖書館數(shù)據(jù)服務(wù)工作為各行各業(yè)的發(fā)展提供了充分的數(shù)據(jù)支持,開展好圖書館數(shù)據(jù)服務(wù)工作具有重要的意義。但是在大數(shù)據(jù)技術(shù)環(huán)境下,圖書館數(shù)據(jù)服務(wù)工作面臨著許多新情況。在這種背景下,如何更好地開展數(shù)據(jù)服務(wù)工作,是圖書館管理人員需要認真思考的議題。
一、相關(guān)概念界定
(一)關(guān)于大數(shù)據(jù)的認識
大數(shù)據(jù)是一種數(shù)據(jù)集合,數(shù)據(jù)規(guī)模是海量的,數(shù)據(jù)流轉(zhuǎn)是飛速的,數(shù)據(jù)類型是多樣化的,數(shù)據(jù)價值密度是低的。大數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模,傳統(tǒng)的數(shù)據(jù)庫處理軟件很難處理,在進行數(shù)據(jù)獲取、數(shù)據(jù)存儲、數(shù)據(jù)管理、數(shù)據(jù)分析時面臨著許多困難[1]。大數(shù)據(jù)的特點鮮明,主要表現(xiàn)在三個方面。首先,大數(shù)據(jù)的數(shù)據(jù)量是巨大的。數(shù)據(jù)量巨大是大數(shù)據(jù)最顯著的特征,在信息技術(shù)快速發(fā)展的背景下,各行各業(yè)的活動軌跡都以數(shù)據(jù)的形式呈現(xiàn)出來,數(shù)據(jù)量以指數(shù)級的速度增加,數(shù)據(jù)量巨大。其次,大數(shù)據(jù)的種類是多樣的。在物聯(lián)網(wǎng)快速發(fā)展的背景下,各行業(yè)對數(shù)據(jù)的需求量越來越大,數(shù)據(jù)的種類也越來越多。最后,大數(shù)據(jù)的價值密度比較低。大數(shù)據(jù)的價值密度是低的,這與大數(shù)據(jù)的表征方式有關(guān)。
(二)關(guān)于圖書館數(shù)據(jù)服務(wù)的認識
圖書館數(shù)據(jù)服務(wù)是在遵循數(shù)據(jù)全生命周期管理原則的基礎(chǔ)上進行的數(shù)據(jù)服務(wù),數(shù)據(jù)資源是主要的管理對象,在統(tǒng)一的圖書館數(shù)據(jù)管理平臺上,對圖書數(shù)據(jù)進行整理、歸集、挖掘和分析,在進行全生命周期處理后,把數(shù)據(jù)傳遞給需求者[2]。在這一流程中,大數(shù)據(jù)平臺發(fā)揮著統(tǒng)攝作用。圖書館數(shù)據(jù)服務(wù)與傳統(tǒng)的圖書館管理工作存在差異,具體來看,傳統(tǒng)的圖書館管理工作更多是在信息服務(wù)這一范疇下進行的,而圖書館數(shù)據(jù)服務(wù)歸屬于數(shù)據(jù)服務(wù)這一范疇。圖書館信息服務(wù)是服務(wù)于用戶的共性需求,提供的內(nèi)容具有一般性和概括性。而圖書館數(shù)據(jù)服務(wù)對提供內(nèi)容的要求更具體,采用全息數(shù)據(jù)來描述事物,主要表現(xiàn)在數(shù)據(jù)服務(wù)粒度更細、精度更高、速度更快等。
二、圖書館數(shù)據(jù)服務(wù)的意義
圖書館是各類數(shù)據(jù)的重要存放地,圖書館數(shù)據(jù)服務(wù)工作給社會上各類組織機構(gòu)提供了便捷的查詢通道,具有重要的意義。圖書館數(shù)據(jù)服務(wù)的重要意義主要表現(xiàn)在三個方面,分別是聚合各類數(shù)據(jù)資源、為各類組織提供決策依據(jù)、為科學(xué)研究提供支持。
(一)聚合各類數(shù)據(jù)資源
圖書館數(shù)據(jù)服務(wù)是社會上各類組織都需要的,使用途徑是多樣的,比較常見的使用目的有科研、經(jīng)營管理、政策制定等。以科研活動為例來看,更需要健全的圖書館數(shù)據(jù)服務(wù)??蒲谢顒拥闹饕獔鏊歉咝?,做好高校圖書館數(shù)據(jù)服務(wù)工作就具有了現(xiàn)實的緊迫性[3]。高校的科研、管理活動會產(chǎn)生各類數(shù)據(jù),這些數(shù)據(jù)具有很高的價值,但是處于零散的狀態(tài)。需要進行聚合管理,讓這些數(shù)據(jù)的價值充分發(fā)揮出來。對高校內(nèi)的各類數(shù)據(jù)資源進行聚合,可以減少對數(shù)據(jù)資源的重復(fù)性整理,同時也可以促進數(shù)據(jù)資源在高校各個組織部門間流動。
(二)為各類組織提供決策依據(jù)
社會上各類組織在制定重大決策時,都要進行多方調(diào)研,盡可能保證數(shù)據(jù)政策具有合理性,大量查看相關(guān)數(shù)據(jù)就具有了現(xiàn)實的必要性。圖書館數(shù)據(jù)是各類組織制定決策時主要的參考依據(jù)。圖書館中保存的數(shù)據(jù)分類存放,按照對應(yīng)的序列進行查看,花費的成本很低。借助于圖書館數(shù)據(jù)資源庫,各類組織可以獲得必要的決策依據(jù)。
(三)為科學(xué)研究提供支持
科研活動對數(shù)據(jù)的需求量非常大,科研人員在進行科研活動時,需要大量查閱研究領(lǐng)域的數(shù)據(jù),關(guān)注世界范圍內(nèi)同行的研究進度。圖書館是獲取這些數(shù)據(jù)的重要途徑,通過提供優(yōu)質(zhì)的圖書館數(shù)據(jù)服務(wù),可以為科學(xué)研究活動提供大量支持。整理數(shù)據(jù)在科研活動中花費的時間占據(jù)了整個科研流程的很大比重。圖書館中的數(shù)據(jù)按照特定的規(guī)則進行存放,查找方便,幫助科研工作者省去了很多的查找時間。
三、大數(shù)據(jù)對圖書館數(shù)據(jù)服務(wù)的影響
(一)對業(yè)務(wù)功能的影響
在大數(shù)據(jù)時代,圖書館的業(yè)務(wù)范圍不斷拓展,數(shù)據(jù)資料的類型不斷增多。圖書館工作人員在開展業(yè)務(wù)時,同步變革了業(yè)務(wù)活動,對大數(shù)據(jù)時代的業(yè)務(wù)需求做出了回應(yīng),回應(yīng)的內(nèi)容主要為兩個方面,分別是讀者和圖書館工作人員。
就讀者方面而言,圖書館工作人員會積極收集、整理與讀者相關(guān)的數(shù)據(jù),建立大數(shù)據(jù)管理系統(tǒng),整理讀者閱讀過的各種介質(zhì)的數(shù)據(jù),包括書籍、報紙、刊物、音頻、視頻等。同時也會對數(shù)據(jù)資源庫中的數(shù)據(jù)資源進行組合,嘗試建立大數(shù)據(jù)資源整合中心,借助大數(shù)據(jù)管理系統(tǒng),分析讀者的閱讀行為,做好日志記錄。圖書館工作人員還會對讀者在圖書館中的活動軌跡進行場景分析,場景分析內(nèi)容包括閱讀位置、進館時間、數(shù)據(jù)搜索偏好、歷史搜索行為、書籍借閱記錄等。就圖書館工作人員方面而言,圖書館工作人員會對自身的工作表現(xiàn)進行總結(jié),分析工作中的得與失。具體來看,圖書館工作人員會對自身提供數(shù)據(jù)服務(wù)的時間、服務(wù)的內(nèi)容、工作效率等進行數(shù)據(jù)歸集,對這些數(shù)據(jù)進行半結(jié)構(gòu)化和非結(jié)構(gòu)化分類,然后對這些數(shù)據(jù)進行全生命周期管理,通過數(shù)據(jù)分析來提高工作效率,進而提升業(yè)務(wù)服務(wù)質(zhì)量。
在大數(shù)據(jù)時代,圖書館的業(yè)務(wù)功能面臨著新的環(huán)境,充滿了機遇和挑戰(zhàn),圖書館工作人員要通過大數(shù)據(jù)分析,找出讀者的數(shù)據(jù)使用規(guī)律,同時還要對自身的數(shù)據(jù)服務(wù)工作展開反思和分析,讓業(yè)務(wù)功能更加全面和高效,這些做法正是大數(shù)據(jù)時代對圖書館業(yè)務(wù)功能召喚的回應(yīng)。
(二)對技術(shù)體系的影響
在大數(shù)據(jù)時代,圖書館的技術(shù)體系出現(xiàn)了變化。圖書館使用比較多的管理系統(tǒng)是Libsys、ILAS、SULCMIS等,使用比較多的數(shù)據(jù)庫服務(wù)平臺是Oracle、Sybase,以關(guān)系型數(shù)據(jù)庫作為后臺支撐,使用web2.0技術(shù)來提供個性化服務(wù)。隨著大數(shù)據(jù)技術(shù)的發(fā)展,原有的圖書館技術(shù)支撐體系遭到了顛覆,在數(shù)據(jù)管理系統(tǒng)中比較熱門的是RFID,以及其他先進的個性化服務(wù)技術(shù)等。通過采用先進的數(shù)據(jù)庫管理技術(shù),圖書館數(shù)據(jù)服務(wù)將邁入web3.0時代,圖書館數(shù)據(jù)分析工作也將朝著語義分析的方向發(fā)展。
在大數(shù)據(jù)時代,物聯(lián)網(wǎng)技術(shù)和數(shù)據(jù)庫技術(shù)發(fā)展較快,為圖書館的數(shù)據(jù)技術(shù)革新提供了充足的動力,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫不再是主流選擇。目前主流的圖書數(shù)據(jù)管理系統(tǒng)有Hadoop、BigData、NoSQL等。NoSQL采用多節(jié)點分布的方式,運用MapReduce處理方法來處理海量數(shù)據(jù),采用Hadoop平臺來管理圖書館日常數(shù)據(jù)運營。MapReduce通過“Map”(映射)和“Reduce”(化簡),將圖書館管理程序運行在Hadoop平臺上,實現(xiàn)圖書館數(shù)據(jù)服務(wù)系統(tǒng)的高效運轉(zhuǎn)。在大數(shù)據(jù)時代,語意技術(shù)和web3.0技術(shù)也逐漸成為了圖書數(shù)據(jù)管理系統(tǒng)使用的主流技術(shù),這些技術(shù)是在現(xiàn)有結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)庫的基礎(chǔ)上形成的語義疊加層,通過使用這些先進的技術(shù),可以匯聚散落在各個地方的數(shù)據(jù)。圖書館數(shù)據(jù)服務(wù)涉及到了許多非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)具有復(fù)雜性,在運行過程中也存在不規(guī)則性,促使新的數(shù)據(jù)處理技術(shù)不斷出現(xiàn),圖書館技術(shù)體系在數(shù)據(jù)技術(shù)革新的過程中不斷更新。
(三)對工作人員的影響
在信息技術(shù)的推動下,圖書館管理活動實現(xiàn)了從手工管理到系統(tǒng)自動化操作的轉(zhuǎn)變,圖書館工作人員也在這一背景下,開始學(xué)習(xí)圖書管理系統(tǒng)的操作技能,圖書管理理念也發(fā)生了轉(zhuǎn)變。在大數(shù)據(jù)技術(shù)的推動下,圖書館管理活動將迎來第二次轉(zhuǎn)變,圖書館工作人員也將再次變革自己的工作方式。圖書館管理活動的第二次轉(zhuǎn)變是在大數(shù)據(jù)技術(shù)的推動下進行的,圖書館管理活動將呈現(xiàn)出智慧化的特點。
面對大數(shù)據(jù)技術(shù)對圖書館管理活動的沖擊,圖書管理人員應(yīng)積極增加自己的知識儲備,加強自身工作技能。具體來看,圖書管理人員不僅需要掌握圖書情報方面的基礎(chǔ)知識,而且還需要學(xué)習(xí)新型技術(shù)手段;要圍繞非結(jié)構(gòu)化數(shù)據(jù)來探索可行的業(yè)務(wù)再造流程,善于使用大數(shù)據(jù)分析工具來分析圖書管理數(shù)據(jù);開發(fā)智能化的數(shù)據(jù)分析平臺,打造出能夠促進知識加工和知識服務(wù)發(fā)展的數(shù)據(jù)支撐體系。為應(yīng)對大數(shù)據(jù)技術(shù)對圖書館數(shù)據(jù)服務(wù)工作的影響,圖書館工作人員應(yīng)主動學(xué)習(xí)數(shù)據(jù)分析技術(shù),要善于在那些零散的無關(guān)聯(lián)的數(shù)據(jù)中挖掘出讀者感興趣的數(shù)據(jù),并且及時把這些數(shù)據(jù)推送給讀者,實現(xiàn)圖書館數(shù)據(jù)服務(wù)價值的最大化。圖書館數(shù)據(jù)采編人員需要對讀者的歷史瀏覽數(shù)據(jù)進行分析,評測圖書館現(xiàn)存數(shù)據(jù)的質(zhì)量,評估讀者對各類數(shù)據(jù)需求量的緊迫程度,然后制訂相應(yīng)的數(shù)據(jù)采購計劃。這些做法正是在大數(shù)據(jù)時代,圖書管理人員需要注意的。
四、圖書館數(shù)據(jù)服務(wù)創(chuàng)新發(fā)展的路徑
(一)重點分析讀者的信息和日志
用戶在瀏覽圖書數(shù)據(jù)時,會留下相應(yīng)的個人信息,包括瀏覽時長、類型、借閱頻率等。分析好這些數(shù)據(jù),可以對讀者做出更好的用戶畫像,從而制定出個性化的數(shù)據(jù)服務(wù)策略,提升讀者對數(shù)據(jù)服務(wù)的滿意度。另外,對讀者的相關(guān)行為數(shù)據(jù)進行分析,可以找出數(shù)據(jù)之間的關(guān)聯(lián),從而調(diào)整數(shù)據(jù)的購買計劃,及時購進和整合讀者關(guān)注較多的數(shù)據(jù)。在圖書館的日常經(jīng)營管理活動中,存在著許多碎片化的數(shù)據(jù),圖書館工作人員需要對這些數(shù)據(jù)進行歸集整理,挖掘出這些數(shù)據(jù)蘊含的價值[4]。讀者的興趣愛好存在偏差,關(guān)注的圖書數(shù)據(jù)也存在差異。圖書館工作人員需要通過大數(shù)據(jù)分析技術(shù),制定分眾化的數(shù)據(jù)服務(wù)策略,既要在二八法則的指導(dǎo)下,關(guān)注主要讀者群體的數(shù)據(jù)使用偏好,又要參考長尾理論的框架,關(guān)注小眾群體的數(shù)據(jù)使用偏好,提供個性化的數(shù)據(jù)推送策略,從而提供貼切的圖書館數(shù)據(jù)服務(wù)。
圖書館管理和超市經(jīng)營存在許多相似之處,讀者查閱數(shù)據(jù)的行為和在超市購買商品的行為有許多相似之處,圖書館工作人員需要整理好與讀者數(shù)據(jù)查閱行為相關(guān)的日志,并且重點分析這些日志。借助讀者日志來分析不同讀者群體間存在的差異,結(jié)合相關(guān)的關(guān)聯(lián)規(guī)則、聚類方法和時間序列等,構(gòu)建出數(shù)據(jù)資源需求意愿分析模型,預(yù)測讀者數(shù)據(jù)需求的變化趨勢。
(二)做好圖書館的數(shù)據(jù)分析和共享工作
大數(shù)據(jù)時代,圖書館工作人員需要重點做好數(shù)據(jù)分析和共享工作。在大數(shù)據(jù)技術(shù)推動下,圖書館的傳統(tǒng)業(yè)務(wù)開始向數(shù)據(jù)分析和共享方向轉(zhuǎn)變。圖書館資源數(shù)量較多,種類多樣,包括紙質(zhì)資源、光盤資源、數(shù)據(jù)庫資源等。這些數(shù)據(jù)資源蘊含著巨大的價值,但是缺乏整理,需要做好充分的分析,只有進行充分的分析,才能夠挖掘出巨大的價值。目前很多圖書館都在進行數(shù)字化改革,圖書館內(nèi)部的文獻基本實現(xiàn)了數(shù)字化,相關(guān)的圖書資料也可以通過網(wǎng)絡(luò)途徑進行查閱。讀者在查閱這些數(shù)字化資料時,會留下對應(yīng)的歷史瀏覽數(shù)據(jù),通過對讀者的歷史瀏覽數(shù)據(jù)進行大數(shù)據(jù)分析,可以分析出讀者的閱讀心理和數(shù)據(jù)需求。結(jié)合讀者的數(shù)據(jù)需求,進而檢索出有用的數(shù)據(jù)資源,以制定合適的數(shù)據(jù)服務(wù)方案。
每個圖書館的數(shù)據(jù)資源存儲存在差異,具體表現(xiàn)在數(shù)據(jù)存儲格式、存放類型、數(shù)據(jù)編碼方式、數(shù)據(jù)特征等方面。這些差異使得圖書館的數(shù)據(jù)資源存放表現(xiàn)出分布式、異構(gòu)化、多樣化的特點。針對這些差異,圖書館工作人員需要做好館際間的數(shù)據(jù)共享,滿足不同地區(qū)讀者的數(shù)據(jù)需求,讓圖書館數(shù)據(jù)價值得到充分釋放。各圖書館之間共享數(shù)據(jù)是大數(shù)據(jù)時代數(shù)據(jù)服務(wù)工作的必然選擇,順應(yīng)了大數(shù)據(jù)時代的發(fā)展趨勢,是圖書館數(shù)據(jù)服務(wù)工作的重要選擇。
(三)推動圖書館數(shù)據(jù)服務(wù)工作的智能化發(fā)展
在大數(shù)據(jù)技術(shù)推動下,智能分析逐漸成為數(shù)據(jù)營銷主要依賴的方法。圖書館工作人員需要借助大數(shù)據(jù)技術(shù),圍繞圖書館數(shù)據(jù)服務(wù)進行智能分析,建立強大的數(shù)據(jù)搜索引擎,為讀者精準推送他們所需要的信息[5]。在大數(shù)據(jù)技術(shù)和語義分析技術(shù)的推動下,打造出智能化的圖書館,推動圖書館的智能化發(fā)展。
語義分析技術(shù)對數(shù)據(jù)價值發(fā)揮有重要意義,圖書館工作人員借助語義分析技術(shù),可以盤活數(shù)據(jù)價值,讓圖書館數(shù)據(jù)服務(wù)工作更高效,讓讀者獲得更好的數(shù)據(jù)使用體驗。在傳統(tǒng)的圖書館數(shù)據(jù)搜索引擎中,搜索出的數(shù)據(jù)結(jié)果大多是無用的,借助語義分析技術(shù),加入一些可以被計算機識別的語義信息,可以準確地搜索出讀者真實需要的數(shù)據(jù),降低讀者的時間成本。借助于語義分析技術(shù),圖書館數(shù)據(jù)服務(wù)工作將表現(xiàn)得更加智能化,讀者查閱數(shù)據(jù)的行為將會更加便捷。在傳統(tǒng)的圖書館數(shù)據(jù)服務(wù)工作中,讀者如果想要獲得某一類型的數(shù)據(jù),他們會在多個平臺中去檢索,花費的時間較多。在大數(shù)據(jù)時代,通過語義網(wǎng)分析,使用推理、機械學(xué)習(xí)等智能技術(shù),可以有效地判斷讀者的意圖。屏蔽掉讀者不感興趣的數(shù)據(jù),幫助讀者更快地檢索到他們真正感興趣的數(shù)據(jù)。
結(jié)語
大數(shù)據(jù)對圖書館數(shù)據(jù)服務(wù)具有重要的影響,在大數(shù)據(jù)技術(shù)的推動下,圖書館的業(yè)務(wù)功能、技術(shù)體系、工作人員都出現(xiàn)了一定的變化。圖書館作為數(shù)據(jù)存儲的重要場所,對社會發(fā)展有著重要的推動作用,各社會組織在作出重要決策前都會收集相關(guān)的數(shù)據(jù)作為參考,圖書館是獲取數(shù)據(jù)的重要途徑之一,所以做好圖書館建設(shè)具有重要意義。在大數(shù)據(jù)時代,圖書館數(shù)據(jù)服務(wù)工作需要與時俱進,主要的突破口是數(shù)據(jù)分析和智能化發(fā)展。本文基于大數(shù)據(jù)時代的發(fā)展特點,分析圖書館數(shù)據(jù)服務(wù)工作的意義及創(chuàng)新路徑,為相關(guān)研究提供參考和借鑒。
參考文獻:
[1]? 唐彬.跨界搜尋、大數(shù)據(jù)能力對平臺企業(yè)商業(yè)模式創(chuàng)新的影響研究[D].長春:吉林大學(xué),2021.
[2]? 蔚海燕,李旺.圖書館數(shù)據(jù)服務(wù)助力新文科建設(shè)之路徑[J].圖書與情報,2020,(6):77-83.
[3]? 盧祖丹.我國高校圖書館數(shù)據(jù)素養(yǎng)服務(wù)供給實證評價研究[J].圖書館雜志,2020,(10):63-70.
[4]? 陳雅,譚華軍,鄭建明.圖書館個性化服務(wù)中的Web日志分析技術(shù)研究[J].圖書館雜志,2011,(7):43-46+54.
[5]? 王雅麗.圖書館智慧數(shù)據(jù)服務(wù)策略研究[J].圖書館學(xué)研究,2021,(15):77-82.