司新霞
摘?要:本文分析了大數(shù)據(jù)時代圖書館用戶需求的變化,比較了文獻資源數(shù)字化與文獻資源數(shù)據(jù)化的異同,最后,提出了通過文獻資源數(shù)據(jù)化,重組細粒度的文獻信息 “知識元”,滿足圖書館用戶日益變化的信息需求,提供更精準的圖書館用戶服務(wù)。
關(guān)鍵詞:圖書館用戶需求;精準服務(wù);文獻資源數(shù)據(jù)化;文獻資源數(shù)字化
中圖分類號:F27?????文獻標識碼:A??????doi:10.19311/j.cnki.1672-3198.2021.01.033
0?引言
《普通高等學校圖書館規(guī)程》(教高〔2015〕14號)第三條規(guī)定“圖書館的主要職能是教育職能和信息服務(wù)職能”。高校圖書館的兩大職能都需要通過服務(wù)功能來體現(xiàn)。傳統(tǒng)圖書館主要以巴黎《原則聲明》為指導思想,以AACR2和《中國文獻編目規(guī)則》為依據(jù),以文獻為描述單元,通過文獻編目組織文獻資源,形成書目數(shù)據(jù),為圖書館用戶提供查閱,借還服務(wù)。隨著ICT(information and communications technology,信息與通信技術(shù))的發(fā)展,在大數(shù)據(jù)環(huán)境下,圖書館用戶信息知識需求發(fā)生了很大的變化,傳統(tǒng)書目組織模式已不能完全適應(yīng)并滿足大數(shù)據(jù)環(huán)境下用戶不斷變化的信息知識需求。
1?圖書館用戶需求的變化
1.1?圖書館用戶由渴求信息到渴求知識
第45次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》報道:截至2020年3月,我國網(wǎng)民規(guī)模為9.04億,互聯(lián)網(wǎng)普及率達64.5%;我國手機網(wǎng)民規(guī)模達8.97億,全年新增手機網(wǎng)民7992萬;網(wǎng)民中使用手機上網(wǎng)的比例由2018年底的98.6%提升至2019年底的99.3%,手機上網(wǎng)已成為最常用的上網(wǎng)渠道之一。移動互聯(lián)網(wǎng)技術(shù)的發(fā)展使得網(wǎng)民既是信息的消費者,又是信息的生產(chǎn)者。所以我們在生活中能接觸的多元化的信息量遠比人類歷史上任何一個時刻都多,并且信息產(chǎn)生的速度也在不停地成倍增長。然而,淹沒在網(wǎng)絡(luò)數(shù)據(jù)資料的海洋中,卻無法從中準確而有效的找到所需要的知識,已成為眾多互聯(lián)網(wǎng)用戶的困惑和無奈,正如世界著名的未來學家約翰奈斯比特曾在其著作《大趨勢》所寫:“我們雖然淹沒在信息的海洋中,但是卻渴求所需的知識。”
1.2?圖書館用戶的需求由共性化轉(zhuǎn)變?yōu)閭€性化
圖書館用戶的信息需求已經(jīng)從圖書借還等共性需求轉(zhuǎn)化為因?qū)W歷、專業(yè)背景、職業(yè)、年齡等因素不同而產(chǎn)生的個性化需求。圖書館用戶對能滿足不同類型用戶需求的圖書館智能推介服務(wù)有了更多的期待。
1.3?圖書館用戶需求從對圖書等的單一需求到對各類信息資源的多樣化需求
隨著ICT技術(shù)的發(fā)展,圖書館用戶的信息需求由單一化向多元化轉(zhuǎn)變,具體表現(xiàn)為:由單一的紙質(zhì)文獻需求轉(zhuǎn)變?yōu)榧堎|(zhì)文獻和電子文獻的同步需求;由單一的線下服務(wù)需求轉(zhuǎn)變?yōu)榫€上、線下服務(wù)的共同需求;由單一的文獻借閱需求轉(zhuǎn)變?yōu)槎喾N不同類型資源平臺的共享需求。
2?文獻資源數(shù)字化與文獻資源數(shù)據(jù)化
基于這些變化,圖書館需要通過文獻資源數(shù)據(jù)化,重組細粒度的文獻信息 “知識元”,才能深度揭示館藏資源,在現(xiàn)有數(shù)字化的基礎(chǔ)上更進一步,為提供更精準的知識服務(wù)打下基礎(chǔ)。
2.1?文獻資源數(shù)字化
所謂文獻資源數(shù)字化是指利用鼠標、鍵盤等輸入設(shè)備,將文本、圖像、音頻、視頻等文獻資源轉(zhuǎn)化為由0、1表示的二進制數(shù)字編碼的過程。正因為這樣的轉(zhuǎn)換,各類文獻資源得以存入磁盤等計算機存儲設(shè)備中。文獻資源數(shù)字化的核心是以計算機為工具去管理和共享海量的文獻資源。20世紀60 年代,圖書館界就開始探索文獻資源的數(shù)字化問題,MARC(機器可讀目錄)成為文獻資源數(shù)字化的最重要成果之一。結(jié)合中國的實際情況,中國圖書館同仁在20世紀80年代以MARC 格式為基礎(chǔ),提出了與MARC完全兼容的CNMARC(中國機器可讀目錄),用于中文信息資源的數(shù)字化,方便了海量文獻資源的查找。然而,由于其對文獻自身所包含的知識內(nèi)容揭示不夠,因此難以滿足用戶從這類數(shù)字化的文獻資源中獲得相關(guān)知識的需求。
2.2?文獻資源數(shù)據(jù)化
ICT技術(shù)的快速發(fā)展將文獻資源整合帶到數(shù)據(jù)化的發(fā)展階段。數(shù)據(jù)化是指一種把現(xiàn)象變成可制表分析的量化形式的過程。而文獻資源數(shù)據(jù)化是指以數(shù)字化的文獻資源為基礎(chǔ),將這些文獻資源組織為數(shù)據(jù)、公式、事實、結(jié)論等細粒度“知識元”的過程。知識元是知識控制與處理的基本單位,是知識結(jié)構(gòu)的基元。將眾多的知識元按照一定的語義鏈接在一起,發(fā)掘、揭示它們之間的各種關(guān)聯(lián),可以帶來知識價值的增值,并創(chuàng)造出新的知識。文獻資源數(shù)據(jù)化的意義是將利用文獻的方式從“讀”轉(zhuǎn)變?yōu)椤胺治觥?,其核心方法是重組文獻內(nèi)容,置入使用者所建立的新的文本或數(shù)據(jù)結(jié)構(gòu)中,也即文獻的結(jié)構(gòu)化。
文獻資源數(shù)字化是文獻資源數(shù)據(jù)化的基礎(chǔ),也是文獻資源數(shù)據(jù)化不可或缺的關(guān)鍵環(huán)節(jié),直接關(guān)系到文獻資源管理今后的發(fā)展。文獻資源數(shù)據(jù)化則是將數(shù)字化的文獻資源條理化,并可以通過查詢回溯、多維分析、智能分析等,為圖書館用戶信息行為分析、圖書館館藏布局決策等提供有力的數(shù)據(jù)支撐。
3?面向圖書館用戶精準服務(wù)的文獻資源數(shù)據(jù)化
3.1?圖書館用戶畫像
圖書館用戶精準服務(wù)的基礎(chǔ)是對圖書館用戶需求的準確把握。圖書館用戶需求主要體現(xiàn)在其日常的信息行為中,綜合這些日常的信息行為等數(shù)據(jù)標簽,就可以勾勒出該圖書館用戶的畫像,其畫像較好地反映了該圖書館用戶的信息需求,并會隨著該圖書館用戶信息行為的變化而變化。圖書館用戶畫像一般由屬性標簽、行為標簽、興趣標簽、場景標簽等來構(gòu)成。圖書館用戶屬性標簽主要包括圖書館用戶的專業(yè)、教育程度、年齡、性別等;圖書館用戶行為標簽主要包括登錄圖書館網(wǎng)站、CNKI等中外文數(shù)據(jù)庫平臺,借閱各類圖書、期刊,下載與閱讀各類專業(yè)數(shù)據(jù)庫資源,參加各類數(shù)據(jù)庫系統(tǒng)使用的培訓,利用微信公眾號等移動平臺的訪問、續(xù)借、咨詢等。
通過匯集圖書館用戶到館時間,書籍、雜志借閱,中外文文獻下載,圖書館微信公眾號互動等內(nèi)容數(shù)據(jù),對圖書館用戶線上和線下行為深度解析,提取屬性、內(nèi)容興趣、知識點、閱讀習慣、閱讀互動行為等標簽,就可以對圖書館用戶需求進行全面、多維、精準的畫像。同時,根據(jù)圖書館用戶信息需求的群體屬性特征,聚類形成的圖書館用戶群體畫像分析,還可呈現(xiàn)出一群圖書館用戶的行為特征。
3.2?面向圖書館用戶精準服務(wù)的文獻資源數(shù)據(jù)化
文獻資源數(shù)據(jù)化主要是重組文獻信息細粒度“知識元”,滿足圖書館用戶日益變化的信息需求,提供更精準的圖書館用戶服務(wù)。第一,面向?qū)n}服務(wù)的文獻資源數(shù)據(jù)化。專題服務(wù)是精準服務(wù)圖書館用戶的有效手段,通過大數(shù)據(jù)ETL、大數(shù)據(jù)融合等技術(shù)將文獻資源先“知識元”化,然后根據(jù)專題服務(wù)的數(shù)據(jù)標簽,將選取的 “知識元”重組為滿足圖書館用戶需求的“知識單元”。第二,面向跟蹤服務(wù)的文獻資源數(shù)據(jù)化。隨著時間的推移,圖書館用戶的信息需求會發(fā)生相應(yīng)的改變,同時反映圖書館用戶需求的圖書館用戶畫像也會發(fā)生相應(yīng)的改變。根據(jù)變化后的圖書館用戶畫像中的數(shù)據(jù)標簽,系統(tǒng)定期自動重組“知識元”,生成新的“知識單元”,從而滿足圖書館用戶新的“信息需求”。第三,面向推薦服務(wù)的文獻資源數(shù)據(jù)化。針對一些特定時間(比如新生入學,畢業(yè)季等)和特定群體圖書館用戶等開展有針對性的推薦服務(wù)時,可以利用相應(yīng)的數(shù)據(jù)標簽生成滿足特定任務(wù)的“知識單元”。
參考文獻
[1]王景俠.圖書館從數(shù)據(jù)關(guān)聯(lián)到關(guān)聯(lián)數(shù)據(jù)化發(fā)展及其啟示[J].圖書館雜志,2014,33(11):49-54.
[2]戴秀文.大數(shù)據(jù)背景下的檔案數(shù)據(jù)化[J].內(nèi)江師范學院學報,2019,34(04):116-120.
[3]楊麗娜.從“數(shù)字化”到“數(shù)據(jù)化”——信息技術(shù)背景下檔案資源整合路徑探析[J].辦公室業(yè)務(wù),2019,(12):183.
[4]胡小菁.文獻編目:從數(shù)字化到數(shù)據(jù)化[J].中國圖書館學報,2019,45(03):49-61.
[5]維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.
[6]索傳軍,蓋雙雙.知識元的內(nèi)涵、結(jié)構(gòu)與描述模型研究[J].中國圖書館學報,2018,44(04):54-72.
[7]趙思淵.地方歷史文獻的數(shù)字化、數(shù)據(jù)化與文本挖掘:以《中國地方歷史文獻數(shù)據(jù)庫》為例[J].清史研究,2016,(04):26-35.
[8]潘宇光.高校智慧圖書館讀者信息需求的用戶畫像[J].合肥工業(yè)大學學報(社會科學版),2018,32(02):113-119.