王露露,徐軍華(湘潭大學公共管理學院)
?
語義網(wǎng)環(huán)境下的數(shù)字圖書館服務創(chuàng)新
王露露,徐軍華(湘潭大學公共管理學院)
摘要:通過分析數(shù)字圖書館建設中存在的一些問題,探討在語義網(wǎng)環(huán)境下數(shù)字圖書館與語義網(wǎng)相結合,在信息檢索技術、打破“信息孤島”、改進用戶體驗等方面可以進行的技術改進與服務創(chuàng)新。
關鍵詞:語義網(wǎng);數(shù)字圖書館;服務創(chuàng)新
2014年10月26日,在京舉辦的“2014開放學習國際論壇”首次發(fā)布了由新媒體聯(lián)盟會同瑞士庫爾技術與經(jīng)濟學院﹑蘇黎世聯(lián)邦理工學院圖書館和德國國家科學技術圖書館共同完成的《新媒體聯(lián)盟地平線報告(2014圖書館版)》的國內譯版。報告顯示,未來5年,圖書館館藏圖書資料將只是信息資源的一部分,信息資源借助網(wǎng)絡將具有共享性﹑互動性﹑開放性,呈現(xiàn)方式也更加多樣化。與此同時,信息技術發(fā)展將從根本上改變人類獲取知識和利用資源的方式,必然會給圖書館的職能及服務帶來全面而深刻的變革。[1]新媒體聯(lián)盟遴選出了極有可能在未來5年成為驅動圖書館技術采納和決策制定的六大趨勢,其中的一大焦點技術就是語義網(wǎng)。
自2000年Tim Berners-Lee提出語義網(wǎng)的七層模型以來,對于語義網(wǎng)的建設一直在進行中,W3C已出臺七層模型的底部四層標準,但邏輯層﹑證明層﹑信任層的研究仍在進行中。事實上,對于語義網(wǎng)研究的參考文獻大部分都是外文,國內在圖書館領域的深入研究少之又少。但是,隨著七層模型的不斷細化和各界關于語義網(wǎng)應用的不斷研究,它作為網(wǎng)絡發(fā)展新的愿景而言,將會無可限量,尤其IBM﹑Google等互聯(lián)網(wǎng)產(chǎn)業(yè)巨頭以及美國國會圖書館對于語義網(wǎng)的熱衷可見一斑。因此,筆者認為,作為互聯(lián)網(wǎng)發(fā)展催生的數(shù)字圖書館,更應該站在技術革新的浪頭,更加精心地將處于生長期的“初生兒”——語義網(wǎng)哺育長大。
2.1檢索系統(tǒng)效率較低
數(shù)字圖書館的搜索引擎多以傳統(tǒng)的關鍵字檢索為主要方式,這種檢索方式雖然一定程度上滿足了用戶需求,但是由于關鍵字與其真正語義的含義不在同一層面,導致查詢結果往往只是字面意義上的相加匹配,而非我們真正需要的信息,最終導致檢準率較低。比如,我們在搜索欄輸入“比爾·克林頓的夫人”,搜索引擎只會給出同時包含“比爾·克林頓”和“夫人”兩個關鍵詞的一系列網(wǎng)頁,只有點鏈接,逐條閱讀,我們才可以找到答案。另外,目前數(shù)字圖書館的檢索對象僅僅是已經(jīng)數(shù)字化﹑標準化的資源,對于那些數(shù)量龐大或是資源還未與元數(shù)據(jù)匹配的信息卻無能為力,最終導致檢全率較低。
2.2資源利用效率較低
(1)傳統(tǒng)用戶利用數(shù)字圖書館資源的方式一般是在搜索欄搜索到相關結果,分篇下載或是瀏覽后,從眾多資源中選擇自己想要的相關主題信息,信息獲取過程繁雜。(2)不同領域之間甚至同一領域之間的知識關聯(lián)度較差,因為元數(shù)據(jù)標準﹑信息系統(tǒng)的鴻溝,甚至社會組織之間的交流隔閡,我們很難將其完整收集并整合起來。(3)面向用戶的信息載體單一,數(shù)字圖書館基本沿襲的都是傳統(tǒng)圖書館古老的知識呈現(xiàn)方式,即文字與符號。但事實上,就同一主題,我們可以在google搜索到相關網(wǎng)頁新聞,在Youtube搜索到相關視頻,在DIALOG聯(lián)機數(shù)據(jù)庫中搜索到相關論文,在Twitter搜索到相關評論,卻沒有一個是可以同時搜索到全部格式的信息系統(tǒng)。
2.3用戶體驗指數(shù)較差
Web2.0環(huán)境下,數(shù)字圖書館用戶是以信息集中地“客人”的身份到訪的——用戶提出需求,再由圖書管理員根據(jù)用戶需求向用戶推送信息。用戶與圖書館管理員之間溝通不暢,極大削弱了數(shù)字圖書館用戶的體驗指數(shù)。因此,克服這一問題的方法就是要想方設法讓用戶成為“主人”,獲取信息就像取家里的物品一樣隨心隨意,而這一切的實現(xiàn)都需要語義網(wǎng)的加入。
3.1推動圖書館信息檢索平臺智能化
語義網(wǎng)不是對Web的重塑,而是在現(xiàn)有Web2.0基礎上的延伸,是對現(xiàn)有Web利用價值的挖掘。語義網(wǎng)首先強調的不是語義,而是Web,是讓計算機智能化,這對于數(shù)字圖書館而言,將會為信息檢索平臺和檢索用戶之間創(chuàng)建一種可交流的語言,讓信息檢索平臺可以聽懂用戶的聲音。要實現(xiàn)這一服務,需要應用語義技術,構建智能化信息檢索平臺。一般有以下兩種方法:一是在基于本體的傳統(tǒng)信息檢索平臺的基礎上,增加以RDFS﹑OWL等為基礎語言的語義層;二是通過引入語義技術,如智能代理﹑Web爬蟲等,實現(xiàn)智能聚合﹑組織和處理用戶提出的檢索項功能,即在原有的系統(tǒng)模型的基礎上實現(xiàn)傳統(tǒng)檢索平臺的智能升級。
在語義信息檢索過程中,信息推理分析引擎通過本體工程支撐,抽取出用戶提問背后的某專業(yè)領域所隱含的信息。同時,經(jīng)過語義描述標準和智能推理技術將檢索信息轉化為與語義信息檢索平臺的元數(shù)據(jù)結構和規(guī)則精確契合的檢索詞,即生成為計算機可以理解的結構化語言,進而在互聯(lián)網(wǎng)中央大數(shù)據(jù)庫搜索數(shù)據(jù),最后通過智能聚合﹑語義排序等操作向用戶返回查詢結果(見圖1)。
圖1 語義信息檢索模型
3.2打破數(shù)字圖書館“信息孤島”和“社交藩籬”
語義網(wǎng)最大的特點就是提供了打破應用﹑企業(yè)和社區(qū)之間藩籬的工具,就數(shù)字圖書館而言,“界限”這個概念被顛覆。原來所定義的界限是各個信息系統(tǒng)之間的“信息孤島”,我們對于打破“孤島”之間的界限問題一直在探索中。當互聯(lián)網(wǎng)發(fā)展至Web3.0階段,信息資源最大的特點就是開放。一方面,有了語義網(wǎng)的RDF和內容元數(shù)據(jù)結成的數(shù)據(jù)標準套件,“信息孤島”問題將迎刃而解;另一方面,語義網(wǎng)作為“云計算”的孿生子,就像云計算對于數(shù)字資源的優(yōu)化整合作用,語義網(wǎng)不僅可以打破數(shù)字資源領域的“信息孤島”,還可以跨越新浪微博﹑維基百科﹑Youtube等UGC和社交網(wǎng)絡領域,實現(xiàn)數(shù)字圖書館與應用﹑企業(yè)和社區(qū)的創(chuàng)新性攜手,這樣將不會有任何“孤島”的問題。
3.2.1增強數(shù)字圖書館的開放化
提到數(shù)字資源的整合和開放化,不得不提到關聯(lián)數(shù)據(jù)(Linked Data)。筆者這樣理解:它以大量的RDF三元組(主詞,謂詞,賓詞)在數(shù)據(jù)層與語義層之間形成一種統(tǒng)一資源定位符(URL),但并不賦予語義含義,以此取代各式各樣且不斷變化的網(wǎng)站地址,從而使得整個互聯(lián)網(wǎng)變成一個放置在“云”中的大數(shù)據(jù)庫。數(shù)字圖書館將其用戶模型發(fā)布為關聯(lián)數(shù)據(jù)實例,建立起不同系統(tǒng)所擁有的同一用戶模型片段的關聯(lián),呈現(xiàn)具有更多信息的用戶全景圖,支持用戶情景敏感服務優(yōu)化;[2]不僅開放數(shù)據(jù),也開放功能,將圖書館數(shù)據(jù)真正嵌入到社會信息基礎結構中去,使圖書館數(shù)據(jù)不僅存在于網(wǎng)絡,而且成為開放網(wǎng)絡的一部分,便于搜索引擎發(fā)現(xiàn)和索引。[3]也就是說,在語義網(wǎng)的環(huán)境下,數(shù)百萬種書籍將被掃描傳播到世界網(wǎng)絡中,有史以來第一次,全世界圖書館用戶可以真正通過數(shù)字圖書館訪問這些書籍內容的章節(jié)﹑概念﹑引用﹑公式﹑定理和數(shù)字等內容。用戶可以真正在幾本專業(yè)領域的書籍內容之外,用這數(shù)百萬種書籍中的內容另外搭建一個龐大又精細的知識模型,實現(xiàn)數(shù)字圖書館從用戶需求到收獲結果的“一站式”服務。
3.2.2增強數(shù)字圖書館的社交功能
Web2.0帶來的全民合作——在維基百科﹑QQ﹑微博微信之類的社交平臺上廣大用戶集體共享智慧與服務的時代,也將數(shù)字圖書館初步帶入全民社交圈。國內許多高校﹑企業(yè)合作的數(shù)字圖書館也紛紛開通了微博﹑微信交流平臺,說明數(shù)字圖書館已經(jīng)有意識地通過建立社交平臺,將本身的信息資源與圖書館用戶的評論﹑喜好﹑需求相結合匹配,從而走向數(shù)字圖書館社交服務的道路。在語義網(wǎng)環(huán)境下,數(shù)字圖書館的社交功能將會比現(xiàn)在熱門的微信公眾平臺契合很多,文本﹑標簽﹑數(shù)據(jù)庫﹑社交應用等各種格式將實現(xiàn)無縫式鏈接,用戶在閱讀時,可以通過一種語義標記獲得其他用戶的評論,又或是專業(yè)研究員關于這一段的科學性探討。這一功能的實現(xiàn)需要圖書館在移動服務組合領域繼續(xù)推動創(chuàng)新,以滿足用戶對核心信息的需求和適應用戶自服務的時代特征。比如,通過開發(fā)移動網(wǎng)站和移動應用的個性定制功能,增強基于定位和實時活動的服務功能,改進QR掃描技術和電子書閱讀體驗,實現(xiàn)移動圖書館設備的普及以及擴大與Facebook﹑Twitter﹑YouTube等其他具備成熟移動服務的社交媒體之間的交互性等,[4]從而讓用戶基于完善的移動端服務,自覺培養(yǎng)起主人的信息共享和參與意識,也讓數(shù)字圖書館真正打破“社交藩籬”。
3.3帶動圖書館用戶體驗角色的轉換
用戶體驗與個性化需求是現(xiàn)今促進技術創(chuàng)新進步的一大動力,也是Web2.0階段“以用戶為中心”這一顯著特征的重要體現(xiàn)。同時,它也是數(shù)字圖書館技術進步和服務完善的一大衡量標準,必須引起我們的重視。筆者主要從感官體驗動態(tài)化﹑知識體驗個性化﹑情感體驗主人化來介紹語義網(wǎng)將給數(shù)字圖書館用戶帶來的體驗及角色轉換。
3.3.1視覺體驗動態(tài)化
語義網(wǎng)在圖書館用戶視覺體驗上的創(chuàng)新主要表現(xiàn)在以下兩方面:一方面,基于FRBR模型,可以識別和定義書目實體﹑屬性和它們之間的關系,進而根據(jù)書籍內容的相關度和個人記錄的搜索信息將多個版本﹑不同載體資源之間的關系進行智能排序和聚合,以一種更豐富﹑準確和有意義的方式呈現(xiàn)給用戶。[5]因此,用戶在搜索相關內容時,可以通過主題樹或標簽云更加直接方便地發(fā)現(xiàn)與之相關的隱性信息以及主題之間的關系。另一方面,語義網(wǎng)支持在用戶界面采用超文本﹑圖形接口技術以及Z39.50協(xié)議實現(xiàn)不同系統(tǒng)平臺的開放互聯(lián),支持數(shù)字圖書館用戶在閱讀相關內容時,可以進入圖像界面﹑語音界面﹑多媒體界面交流,獲得更加生動﹑立體﹑多維的知識體驗。
3.3.2知識體驗個性化
在語義環(huán)境下,數(shù)字圖書館主要通過個人偏好庫服務實現(xiàn)為用戶提供個性化的知識體驗。這種服務是基于用戶的基本設定以及搜索系統(tǒng)中的歷史記錄等專為用戶建設的偏好庫。它面向個體用戶,以合并起來的多個大型知識庫為信息基礎,通過明晰的知識網(wǎng)絡模型建立起一個覆蓋全網(wǎng)﹑解答角度立體的自適應動態(tài)系統(tǒng)。個人偏好庫與傳統(tǒng)信息定制服務的不同之處在于它解放了用戶之間的信息壁壘,展現(xiàn)知識更加廣闊﹑立體和動態(tài)。在用戶搜索時,搜索引擎將提取用戶檢索信息并記憶此次搜索行動,在語義檢索平臺上通過RDF的形式語義和推理功能,將非結構化的語言結構化并為計算機所理解,進而通過已搭建的立體知識模型拉取全網(wǎng)偏好庫中的有用信息呈現(xiàn)給用戶,同時自動更新并發(fā)布自身偏好庫的最新動態(tài)(見圖2)。
圖2 個人偏好庫服務流程
3.3.3情感體驗主人化
語義網(wǎng)將推動數(shù)字圖書館從以主動“推送”為主的服務進入以用戶為中心的“推拉”服務時代,以此實現(xiàn)數(shù)字圖書館用戶從信息集散地的客人到隨心所欲的主人的角色轉換。這一角色轉換的實現(xiàn)則要依靠基于推拉技術而形成的“智能信息推送”(IIPP)。IIPP技術應用了人工智能(AI)﹑機器學習(ML)方法﹑知識工程(KE)的知識推理搜索方法﹑知識發(fā)現(xiàn)(KDD)方法等技術,將“智能信息
推送”(IIpush)和“智能信息拉取”(IIpull)相結合,一方面,提高“信源”對“用戶”興趣的推測水平,實現(xiàn)主動﹑個性化的信息推送服務,另一方面,幫助用戶快速﹑準確地從信源拉取信息,提高用戶的滿意度。[6]這樣既使得用戶獲取信息的主動權得到更大的解放,最大程度地減少了用戶需求與獲得結果的不一致概率,又避免了圖書館單方面推送信息服務準確率低的現(xiàn)象,減少了用戶篩選和過濾無用信息的勞動量和時間,也使得一些沒有主動獲取信息能力及知識水平較低的受眾同樣可以獲得優(yōu)質的用戶體驗。
[參考文獻]
[1]張鐵道,等.新媒體聯(lián)盟地平線報告:未來圖書館就在你的指尖[N].中國教育報,2014-12-10(007).
[2]賀德方.基于語義的數(shù)字圖書館服務創(chuàng)新[J].情報學報,2012,31(10):1012-1017.
[3]林海青,等.圖書館關聯(lián)數(shù)據(jù):機會與挑戰(zhàn)[J].中國圖書館學報,2012(1):58-68.
[4]Lisa Carlucci Thomas.The State of Mobile in Libraries 2012[EB/OL].[2015-03-24].http://www.thedigitalshift.com/2012/02/mobile/the-state-of-mobile-in-libraries-2012/.
[5]KiorgaardD.ResourceDescriptionandAccess[DB/OL]. [2015-03-24].http://www.nla.gov.au/openpublish/index.php/nlasp/article/download/1420/1725/1420-6735-2-PB.pdf.
[6]百度百科.智能信息推拉技術[EB/OL].[2015-03-24].http://baike.baidu.com/view/2638844.htm.
Service Innovation of Digital Library in the Environment of Semantic Web
Wang Lu-lu, Xu Jun-hua
Abstract:The paper analyses some problems existing in the construction of digital library, and further explores the technology improvement and service innovation on information retrieval, information island breakdown as well as user experience improvement with the combinationof digital library andsemantic web in the semantic web environment.
Keywords:Semantic Web; Digital Library; Service Innovation
[收稿日期]2015-04-27[責任編輯]張雅妮
[作者簡介]王露露(1993-),女,山西晉城人,湘潭大學公共管理學院電子政務系在讀學生,研究方向:圖書情報領域;徐軍華(1979-),男,博士,湘潭大學公共管理學院碩士生導師,發(fā)文30余篇,研究方向:圖書館管理、數(shù)字圖書館服務。
[基金項目]本文系2013年度湖南省社科基金立項資助一般項目“數(shù)字環(huán)境下湖南省高校圖書館業(yè)務流程重組的模式研究”(項目編號:13YBA312)研究成果之一。
中圖分類號:G250.76
文獻標志碼:A
文章編號:1005-8214(2016)01-0088-03