曲佳彬
摘 要:論述了關(guān)聯(lián)數(shù)據(jù)在知識(shí)組織中應(yīng)用的優(yōu)勢(shì),提出基于關(guān)聯(lián)數(shù)據(jù)的知識(shí)組織模型,并介紹了模型各個(gè)層次的工作和內(nèi)容。根據(jù)此模型,設(shè)計(jì)了以"煙臺(tái)大學(xué)圖書(shū)館學(xué)術(shù)論文"為實(shí)例的知識(shí)組織系統(tǒng),驗(yàn)證了模型的可行性、實(shí)用性,展示了關(guān)聯(lián)數(shù)據(jù)作為新技術(shù)在知識(shí)組織中的應(yīng)用前景。
關(guān)鍵詞:關(guān)聯(lián)數(shù)據(jù);知識(shí)組織;語(yǔ)義網(wǎng)
傳統(tǒng)知識(shí)組織在文獻(xiàn)信息組織與檢索中發(fā)揮了巨大的作用,隨著計(jì)算機(jī)技術(shù)以及語(yǔ)義網(wǎng)技術(shù)的發(fā)展,對(duì)知識(shí)組織的研究將更加深入,如何豐富和拓展知識(shí)組織的結(jié)構(gòu)和功能,如何深度序化信息資源的內(nèi)部屬性和特征,無(wú)縫的鏈接相關(guān)的信息資源,消除信息孤島使其富含語(yǔ)義,如何有效的整合、序化異構(gòu)、動(dòng)態(tài)變化的網(wǎng)絡(luò)信息資源將成為知識(shí)組織研究的熱點(diǎn)。關(guān)聯(lián)數(shù)據(jù)作為輕量級(jí)的語(yǔ)義網(wǎng)實(shí)現(xiàn)方法,自2006年由Tim Bern
ers-Lee[1]提出以來(lái)備受關(guān)注,逐漸成為圖情界的翹楚,關(guān)聯(lián)數(shù)據(jù)以通用框架RDF描述信息資源,關(guān)注的焦點(diǎn)放在信息本身而不是承載信息的頁(yè)面或是信息的訪問(wèn)接口,組織的對(duì)象直接深入到細(xì)粒度級(jí)的具有語(yǔ)義信息的實(shí)體,為每個(gè)信息實(shí)體定義唯一的URI,使用RDF鏈接相關(guān)的實(shí)體從而構(gòu)建關(guān)聯(lián)關(guān)系,揭示信息間的語(yǔ)義隱含,到達(dá)語(yǔ)義揭示的目的。鑒于關(guān)聯(lián)數(shù)據(jù)的特性以及它在知識(shí)組織、信息聚合等方面的突出表現(xiàn),本文以關(guān)聯(lián)數(shù)據(jù)為視角,探索知識(shí)組織的新方法,通過(guò)關(guān)聯(lián)數(shù)據(jù)的應(yīng)用實(shí)現(xiàn)知識(shí)組織的語(yǔ)義化、標(biāo)準(zhǔn)化,以促進(jìn)知識(shí)組織的新發(fā)展。
一、關(guān)聯(lián)數(shù)據(jù)在知識(shí)組織中應(yīng)用的優(yōu)勢(shì)
(一)關(guān)聯(lián)數(shù)據(jù)一種輕量級(jí)的語(yǔ)義網(wǎng)實(shí)現(xiàn)方法,結(jié)構(gòu)簡(jiǎn)單適合混搭。關(guān)聯(lián)數(shù)據(jù)設(shè)計(jì)的技術(shù)主要是統(tǒng)一資源定位符(URI)、超文本傳輸協(xié)議(HTTP)和RDF資源框架。關(guān)聯(lián)技術(shù)沒(méi)有定義特定的實(shí)現(xiàn)方式和技術(shù),只是提出了發(fā)布的原則和要求,只要遵循四個(gè)原則即可[2]:使用URI作為任何事物的標(biāo)識(shí)名稱、通過(guò)
HTTP協(xié)議,任何人都可以訪問(wèn)這一事物、以RDF的形式提供有用的信息、盡可能多的提供相關(guān)的URI鏈接。簡(jiǎn)單來(lái)說(shuō)就是使用RDF框架描述信息資源,通過(guò)HTTP的方式去訪問(wèn),利用
RDF鏈接的信息導(dǎo)航到更多的相關(guān)信息。
(二)信息之間的語(yǔ)義更加明顯,不僅是單純的知識(shí)鏈接。關(guān)聯(lián)數(shù)據(jù)本身不會(huì)給信息增加任何語(yǔ)義含義,其在底層數(shù)據(jù)間構(gòu)建了信息之間的鏈接,以攜帶語(yǔ)義的形式展現(xiàn)給用戶,通過(guò)將目前文檔web轉(zhuǎn)化成數(shù)據(jù)的Web,并在不同的數(shù)據(jù)間通過(guò)
URI建立關(guān)聯(lián),最終實(shí)現(xiàn)信息資源有效整合。
(三)關(guān)聯(lián)數(shù)據(jù)采用標(biāo)準(zhǔn)化的RDF描述信息資源。RDF是一種用來(lái)描述Web上資源的語(yǔ)言,將一個(gè)資源描述成一組三元組(主語(yǔ),謂語(yǔ),賓語(yǔ)),主語(yǔ)用來(lái)表示需要描述的資源,謂語(yǔ)用來(lái)表示主語(yǔ)的某個(gè)屬性或者某個(gè)關(guān)系,賓語(yǔ)表示了屬性的值[3]。主語(yǔ)、謂語(yǔ)都可以用 HTTP URI來(lái)表示,其中賓語(yǔ)也可以用 HTTP URI 標(biāo)識(shí)另一個(gè)資源。例如:Yantai University(主語(yǔ))is
located(謂語(yǔ)) in Yantai(賓語(yǔ))。主體和客體都是一個(gè)獨(dú)立的類資源,都有自己的HTTP URI標(biāo)示符,通過(guò)查看“Yantai Univer
siyt”的描述,還可以鏈接到客體“Yantai”的具體描述的信息,同時(shí)“Yantai”還有自己的屬性值可供參引。
二、基于關(guān)聯(lián)數(shù)據(jù)的知識(shí)組織模型
關(guān)聯(lián)數(shù)據(jù)主要使用URI,HTTP,RDF 等語(yǔ)義網(wǎng)技術(shù)來(lái)實(shí)現(xiàn),使信息組織更加細(xì)化、結(jié)構(gòu)化和語(yǔ)義化,同時(shí)能夠支持機(jī)器理解和處理,另外,其統(tǒng)一的數(shù)據(jù)模型(RDF)、統(tǒng)一的存取API
(RDF/SPARQL)、統(tǒng)一的HTTP URI標(biāo)識(shí),為信息對(duì)象的整合和組織提供了統(tǒng)一的標(biāo)準(zhǔn),使得在開(kāi)發(fā)應(yīng)用的時(shí)候可以考慮使用幾個(gè)平臺(tái)的混搭。本文設(shè)計(jì)了一個(gè)基于關(guān)聯(lián)數(shù)據(jù)的知識(shí)組織的技術(shù)體系,為知識(shí)組織提供新的研究方法和思路。
圖1 基于關(guān)聯(lián)數(shù)據(jù)的知識(shí)組織層次模型
從圖1可以得出,基于關(guān)聯(lián)數(shù)據(jù)的知識(shí)組織框架可以分為底層數(shù)據(jù)源、語(yǔ)義標(biāo)引層、RDF數(shù)據(jù)關(guān)聯(lián)層、信息資源應(yīng)用層,如下對(duì)四個(gè)層次進(jìn)行介紹。
(一)底層數(shù)據(jù)源的組織。數(shù)據(jù)源主要包括:來(lái)自不同領(lǐng)域的信息資源,可以是圖書(shū)的出版社、科學(xué)出版物的刊號(hào)、地名、人名、等具體化的數(shù)據(jù)資源;同時(shí)也可以是早已成型的關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù),如:圖書(shū)館的圖書(shū)目錄數(shù)據(jù)庫(kù)、企業(yè)內(nèi)部資源的數(shù)據(jù)庫(kù)、科研機(jī)構(gòu)的知識(shí)管理系統(tǒng)。這兩者是目前為止比較受歡迎的關(guān)聯(lián)數(shù)據(jù)底層數(shù)據(jù)源的組織形式,如果將這些信息源進(jìn)行整合、組織,以關(guān)聯(lián)數(shù)據(jù)的形式發(fā)布出去將會(huì)有驚人的發(fā)現(xiàn)。在此筆者將底層數(shù)據(jù)分為如下三類。(1)易于檢索的結(jié)構(gòu)化數(shù)據(jù)。這類數(shù)據(jù)主要設(shè)計(jì)到存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中的結(jié)構(gòu)化數(shù)據(jù),已經(jīng)有了成型的數(shù)據(jù)模型。(2)分散的異構(gòu)的網(wǎng)絡(luò)信息資源。主要指分布在網(wǎng)絡(luò)上,以html網(wǎng)頁(yè)的形式表達(dá)的、異構(gòu)的、分散的、形式多樣的數(shù)據(jù),對(duì)這些數(shù)據(jù)的聚合難度相對(duì)來(lái)說(shuō)比較大,要進(jìn)行充分的分析、預(yù)處理。(3)靜態(tài)的結(jié)構(gòu)化數(shù)據(jù)。主要包括了CSV、Excel、BibTeX格式的文件,這些文件要通過(guò)RD
Fizing等工具轉(zhuǎn)換成為RDF格式的數(shù)據(jù),然后存儲(chǔ)到RDF數(shù)據(jù)庫(kù)中發(fā)布。
(二)信息的語(yǔ)義標(biāo)引。語(yǔ)義標(biāo)注是使用計(jì)算機(jī)可理解的屬性來(lái)描述資源,目前的語(yǔ)義標(biāo)注中,標(biāo)注往往是針對(duì)特定的應(yīng)用,不能根據(jù)不同數(shù)據(jù)的特點(diǎn)而靈活變換標(biāo)注方法,如領(lǐng)域本體只是針對(duì)特定的領(lǐng)域內(nèi)的信息資源來(lái)標(biāo)注、概念化信息資源。進(jìn)一步而言,標(biāo)注方法只能標(biāo)注相互獨(dú)立的數(shù)據(jù)信息,涉及到數(shù)據(jù)之間的相互依賴、相互關(guān)聯(lián)時(shí),往往不能明確的標(biāo)注這種依賴關(guān)系。本文討論的關(guān)聯(lián)數(shù)據(jù)采用的是RDF三元組來(lái)描述資源,其中包括了“主體”,“謂語(yǔ)”,“客體”,使用規(guī)范的詞表標(biāo)注三元組陳述的“謂語(yǔ)”,不僅靈活的描述了信息資源,信息資源間的相互依賴關(guān)系清晰的展現(xiàn)了出來(lái)。RDF僅僅使用特定命名和值來(lái)表達(dá)與資源有關(guān)的簡(jiǎn)單聲明,很大程度上了限制了用戶的使用范圍,比如說(shuō)定義Person類了來(lái)描述人,定義Orga
nization類來(lái)描述機(jī)構(gòu)等,因此需要擴(kuò)展更多的詞表。DC、
FOAF、OWL、SKOS等規(guī)范的詞表擴(kuò)展了RDF/RDFS的描述能力,作為關(guān)聯(lián)數(shù)據(jù)集和用戶之間的橋梁得到了很好的應(yīng)用,充實(shí)飽滿的描述了信息資源。
(三) RDF數(shù)據(jù)關(guān)聯(lián)層。RDF數(shù)據(jù)關(guān)聯(lián)層是通過(guò)數(shù)據(jù)集內(nèi)部的URI來(lái)實(shí)現(xiàn),一個(gè)RDF三元組描述了一個(gè)數(shù)據(jù)對(duì)象,這個(gè)數(shù)據(jù)對(duì)象的客體或者主體在其他RDF三元組中也有類似的描述或者相依賴的資源,這樣就需要構(gòu)建這兩個(gè)RDF數(shù)據(jù)描述間的關(guān)聯(lián),此中情況只是針對(duì)本地?cái)?shù)據(jù)庫(kù)中的信息資源。另一個(gè)情況擴(kuò)展其他開(kāi)放的關(guān)聯(lián)數(shù)據(jù)集,因?yàn)檫@些數(shù)據(jù)集之間已經(jīng)形成了很好的數(shù)據(jù)鏈接,研究者只需要獲得相關(guān)對(duì)象的URI就可以鏈接到他們的數(shù)據(jù)集,從而把自己的數(shù)據(jù)集中的相關(guān)信息進(jìn)行擴(kuò)展。當(dāng)把開(kāi)放的數(shù)據(jù)集作為鏈接的潛在候選目標(biāo)時(shí),如下幾點(diǎn)應(yīng)該考慮在內(nèi):(1)目標(biāo)數(shù)據(jù)集中的主要領(lǐng)域是什么。(2)所鏈接的數(shù)據(jù)集中對(duì)象的URIs是否穩(wěn)定、保持不變。(3)目標(biāo)數(shù)據(jù)集和它的命名空間是否保持一致、不會(huì)隨時(shí)變化。(4)目標(biāo)數(shù)據(jù)集中的RDF links是否和其他關(guān)聯(lián)數(shù)據(jù)集保持無(wú)縫的鏈接,沒(méi)有死鏈接或者空節(jié)點(diǎn)。
(四)信息資源應(yīng)用層。發(fā)布為關(guān)聯(lián)數(shù)據(jù)的資源主要是通過(guò)以下方式瀏覽和檢索。(1)關(guān)聯(lián)數(shù)據(jù)主要是以URI來(lái)標(biāo)識(shí)數(shù)據(jù)對(duì)象的,通過(guò)HTTP參引可以找到相應(yīng)的資源RDF描述,通過(guò)數(shù)據(jù)間的RDF鏈接在這些相關(guān)的數(shù)據(jù)源間導(dǎo)航,獲得用戶感興趣的知識(shí)。(2)發(fā)布后的信息資源以RDF的形式呈現(xiàn),使得一些基于RDF的瀏覽器插件成為佼佼者,比如Tabulator
Browser、OpenLink RDF Browser插件在瀏覽關(guān)聯(lián)數(shù)據(jù)方面發(fā)揮了很大的優(yōu)勢(shì)。(3)SPARQL是為RDF開(kāi)發(fā)的一種查詢語(yǔ)言和數(shù)據(jù)獲取協(xié)議,能夠接收客戶端的查詢請(qǐng)求,可以在關(guān)聯(lián)數(shù)據(jù)源中像SQL那樣查詢,并把結(jié)果反饋給用戶,如Wikipedia、GeoNames、MusicBrainz、DBLP bibliography這些數(shù)據(jù)集都支持這種SPARQL端點(diǎn)查詢?cè)L問(wèn)模式。
三、學(xué)術(shù)論文特色數(shù)據(jù)資源的知識(shí)組織的實(shí)例
(一)學(xué)術(shù)論文特色知識(shí)庫(kù)的系統(tǒng)結(jié)構(gòu)。為了驗(yàn)證前文提出關(guān)聯(lián)數(shù)據(jù)在知識(shí)組織中的優(yōu)勢(shì)及框架的合理性,本文以“煙臺(tái)大學(xué)圖書(shū)館學(xué)術(shù)論文數(shù)據(jù)庫(kù)”為背景,構(gòu)建了基于關(guān)聯(lián)數(shù)據(jù)的特色知識(shí)庫(kù),遵循關(guān)聯(lián)數(shù)據(jù)的基本原則,揭示信息資源之間的內(nèi)在語(yǔ)義關(guān)聯(lián)。
圖2 學(xué)術(shù)論文知識(shí)庫(kù)系統(tǒng)模型
鑒于學(xué)術(shù)論文數(shù)據(jù)庫(kù)的特點(diǎn),采用D2R的方式將學(xué)位論文數(shù)據(jù)發(fā)布成富含語(yǔ)義的關(guān)聯(lián)數(shù)據(jù)。D2R Server是一個(gè)HTTP Server,支持將關(guān)系數(shù)據(jù)庫(kù)中的內(nèi)容發(fā)布成為RDF描述形式的關(guān)聯(lián)數(shù)據(jù)。D2R提供一種可定制的映射文件:D2RQ Mapping 文件,該映射文件將關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)轉(zhuǎn)換為虛擬的 RDF 數(shù)據(jù)進(jìn)行訪問(wèn),其中表的名字轉(zhuǎn)換成了映射文件中的類(d2rq:ClassMaps)、表中的列轉(zhuǎn)換成映射文件中的屬性(d2rq:Property
Bridges),通過(guò)映射文件中這兩個(gè)類和屬性來(lái)表示關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)表間的關(guān)系以及表內(nèi)不同屬性的關(guān)系。在用戶在前臺(tái)請(qǐng)求相關(guān)的信息實(shí)體時(shí),D2RQ Mapping 文件會(huì)映射到關(guān)系數(shù)據(jù)庫(kù),將查詢結(jié)果轉(zhuǎn)換為RDF描述的實(shí)體、屬性反饋給前臺(tái)界面。
(二) 學(xué)術(shù)論文資源的建模。以“煙臺(tái)大學(xué)圖書(shū)館學(xué)術(shù)論文數(shù)據(jù)庫(kù)”為主要數(shù)據(jù)源,對(duì)信息進(jìn)行了預(yù)處理,歸納為論文、作者、論文主題、組織機(jī)構(gòu)、論文所屬期刊五種實(shí)體類型,如下圖是它們的關(guān)系圖。
圖3 實(shí)體關(guān)系圖
本文采用SQL Server作為底層數(shù)據(jù)的存儲(chǔ)容器,上述幾個(gè)實(shí)體類分別包含了各自的數(shù)據(jù)項(xiàng),在關(guān)系數(shù)據(jù)庫(kù)建立相應(yīng)的表存儲(chǔ),如:Papers、Persons、Topic、Department、Periodical表。在后臺(tái)處理的時(shí)候還要考慮數(shù)據(jù)實(shí)體間的關(guān)聯(lián),Paper表中的作者字段必須和Persons表中的作者字段相關(guān)聯(lián)、Topics表中的論文名稱需關(guān)聯(lián)Papers表中的論文名等等。
(三)學(xué)術(shù)論文特色知識(shí)庫(kù)的實(shí)現(xiàn)。實(shí)現(xiàn)了底層數(shù)據(jù)的組織以后,就要采用D2R的方式將SQL Server關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)發(fā)布成為RDF描述數(shù)據(jù),這樣才能使關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)富含語(yǔ)義,數(shù)據(jù)之間形成鏈接的數(shù)據(jù)網(wǎng)。其實(shí)在通過(guò)D2R形式發(fā)布關(guān)系數(shù)據(jù)的時(shí)候,所形成的D2RQ Mapping映射文件將關(guān)系數(shù)據(jù)虛擬成為RDF格式,在上層瀏覽、查詢的時(shí)候通過(guò)此映射文件對(duì)關(guān)系數(shù)據(jù)庫(kù)進(jìn)行操作。
本實(shí)例使用的是SQL Server數(shù)據(jù)庫(kù),需要把SQL Server的驅(qū)動(dòng)包放到D2R Server的lib下,在進(jìn)行瀏覽、查詢的時(shí)候才能驅(qū)動(dòng)數(shù)據(jù)庫(kù)。然后需要運(yùn)行生成映射文件的腳本:gener
ate-Mapping [-u username] [-p password] [-d driverclass] [-o out
file.n3] [-b base uri] jdbcURL,參數(shù)的意義為:數(shù)據(jù)庫(kù)的登錄名、數(shù)據(jù)庫(kù)登錄密碼、驅(qū)動(dòng)名稱、輸出映射文件名、JDBC鏈接數(shù)據(jù)庫(kù)的URL。此腳本運(yùn)行后生成一個(gè)對(duì)應(yīng)關(guān)系數(shù)據(jù)庫(kù)的映射文件linkeddata.n3文件,用來(lái)實(shí)現(xiàn)上層關(guān)聯(lián)數(shù)據(jù)的展示和查詢。
其D2RQ Mapping是基于RDFS和OWL進(jìn)行描述的,自動(dòng)生成的與關(guān)系數(shù)據(jù)的映射文件顯得簡(jiǎn)單、粗糙。表之間的約束關(guān)系、關(guān)聯(lián)關(guān)系沒(méi)有形成很好的鏈接,謂詞的也是默認(rèn)的表中列的值,在表達(dá)語(yǔ)義方面顯得蒼白無(wú)力,與外部數(shù)據(jù)源間的鏈接也需要用詞表來(lái)描述。如下
實(shí)例中用到的部分詞表有dc:title表示論文的題目,dc:data論文發(fā)表的日期,dc:author論文的作者,dc:Description對(duì)論文的描述,foaf:person說(shuō)明這個(gè)類是用來(lái)描述人的,foaf:knows描述與此人有關(guān)系的人, skos:PrimaySubject描述該文獻(xiàn)的主題,
vcard:locality描述機(jī)構(gòu)的位置。這些規(guī)范詞表的使用規(guī)范了對(duì)數(shù)據(jù)的描述,更容易讓人明白要表達(dá)的關(guān)系,另外采用規(guī)范的詞表來(lái)描述,使機(jī)器也能很好的識(shí)別,關(guān)聯(lián)數(shù)據(jù)的共享和重復(fù)利用變得更加容易。
(四)結(jié)果分析。本實(shí)例經(jīng)過(guò)D2R發(fā)布后的關(guān)系數(shù)據(jù)庫(kù),使得信息資源使用RDF描述,并且富含語(yǔ)義,能比較好的展示數(shù)據(jù)之間的語(yǔ)義關(guān)聯(lián)。linked data技術(shù)在知識(shí)組織中的運(yùn)用,使得用戶可以通過(guò)HTML瀏覽關(guān)聯(lián)數(shù)據(jù),還可以通過(guò)SPARQL語(yǔ)言實(shí)現(xiàn)對(duì)關(guān)聯(lián)數(shù)據(jù)的查詢。Linked data不僅可以整合內(nèi)部相關(guān)的信息,使其深度序化,還實(shí)現(xiàn)了與外部相關(guān)數(shù)據(jù)的關(guān)聯(lián),對(duì)分布式異構(gòu)的網(wǎng)絡(luò)資源的整合提出了很好的解決辦法。準(zhǔn)備好數(shù)據(jù)后在D2R的路徑下啟動(dòng)服務(wù)器,運(yùn)行命令d2r-server linked
data.n3,在瀏覽器中輸入:http://127.0.0.1:2020/,即可進(jìn)行關(guān)聯(lián)數(shù)據(jù)的瀏覽。以一個(gè)作者的數(shù)據(jù)為例,如下圖4所示。關(guān)聯(lián)數(shù)據(jù)化后的作者元數(shù)據(jù)的屬性和實(shí)體都是比較靈活的,都有與之相關(guān)的URI導(dǎo)航到作者的所屬部門、發(fā)表的其他論文、合作者等等相關(guān)的信息。
圖4 關(guān)聯(lián)數(shù)據(jù)化的作者詳細(xì)信息
其中http://localhost:2020/data/persons/1是實(shí)體的唯一
URI,分別用實(shí)體和屬性來(lái)描述實(shí)體的,點(diǎn)擊圖4中屬性dc:cre
ator,可以導(dǎo)航到作者發(fā)表論文的描述。
圖 5 關(guān)聯(lián)數(shù)據(jù)化的論文信息
SPARQL是W3C的RDF數(shù)據(jù)工作組設(shè)計(jì)的一種查詢語(yǔ)言和協(xié)議,用于RDF數(shù)據(jù)的查詢。本實(shí)例也支持基于
SPARQL檢索。圖6中檢索的內(nèi)容是:在煙臺(tái)大學(xué)圖書(shū)館2000年以后發(fā)表的學(xué)術(shù)論文。
圖6 基于SPARQL語(yǔ)言的查詢界面
結(jié)論:本文利用關(guān)聯(lián)數(shù)據(jù)對(duì)煙臺(tái)大學(xué)圖書(shū)館學(xué)術(shù)論文數(shù)據(jù)庫(kù)再組織,實(shí)現(xiàn)了關(guān)聯(lián)數(shù)據(jù)的html導(dǎo)航瀏覽、SPARQL檢索服務(wù)。深層次的序化了學(xué)術(shù)論文的關(guān)聯(lián)關(guān)系,發(fā)掘?qū)W術(shù)論文中隱含的語(yǔ)義信息,比如說(shuō)學(xué)術(shù)論文所屬作者的合作關(guān)系、學(xué)術(shù)論文主題相關(guān)性、作者所屬部門的關(guān)聯(lián)等等,無(wú)縫的鏈接相關(guān)的信息資源,消除信息孤島使其富含語(yǔ)義,以知識(shí)鏈的形式呈現(xiàn)。
關(guān)聯(lián)數(shù)據(jù)一種輕量級(jí)的語(yǔ)義網(wǎng)實(shí)現(xiàn)方法,結(jié)構(gòu)簡(jiǎn)單適合混搭,沒(méi)有定義特定的實(shí)現(xiàn)方式和技術(shù),只是提出了發(fā)布的原則和要求,因此可以不受技術(shù)的限制,定制化自己的實(shí)現(xiàn)平臺(tái),其強(qiáng)調(diào)語(yǔ)義關(guān)聯(lián)、數(shù)據(jù)網(wǎng)絡(luò),無(wú)疑將成為未來(lái)信息聚合、知識(shí)呈現(xiàn)的佼佼者。關(guān)聯(lián)數(shù)據(jù)的發(fā)展帶來(lái)了語(yǔ)義網(wǎng)的普及,基于 RDF形式存在的數(shù)據(jù)也會(huì)不斷增多,如何消費(fèi)關(guān)聯(lián)數(shù)據(jù)、如何使用
SPARQL語(yǔ)言進(jìn)行語(yǔ)義發(fā)現(xiàn)將會(huì)成為研究熱點(diǎn)。
參考文獻(xiàn):
[1] 劉煒. 關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J]. 大學(xué)圖書(shū)館學(xué)報(bào),2011(02):05-12.
[2]夏翠娟. 關(guān)聯(lián)數(shù)據(jù)的發(fā)布技術(shù)及其實(shí)現(xiàn)——以Drupal 為例[J].中國(guó)圖書(shū)館學(xué)報(bào),2012(01):049-057.
[3] RDF Vocabulary Description Language 1.0:RDF Schema[EB/OL].[2012-06-09].