• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于本體和關(guān)聯(lián)數(shù)據(jù)的單元信息知識(shí)組織模式研究

      2019-05-07 07:50呂葉欣張娟
      現(xiàn)代情報(bào) 2019年5期
      關(guān)鍵詞:本體

      呂葉欣 張娟

      摘 要:[目的/意義]為滿足用戶多層次、多粒度的知識(shí)獲取需求,圖書(shū)館文獻(xiàn)資源組織的對(duì)象由文獻(xiàn)單元逐步向知識(shí)單元轉(zhuǎn)變。[方法/過(guò)程]文章在研究單元信息概念和表示模型的基礎(chǔ)上,提出基于本體和關(guān)聯(lián)數(shù)據(jù)的單元信息知識(shí)組織框架,并深入探討了實(shí)現(xiàn)單元信息語(yǔ)義組織的核心步驟。以中醫(yī)養(yǎng)生領(lǐng)域?yàn)槔U述單元信息知識(shí)組織語(yǔ)義模型的應(yīng)用過(guò)程。[結(jié)果/結(jié)論]本文構(gòu)建的單元信息知識(shí)組織模式,是實(shí)現(xiàn)單元信息細(xì)粒度組織、語(yǔ)義化揭示以及多維度關(guān)聯(lián)的有效途徑。該研究可為特定領(lǐng)域單元信息的語(yǔ)義應(yīng)用提供參考。

      關(guān)鍵詞:?jiǎn)卧畔?本體;關(guān)聯(lián)數(shù)據(jù);知識(shí)組織

      DOI:10.3969/j.issn.1008-0821.2019.05.006

      〔中圖分類(lèi)號(hào)〕G254.6 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2019)05-0041-07

      Abstract:[Purpose/Significance]For the purpose of users knowledge acquisition at multiple levels and multi granularity,the object of librarys literature resources organization has gradually shifted from a literature unit to a knowledge unit.[Method/Process]On the basis of researching unit information concept and representation model,this paper put forward a framework of unit information organization based on Ontology and Linked Data,and discusses in depth the core steps of realizing the semantic organization of unit information.Taking“Yang sheng”as an example,this paper presented the application process of the semantic model of unit information knowledge Organization.[Result/Conclusion]Unit information knowledge organization constructed in this paper was an effective way to implement fine-grained organization,semantic revelation and multi-dimensional correlation of unit information.This research can provide reference for the semantic application of unit information in other specific fields.

      Key words:unit information;ontology;linked data;knowledge organization

      隨著信息技術(shù)和數(shù)字圖書(shū)館的發(fā)展,圖書(shū)館傳統(tǒng)的以文獻(xiàn)單元為基礎(chǔ)的信息組織體系已經(jīng)不能滿足用戶的知識(shí)性需求。深入到文獻(xiàn)內(nèi)部,實(shí)現(xiàn)細(xì)粒度的單元信息的組織與檢索成為未來(lái)發(fā)展趨勢(shì)。通過(guò)對(duì)文獻(xiàn)中蘊(yùn)含的單元信息進(jìn)行分析抽取,并運(yùn)用語(yǔ)義技術(shù)和方法,達(dá)到對(duì)知識(shí)單元語(yǔ)義層面的組織,形成基于文獻(xiàn)的知識(shí)網(wǎng)絡(luò)。在此基礎(chǔ)上,實(shí)現(xiàn)具體的檢索、自動(dòng)分類(lèi)、智能推理方面的應(yīng)用。

      目前,國(guó)內(nèi)運(yùn)用語(yǔ)義技術(shù)實(shí)現(xiàn)細(xì)粒度知識(shí)的組織方法已經(jīng)取得了一些研究成果,如知識(shí)元表示、知識(shí)元抽取、知識(shí)元標(biāo)引。單元信息的知識(shí)組織方法可以借鑒知識(shí)元的研究成果,如知識(shí)元與本體的結(jié)合成為一種重要的知識(shí)組織表達(dá)方式,被應(yīng)用于各類(lèi)知識(shí)庫(kù)的構(gòu)建。但在文獻(xiàn)深度知識(shí)組織和開(kāi)發(fā)實(shí)踐中,目前較少引入關(guān)聯(lián)數(shù)據(jù)的相關(guān)技術(shù)和方法。關(guān)聯(lián)數(shù)據(jù)作為一種簡(jiǎn)化的語(yǔ)義網(wǎng)模型,可以實(shí)現(xiàn)不同領(lǐng)域、不同來(lái)源、不同系統(tǒng)間知識(shí)資源的關(guān)聯(lián),更好地實(shí)現(xiàn)知識(shí)之間的多維度關(guān)聯(lián)與開(kāi)放獲取。本文將本體和關(guān)聯(lián)數(shù)據(jù)引入單元信息的知識(shí)組織,通過(guò)對(duì)單元信息特征和專(zhuān)業(yè)領(lǐng)域的屬性和語(yǔ)義關(guān)系進(jìn)行描述和揭示,構(gòu)建多維鏈接的文獻(xiàn)知識(shí)網(wǎng)絡(luò)。

      1 單元信息及其知識(shí)組織框架

      1.1 單元信息概念

      知識(shí)單元作為知識(shí)組織的對(duì)象,目前學(xué)術(shù)界仍未形成統(tǒng)一認(rèn)識(shí)。馮汝佳等[1]從粒度原理出發(fā),對(duì)知識(shí)單元、知識(shí)元的概念做了界定。認(rèn)為知識(shí)單元是任意粒度的用于知識(shí)組織的文獻(xiàn)片斷。而知識(shí)元作為一種表征知識(shí)點(diǎn)的細(xì)粒度資源,是知識(shí)組織中不可分割的最小控制單位,如數(shù)據(jù)、事實(shí)、結(jié)論、公式等。知識(shí)單元可以是一個(gè)或多個(gè)知識(shí)元的集合。

      本文中的單元信息是指從文獻(xiàn)中提取的獨(dú)立、完整、有價(jià)值且不可拆分的內(nèi)容片段。單元信息在粒度層級(jí)上與知識(shí)元的概念一致,都是不可拆分的最小獨(dú)立單元。但在知識(shí)形態(tài)上又與知識(shí)單元相似,都是隱含在文獻(xiàn)中的片段信息。單元信息的實(shí)質(zhì)是一種細(xì)粒度的知識(shí)單元,是論述某一問(wèn)題的觀點(diǎn)、數(shù)據(jù)、方法等段落語(yǔ)句[2]。

      1.2 單元信息本體表示

      單元信息作為一種細(xì)粒度的知識(shí)單元,對(duì)其進(jìn)行知識(shí)組織和檢索其前提是要建立知識(shí)表示模型。目前細(xì)粒度知識(shí)資源的表示方法主要包括基于特征的線性知識(shí)表示方法和結(jié)構(gòu)化的知識(shí)表示方法。單元信息的線性描述模型雖能揭示單元信息的屬性特征,卻不能揭示單元信息內(nèi)在結(jié)構(gòu)和語(yǔ)義關(guān)聯(lián)。通過(guò)使用語(yǔ)義結(jié)構(gòu)代替?zhèn)鹘y(tǒng)線性結(jié)構(gòu)的知識(shí)表示模型,可以使用戶更容易通過(guò)語(yǔ)義元數(shù)據(jù)(Semantic Metadata)進(jìn)行高效檢索和瀏覽。此外,數(shù)字環(huán)境下依靠人工添加元數(shù)據(jù)的方式難以提高搜索引擎的檢索效率和準(zhǔn)確率,而結(jié)構(gòu)化和語(yǔ)義化的知識(shí)表示,能夠幫助機(jī)器實(shí)現(xiàn)自動(dòng)分類(lèi)、聚類(lèi)、數(shù)據(jù)挖掘及語(yǔ)義檢索[3]。在借鑒已有的知識(shí)元本體模型以及文獻(xiàn)本體模型的基礎(chǔ)上,結(jié)合單元信息自身的特點(diǎn),將單元信息結(jié)構(gòu)表示為:UI=〈s,c,p〉三元組。其中s表示來(lái)源文獻(xiàn)、c表示單元信息內(nèi)容,p表示單元信息屬性,其結(jié)構(gòu)表示模型如圖1所示:

      來(lái)源文獻(xiàn)包括圖書(shū)、期刊、學(xué)位論文3個(gè)子類(lèi),與單元信息間是整體與部分關(guān)系。內(nèi)容是單元信息的內(nèi)容本身,用戶可從中獲取知識(shí),其獨(dú)立完整且粒度小,用戶閱讀后都能掌握某一主題的相關(guān)知識(shí)[4]。屬性主要是單元信息的元數(shù)據(jù)項(xiàng),包括唯一標(biāo)示符(采用URI表示)、名稱(chēng)、主題、類(lèi)型、格式和創(chuàng)建者。元數(shù)據(jù)項(xiàng)的提取除對(duì)單元信息特征進(jìn)行描述和定位外,還能建立單元信息之間基于外部特征的顯性關(guān)聯(lián)關(guān)系,如責(zé)任者合作、關(guān)鍵詞共現(xiàn)等。主題詞是提取單元信息的重要內(nèi)容特征,是單元信息內(nèi)容的高度概括,其主要來(lái)源于領(lǐng)域本體中的概念表達(dá),通過(guò)主題標(biāo)注,生成一條或多條帶有標(biāo)注的主題句,能建立如上下位、等同、相關(guān)以及本體構(gòu)建的豐富語(yǔ)義關(guān)聯(lián),挖掘知識(shí)間的隱性關(guān)聯(lián)關(guān)系。類(lèi)型則通過(guò)分析單元信息內(nèi)容即主題句信息得到,類(lèi)型的提取主要用于基于單元信息內(nèi)容類(lèi)型的聚類(lèi)和瀏覽,包括方法、概念、事實(shí)、陳述和數(shù)值。單元信息的格式包括文本型、圖片型和視頻型,也可能是各種媒體類(lèi)型交叉和融合的,比如文本中含有圖片、視頻的綜合性多媒體單元信息。

      1.3 單元信息知識(shí)組織總體框架

      基于本體和關(guān)聯(lián)數(shù)據(jù)的單元信息組織是對(duì)海量、異源、異構(gòu)文獻(xiàn)信息資源進(jìn)行精確化抽取、細(xì)粒度揭示、深度序化和語(yǔ)義化組織的過(guò)程,其核心意義在于實(shí)現(xiàn)單元信息的語(yǔ)義關(guān)聯(lián)。單元信息知識(shí)組織包括知識(shí)資源和知識(shí)組織體系內(nèi)容建設(shè)[5]。知識(shí)資源包括單元信息、來(lái)源文獻(xiàn)以及相關(guān)外部數(shù)據(jù)集。知識(shí)組織體系是對(duì)單元信息進(jìn)行加工組織的方法體系,包括元數(shù)據(jù)、本體、關(guān)聯(lián)數(shù)據(jù)等語(yǔ)義網(wǎng)核心技術(shù)。通過(guò)元數(shù)據(jù)描述、本體建模、關(guān)聯(lián)數(shù)據(jù)組織模型構(gòu)建等方法實(shí)現(xiàn)對(duì)單元信息的外部特征和內(nèi)容特征的描述,知識(shí)屬性和關(guān)系屬性的揭示,語(yǔ)義表達(dá)單元信息關(guān)聯(lián)組織的需求,構(gòu)建多維文獻(xiàn)知識(shí)網(wǎng)絡(luò),為基于語(yǔ)義關(guān)聯(lián)的知識(shí)發(fā)現(xiàn)、查詢(xún)?yōu)g覽、本體可視化等知識(shí)服務(wù)和應(yīng)用提供底層源數(shù)據(jù)的組織管理模型。

      本文提出基于本體和關(guān)聯(lián)數(shù)據(jù)的單元信息知識(shí)組織框架如圖2所示,該框架為4層結(jié)構(gòu),從下至上分別為數(shù)據(jù)層、語(yǔ)義層(本體層)、關(guān)聯(lián)層和應(yīng)用層。各層功能相對(duì)獨(dú)立,上層功能基于底層功能實(shí)現(xiàn)。

      數(shù)據(jù)層是單元信息組織框架的基礎(chǔ),其中包括兩大部分:本地?cái)?shù)據(jù)源和外部數(shù)據(jù)集。本地信息源是指存儲(chǔ)于本地的單元信息庫(kù),是以文獻(xiàn)庫(kù)為基礎(chǔ),根據(jù)相應(yīng)的抽取規(guī)則人工或計(jì)算機(jī)自動(dòng)抽取出的單元信息集合。外部數(shù)據(jù)集是最終與單元信息庫(kù)進(jìn)行鏈接的數(shù)據(jù)對(duì)象集合。

      語(yǔ)義層(本體層)是實(shí)現(xiàn)單元信息組織的關(guān)鍵,原始信息缺乏明確的形式化定義,在分析單元信息資源特征、知識(shí)結(jié)構(gòu)、內(nèi)容特點(diǎn)基礎(chǔ)上構(gòu)建語(yǔ)義標(biāo)注模型,繼承、復(fù)用現(xiàn)有語(yǔ)義描述框架及本體基礎(chǔ)構(gòu)建與各類(lèi)相關(guān)資源相契合的語(yǔ)義關(guān)聯(lián)模型。其工作主要包括兩部分內(nèi)容:首先,采用owl語(yǔ)言基于本文搭建的語(yǔ)義標(biāo)注模型對(duì)單元信息進(jìn)行資源描述;其次,基于關(guān)聯(lián)數(shù)據(jù)原則,采用HTTP URI標(biāo)識(shí)所有資源,最大限度地復(fù)用已有本體或詞匯表對(duì)單元信息相關(guān)資源進(jìn)行規(guī)范描述;最后,將所有標(biāo)注后的資源轉(zhuǎn)換為統(tǒng)一的RDF格式,借助語(yǔ)義融合的關(guān)聯(lián)模型把具有語(yǔ)義的RDF鏈接顯性地揭示出來(lái),形成語(yǔ)義元數(shù)據(jù)網(wǎng)絡(luò)。

      關(guān)聯(lián)層是基于語(yǔ)義關(guān)聯(lián)模型以及各種技術(shù)支撐工具,實(shí)現(xiàn)對(duì)單元信息關(guān)聯(lián)數(shù)據(jù)的構(gòu)建、關(guān)聯(lián)與發(fā)布,并同時(shí)與網(wǎng)絡(luò)開(kāi)放的相關(guān)資源建立鏈接。依據(jù)語(yǔ)義關(guān)聯(lián)模型轉(zhuǎn)化的RDF數(shù)據(jù)集間生成了語(yǔ)義鏈接,從而真正實(shí)現(xiàn)單元信息之間以及單元信息與外部數(shù)據(jù)集間的語(yǔ)義關(guān)聯(lián),為上層提供一個(gè)統(tǒng)一的知識(shí)視圖。

      應(yīng)用層是基于上述組織過(guò)程的最終應(yīng)用實(shí)現(xiàn)。

      2 單元信息知識(shí)組織語(yǔ)義模型構(gòu)建

      構(gòu)建以單元信息為基礎(chǔ)的多維文獻(xiàn)知識(shí)網(wǎng)絡(luò),其核心步驟主要包括兩個(gè)方面:一是在本體的指導(dǎo)下,對(duì)單元信息進(jìn)行語(yǔ)義標(biāo)注,將非結(jié)構(gòu)化的單元信息轉(zhuǎn)化為規(guī)范的知識(shí)表示,實(shí)現(xiàn)單元信息的語(yǔ)義關(guān)聯(lián),為上層資源提供語(yǔ)義檢索;二是根據(jù)關(guān)聯(lián)數(shù)據(jù)特點(diǎn),通過(guò)對(duì)單元信息的特征及各類(lèi)實(shí)體間的相互關(guān)系進(jìn)行語(yǔ)義化、層次化、立體化的描述,建立單元信息與其他實(shí)體間的語(yǔ)義關(guān)聯(lián)關(guān)系,并采用關(guān)聯(lián)數(shù)據(jù)原則進(jìn)行發(fā)布,實(shí)現(xiàn)以單元信息為核心的網(wǎng)狀知識(shí)圖譜。

      2.1 單元信息本體標(biāo)注模型構(gòu)建

      單元信息模型的形式化表示主要是基于XML和基于本體的方法[6]?;诒倔w的單元信息語(yǔ)義標(biāo)注一般要基于某個(gè)領(lǐng)域。根據(jù)應(yīng)用目標(biāo)不同,可將本體在本研究中的應(yīng)用分為單元信息表示本體和領(lǐng)域本體。單元信息表示本體提供了一種知識(shí)表示框架,以層次表達(dá)的方式規(guī)范描述單元信息的內(nèi)容、出處、元數(shù)據(jù)等,實(shí)現(xiàn)了知識(shí)的形式化表示。領(lǐng)域本體提供了其所在領(lǐng)域知識(shí)的標(biāo)準(zhǔn)性描述,即領(lǐng)域知識(shí)的元數(shù)據(jù)或規(guī)范術(shù)語(yǔ)集,可在內(nèi)容層面豐富領(lǐng)域資源的語(yǔ)義關(guān)聯(lián)關(guān)系。采用兩種本體相結(jié)合的方式為單元信息的語(yǔ)義標(biāo)注提供系統(tǒng)的標(biāo)注框架,能更好地促進(jìn)隱性的知識(shí)挖掘。根據(jù)上述內(nèi)容,單元信息本體標(biāo)注模型構(gòu)建主要包括3方面工作:?jiǎn)卧畔⒈硎颈倔w設(shè)計(jì)、領(lǐng)域本體構(gòu)建以及兩者之間的關(guān)聯(lián)表示。如圖3所示:

      圖3 單元信息語(yǔ)義標(biāo)注模型

      上文已闡述了單元信息表示本體的構(gòu)建方法。采用Protégé工具及本體描述語(yǔ)言owl建立領(lǐng)域本體,通過(guò)Jena[7]技術(shù)完成對(duì)領(lǐng)域本體的解析,從而實(shí)現(xiàn)計(jì)算機(jī)的訪問(wèn)、操作和語(yǔ)義推理。領(lǐng)域本體的建立應(yīng)盡可能地重用已有知識(shí)資源來(lái)獲取領(lǐng)域概念,如敘詞表、分類(lèi)表以及本體等。上述各本體構(gòu)建后,單元信息描述本體使用對(duì)象屬性has Subject實(shí)現(xiàn)從單元信息到領(lǐng)域本體的關(guān)聯(lián),領(lǐng)域本體使用對(duì)象屬性has Resouce實(shí)現(xiàn)從概念到單元信息的關(guān)聯(lián),從而將單元信息實(shí)例中的主題詞同領(lǐng)域本體中的概念實(shí)例關(guān)聯(lián)起來(lái),通過(guò)領(lǐng)域本體構(gòu)建的豐富語(yǔ)義關(guān)聯(lián),利用推理機(jī)挖掘知識(shí)間的隱性關(guān)聯(lián)。此模型的優(yōu)點(diǎn)在于,替換任意單個(gè)本體不會(huì)對(duì)其他相關(guān)本體產(chǎn)生影響,是一種更為通用的單元信息標(biāo)注模型,同時(shí)滿足領(lǐng)域概念動(dòng)態(tài)擴(kuò)展的需求。經(jīng)過(guò)本體標(biāo)注和映射的單元信息鏈接成具有本體語(yǔ)義的知識(shí)網(wǎng)絡(luò),存儲(chǔ)于知識(shí)庫(kù)中,為實(shí)現(xiàn)知識(shí)推理和語(yǔ)義檢索提供了基礎(chǔ)。

      2.2 單元信息語(yǔ)義關(guān)聯(lián)模型構(gòu)建

      基于本體的語(yǔ)義標(biāo)注雖可實(shí)現(xiàn)對(duì)單元信息資源的細(xì)粒度組織和語(yǔ)義標(biāo)注,但不支持資源本身的開(kāi)放獲取,關(guān)聯(lián)數(shù)據(jù)作為語(yǔ)義網(wǎng)中使用URI和RDF發(fā)布、分享、連接各類(lèi)數(shù)據(jù)、信息和知識(shí)的最佳實(shí)踐[8],能滿足資源間廣泛關(guān)聯(lián)與開(kāi)放的知識(shí)組織需求,幫助用戶挖掘不同領(lǐng)域的知識(shí)資源,建立多維度的知識(shí)鏈接。關(guān)聯(lián)數(shù)據(jù)采用RDF數(shù)據(jù)模型,RDF三元組的URI采用來(lái)源于各種規(guī)范詞表及本體的URI來(lái)標(biāo)識(shí)知識(shí)對(duì)象,從而實(shí)現(xiàn)跨領(lǐng)域資源實(shí)體的規(guī)范性描述,為實(shí)現(xiàn)不同領(lǐng)域、不同來(lái)源、不同系統(tǒng)間資源實(shí)體的鏈接奠定了基礎(chǔ),具有較高的可獲取性[9]。

      由于關(guān)聯(lián)數(shù)據(jù)本身不具備語(yǔ)義功能,所以需要應(yīng)用已有的成熟的詞表或本體作為語(yǔ)義描述框架。單元信息語(yǔ)義關(guān)聯(lián)模型是通過(guò)對(duì)各類(lèi)實(shí)體的元數(shù)據(jù)項(xiàng)進(jìn)行分析和抽象,找出語(yǔ)義關(guān)聯(lián)性,定義類(lèi)及類(lèi)的屬性,盡可能復(fù)用現(xiàn)有廣泛使用的元數(shù)據(jù)或本體相關(guān)詞匯對(duì)各類(lèi)屬性進(jìn)行規(guī)范化描述(如DC、FOAF、SWRC),并對(duì)特定需求的屬性進(jìn)行擴(kuò)展。屬性包括表達(dá)概念之間關(guān)系的對(duì)象屬性和表達(dá)概念特征的數(shù)據(jù)屬性,通過(guò)對(duì)象屬性與其他實(shí)體類(lèi)進(jìn)行外部關(guān)聯(lián),建立各類(lèi)型資源間的語(yǔ)義關(guān)聯(lián)。根據(jù)單元信息本體描述模型,本文主要抽取了單元信息(ui:UintInformation)、來(lái)源文獻(xiàn)(ui:ResourceDocument)、學(xué)科人物(foaf:Person)3個(gè)核心實(shí)體類(lèi)初步建成單元信息關(guān)聯(lián)模型,屬性和類(lèi)間關(guān)系如表1所示:

      為以上實(shí)體類(lèi)及屬性,添加如下關(guān)聯(lián)條件:

      單元信息類(lèi)、來(lái)源文獻(xiàn)類(lèi)的屬性主要復(fù)用DCMI的部分核心元素,通過(guò)互逆屬性dcterms:hasPart和dcterms:isPartOf描述出來(lái)源文獻(xiàn)與單元信息間的整體與部分關(guān)系,單元信息類(lèi)、來(lái)源文獻(xiàn)類(lèi)通過(guò)對(duì)象屬性dcterms:creator與人物類(lèi)建立著者關(guān)聯(lián)。

      人物類(lèi)重用foaf:Person、swrc:FacultyMember的部分核心詞匯進(jìn)行語(yǔ)義描述。通過(guò)擴(kuò)展屬性foafx:createUI和對(duì)象屬性swrc:publication分別建立與單元信息類(lèi)、來(lái)源文獻(xiàn)類(lèi)的作品關(guān)聯(lián),也可通過(guò)foaf:topic_interet描述著者的研究領(lǐng)域,與主題概念建立關(guān)聯(lián)關(guān)系。

      此外,將知識(shí)組織資源(如主題詞表、術(shù)語(yǔ)表、分類(lèi)法以及各領(lǐng)域敘詞表)采用SKOS語(yǔ)義描述,其概念主題可通過(guò)dcterms:subject屬性與單元信息、來(lái)源文獻(xiàn)建立語(yǔ)義關(guān)聯(lián),將主題概念嵌入相關(guān)實(shí)例中,使各層次知識(shí)單元在主題層次上關(guān)聯(lián)起來(lái)。同時(shí),主題詞表等通用詞表可通過(guò)SKOS詞表[10]中定義的skos:broadMatch、skos:closeMatch、skos:exactMatch、skos:mappingRealtion、skos:narrowMatch、skos:narrowMatch詞匯鏈接實(shí)現(xiàn)與領(lǐng)域本體概念間的映射。

      單元信息關(guān)聯(lián)模型的構(gòu)建思路實(shí)現(xiàn)了從粗粒度的來(lái)源文獻(xiàn)到細(xì)粒度的單元信息,從二維知識(shí)組織層次到多維知識(shí)組織網(wǎng)絡(luò)的演化,全方位展現(xiàn)信息資源體系的語(yǔ)義關(guān)系。類(lèi)間語(yǔ)義關(guān)系如圖4所示。

      為單元信息關(guān)聯(lián)模型的每個(gè)概念節(jié)點(diǎn)添加實(shí)例,利用定義好的類(lèi)和屬性來(lái)描述具體的資源對(duì)象,形成語(yǔ)義元數(shù)據(jù)的關(guān)聯(lián)網(wǎng)絡(luò)。通過(guò)文本、圖片、

      視頻等形式,充分展現(xiàn)了單元信息與來(lái)源文獻(xiàn)、領(lǐng)域概念、人物之間的語(yǔ)義互聯(lián)關(guān)系。用戶可利用RDF語(yǔ)義鏈接,快速查找、獲取相關(guān)資源。

      本文建立的單元信息語(yǔ)義關(guān)聯(lián)模型是一種較為一般的模型,當(dāng)選定某一具體領(lǐng)域時(shí),可根據(jù)領(lǐng)域資源特點(diǎn)增加新的實(shí)體關(guān)系,構(gòu)建語(yǔ)義化程度更高的關(guān)聯(lián)模型。

      3 單元信息知識(shí)組織語(yǔ)義模型應(yīng)用實(shí)例——以中醫(yī)養(yǎng)生領(lǐng)域?yàn)槔?/p>

      本文以中醫(yī)養(yǎng)生領(lǐng)域?yàn)槔纠龁卧畔⒅R(shí)組織語(yǔ)義模型的應(yīng)用過(guò)程,主要包括以下幾個(gè)步驟:

      第一步,根據(jù)單元信息鑒選原則[11]從權(quán)威出版社、核心期刊發(fā)表的中醫(yī)養(yǎng)生領(lǐng)域文獻(xiàn)中抽取單元信息。本文選取兩段單元信息作為標(biāo)注示例。

      單元信息一:高血壓是常見(jiàn)的心血管疾病危險(xiǎn)因素之一,隸屬于中醫(yī)的“眩暈”范疇。其病因主要有情志不遂、飲食不節(jié)、體虛年高、跌仆外傷等[12]。

      單元信息二:孫思邈《備急千金要方·風(fēng)眩》首次提出“風(fēng)?!钡牟∶岸x:“夫風(fēng)眩之病,起于心氣 不定,胸上蓄實(shí),鼓有高風(fēng)面熱之所為也。痰熱相感而動(dòng)風(fēng),風(fēng)心相亂則悶 瞀,故謂之風(fēng)眩”。并提出風(fēng)、熱、痰致眩的觀點(diǎn)[13]。

      第二步,參考領(lǐng)域本體構(gòu)建框架進(jìn)行中醫(yī)養(yǎng)生本體建模,規(guī)范中醫(yī)養(yǎng)生領(lǐng)域中概念描述及關(guān)聯(lián)關(guān)系[14]。

      第三步,基于單元信息語(yǔ)義標(biāo)注模型(如圖3所示)對(duì)上文中抽取的道家養(yǎng)生理論單元信息進(jìn)行語(yǔ)義標(biāo)注;以上文確定的元數(shù)據(jù)標(biāo)準(zhǔn)對(duì)其來(lái)源文獻(xiàn)、相關(guān)人員進(jìn)行標(biāo)準(zhǔn)化描述,并在描述過(guò)程中建立內(nèi)容對(duì)象之間的關(guān)聯(lián)關(guān)系。使用URI引用機(jī)制對(duì)這些資源對(duì)象進(jìn)行標(biāo)識(shí),如圖5、圖6所示。

      圖5、圖 6以RDF三元組形式表達(dá)了單元信息內(nèi)容本身、單元信息之間以及單元信息與來(lái)源文獻(xiàn)、 領(lǐng)域?qū)<?、養(yǎng)生領(lǐng)域本體概念等外部資源的屬性、屬性值以及它們之間的邏輯關(guān)系。在實(shí)際應(yīng)用中,采用RDF/XML序列化方式進(jìn)行存儲(chǔ)。

      圖5中“內(nèi)容”實(shí)例是兩段單元信息片段的內(nèi)容本身,通過(guò)主題概念“飲食不節(jié)”與“高血壓”之間的“導(dǎo)致”關(guān)系、“眩暈”與“高血壓”之間的"對(duì)應(yīng)"關(guān)系,語(yǔ)義揭示單元信息片斷本身的邏輯關(guān)系。通過(guò)概念實(shí)例“高血壓”與“風(fēng)?!敝g的等同關(guān)系以及“風(fēng)熱痰”與高血壓之間的“導(dǎo)致”關(guān)系建立起兩段單元信息之間的語(yǔ)義關(guān)聯(lián)。

      圖6中“內(nèi)容”實(shí)例是高血壓病因單元信息,與來(lái)源文獻(xiàn)實(shí)例“中醫(yī)養(yǎng)生來(lái)源文獻(xiàn)”通過(guò)“dcterms:isPartof”建立整體與部分關(guān)系,通過(guò)“dcterms:subject”與中醫(yī)養(yǎng)生本體概念實(shí)例(高血壓、眩暈)相關(guān)聯(lián),與養(yǎng)生領(lǐng)域?qū)<腋鱾€(gè)子類(lèi)的實(shí)例通過(guò)“dcterms:creator”相關(guān)。用戶在獲取高血壓病因單元信息的同時(shí),不僅可以查找來(lái)源文獻(xiàn)的相關(guān)信息,還可以查找到作者的其他研究成果以及擅長(zhǎng)的領(lǐng)域,建立起與中醫(yī)養(yǎng)生領(lǐng)域本體中定義的核心概念之間的關(guān)聯(lián)。

      第四步,通過(guò)語(yǔ)義關(guān)聯(lián)模型(如圖4所示),在各種軟硬件工具的支撐下進(jìn)行單元信息關(guān)聯(lián)數(shù)據(jù)集的創(chuàng)建與發(fā)布,最終實(shí)現(xiàn)資源間的語(yǔ)義關(guān)聯(lián),為用戶提供單元信息在線瀏覽與分類(lèi)導(dǎo)航、本體可視化瀏覽與檢索以及基于SPARQl的查詢(xún)等語(yǔ)義應(yīng)用服務(wù)。

      參考文獻(xiàn)

      [1]馮儒佳,王忠義,王艷鳳,等.科技論文的多粒度知識(shí)組織框架研究[J].情報(bào)科學(xué),2016,(12):46-54.

      [2]張娟,倪曉建.精準(zhǔn)服務(wù)與單元信息組織探析[J].圖書(shū)館理論與實(shí)踐,2017,(8):50-52.

      [3]徐昊.科技知識(shí)對(duì)象的語(yǔ)義模式研究[D].長(zhǎng)春:吉林大學(xué),2013:1-109.

      [4]許春漫.泛在知識(shí)環(huán)境下知識(shí)元的構(gòu)建與檢索[J].情報(bào)理論與實(shí)踐,2014,(2):107-111.

      [5]付苓.面向大數(shù)據(jù)的單元信息知識(shí)組織體系建設(shè)框架[J]情報(bào)理論與實(shí)踐,2016,(6):96-98.

      [6]付苓.基于本體網(wǎng)絡(luò)概念化單元信息研究[J]情報(bào)雜志,2018,37(1):122-125.

      [7]HP LABS.Jena-A Semantic Web Framework for Java[EB/OL].http://jena.sourceforge.net/index.html,2011-09-25.

      [8]Bizer C,Heath T,Berners-Lee T.Linked Data-The Story So Far[J].International Journal on Semantic Web and Information System,2009,5(3):1-22.

      [9]翟?shī)檴?基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合研究[M]北京:科學(xué)出版社,2015.

      [10]Bechhofer S,Miles A.SKOS Simple Knowledge Organization System Reference[EB/OL].http://www.w3.org/TR/skos-reference/,2014-05-26.

      [11]倪曉建.問(wèn)道書(shū)淵:圖書(shū)館工作偶拾[M].上海:上??茖W(xué)技術(shù)出版社,2014.

      [12]司亞雪.中醫(yī)養(yǎng)生健康教育對(duì)高血壓患者生活方式的影響[J].中國(guó)中醫(yī)藥現(xiàn)代遠(yuǎn)程教育,2011,(12):85-86.

      [13]顧寧,陳紅錦.高血壓病中醫(yī)特色療法[M].北京:人民軍醫(yī)出版社,2012.

      [14]中醫(yī)養(yǎng)生本體[EB/OL].http://www.tcmkb.cn/ontologies/health/,2015-10-01.

      (責(zé)任編輯:陳 媛)

      猜你喜歡
      本體
      Abstracts and Key Words
      灰鑄鐵缸體本體抗拉強(qiáng)度提升的研究
      眼睛是“本體”
      對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
      領(lǐng)域本體的查詢(xún)擴(kuò)展和檢索研究
      基于本體的機(jī)械產(chǎn)品工藝知識(shí)表示
      本體在產(chǎn)品設(shè)計(jì)知識(shí)管理中的應(yīng)用研究
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      一種基于本體的語(yǔ)義檢索設(shè)計(jì)與實(shí)現(xiàn)
      媒介生存:關(guān)于新聞史研究本體的思考
      黔西| 金堂县| 宜昌市| 永城市| 郸城县| 罗源县| 吉林市| 昭觉县| 沂南县| 普兰店市| 敦煌市| 祥云县| 宁海县| 志丹县| 靖江市| 淳化县| 衢州市| 米易县| 阿鲁科尔沁旗| 安宁市| 长治县| 沐川县| 碌曲县| 吉林市| 岫岩| 赤峰市| 嘉祥县| 汉源县| 青河县| 佳木斯市| 惠安县| 蕲春县| 雅安市| 新巴尔虎右旗| 枣强县| 奉化市| 宜宾县| 祁东县| 惠州市| 山阳县| 开远市|