• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      高等學(xué)校開放數(shù)字資源的本體構(gòu)建和利用

      2020-07-26 14:19軒旭
      科技創(chuàng)新與應(yīng)用 2020年22期
      關(guān)鍵詞:知識(shí)共享數(shù)字資源

      軒旭

      摘? 要;文章通過(guò)對(duì)于語(yǔ)義Web技術(shù)的理論基礎(chǔ)、結(jié)構(gòu)層次和框架的分析,比較不同技術(shù)的特點(diǎn),并給出了語(yǔ)義Web數(shù)字資源整合總體框架和流程。根據(jù)數(shù)字資源的不同類型,利用本體、語(yǔ)義網(wǎng)服務(wù)和搜索引擎,提出分布式的數(shù)字資源整合方案,實(shí)現(xiàn)了主要數(shù)據(jù)類型的資源共享。探討了從OWL模型到UML模型之間的轉(zhuǎn)換,并對(duì)如何利用語(yǔ)義Web進(jìn)行開發(fā),提出應(yīng)注意的問(wèn)題和相應(yīng)的解決措施。

      關(guān)鍵詞:語(yǔ)義Web;數(shù)字資源;知識(shí)共享

      中圖分類號(hào):G25? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號(hào):2095-2945(2020)22-0014-04

      Abstract: Through the analysis of the theoretical basis, structure and framework of semantic Web technology, this paper compares the characteristics of different technologies, and gives the overall framework and process of semantic Web digital resource integration. According to the different types of digital resources, a distributed digital resource integration scheme is proposed by using ontology, semantic web service and search engine, and the resource sharing of main data types is realized. This paper discusses the transformation from OWL model to UML model, and puts forward some problems that should be paid attention to and corresponding solutions to how to develop with semantic Web.

      Keywords: semantic Web; digital resources; knowledge sharing

      1 背景和需求

      語(yǔ)義Web 是下一代互聯(lián)網(wǎng)發(fā)展的核心技術(shù)之一,數(shù)字資源的日趨豐富是推動(dòng)網(wǎng)絡(luò)向智能化和自動(dòng)化方向發(fā)展的重要?jiǎng)恿?。語(yǔ)義網(wǎng)賦予知識(shí)具體的形式,使它具有計(jì)算機(jī)可讀性,以及對(duì)知識(shí)庫(kù)進(jìn)行方便的集成和推理。語(yǔ)義Web本身是一個(gè)數(shù)據(jù)網(wǎng),通過(guò)對(duì)數(shù)據(jù)進(jìn)行各種方式的描述,以便形成具有遵守特定語(yǔ)法和語(yǔ)義的上下文,即具有相互關(guān)聯(lián)的語(yǔ)義。數(shù)據(jù)資源由于需要特定的存儲(chǔ)方式,呈現(xiàn)出表達(dá)形式的多樣性,結(jié)構(gòu)化程度不一。而對(duì)大量的資源的查詢,為獲得更為準(zhǔn)確和針對(duì)性的結(jié)果,就需要對(duì)各種數(shù)據(jù)進(jìn)行整合和組織,使之能體現(xiàn)知識(shí)的內(nèi)在聯(lián)系,讓知識(shí)的表達(dá)完備和清晰。語(yǔ)義Web具有以數(shù)據(jù)為中心的組織特征以及對(duì)知識(shí)庫(kù)的推理能力,成為對(duì)資源進(jìn)行組織的一種有效方式。

      Web由國(guó)際化聯(lián)盟機(jī)構(gòu)W3C進(jìn)行管理,根據(jù)Tim Berners-lee等人的定義:“語(yǔ)義Web不是另外一個(gè)Web,它是現(xiàn)有Web的延伸,其中信息被良好的定語(yǔ)了含義,從而使計(jì)算機(jī)可以更好地協(xié)同人工作。”語(yǔ)義Web提供了在應(yīng)用、企業(yè)和社區(qū)之間數(shù)據(jù)共享的通用框架。語(yǔ)義Web搜索技術(shù)和語(yǔ)義服務(wù)技術(shù)是兩項(xiàng)正在發(fā)展的遠(yuǎn)未成熟的技術(shù),都已經(jīng)有了不同程度的實(shí)現(xiàn)。語(yǔ)義Web搜索實(shí)現(xiàn)了語(yǔ)義標(biāo)注的索引以及基于標(biāo)注本體和知識(shí)庫(kù)的推理,能夠檢索出內(nèi)容對(duì)象并給出明確的關(guān)系。語(yǔ)義Web服務(wù)通過(guò)富含語(yǔ)義的服務(wù)信息可以為服務(wù)加入計(jì)算機(jī)可讀性,便于服務(wù)的自動(dòng)的發(fā)現(xiàn)、組合、協(xié)商和調(diào)用,便于數(shù)據(jù)資源的利用,不僅包括服務(wù)而且包括數(shù)據(jù)。

      2 不同形式數(shù)據(jù)資源的發(fā)現(xiàn)和利用方式

      當(dāng)今教育、科研、圖書館數(shù)字資源存在大量的重復(fù)建設(shè),由于各種標(biāo)準(zhǔn)和應(yīng)用平臺(tái)之間的不兼容,本應(yīng)相互關(guān)聯(lián)結(jié)構(gòu)完備的知識(shí)卻是以點(diǎn)的或碎片的形式提供給應(yīng)用者。原因在于當(dāng)前的檢索技術(shù)僅是以關(guān)鍵詞作為檢索詞,無(wú)法清晰理解語(yǔ)言的含義,并進(jìn)行必要的推理。通過(guò)語(yǔ)義Web能夠把數(shù)據(jù)資源公開到網(wǎng)絡(luò)上,形成具有語(yǔ)義的知識(shí)內(nèi)容,便于搜索和利用。語(yǔ)義Web上的數(shù)字資源的表達(dá)的方式多種多樣,通過(guò)語(yǔ)義Web對(duì)信息進(jìn)行信息的整合,以一個(gè)整體的視角來(lái)看,即是通過(guò)語(yǔ)義Web的本體技術(shù),利用標(biāo)注、搜索和語(yǔ)義網(wǎng)絡(luò)服務(wù)組合,把傳統(tǒng)數(shù)據(jù)資源轉(zhuǎn)換為具有一定語(yǔ)義的能夠通過(guò)Web訪問(wèn)的數(shù)據(jù)資源知識(shí)庫(kù)。語(yǔ)義Web能夠使用導(dǎo)航、搜索或檢索的方式訪問(wèn)資源,對(duì)知識(shí)進(jìn)行有效的組織,并可以進(jìn)行進(jìn)一步的推理和利用。導(dǎo)航簡(jiǎn)單明了地利用可視化的方式顯示資源的位置和它們之間的聯(lián)系,搜索可以訪問(wèn)分布于不同位置的資源存儲(chǔ),而檢索可以進(jìn)行完備和準(zhǔn)確的查詢。傳統(tǒng)數(shù)據(jù)包括網(wǎng)頁(yè)、數(shù)據(jù)庫(kù)、多媒體等內(nèi)容。不同的數(shù)據(jù)都可以利用分布網(wǎng)絡(luò)的形式,通過(guò)超文本鏈接的方式組織起來(lái)。對(duì)于Web的內(nèi)容,通過(guò)在網(wǎng)頁(yè)中嵌入語(yǔ)義或添加標(biāo)注充實(shí)已有的網(wǎng)站,使網(wǎng)頁(yè)的內(nèi)容之間的關(guān)系明確,易于人類或者智能代理的理解和利用。各種數(shù)據(jù)庫(kù)的集成,需要利用語(yǔ)義Web技術(shù)提供的多種映射功能集成各種知識(shí),以面向特定應(yīng)用程序的本體作為知識(shí)模型和應(yīng)用程序之間的接口,完成跨領(lǐng)域的信息交換。對(duì)于多媒體內(nèi)容以及文本中的實(shí)體的處理,現(xiàn)在仍以手工分類整理為主,采取文本處理的方法,用關(guān)鍵詞、創(chuàng)建時(shí)間或者特定的元數(shù)據(jù)等進(jìn)行標(biāo)引,成本較高。檢索大多局限于多媒體的外部特征方面,而發(fā)展方向應(yīng)是基于內(nèi)容的檢索?;趦?nèi)容的檢索是對(duì)多媒體對(duì)象的內(nèi)容及上下文語(yǔ)義環(huán)境所進(jìn)行的檢索,既能對(duì)以文本為代表的離散媒體進(jìn)行檢索,也可以對(duì)聲音、圖像、視頻等連續(xù)媒體進(jìn)行檢索。其內(nèi)容包括物理層、邏輯層、語(yǔ)義層三個(gè)不同層次。例如圖像的顏色特征、紋理特征、性狀特征屬于物理層,圖像對(duì)象的空間位置和相互關(guān)系屬于邏輯層,而語(yǔ)義層是圖像表達(dá)的意識(shí)。通過(guò)引入本體和語(yǔ)義標(biāo)注,為多媒體的深處理提供了新的方法,尤其在多媒體的語(yǔ)義層面。從原始數(shù)據(jù)到跨領(lǐng)域的信息共享,需要利用本文提到的不同的方法。

      3 引入數(shù)據(jù)資源到語(yǔ)義豐富的知識(shí)庫(kù)

      以下從兩個(gè)方面對(duì)構(gòu)建知識(shí)庫(kù)進(jìn)行說(shuō)明:(1)語(yǔ)義Web信息整合的基本內(nèi)容和框架結(jié)構(gòu)。(2)通過(guò)本體技術(shù)進(jìn)行整合的原理、過(guò)程和方法。

      3.1 語(yǔ)義Web信息整合的基本內(nèi)容和框架結(jié)構(gòu)

      語(yǔ)義Web的基礎(chǔ)是數(shù)據(jù)表示、查詢和應(yīng)用規(guī)則一組標(biāo)準(zhǔn)。語(yǔ)義Web解決的問(wèn)題主要在于:將Web數(shù)據(jù)轉(zhuǎn)化為計(jì)數(shù)機(jī)可以理解的形式;提供一種構(gòu)建領(lǐng)域知識(shí)的模型;不同領(lǐng)域的信息交換。主要技術(shù)包括資源描述框架RDF,用于構(gòu)造的RDFS,以及用于構(gòu)建和描述的Web本體語(yǔ)言O(shè)WL。RDF定義三元組形式的數(shù)據(jù)模型,在語(yǔ)義網(wǎng)中,信息被表示成陳述的斷言集合,每一個(gè)陳述由三部分組成:主語(yǔ)、謂語(yǔ)和賓語(yǔ)。RDFS是一種面向資源描述框架的詞匯表語(yǔ)言,用語(yǔ)義一致的公共詞匯集合對(duì)RDF中使用的資源和屬性,表達(dá)RDF信息的含義。OWL是面向Web的本體語(yǔ)言,它擴(kuò)展了RDFS的詞匯表,引入了更多的約束,可進(jìn)行推理過(guò)程,是更高層級(jí)的語(yǔ)言。三者之間體現(xiàn)一種進(jìn)化的關(guān)系。

      Tim Berners-lee 在2000年提出最初的語(yǔ)言Web層次模型,其后隨著語(yǔ)義技術(shù)的發(fā)展,該模型不斷完善。通過(guò)UNICODE和URI層,支持語(yǔ)義Web上的對(duì)象和資源標(biāo)識(shí);XML及命名空間層,支持創(chuàng)建結(jié)構(gòu)化的XML文檔和在Web上交換文檔;RDF和RDFS 層、本體層兩層給出基本數(shù)據(jù)模型和各種資源的關(guān)系;邏輯層和證明層提供公理和推理規(guī)則,進(jìn)行演繹和證明;信任層提供信任機(jī)制。

      大多數(shù)的語(yǔ)義Web的框架結(jié)構(gòu)都是一組工具的集合,通常包括3種基礎(chǔ)組件:存儲(chǔ)、推理和訪問(wèn)。存儲(chǔ)組件是RDF陳述的知識(shí)庫(kù),如Sesame、jena存儲(chǔ)系統(tǒng)。推理組件是推理引擎,如Racer、Pellet等。訪問(wèn)組件是查詢搜索的應(yīng)用程序處理器。語(yǔ)言、框架和模型通過(guò)抽象規(guī)范化標(biāo)準(zhǔn)找出兼容的解決方案。

      3.2 通過(guò)本體技術(shù)進(jìn)行整合的原理,過(guò)程和方法

      為了利用傳統(tǒng)數(shù)據(jù),首先要做的就是把不同形式的數(shù)據(jù)轉(zhuǎn)化為以RDF描述的本體方式;然后對(duì)不同領(lǐng)域本體進(jìn)行轉(zhuǎn)換,使領(lǐng)域本體對(duì)準(zhǔn)(Ontology alignment),將數(shù)據(jù)引入到領(lǐng)域知識(shí)模型中,形成知識(shí)庫(kù);最后通過(guò)Web和各種接口訪問(wèn)分布的知識(shí)庫(kù)。轉(zhuǎn)換這些數(shù)據(jù)的方法正是本文討論的重點(diǎn)內(nèi)容。數(shù)據(jù)資源主要有如下幾種:數(shù)據(jù)庫(kù)、XML描述的文檔、網(wǎng)頁(yè)、文本、多媒體,不同的形式?jīng)Q定了轉(zhuǎn)化為本體的復(fù)雜程度,而且結(jié)構(gòu)化程度的不同程度決定了向本體轉(zhuǎn)換的深度和顆粒度程度。按照數(shù)據(jù)的結(jié)構(gòu)化程度,可以把數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù),即可以用二維表結(jié)構(gòu)來(lái)邏輯表達(dá)實(shí)現(xiàn)的數(shù)據(jù):存儲(chǔ)在數(shù)據(jù)庫(kù)里的數(shù)據(jù);半結(jié)構(gòu)化數(shù)據(jù):就是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無(wú)結(jié)構(gòu)的數(shù)據(jù)之間的數(shù)據(jù),它一般是自描述的,數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容混在一起,沒(méi)有明顯的區(qū)分,能用樹或圖的模型表示。包括HTML文檔、XML文檔和各類報(bào)表等;非結(jié)構(gòu)化數(shù)據(jù):聲音、圖像、視頻等多媒體文件。轉(zhuǎn)換這些數(shù)據(jù)的方法正是整合資源的重點(diǎn)內(nèi)容。根據(jù)結(jié)構(gòu)化程度不同,把數(shù)據(jù)轉(zhuǎn)換為RDF格式主要有以下幾種方式:

      3.2.1 對(duì)結(jié)構(gòu)化的數(shù)據(jù)-數(shù)據(jù)庫(kù)數(shù)據(jù)的轉(zhuǎn)換

      對(duì)于數(shù)據(jù)庫(kù)和其它數(shù)據(jù)規(guī)范程度較高、數(shù)據(jù)量大的數(shù)據(jù)處理,是語(yǔ)義Web的重要任務(wù),RDF和OWL與關(guān)系數(shù)據(jù)庫(kù)一樣,都適用于對(duì)實(shí)體-關(guān)系模型中的信息進(jìn)行建模,可以把數(shù)據(jù)庫(kù)的表和列映射到本體的類和屬性上。目前已有多種工具(如D2RQ、SquirrelRDF)把關(guān)系數(shù)據(jù)庫(kù)中數(shù)據(jù)轉(zhuǎn)換為虛擬的RDF圖,作為一個(gè)SPARQL查詢的端點(diǎn)被訪問(wèn),或直接從SQL結(jié)果生成RDF,也可以制定一個(gè)流式的寫RDF文件接口程序,進(jìn)行大批量的轉(zhuǎn)換。

      3.2.2 對(duì)于半結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)換

      (1)基于XML格式的數(shù)據(jù)轉(zhuǎn)換。網(wǎng)絡(luò)上有海量的XML數(shù)據(jù)資源可以使用,XML是樹形結(jié)構(gòu),每個(gè)節(jié)點(diǎn)包含節(jié)點(diǎn)的屬性和子節(jié)點(diǎn),XMLschema用來(lái)表示文檔中節(jié)點(diǎn)的數(shù)據(jù)類型和預(yù)期節(jié)點(diǎn),而RDF三元組的圖結(jié)構(gòu)是表示使用屬性聯(lián)結(jié)資源的陳述。由于將結(jié)構(gòu)和屬性轉(zhuǎn)換為資源和關(guān)系很難找到通用的方法,所以要作具體考慮。從XML轉(zhuǎn)換到RDF需要較多的方法和步驟。利用可擴(kuò)展樣式表語(yǔ)言轉(zhuǎn)換XSTL是一種常用的方式。它首先生成用于影射的模版,然后將源文檔進(jìn)行解析,按路徑對(duì)XML文檔樹的節(jié)點(diǎn)進(jìn)行匹配,處理節(jié)點(diǎn)的結(jié)構(gòu)和取值,生成對(duì)應(yīng)的RDF文檔。這種方法的好處是可以把轉(zhuǎn)換的配置保存在程序的外部,當(dāng)源文檔發(fā)生變化時(shí),并不需要對(duì)程序作新的改變。

      (2)對(duì)任意的Java對(duì)象的轉(zhuǎn)換和數(shù)據(jù)公開。Java Reflection API允許對(duì)任意對(duì)象進(jìn)行操作,首先推斷該對(duì)象是哪一個(gè)類的實(shí)例,隨后得到這些類的信息,包括屬性名稱、修飾符和合屬性,然后為每一個(gè)對(duì)象生成類型信息、屬性和值的信息,最后進(jìn)行序列化成輸出流,存儲(chǔ)為RDF文件。由于很多數(shù)據(jù)形式能夠通過(guò)不同的方式最終轉(zhuǎn)換成Java數(shù)據(jù)對(duì)象。如以下兩種方式都可以進(jìn)行XML到Java對(duì)象轉(zhuǎn)換,a.通過(guò)JAXB(Java Architecture for XML Binding簡(jiǎn)稱JAXB)產(chǎn)生Java類的集合,XML文檔的節(jié)點(diǎn)被表示成protected類型的成員變量,然后把XML中的數(shù)值編出(unmarshal)到對(duì)象中,產(chǎn)生Java對(duì)象(圖1)。b.或者利用文檔對(duì)象模型DOM解析XML文檔,然后將其裝載在Java對(duì)象中,所以這是一種一般化的方法。

      (3)對(duì)于RDFa和各種微格式解析和轉(zhuǎn)換。RDFa是一個(gè)W3C推薦標(biāo)準(zhǔn),用于在XHTML網(wǎng)頁(yè)中插入嵌入式語(yǔ)義。微格式是整合到XHTML網(wǎng)頁(yè)中的支持語(yǔ)義表述性表達(dá)式的XML標(biāo)簽,是基于詞匯的集合。要將它們抽取到語(yǔ)義Web應(yīng)用程序中,需要相應(yīng)的解析器來(lái)處理,通過(guò)正確解析后便可以用來(lái)構(gòu)建RDF文檔。對(duì)于RDFa而言,它本身已經(jīng)是RDF格式,所需關(guān)注的只是如何從網(wǎng)頁(yè)抽取。

      3.2.3 對(duì)于非結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)換

      多媒體文件對(duì)于人類是很容易理解的,而計(jì)算機(jī)對(duì)圖像、圖片、視頻、音頻、文本文檔、地圖等數(shù)據(jù)類型的理解十分困難。通過(guò)Web標(biāo)簽系統(tǒng),用戶可以對(duì)Web中的數(shù)據(jù)塊、圖像、視頻加標(biāo)注,增加對(duì)Web內(nèi)容的支持。但是標(biāo)簽僅僅是一些單詞或短語(yǔ),除自身的含義外,無(wú)法提供給計(jì)算機(jī)可以識(shí)別的語(yǔ)義,畢竟非結(jié)構(gòu)化的文本無(wú)法很好的描述非結(jié)構(gòu)化的數(shù)據(jù)。如果在實(shí)現(xiàn)過(guò)程中,利用語(yǔ)義標(biāo)簽標(biāo)注的方法,就可以把各種非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的語(yǔ)義標(biāo)注描述的數(shù)據(jù),產(chǎn)生相應(yīng)的RDF文件。此方法是通過(guò)在一個(gè)本體中對(duì)標(biāo)簽進(jìn)行定義,形成一個(gè)標(biāo)簽本體,對(duì)標(biāo)注詞匯集和本體的標(biāo)準(zhǔn)化,進(jìn)而產(chǎn)生用戶可以用來(lái)標(biāo)注的語(yǔ)義標(biāo)簽,為數(shù)據(jù)提供了無(wú)歧義的語(yǔ)言描述。

      猜你喜歡
      知識(shí)共享數(shù)字資源
      價(jià)值網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)躍遷中知識(shí)共享模式演變
      西部獨(dú)立學(xué)院教師知識(shí)共享現(xiàn)狀與對(duì)策研究
      基于ISM和AH的虛擬社區(qū)知識(shí)共享影響因素研究
      信息自由與版權(quán)法的變革
      美術(shù)教科書使用應(yīng)把握的幾個(gè)視角
      圖書館員新角色
      高校數(shù)字資源云服務(wù)平臺(tái)的建設(shè)研究
      高職校企合作模式下的知識(shí)共享激勵(lì)機(jī)制研究
      圖書館與出版企業(yè)數(shù)字資源共享的環(huán)境因素分析
      “經(jīng)管之家”用戶知識(shí)共享及社會(huì)資本影響因素調(diào)查研究
      临潭县| 尼木县| 大足县| 福泉市| 寿阳县| 阳信县| 共和县| 湖北省| 文水县| 裕民县| 布拖县| 遂昌县| 滨州市| 淮阳县| 南和县| 渭南市| 司法| 湘潭县| 梨树县| 双牌县| 泾阳县| 淮安市| 龙山县| 台江县| 朝阳区| 洛隆县| 两当县| 东丽区| 东海县| 安国市| 太保市| 固始县| 镇巴县| 贵港市| 恩平市| 自治县| 岳西县| 枣庄市| 宽城| 通山县| 武平县|