• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      本體構建研究綜述*

      2011-01-15 13:26:53
      艦船電子工程 2011年6期
      關鍵詞:本體工具定義

      (海軍大連艦艇學院導彈與艦炮系 大連 116018)

      1 引言

      本體(Ontology)是一個源于哲學的概念,指的是對客觀存在物的解釋和說明,即“存在論”[1]。近年來,本體成為人工智能、語義網(wǎng)和知識工程等諸多領域的研究熱點并得到了迅速發(fā)展。最被廣泛認可的定義為“共享概念模型的明確形式化規(guī)范說明”[1]。本體可以實現(xiàn)某種程度的知識共享和重用,使得計算機對信息和對語言的理解上升到語義層次,并在一定程度上解決語義異構問題,在信息互操作、知識理解和信息集成等領域具有很大的應用前景,它的研究成果對軍隊信息化建設也會產(chǎn)生一定的指導意義。但是,由于本體引入人工智能、語義網(wǎng)和信息系統(tǒng)等領域的時間較短,本體的建模方法也初步確立,本體構建方法仍然不成熟。本文主要對目前的各種本體構建方法和構建工具進行了分析比較,最后對這些本體構建方法和工具進行了總結和展望。

      2 本體的構建

      本體構建是本體應用的基礎,是實現(xiàn)信息交換、共享,解決語義沖突的基礎,通過構建統(tǒng)一的術語和概念,實現(xiàn)知識共享,為異構系統(tǒng)間的通訊提供共同的詞匯,便于它們之間的互操作和集成。本體構建是一項龐大的系統(tǒng)工程,需要各領域的專家(領域?qū)<?、本體工程師等)按照一定的本體構建原則,在合理方法論的指導下,采用合適的關鍵技術或使用便捷的本體開發(fā)工具加以實現(xiàn)。

      2.1 本體構建的原則

      研究人員從實踐出發(fā)提出了許多指導本體構建的原則,然而,目前仍沒有構造本體的統(tǒng)一標準,一般采用1995年T.R.Gruber提出的指導本體構造的五條原則[2],具體如下:

      1)清晰:領域本體必須能有效地說明所定義術語的含義。定義應該是客觀的,與背景獨立的;當定義可以用邏輯公理表達時,它應是形式化的,應盡力用邏輯公理表達;定義應該盡可能的完整;所有定義應該用自然語言加以詳細說明。

      2)一致:領域本體應該是前后一致的,也就是說,它應該支持與其定義相一致的推理。領域本體所定義的公理以及用自然語言進行說明的文檔都應該具有一致性。假如從一組公理中推導出來的一個句子與一個非形式化的定義或者實例矛盾,則這個領域本體是不一致的。

      3)可擴展性:領域本體的可擴展性是指其提供一個共享的詞匯,這個共享的詞匯應該為預期的任務提供概念基礎。它應該可以支持在已有的概念基礎上定義新的術語,以滿足特殊的需求,而無須修改已有的概念定義。也就是說,人們應該能夠在不改變原有定義的前提下,以這組存在的詞匯為基礎定義新的術語。

      4)編碼偏好程度最?。侯I域本體與特定的符號即編碼無關。也就是說,領域本體的表示形式的選擇不應該只考慮表示或?qū)崿F(xiàn)上的方便,概念的描述不應該依賴于某一種特殊的符號層的表示方法,不能依賴于某種確定的語言,因為實際的系統(tǒng)可能采用不同的知識表示方法。

      5)本體約定最小:本體約定應該最小,只要能夠滿足特定的知識共享需求即可。也就是說,本體應該對所模擬的事物產(chǎn)生盡可能少的推斷,而讓共享者自由地按照他們的需要去專門化和實例化這個本體。Gruber還指出,由于本體承諾是以詞匯的使用為基礎的,因此可以通過定義約束最弱的公理以及只定義應用所需的基本詞匯來保證。

      上述五條原則給出了構造領域本體的基本思路和框架,但是明顯的不足之處就是它們所反映的內(nèi)容較模糊且難于把握。實際本體構建過程中,以上五原則甚至可能有不一致的情況,本體開發(fā)者需要權衡各原則,必要時可能還要參照其他原則,需要靈活運用本體構建原則才能構建高質(zhì)量的本體。

      2.2 本體構建的知識來源

      目前的本體構建方法主要分為本體論工程方法和將敘詞表轉(zhuǎn)化為本體的方法兩大類[4]。顯然,后者的知識來源是該專業(yè)領域的敘詞表,而本體論工程的知識來源則相對豐富,主要有表格、主題詞表、數(shù)據(jù)庫、WordNet、WEB網(wǎng)、領域?qū)<?、文本和Wiki等等。依據(jù)知識的結構化程度可以將它們分為兩類:結構化知識來源,包括主題詞表、表格、WordNet、數(shù)據(jù)庫;非結構化知識,包括WEB網(wǎng)、領域?qū)<?、文本和Wiki等。運用結構化知識最大的優(yōu)點就是便于半自動或自動化構建本體,大大提高了構建速度。而運用非結構化知識構建本體往往需要大量人工參與,雖然本體構建質(zhì)量較好,但是耗時較長。雖然運用自然語言處理學科知識可以對非機構化知識進行一定程度的自動處理,貌似可以提高本體構建的速度,但同時該學科的不成熟導致了本體質(zhì)量的下降。

      3 本體構建方法評述

      3.1 本體構建方法

      本體構建的方法學還沒有成熟的理論作指導,而目前的本體構建方法都是針對具體的項目提出的,這就導致各種本體構建方法的出現(xiàn)。

      國外主要的構建方法有IDEF5法、骨架法、TOVE法、METHONLOGY法、KACT US法、七步法和SENSUS法等,其成熟度依次為七步法>MET HONLOGY法>IDEF5法>TOVE法>骨架法>SENSUS法>KACT US法[4],下面主要介紹前面五種相對成熟的方法。

      七步法[4,7]是斯坦福大學醫(yī)學院提出的基于Protege本體構建工具的一種領域本體構建方法。一共包括7個步驟,因此被稱為七步法:1)確定知識本體的專業(yè)領域和范疇;2)考查復用現(xiàn)有知識本體的可能性;3)列出本體中的重要術語;4)定義類(Class)和類的等級(層次)體系;5)定義類的屬性;6)定義屬性的分面(Facets);7)創(chuàng)建實例。

      METHONLOGY方法[1,4]是由西班牙馬德里理工大學AI實驗室提出的。該方法結合了骨架法和GOMEZ-PEREZ方法后,提出的一種更為通用的本體建設方法。這個本體開發(fā)方法更接近軟件工程開發(fā)方法。它將本體開發(fā)進程和本體生命周期兩個方面區(qū)別開來,并使用不同的技術予以支持。METHONLOGY法,專用于創(chuàng)建化學本體(有關化學元素周期表的本體),該方法已被馬德里大學理工分校人工智能圖書館采用。它的流程包括:1)管理階段:這一階段的系統(tǒng)規(guī)劃包括任務的進展情況、需要的資源、如何保證質(zhì)量等問題;2)開發(fā)階段:分為規(guī)范說明、概念化、形式化、執(zhí)行以及維護五個步驟;3)維護階段:包括知識獲取、系統(tǒng)集成、評價、文檔說明、配置管理五個步驟。

      IDEF5法[3~4]是美國KBSI(Knowledge Based Systems Inc.)公司開發(fā)用于描述和獲取企業(yè)本體時所采用的一種結構化的本體開發(fā)方法。IDEF5通過使用圖表語言和細節(jié)說明語言,獲取關于客觀存在的概念、屬性和概念間關系,并將它們形式化,作為知識本體的主要架構。IDEF5的本體構建方法流程如下:1)組織和范圍:確定本體項目的目標、觀點和語境,組織課題隊伍并為組員分配角色;2)數(shù)據(jù)收集:收集本體建設需要的原始數(shù)據(jù);3)數(shù)據(jù)分析:分析數(shù)據(jù),為抽取本體做準備;4)知識本體的初步開發(fā):從收集的數(shù)據(jù)當中建立一個初步的本體;5)本體的精煉與驗證:完成本體建設過程。

      TOVE法[4],也稱為評價法,是Gruninger和Fox等開發(fā)TOVE工程本體(關于商業(yè)過程和活動建模的本體)的經(jīng)驗總結。這種方法并非直接構建以本體形式描述的知識的邏輯模型,而是先建立本體的非形式化描述說明,然后將這種描述形式化。這種方法的本體構建基本流程如下:1)激勵情節(jié)的獲取。Gruninger和Fox認為本體開發(fā)是由應用中的具體情節(jié)所驅(qū)動的。獲取激勵情節(jié)就是定義直接可能的應用和所有解決方案,提供潛在的非形式化的對象和關系的語義表示;2)非形式化能力問題的明確表達。將系統(tǒng)能力問題(能夠回答)作為約束條件,包括能解決什么問題和如何解決,這里的問題用術語表示,答案用公理和形式化定義回答。由于是在沒有形式化本體之前進行的,所以叫非形式化的能力問題;3)術語的規(guī)范化。從非形式化能力問題中抽取非形式化的術語,然后用本體形式化語言進行規(guī)范化定義;4)形式化能力問題的明確描述。一旦本體內(nèi)的概念得到了定義,能力問題就脫離了非形式化,演變?yōu)樾问交哪芰栴};5)將規(guī)則形式化為公理。術語定義所遵循的公理用一階謂詞邏輯表示;6)調(diào)整能力問題解決方案的條件,從而使知識本體趨于完備。

      骨架法[1,4],也稱為EO工程法,是Uschold和King在1995年開發(fā)EO(Enterprise Ontology,關于企業(yè)建模過程的本體,是相關商業(yè)企業(yè)間術語和定義的集合)中的經(jīng)驗總結,它提出了一種本體開發(fā)的具體步驟,其基本步驟如下:1)明確本體應用的目的和范圍;2)構建本體;3)本體評價;4)本體成文。使用骨架法開發(fā)的最重要的本體就是EO,該本體在愛丁堡大學的人工智能應用研究所以及IBM、Lloyd's Register,Logica UK Limited,和Unilever等合作單位共同開發(fā)完成。骨架法清晰地描述了本體開發(fā)的具體實現(xiàn)步驟,對于當前本體開發(fā)實踐具有重要指導意義。

      此外,我國研究學者,如李景[5~6]、董慧、劉柏嵩、唐愛民等,在借鑒國外本體構建方法的基礎上,根據(jù)中文漢語本體構建的實際情況,也提出一些具有影響的本體構建方法。

      3.2 本體構建方法存在的問題

      盡管國內(nèi)外一些本體構建方法在相應的項目中比較適用,但通過對各方法的熟悉與對比之后可以發(fā)現(xiàn)這些方法仍然存在許多問題,例如:

      1)大多數(shù)方法不是通用的領域本體構建方法,僅適用于較小專業(yè)范圍的本體構建,如骨架法是在企業(yè)本體開發(fā)中總結出來的,它對通用本體開發(fā)的指導作用就很有限。

      2)自動化程度不高,大多數(shù)方法還是運用人工開發(fā),耗費大量人力、物力和財力,開發(fā)效率不高。

      3)建設過程缺乏規(guī)范性,領域本體建設還沒有成熟的方法論作為指導,更不用說對建設過程的規(guī)范管理。

      4)大部分都是從各自的實踐經(jīng)驗出發(fā),勾勒出了本體建模的過程、方法和步驟的輪廓,很多都只提供了建模過程的指導原則,但是卻缺少對本體建模的指導原則等進行落實的、可操作性強的方法。

      5)忽視本體的共享和重用。領域本體建設的目的不能僅為某一個系統(tǒng)提供服務,而是為不同系統(tǒng)提供交流的語義基礎。本體建設的過程,也是人類知識機器化積累的過程。所以共享和重用是本體的本質(zhì)要求,這也是領域本體建設中很重要的問題。

      6)成果沒有評價標準。本體的評價方法沒有統(tǒng)一的標準,更沒有標準的測試集。不能對本體的建設成果進行合理評價,必然影響到下一個周期中的進化過程。

      4 本體構建工具評述

      4.1 本體構建工具

      隨著本機機制研究的逐漸深入,越來越多的本體開發(fā)活動在國內(nèi)外陸續(xù)開展。然而,本體開發(fā)是一項龐大的知識工程,研究人員在采用上述方法構建本體的過程中遇到了各種問題,如一致性檢查、本體展示等等,人們迫切希望產(chǎn)生一些工具幫助其完成本體開發(fā)任務。在這種情況下,本體構建工具應運而生,各研究單位都試圖開發(fā)適合特定領域本體構建的環(huán)境,以支持本體開發(fā)過程中的多個環(huán)節(jié)。借助這些工具,本體構建者可以把精力集中在本體內(nèi)容的組織上,而不必了解本體描述語言和描述方式等細節(jié),極大地方便了本體的構建。目前,在國外已經(jīng)出現(xiàn)了眾多的本體構建工具,典型的包括WebOnto、WebODE、KAON和Protege等。

      WebOnto[3]起源于英國Open University開始于1997年的KMI項目,目的是開發(fā)一個基于Web的本體編輯器。它能提供比Ontolingua更為復雜的瀏覽、可視化和編輯能力;基于OCML推理引擎的知識模型,提供多重繼承、鎖機制,支持用戶合作地瀏覽、構建和編輯本體;但是WebOnto沒有提供源代碼。

      WebODE[3]是西班牙馬德里技術大學開發(fā)的一個綜合性的本體建模工具,它集成了本體開發(fā)過程中的大多數(shù)行為,支持METHONLOGY本體構建方法論,目前只有WebODE和OntoEdit能夠?qū)⒈倔w開發(fā)環(huán)境和實際的本體構建方法相對應。WebODE支持構建知識層次的本體,并可以將其轉(zhuǎn)化為不同的本體語言加以描述。它不同于OntoEdit和Protege的插件結構體系,而是采用客戶機/服務器模式的體系結構,通過Java、RMI、COBRA、XML等技術實現(xiàn),具有較高的可擴展性和可用性,允許添加新的服務;使用WebODE構建的本體以SQL數(shù)據(jù)庫的形式存儲,對于大規(guī)模本體來說具有較高的執(zhí)行效率;通過定義實例集來提高概念模型的可重用性;支持多重繼承、類型一致性、數(shù)值一致性、集合基一致性檢查,并且提供了分類一致性驗證機制。

      KAON[3]是德國Karlsruhe大學編制的一套用于語義網(wǎng)和本體研究的工具,包含各種模塊用于本體的構建、存儲、檢索、維護以及應用,其中OI—Modeler是KAON模塊集中的本體建模工具,可便捷的實現(xiàn)本體的創(chuàng)建和維護。

      Protégé[5~7]是斯坦福大學為知識獲取而開發(fā)的一個工具,主要應用于知識的獲取以及現(xiàn)存本體合并和排列,可以免費下載并公開源代碼,再加上其支持中文,Protege已經(jīng)成為目前國內(nèi)使用最為廣泛的本體編輯工具和基于知識的框架Protege主要具有以下特征:

      1)可擴展的知識模型能夠使用戶重新定義原始知識集合;

      2)友好的本體導入導出功能,可以從RDFS、帶DTD的XML文件、XML Schema等文件中導入本體,也可以將本體轉(zhuǎn)化為多種形式化語言描述,如RDF(S)、OWL等。

      3)具有友好的開發(fā)界面。

      4)具有強大的功能插件體系和開放的模塊化風格?;陂_放式組件的體系結構使系統(tǒng)開發(fā)者可以通過生成恰當?shù)牟寮栽黾有碌墓δ堋?/p>

      5)提供一個半自動化工具PROMPT用于自動地執(zhí)行本體的合并和排列。

      6)Protege平臺支持兩種類型的本體建模[8]:(1)Protege-Frames編輯器用于構建基于框架的本體,目前最新的版本是Protege3.4.5[9],發(fā)布于2011年3月18日。在這種模型中,本體是由具有層次結構的類集合組成,類的槽(slots)集合表示概念的屬性和關系;類的實例集合則表示概念的具有特定屬性值的個體;(2)Protege-OWL編輯器則用于構建應用于語義網(wǎng)的本體。目前最新版本為Protege4.1,該版本全面支持OWL2.0語言,專門使用W3C的OWL語言描述,一個OWL本體包含類的描述、屬性以及實例。

      除此之外,還有Apollo、LinkFactory、OILEd、Ontolingua、OntoSaurus、OpenKnoME等[7,10~11]本體構建與管理工具。這些本體開發(fā)工具功能各不相同,對于本體語言的支持能力、表達能力、邏輯支持能力以及可擴展性、靈活性、易用性等都相差甚遠。就目前而言,在國內(nèi)Protege和KAON的使用最為廣泛。

      4.2 本體構建工具存在的問題

      盡管目前本體構建研究炙手可熱,本體構建工具也多種多樣,但是對比之后可以發(fā)現(xiàn),這些工具存在如下問題:

      1)本體工具的多樣化和差異性阻礙了不同領域知識的聯(lián)通和異構系統(tǒng)的互操作。

      2)構建工具不為用戶提供通用概念/類的體系,可能使得用戶大量時間花在通用概念的構建上,大大降低了本體構建效率。

      3)每種構建工具都有不同的導入/輸出格式,缺乏統(tǒng)一的標準和規(guī)范,使得不同工具構建的本體之間無法兼容,在異構系統(tǒng)中無法被復用。

      4)大多缺乏對中文的支持,使得國內(nèi)研究人員在中文本體構建上進展緩慢。

      5)一些本體工具界面不夠友好,降低了本體開發(fā)效率。

      6)許多工具不支持協(xié)作開發(fā),這使得目前構建的本體中摻雜許多個人主觀意見,降低了本體的質(zhì)量。

      5 結語

      本體構建的方法學還沒有成熟的理論作指導,現(xiàn)有的本體構建方法參差不齊。對于本體構建方法的使用者來說,應根據(jù)現(xiàn)存的方法及其適用范圍,選擇適合特定本體構建的方法;或借鑒這些方法的框架和步驟,總結出適合自己的方法。在本體評估方面,對本體沒有一個具體的評估標準是本體構建的一個瓶頸問題,這也是本體構建方法以后要重點研究的方面。

      本文首先對目前幾種主要的本體構建方法和構建工具進行了介紹與比較,分別指出了存在的問題。針對這些問題,筆者認為:在目前本體評價標準尚不成熟的情況下,為了高效地開發(fā)高質(zhì)量的本體,在方法上,未來本體構建方法發(fā)展的方向是自動化、半自動化并且具有嚴格可操作性的本體構建方法;在本體描述語言上,將由現(xiàn)在的百花爭鳴朝著規(guī)范化標準化的方向發(fā)展;在構建工具上,應該具備以下特點:界面友好,易于使用;能夠跨平臺,支持多人協(xié)作開發(fā);支持功能插件的擴展;提供統(tǒng)一的通用概念常識庫;支持多語種;具備強大的推理能力;能支持本體生命周期的大部分開發(fā)過程。

      [1]馮志勇,李文杰,李曉紅.本體論工程及其應用[M].北京:清華大學出版社,2007,5

      [2]T.R.Gruber.Towards Principles for the Design of Ontologies Used for Knowledge Sharing[J].International Journal of Human Computer Studies,1995

      [3]杜文華.本體構建方法比較研究[J].情報方法,2005(10):24~25

      [4]李勇,張志剛.領域本體構建方法研究[J].計算機工程與科學,2008(5):129~131

      [5]劉宇松.本體構建方法與開發(fā)工具研究[J].現(xiàn)代情報,2009,29(9):17~24

      [6]李景.主要本體構建工具比較研究_上[J].信息系統(tǒng),2006(1):109~111

      [7]李景.主要本體構建工具比較研究_下[J].信息系統(tǒng),2006(2):222~225

      [8]Natalya F.Noy,Deborah L.McGuinness.Ontology Development101:A Guide to Creating Your First Ontology[DB].2001,8

      [9]http://protégé.stanford.edu/

      [10]徐國虎,許芳.本體構建工具的分析與比較[J].圖書情報工作,2006(1):44~48

      [11]王長霞,李冠宇,陳布偉.語義網(wǎng)本體構建工具現(xiàn)狀及發(fā)展趨勢[J].計算機與現(xiàn)代化,2009(7):27~29

      猜你喜歡
      本體工具定義
      Abstracts and Key Words
      哲學分析(2023年4期)2023-12-21 05:30:27
      對姜夔自度曲音樂本體的現(xiàn)代解讀
      中國音樂學(2020年4期)2020-12-25 02:58:06
      波比的工具
      波比的工具
      “巧用”工具
      讀者(2017年18期)2017-08-29 21:22:03
      成功的定義
      山東青年(2016年1期)2016-02-28 14:25:25
      《我應該感到自豪才對》的本體性教學內(nèi)容及啟示
      文學教育(2016年27期)2016-02-28 02:35:15
      修辭學的重大定義
      當代修辭學(2014年3期)2014-01-21 02:30:44
      Care about the virtue moral education
      卷宗(2013年6期)2013-10-21 21:07:52
      山的定義
      公務員文萃(2013年5期)2013-03-11 16:08:37
      苏州市| 凯里市| 永州市| 射洪县| 方正县| 孙吴县| 五河县| 兴业县| 长泰县| 交城县| 阿巴嘎旗| 五家渠市| 公安县| 周宁县| 凤阳县| 贵德县| 庆元县| 阿克陶县| 白玉县| 厦门市| 丰镇市| 远安县| 河源市| 顺昌县| 承德县| 清流县| 讷河市| 日照市| 新安县| 山东| 麻江县| 高雄市| 花垣县| 凤城市| 寿阳县| 昌吉市| 香港 | 修武县| 宜黄县| 洪泽县| 镇远县|