齊繼東 陳 健 荀 燁 馬小平 傅 鈺
摘要:文章以國標“物流公共信息平臺應用開發(fā)指南-主要單證”為例,通過建立領域本體的概念、概念之間的繼承、約束、實例關系表達了物流公共信息平臺的領域知識,并利用建模工具protégé分析和設計了物流公共信息平臺主要單證的領域本體庫,即基本本體和過程本體的集合。為物流公共信息平臺主要單證的結構異構和語義異構的信息交換提供標準。
關鍵詞:物流公共信息平臺;物流領域本體庫;共享本體與過程本體
中圖分類號:TP391文獻標識碼:A
Abstract:Based on applied guide of logistics commonality information flat, the paper has expressed logistics domain information by domain ontology, inherience and constrains and instance which concept andinter-concept have generated. Share ontology and application ontology have structured by protégé. Ontology base is data interchange standard on main docment of logistics commonality information plat.
Key words: logistics commonality information plat; logistics domain ontology base; share ontology and process ontology
0引言
領域本體[2-3]是專業(yè)性的本體提供了某個專業(yè)學科領域中概念的術語以及相互關系的規(guī)范化描述,勾畫出某一領域的基本知識的體系結構和描述語言。一個領域本體包括一套關于某一領域概念的規(guī)范而清晰的描述稱為類,對概念的各種特征屬性,還包括屬性的限制條件和方面,以及一系列與某個類相關的實例,這些實例組成了一個知識庫。類是本體的核心,它描述了某一領域的概念。屬性描述了類的屬性和實例。構建領域本體可以達成用戶間或軟件代理間對于信息組織結構的共同理解和認識,使專業(yè)領域內的假設變得更加明確,將領域知識從運籌學、知識管理的環(huán)境中剝離出來,并且可以分析專業(yè)領域的知識。
目前,本體模型的研究已經進入實際應用階段。許多研究領域目前都建立了自己標準的本體,如常識本體、企業(yè)本體(TOVE、ENTERPRISE)、GIS信息資源管理本體等,這使得諸多領域專家能夠使用它們來共享和評注領域中的信息。本文以構建物流公共信息平臺(Logistics Commonality Information Flat, LCIF)主要單證(Main Documents)本體為例,嘗試分析和設計物流公共信息平臺領域本體的方法和過程。LCIF本體庫的創(chuàng)建可以為本專業(yè)領域的結構異構、語義異構的多源信息資源管理提供標準。
1本體的構建規(guī)則與方法[8]
1.1領域本體構建的規(guī)則[4,9]
由于不同專業(yè)領域和學科考慮,構建領域本體的過程也各不相同,一般認為,構造領域本體應遵循Cruber于1995年提出的5條規(guī)則:①明確性和客觀性。本體應該用自然語言對所定義術語給出明確的、客觀的語義定義。②完全性。所給出的定義是完整的,完全能表達所描述術語的含義。③一致性。由術語得出的推論與術語本身的含義是相容的,不會產生矛盾。④大單調可擴展性。向本體中添加通用或專用的術語時,不需要修改已有的內容。⑤最小承諾。對待建模對象給出盡可能少的約束。
1.2本體的構建方法[9]
構建領域本體的方法已經成為一個新的研究熱點,在實踐中也產生了一些面向不同應用需求的本體方法,如IDEF-5法、骨架法、企業(yè)建模法、METHONTOLOGY法、循環(huán)獲取法、七步法等。通過對他們的比較,本文利用骨架法構建物流公共信息平臺的領域本體。骨架法是Uschold和King等人基于從開發(fā)企業(yè)建模過程的Enterprise Ontology的經驗中得出的骨架法(Uschold,1995),該方法使用middle-out開發(fā)方式提供本體開發(fā)的指導方針,還是與商業(yè)和企業(yè)有關的術語及其定義的集合。Enterprise Ontology是英國Edinburgh大學AI應用研究所的Enterprise項目組開發(fā),合作伙伴有IBM、Logica UK有限公司和Unilever公司等。骨架法的開發(fā)過程:
(1)確定本體應用的目的和范圍。根據(jù)研究的領域或任務,建立相應的領域本體或過程本體。研究的領域越大,所建的本體也會越大。
(2)本體分析。定義本體所有術語的意思及其之間的關系,該步驟需要領域專家的參與。對該領域了解越多,所建本體越完善。
(3)本體表示。一般用RDF、OWL語義模型來表示本體。
(4)本體評估。建立本體的評估標準是清晰性、一致性、完善性和可擴展性。清晰性就是本體中的術語應無歧義;一致性指的是術語之間邏輯關系上應一致;完善性是指本體中的概念及其關系應是完整的;可擴展性指的是本體應能夠可擴展以便適應將來的發(fā)展需要。符合評估標準則繼續(xù)下一步,否則轉到第2步。
(5)本體的建立:以文檔形式保存所建立的本體。
2構建物流領域本體
本文以GB/T 18354-2001《中華人民共和國國家標準物流術語》、GB/T 7635.1-2002《全國主要產品分類與代碼》和GB/T《物流公共信息平臺應用開發(fā)指南》等標準規(guī)定的概念和術語為基礎,分析和設計LCIF的主要單證的領域本體。無論是分析還是通過建模工具設計本體、類、屬性、約束、還是實例,均表示為資源描述架構(RDF)模式,即是三元組。
2.1物流領域本體分析
本文針對國標“物流公共信息平臺應用開發(fā)指南-主要單證”中發(fā)貨通知單證(Delivery Notice Document)為例(見表1),分析和設計物流領域本體,即共享本體(基本本體)和過程本體。
目標:構建LCIF領域本體目標是為物流信息的應用提供語義層次的應用,為供應鏈的信息集成提供語義基礎,為語義異構、結構異構的現(xiàn)存多源數(shù)據(jù)集成提供“元數(shù)據(jù)”。
應用范圍:LCIF的主要單證主要應用在需求方提出物品需求,并上報給供應方,供應方根據(jù)多點物品的需求與儲備的情況,制定相應的物品實施計劃和配送計劃,即業(yè)務計劃文檔。本文采用構建基本本體[5-6]和過程本體[5-6]的模式(見圖1),分析與設計發(fā)貨通知單證涉及的領域本體。
依據(jù)《中華人民共和國國家標準物流術語》,分析發(fā)貨通知單證(Delivery Notice Document)中涉及的概念或術語,并為其提供精確、公認或公理式的描述。
(1)基本本體(base ontology)。LCIF的最高層次的全局共享詞匯集,包括了本領域中的基本術語或概念,即形成類,以及類屬性要素、類實例的描述。結合表1,發(fā)貨通知單證中包含的術語或概念有:物品(article)、存儲物品的倉庫(warehouse)、生產物品的企業(yè)(enterprise)、裝載或運輸物品的設備或設施(devices)、企業(yè)或倉庫的坐落位置(area)等。
△物品類(article):發(fā)貨通知中不可避免要包括保障的物品或貨物,此本體包含的屬性應是物品本身具備的基本屬性或特殊屬性,并為屬性定義類型和值域等方面。示例:屬性{代碼、名稱、型號、計量單位、單價、單價單位、危險品、運輸?shù)燃壍龋?,單價單位值域{元、萬元、美元、歐元、…}。
《全國主要產品分類與代碼》-可運輸產品分為5大部類(見表2),每大部類內又分為若干部類、大類、中類、小類和細類。如0大部類又分6部類(分別為01~06),01部類下又分為9大類,01部類谷物、雜糧及其種子部類又分為9大類等,結合國標《全國主要產品分類與代碼》的標準,同級本體類不超過2-12個的原則,物品(article)本體的類結構應為三層,類級別到物品大類。
結合《全國主要產品分類與代碼》-可運輸產品的規(guī)定,在類〔beginning bits encoded ××〕繼續(xù)增加子類本體。以0大部類為例:01部類種植業(yè)產品(beginning bits encoded zeroone);011大類谷物、雜糧及其種子(beginning bits encoded zerooneone);012大類蔬菜(beginning bits encoded zeroonetwo);013大類水果和堅果(beginning bits encoded zeroonethree);014大類油籽類和含油果類(beginning bits encoded zeroonefour);015大類活的植物、切花和花蕾、花卉種子及其幼苗、插穗和水果種子、蔬菜種子、林木種子和幼苗(beginning bits encoded zeroonefive);016大類飲料和香辛料作物產品(beginning bits encoded zeroonesix);017大類未加工的煙草(beginning bits encoded zerooneseven);018大類制糖用植物(beginning bits encoded zerooneeight);019大類不另分類的植物原料(beginning bits encoded zeroonenine)。
△倉庫類(warehouse):存儲需要保障的物品的庫房信息。屬性示例:代碼、類型、名稱、儲備容量、容量計量單位等。根據(jù)倉庫儲備的物品性質及其特點,增加倉庫類(warehouse)下子類:通用倉庫類(generalwarehouse)、專用倉庫類(specialitywarehouse)和特殊倉庫類(dangerwarehouse),并進一步描述子類的特有屬性及其實例,如特殊倉庫類中危險等級及其值域。
△包裝類(package):包裝對于物流活動的效率非常重要,因此在貨品包裝本體必須構建。示例屬性:名稱、尺寸、材料、凈重、托盤模數(shù)(modulus)等。結合包裝的方式或運輸方式,增加包裝類(package)的子類:集裝化包裝(containerization)、托盤包裝(palietizing)和散裝包裝(inbulk),并結合各包裝類型標準創(chuàng)建實例,以及特有屬性及其值域。
△設備類(devices):實現(xiàn)物品的發(fā)貨必須具備相應的運載工具,如運輸工具、叉車等。示例屬性:代碼、名稱、額定承載能力等。結合設備的功能特點,設備類(devices)下增加子類:運載工具(vechile)和裝卸搬運機械類(fork lift truck)并結合子類特點創(chuàng)建子類屬性及其實例。
本體或本體之間的約束關系:企業(yè)類與區(qū)域類之間的駐地關系、物品類與包裝類之間的包裝關系、倉庫類與物品類之間存儲關系,以及類本身屬性值域的約束,如物品類(Article)、設備類(devices)的“計量單位〔measure、size_measure、modulus_measure〕”屬性的值域來源于計量單位類(measure),企業(yè)類(enterprise)的屬性“駐地”值域來源于區(qū)域類(area)。
(2)過程本體(process ontology)。利用基本本體庫中的一個或多個類及其屬性、約束生成新的本體。如發(fā)貨通知單證本體包含了上述部分類及其部分屬性,個別屬性隸屬發(fā)貨通知單證本身特點。
△單證類(document):描述物流活動過程中涉及的各種單證及其屬性、約束、單證實例等關系。依據(jù)國標《物流公共信息平臺應用開發(fā)指南》的主要單證,單證類(doument)下增加子類:訂單類(order)、發(fā)貨類(delivery)、庫存水平類(inventory)、發(fā)貨狀態(tài)類(delivery status)、發(fā)票(bill)。并在上述類基礎上創(chuàng)建或關聯(lián)屬性、約束、繼承和實例等內容(由于篇幅所限,LCIF主要單證的其他本體略)。
LCIF主要單證的本體結構見圖2(其中,Thing是領域本體的超類,構建的所有類或本體均是其子類)。
2.2利用protégé[1-7]創(chuàng)建LCIF領域本體
目前JOE、KADS22、OILep、OntoEdit、protégé[1]、Ontolingua、WebOnto等本體建模工具不少于50種,通過分析和相關研究人員使用,本文選擇protégé作為構建物流公共信息平臺的基本本體和過程本體的工具,并確定領域本體庫的表達方式,如RDF、OWL等格式。protégé特點是能免費下載,插件可以擴展特殊的功能,如程序編程、本體查詢等,具有圖形化的用戶界面,使用簡單,有詳細友好的幫助文檔,支持多種語言并能支持中文,比較適合本體構建的概念化和形式化階段,適用于對構建沒有過多經驗的用戶。本體設計階段的主要內容:確定LCIF領域本體的表達模式(語言);設計LCIF共享本體和過程本體。
打開protégé。點擊『create new project』按鈕后,出現(xiàn)選擇project類型的界面。在界面中『select a project type』列出了幾種類型的選擇,選擇『protégé files(.pont and .pins)』,然后點擊『finish』按鈕, 新的項目被成功地建立。在當前創(chuàng)建的項目下創(chuàng)建Thing的子類及其子類的子類,并為各子類指定特有的屬性、約束和實例,由于篇幅關系,創(chuàng)建過程略。LCIF領域本體結構見圖3。
通過圖3所示本體庫的創(chuàng)建,本體之間關系、本體屬性、本體約束、屬性約束、本體實例的設計,為在信息資源實踐管理中應用,需要利用protégé提供的功能將其生成rdf或owl本體庫。通過本體庫與相關數(shù)據(jù)庫字典或數(shù)據(jù)管理基礎標準進行映射,并利用RDF查詢語言進行語義層的數(shù)據(jù)管理。
3結論
本體作為一種論點是新穎、起點較高的,是連接信息系統(tǒng)與哲學之間的紐帶,能夠在語義層次上解決信息資源管理中的語義異構和結構異構的問題。本文以GB/T《物流公共信息平臺應用開發(fā)指南-主要單證》為例,通過建立領域本體的概念、概念之間的繼承、約束、實例關系表達了物流公共信息平臺的主要大爆炸各報告的領域知識,并利用建模工具protégé設計了物流公共信息平臺的主要單證的領域本體集合,即基本本體和過程本體。
參考文獻:
[1]Natalya F Noy and Deborah L McGuinness. A Guide to Creating Your First Ontology[EB/OL]. (2001-08-10)[2008-09-25].http://protég.éstanford.edu/publications/ontology-develop-ment/ontology101.
[2]李恒杰. 領域本體建模方法研究[J]. 計算機工程與設計, 2008,29(2):381-384.
[3]肖敏,等. 領域本體的構建方法研究[J]. 情報方法, 2006(2):70-74.
[4]胡兆芹,等. 領域本體的構建實踐[J]. 醫(yī)學信息, 2008(1):13-16.
[5]吳玲麗,等. 一種基于Ontology的異構數(shù)據(jù)庫語義集成方法[J]. 計算機系統(tǒng)應用, 2008(3):31-37.
[6]袁磊,等. 面向領域知識的本體知識模型XML表示框架[J]. 計算機工程, 2006,32(1):192-196.
[7]Choset H, Burdick J. Sensor Based Motion Planning: The Hierarchical Generalized Voronoi Graph[Z]. Workshop on Algorithmic Foundation of Robotics, 1996.
[8]Cruber T R. Towards Principles for the Design of Ontologies Used for Knowledge Sharing[J]. International Journal of Human-Computer Studies, 1995(43):907-908.
[9]馮志勇,等. 本體工程及其應用[M]. 北京: 清華大學出版社,2007.