劉華堯,文思
(1.廣西有色勘察設(shè)計(jì)研究院,廣西南寧 530031;2.桂林理工大學(xué)藝術(shù)學(xué)院,廣西桂林 541000)
空間數(shù)據(jù)庫的研究一直是地理信息科學(xué)(GIS)領(lǐng)域的研究熱點(diǎn)。隨著信息技術(shù)的飛速發(fā)展,GIS的應(yīng)用范圍已經(jīng)涉及人類生活的各個(gè)層面。然而,不同領(lǐng)域、不同部門在應(yīng)用GIS系統(tǒng)時(shí)往往按照各自需求,采用相互獨(dú)立的空間數(shù)據(jù)格式和建模方法,時(shí)空數(shù)據(jù)的組織有很大的差異,信息孤島由此產(chǎn)生。
對(duì)道路而言,交通管理部門需要詳細(xì)了解其路面結(jié)構(gòu)、通行能力、行車方式、交通設(shè)施等與交通運(yùn)輸密切相關(guān)的信息;而城建部門則關(guān)注道路寬度、面積等與城市建設(shè)密切相關(guān)的信息。這兩個(gè)部門對(duì)道路的概念化有很大的差異。不同部門對(duì)空間數(shù)據(jù)庫的設(shè)計(jì)需要數(shù)據(jù)更加具有針對(duì)性,以適應(yīng)不同行業(yè)領(lǐng)域的專業(yè)要求,然而空間數(shù)據(jù)的共享和互操作又要求空間數(shù)據(jù)庫更加大眾化,能夠適應(yīng)各種平臺(tái)和環(huán)境[1]。這樣的矛盾隨著地理信息科學(xué)的發(fā)展,這種矛盾在可持續(xù)發(fā)展要求多學(xué)科多部門的協(xié)作中顯得越來越突出。本體論思想的引入為解決這一問題提供了新的思路。
本體(Ontology)原本是哲學(xué)概念,最早來源于亞里士多德對(duì)事物存在本質(zhì)的研究。它的含義是客觀存在的一個(gè)系統(tǒng)本質(zhì)的抽象解釋和說明[2~3],從哲學(xué)意義上看,本體論關(guān)注的是“存在”,即世界在本質(zhì)上有什么樣的東西存在,或者世界存在哪些類別的實(shí)體,是描述領(lǐng)域范圍內(nèi)公認(rèn)的知識(shí)和概念集。
本體論在計(jì)算機(jī)科學(xué)領(lǐng)域的發(fā)展與人工智能和信息技術(shù)的起步和發(fā)展密不可分。首先是McCarthy受學(xué)者Quine的啟發(fā),認(rèn)識(shí)到哲學(xué)本體論與人工智能的邏輯構(gòu)建活動(dòng)之間的重疊,并于1980年提出:以邏輯概念為基礎(chǔ)的智能系統(tǒng)必須“列出所有存在的事物,并構(gòu)建一個(gè)本體描述我們的世界”[4]。以此為基礎(chǔ)信息學(xué)的本體概念目前被廣泛接受的定義是1995年由Gruber提出的:本體是一個(gè)領(lǐng)域中共享的概念化模型的形式化和顯式的說明規(guī)范[5]。這種抽象的描述方法目前已經(jīng)成為計(jì)算機(jī)科學(xué)的一種重要方法,尤其是在地理信息科學(xué)領(lǐng)域有重要應(yīng)用。為了更好地將本體理論應(yīng)用到地理空間的研究中首先要對(duì)地理空間的內(nèi)涵進(jìn)行抽象和描述。
空間是實(shí)體存在的前提和基礎(chǔ),空間和實(shí)體既有獨(dú)立性又是統(tǒng)一的整體。并且由于空間和空間內(nèi)實(shí)體的交互作用。這種空間的描述和理解的過程離不開語義的參與,由于不同空間體系中對(duì)同一實(shí)體的拓?fù)涿枋霾槐M相同就會(huì)存在語義異構(gòu),系統(tǒng)間難以兼容或無法發(fā)共享。而基于本體建立起來的邏輯關(guān)系知識(shí)庫,是目前一般計(jì)算機(jī)甚至云計(jì)算機(jī)能夠普遍接受和共享的。本體間的基本邏輯關(guān)系主要包括4種:
(1)“part-of”表達(dá)概念之間部分與整體的關(guān)系即{a1,a2,a3…,an}∈Rk;
(2)“kind-of”表達(dá)概念之間的繼承關(guān)系,類似于父類與子類之間的關(guān)系即:{Rk1,Rk2,…,Rkn}?R;
(3)“instance-of”表達(dá)概念的實(shí)例與概念之間關(guān)系,類似于面向?qū)ο笾械念惻c對(duì)象之間的關(guān)系即Rki∩Rkj=?或Rki∩Rkj≠?;
(4)“attribute-of”表達(dá)某個(gè)概念是另外一個(gè)概念的屬性即Rki∈M。
基于本體的空間認(rèn)知是將空間抽象為關(guān)系集的描述。它主要以概念網(wǎng)絡(luò)層次的形式來表達(dá)實(shí)體間的關(guān)系,不同層級(jí)的概念是本體的基本組成元素。由此我們將本體視為由5個(gè)基本的建模元語組成[6~7],表示為:O={C,R,F(xiàn),A,I}五元組結(jié)構(gòu)具有深遠(yuǎn)的影響,具體含義為:
C代表概念(Concepts)或類(Classes),概念的范圍很廣,可以指描述、操作或生產(chǎn)活動(dòng)等。從本體的語義層面上看,概念描述的是一系列對(duì)象的集合,包括概念名、與其他概念之間的關(guān)系等,在道路實(shí)體的抽象過程中,主要將其分為單純道路類和交通設(shè)施類。
R表示概念之間的相互關(guān)系(Relations),用n維笛卡兒積的子集形式進(jìn)行描述,表達(dá)為R:C1×C2×…× Cn。關(guān)系包括子、父類關(guān)系以及部分、整體關(guān)系等。關(guān)系是通過對(duì)象元組集合的形式進(jìn)行表達(dá),通常為二元組集合。對(duì)于道路實(shí)體而言,就表達(dá)了其包含的各種概念之間的關(guān)系集。
F表示函數(shù)(Functions),是概念間特殊的關(guān)系表達(dá),表示公式中n-1個(gè)元素可以唯一決定第n個(gè)元素。形式化的定義為F:C1×C2×…×Cn-1→Cn。比如支線與干線的匯聚關(guān)系,一條支線最終匯聚一條干線。
A表示公理(Axioms),是永真性斷言,包括對(duì)概念和關(guān)系的約束。
I空間集(Space set)是空間對(duì)象的空間屬性,它包括基本點(diǎn)對(duì)象、線對(duì)象、面對(duì)象等。在地理本體研究中,需要同時(shí)關(guān)注空間對(duì)象的空間幾何特征及空間關(guān)系描述。采用地理本體描述空間對(duì)象的空間特征的方法,對(duì)點(diǎn)、線、面進(jìn)行抽象和定義可分為5個(gè)類:Point類、Line類、Polygon類、Compound類、Attribute類。具體抽象過程如圖1所示。
圖1 空間對(duì)象具體抽象過程
點(diǎn)(Point)類:由點(diǎn)的唯一標(biāo)識(shí)符和(x,y,z)三維坐標(biāo)進(jìn)行定義。
線(Line)類:由一系列點(diǎn)的有序?qū)M成,至少有兩個(gè)結(jié)點(diǎn),折線通過記錄關(guān)鍵點(diǎn)的序列進(jìn)行描述,若定位的直線僅有兩個(gè)點(diǎn),則為直線段,若有多條折線則為曲線,記錄起點(diǎn)、中間的關(guān)鍵點(diǎn)、止點(diǎn)的有序序列,若起、止點(diǎn)重合,則構(gòu)成環(huán)。使用函數(shù)表示為f(x,y)或者
面(Polygon)類:由外環(huán)的內(nèi)區(qū)域與內(nèi)環(huán)的外邊界圍成的中間范圍。使用函數(shù)表示為f(x,y,z)
復(fù)合(Compound)類:由點(diǎn)線面等基本幾何對(duì)象類組合而成。Compound可使用復(fù)合函數(shù)f[g(x),z]、分段函數(shù)進(jìn)行表示。
非空間屬性(Attribute)類:表示出幾何屬性以外的其他所有屬性。
時(shí)空數(shù)據(jù)應(yīng)是無縫化的有機(jī)整體,而空間屬性和非空間屬性的改變或持續(xù)都是基于時(shí)間發(fā)展的,時(shí)間的發(fā)展又通過空間屬性和非空間屬性的改變和持續(xù)來表現(xiàn)。不同空間實(shí)體相對(duì)獨(dú)立的改變?cè)跁r(shí)間軸上具有絕對(duì)的同步性。為了實(shí)現(xiàn)相對(duì)獨(dú)立屬性在時(shí)空內(nèi)的無縫關(guān)聯(lián),基于本體的思想我們引入時(shí)間本體的概念。
時(shí)間本體是從空間內(nèi)對(duì)象的一切屬性發(fā)展的角度出發(fā),把空間對(duì)象屬性的改變與更替就可以抽象為一個(gè)對(duì)象在某一瞬間由于空間和屬性的變化而死亡或新的對(duì)象產(chǎn)生。
空間對(duì)象的存在狀態(tài)是在一定的時(shí)間下,空間實(shí)體客觀存在的形式,是空間實(shí)體相對(duì)穩(wěn)定的一個(gè)過程,一個(gè)空間對(duì)象在其生命周期里有不同的狀態(tài)。空間實(shí)體狀態(tài)的改變是人類認(rèn)識(shí)、改造地理實(shí)體的反映,因而空間對(duì)象的產(chǎn)生和變更是一個(gè)瞬間狀態(tài),產(chǎn)生和變更采用時(shí)刻的方式表示[8]。其變化主要分為3種類型:
空間信息不變,屬性信息的突然變化;屬性信息不變,空間信息的突然變化;空間幾何信息和屬性信息的同時(shí)突然變化。
無論是持續(xù)還是變化,空間對(duì)象的死亡與產(chǎn)生是一個(gè)相對(duì)狀態(tài),死亡對(duì)象的空間特性與產(chǎn)生對(duì)象的特性是相關(guān)的平且在時(shí)間上是一致的,這樣就保證了地理空間的無縫性??臻g實(shí)體的發(fā)展和時(shí)間一致性如圖2所示:
圖2 空間對(duì)象時(shí)態(tài)的關(guān)系示意圖
道路系統(tǒng)作為城市構(gòu)架的重要組成部分,在交通、規(guī)劃、旅游等行業(yè)應(yīng)用中占據(jù)舉足輕重的作用。但在構(gòu)建道路模型數(shù)據(jù)庫時(shí),受比例尺、用途、區(qū)域特征等各種主客觀因素的影響。人們對(duì)究竟應(yīng)選用何種準(zhǔn)則對(duì)路網(wǎng)要素進(jìn)行認(rèn)知、抽象、表達(dá)約束等問題未達(dá)成一致的認(rèn)識(shí),使得目前存在著多重抽象表達(dá)模式,造成路網(wǎng)要素多尺度表達(dá)實(shí)體和關(guān)系難以量化。本文擬從本體的角度出發(fā),闡述道路抽象和組織。
道路本體是地理本體的子類,描述包括道路實(shí)體及實(shí)體間的關(guān)系。其中,對(duì)道路實(shí)體的描述包括空間屬性和非空間屬性?;诒倔w的空間認(rèn)知過程是把空間實(shí)體的相關(guān)屬性封裝為整體,將概念、空間屬性和非空間屬性進(jìn)行一體化的組織和表達(dá),既實(shí)現(xiàn)了語義共享遵循了人類認(rèn)識(shí)現(xiàn)實(shí)世界的思維過程,又使用數(shù)學(xué)方法定義了道路對(duì)象、對(duì)象所在空間以及對(duì)象直接復(fù)雜的邏輯關(guān)系(如圖3所示)。
圖3 道路本體的認(rèn)知過程
道路對(duì)象的本體描述可以視為是道路實(shí)體、現(xiàn)象、特征等以及對(duì)他們的描述的總和,在離散的三維空間中,可以將道路對(duì)象的本體描述成一個(gè)一維數(shù)組[9]。
其中,R表示任意路段{R,a1,a2,…,an}表示該路段的道路對(duì)象、特征等的集合。
假設(shè)α是關(guān)于空間變量ai的離散空間,β是該空間的一個(gè)路段,我們就可以把自變量β及其在α上的空間參變量變量ai視為一個(gè)ai關(guān)于R的函數(shù)f(R,ai)。f(R,ai)就是一個(gè)道路實(shí)體,是具有完整道路要素的最小邏輯單元。
對(duì)道路的本體描述可以定義成一個(gè)五元組Ot= {CP,EP,F(xiàn),S,L}。其中CP表示道路本體的概念集,控制本體描述的客觀性;EP是概念集及它們之間聯(lián)系的精確定義;F是實(shí)例聲明集,它確保了Ot的實(shí)例是精確地?cái)?shù)學(xué)描述;S是CP、EP的定義集,它保證了本體中反映的知識(shí)是其使用者共同認(rèn)可的;L是圖層要素主要反映了道路實(shí)體之間的拓?fù)潢P(guān)系和屬性關(guān)聯(lián)。Ot的定義是在實(shí)體之間建立了明確的邏輯關(guān)系和語義聯(lián)系。由此道路實(shí)體在本體空間數(shù)據(jù)模型的描述即為一個(gè)三元組E={Ot,f(R,ai),L},模型的構(gòu)成如圖4所示。
圖4 基于本體的道路實(shí)體數(shù)據(jù)概念
該模型以實(shí)體為單位對(duì)道路的地理信息進(jìn)行組織,把客觀世界作為整體看待,在保證了傳統(tǒng)模型便于理解和易于實(shí)現(xiàn)等優(yōu)點(diǎn)的基礎(chǔ)上,增加了道路實(shí)體之間的邏輯關(guān)系和語義聯(lián)系,進(jìn)一步擴(kuò)展了傳統(tǒng)模型的。通過對(duì)道路對(duì)象的本體化描述,實(shí)現(xiàn)了道路對(duì)象的結(jié)構(gòu)化,數(shù)學(xué)化、封裝化,描述了道路對(duì)象之間的空間和邏輯關(guān)系。
時(shí)空數(shù)據(jù)模型的建立必須符合人的認(rèn)知規(guī)律,圖5所示,基于本體的GIS時(shí)空數(shù)據(jù)模型是將空間對(duì)象的變化劃分為對(duì)象的屬性改變(Ⅰ、Ⅱ),對(duì)象的合并與分解(Ⅲ、Ⅳ),對(duì)象的繼承(Ⅴ、Ⅵ)3種基本類型。圖中以道路的交通信息為例既描述了變化的類型,表達(dá)了空間對(duì)象屬性信息不變而空間幾何信息的突然變化、空間幾何信息和屬性信息突然變化的兩種死亡類型,空間對(duì)象空間幾何信息不變而屬性信息突然變化的死亡類型。
基于本體的GIS時(shí)空數(shù)據(jù)模型非常直觀地表達(dá)了道路對(duì)象的變化過程,是地理現(xiàn)象隨時(shí)間變化的原始表達(dá),且能夠很好地恢復(fù)歷史上某一時(shí)刻的所有信息。在整個(gè)歷程中,只存儲(chǔ)變化的空間對(duì)象,沒有變化的空間對(duì)象只需存儲(chǔ)一次。因此,每變化一次,只需記錄很小的數(shù)據(jù)量。
圖5 道路實(shí)體的特征變化
道路實(shí)體是一個(gè)個(gè)彼此相互連接的對(duì)象,而且輻射范圍廣泛,涉及內(nèi)容眾多。合理的拆分道路的各種要素是實(shí)現(xiàn)科學(xué)組織和管理道路信息的重要保證。
基于本體的概念將城市道路實(shí)體拆分,首先將道路實(shí)體拆分、抽象,進(jìn)而得到單純道路和交通設(shè)施兩個(gè)子類,子類中根據(jù)不同的功能進(jìn)行實(shí)例化。依據(jù)基于本體的地理空間數(shù)據(jù)模型建模方法,城市道路實(shí)體抽象為3個(gè)層次如圖6所示。
圖6 道路的抽象層次
基于本體的地理空間數(shù)據(jù)模型將城市道路本體按照模型的要求存儲(chǔ)在Oracle Spatial對(duì)象—關(guān)系數(shù)據(jù)庫中,每個(gè)道路實(shí)體占用一條記錄,圖形信息存放在SDO _GEOMETRY類型的字段中,數(shù)據(jù)庫表之間通過對(duì)象標(biāo)識(shí)建立聯(lián)系。
抽象得到的道路實(shí)體的概念及相互關(guān)系采用本體模型進(jìn)行組織,用W3C公布的本體描述語言O(shè)WL進(jìn)行描述,最后存儲(chǔ)到Oracle XML/OWL中。
數(shù)據(jù)庫表主要包括道路表、交通設(shè)施表如圖7所示,每個(gè)表中都包含了由本體概念決定的定量定性的道路屬性和設(shè)施的屬性,不同的箭頭代表了不同的函數(shù)映射關(guān)系,是對(duì)道路本體各種屬性和聯(lián)系的定義。每個(gè)表表示一個(gè)圖層L,不同道路對(duì)象使用相同的屬性或者相同的映射關(guān)系就是它們?cè)趫D層L上的聯(lián)系。道路表不存儲(chǔ)對(duì)象的位置信息,只存儲(chǔ)組合對(duì)象信息和簡單對(duì)象的地址信息。道路的幾何信息和屬性信息的改變的關(guān)聯(lián)通過時(shí)間序列關(guān)系連接,保證了屬性幾何信息和非幾何信息的同時(shí)更新和記錄。
基于本體的地理空間數(shù)據(jù)模型從人類的思維角度出發(fā),研究地理世界中語義和邏輯關(guān)系的描述與表達(dá),將現(xiàn)實(shí)世界中的地理現(xiàn)象用空間本體及本體間關(guān)系來描述。在信息管理方面,模型以本體的方式存儲(chǔ)空間實(shí)體,該方法具有實(shí)體管理、修改方便、查詢檢索、空間分析容易等優(yōu)點(diǎn)。更重要的是它能夠方便的構(gòu)造用戶需要的任何復(fù)雜空間實(shí)體。該模型的存儲(chǔ)方法實(shí)現(xiàn)了空間實(shí)體的圖形信息和屬性信息的一體化管理,突出了語義信息的管理,可以解決不同系統(tǒng)間易造成語義理解誤差甚至錯(cuò)誤的問題。對(duì)現(xiàn)有數(shù)據(jù)模型進(jìn)行了擴(kuò)充,為智慧城市地理信息的表達(dá)、存儲(chǔ)和共享等操作提供了借鑒。
[1] Rodaric B.The design of GSC field Log:ontology-based software for computer aided geologicalmapping[J].Computers&Geosciences,2004,30(1):5~20.
[2] 趙波,陶躍華.本體論及本體論在計(jì)算機(jī)科學(xué)技術(shù)中的應(yīng)用[J].云南師范大學(xué)學(xué)報(bào)·自然科學(xué)版,2002,22 (6):5~7.
[3] 鄧志鴻,唐世渭,張銘等.Ontology研究綜述[J].北京大學(xué)學(xué)報(bào)·自然科學(xué)版,2002(5):730~738.
[4] JMcCarthy.Circumscription-A form of non-monotonic reasoning[J].Artificial intelligence,1980,5(13):27~39.
[5] Mennis JL,Peuquet D J.A conceptual framework for incorporating cognitive principles into geo-graphical database representation[J].geographical information science,2000,14 (6):501~520.
[6] 李景.本體理論及在農(nóng)業(yè)文獻(xiàn)檢索系統(tǒng)中的應(yīng)用研究一以花卉學(xué)本體建模為例[D].北京:中國科學(xué)院,2004.
[7] 王洪偉.基于本體的元數(shù)據(jù)模型的建立研究[D].上海:上海交通大學(xué),2004.
[8] 李景文,傅瑋佳,葉良松等.基于對(duì)象的GIS時(shí)空數(shù)據(jù)模型設(shè)計(jì)方法[J].地理與地理信息科學(xué),2010,26(6):11~14.
[9] Goodchild F.Geographic datamodeling[J].Computer and Geo-sciences,1992,18(4):401~408.