權(quán)赟
(西安歐亞學(xué)院信息工程學(xué)院,陜西 西安 710065)
現(xiàn)今的國(guó)際互聯(lián)網(wǎng)是一個(gè)有利于人們相互交流、合作的強(qiáng)大工具。它以HTML的頁面方式向人們提供了大量的信息,人們可以很容易理解網(wǎng)頁上的信息。但是由于這種易于人類理解、交流的設(shè)計(jì)目的,也就造成了網(wǎng)頁上的內(nèi)容設(shè)計(jì)成為專供人類瀏覽的,而不是供計(jì)算機(jī)理解和處理的工具。所以,國(guó)際互聯(lián)網(wǎng)應(yīng)該不單單只是使人類來理解,而且應(yīng)該讓機(jī)器來理解網(wǎng)頁上的內(nèi)容。為了滿足這種要求,使計(jì)算機(jī)按照可靠的方法來處理網(wǎng)頁中的語義,智能地理解網(wǎng)頁內(nèi)容和進(jìn)行操作,人們就開始研究和開發(fā)新一代的國(guó)際互聯(lián)網(wǎng)--語義網(wǎng)。語義網(wǎng)是一個(gè)由大量計(jì)算機(jī)可以理解的數(shù)據(jù)所構(gòu)成的一個(gè)分布式的體系結(jié)構(gòu),在這個(gè)體系結(jié)構(gòu)中,數(shù)據(jù)之間的關(guān)系按照特定的術(shù)語表達(dá),計(jì)算機(jī)能夠通過這些術(shù)語得到數(shù)據(jù)的含義,同時(shí)這些術(shù)語之間又形成一種復(fù)雜的網(wǎng)絡(luò)聯(lián)系,計(jì)算機(jī)在數(shù)據(jù)含義的基礎(chǔ)上利用這種聯(lián)系應(yīng)用邏輯來進(jìn)行推理,從而實(shí)現(xiàn)機(jī)器對(duì)信息的智能自動(dòng)處理,解決像現(xiàn)在的網(wǎng)頁功能單調(diào)、搜索引擎智能化程度低等問題。從功能上看,語義網(wǎng)是一個(gè)能夠理解人類信息的智能網(wǎng)絡(luò)。
萬維網(wǎng)創(chuàng)始人Tim.Berner-Lee對(duì)語義網(wǎng)做了如下的描述:語義網(wǎng)不是一個(gè)孤立的,全新的萬維網(wǎng),而是對(duì)當(dāng)前的國(guó)際互聯(lián)網(wǎng)的擴(kuò)展,語義網(wǎng)上的信息具有良好的含義,使計(jì)算機(jī)之間以及人類能夠彼此合作。根據(jù)上面的描述,我們可以給語義網(wǎng)做出如下定義:計(jì)算機(jī)可以理解信息含義的下一代萬維網(wǎng),稱之為語義網(wǎng)。
語義網(wǎng)中的信息和知識(shí)要求是從眾多的提供者以多種多樣的方式來提供,而且這些知識(shí)和信息能夠被各種應(yīng)用或Web服務(wù)實(shí)現(xiàn)共同理解,并且按照一定的邏輯規(guī)則進(jìn)行處理。所以語義網(wǎng)上的信息和知識(shí)要有創(chuàng)建上的分散性,同時(shí)又要有應(yīng)用上的通用性。
互聯(lián)網(wǎng)的創(chuàng)始人Tim.Berners-Lee在2000年提出了語義網(wǎng)的體系結(jié)構(gòu)。下面我們對(duì)這個(gè)結(jié)構(gòu)從底層到高層,逐層簡(jiǎn)單介紹每個(gè)部分的概念和功能。
在其體系結(jié)構(gòu)中,第一層是Unicode和URI,它是整個(gè)語義網(wǎng)的基礎(chǔ),Unicode(統(tǒng)一編碼)處理資源的編碼,URI(統(tǒng)一資源定位器)負(fù)責(zé)標(biāo)識(shí)資源;第二層是XML+名空間+XML模式,用于表示數(shù)據(jù)的內(nèi)容和結(jié)構(gòu);第三層是RDF+RDF模式,用于描述資源及其類型;第四層是本體詞匯,用于描述各種資源之間的聯(lián)系;第五層是邏輯,在下面四層的基礎(chǔ)上進(jìn)行邏輯推理操作;第六層是驗(yàn)證,根據(jù)邏輯陳述進(jìn)行驗(yàn)證以得出結(jié)論;第七層是信任,在用戶間建立信任關(guān)系。第二、三、四層是語義Web的關(guān)鍵層,用于表示網(wǎng)絡(luò)信息的語義,也是現(xiàn)在語義網(wǎng)研究的熱點(diǎn)所在。因?yàn)閮蓚€(gè)系統(tǒng)可能采用不同的標(biāo)識(shí)符表示同一概念,也可能用一個(gè)標(biāo)識(shí)符表示不同的含義,程序若要在兩個(gè)數(shù)據(jù)庫(kù)之間進(jìn)行信息的比較和合并,就必須了解某些標(biāo)識(shí)符表示的是否是同一事物。對(duì)這個(gè)問題的一個(gè)解決方法就是本體論(Ontology)。本體是概念化的顯式說明,它是對(duì)現(xiàn)實(shí)世界事物的抽象建模,包括分類和一套推理規(guī)則。分類定義對(duì)象的類別及其之間的關(guān)系,使我們能夠表達(dá)實(shí)體之間的大量關(guān)系,而根據(jù)推理規(guī)則,程序可以進(jìn)行自動(dòng)推理。簡(jiǎn)單地說,就是在不同的系統(tǒng)間定義一本字典或者度量表,使它們對(duì)實(shí)體及其之間的關(guān)系達(dá)成共識(shí),以便交流和共享。
現(xiàn)今的互聯(lián)網(wǎng)上充斥著海量信息,傳統(tǒng)的HTML表示信息的方法使得信息搜索面臨種種困境?,F(xiàn)在的搜索引擎大多采用關(guān)鍵字搜索方法,耗時(shí)而且不準(zhǔn)確,垃圾信息太多。語義網(wǎng)能帶給我們?nèi)碌乃阉鞣椒?,能幫助我們高效地找到所需要地?zhǔn)確信息。在企業(yè)內(nèi)部信息處理中,我們可以利用基于Ontology的學(xué)習(xí)系統(tǒng)將企業(yè)的內(nèi)部信息轉(zhuǎn)化成為一個(gè)龐大的,分類別的,有規(guī)則的知識(shí)庫(kù)。這樣我們就能使企業(yè)積累的這些信息服務(wù)于企業(yè)的日常運(yùn)作,消除知識(shí)壁壘和知識(shí)盲區(qū),提高員工的個(gè)人素質(zhì),從而達(dá)到提升整個(gè)企業(yè)的運(yùn)行效率。在今后的互聯(lián)網(wǎng)服務(wù)中,用戶關(guān)心的是服務(wù)的具體結(jié)果和服務(wù)質(zhì)量,而不是具體的服務(wù)過程。通過將語義網(wǎng)和Web Service結(jié)合起來,可以使得Web Service被機(jī)器理解,從而自動(dòng)執(zhí)行,對(duì)用戶透明。同時(shí)這種服務(wù)能被Agent自動(dòng)處理,實(shí)現(xiàn)Web Service之間的自動(dòng)交互。
總的來說,有了大量富含語義信息的網(wǎng)頁,就好像有了一個(gè)巨大的全球互聯(lián)的數(shù)據(jù)庫(kù)。有了語義信息的幫助,人們開發(fā)出的軟件代理A-gent程序的智能和自動(dòng)化將大大提高,它們從不同的資源中收集網(wǎng)頁內(nèi)容,搜索和處理信息并和其他程序交換信息,真正發(fā)揮語義網(wǎng)的力量。當(dāng)出現(xiàn)更多的機(jī)器、可處理的網(wǎng)頁內(nèi)容和服務(wù)(包括更多的代理)時(shí),通過代理之間的信息交換和協(xié)同工作,信息處理的效率將呈指數(shù)級(jí)增長(zhǎng),能更好地滿足用戶的需求。
[1]http://www.xml.com/pub/a/98/10/guide0.html
[2]http://www.w3.org/TR/2000/REC-xml-20001006
[3]Grigoris Antoniou and Frank van Harmelen《A Semantic Web Primer》
[4]http://www.chinakm.com