• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      構(gòu)建基于Web/XML的信息集成研究

      2009-06-16 08:11
      消費(fèi)導(dǎo)刊 2009年10期

      胡 舟

      [摘 要]在當(dāng)前的網(wǎng)絡(luò)信息時(shí)代,信息量不僅龐大而且源自于不同的數(shù)據(jù)源,信息集成一直是研究的熱點(diǎn)?;诙啻?Multi-Agent)的信息資源集成方案有所 不足,而XML集成機(jī)制的優(yōu)點(diǎn),適于網(wǎng)絡(luò)環(huán)境下基于XML的信息集成。

      [關(guān)鍵詞]XML 資源集成 DTD XSL Wrapper DOM

      引言

      隨著計(jì)算機(jī)技術(shù),特別是Internet的不斷發(fā)展,實(shí)現(xiàn)"信息孤島"之間的集成與交互成為亟待解決的問題。而XML技術(shù)則可以很好的解決這個(gè)問題。用XML進(jìn)行數(shù)據(jù)集成,只需對所有的異構(gòu)數(shù)據(jù)源增加一個(gè)以XML為格式的封裝體,即在不改變數(shù)據(jù)源的前提下,用XML對數(shù)據(jù)源的定義描述字、數(shù)據(jù)源的創(chuàng)建等相關(guān)信息進(jìn)行封裝。供應(yīng)鏈節(jié)點(diǎn)上所有數(shù)據(jù)源的封裝體納入全局的 XML Schema或DTD,并存儲在XML虛擬服務(wù)器,為系統(tǒng)檢索、定位提供服務(wù)。在XML的集成機(jī)制里,可以通過XML封裝體實(shí)現(xiàn)彼此之間的數(shù)據(jù)交互,所以 不需要了解數(shù)據(jù)庫的格式,從而彌補(bǔ)了基于多代理的集成方法在這方面的不足。下面首先概要介紹XML的相關(guān)技術(shù),進(jìn)而給出網(wǎng)絡(luò)環(huán)境下的、基于XML的信息集成方案

      一、XML技術(shù)

      (一)XML相關(guān)標(biāo)準(zhǔn)

      XML基礎(chǔ)標(biāo)準(zhǔn)是為XML的進(jìn)一步實(shí)用化制定的標(biāo)準(zhǔn),它規(guī)定了采用XML制定標(biāo)準(zhǔn)時(shí)的一些公用特征、方法或規(guī)則。XML Schema描述了更加嚴(yán)格定義XML文檔的方法,以便可以更自動地處理XML文檔。XML Namespace用于保證XML DTD中名字的一致性,以便不同的DTD中的名字在需要時(shí) 可以合并到一個(gè)文檔中。DOM定義了一組與平臺和語言無關(guān)的接口,以便程序和腳本能夠動態(tài)訪問和修改XML文檔內(nèi)容、結(jié)構(gòu)及樣式。

      (二)XML的主要技術(shù)特點(diǎn)

      XML是一種元標(biāo)記語言,強(qiáng)調(diào)以數(shù)據(jù)為核心,這兩大特點(diǎn)在XML的眾多技術(shù)特點(diǎn)中最為突出,同時(shí)也奠定了XML在信息管理中的優(yōu)勢。

      XML是一種元標(biāo)記語言與HTML不同,XML不是一種具體的標(biāo)記語言,它沒有固定的標(biāo)記符號,是一種元標(biāo)記語言,是一種用來定義標(biāo)記的標(biāo)記語言,它允許用戶自己定義一套適于應(yīng)用的DTD。

      (三)DTD(Document Type Define,文檔類型定義)

      DTD的作用是定義允許或不允許什么在文檔中出現(xiàn)。DTD的結(jié)構(gòu):一般由元素類型聲明、屬性表聲明、實(shí)體聲明、記號聲明等構(gòu)成。一個(gè)典型的文檔類型定義文 件會把未來所要創(chuàng)作的XML文檔的元素結(jié)構(gòu)、屬性類型、實(shí)體引用等預(yù)先進(jìn)行規(guī)定。用戶既可以直接在XML文檔中定義DTD,也可以通過URL引用外部的 DTD。DTD位XML文檔的編寫者和處理者提供了共同遵循的原則,使得與文檔相關(guān)的各種工作有了統(tǒng)一的標(biāo)準(zhǔn)。

      二、基于XML的信息集成方案

      (一)基于XML的信息集成的層次結(jié)構(gòu)

      整個(gè)信息集成可以分為三個(gè)層次:其中最底層為信息抽取層,中間為中介層,最上層為用戶接口層。

      1.信息抽取層

      信息抽取層處于系統(tǒng)的最低層,是系統(tǒng)的數(shù)據(jù)提供者,主要功能是提取和集成分布在多個(gè)異構(gòu)數(shù)據(jù)源(數(shù)據(jù)庫,知識庫及構(gòu)件庫)上的信息。這一層采用 Wrapper(包裝器)技術(shù)實(shí)現(xiàn)將一個(gè)從中介層得到的查詢,翻譯成能在經(jīng)過封裝的數(shù)據(jù)源上執(zhí)行的操作,將查詢結(jié)果抽取并打包到一個(gè)XML文檔,最后將該 文檔返回給中介層。

      2.中介層

      中介層(Mediation Layer)的主要功能有兩方面:一方面對上接受用戶通過DOM客戶端API向系統(tǒng)提交的或應(yīng)用程序發(fā)出的查詢,將其轉(zhuǎn)換成對XML的查詢,并將查詢結(jié)果 返回給用戶或應(yīng)用程序;另一方面對下將XML查詢分發(fā)給各個(gè)包裝器,并將查詢結(jié)果通過DTD說明再轉(zhuǎn)換成XML格式。

      3.用戶接口層

      用戶接口層(User Interface Layer)在中介層之上,負(fù)責(zé)將用戶的查詢命令提交給中介層,獲得并解釋查詢結(jié)果樹,并將結(jié)果顯示給用戶。XML DOM(Document Object Model,文檔對象模型)是為合法的格式良好的XML文檔設(shè)計(jì)的一套API(Application Programming Interface,應(yīng)用程序接口),它同時(shí)定義了這些文檔的邏輯結(jié)構(gòu),訪問及操作方法。由于數(shù)據(jù)顯示與內(nèi)容分開,XML定義的數(shù)據(jù)允許指定不同的顯示方 式,使數(shù)據(jù)更合理的表現(xiàn)出來。本地的數(shù)據(jù)能夠以客戶配置,使用者選擇或其他標(biāo)準(zhǔn)決定的方式動態(tài)的表現(xiàn)出來。CSS和XSL為數(shù)據(jù)的顯示提供了公布的機(jī)制。

      (二)基于XML的信息集成系統(tǒng)的設(shè)計(jì)

      信息抽取層的Wrapper組件由兩部分組成:Wrapper生成器和Wrapper實(shí)例(簡稱Wrapper)。如圖4所示,一個(gè)Wrapper位于 中介層和一個(gè)數(shù)據(jù)源的中間,它通常為中介層查詢異構(gòu)信息源集合提供一個(gè)公共接口。每個(gè)Wrapper都要為某個(gè)特定的數(shù)據(jù)源制定相應(yīng)的接口,這個(gè)功能是由 Wrapper生成器完成的。Wrapper生成器用于為查詢某個(gè)確定的站點(diǎn)或站點(diǎn)集合構(gòu)建Wrapper。Wrapper的輸入是用一種Wrapper規(guī)范語言書寫的規(guī)格說明,包 括關(guān)于將要為之生成的Wrapper的數(shù)據(jù)源的元信息,該元信息描述了如何從一個(gè)數(shù)據(jù)源請求服務(wù)以及如何抽取和解釋從數(shù)據(jù)源返回的信息。規(guī)格說明還必須能 夠表達(dá)以下內(nèi)容:數(shù)據(jù)源接口、數(shù)據(jù)模型、從用戶到數(shù)據(jù)源本地操作的查詢映射、數(shù)據(jù)源的查詢能力。

      三、DOM客戶端API的設(shè)計(jì)

      DOM全稱是Document Object Model,是一個(gè)文件對象所組成的模型。它不光用于XML,最早是用于HTML的。DOM定義了一組分析元可以顯示的標(biāo)準(zhǔn)指令集,通過程序存取HTML或XML的內(nèi)容,然后通過程序中的對象集合將其顯示出來。

      我們可以通過創(chuàng)建Document對象,使得應(yīng)用程序得到對XML文檔進(jìn)行操作的入口。進(jìn)一步通過直接加載XML文檔把創(chuàng)建的這個(gè)文檔對象同實(shí)際的XML文檔關(guān)聯(lián)起來。從而將XML文檔轉(zhuǎn)換成一個(gè)DOM對象模型,為上層提供訪問服務(wù)。

      下面的例子結(jié)合VBScript和XML DOM對象來生成XML數(shù)據(jù):

      </SCRIPT>

      <html>

      <head><title>利用DOM對象來生成XML數(shù)據(jù)</title></head>

      <body>

      <hr>

      姓名:

      <Input id=namel>

      <br>

      用戶名:

      <input id=id>

      <br>

      密碼

      <input type=“passwordid”=password>

      <br>

      電子郵件

      <input id=email>

      <Input type=Button id=domxml value=“生成XML數(shù)據(jù)”>

      </body>

      </html>

      四、總結(jié)

      Web環(huán)境下的異構(gòu)數(shù)據(jù)源的集成,特別是基于XML的數(shù)據(jù)集成問題已經(jīng)成為當(dāng)前計(jì)算機(jī)領(lǐng)域中一個(gè)重要的研究方向。XML具有簡單、開放、可擴(kuò)展性、靈 活、自描述性等特點(diǎn),給Internet注入了新的活力。作為數(shù)據(jù)表示的一個(gè)開放標(biāo)準(zhǔn),XML為數(shù)據(jù)集成帶來了新的機(jī)遇。用XML作為數(shù)據(jù)交換的中介,給 系統(tǒng)的實(shí)現(xiàn)帶來了極大的靈活性。系統(tǒng)可以屏蔽掉后臺的多種數(shù)據(jù)源,用統(tǒng)一的XML格式的數(shù)據(jù)呈現(xiàn)給用戶。接收數(shù)據(jù)方根據(jù)XML數(shù)據(jù)的DTD可以對數(shù)據(jù)進(jìn)行 任意的處理,如分解出其中需要處理的數(shù)據(jù)或是以不同的樣式來顯示。通過本系統(tǒng),可以實(shí)現(xiàn)散布在Web上的異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)的無縫集成。

      全椒县| 荆州市| 调兵山市| 杭锦旗| 冕宁县| 凌源市| 江北区| 海淀区| 罗定市| 运城市| 蒙阴县| 新源县| SHOW| 霍林郭勒市| 湛江市| 临夏县| 普兰店市| 定南县| 奉新县| 沛县| 务川| 定安县| 扶绥县| 客服| 山东省| 尼玛县| 柳州市| 高淳县| 黑龙江省| 岳普湖县| 昆明市| 土默特右旗| 安远县| 洛隆县| 海安县| 香河县| 新宾| 和林格尔县| 文水县| 阜新市| 筠连县|