• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      供水管網(wǎng)異構(gòu)數(shù)據(jù)集成共享關(guān)鍵技術(shù)研究

      2019-11-22 07:04:02范冬林康傳利付波霖高二濤徐雯婷藍(lán)貴文
      水力發(fā)電 2019年8期
      關(guān)鍵詞:供水管數(shù)據(jù)模型異構(gòu)

      范冬林,康傳利,付波霖,高二濤 ,徐雯婷,藍(lán)貴文

      (1.桂林理工大學(xué)測(cè)繪地理信息學(xué)院,廣西桂林541004;2.廣西空間信息與測(cè)繪重點(diǎn)實(shí)驗(yàn)室,廣西桂林541004;3.東華理工大學(xué)測(cè)繪工程學(xué)院,江西南昌330013)

      0 引 言

      在信息化、智慧化浪潮的推動(dòng)下,智慧城市已成為我國城市化發(fā)展的新趨勢(shì)[1]。供水管網(wǎng)作為城市信息基礎(chǔ)設(shè)施的重要組成部分,是智慧城市建設(shè)的重要數(shù)據(jù)源之一。智慧城市的發(fā)展與數(shù)字城市的建設(shè)一脈相承[2],在數(shù)字城市建設(shè)進(jìn)程中,供水管網(wǎng)信息化系統(tǒng)作為GIS平臺(tái)的一個(gè)行業(yè)應(yīng)用,通常僅以現(xiàn)有的數(shù)據(jù)模型來解決城市管網(wǎng)的特殊應(yīng)用,未能深入考慮管網(wǎng)運(yùn)行的行業(yè)特性[3],主要表現(xiàn)在:①管網(wǎng)信息資源缺乏語義信息,不能滿足智慧城市對(duì)重要資源的整合、共享、集成的要求;②供水管網(wǎng)數(shù)據(jù)多樣化,系統(tǒng)建設(shè)層次不一。由于管網(wǎng)管理者需求的不同以及系統(tǒng)建設(shè)者對(duì)城市管網(wǎng)認(rèn)識(shí)的差異,使得現(xiàn)有系統(tǒng)的應(yīng)用層次各不相同,進(jìn)而導(dǎo)致了供水管網(wǎng)數(shù)據(jù)格式多樣化且語義一致性差[4]。此類供水信息系統(tǒng)對(duì)外提供的WEB服務(wù)資源(即共享信息)缺乏統(tǒng)一的語義描述,難以形成具有統(tǒng)一語義與知識(shí)表達(dá)的信息共享。

      為解決上述問題,必須對(duì)現(xiàn)行的異構(gòu)數(shù)據(jù)進(jìn)行集成,形成一致的數(shù)據(jù)語義描述,構(gòu)建集成數(shù)據(jù)模型[5]。對(duì)GIS空間數(shù)據(jù)而言,數(shù)據(jù)集成是消除源數(shù)據(jù)在數(shù)據(jù)模式、數(shù)據(jù)屬性和數(shù)據(jù)結(jié)構(gòu)上的差異和沖突,按照目標(biāo)數(shù)據(jù)進(jìn)行一致化處理,最后為用戶提供統(tǒng)一的表現(xiàn)形式[6]。本文從數(shù)據(jù)集成的層面,實(shí)現(xiàn)供水管網(wǎng)異構(gòu)數(shù)據(jù)集成研究,為城市其他行業(yè)管網(wǎng)數(shù)據(jù)集成提供參考。

      1 供水管網(wǎng)數(shù)據(jù)異構(gòu)性分析

      對(duì)供水管網(wǎng)本身數(shù)據(jù)而言,不僅存在數(shù)據(jù)格式的不同,如常見的數(shù)據(jù)格式有ArcGIS的SHP格式、AutoCAD的DWG格式、MapGIS的W*格式等。而且,即使是同一格式的管網(wǎng)數(shù)據(jù),對(duì)管網(wǎng)領(lǐng)域概念理解的不同,也會(huì)存在對(duì)相同實(shí)體的數(shù)據(jù)存儲(chǔ)描述的差異,如數(shù)據(jù)結(jié)構(gòu)沖突、字段命名沖突以及實(shí)例的度量單位沖突等。

      從數(shù)據(jù)的語義層面看,供水管網(wǎng)數(shù)據(jù)異構(gòu)包括2種類型[7]:實(shí)例異構(gòu)和模式異構(gòu)。實(shí)例異構(gòu)是指不同的數(shù)據(jù)源對(duì)同一個(gè)實(shí)體具有不同的描述,對(duì)相同的地理實(shí)體的描述使用同義字或同形異義字。如系統(tǒng)A中材質(zhì)為“普通鑄鐵管”,而系統(tǒng)B中表示為“灰口鑄鐵管”,由于其表現(xiàn)形式不同,通過精確匹配方式則無法將2個(gè)數(shù)據(jù)描述一一對(duì)應(yīng)起來。模式異構(gòu)是指不同數(shù)據(jù)源數(shù)據(jù)含義相似或有差別,包含2方面異構(gòu):一方面是指2個(gè)局部模式的屬性具有相同的含義,但屬性名卻不相同,這種異構(gòu)亦稱為命名異構(gòu),如在模式A中“材質(zhì)”字段名和模式B中“管材”指的是同一個(gè)概念;另一方面則指不同的數(shù)據(jù)源對(duì)相同實(shí)體的屬性采取不同的定義方法,這種異構(gòu)也稱為結(jié)構(gòu)異構(gòu),如模式A對(duì)“地址”的表示在一個(gè)屬性字段中完成,而在模式B中“地址”由“省”、“市”、“街道”3個(gè)屬性字段描述。

      2 供水管網(wǎng)異構(gòu)數(shù)據(jù)集成技術(shù)

      2.1 集成數(shù)據(jù)模型

      本體技術(shù)能夠解決數(shù)據(jù)集成中語義異構(gòu)問題,最根本的原因在于其定義的共享概念模型使用戶和應(yīng)用程序?qū)Ω拍詈托g(shù)語具有共同的理解[8]。因此,對(duì)供水管網(wǎng)領(lǐng)域中核心概念的抽象顯得尤為重要。在傳統(tǒng)的本體集成技術(shù)研究中,核心概念僅僅是對(duì)領(lǐng)域內(nèi)實(shí)體和關(guān)系的表達(dá)[9],而在本文中,核心概念不僅包含供水管網(wǎng)中的實(shí)體類型與關(guān)系,同時(shí)包含實(shí)體內(nèi)屬性集合的抽象。為了構(gòu)建供水管網(wǎng)集成數(shù)據(jù)模型,本文將屬性集合的概念抽象為特性,其邏輯上是對(duì)供水管網(wǎng)概念的形式化表述,而物理上則是一組屬性的集合。本文將特性分為3類:存儲(chǔ)特性、普通特性和標(biāo)識(shí)特性。

      (1)存儲(chǔ)特性。用于管理數(shù)據(jù)類型的存儲(chǔ)方式,主要功能包括基于類型的數(shù)據(jù)創(chuàng)建、數(shù)據(jù)選擇、數(shù)據(jù)讀取和修改等。

      (2)普通特性。包含一定數(shù)量的固有屬性字段,并在該固有屬性字段的基礎(chǔ)上定義了基于特性的基礎(chǔ)應(yīng)用操作,如管材特性中的獲取管材信息,規(guī)格特性中的獲取設(shè)備規(guī)格信息以及進(jìn)行設(shè)備規(guī)格檢查等。

      (3)標(biāo)識(shí)特性。用于對(duì)管線設(shè)備標(biāo)識(shí),這類特性不需要匹配固有的屬性字段信息,如針對(duì)供水的閥門設(shè)備以及燃?xì)獾恼{(diào)壓站設(shè)備都具有的關(guān)斷特性,當(dāng)給某一數(shù)據(jù)類型賦予了關(guān)斷特性時(shí),說明該數(shù)據(jù)所存儲(chǔ)的設(shè)備具有阻斷網(wǎng)絡(luò)流通功能的特性。

      按照地下管線探測(cè)規(guī)程和集成數(shù)據(jù)模型的需求,建立供水設(shè)備類型,并進(jìn)一步確定每種設(shè)備類型的屬性。對(duì)于集成數(shù)據(jù)模型而言,類型的屬性結(jié)構(gòu)不僅需要考慮異構(gòu)數(shù)據(jù)中的相同概念,還需考慮數(shù)據(jù)源中的特殊屬性,以便更大程度兼容異構(gòu)數(shù)據(jù)源。上文提到的特性能夠很好地解決這一問題。類型通過特性間接決定其屬性結(jié)構(gòu),不直接持有屬性,屬性的管理由特性完成。

      閥門類型-特性-屬性關(guān)系見圖1。閥門類型被指定為點(diǎn)設(shè)施存儲(chǔ)特性,該閥門類型還具有關(guān)斷特性和關(guān)閥影響2個(gè)標(biāo)識(shí)特性。同時(shí),普通特性記錄了該類型公共數(shù)據(jù)屬性字段集合。數(shù)據(jù)類型還可以派生子數(shù)據(jù)類型,子數(shù)據(jù)類型繼承了父類型的所有特性。派生的子類型只能添加普通特性和標(biāo)識(shí)特性,不能更改存儲(chǔ)特性。按照上述原則,本文設(shè)計(jì)了供水設(shè)備集成數(shù)據(jù)模型,該模型將作為目標(biāo)本體參與異構(gòu)源數(shù)據(jù)的集成。

      圖1 類型-特性-屬性關(guān)系示意

      2.2 數(shù)據(jù)集成中映射關(guān)系的建立

      建立映射關(guān)系是為了將供水管網(wǎng)集成數(shù)據(jù)模型與不同的源數(shù)據(jù)進(jìn)行關(guān)聯(lián),消除集成數(shù)據(jù)模型與源數(shù)據(jù)的模式和實(shí)例異構(gòu)[10],其關(guān)鍵是概念之間相似度的計(jì)算。在研究相似度計(jì)算方法的文獻(xiàn)[11-13]中,按照不同的標(biāo)準(zhǔn),將相似度計(jì)算方法分為模式級(jí)、實(shí)例級(jí)、元素級(jí)和結(jié)構(gòu)級(jí)。本文主要考慮模式級(jí)和實(shí)例級(jí)的相似度計(jì)算算法,前者指利用本體中的模式信息來計(jì)算相似度,該計(jì)算方式主要是計(jì)算詞法層面的語義相似度[14];后者指利用一定量實(shí)例來進(jìn)行相似度的計(jì)算,該計(jì)算方式主要以數(shù)學(xué)聯(lián)合分布概率為基礎(chǔ)進(jìn)行相似度計(jì)算。每一種相似度在一定程度上反應(yīng)了本體概念間的關(guān)系,對(duì)映射關(guān)系的建立都有不同程度的影響,單獨(dú)使用一種相似度在一些場(chǎng)景亦能取得較為滿意的效果。如在文獻(xiàn)[15]中提供的數(shù)據(jù)中,使用基于實(shí)例的相似度計(jì)算方法可以取得較理想的匹配結(jié)果,但當(dāng)遇到語義上一致,但詞義不同的實(shí)例便難以勝任?;谏鲜鲈颍⒔Y(jié)合供水管網(wǎng)中異構(gòu)數(shù)據(jù)的特性,本文將應(yīng)用結(jié)合詞義、語義和實(shí)例的相似度算法進(jìn)行加權(quán)計(jì)算的綜合相似度計(jì)算方法。

      假設(shè)simw(A,B)、sime(A,B)、simc(A,B)分別表示本體O1中A概念與本體O2中B概念的詞義相似度、語義相似度和實(shí)例相似度,則綜合相似度的計(jì)算方法表示為

      sim(A,B)=α×simw(A,B)+β×sime(A,B)+

      λ×simc(A,B)

      (1)

      α+β+λ=1.0

      (2)

      min{simw(A,B),sime(A,B),

      simc(A,B)}≤sim(A,B)≤max{simw(A,B),

      sime(A,B),simc(A,B)}

      (3)

      式中,α、β、λ為權(quán)重值,依賴于經(jīng)驗(yàn)值,在實(shí)際應(yīng)用中,α、β、λ的值通過訓(xùn)練確定。在本體與源數(shù)據(jù)中選取1組訓(xùn)練樣本,計(jì)算得到的相似分量,變換α、β、λ的取值,得到更多的試驗(yàn)值,從結(jié)果中選取映射準(zhǔn)確率高的作為經(jīng)驗(yàn)值。

      本文從供水管網(wǎng)數(shù)據(jù)中選取了1組數(shù)據(jù)進(jìn)行綜合相似度的計(jì)算,計(jì)算結(jié)果見表1。其中,α、β、λ的值分別取0.3、0.5、0.2。

      通過綜合相似度計(jì)算得到的相似度矩陣,本體中一個(gè)概念可能具有多個(gè)相似度差別不大的另一本體的概念組,如“高程”對(duì)應(yīng)的“管頂高程”和“管底高程”相似度的值都大于0.7。因此,需要確定選擇具體哪個(gè)概念與之對(duì)應(yīng),從而建立本體概念間的映射關(guān)系。設(shè)定閾值T可以有效減少關(guān)聯(lián)概念的數(shù)量,當(dāng)2個(gè)概念的相似度小于T時(shí),便認(rèn)為概念無相關(guān)性;當(dāng)相似度大于T時(shí),則將被匹配概念作為1個(gè)候選概念。如在表1中,當(dāng)T取0.7時(shí),數(shù)據(jù)源本體管頂標(biāo)高、管底標(biāo)高對(duì)應(yīng)集成本體的候選概念皆為管底高程和管頂高程。

      本文選取了106個(gè)目標(biāo)概念和122個(gè)源概念,對(duì)兩者分別使用詞義、語義、實(shí)例和綜合相似度計(jì)算方法進(jìn)行匹配處理,并使用查準(zhǔn)率(Precision)、查全率(Recall)和F1-Measure作為評(píng)判匹配結(jié)果的有效性指標(biāo),評(píng)判指標(biāo)見表2。從表2可知,由于實(shí)例相似度算法僅就數(shù)值型的概念進(jìn)行匹配處理,故其計(jì)算結(jié)果相對(duì)其他算法準(zhǔn)確率稍低;而綜合相似度計(jì)算方法反應(yīng)了概念的多個(gè)方面的信息,其準(zhǔn)確率明顯高于其他相似度算法。

      表2 相似度計(jì)算算法結(jié)果評(píng)價(jià)

      本文中,映射關(guān)系的建立包含模式和數(shù)值映射關(guān)系2個(gè)方面。前者指建立集成數(shù)據(jù)模型和異構(gòu)源關(guān)于類型和屬性字段之間的映射關(guān)系,后者指建立集成數(shù)據(jù)模型和異構(gòu)源屬性數(shù)值的映射關(guān)系。

      模式映射可將非標(biāo)準(zhǔn)化的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)化的數(shù)據(jù),實(shí)現(xiàn)模式映射需要經(jīng)過3個(gè)步驟:類型匹配→屬性字段匹配→數(shù)值匹配。類型匹配通過字符相似度計(jì)算可以確定初步的映射關(guān)系;屬性字段匹配通過綜合相似度計(jì)算也可確定初步的映射關(guān)系,在初步映射關(guān)系的基礎(chǔ)上,通過人工干預(yù)確定最終的映射關(guān)系。在計(jì)算相似度之前,需經(jīng)過預(yù)定義字典過濾,將在預(yù)定義字典中有明確對(duì)應(yīng)關(guān)系的概念剔除,以減少計(jì)算量。模式映射過程如圖2所示。

      完成模式映射關(guān)系后,還需進(jìn)一步對(duì)數(shù)據(jù)值進(jìn)行匹配。本文僅就文本和數(shù)值類型的屬性值進(jìn)行考慮。數(shù)值匹配處理流程見圖3。對(duì)屬性值進(jìn)行匹配的原因是存在實(shí)例異構(gòu),在創(chuàng)建集成本體時(shí),對(duì)字段進(jìn)行過值域約束(范圍約束、選項(xiàng)約束)或進(jìn)行了統(tǒng)一度量單位的約束等。文本類型的數(shù)據(jù)值可能存在n∶1、1∶1的映射關(guān)系以及數(shù)值書寫格式的統(tǒng)一,這部分的映射關(guān)系生成同樣需要進(jìn)行相似度的計(jì)算。

      圖2 模式映射處理流程

      圖3 數(shù)值匹配處理流程

      圖4 集成管網(wǎng)數(shù)據(jù)模板

      數(shù)值型的數(shù)據(jù)值僅考慮度量單位的統(tǒng)一,這部分主要通過元信息、均值來判別換算關(guān)系。

      3 異構(gòu)數(shù)據(jù)集成共享平臺(tái)應(yīng)用

      供水管網(wǎng)異構(gòu)數(shù)據(jù)集成與共享平臺(tái)是在供水集成數(shù)據(jù)模型和綜合相似度計(jì)算方法的支撐下,基于MapGIS SDK二次開發(fā)的供水管網(wǎng)數(shù)據(jù)異構(gòu)的集成共享平臺(tái)。該平臺(tái)以特性為基本處理單元而開發(fā)的特性工具集合,為上層應(yīng)用提供了一套完整的數(shù)據(jù)操作接口。特性工具降低了數(shù)據(jù)與功能的耦合性,提高了基于集成數(shù)據(jù)模型開發(fā)的供水地理信息系統(tǒng)在異構(gòu)數(shù)據(jù)下的復(fù)用性和系統(tǒng)的擴(kuò)展性。平臺(tái)還提供了數(shù)據(jù)的統(tǒng)一發(fā)布,基于GML格式的數(shù)據(jù),可以實(shí)現(xiàn)不同系統(tǒng)或平臺(tái)間的數(shù)據(jù)共享。由于數(shù)據(jù)是已經(jīng)進(jìn)行過集成化處理的,因此使這類數(shù)據(jù)的共享是具有相同語義和知識(shí)的共享。集成管網(wǎng)數(shù)據(jù)模板見圖4。管網(wǎng)拓?fù)涞慕y(tǒng)一語義表達(dá)見圖5。

      圖5 管網(wǎng)拓?fù)涞慕y(tǒng)一語義表達(dá)

      4 結(jié) 語

      本文針對(duì)不同供水管網(wǎng)存在異構(gòu)性和共享信息語義不一致問題,對(duì)其中的關(guān)鍵技術(shù)進(jìn)行了探討,構(gòu)建了一個(gè)供水管網(wǎng)異構(gòu)數(shù)據(jù)集成共享平臺(tái)應(yīng)用實(shí)例,并使用該平臺(tái)先后對(duì)常州、桂林2個(gè)城市的供水管網(wǎng)數(shù)據(jù)進(jìn)行異構(gòu)集成,達(dá)到了預(yù)期效果。

      異構(gòu)數(shù)據(jù)集成共享平臺(tái)在一定程度上解決了供水管網(wǎng)數(shù)據(jù)語義一致的集成共享,特性的引入也可在一定程度上降低供水應(yīng)用系統(tǒng)的開發(fā)周期,提高應(yīng)用功能的復(fù)用性,可供城市其他管網(wǎng)行業(yè)數(shù)據(jù)集成和共享提供參考。

      猜你喜歡
      供水管數(shù)據(jù)模型異構(gòu)
      試論同課異構(gòu)之“同”與“異”
      二次供水管道漏損預(yù)警方法的分析和選擇
      市政工程供水管網(wǎng)運(yùn)行管理
      桂林市供水管網(wǎng)在線水力模型的建立與應(yīng)用初探
      面板數(shù)據(jù)模型截面相關(guān)檢驗(yàn)方法綜述
      加熱爐爐內(nèi)跟蹤數(shù)據(jù)模型優(yōu)化
      overlay SDN實(shí)現(xiàn)異構(gòu)兼容的關(guān)鍵技術(shù)
      LTE異構(gòu)網(wǎng)技術(shù)與組網(wǎng)研究
      用EPANET確定供水管網(wǎng)的最不利配水點(diǎn)
      在新興異構(gòu)SoCs上集成多種系統(tǒng)
      汉川市| 饶河县| 灵寿县| 永清县| 富阳市| 永福县| 遵义市| 安国市| 东宁县| 神农架林区| 东城区| 攀枝花市| 平果县| 榆林市| 内江市| 苏尼特右旗| 巧家县| 比如县| 汶川县| 同仁县| 景宁| 辉县市| 宁国市| 温宿县| 焦作市| 建德市| 什邡市| 清流县| 鄂州市| 安吉县| 罗山县| 洪雅县| 冀州市| 镇江市| 通河县| 临安市| 伊宁县| 承德县| 安丘市| 九龙坡区| 荣昌县|