網(wǎng)絡出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20150302.1106.004.html
模式匹配不確定性的多因素集結度量
胡文彬,潘祝山,紀兆輝
(淮海工學院 計算機工程學院,江蘇 連云港 222005)
摘要:為了能夠有效度量模式匹配的不確定性,提出了一個模式匹配不確定性的度量模型,根據(jù)不確定性因素間的關系提出了一個集結算子。使用全知熵度量語義匹配和屬性匹配的不確定性,引入過程不確定性的度量方法度量匹配決策過程的不確定性。使用多因素集結算子判斷各因素的影響程度,并可合成各度量結果。實驗證明,所提模型和方法能夠有效度量模式匹配的不確定性,且具有高效性和可擴展性。
關鍵詞:模式定義;模式分析;模式匹配;不確定性分析;數(shù)據(jù)不確定性度量;度量方法;決策分析;熵;集結評估方法
DOI:10.3969/j.issn.1673-4785.201405061
中圖分類號:TP18;TP391文獻標志碼:A
收稿日期:2014-06-06.網(wǎng)絡出版日期:2015-03-02.
基金項目:國家自然科學基金資助項目(60903027);江蘇省自然科學重大研究項目資助項目(BK2011023);江蘇省自然科學基金資助項目(BK2011370).
作者簡介:
中文引用格式:胡文彬,潘祝山,紀兆輝. 模式匹配不確定性的多因素集結度量[J]. 智能系統(tǒng)學報, 2015, 10(2): 286-292.
英文引用格式:HU Wenbin, PAN Zhushan, JI Zhaohui. Uncertain measure for schema matching based on the aggregation of uncertain factors[J]. CAAI Transactions on Intelligent Systems, 2015, 10(2): 286-292.
Uncertain measure for schema matching
based on the aggregation of uncertain factors
HU Wenbin, PAN Zhushan, JI Zhaohui
(School of Computer Engineering, Huaihai Institute of Technology, Lianyungang 222005, China)
Abstract:To measure efficiently uncertainty of schema matching, a measure model based on all uncertain factors was proposed and an aggregation operator was given according to the relations of uncertain factors. A measure method of semantic matching and attribute matching based on all known entropy uncertain ratio was designed. A measure algorithm of process uncertainty was introduced to measure uncertainty of a decision making process. The aggregation operator based on relationships between uncertain factors was proposed to determine influence degree of uncertain factors and merge all measure values in the measure process. The real world examples illustrate that the proposed model and methods can completely reflect three factors of uncertainty and can measure efficiently uncertainty for schema matching. The proposed methods are efficient and scalable.
Keywords:schema definition; schema analysis; schema matching;uncertainty analysis; measured data uncertainty; measurement method; decision analysis; entropy; aggregation estimation method
通信作者:胡文彬. E-mail:hwb1008@163.com.
模式匹配是許多領域的關鍵操作,是模式對象間的映射或相應關系的識別[1]。由于模式對象間的語義不能完全來源于數(shù)據(jù)和元數(shù)據(jù)信息,因此模式匹配中存在固有的不確定性,而且其不確定性會影響模式集成的整個過程[2],被認為是開展大規(guī)模數(shù)據(jù)集成的一個關鍵瓶頸,不確定性管理是未來的挑戰(zhàn)之一[3]。通常,自動或是半自動模式匹配的方法都是耗時和難于實施的,尤其是進行大規(guī)模模式匹配就更困難了,但若能在具體模式匹配實施前,對整個過程進行不確定性度量,將會為模式匹配在語義Web、模式集成、無線網(wǎng)絡和電子商務等諸多領域中的高效應用提供決策參考。
模式匹配實質上是一多屬性決策過程[4],其過程中需要考慮一定的不確定性。對模式匹配不確定性的度量研究目前比較少,相關領域主要針對科學數(shù)據(jù)庫和確定數(shù)據(jù)庫進行基于確定語義的匹配操作,主要目的是盡量提高映射結果的正確率。不確定模式匹配的相關研究中,基于不確定語義映射的模式集成[2]、基于相似度計算的方法[5]、基于概率映射的模式匹配方法[6]、基于by-table和by-tuple的數(shù)據(jù)集成方法[7]和Top-K方法[8]等均是在匹配結果上盡量提高輸出正確率,而拋棄掉一些不確定性信息和結果,因此會丟失一些對用戶有用的信息,并且這些研究工作中均未對整個匹配的不確定性進行度量,未考慮匹配過程中不確定性因素對結果的綜合影響。由B.Liu在2007年提出的不確定性度量適用于不精確數(shù)量數(shù)據(jù)的度量[9-10]。與本文相近的工作有AMUR算法和粗糙集(rough set, RS)的不確定性度量,AMUR算法處理的對象是RFID數(shù)據(jù)[11]。RS理論是由波蘭科學家Pawlak[12]在1982年提出的一種有效處理不確定性的工具,對RS不確定性度量的研究是近年來的研究熱點,在經(jīng)典RS理論中,產(chǎn)生不確定性的原因有集合的粗糙性和知識(概念)的不確定性[13]?;谛畔㈧氐亩攘糠椒╗14]能夠反映出產(chǎn)生不確定性的2個因素,但不能夠全面地反映出知識不確定性,該方法被應用在粗糙集的異常值發(fā)覺中;基于不確定熵的度量方法[13]綜合了粗糙熵、精確度和包含度3種基本方法,能夠反映出粗糙性和知識的不確定性;基于知識粒度的不確定性度量方法[15]適于解決集合的粗糙性;定位服務的不確定性度量方法[16]運用粗糙集和證據(jù)理論進行不確定性度量。這些方法的實際應用范圍有限,容易受系統(tǒng)規(guī)模的影響,且未詳細討論不確定性因素對度量結果的影響程度。
本文針對不確定性模式匹配的處理過程[17],提出了一個多因素集結的模式匹配不確定性度量模型,根據(jù)語義匹配和屬性匹配不確定性因素的特點,運用全知熵度量其中的不確定性,并引入過程不確定性度量方法對匹配決策的不確定性進行了度量。根據(jù)不確定性因素間的相互關系,給出了一個集結算子,用于判斷各不確定性因素的影響程度和合成度量結果以生成總不確定率。所提出的模型和方法能夠有效度量模式匹配的不確定性,能夠綜合各不確定性因素產(chǎn)生的影響,能夠處理大規(guī)模模式匹配的不確定性度量,為復雜系統(tǒng)的不確定性度量奠定了基礎。
1模式匹配中的不確定性
根據(jù)不確定性模式匹配的處理過程,模式匹配(schema matching,SM)的不確定性主要出現(xiàn)在語義匹配、屬性匹配和匹配決策過程中,存在于其中的不確定性表現(xiàn)[17],可歸結為語義因素、屬性因素和過程決策因素,這3個不確定性因素具有源發(fā)性和主導性。
定義1不確定語義匹配。2個模式S1和S2的不確定語義匹配是一個三元組〈S,O,UM〉,其中S是模式有限集,S1,S2∈S,O∈Si是模式對象有限集,UM = {〈r11,m11〉, 〈r12,m12〉, …, 〈r1k,m1k〉, 〈r21,m21〉, …, 〈rnk,mnk〉}是模式對象間的不確定匹配關系集,rij∈R,i=1,2,…,n,j=1,2,…,k,n=|S1|和k=|S2|為所包含模式對象的個數(shù),R={相等,包含,相交,超集,不相交,不相容}是6種相互排斥的語義關系集,mij為rij的不確定率。
定義2不確定屬性匹配。2個模式對象的不確定屬性匹配是一個三元組〈A,T,UD〉,其中A是屬性集,T={ANM,ATM,KRM,DIM}是匹配類型集,ANM是屬性名匹配,ATM是屬性數(shù)據(jù)類型匹配,KRM是關鍵字約束匹配,DIM是數(shù)據(jù)實例匹配,UD={〈A1, UD1〉,〈A2, UD2〉, 〈A3, UD3〉,〈A4, UD4〉}是各類屬性匹配的不確定率集,Ai∈A。
定義3不確定決策過程。不確定決策過程UDP是一個四元組〈T,ST,P,f〉,其中T是任務集,ST是狀態(tài)集,P是不確定度集,f:T×ST→P是一個決策函數(shù)。
定義4模式匹配的不確定性度量。模式匹配的不確定性度量是滿足系統(tǒng)不確定性度量[18]中4個條件的不確定性度量。
2模式匹配的不確定性度量
2.1不確定性度量模型
模式集成中的模式匹配不確定性度量模型由模式對象清洗(schema object cleanout,SOC)、語義匹配不確定性度量(uncertainty measure of semantic matching,UMSM)、屬性匹配不確定性度量(uncertainty measure of attribute matching,UMAM)、決策過程不確定性度量(uncertainty measure of process,UMP)和不確定性度量合成器(uncertainty measure synthesizer,UMS)5個模塊組成。模式匹配不確定性度量模型的框架如圖1所示。
圖1 模式匹配不確定性的度量模型 Fig.1 Uncertainty measure model for schema matching
待匹配模式集作為輸入,由SOC清洗掉確定模式對象,不確定部分(uncertainty set,US)由UMSM和UMAM進行語義匹配和屬性匹配不確定性的度量,再由PUM對整個決策過程的不確定性進行度量,最后由UMS合成各度量結果而得到總不確定率。
2.2模式對象清洗
模式匹配的復雜度會隨數(shù)據(jù)集成規(guī)模的增大而增大,對輸入模式進行預處理至關重要。在SOC中使用屬性約減方法[19]對輸入模式所包含的模式對象進行等價類劃分(equipollence partition,EP)后,再進行正域約減(positive region deduction,PRD)和模式對象約簡(schema object deduction,SOD),得到可能存在不確定性的部分——模式對象約簡集。模式匹配不確定性的度量規(guī)模經(jīng)過SOC的處理后明顯縮小。
2.3基于全知熵的不確定性度量
粗糙性是指由于知識的不完備性或不精確性,導致對象與對象之間不可分辨,從而使得對象與概念之間的關系具有不確定性[12]。信息熵是信息理論中用于分析不確定程度的一種重要度量,以所需信息量的多少來衡量不確定性的程度[20]?;谛畔㈧氐亩攘糠绞街腥夭淮_定率對系統(tǒng)的不確定性比較敏感,能夠較為準確地反映不確定性的變化規(guī)律[21]。模式匹配的執(zhí)行過程能夠表達其系統(tǒng)內(nèi)的條件屬性知識和決策屬性知識,模式匹配的不確定性結構和程度可由屬性知識完全確定,因此基于全知熵的度量方式適于度量模式匹配的不確定性。
2.3.1模式匹配的全知熵不確定率
定義5 模式匹配的全知熵不確定率。四元組DS= (O, MA,V,f)為模式匹配決策系統(tǒng),其中,O為模式對象有限集;MA=C∪D是匹配屬性的集合,C為不確定匹配關系集,D為決策屬性集,C∩D=φ,a∈C∪D;V=∪Va是屬性的值域,f:O×MA→V是一個信息函數(shù)。模式匹配的全知熵不確定率定義為
式中:Hall(C→D)=H(C)+H(D|C)為全知熵[21],H(C) 為C在U上的信息熵,且H(C)=-∑1≤i≤np(Xi)log(p(Xi))(O/IND(C)={X1,X2,…,Xn},n=|O/IND(C)|),H(D|C) 為條件熵,且H(D|C)=-∑1≤i≤np(Xi)∑1≤j≤mp(Yj|Xi)log(p(Yj|Xi))(O/IND(D)={Y1,Y2,…,Ym},m=|O/IND(D)|),H(D)為D在U上的信息熵。
可將模式匹配看做一個決策系統(tǒng),C的元素為定義1中R所包含的元素,D={0(不是),1(是),2(不確定)}。所定義的不確定率滿足粗糙集不確定性度量的基本準則。
定理 模式匹配的全知熵不確定率滿足粗糙集不確定性度量的基本準則。
證明全知熵不確定率μall= 1- (Hall(C→D) -H(D)) / (log(|O|) -H(D))= 1-(H(C)+H(D|C)-H(D)) / (log(|O|) -H(D))。R1和R2是U上的2個等價關系。
1)0≤(H(C)+H(D|C)-H(D)) / (log(|O|) -H(D))≤1,因此0≤μall≤1非負;
2)若R1≈R2,則H(C1)=H(C2),H(D1)=H(D2),所以μall滿足不變性;
3)若R1﹤R2,則根據(jù)文獻[22]的定理7有H(C1) 綜上所述,模式匹配的全知熵不確定率滿足粗糙集不確定性度量的基本準則[23]。 2.3.2語義匹配的不確定性度量 語義匹配是用于確定各模式及其模式對象間匹配程度的過程之一,由于模式對象的語義不能完全來源于數(shù)據(jù)和元數(shù)據(jù)信息,并且識別確定的語義映射是非常困難的,因此語義匹配中產(chǎn)生的不確定性是模式匹配中存在不確定性的主因之一[24]。語義匹配是一決策過程,語義匹配的不確定率如下: 式中:C1是語義匹配條件屬性集,D1是語義匹配決策屬性集,O1∈O是模式對象集。 2.3.3屬性匹配的不確定性度量 屬性匹配不確定性的度量由UMAM來完成,實現(xiàn)屬性名匹配(ANM)、數(shù)據(jù)類型匹配(ATM)、關鍵字約束匹配(KRM)和數(shù)據(jù)實例匹配(DIM)的不確定性度量,計算出屬性匹配的總不確定率。屬性匹配過程同樣是一決策過程,其中的條件屬性集合均為{相等,包含,相交,超集,不相交}。 根據(jù)定義5屬性匹配的不確定率如下: 2.4匹配決策過程的不確定性度量 模式匹配是根據(jù)運行時管理者的決策或過程數(shù)據(jù)有條件執(zhí)行的,因而其過程中存在不確定性是毫無疑問的[25]。用Petrinets表示模式匹配的決策過程(decision process,DP),如圖2。 圖2 模式匹配的過程模型 Fig.2 Process model of schema matching ti為任務塊,B1為SOC的執(zhí)行過程,B2為語義匹配和屬性匹配的順序執(zhí)行過程,B3為屬性匹配的執(zhí)行過程,B4為匹配結果合并過程。圖2可轉換為圖3形式。 圖3 轉換后的過程模型 Fig.3 Converted process model 決策過程不確定性的計算通式如下: 決策過程不確定率μ3的計算公式如下: 式中:Ti是任務Bi被執(zhí)行的次數(shù)。由于B1和B4為必須執(zhí)行的過程,因此可令K(B1)=0,K(B4)=0。 3不確定性因素的集結度量 3.1不確定性因素影響程度的判斷 影響模式匹配的不確定因素之間往往不是孤立的,它們之間可能存在著某些關系,這將影響不確定性的準確度量,各因素及其權重的簡單線性組合也從一定程度上忽略了這些因素之間存在的相互關系[26]。 定義6 不確定性的集結度量。U(SM)=f(S(SM),A(SM),P(SM)) 稱為模式匹配SM不確定性的集結度量,U(SM) ∈[0,1],U(SM)越大SM的不確定性就越大,其中f稱為以S(SM)、A(SM)和P(SM)為自變量的不確定性度量函數(shù),f:[0,1]×[0,1]×[0,1] →[0,1]。 基于f對SM不確定性的度量將所有不確定性因素映射到一個[0,1]上,反映了模式匹配的不確定性。 模式匹配中任何不確定因素的細微變化都將影響到整個過程。綜合語義匹配、屬性匹配和決策過程這3個方面的不確定因素以進行模式匹配不確定性的客觀度量,而不是各因素的簡單線性組合,需要考慮這3個因素的內(nèi)在關系。為了討論單個因素對不確定性的影響以及多個因素集結起來對不確定性的影響,下面給出相關定義。 定義7分別對因素S(SM),A(SM)和P(SM)作如下變換: S′(SM)=2S(SM)-1 A′(SM)=2A(SM)-1 P′(SM)=2P(SM)-1 令因素e∈{S(SM),A(SM),P(SM)},相應地,z∈{S′(SM),A′(SM),P′(SM)}稱為因素e對SM不確定性的影響,z∈[-1,1]。若z≥0,則稱e為積極因素;若z=0,則稱e為不變因素;若z<0,則稱e為消極因素。 定義8 若給定z1,z2∈{S′(SM),A′(SM),P′(SM)},z1≠z2,集結算子定義如下: 若已存在一個不確定因素e1,再給定一個不確定因素e2,它們的影響分別為z1和z2,則2個因素c之間的內(nèi)在相互關系有如下特性: 1)增長性,若e2是一個積極因素,即z2>0。e1和e2對SM不確定性的集結影響z應該滿足z>z1;若e1也是一個積極因素,則z>z2也同樣成立。 2)不變性,若e2是一個不變因素,即z2=0。e1和e2對SM不確定性的集結影響z應該滿足z=z1,即SM的不確定性受e1的影響大;若e1也是一個不變因素,則SM的不確定性不受加入因素的影響。 3)減弱性,若e2是一個消極因素,即z2<0。e1和e2對SM不確定性的集結影響z應該滿足z 4)有界性,z1?z2∈[-1,1],以確保多個因素的集結影響可以通過兩兩集結來實現(xiàn)。 5)交換率,z1?z2=z2?z1,這可以保證2個給定不確定性因素對SM不確定性的影響保持不變。 6)結合率, (z1?z2)?z3=z1?(z2?z3),這表明2個以上因素的集結影響與各因素參與計算的次序無關。 3.2總不確定率 模式匹配的總不確定率主要由3部分來確定,分別是語義匹配的不確定率S(M)、屬性匹配的不確定率A(M)和決策過程的不確定率P(M)。由于z1?z2?z3∈[-1,1],而模式匹配不確定性度量函數(shù)的值域為[0,1],因此模式匹配不確定性的度量函數(shù)(即,總不確定率)定義為 式中:z1,z2,z3∈{S′(M),A′(M),P′(M)},S(M)=μ1,A(M)=μ2,P(M)=μ3。 4實驗與分析 4.1實驗 設計2種實驗方案:1)較小不確定性的度量。對2個模式S1(在校生)和S2(畢業(yè)生)間的匹配進行不確定性度量,所包含模式對象的詳細信息分別如圖4、5所示;2)多模式對象匹配不確定性的度量。對5個模式間的匹配進行不確定性度量,共包含57個模式對象,實驗數(shù)據(jù)情況見表1。實驗參數(shù)見表2。屬性匹配包括屬性名匹配(ANM)、屬性類型匹配(ATM)、關鍵字匹配(KRM)和數(shù)據(jù)實例匹配(DIM)4個過程,每個過程中條件屬性個數(shù)|C|=6,條件屬性值域VC={0,1,2},每個過程中的模式個數(shù)和模式對象個數(shù)見表3。模式匹配的不確定率見表4。 圖4 存儲在校生數(shù)據(jù)的模式截圖 Fig.4 Schema data of undergraduate 圖5 存儲畢業(yè)生數(shù)據(jù)的模式截圖 Fig.5 Schema data of graduate 序號年份對象個數(shù)12005sp1722006au1732007au742008sp952009sp7 注:表中數(shù)據(jù)為2005年春至2009年春江蘇省VFP二級考試的數(shù)據(jù)情況 表2語義匹配不確定性度量的實驗參數(shù) Table 2Experiment parameters of uncertainty measurement for semantic matching No.模式個數(shù)|S|模式對象個數(shù)|U|條件屬性|C1|VC1決策屬性|D1|VD11226{0,1,2}10,1,2}25526{0,1,2}1{0,1,2} 注:{0,1,2}中,0—是,1—不是,2—不確定 表3屬性匹配不確定性度量的實驗參數(shù) Table 3Experiment parameters of uncertainty measurement for attribute matching 匹配類型方案1|S||U|方案2|S||U|ANM2125301ATM2165301KRM2255DIM230053501 表42種方案下的模式匹配的不確定率 Table 4Uncertainty ratio of schema matching from two projects 第1種方案第2種方案USMμ1=0μ1=0.34UAMμ2=0.21μ2=0.95DPμ3=0.17μ3=0.17總計μwhole=0.19μwhole=0.72 4.2分析 第1種方案中,首先通過SOC處理后,匹配規(guī)模比[2]中降低50%。2個模式的模式對象名語義相同,因此μ1=0。屬性匹配中只有屬性名匹配具有不確定性。決策過程中的不確定率隨模式匹配規(guī)模的減小而降低,利用公式計算得到的μwhole值符合實際情況。第2種方案中,模式對象規(guī)模和屬性匹配的規(guī)模突然增大,通過SOC的處理后,匹配規(guī)模降低了近1/10,同時計算效率也明顯提高,不確定率隨匹配規(guī)模增大而增大符合不確定性度量的基本準則。實驗表明度量模式匹配不確定性的模型和不確定率計算方法具有可行性、有效性、可擴展性和高效性。 5結束語 模式匹配的不確定性研究是國際上相關領域近年來才興起的熱點研究方向,度量原始匹配的不確定性是關鍵問題。本文根據(jù)模式匹配中產(chǎn)生不確定性的主要因素,首次將全知熵不確定率和過程不確定率結合起來,并證明模式匹配的全知熵不確定率滿足粗糙集不確定性度量的基本準則,提出了一個多因素集結的模式匹配不確定性度量模型,利用集結算子判斷各不確定性因素對模式匹配不確定性的影響程度和合成各階段的度量結果,實驗證明本文提出的方法與已有方法相比可獲得更加合理的度量結果。所提模型解決了不確定性度量中規(guī)模限制問題,使得大規(guī)模模式匹配不確定性的處理復雜度降低。下一步的工作將探討動態(tài)環(huán)境下模式匹配不確定性的度量方法及其處理過程中不確定性傳播的測算方法。 參考文獻: [1]SHVAIKO P, EUZENAT J. A survey of schema-based matching approaches[J]. Journal on Data Semantics IV, 2005(3730): 146-171. [2]MAGNANI M, RIZOPOULOS N, BRIEN P, et al. Schema integration based on uncertain semantic mappings[J]. Lecture Notes in Computer Science, 2005(3716): 31-46. [3]HALEVY A, RAJARAMAN A, ORDILLE J. Data integration:the teenage years[Z]. Seoul, 2006: 9-16. [4]翁年鳳,刁興春,曹建軍,等. 不確定模式匹配研究綜述[J]. 計算機科學, 2011, 38(12): 1-5. WENG Nianfeng, DIAO Xingchun, CHAO Jianjun, et al. Survey of uncertain schema matching[J]. Computer Science, 2011, 38(12): 1-5. [5]姜芳艽,孟小峰,賈琳琳. Deep Web 集成服務的不確定模式匹配[J]. 計算機學報, 2008, 31(8): 1412-1421. JIANG Fangjiao, MENG Xiaofeng, JIA Linlin. Uncertain schema matching in deep web integration service[J]. Chinese Journal of Computers, 2008, 31(8): 1412-1421. [6]MAGNANI M, MONTESI D. Probabilistic data integration[R]. Bologna(italy): UBLCS, 2009. [7]DONG X L, HALEVY A, YU CONG. Data integration with uncertainty[J]. The VLDB Journal, 2009, 18: 469-500. [8]AVIGDOR G. Managing uncertainty in schema matching with top-k schema mappings[J]. Journal on Data Semantics, 2006, 6: 90-114. [9]LIU Baoding. Uncertainty theory[M]. Berlin: Springer-Verlag, 2007: 3-12. [10]LIU Baoding. Some research problems in uncertainty theory[J]. Journal of Uncertain Systems, 2009, 3(1): 3-10. [11]王永利,錢江波,孫淑榮. AMUR:一種RFID數(shù)據(jù)不確定性的自適應度量算法[J]. 電子學報, 2011, 39(3): 579-584. WANG Yongli, QIAN Jiangbo, SUN Shurong. AMUR: an adaptive measuring algorithm of underlying uncertainty for rfid data[J]. Chinese of Journal Electronics, 2011, 39(3): 579-584. [12]PAWLAL Z. Rough sets[J]. International Journal of Computer and Information Science, 1982, 11(5): 341-356. [13]QIU Taorong, YOU Min, GE Hanjuan, et al. A method of uncertainty measure based on rough set[Z]. 2008: 544-547. [14]JIANG Feng, SUI Yuefei, CAO Cungen. An information entropy-based approach to outlier detection in rough sets[J]. Expert Systems with Applications, 2010, 37(9): 6338-6344. [15]LIANG Jiye, WANG Junhong, QIAN Yuhua. A new measure of uncertainty based on knowledge granulation for rough sets[J]. Information Sciences, 2009, 179(4): 458-470. [16]IFTIKHAR-U S, ARYYA G. Managing uncertainty in location services using rough set and evidence theory[J]. Expert System with Application, 2007, 32(2): 386-396. [17]胡文彬,李千目,張宏. 基于領域知識的不確定性關系模式集成[J]. 南京理工大學學報:自然科學版, 2010, 34(4): 409-414. HU Wenbin, LI Qianmu, ZHANG Hong. Uncertain relation schema integration based on domain knowledge[J]. Journal of Nanjing University of Science and Technology: Natural Science, 2010, 34(4): 409-414. [18]胡文彬,張宏,李千目. 基于全知熵的模式集成不確定性度量模型[J]. 南京航空航天大學學報, 2012, 44(4): 575-579. HU Wenbin, ZHANG Hong, LI Qianmu. Uncertainty measure model of schema integration based on all known entropy[J]. Journal of Nanjing University of Aeronautics & Astronautics, 2012, 44(4): 575-579. [19]WANG J G, MENG G Y, ZHENG X L. The attribute reduce based on rough sets and sat algorithm[Z]. 2008: 98-102. [20]LIANG Jiye, QIAN Yuhua. Information granules and entropy theory in information systems[J]. Science in China Series F: Information Sciences, 2008, 51(10): 1427-1444. [21]趙軍,周應華. 基于粗集理論的系統(tǒng)不確定性度量方式研究[J]. 小型微型計算機系統(tǒng), 2010, 31(2): 354-359. ZHAO Jun, ZHOU Yinghua. Study on system uncertainty measures based on rough set theory[J]. Journalof Chinese Computer Systems, 2010, 31(2): 354-359. [22]YU Daren, HU Qinghua, WU Congxin. Uncertainty measures for fuzzy relations and their applications[J]. Applied Soft Computing, 2007, 7(3): 1135-1143. [23]胡軍,王國胤. 粗糙集的不確定性度量準則[J]. 模式識別與人工智能, 2010, 23(5): 606-615. HU Jun, WANG Guoyin. Uncertainty measure rule sets of rough sets[J]. Pattern Recognition and Artificial Intelligence. 2010, 23(5): 606-615. [24]MAGNANI M, MONTESI D. Uncertainty in data integration:current approaches and open problems[M]. Enschede, The Netherlands: the Centre for Telematics and Information Technology, 2007: 26-32. [25]JUNG J Y, CHIN C H, CARDOSO J. An entropy-based uncertainty measure of process models[J]. Information Processing Letters, 2011, 111(3): 135-141. [26]岳昆,劉惟一,王曉玲. 一種基于不確定性因素疊加的Web服務質量度量方法[J]. 計算機研究與發(fā)展, 2009, 46(5): 841-849. YUE Kun, LIU Weiyi, WANG Xiaoling. An approach for measuring quality of web services based on the superposition of uncertain factors[J].Journal of Computer Research and Development, 2009, 46(5): 841-849. 胡文彬,女,1976年生,博士,中國計算機學會會員,主要研究方向為數(shù)據(jù)集成、社會網(wǎng)絡、隱私保護,作為主要成員完成省級課題1項,參與完成市級課題2項。發(fā)表學術論文10余篇,其中被EI檢索3篇。 潘祝山,男,1968年生,副教授,主要研究方向為人工智能、確定性理論。參與省市級課題多項。 紀兆輝,男,1971年生,副教授,中國計算機學會高級會員,主要研究方向為數(shù)據(jù)挖掘、語義Web、多Agent等。發(fā)表學術論文20余篇,主持、參與省市級科研課題10余項。