涂俊翔,朱曉林
(1.福州大學(xué) 機(jī)械工程及自動化學(xué)院,福建 福州 350108;2.福建省制造業(yè)數(shù)字化設(shè)計工程研究中心,福建 福州 350002)
隨著經(jīng)濟(jì)全球化和網(wǎng)絡(luò)技術(shù)的發(fā)展,企業(yè)協(xié)同制造的需求在迅速提高.越來越多的協(xié)作企業(yè)依賴于產(chǎn)品生命周期管理(Product Lifecycle Management,PLM)系統(tǒng)為產(chǎn)品設(shè)計和制造建立1個并行化的協(xié)同環(huán)境.然而,由于各企業(yè)文化背景不同、產(chǎn)品及零件的命名體系或標(biāo)準(zhǔn)的多樣化,不同PLM系統(tǒng)對特定產(chǎn)品和零部件對象、對象屬性及對象間關(guān)聯(lián)關(guān)系的描述存在著許多差異,極大地限制了協(xié)同企業(yè)產(chǎn)品信息的檢索與共享.
由于在不同的PLM系統(tǒng)中存在著大量語義不一致信息,如果采用人工檢索的方法,檢索的工作量極大且效率低.在信息的自動檢索和匹配方面,國內(nèi)外學(xué)者已經(jīng)做了不少工作,提出了很多方法[1,2].這些方法大致可以概括為基于名稱匹配的方法[3]和基于規(guī)則的結(jié)構(gòu)匹配方法[4].基于名稱匹配的方法簡單易行,在產(chǎn)品成系列化和標(biāo)準(zhǔn)化的企業(yè)中能得到很好的運(yùn)用.但由于這種方法難以辨識異名或語義相近的數(shù)據(jù)對象,如圖1的產(chǎn)品數(shù)據(jù)描述中,“名稱”與“品名”屬性,“廠家”與“廠商”屬性就屬于異名同義;“工業(yè)鍋爐”與“工業(yè)鍋爐和生活鍋爐”構(gòu)成泛化關(guān)系等,因此基于名稱匹配的方法在實(shí)際運(yùn)用中受到了很大限制.如采用基于規(guī)則的結(jié)構(gòu)匹配方法,則更有針對性并能取得較好的精度,但它需要人工定義大量的語義轉(zhuǎn)換規(guī)則,算法復(fù)雜且擴(kuò)展性不強(qiáng),在實(shí)際PLM系統(tǒng)中難以運(yùn)用.
Bayes網(wǎng)是人工智能領(lǐng)域用于處理不確定性問題的重要方法[5],本文將其與本體理論結(jié)合,提出了1種擴(kuò)展的Bayes網(wǎng)檢索模型.該模型無需構(gòu)建復(fù)雜的語法規(guī)則,能在整體結(jié)構(gòu)上對PLM數(shù)據(jù)對象進(jìn)行模糊匹配,方便實(shí)現(xiàn)自動化檢索和大大減少領(lǐng)域?qū)<业膮⑴c量.
圖1 產(chǎn)品數(shù)據(jù)描述中的概念差異Fig.1 Different expressions in product description
為便于對協(xié)同企業(yè)PLM數(shù)據(jù)對象進(jìn)行檢索和匹配,可預(yù)先將PLM系統(tǒng)中對象進(jìn)行概念化抽象,并對概念、子概念、屬性以及關(guān)系等進(jìn)行規(guī)范化處理.這個預(yù)處理過程即是PLM數(shù)據(jù)對象的本體化過程.按照Gruber[6]的定義,本體是1個領(lǐng)域或主題范圍的概念化,可表示為如下的四元組形式O∶=(C,R,I,A),O為要定義的本體;C為本體中的概念集合;R為概念間的關(guān)系;I為實(shí)例集合;A為公理斷言.依據(jù)PLM數(shù)據(jù)對象檢索和信息共享的特點(diǎn),可認(rèn)為PLM本體元素主要包括對象名稱、屬性和關(guān)聯(lián)關(guān)系等.對目標(biāo)PLM本體的檢索則可看成是由本地PLM本體到協(xié)同企業(yè)目標(biāo)本體的映射,因此有如下的形式化定義:
定義 設(shè)o1為PLM本地本體,o2為PLM目標(biāo)本體.Fm為本體o1到本體o2的映射函數(shù),它可表示為
式中:{e1},{a1},{r1}分別為o1中對象名稱、對象屬性和關(guān)系的集合;{e2},{a2},{r2}分別為o2中對象名稱、對象屬性和關(guān)系的集合.
產(chǎn)品信息的檢索和共享過程包括PLM本體導(dǎo)入、對象檢索和匹配、匹配關(guān)系確認(rèn)和PLM數(shù)據(jù)對象整合等4個步驟,如圖2所示.
PLM本體的導(dǎo)入是將抽象出來的概念按照主題、維度、類別等層次進(jìn)行組織,這將方便以后對產(chǎn)品信息進(jìn)行快速的檢索.這里的主題是指從宏觀的某個特定方面對PLM數(shù)據(jù)對象進(jìn)行描述,如制造企業(yè)中物料、產(chǎn)品、文檔、人員、組織、設(shè)備等主題;維度則是對特定主題進(jìn)行描述和分類的角度,例如,企業(yè)產(chǎn)品管理中零部件主題可以按形狀特征維度,也可按制造特征等維度對零部件對象進(jìn)行描述;類別是按照特定對象的共同特性劃分的事物集合,例如,零件可劃分為軸類 、箱體類 、齒輪類等類別.另外,對象元素具有屬性,并通過屬性建立關(guān)聯(lián)關(guān)系.
對象檢索和匹配是通過建立的Bayes網(wǎng)檢索模型,按相應(yīng)算法對抽象出來的目標(biāo)PLM本體元素進(jìn)行檢索,自動地發(fā)現(xiàn)與本地PLM本體元素相匹配或相似的目標(biāo)對象,在計算它們的匹配程度之后返回大于閾值的目標(biāo)對象.
確定匹配關(guān)系是在檢索到的目標(biāo)對象中,按照領(lǐng)域約束條件和專家意見最終確定與本地PLM本體元素相匹配的目標(biāo)元素,并標(biāo)識它們的匹配關(guān)系如泛化關(guān)系、等同關(guān)系等.
PLM數(shù)據(jù)對象整合是根據(jù)已確定的匹配關(guān)系在本地PLM系統(tǒng)中集成協(xié)同企業(yè)相關(guān)的PLM數(shù)據(jù)對象,實(shí)現(xiàn)產(chǎn)品信息共享.
圖2 產(chǎn)品信息的檢索與共享Fig.2 Retrieval and sharing of product information
Bayes網(wǎng)是1種由節(jié)點(diǎn)、有向弧組成的有向無環(huán)圖 (Directed Acyclic Graph),它能夠以圖形化的形式明確地表達(dá)一定領(lǐng)域?qū)ο蟮南嚓P(guān)性.這些關(guān)聯(lián)對象的相關(guān)程度通過聯(lián)合概率的形式進(jìn)行描述,它量化了各對象間的相互依賴關(guān)系.圖3是1個典型的Bayes網(wǎng)絡(luò)圖,其中節(jié)點(diǎn)Xn表示了隨機(jī)變量,節(jié)點(diǎn)間的有向邊表示變量之間的因果關(guān)系,節(jié)點(diǎn)間如果沒有邊相連則表示變量是條件獨(dú)立的.對于Bayes網(wǎng)中任意節(jié)點(diǎn)xi,假設(shè)其直接雙親節(jié)點(diǎn)集為Pai,xi,的條件概率為P(xi|Pai).對于頂點(diǎn)集合X=(x1,x2,…,xn)的聯(lián)合概率分布則由下式計算:
圖3 Bayes網(wǎng)Fig.3 Bayesian network
Ribeiro-Neto和Muntz提出了經(jīng)典的Bayes網(wǎng)信息檢索模型[7],它通過構(gòu)建由關(guān)鍵詞組成的中間節(jié)點(diǎn)層將用戶查詢與相關(guān)文檔進(jìn)行模糊匹配.將上述思想與本體技術(shù)結(jié)合,本文構(gòu)造出圖4所示的擴(kuò)展Bayes網(wǎng)模型.模型分為3層:本地PLM本體層,根節(jié)點(diǎn)層和協(xié)同企業(yè)目標(biāo)PLM本體層.圖中has-a為概念與屬性的關(guān)系,由本地PLM本體元素構(gòu)成,即os({es},{as},{rs}),這里{es}{as},{rs})分別為本地PLM本體中對象名稱、對象屬性和關(guān)聯(lián)關(guān)系的集合.
根節(jié)點(diǎn)層由描述PLM數(shù)據(jù)對象名稱及其屬性的基本術(shù)語組成,這些術(shù)語構(gòu)成基本詞匯庫.詞匯庫中的這些術(shù)語與制造企業(yè)的具體領(lǐng)域相關(guān),并可根據(jù)實(shí)際情況進(jìn)行相應(yīng)擴(kuò)展.術(shù)語根節(jié)點(diǎn)ui∈u?U={c1,…,cr,…,cm,d1,…,di,…,dn}(1≤i≤m+n)其中cr為對象名稱術(shù)語,di為屬性術(shù)語,u為U集合中元素所構(gòu)成的任意可能子集.基本詞匯庫不但包括了對領(lǐng)域?qū)ο蠹皩傩悦枋龅臉?biāo)準(zhǔn)術(shù)語,而且包括在語義上與標(biāo)準(zhǔn)術(shù)語等價或相近的常用術(shù)語,從而能夠擴(kuò)大查詢范圍和有效地提高檢索精度.對象間關(guān)聯(lián)關(guān)系則由根節(jié)點(diǎn)間的語義信息表達(dá),這些語義信息包括了對象元素與對象元素、對象元素與屬性的關(guān)系(見圖4中用虛線表達(dá)的關(guān)系),包括等同關(guān)系(equivalence)、泛化關(guān)系(generalize)、整體與部分關(guān)系(hasParts)、實(shí)例關(guān)系(instanceOf)、概念與屬性的關(guān)系(has-a)等.根節(jié)點(diǎn)通過語義信息相互關(guān)聯(lián),反映出概念的結(jié)構(gòu)化特征,從而方便不同的概念樹(這里指對象元素與對象元素、對象與屬性共同構(gòu)成的關(guān)聯(lián)結(jié)構(gòu))在整體結(jié)構(gòu)上進(jìn)行匹配,提高了檢索的準(zhǔn)確性.
目標(biāo)PLM本體層由特定查詢范圍內(nèi)的協(xié)同企業(yè)PLM本體元素組成,即Oj({ej},{aj},{rj})(j≥1),它們在構(gòu)造上與本地PLM本體層類似,不再贅述.
圖4 擴(kuò)展的Bayes網(wǎng)檢索模型Fig.4 Extended information retrieval model based on Bayesian network
目標(biāo)對象的檢索過程即是計算P(oj|os)概率值的過程.由Bayes模型可知,P(oj|os)的值反映了目標(biāo)PLM本體元素在對象名稱、對象屬性和關(guān)聯(lián)關(guān)系等方面與本地PLM本體元素的綜合匹配程度.P(oj|os)的值越大,表示oj與目標(biāo)本體元素近似程度越高,反之亦然.P(oj|os)值大于規(guī)定閾值的目標(biāo)對象將被視為符合要求的檢索目標(biāo).
由Bayes規(guī)則和全概率公式可知:
式中:α為歸一化常數(shù);條件概率P(oj|u),P(os|u)分別為給定的子集與本體元素oj|os的匹配程度,P(oj|u),P(os|u)值越大,則u與oj,os越匹配,反之亦然;P(u)為樣本空間U 的各任意可能子集u 的概率.在這里,可根據(jù)語義關(guān)聯(lián)信息確定可能子集u的數(shù)量t,并假設(shè)u等概率發(fā)生,則P(u)=1/t,t為整數(shù)且0<t≤2m+n.依據(jù)矢量空間模型計算P(oj|u)如下:
式中:wiu為術(shù)語ui在u中的權(quán)重,當(dāng)ui∈u時,可取wiu=1,否則wiu=0;wij為術(shù)語ui在oj中的權(quán)重,對權(quán)重wij的不同計算方法將得到不同的匹配策略.P(os|u)的確定方法與P(oj|u)的計算類似,不再贅述.
在具體實(shí)現(xiàn)上,本文基于上節(jié)所述模型及算法開發(fā)了MPDICP(Middleware for Product Data Interoperation in Collaborative,PLMs)中間件核心模塊,它遵循對象管理組織(Object Management Group,OMG)制定的產(chǎn)品數(shù)據(jù)管理軟件規(guī)范,能方便地與協(xié)同企業(yè)PLM系統(tǒng)集成.下面以1個實(shí)例進(jìn)一步說明本文所提方案的工作過程.
某鍋爐企業(yè)的產(chǎn)品結(jié)構(gòu)樹片段如圖5所示,鍋爐產(chǎn)品主要由鍋爐體和鍋爐機(jī)組構(gòu)成,其中核心的鍋爐體部分由爐膛、鍋筒、燃燒器、水冷壁過熱器、省煤器、空氣預(yù)熱器等部件組成.該企業(yè)自己生產(chǎn)鍋筒殼體.鍋筒內(nèi)部零件稱之為鍋筒內(nèi)件,由協(xié)作企業(yè)提供.
過程1:將PLM數(shù)據(jù)對象本體化.在對PLM產(chǎn)品結(jié)構(gòu)樹進(jìn)行本體化處理后,導(dǎo)入的鍋爐本體片段如圖6所示.
過程2:在基本詞匯庫的支持下,MPDICP模塊查詢協(xié)作企業(yè)PLM本體(見圖7),尋找與“鍋筒內(nèi)件”相匹配的外協(xié)產(chǎn)品信息.計算相對概率P(oj|os),并將P(oj|os)大于閾值的對象列為檢索目標(biāo).它們按概率值大小以降序排列分別為:“汽包附件”、“汽包”.依據(jù)領(lǐng)域知識可確定“鍋筒內(nèi)件”與“汽包附件”構(gòu)成“等同類”的匹配關(guān)系.
圖5 PLM鍋爐對象Fig.5 Boiler PLM object
圖6 鍋爐本體片段Fig.6 Boiler ontology
圖7 協(xié)作企業(yè)汽包附件本體Fig.7 Steam tank accessories ontology
過程3:根據(jù)確認(rèn)的匹配關(guān)系,調(diào)整本地PLM數(shù)據(jù)對象信息.圖8為調(diào)整后的PLM產(chǎn)品結(jié)構(gòu)樹,其中“鍋筒內(nèi)件”與“汽包附件”間建立了“等同類”語義匹配關(guān)系.
圖8 信息集成后的PLM產(chǎn)品結(jié)構(gòu)樹Fig.8 Integrated PLM product structure tree
本文針對協(xié)同企業(yè)PLM產(chǎn)品信息檢索中大量存在的語義差異問題,在PLM數(shù)據(jù)對象本體化的基礎(chǔ)上,建立了擴(kuò)展的Bayes網(wǎng)檢索模型.案例表明,它無需構(gòu)建復(fù)雜的語法規(guī)則,能在整體結(jié)構(gòu)上對數(shù)據(jù)對象的名稱、屬性和關(guān)聯(lián)關(guān)系進(jìn)行自動檢索和模糊匹配,為協(xié)同企業(yè)的產(chǎn)品信息集成與協(xié)作提供了1種準(zhǔn)確性較好且高效的實(shí)現(xiàn)方案.
[1]李衛(wèi)疆,趙鐵軍,王憲月.基于上下文的查詢擴(kuò)展[J].計算機(jī)研究與發(fā)展,2010,47(2):300-304.LI Weijiang,ZHAO Tiejun,WANG Xianyue.Context-sensitive query expansion[J].Journal of Computer Research and Development,2010,47(2):300-304.
[2]RAHM E,BERNSTEIN P A.A survey of approaches to automatic schema matching[J].The VLDB Journal,2001,10(4):334-350.
[3]CALADO P,RIBERIRO-NETO B,ZINIANI N,et al.Local versus global link information in the web[J].ACM Transactions on Information Systems,2003,21(1):42-63.
[4]SUDARSAN R,F(xiàn)ENVES S J,SRIRAM R D,et al.A product information modeling framework for product lifecycle management[J].Computer Aided Design,2005,37(13):1399-1411.
[5]張金,涂俊翔,陳卓寧,等.基于自然語言語義的數(shù)據(jù)庫目標(biāo)檢索研究[J].計算機(jī)系統(tǒng)應(yīng)用,2009,18(2):57-60.ZHANG Jin,TU Junxiang,CHEN Zhuoning,et al.Research on database object retrieval based on natural language query[J].Computer Systems & Applications,2009,18(2):57-60.
[6]GRUBER T R.Towards principles for the design of ontologies used for knowledge sharing[J].International Journal of Human-computer Studies,1995,43(5-6):907-928.
[7]RIBERIRO-NETO B,MUNTZ R.A belief network model for IR[C]∥ The 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval 1996.New York:ACM Press,1996:253-260.