王明微 ,韓紹歡,劉曉晨,李曙光
WANG Ming-wei1 , HAN Shao-huan2 , LIU Xiao-chen3, LI Shu-guang1
(1.西北工業(yè)大學(xué) 現(xiàn)代設(shè)計(jì)與集成制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,西安 710072;2.中國(guó)空間技術(shù)研究院,北京 100094;3.航天人才開(kāi)發(fā)交流中心,北京 100830)
目前,在我國(guó)以衛(wèi)星、飛機(jī)為代表的飛行器總體設(shè)計(jì)中對(duì)功能分析、技術(shù)要求分配等設(shè)計(jì)活動(dòng),仍然主要依賴(lài)于個(gè)人經(jīng)驗(yàn)進(jìn)行主觀判斷與協(xié)調(diào);嚴(yán)格的評(píng)審程序只能保證最終設(shè)計(jì)結(jié)果的正確性,而忽略了設(shè)計(jì)整體實(shí)現(xiàn)過(guò)程,難以追溯問(wèn)題產(chǎn)生根源。因此,獲取復(fù)雜產(chǎn)品設(shè)計(jì)過(guò)程中設(shè)計(jì)元素之間的因果知識(shí),將產(chǎn)品開(kāi)發(fā)過(guò)程從依賴(lài)個(gè)人經(jīng)驗(yàn)轉(zhuǎn)變?yōu)閲?yán)謹(jǐn)、有規(guī)律可循的科學(xué)實(shí)踐,對(duì)于提高產(chǎn)品設(shè)計(jì)效率和質(zhì)量具有重要意義和作用。
貝葉斯網(wǎng)絡(luò)(Bayesian networks)[1,2]作為數(shù)據(jù)挖掘技術(shù)中的最重要理論工具之一,能夠以條件概率方式確定變量之間的因果依賴(lài)關(guān)系,直觀和全面地綜合分析影響決策的所有因素。目前,國(guó)內(nèi)外學(xué)者在不同領(lǐng)域?qū)谪惾~斯網(wǎng)絡(luò)的因果知識(shí)表達(dá)、獲取和推理展開(kāi)了大量的研究。例如文獻(xiàn)[3]嘗試?yán)靡蚬麍D構(gòu)建貝葉斯網(wǎng)絡(luò),并比較二者異同;文獻(xiàn)[4]給出常見(jiàn)的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)因果關(guān)系知識(shí)模型的假設(shè)條件;文獻(xiàn)[5]通過(guò)貝葉斯網(wǎng)建立了設(shè)備故障原因與故障模型的因果關(guān)系;文獻(xiàn)[6]針對(duì)海岸安全評(píng)估問(wèn)題建立了一個(gè)貝葉斯網(wǎng)絡(luò)模型用于表述問(wèn)題中的因果關(guān)系,并提出了一個(gè)五層結(jié)構(gòu)框架用于預(yù)測(cè)潛在風(fēng)險(xiǎn)。
由于復(fù)雜產(chǎn)品設(shè)計(jì)過(guò)程是一個(gè)涉及多約束、多問(wèn)題域復(fù)雜問(wèn)題,在因果傳播機(jī)理、內(nèi)部關(guān)聯(lián)關(guān)系及決策過(guò)程等方面都有其自身特點(diǎn),很難直接利用貝葉斯網(wǎng)絡(luò)模型描述復(fù)雜開(kāi)發(fā)開(kāi)發(fā)過(guò)程,影響了因果知識(shí)提取的效果,迫切需要解決以下關(guān)鍵問(wèn)題:
1)隨著開(kāi)發(fā)活動(dòng)的深入,設(shè)計(jì)元素間的耦合程度急劇上升,單純依靠設(shè)計(jì)人員認(rèn)知能力無(wú)法準(zhǔn)確分析出各種設(shè)計(jì)狀態(tài)和設(shè)計(jì)結(jié)果之間的內(nèi)涵和關(guān)聯(lián)。如何將貝葉斯網(wǎng)絡(luò)的基本要素(節(jié)點(diǎn)、有向邊、概率分布、狀態(tài)、事件等)與復(fù)雜的產(chǎn)品開(kāi)發(fā)過(guò)程關(guān)聯(lián)起來(lái),能夠準(zhǔn)確且簡(jiǎn)潔地描述設(shè)計(jì)元素間不確定的因果關(guān)系,是需要解決的基本問(wèn)題。
2)雖然一些顯性映射規(guī)則能夠直接建立設(shè)計(jì)元素之間的因果聯(lián)系,但是總體來(lái)說(shuō)設(shè)計(jì)元素之間的因果映射需要設(shè)計(jì)人員根據(jù)設(shè)計(jì)原理和自身經(jīng)驗(yàn)才能建立。這種經(jīng)驗(yàn)規(guī)則蘊(yùn)含在設(shè)計(jì)實(shí)例中,具有模糊性和不確定性。如何將設(shè)計(jì)人員的經(jīng)驗(yàn)信息與歷史設(shè)計(jì)數(shù)據(jù)相融合,并充分利用產(chǎn)品開(kāi)發(fā)特點(diǎn)(例如具有一定的層次性),是提高知識(shí)獲取效果的關(guān)鍵。
因此,本文基于分層映射的產(chǎn)品開(kāi)發(fā)過(guò)程思想[7,8],提出基于貝葉斯網(wǎng)絡(luò)的產(chǎn)品開(kāi)發(fā)過(guò)程因果知識(shí)表達(dá)模型和知識(shí)獲取方法,通過(guò)融合設(shè)計(jì)人員先驗(yàn)知識(shí)和已有產(chǎn)品設(shè)計(jì)數(shù)據(jù),從定量和定性二個(gè)角度實(shí)現(xiàn)設(shè)計(jì)要素之間隱含因果關(guān)系的顯性化。
分層映射模型是最常用的產(chǎn)品開(kāi)發(fā)過(guò)程的形式化表達(dá)和規(guī)律性描述,它通過(guò)將產(chǎn)品開(kāi)發(fā)過(guò)程進(jìn)行層次劃分,將復(fù)雜問(wèn)題的求解分解為多個(gè)子問(wèn)題域并進(jìn)行層次化推理求解[8]。這意味著產(chǎn)品開(kāi)發(fā)過(guò)程因果知識(shí)具有一定的層次性。同時(shí),從飛行器總體設(shè)計(jì)過(guò)程全局角度來(lái)看,不僅僅單純關(guān)注于設(shè)計(jì)元素間的兩兩映射,總體設(shè)計(jì)過(guò)程所有設(shè)計(jì)元素的因果聯(lián)系呈現(xiàn)出網(wǎng)狀拓?fù)浣Y(jié)構(gòu)。因此,本文在貝葉斯網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行功能擴(kuò)展,提出一種面向復(fù)雜產(chǎn)品總體設(shè)計(jì)的產(chǎn)品開(kāi)發(fā)過(guò)程因果知識(shí)模型PDCKM(Product Development Causal Knowledge Model),表達(dá)不同問(wèn)題域各設(shè)計(jì)元素的因果影響、因果影響傳遞以及因果影響程度,通過(guò)前向節(jié)點(diǎn)對(duì)后向節(jié)點(diǎn)狀態(tài)的遞推作用來(lái)實(shí)現(xiàn)產(chǎn)品開(kāi)發(fā)過(guò)程的模擬。
定義1[產(chǎn)品設(shè)計(jì)過(guò)程因果知識(shí)模型](Product Development Causal Knowledge Model)采用有向圖方式表達(dá)開(kāi)發(fā)過(guò)程中各種設(shè)計(jì)要素以及其因果關(guān)系的一種知識(shí)模型,以三元組
本文基于經(jīng)典的功能-行為-結(jié)構(gòu)層次模型[7],將PDCKM中的節(jié)點(diǎn)變量X劃分為3個(gè)無(wú)交集的集合:需求域變量子集R、功能域變量子集F、結(jié)構(gòu)域變量子集S,即X=R∪F∪S。
1)需求域變量:需求域節(jié)點(diǎn)表達(dá)了用戶(hù)對(duì)產(chǎn)品的設(shè)計(jì)要求,通過(guò)質(zhì)量功能配置(QFD)等方法用一組可度量的參數(shù)來(lái)明確地描述產(chǎn)品應(yīng)具有的基本需求特性。
2)功能域變量:功能域變量是為完成產(chǎn)品設(shè)計(jì)需求所必需具有的最小功能需求元素集合,表達(dá)了達(dá)到產(chǎn)品設(shè)計(jì)需求所必需的一系列行動(dòng)。
3)結(jié)構(gòu)域變量:結(jié)構(gòu)域變量是滿(mǎn)足功能域變量要求的產(chǎn)品物理結(jié)構(gòu)元素的集,包括硬件類(lèi)和軟件類(lèi)。結(jié)構(gòu)域中的每一個(gè)元素至少應(yīng)滿(mǎn)足一項(xiàng)功能要求,或功能要求的一部分。當(dāng)然一個(gè)結(jié)構(gòu)元素也可滿(mǎn)足多項(xiàng)功能要求。
PDCKM模型中的有向邊集合E表示父節(jié)點(diǎn)Pa(Xi)對(duì)子節(jié)點(diǎn)具有直接因果影響,有向邊的方向是進(jìn)行決策推理的依據(jù)。為保證使PDCKM內(nèi)含的條件獨(dú)立性假設(shè)更為合適,本文基于分層映射模型思想,確定PDCKM中有向邊取向規(guī)則如下:需求域變量只受其他需求變量的影響(即發(fā)生需求分解);功能域變量可以受所有需求域變量以及其他功能域變量影響(即發(fā)生功能分解);需求域變量和功能域變量將共同影響結(jié)構(gòu)域變量。因此,確定PDCKM中有向邊取向規(guī)則如下:
PDCKM采用為節(jié)點(diǎn)變量計(jì)算以其父節(jié)點(diǎn)的狀態(tài)取值為條件的概率分布,表示節(jié)點(diǎn)之間因果關(guān)系的連接強(qiáng)度,對(duì)于沒(méi)有父節(jié)點(diǎn)的節(jié)點(diǎn)則需要給出其先驗(yàn)概率。如果有n個(gè)設(shè)計(jì)要素變量,并且當(dāng)所有的設(shè)計(jì)要素變量均取二值時(shí),需要2n-1個(gè)參數(shù)才能確定其聯(lián)合概率分布,此計(jì)算量相當(dāng)巨大。因此在PDCKM中可以充分利用變量間的條件獨(dú)立關(guān)系,將聯(lián)合分布分解成多個(gè)復(fù)雜度較低的條件概率分布,有如式(1)所示的聯(lián)合概率計(jì)算公式,從而降低概率參數(shù)的表達(dá)復(fù)雜度,提高知識(shí)獲取效率。
基于數(shù)據(jù)的貝葉斯結(jié)構(gòu)學(xué)習(xí)已經(jīng)證明為NP-hard問(wèn)題,本文采用最廣泛應(yīng)用的基于評(píng)分-搜索的結(jié)構(gòu)學(xué)習(xí)算法。為在聯(lián)合概率密度函數(shù)逼近程度和有向圖模型復(fù)雜度之間取折衷,采用基于附加懲罰函數(shù)的最大互信息作為評(píng)分函數(shù)[9],以改進(jìn)的爬山算法獲得最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)。
設(shè):Bs是基于數(shù)據(jù)集D構(gòu)建的一個(gè)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),ri是變量Xi是的取值數(shù),是父節(jié)點(diǎn)集Pa(Xi)的配置數(shù)目,則基于附加懲罰函數(shù)的最大互信息評(píng)分函數(shù)如式(2)所示:
其中,MI(Xi,Pa(Xi))為Xi和Pa(Xi)的條件互信息,如式(3)所示,文獻(xiàn)[9]已證明使MI(Xi,Pa(Xi))最大的網(wǎng)絡(luò)結(jié)構(gòu)是對(duì)聯(lián)合密度p(X1,…,Xn)的最佳逼近;dim(S)指拓?fù)浣Y(jié)構(gòu)Bs的復(fù)雜度,定義為拓?fù)浣Y(jié)構(gòu)Bs下有向圖模型參數(shù)的最小數(shù)目
雖然完全基于專(zhuān)家經(jīng)驗(yàn)建立PDCKM是不現(xiàn)實(shí)的,但是我們可以很容易利用專(zhuān)家已有經(jīng)驗(yàn)知識(shí),提高PDCKM獲取的準(zhǔn)確度和速度。這些先驗(yàn)知識(shí)主要包括:1)一個(gè)設(shè)計(jì)元素將受幾個(gè)因素影響,即最大父節(jié)點(diǎn)數(shù)目,記為max(Pa(Xi)) ;2)部分設(shè)計(jì)要素變量間的偏序關(guān)系,從而判斷節(jié)點(diǎn)之間的指向。所以本文除了采用爬山算法的加邊算子、減邊算子、換向算子,引入了修正算子,對(duì)候選PDCKM的拓?fù)浣Y(jié)構(gòu)進(jìn)行修正。修正算子包括3個(gè):1)消除環(huán)狀回路算子:根據(jù)分層映射的產(chǎn)品開(kāi)發(fā)過(guò)程思想,一般不考慮有回路的因果關(guān)系,如圖1(a)所示;2)最大父節(jié)點(diǎn)算子:根據(jù)先驗(yàn)知識(shí)判斷一個(gè)設(shè)計(jì)要素最大有多少個(gè)父節(jié)點(diǎn),這樣有利于減少搜索空間,如圖1(b)所示;3)修正偏序關(guān)系算子:為了保證因果關(guān)系正確性,改正與先驗(yàn)知識(shí)不符的父子節(jié)點(diǎn)關(guān)系。
圖1 PDCKM參數(shù)學(xué)習(xí)
對(duì)于PDCKM參數(shù)學(xué)習(xí),當(dāng)訓(xùn)練樣本集完整時(shí)可以采用最大似然估計(jì)MLE進(jìn)行參數(shù)估計(jì),但是當(dāng)樣本數(shù)據(jù)不完整時(shí),如當(dāng)父結(jié)點(diǎn)樣本數(shù)目為0時(shí),MLE算法就會(huì)產(chǎn)生溢出問(wèn)題,從而無(wú)法計(jì)算。在實(shí)際產(chǎn)品開(kāi)發(fā)過(guò)程中,難免有些數(shù)據(jù)缺失。文獻(xiàn)[10]證明了期望最大化算法EM從不完整的數(shù)據(jù)中進(jìn)行參數(shù)學(xué)習(xí)比較有效,因此本文采用EM算法進(jìn)行PDCKM參數(shù)學(xué)習(xí)。
在EM算法中第t次迭代過(guò)程中,第一步根據(jù)式(4)計(jì)算期望對(duì)數(shù)似然函數(shù)Q(θ|θt),第二步是求得使Q(θ|θt)最大時(shí)候的θ。
當(dāng)θ取以下值時(shí),Q(θ|θt)達(dá)到最大其中,其中是修補(bǔ)后數(shù)據(jù)中所有滿(mǎn)足Xi=k和Pa(Xi)=j的樣本的權(quán)重之和。
本文以信標(biāo)機(jī)系統(tǒng)為例,選取設(shè)計(jì)人員感興趣的一組11個(gè)設(shè)計(jì)要素變量,通過(guò)收集國(guó)內(nèi)外設(shè)計(jì)成功案例,提取出46個(gè)樣本作為數(shù)據(jù)集。同時(shí),根據(jù)領(lǐng)域?qū)<医?jīng)驗(yàn)確定部分先驗(yàn)知識(shí),包括有向邊的方向(如X1→X6)和最大父節(jié)點(diǎn)數(shù)目(如max(Pa(Xi)=5)。
采用基于最大互信息的啟發(fā)式搜索算法得到PDCKM拓?fù)浣Y(jié)構(gòu),如圖2所示,可以看出天線(X7)只會(huì)載噪比(X8)參數(shù)。
基于所獲取的PDCKM拓?fù)浣Y(jié)構(gòu),采用EM算法進(jìn)行PDCKM參數(shù)學(xué)習(xí),獲得PDCKM參數(shù)分布P,部分參數(shù)如表2所示,定量化的描述節(jié)點(diǎn)之間的因果依賴(lài)程度。
圖2 PDCKM拓?fù)浣Y(jié)構(gòu)學(xué)習(xí)結(jié)果
通過(guò)實(shí)驗(yàn)結(jié)果,可以全面綜合而直觀的確定產(chǎn)品開(kāi)發(fā)過(guò)程中各設(shè)計(jì)因素的因果關(guān)聯(lián)關(guān)系,為進(jìn)行正確決策奠定基礎(chǔ)。同時(shí),也可以提取概率較大的變量狀態(tài)作為典型設(shè)計(jì)案例,為產(chǎn)品開(kāi)發(fā)過(guò)程有規(guī)律可循的科學(xué)實(shí)踐。
表2 PDCKM的部分參數(shù)
復(fù)雜產(chǎn)品開(kāi)發(fā)過(guò)程各種設(shè)計(jì)元素因果關(guān)系具有模糊性和不確定性,本文提出了一種基于貝葉斯網(wǎng)絡(luò)的產(chǎn)品開(kāi)發(fā)過(guò)程過(guò)程知識(shí)提取方法。闡述了產(chǎn)品開(kāi)發(fā)過(guò)程過(guò)程因果知識(shí)模型基本概念及模型組成部分,然后詳細(xì)描述了模型結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)過(guò)程,從而能夠依次提取概率較大的變量狀態(tài)作為典型設(shè)計(jì)案例,為產(chǎn)品開(kāi)發(fā)有規(guī)律可循的實(shí)現(xiàn)途徑。
[1]Kim K Y,Kim Y S.Causal design knowledge:Alternative representation method for product development knowledge management[J].Computer-Aided Design,2011,43(9):1137-1153.
[2]慕春棣,戴劍彬,葉俊.用于數(shù)據(jù)挖掘的貝葉斯網(wǎng)絡(luò)[J].軟件學(xué)報(bào),2000,11(5):660-666.
[3]Nadkarni S,Shenoy P P.A causal mapping approach to constructing Bayesian networks[J].Decision Support Systems,2004,38(2):259-281.
[4]Eckerman D.A tutorial on learning with Bayesian networks[M].Springer Berlin Heidelberg,2008.
[5]蔡志強(qiáng),孫樹(shù)棟,司書(shū)賓,王寧.基于貝葉斯網(wǎng)絡(luò)的不確定環(huán)境裝備故障推理模型[J].西北工業(yè)大學(xué)學(xué)報(bào),2011,29(4):509-514.
[6]Ren J,Jenkinson I,Wang J,Xu D L,Yang J B.A methodology to model causal relationships on offshore safety assessment focusing on human and organizational factors.Journal of Safety Research,2008,39:87-100.
[7]Qian L,Gero J S.Function-Behavior-Structure path and their role in analogy-based design[J].AI EDAM,1996,10(4):289-312.
[8]王玉新,毛曉輝,李添益.功能-結(jié)構(gòu)雙向創(chuàng)新商空間模型關(guān)鍵技術(shù)研究[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2010,44(8):1570-1578.
[9]李剛.知識(shí)發(fā)現(xiàn)的圖模型方法[D].2000.
[10]M.Drudzzel.Qualitative Verbal Explanations Byaesian Belief Networks.In Artificial Intelligence and Simulation of Behaviour Quarterly[J].Special Issue on Bayesian Belief Networks.1996.94:43-54.