韓紹金 ,李建勛
HAN Shaojin1,2,3,LI Jianxun1,3
1.上海交通大學(xué) 電子信息與電氣工程學(xué)院,上海 200240
2.中國人民解放軍63926部隊(duì)
3.教育部系統(tǒng)控制與信息處理重點(diǎn)實(shí)驗(yàn)室,上海 200240
1.School of Electronic Information and Electrical Engineering,Shanghai Jiaotong University,Shanghai 200240,China
2.Unit 63926 of PLA,China
3.Key Laboratory of System Control and Information Processing,Ministry of Education,Shanghai 200240,China
貝葉斯網(wǎng)絡(luò)(Bayesian Networks,BN)是融合了概率分布表的有向無環(huán)圖,它將樣本信息與先驗(yàn)知識(shí)相結(jié)合,具有形象直觀的數(shù)據(jù)表達(dá)特點(diǎn),以結(jié)構(gòu)依賴和概率表示的形式分別描述了變量之間定性與定量依賴關(guān)系,理論基礎(chǔ)堅(jiān)實(shí),表述方式直觀,推理能力強(qiáng)大,是不確定性問題建模和推理的有效工具。
準(zhǔn)確高效地學(xué)習(xí)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),是有效利用貝葉斯網(wǎng)絡(luò)解決實(shí)際問題的基礎(chǔ),是貝葉斯網(wǎng)絡(luò)理論研究的熱點(diǎn),其內(nèi)容包括確定貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)(有向無環(huán)圖)和學(xué)習(xí)節(jié)點(diǎn)變量的條件概率分布,即為結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)。其中結(jié)構(gòu)學(xué)習(xí)是貝葉斯網(wǎng)絡(luò)學(xué)習(xí)的重點(diǎn)和基礎(chǔ),目前在結(jié)構(gòu)學(xué)習(xí)的領(lǐng)域已經(jīng)研究發(fā)展了許多經(jīng)典實(shí)用的算法,如爬山法[1],MMHC法[2]等,這些方法有扎實(shí)的理論支持,并且在各工程領(lǐng)域都得到了廣泛的應(yīng)用,但這些方法的實(shí)現(xiàn)和應(yīng)用都是基于大規(guī)模數(shù)據(jù)集(完備或者經(jīng)補(bǔ)充后完備),而在實(shí)際工程應(yīng)用中,受限于環(huán)境、材料、時(shí)間等因素,很多實(shí)驗(yàn)往往不能夠多次重復(fù),使得能夠獲得的實(shí)驗(yàn)數(shù)據(jù)較少,樣本規(guī)模很小,這樣的小樣本數(shù)據(jù)集里能夠表達(dá)的信息不夠完整,許多數(shù)據(jù)的統(tǒng)計(jì)因子缺失,由此進(jìn)行的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)的準(zhǔn)確性和可靠性無法保證。由此衍生出基于小樣本數(shù)據(jù)集的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)問題的研究。目前研究比較多的集中在兩個(gè)方面,一種是研究基于小樣本數(shù)據(jù)集直接進(jìn)行學(xué)習(xí)得到主體結(jié)構(gòu),然后利用數(shù)據(jù)修正等性質(zhì)進(jìn)行優(yōu)化[3],另一種是通過拓展數(shù)據(jù)集來增加樣本規(guī)模[4],以此提高結(jié)構(gòu)學(xué)習(xí)的可靠性?;跀?shù)據(jù)集的Bootstrap抽樣是常用的數(shù)據(jù)拓展方法,但傳統(tǒng)的Bootstrap抽樣是對(duì)數(shù)據(jù)集的可重復(fù)抽樣,沒有增加額外信息,學(xué)習(xí)效果無法得到實(shí)質(zhì)性的改進(jìn)。
在本文提出的算法中,將概率密度核估計(jì)的方法引入小數(shù)據(jù)集的拓展過程,將所得到的拓展數(shù)據(jù)集用于貝葉斯網(wǎng)絡(luò)的深入學(xué)習(xí),還通過計(jì)算互信息度確認(rèn)了節(jié)點(diǎn)次序,較好地改善了Bootstrap抽樣方法無法得到額外有效信息的缺點(diǎn),彌補(bǔ)了K2算法需要確認(rèn)節(jié)點(diǎn)先驗(yàn)次序的不足,有效地提高了貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí)效果。
現(xiàn)有的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法分成兩類,一類是基于評(píng)分搜索的學(xué)習(xí)方法,另一類是基于約束滿足的學(xué)習(xí)方法[5]。其中評(píng)分搜索的方法過程簡單規(guī)范,更被人們采用。Cooper提出的K2算法是簡單經(jīng)典的方法之一。K2算法的基本思想是定義評(píng)價(jià)網(wǎng)絡(luò)結(jié)構(gòu)模型優(yōu)劣的評(píng)分測度函數(shù),首先給定一個(gè)包含所有節(jié)點(diǎn)的變量順序δ和最大父親節(jié)點(diǎn)個(gè)數(shù)π。在搜索過程中,按給定順序逐個(gè)考察δ中變量,確定其父親節(jié)點(diǎn),添加相應(yīng)邊。對(duì)變量 Xj,假設(shè)已經(jīng)找到的父親節(jié)點(diǎn)為πj。如果 Xj的父親節(jié)點(diǎn)個(gè)數(shù)還未達(dá)到最大值π,即|πj|<π,則應(yīng)繼續(xù)考察δ中排在 Xj之前而還不是 Xj父親節(jié)點(diǎn)的變量,在其中繼續(xù)尋找父節(jié)點(diǎn),操作步驟為:從這些變量中選出使得新網(wǎng)絡(luò)評(píng)分Vnew達(dá)到最大的 Xi,然后將Vnew與舊網(wǎng)絡(luò)評(píng)分Vold比較:如果Vnew>Vold,則 Xi為 Xj的父節(jié)點(diǎn);當(dāng)父親節(jié)點(diǎn)數(shù)到達(dá)最大值或者網(wǎng)絡(luò)評(píng)分無法提高時(shí)停止為Xj尋找父親節(jié)點(diǎn)。其評(píng)測函數(shù)定義為:
學(xué)習(xí)流程偽代碼為:
輸入:X={X1,X2,…,Xn}為一組變量,δ為一個(gè)變量順序,π為變量最大父親節(jié)點(diǎn)個(gè)數(shù),λ為完整的數(shù)據(jù)集。
輸出:經(jīng)過結(jié)構(gòu)學(xué)習(xí)得到的貝葉斯網(wǎng)絡(luò)。
ζ=由按照次序排列的全部節(jié)點(diǎn)組成的無邊圖
傳統(tǒng)的基于小樣本數(shù)據(jù)集的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)問題通常采用Bootstrap[6-8]抽樣方法來完成小樣本的拓展,然后基于拓展后的數(shù)據(jù)集采用大規(guī)模數(shù)據(jù)集的結(jié)構(gòu)學(xué)習(xí)算法完成學(xué)習(xí)。但由于Bootstrap抽樣方法產(chǎn)生的樣本只是來源于原樣本,因此極有可能得到的拓展樣本與原樣本極為相似,且不會(huì)改善小樣本集里的信息缺失的情況,特別在樣本容量極小的情況下,這樣的特性會(huì)使得概率分布集中于少量點(diǎn),體現(xiàn)在學(xué)習(xí)得到的貝葉斯網(wǎng)絡(luò)里便是這些點(diǎn)對(duì)應(yīng)的連接邊出現(xiàn)的概率較高,而原始小樣本缺失的數(shù)據(jù)信息所對(duì)應(yīng)的連接邊無法得到補(bǔ)充。為改善Bootstrap抽樣方法不能補(bǔ)充缺失數(shù)據(jù)的問題,本文以概率密度核估計(jì)的方法對(duì)原始小樣本進(jìn)行拓展得到大數(shù)據(jù)集,然后基于大數(shù)據(jù)集運(yùn)用K2算法進(jìn)行結(jié)構(gòu)學(xué)習(xí),由于概率密度核估計(jì)方法是估計(jì)概率密度分布后再進(jìn)行重采樣,因此可以有效補(bǔ)充小數(shù)據(jù)集缺失信息,以此進(jìn)行結(jié)構(gòu)學(xué)習(xí)得到的模型更加全面準(zhǔn)確。
密度核估計(jì)(kernel density estimation)是估計(jì)未知概率密度函數(shù)的方法,是非參數(shù)檢驗(yàn)方法之一,由Rosenblatt[9]和Emanuel Parzen[10]提出。密度核估計(jì)方法不利用有關(guān)數(shù)據(jù)分布的先驗(yàn)知識(shí),對(duì)樣本的總體分布不作任何假設(shè),是一種從樣本自身出發(fā)研究數(shù)據(jù)分布特征的方法,在統(tǒng)計(jì)學(xué)理論和應(yīng)用領(lǐng)域均受到高度的重視。
設(shè) X1,X2,…,Xn是從一維總體 X中抽出的獨(dú)立同分布樣本,X具有未知密度函數(shù) f(x),x∈R,則 f(x)的核估計(jì)為:
其中 K(·)為 R=(-∞,+∞)上的Borel可測函數(shù),稱為核函數(shù),在有意義的核估計(jì)里,核函數(shù)應(yīng)當(dāng)是概率密度函數(shù),hn是個(gè)同n有關(guān)的正數(shù),稱為窗寬或帶寬[11]。在獨(dú)立同分布的情況下,核估計(jì)量具有逐點(diǎn)漸進(jìn)無偏性和一致漸進(jìn)無偏性、均方相合性、強(qiáng)相合性、一致強(qiáng)相合性等,這使得核估計(jì)在非參數(shù)密度估計(jì)中占有重要地位。
概率密度核估計(jì)的效果,既與樣本規(guī)模n有關(guān),也與核函數(shù)K(·)和窗寬h的選擇有關(guān),在給定樣本的情況下,決定概率密度核估計(jì)性能好壞的變量就只有核函數(shù)K(·)和窗寬n。核函數(shù)的選擇不是密度估計(jì)中最關(guān)鍵的因素,因?yàn)檫x用任何核函數(shù)都能保證密度估計(jì)具有穩(wěn)定相合性。因此在實(shí)際工程應(yīng)用中,只需選擇滿足一定條件的核函數(shù)即可。核函數(shù)的確定一般需要滿足下列條件:(1)函數(shù)對(duì)稱且 ∫K(t)dt=1;(2)一階矩等于零,方差為有限值;(3)函數(shù)連續(xù)。常見的核函數(shù)有Epanechikov核、Parzen核、Triweight核等。見表1。
表1 常見核函數(shù)
常用來度量核估計(jì)性能的一種測度是積分均方誤差MISE,表達(dá)式為:
對(duì)其進(jìn)行展開計(jì)算,并略去高階小量得到:
在上式中,第一項(xiàng)是估計(jì)的方差,第二項(xiàng)是偏差項(xiàng)。由此可知,當(dāng)核函數(shù)固定時(shí),若窗寬選得過大,偏差會(huì)隨之變大,但方差能夠得到抑制,此時(shí)x經(jīng)過壓縮變換之后 fn(x)對(duì) f(x)有較大的平滑作用,淹沒了密度的細(xì)節(jié)部分;若窗寬選得過小,偏差得到改善,但方差隨之增加,這是因?yàn)榇藭r(shí)引起了隨機(jī)性影響的增加,fn(x)有較大的波動(dòng),f(x)的某些重要特性可能被掩蓋。因此窗寬的選擇需要同時(shí)考慮偏差和方差的影響。
貝葉斯網(wǎng)絡(luò)得到的數(shù)據(jù)集為多維數(shù)據(jù),數(shù)據(jù)維度取決于網(wǎng)絡(luò)節(jié)點(diǎn),且各維度之間存在相互關(guān)聯(lián)和耦合,因此在貝葉斯網(wǎng)絡(luò)的小樣本數(shù)據(jù)拓展中,必須將數(shù)據(jù)集作為多維自耦合的整體來考察。
設(shè)將要學(xué)習(xí)的貝葉斯網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)為M,則可知得到的數(shù)據(jù) X為 M 維變量,設(shè) X1,X2,…,Xn為要得到的 X的樣本,則由上文可知數(shù)據(jù)集X的概率密度函數(shù) f(X)的核估計(jì)為:
其中:X=(x1,x2,…,xM)T,Xi=(xi1,xi2,…,xiM)T(i=1,2,…,n);h為窗寬,n為樣本容量;S是 M×M 維對(duì)稱樣本協(xié)方差矩陣[12]。
依潘涅契科夫[13]經(jīng)過統(tǒng)計(jì)研究得出,當(dāng)概率密度核估計(jì)的窗寬系數(shù)確定時(shí),核函數(shù)的不同對(duì)MISE的影響很小。本文以標(biāo)準(zhǔn)高斯函數(shù)作為核函數(shù)。標(biāo)準(zhǔn)高斯函數(shù)密度函數(shù)為:
在核函數(shù)固定的情況下,窗寬隨數(shù)據(jù)規(guī)模的增大而減小。窗寬的確定應(yīng)考慮數(shù)據(jù)集的密集程度變化,在數(shù)據(jù)集密集的部分,將窗寬選小一點(diǎn),這樣可以有效保留數(shù)據(jù)細(xì)節(jié),保證數(shù)據(jù)集的精確可靠;在數(shù)據(jù)集稀疏的部分,將窗寬取大一些,這樣可以剔除數(shù)據(jù)集毛刺,減小數(shù)據(jù)拓展開銷。最優(yōu)窗寬的具體計(jì)算方法很多。這里使用LSCV法。LSCV是基于積分平方誤差(Integrated Square Error,ISE)最小準(zhǔn)則的一種計(jì)算方法。對(duì)多維隨機(jī)變量X ,ISE為:
式中最后一項(xiàng)與窗寬無關(guān)。LSCV就是取式中前兩項(xiàng)進(jìn)行最小化,即
多維數(shù)據(jù)樣本集最簡單的形式是二維數(shù)據(jù)樣本,本文以此為例,驗(yàn)證多維數(shù)據(jù)核估計(jì)效果,取均值矩陣M=,協(xié)方差矩陣,樣本采樣率(樣本集規(guī)模)N=300,得到仿真結(jié)果如圖1所示。
由圖可知,以二維數(shù)據(jù)樣本為例的多維數(shù)據(jù)核估計(jì)取得了良好效果,所得概率密度函數(shù)十分貼近給定函數(shù)。
傳統(tǒng)的K2算法需要指定一個(gè)包含所有節(jié)點(diǎn)的變量順序,而這個(gè)變量順序在實(shí)際問題中通常是無法先驗(yàn)預(yù)知的。需要通過對(duì)樣本數(shù)據(jù)的學(xué)習(xí)來識(shí)別最佳變量順序,將其作為K2算法的輸入變量之一,然后再利用K2算法對(duì)樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)得到貝葉斯網(wǎng)絡(luò)。本文提出一種基于互信息度確認(rèn)變量順序的方法。
圖1 維數(shù)據(jù)樣本集核估計(jì)效果
兩個(gè)變量之間的關(guān)聯(lián)程度可用互信息度表示,記為I[X;Y],定義如下[14]:
其中H[X]表示隨機(jī)變量X的信息熵,H[X|Y]表示給定Y條件下變量X的信息熵,定義如下:
其中,n和m分別表示隨機(jī)變量X和Y的取值狀態(tài)個(gè)數(shù),根據(jù)互信息的定義,互信息度具有對(duì)稱性,即I[X;Y]=I[Y;X]。
互信息度取值越大,表明兩個(gè)變量間的聯(lián)系越緊密,則兩個(gè)節(jié)點(diǎn)間有邊連接的可能性越大?;谶@樣的性質(zhì),可以構(gòu)建一條節(jié)點(diǎn)鏈,具體步驟為:
(1)計(jì)算得到兩兩節(jié)點(diǎn)的互信息度Ii[Xi;Yi]。
(2)對(duì)互信息度Ii[Xi;Yi]進(jìn)行降序排列。
(3)依據(jù)排列順序,依次取出一對(duì)節(jié)點(diǎn),判斷兩節(jié)點(diǎn)之間是否有邊連接或者連接后是否形成回路,如果都沒有,則在兩個(gè)節(jié)點(diǎn)之間增加一條邊。
(4)當(dāng)所有節(jié)點(diǎn)都取完后,則形成一條節(jié)點(diǎn)鏈。
得到的節(jié)點(diǎn)鏈?zhǔn)且粋€(gè)無向節(jié)點(diǎn)鏈,作為K2算法的節(jié)點(diǎn)順序輸入,還需要確認(rèn)節(jié)點(diǎn)鏈的方向,在樣本集中提取小規(guī)模樣本分別按照正向節(jié)點(diǎn)順序δ1和反向節(jié)點(diǎn)順序δ2的順序利用K2算法進(jìn)行結(jié)構(gòu)學(xué)習(xí),最終學(xué)習(xí)分別得到分?jǐn)?shù)Score1和Score2,如果Score1>Score2,則取δ1作為變量順序輸入K2算法進(jìn)行結(jié)構(gòu)學(xué)習(xí),反之取δ2作為結(jié)構(gòu)變量高的順序。
由上文可知,概率密度核估計(jì)的方法在進(jìn)行多維數(shù)據(jù)樣本的密度函數(shù)估計(jì)時(shí)取得了良好效果,在此基礎(chǔ)上利用重抽樣得到拓展數(shù)據(jù)集能有效克服Bootstrap抽樣方法樣本單一、數(shù)據(jù)集不確實(shí)的問題。
K2算法是網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)中有效的打分搜索方法,但該算法要求具備大規(guī)模樣本集以確??梢垣@得正確的網(wǎng)絡(luò)結(jié)構(gòu),以及需要已知輸入網(wǎng)絡(luò)節(jié)點(diǎn)的邏輯次序。由于在實(shí)際應(yīng)用中,多數(shù)情況下難以獲得大規(guī)模樣本集,也不是每個(gè)網(wǎng)絡(luò)都能夠得到先驗(yàn)的節(jié)點(diǎn)順序,因此K2算法在工程實(shí)際的應(yīng)用受到限制。本文將概率密度核估計(jì)、互信息度學(xué)習(xí)以及K2算法結(jié)合,提出基于小規(guī)模數(shù)據(jù)集學(xué)習(xí)的KI-K2貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法,算法流程如圖2所示。
圖2 KI-K2算法流程圖
表2 數(shù)據(jù)設(shè)計(jì)表
KI-K2算法以概率密度核估計(jì)來進(jìn)行原始數(shù)據(jù)集拓展,同時(shí)利用互信息度進(jìn)行節(jié)點(diǎn)次序確認(rèn),然后與K2算法學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)相結(jié)合進(jìn)行網(wǎng)絡(luò)學(xué)習(xí),這種算法能夠充分發(fā)揮概率密度核估計(jì)在數(shù)據(jù)集拓展上的優(yōu)勢(shì),為后期網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)提供相對(duì)全面準(zhǔn)確的樣本數(shù)據(jù),同時(shí)將互信息度確認(rèn)節(jié)點(diǎn)次序與K2算法相結(jié)合,能夠最大限度地保留獨(dú)立性測試高效與K2算法快速準(zhǔn)確的特點(diǎn),使得K2算法擺脫節(jié)點(diǎn)次序這一先驗(yàn)輸入的限制,在實(shí)際工程問題中更具有實(shí)用性。
以貝葉斯網(wǎng)絡(luò)為工具,來評(píng)估導(dǎo)彈攔截系統(tǒng)的效能,以此為實(shí)例來進(jìn)行學(xué)習(xí)驗(yàn)證本文提出的KI-K2算法的性能。
彈道導(dǎo)彈防御系統(tǒng)一般由搜索探測系統(tǒng)、指揮控制系統(tǒng)、跟蹤制導(dǎo)系統(tǒng)、攔截彈系統(tǒng)、評(píng)估系統(tǒng)組成[15]。評(píng)判其效能有以下指標(biāo):
(1)作戰(zhàn)能力。主要包括:預(yù)警探測能力、跟蹤能力、通信能力、攔截能力等。
(2)生存能力。
(3)可靠性。
假定攔截系統(tǒng)為PAC-3(“愛國者”-3)末段低層攔截系統(tǒng),進(jìn)攻彈為“潘興”-2中程戰(zhàn)術(shù)彈道導(dǎo)彈。仿真實(shí)例為PAC-3多次攔截1枚彈道導(dǎo)彈??煽繉?shí)驗(yàn)數(shù)據(jù)表明,其貝葉斯網(wǎng)絡(luò)節(jié)點(diǎn)可設(shè)計(jì)如表2。
導(dǎo)彈攔截系統(tǒng)全因素貝葉斯模型如圖3所示。
圖3 導(dǎo)彈攔截系統(tǒng)全因素貝葉斯模型
實(shí)驗(yàn)過程中共選取實(shí)驗(yàn)設(shè)計(jì)中的7個(gè)因素(見表3),并對(duì)每個(gè)因素取值進(jìn)行離散化得到2個(gè)狀態(tài)。
表3 最終數(shù)據(jù)設(shè)計(jì)表
得到貝葉斯網(wǎng)絡(luò)如圖4所示。
圖4 生成貝葉斯網(wǎng)絡(luò)
將均勻分布生成的隨機(jī)數(shù)與節(jié)點(diǎn)的條件概率對(duì)比便可實(shí)現(xiàn)對(duì)節(jié)點(diǎn)的采樣,基于給定的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),按照網(wǎng)絡(luò)結(jié)構(gòu)順序依次對(duì)節(jié)點(diǎn)進(jìn)行采樣便可生成對(duì)此網(wǎng)絡(luò)的一組隨機(jī)采樣數(shù)據(jù)。利用Matlab貝葉斯網(wǎng)絡(luò)工具箱里面的sample_bnet函數(shù)可產(chǎn)生規(guī)模為N的小數(shù)據(jù)集,然后基于數(shù)據(jù)集使用Bootstrap方法以及概率密度核估計(jì)的方法分別進(jìn)行數(shù)據(jù)拓展,然后利用K2算法進(jìn)行結(jié)構(gòu)學(xué)習(xí),最后進(jìn)行比較。
本文采取的各個(gè)參數(shù)如下:Bootstrap抽樣為原數(shù)據(jù)規(guī)模10倍,密度核估計(jì)選取核函數(shù)為高斯函數(shù)。為減少偶然誤差,實(shí)驗(yàn)重復(fù)進(jìn)行10次,取平均值作為實(shí)驗(yàn)結(jié)果輸出。
實(shí)驗(yàn)環(huán)境為:硬件為Intel?CoreTMi5-2310 2.90 GHz 2.89 GHz;操作系統(tǒng)為Windows XP;編程軟件為matlabR2010a。
用IE代表學(xué)習(xí)結(jié)構(gòu)比原網(wǎng)絡(luò)結(jié)構(gòu)多的邊,ME代表學(xué)習(xí)結(jié)構(gòu)比原網(wǎng)絡(luò)結(jié)構(gòu)缺的邊,RE代表學(xué)習(xí)結(jié)構(gòu)與原網(wǎng)絡(luò)結(jié)構(gòu)相比反轉(zhuǎn)的邊,分別取原始樣本數(shù)N=1 000,500和100,得到仿真結(jié)果如表4~6所示。
表4 原始樣本數(shù)N=1 000時(shí)各算法仿真效果
表5 原始樣本數(shù)N=500時(shí)各算法仿真效果
表6 原始樣本數(shù)N=100時(shí)各算法仿真效果
由實(shí)驗(yàn)結(jié)果可知:
(1)小樣本數(shù)據(jù)集條件下,概率密度核估計(jì)拓展數(shù)據(jù)集后進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)效果比Bootstrap抽樣方法拓展數(shù)據(jù)后進(jìn)行結(jié)構(gòu)學(xué)習(xí)的效果好,隨著數(shù)據(jù)集減小,學(xué)習(xí)誤差增大,但該算法效果優(yōu)越性越明顯。
(2)小樣本數(shù)據(jù)集條件下,給定先驗(yàn)節(jié)點(diǎn)順序的概率密度核估計(jì)拓展數(shù)據(jù)集后進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)效果同樣優(yōu)于給定先驗(yàn)節(jié)點(diǎn)順序的K2算法,隨著數(shù)據(jù)集減小,學(xué)習(xí)誤差增大,但該算法效果優(yōu)越性越明顯。
(3)小樣本數(shù)據(jù)集條件下,基于互信息度求得先驗(yàn)節(jié)點(diǎn)順序的概率密度核估計(jì)拓展數(shù)據(jù)集后進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)效果與給定先驗(yàn)節(jié)點(diǎn)順序的K2算法基本持平,優(yōu)于隨機(jī)順序的K2學(xué)習(xí)算法,證明該算法確實(shí)有效,改善了必須指定節(jié)點(diǎn)順序的不足。
(4)采用指定節(jié)點(diǎn)順序的K2算法進(jìn)行結(jié)構(gòu)學(xué)習(xí)的話反向的邊一直等于0是因?yàn)镵2算法得到了順序的變量邏輯結(jié)構(gòu),因此不會(huì)產(chǎn)生反向的邊。
本文提出了利用概率密度核估計(jì)方法對(duì)樣本數(shù)據(jù)集進(jìn)行拓展,利用互信息度推算節(jié)點(diǎn)邏輯順序,然后基于拓展后的樣本數(shù)據(jù)集將確認(rèn)的節(jié)點(diǎn)順序進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)的算法,最后通過仿真驗(yàn)證可以看到,本文提出的算法具有較強(qiáng)的結(jié)構(gòu)學(xué)習(xí)能力和良好的學(xué)習(xí)速度,在實(shí)際工程背景下是一種可靠高效的結(jié)構(gòu)學(xué)習(xí)方法。
[1]Cooper G F,Herskovits E.A Bayesian method for the induction of probabilistic networks from data[J].Machine Learning,1992,9(4):309-347.
[2]何德琳,程勇,趙瑞蓮.基于MMHC算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法研究[J].北京工商大學(xué)學(xué)報(bào):自然科學(xué)版,2008,26(3):43-48.
[3]王雙成,冷翠平,李小琳.小數(shù)據(jù)集的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J].自動(dòng)化學(xué)報(bào),2009,35(8):1063-1070.
[4]Borchani H,Amor N B,Khalfallah F.Learning and evaluating Bayesian network equivalence classes from incomplete data[J].International Journal of Pattern Recognition and Artificial Intelligence,2008,22(2):253-278.
[5]金焱,胡云安,張瑾,等.K2與模擬退火相結(jié)合的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版,2012,42(S1):82-86.
[6]Efron B.Bootstrap methods:another look at the jackknife[J].The Annals of Statistics,1979,7(1):1-26.
[7]陳峰,楊珉.Bootstrap估計(jì)及其應(yīng)用[J].中國衛(wèi)生統(tǒng)計(jì),1997,14(5):5-7.
[8]劉偉,龍瓊,陳芳,等.Bootstrap方法的幾點(diǎn)思考[J].飛行器測控學(xué)報(bào),2007,26(5):78-81.
[9]Rosenblatt M.Remarks on some nonparametric estimates of a density function[J].The Annals of Mathematical Statistics,1956,27(3):832-837.
[10]Parzen E.On estimation of a probability density function and mode[J].The Annals of Mathematical Statistics,1962,33(3):1065-1076.
[11]郭照莊,霍東升,孫月芳.密度核估計(jì)中窗寬選擇的一種新方法[J].佳木斯大學(xué)學(xué)報(bào):自然科學(xué)版,2008,26(3):401-403.
[12]李德旺,陳興,喻達(dá)磊,等.多維密度核估計(jì)的Bootstrap逼近[J].西南大學(xué)學(xué)報(bào):自然科學(xué)版,2007,29(11):34-37.
[13]Epanechnikov V A.Nonparametric estimation of a multidimensional probability density[J].Theory of Probability Application,1969,14(1):153-158.
[14]Herskovits E.Computer-based probabilistic-network construction[D].Stanford:Stanford University,1991.
[15]禹磊,唐碩.基于貝葉斯網(wǎng)絡(luò)模型的導(dǎo)彈防御效能評(píng)估研究[J].飛行器測控學(xué)報(bào),2012,31(5):89-94.