劉新海 馬彥恒 侯建強
摘要:針對裝備認知測試性智能決策問題,提出基于云和頻繁項集的認知測試性診斷方案權衡優(yōu)化方法。研究裝備認知測試性中信息流在定性域和定量域的描述和轉換方法,給出基于數據概要的中心云產生方法,實現事務數據清洗與篩選;研究基于頻繁項集和新增項集的數據挖掘方法,提出基于2一范數及協方差的數據相關性分析方法,實現基于云和頻繁項集的認知測試性診斷方案權衡優(yōu)化的數據挖掘過程:得到基于存儲層一云層一應用層一決策層的認知測試性仿真診斷與權衡優(yōu)化模型,并對該模型進行補充說明。該方案可為裝備認知測試性診斷方案權衡優(yōu)化的智能化發(fā)展奠定基礎。
關鍵詞:認知測試性;云;頻繁項集;數據挖掘;診斷方案
0引言
由于現代戰(zhàn)爭多維度、一體化、快節(jié)奏、即時精確打擊的特點以及無人化作戰(zhàn)的發(fā)展趨勢,對作戰(zhàn)裝備的故障診斷與維修要求已從注重隔離故障、降低裝備全壽命周期費用,轉變?yōu)閺娬{基于狀態(tài)的預測性視情維修,滿足裝備的任務可靠性需求。
裝備認知測試性的發(fā)展?jié)M足了這一要求。在裝備測試性設計階段,它不但要求裝備能夠提供裝備自身狀態(tài)、歷史信息、環(huán)境信息以及后方支援系統(tǒng)等信息,還要能綜合作戰(zhàn)使用要求、測試性要求、可靠性要求、維修性要求、保障要素等相關因素,對裝備的狀態(tài)、故障發(fā)展趨勢進行估計和判斷,并結合任務可靠性的需求,做出維修決策。
但是,裝備認知測試性的發(fā)展尚不完善,仍處于起步階段。其中,診斷方案綜合權衡優(yōu)化是根據裝備其履歷信息、認知測試性的指標體系和特征量信息、裝備保障信息以及任務環(huán)境信息等多元數據,分析裝備及作戰(zhàn)體系的當前狀態(tài),對裝備的測試性、維修性、保障性及任務可靠性進行預測,并給出任務決策方案的過程。本文針對認知測試性的發(fā)展,結合云計算理論和頻繁項集數據挖掘技術,研究裝備認知測試性發(fā)展中診斷方案的綜合權衡優(yōu)化問題。
1云計算理論和頻繁項集數據挖掘
裝備認知測試性診斷方案權衡優(yōu)化,包含大量的數據分析過程。這些數據不僅包含裝備本身的測試性數據,還包括裝備級聯、作戰(zhàn)體系、作戰(zhàn)環(huán)境、歷史信息、同型裝備信息、相關裝備信息、裝備保障信息、維修履歷信息、保障資源調度信息以及歷史決策信息等多方面,決策所需處理的信息巨大,具有大量化、多樣化和個性強等典型的大數據特點。因此,可以采用大數據思維,利用大數據技術,有效地開發(fā)這些數據,從而實現對診斷方案的綜合權衡和優(yōu)化。
利用大數據分析的方法可以實現裝備認知測試性中信息流的大數據特征融合、機器學習、數據降維和數據流挖掘等過程。其中基于云模型的大數據相關方法,能夠實現認知測試性信息流中定量數據和定性概念之間的轉換,便于診斷方案的定量化分析。
1.1云和云模型
云是對定性域實現定量描述的一種方法,云模型是云的一種具體實現。設U為定量域集合,C為其相應的定性域集合,如果Vx∈U都是對C的隨機實現,且x對C的確定度μ(x)∈[0,1]是有穩(wěn)定傾向的隨機數。
則x在U的分布稱為云,x稱為云滴。云理論通常用期望、熵和超熵3個特征量進行定量特征分析舊。在云計算中,通常有存儲層、端點云、中心層和應用層4部分結構。其中,存儲層采用分布式存儲的方式,是大數據存儲的理想模型:端點云則是對原始數據定量描述,產生端點云圖;中心層則是對端點云進行合并運算,用于產生、存儲中心云滴;應用層則主要實現對大數據的挖掘分析。
本文主要利用云計算中的分布式存儲和定量化描述過程,實現裝備認知測試性中對信息流的定量描述和分布式存儲。然后,結合數據挖掘方法對存儲數據進行中心云分層,實現對數據的挖掘分析,最終形成診斷方案。
1.2頻繁項集數據挖掘
頻繁項集挖掘是實現數據挖掘的有效方法之一。首先收集并清洗原始數據集(事務數據);然后統(tǒng)計各項集之間出現的次數,一般可取出現頻率靠前的項集作為頻繁項集。為提高頻繁項集的求解效率,常采用Apriori算法進行優(yōu)化。結合Apriori的頻繁項集挖掘算法包括事務數據清洗、1項集求解、k項集迭代求解的過程。
事務數據清洗是根據任務條件和實際環(huán)境,過濾不需要或者不符合要求的原始數據。
1項集求解是掃描每條事務數據記錄,分解出每一項,并計數1,最后統(tǒng)計每一項出現的總次數,取靠前的項集作為頻繁1項集。
k項集的求解中,k項集的生成依賴于k-1項集。若k-1項集完全自連接,則生成的候選k項集組合龐大,且容易生成部分無效k項集,降低算法效率,常采用Apriori算法對候選k項集生成過程進行優(yōu)化。Apriori算法優(yōu)化的基本原理如下:
1)頻繁項集的任何非空子集都是頻繁的。
2)非頻繁項集的任何超集都是非頻繁的。
生成k項集階段,包括了連接和剪枝過程,其中兩個k-1項集進行連接的條件是:它們至少有k-2項相同。
本文通過頻繁項集篩選實現診斷方案的測試性、可靠性和維修保障方案與歷史決策之間的學習分析過程。
2診斷方案權衡優(yōu)化方法
基于大數據的診斷方案權衡優(yōu)化技術在功能層面主要包括4個方面:供裝備作戰(zhàn)使用頂層要求的決策層分析、供本級狀態(tài)監(jiān)測使用的測試層分析、滿足裝備順利完成任務的可靠性分析、維修保障方案的方案分析。
在診斷方案權衡優(yōu)化中,云計算和云模型是將影響決策方案的所有定性量用定量域描述,定量域元素就組成了用于診斷方案權衡優(yōu)化的云滴。當前的任務需求可以產生數據概要,用于清洗云數據池,以便產生包含有效數據的中心云數據。通過頻繁項集和新增項集實現信息流數據的相關性分析,并給出合并分析相關方案。通過歷史決策方案及評價指標,構造代價函數對合并分析結果進行修正,然后給出決策分析的測試性分析結果、任務可靠性分析結果和裝備維修保障方案。最后,結合決策方案評價體系對決策方案進行優(yōu)化和評價。
如圖1所示,為認知測試性診斷方案權衡優(yōu)化圖。其云架構從功能上分為4層:頂層為數據存儲層:第2層為中心云發(fā)生層,其核心任務在于由原始數據產生各云端的云,即端點云;第3層為應用層,基于中心云滴和頻繁項集進行大數據分析和挖掘任務;第4層為決策層,用于產生診斷方案,并根據決策評價對決策進行優(yōu)化校正。
診斷方案權衡優(yōu)化具體過程為:首先根據當前任務需求生成數據概要,實現數據分類,用于決定數據池的容量:其次將數據概要發(fā)送至中心云端和數據池,利用云運算匹配操作產生中心云數字特征,用于最優(yōu)決策特征要求:然后根據中心云數字特征,利用頻繁項集和新增項集方法,調取認知測試性大數據信息,并施加數據相關性分析操作,用于數據挖掘實現決策權衡優(yōu)化。
3信息流和數據概要的定量化描述
3.1信息流的量化描述
在認知測試性中,裝備及其履歷信息流主要包括裝備的類型、生產廠家、批次、使用年限、壽命、維修履歷(故障率及故障分布)等內容。認知測試性信息流主要包括裝備本級的測試性指標信息。裝備保障信息流主要包括維修保障力量的部署、保障代價、保障資源、保障技術要求等內容。任務及環(huán)境信息流主要包括裝備需要進行的任務(教學、演習、作戰(zhàn)等)、試用環(huán)境(溫度、海拔、濕度、氣壓、風速、云雨等)。這些信息流都會對裝備的測試性、可靠性和維修保障方案產生影響,也是云平臺存儲的主要數據。在裝備認知測試性的診斷方案綜合權衡優(yōu)化中都需要進行定量化描述。
本文在進行信息流定量化描述的過程中,將信息流類型分為裝備本級信息流量化和裝備支援信息流量化兩類。其中,裝備支援信息流量化主要包含裝備及其履歷信息流的量化、裝備保障信息流的量化和任務及環(huán)境信息流的量化。裝備本級信息流的量化主要是認知測試性信息流的量化。兩者的差異主要在于信息流中特征量的分布不同。
在裝備支援信息流量化中,以裝備及其履歷信息流中的裝備類型為例分析。根據作戰(zhàn)體系的裝備類型差異,對裝備進行類型編號,本文編號時,根據裝備統(tǒng)計由簡到繁,由裝備對作戰(zhàn)體系功能性影響較小到功能性影響較大的原則。記云存儲平臺共統(tǒng)計了Ⅳ種裝備類型,在分布式存儲時,裝備及其履歷信息流中裝備類型則按照(1,2,…n…N)進行量化描述。為了統(tǒng)一化描述,將裝備類型信息定量描述進行歸一化,則記為
對裝備本級信息流的量化,以電子裝備認知測試性信息流中電壓值的分析為例。根據歷史統(tǒng)計信息,確定裝備正常工作時電壓值的變化范圍,并以正常狀態(tài)下測量值的期望和方差為準構建正態(tài)分布函數。記測量值為X(x1,x2,…x1),期望值為Ex,標準差為u,那么,電壓值的量化可以記為
根據第2節(jié)對云計算的分析,為更好地表示信息流的量化情況,需要對上述正態(tài)分布標準化,使得電壓值的量化分布服從標準正態(tài)分布,即:
根據裝備本級信息流的量化和裝備支援信息流的量化方法,就可以得到分布式存儲量化后的數據池原始數據信息。
3.2數據概要的量化描述
結合云計算理論和頻繁項集理論,本文的數據概要是依據當前的任務及環(huán)境信息流,產生用數字特征表征的數據池篩選條件,從而實現對事務數據的清洗,產生中心云。數據概要的作用是以0和1的形式,從云平臺大數據的數據池中,篩選出本次任務的關注重點和應用場景條件,表示如下:
對信息流量化產生的數據矩陣U而言,Data是與U同型的矩陣,當任務要求考慮某個信息流時,相應位置元素為1,當任務要求不考慮某個信息流時,該位置元素記為0。那么,利用數據概要對事務數據進行清洗的過程,實際上可以簡化為分布式矩陣U與數據概要Data元素的點乘,那么中心云數據可記為
4診斷方案權衡優(yōu)化過程
4.1頻繁項集與新增項集的產生
本文頻繁項集主要是根據歷史決策、歷史診斷及其評價所輸入的數據概要產生。根據數據概要產生的過程可知,數據概要主要描述當前的任務要求和環(huán)境因素,且數據概要為{0,1}矩陣。那么,頻繁項集的產生過程可描述為
為盡快實現方案的確定,本文認為元素值>1的項都可以作為頻繁項集數據概要的有效值。那么,頻繁項集篩選條件可表示如下:
4.2相關性分析
在完成頻繁項集和新增項集篩選的情況下,實現數據的相關性分析是實現診斷方案確定的關鍵過程之一。本文對于頻繁項集的相關性分析,采用歷史診斷方案數據的期望值矩陣與頻繁項集的2一范數表示,表征了當前任務頻繁項集與歷史決策的偏離度:
對于新增項集的相關性分析,采用新增項集的協方差矩陣表示,表征了新增項集對任務指標的影響:
通過頻繁項集和新增項集分析結果的合并,可以得到診斷方案的權衡優(yōu)化結果。
4.3方案優(yōu)化補充
通過上述分析,基本上形成了診斷方案權衡優(yōu)化的過程。但還需做如下說明:
1)本文對于數據概要未描述的數字特征采用最優(yōu)方案確定,不同任務背景可視情況而定。
2)在完成了數據的相關性分析后,基本上形成了決策方案。但是還需要結合決策方案的評價標準對方案進行優(yōu)化,其中評價標準和代價函數將在后續(xù)研究工作中完成。
3)針對信息流的量化問題,在不同的任務側重點可以采用不同的分布函數表示,相關內容將在后續(xù)的研究工作中進行,本文不再贅述。
5結束語
本文針對裝備認知測試性診斷方案權衡優(yōu)化問題展開研究,給出了基于云計算的信息流定量域與定性域轉化方法,并通過數據的相關性分析方法實現了診斷方案權衡優(yōu)化的數據挖掘過程,形成了基于云計算和頻繁項集的診斷方案權衡優(yōu)化方法,為裝備認知測試性診斷方案權衡優(yōu)化的智能化奠定了基礎。后續(xù)將針對診斷方案的評價標準和信息流量化的分布函數進行進一步研究。