虞業(yè)濼,施敏華,鄧洛鳳,楊 萍,鄭倩云
(1.中國科學(xué)院微小衛(wèi)星創(chuàng)新研究院,上海 201203;2.上海微小衛(wèi)星工程中心,上海 201203;3.中國人民解放軍63921部隊,北京 100094)
衛(wèi)星裝備試驗鑒定階段包括性能試驗、作戰(zhàn)試驗、在役考核,每個階段均會產(chǎn)生大量重要的試驗數(shù)據(jù),由于衛(wèi)星裝備的這些試驗鑒定數(shù)據(jù)分散保存在不同單位、不同部門、不同計算機和存儲介質(zhì)上,且數(shù)據(jù)類型多樣、數(shù)據(jù)格式不一致,導(dǎo)致試驗鑒定數(shù)據(jù)的有效利用率低,原始數(shù)據(jù)與試驗相關(guān)其它數(shù)據(jù)信息脫節(jié),大量的試驗數(shù)據(jù)無法利用或無法有效關(guān)聯(lián)使用,存在嚴(yán)重的信息孤島現(xiàn)象,并且試驗鑒定數(shù)據(jù)中包括了有效數(shù)據(jù)及大量無效數(shù)據(jù)[1-2]。而衛(wèi)星裝備的試驗鑒定評價工作的開展對于裝備能力、性能滿足度、在役適用性等多項指標(biāo)具有實際意義,因此需針對衛(wèi)星裝備試驗鑒定數(shù)據(jù)確定健全合適的數(shù)據(jù)質(zhì)量檢驗方法,剔除無用數(shù)據(jù),確保衛(wèi)星試驗鑒定數(shù)據(jù)干凈整齊高質(zhì)量;并進一步建立數(shù)據(jù)質(zhì)量的評價的體系和方法,使用合理的數(shù)據(jù)質(zhì)量評價方式完成多維數(shù)據(jù)質(zhì)量評價,為后續(xù)衛(wèi)星裝備試驗鑒定評估工作獲得準(zhǔn)確的結(jié)果提供前期保障。
衛(wèi)星裝備試驗鑒定數(shù)據(jù)來源多樣且存在數(shù)據(jù)缺失、數(shù)據(jù)異常、數(shù)據(jù)冗余、數(shù)據(jù)格式不規(guī)范或精度不統(tǒng)一等問題,無法直接通過常規(guī)質(zhì)量評價方式方法完成評價[3-4]。因此,針對衛(wèi)星裝備試驗鑒定數(shù)據(jù)的特點,提出兩級遞進式的數(shù)據(jù)質(zhì)量評價流程,如圖1所示。第一級規(guī)定需要進行計算評價的數(shù)據(jù)集合,通過批處理和流模式兩種數(shù)據(jù)質(zhì)量初檢方式從多個維度對目標(biāo)數(shù)據(jù)進行統(tǒng)一、規(guī)整并給出初步質(zhì)量評價;第二級以衛(wèi)星試驗鑒定數(shù)據(jù)質(zhì)量評價體系為基礎(chǔ),建立針對某種衛(wèi)星的具體評價指標(biāo),根據(jù)選取的評價指標(biāo)建立評價規(guī)則,按照指標(biāo)權(quán)重確定的方法確定指標(biāo)權(quán)重和期望,并計算數(shù)據(jù)質(zhì)量綜合評估得分。通過定性定量結(jié)合的方式完成衛(wèi)星裝備試驗鑒定數(shù)據(jù)質(zhì)量的評價。
整個數(shù)據(jù)質(zhì)量評價實現(xiàn)主要分為以下兩個步驟:
第一步是初檢-數(shù)據(jù)質(zhì)量篩選評價:多源異構(gòu)衛(wèi)星裝備試驗鑒定數(shù)據(jù)在完成格式統(tǒng)一轉(zhuǎn)換后并不能直接進行數(shù)據(jù)質(zhì)量評價,需要在該過程下從數(shù)據(jù)完整性、準(zhǔn)確性、一致性、冗余性和及時性等多個維度對數(shù)據(jù)質(zhì)量進行篩選評價,從而提升后續(xù)使用數(shù)據(jù)的準(zhǔn)確性、可信度[5-7]。
其工作流程如下所示:
1)數(shù)據(jù)注冊。將轉(zhuǎn)換后或能夠支持試驗鑒定工作開展的待使用數(shù)據(jù)進行統(tǒng)一注冊;
2)數(shù)據(jù)度量標(biāo)準(zhǔn)。制定數(shù)據(jù)質(zhì)量度量標(biāo)準(zhǔn),針對單一裝備或衛(wèi)星關(guān)鍵器部件人為設(shè)定數(shù)據(jù)度量或準(zhǔn)入標(biāo)準(zhǔn);
3)數(shù)據(jù)質(zhì)量篩選。在統(tǒng)一的數(shù)據(jù)度量標(biāo)準(zhǔn)下,利用自定義數(shù)據(jù)質(zhì)量篩選算法,從:完整性、準(zhǔn)確性、一致性、冗余性、及時性等維度對數(shù)據(jù)開展定性定量相結(jié)合的質(zhì)量篩選;
4)數(shù)據(jù)檢查評價。對完成質(zhì)量篩選后的數(shù)據(jù)進行二次檢查,以原始數(shù)據(jù)為參考,對數(shù)據(jù)處理前后各維度下的量化值進行打分評價,評價準(zhǔn)則支持定性定量兩種方式;
5)數(shù)據(jù)下放。對完成初檢的數(shù)據(jù)給出第一次維度質(zhì)量評價,并對符合篩選標(biāo)準(zhǔn)的數(shù)據(jù)進行下放至第二步數(shù)據(jù)復(fù)檢使用。
初檢流程實現(xiàn)如圖2所示。
第二步是復(fù)檢-數(shù)據(jù)質(zhì)量評價體系及方法:影響衛(wèi)星裝備試驗鑒定數(shù)據(jù)質(zhì)量評價的因素多而復(fù)雜,較之前述第一步中完整性等有限維度評價而言,試驗鑒定數(shù)據(jù)的后續(xù)評價仍然涉及到多個方面,因此引入多層樹形指標(biāo)體系來分析,數(shù)據(jù)質(zhì)量評價指標(biāo)的選取可以依據(jù)實際衛(wèi)星裝備特性、平臺甚至試驗任務(wù)等進行調(diào)整,指標(biāo)的設(shè)立能夠全面地反映數(shù)據(jù)的客觀真實情況,且合理和可操作性。完成指標(biāo)體系構(gòu)建之后,采用多因素層次分析法,并確定多因素模糊隸屬度,最終進行評價,最后完成綜合評價[8-9]。
數(shù)據(jù)質(zhì)量評價體系及方法具體實現(xiàn)步驟如下所示:
1)確定評價數(shù)據(jù)對象。按照衛(wèi)星裝備特性、衛(wèi)星平臺、試驗任務(wù)等不同,對評估的數(shù)據(jù)質(zhì)量對象進行梳理劃分。
2)評價指標(biāo)的選取。根據(jù)被評價數(shù)據(jù)對象,選取合適的指標(biāo),形成數(shù)據(jù)質(zhì)量評價指標(biāo)體系。
3)確定評價指標(biāo)權(quán)重及隸屬度。利用層次分析法來計算數(shù)據(jù)質(zhì)量判斷時所用的指標(biāo)的權(quán)值,其與數(shù)據(jù)質(zhì)量的關(guān)聯(lián)度成正比。結(jié)合衛(wèi)星裝備試驗鑒定各項數(shù)據(jù)關(guān)聯(lián)度極高的特點,選取多因素模糊隸屬度集合。
4)試驗鑒定數(shù)據(jù)評價。根據(jù)數(shù)據(jù)質(zhì)量的評價指標(biāo)和規(guī)則集中的每條評價規(guī)則,計算得到最終試驗鑒定數(shù)據(jù)的評價結(jié)果。
5)試驗鑒定數(shù)據(jù)質(zhì)量分析。依據(jù)第一、二項的數(shù)據(jù)結(jié)果,給出試驗鑒定數(shù)據(jù)質(zhì)量綜合分析結(jié)果。
圍繞衛(wèi)星裝備試驗鑒定數(shù)據(jù)質(zhì)量評價所涉及的初檢及復(fù)檢兩個過程開展數(shù)據(jù)質(zhì)量評價算法實現(xiàn)。初檢數(shù)據(jù)質(zhì)量篩選評價,主要包括從數(shù)據(jù)完整性、準(zhǔn)確性、一致性、冗余性、有效性和及時性等多個維度對數(shù)據(jù)質(zhì)量進行篩選評價。結(jié)合衛(wèi)星裝備試驗鑒定數(shù)據(jù)多維關(guān)聯(lián)性極強的實際特點,選取關(guān)聯(lián)決策樣本計算、數(shù)據(jù)完整檢測計算等方法實現(xiàn);復(fù)檢數(shù)據(jù)質(zhì)量評價則包含基于多因素模糊推理及綜合層級分析等算法[10-12]。
衛(wèi)星裝備試驗鑒定過程中產(chǎn)生的數(shù)據(jù)完整性的判別主要通過星-地數(shù)據(jù)發(fā)送-接收數(shù)據(jù)完整檢測來實現(xiàn)。由于通信干擾、數(shù)據(jù)丟失等原因造成的部分試驗鑒定數(shù)據(jù)丟失或無法使用的情況,需要對實際數(shù)據(jù)進行完整性計算。設(shè)定星上實際下傳數(shù)據(jù)包(數(shù)量)為D,實際采集(解析)得到的數(shù)據(jù)為D1,采集(解析)得到但為空值數(shù)據(jù)為D2,在完成數(shù)據(jù)統(tǒng)計后,可以得到數(shù)據(jù)的完整性占比為:
式中,CWZ為數(shù)據(jù)完整性,其結(jié)果表針衛(wèi)星裝備試驗鑒定待評價數(shù)據(jù)的完整性占比,可以通過專家經(jīng)驗或總師定義數(shù)據(jù)完整性占比下限,若數(shù)據(jù)完整性不達(dá)標(biāo),則直接對該組數(shù)據(jù)進行棄用,不進入后續(xù)數(shù)據(jù)質(zhì)量復(fù)檢評價。
衛(wèi)星裝備試驗鑒定數(shù)據(jù)的準(zhǔn)確性計算需要將數(shù)據(jù)與具體裝備特性進行結(jié)合并建立關(guān)聯(lián)判別。算法首先完成裝備與其對應(yīng)標(biāo)準(zhǔn)數(shù)據(jù)范圍信息值獲取,并將多類數(shù)據(jù)進行樣本集合,將樣本集劃分為k個不同的類Li(i=1,2,…,k),每個不同的類Li含有的樣本數(shù)目為ni,所有的樣本數(shù)目ni均代表該數(shù)據(jù)所對應(yīng)在準(zhǔn)確范圍內(nèi)的值。計算得到衛(wèi)星裝備試驗鑒定數(shù)據(jù)D按照準(zhǔn)確性劃分為k個類的對應(yīng)信息熵計算值為:
式中,pi=ni/n為衛(wèi)星裝備試驗鑒定數(shù)據(jù)D樣本中第i個類Li對應(yīng)在準(zhǔn)確范圍內(nèi)的概率。
考慮到衛(wèi)星裝備試驗鑒定數(shù)據(jù)的需要按照不同的衛(wèi)星、平臺及試驗任務(wù)會具備不同的分類屬性Ti(i=1,2,…,m),Dj是D中屬性Ti樣本值有j個的樣本子集,則屬性Ti的信息熵為:
式中,Info(Dj)為Dj劃分到各個試驗鑒定數(shù)據(jù)落于準(zhǔn)確性屬性的信息熵。
利用結(jié)合具體裝備特性關(guān)聯(lián)后獲取的數(shù)據(jù)準(zhǔn)確度信息熵及對應(yīng)試驗屬性Ti的信息熵,可以得到進一步計算得到試驗鑒定數(shù)據(jù)的準(zhǔn)確度占比為:
式中,CZQ為衛(wèi)星試驗鑒定數(shù)據(jù)的準(zhǔn)確性。
分析衛(wèi)星裝備試驗鑒定數(shù)據(jù)的特點,以遙測數(shù)據(jù)為例,橫向為具體的遙測量,縱向為遙測量對應(yīng)的遙測數(shù)據(jù)量,該數(shù)據(jù)量會根據(jù)衛(wèi)星運行時間產(chǎn)生一定的變化,但變化都在一定閾值范圍中,不會特別大,當(dāng)運行過程中存在變化非常大的值時,可以在大概率上判斷為異常值。因此,衛(wèi)星試驗鑒定數(shù)據(jù)一致性的判別主要依據(jù)衛(wèi)星試驗數(shù)據(jù)的偏離度大小來實現(xiàn)。實現(xiàn)步驟如下:
1)利用最小二乘法對相應(yīng)遙測量的數(shù)據(jù)按照時間順序進行排序;
2)利用基于多項式的最小二乘曲線擬合模型完成排序后的衛(wèi)星試驗數(shù)據(jù)擬合。
建立擬合結(jié)果與真實遙測值之間的偏離度,最后根據(jù)偏離的情況來判斷衛(wèi)星試驗鑒定數(shù)據(jù)的一致性。
偏離度序列Dei的計算如下所示:
式中,DFY為試驗數(shù)據(jù)集中參照一致性計算后異常個數(shù);D為試驗數(shù)據(jù)總數(shù),CYZ為衛(wèi)星試驗鑒定數(shù)據(jù)的一致性計算結(jié)果。
衛(wèi)星試驗鑒定數(shù)據(jù)及時性的判別根據(jù)數(shù)據(jù)更新的時間與規(guī)定更新時間的差值來實現(xiàn)。各個數(shù)據(jù)包的規(guī)定的更新時間存在一定測差異,如平臺實時1 s包更新時間為1 s,平臺實時4 s包更新時間為4 s,設(shè)定一個時間差閾值ΔTSJ,當(dāng)實驗數(shù)據(jù)的更新時間與規(guī)定更新時間差值大于指定時間差閾值ΔTSJ,則將該試驗數(shù)據(jù)判斷為傳輸不及時,最終統(tǒng)計得到試驗數(shù)據(jù)及時度占比:
式中,DSJ為數(shù)據(jù)在指定時間差閾值ΔTSJ下更新不及時的個數(shù);D為數(shù)據(jù)樣本總數(shù),CJS為衛(wèi)星試驗鑒定數(shù)據(jù)的及時性。
分析衛(wèi)星裝備試驗數(shù)據(jù),以遙測數(shù)據(jù)為例可知每一行的數(shù)據(jù)不可能完全相同,主要表現(xiàn)在時間的不同,通過對時間的判斷確定是否為冗余數(shù)據(jù),在記錄冗余后,統(tǒng)計得到試驗鑒定數(shù)據(jù)的記錄冗余占比如下所示:
式中,DRE為試驗鑒定數(shù)據(jù)集中的得到的冗余數(shù)據(jù)個數(shù);D為試驗數(shù)據(jù)綜述,CRY為數(shù)據(jù)冗余性計算結(jié)果。
針對衛(wèi)星裝備試驗鑒定數(shù)據(jù)質(zhì)量復(fù)檢評價需求,結(jié)合衛(wèi)星試驗鑒定多項數(shù)據(jù)存在的潛在多級關(guān)聯(lián)因素。如,試驗任務(wù)過程下的衛(wèi)星姿控星敏與陀螺、太敏與帆板等數(shù)據(jù)之間。引入多因素模糊推理,較之常規(guī)單因素模糊推理只對所屬同一上級指標(biāo)進行橫向模糊隸屬度實現(xiàn)不同,多因素模糊推理以衛(wèi)星裝備實際多關(guān)聯(lián)特性,在單因素模糊推理基礎(chǔ)上全面考慮整個同層級所有指標(biāo)間的相互關(guān)聯(lián)性。多因素模糊隸屬度指標(biāo):
D1={D11,D12,…,D1j}(j=12,…,n)
以標(biāo)準(zhǔn)樹形指標(biāo)拓?fù)潴w系為例,假設(shè)構(gòu)建其第二層級具有2項單列指標(biāo)A1、A2,同時A1指標(biāo)對應(yīng)所屬下級指標(biāo)為A11、A12;A2指標(biāo)對應(yīng)所屬下級指標(biāo)為A21、A22。先根據(jù)單因素模糊推理分別完成A11、A12及A21、A22進行排列,再在此基礎(chǔ)上,利用多因素模糊推理,對A11、A12、A21、A22這4個所屬兩類分項指標(biāo)下的不同指標(biāo)分別進行兩兩比對得到比對定量值,記該層級模糊隸屬度值D3為:D31、D32、D33、D34、D35、D36。同時將所得結(jié)果按照大小順序進行排序,最后獲得的多因素模糊隸屬度集合D3={D34,D31,D32,D36,D35,D33}(D34>D31>D32>D36>D35>D33)。
待對衛(wèi)星裝備試驗鑒定數(shù)據(jù)建立指標(biāo)體系后,通過多因素模糊推理算法完成隸屬度計算后,計算實現(xiàn)按照自底向上進行,假設(shè)最底層指標(biāo)權(quán)重分配矩陣為Z、單因素模糊隸屬矩陣為N,同時利用多因素模糊推理下經(jīng)過兩兩比較后所獲取的差異量化加權(quán)值Q對單因素模糊隸屬矩陣進行最優(yōu)至最劣對應(yīng)加權(quán)值調(diào)整,最終得到該層綜合評價結(jié)果為S*=Z×(N+“Q”)。同時將下一層級計算獲得的綜合評價結(jié)果S作為上層級計算所需的權(quán)重矩陣Z。向上層級運算直至頂層,最終所獲取的定量綜合評判結(jié)果為Sfin[10]。
選取某衛(wèi)星在同等試驗任務(wù)條件背景下產(chǎn)生的試驗鑒定數(shù)據(jù)為例,對數(shù)據(jù)進行質(zhì)量評價。
數(shù)據(jù):測試時間為2019年6月2日,試驗數(shù)據(jù)為衛(wèi)星遙測數(shù)據(jù)1 s包,數(shù)據(jù)長度為82 431點,周內(nèi)秒從45 001~116 999,反應(yīng)的為衛(wèi)星執(zhí)行某試驗任務(wù)時的衛(wèi)星轉(zhuǎn)臺信息。數(shù)據(jù)如圖3所示。
利用所提出的初檢-復(fù)檢相結(jié)合的二級試驗鑒定數(shù)據(jù)質(zhì)量評價方法對上述某衛(wèi)星裝備試驗鑒定數(shù)據(jù)進行指令評價實現(xiàn)。
基于數(shù)據(jù)本身特性,由型號總師預(yù)設(shè)數(shù)據(jù)接收各項閾值。
完整性閾值:ΔTWZ≥95%;
準(zhǔn)確性閾值:ΔTZQ≥96%;
一致性閾值:ΔTYZ≥99.5%;
及時性閾值:ΔTJS≥90%;
冗余性閾值:ΔTRY≤0.5%。
在此閾值基礎(chǔ)上,分項計算各項初檢數(shù)據(jù)篩選值。數(shù)據(jù)在一秒包記錄單項數(shù)據(jù)的情況下,設(shè)定標(biāo)準(zhǔn)長度為83 000點,實際數(shù)據(jù)經(jīng)檢查獲取長度為82 431點,其中空值61點,數(shù)據(jù)量值完整性計算值為:
(82 431-61)/83 000*100%≈99.2%
1 s包數(shù)據(jù)包含試驗數(shù)據(jù)類型17類,每類含有的樣本數(shù)目約為4 848,經(jīng)與型號各項標(biāo)準(zhǔn)閾值比對,所獲取的17類數(shù)據(jù)落于標(biāo)準(zhǔn)閾值范圍內(nèi)的概率:
p17={0.996,0.991,0.994,0.994,0.989,0.992,0.999,0.990,0.997,0.996,0.994,0.994,0.996,0.991,0.988,0.996,0.995}
計算獲得對應(yīng)信息熵計算值:
Info(D)=0.085, Info(D,T)=0.082
進一步計算得到準(zhǔn)確性計算值為:
(0.082/0.085)*100%≈96.4%
通過最小二乘法對該試驗鑒定數(shù)據(jù)進行計算,選取4次多項式擬合函數(shù),α0=3,α1=2,α2=-1,α3=0.5,α4=0.8,即:
y=0.8x4+0.5x3-x2+2x+3
擬合計算得到偏離度Ai處于{0,0.007}范圍內(nèi),對應(yīng)數(shù)據(jù)樣本計算得到:
CYZ=(1-577/82431)*100%≈99.3%
檢查衛(wèi)星遙測1 s包數(shù)據(jù)星地傳輸時間欄信息,配合指定時間差閾值ΔTsj=0.000 01,計算得到CJS=100%,當(dāng)前處理數(shù)據(jù)全部符合時間閾值約束;同時,與遙測標(biāo)準(zhǔn)幀結(jié)構(gòu)比對得到,該組數(shù)據(jù)中不存在重復(fù)數(shù)據(jù),CRY=0。全部初檢數(shù)據(jù)篩選值與預(yù)先設(shè)置的閾值比較均滿足,通過初檢,可以進入復(fù)檢階段。
針對所選取的某衛(wèi)星試驗任務(wù)數(shù)據(jù),在復(fù)檢過程中先進行指標(biāo)體系預(yù)建,如圖4所示。
利用所建設(shè)的指標(biāo)體系進行評價計算,首先分配各層級所對應(yīng)的任務(wù)指標(biāo)權(quán)重矩陣,設(shè)定二級、三級指標(biāo)權(quán)重矩陣為W2,W3。其具體權(quán)重值設(shè)定如表1、表2所示。將數(shù)據(jù)質(zhì)量分為“I、II、III、VI、V”5個層次。分別對應(yīng)模糊推理中的{很好、好、一般、較差、差},本例設(shè)定三級指標(biāo)層模糊向量的單因素評判矩陣R3如表3所示。
表1 二級指標(biāo)權(quán)重向量劃分
表3 單因素評判矩陣R2
計算過程自底向上進行,以最底層模糊向量隸屬度為行,并作為其上一級指標(biāo)評判矩陣,即:
Rn-1=Rn×Wn(n≥2)
同時通過專家或經(jīng)驗系統(tǒng)梳理多指標(biāo)因素之間的加權(quán)數(shù)值為多因素模糊隸屬度量化加權(quán)指標(biāo),本例設(shè)定Q3={0.25(R34),0.02(R32),0.01(R37),0.00(R31),-0.01(R35),-0.02(R33),-0.25(R36)}。依據(jù)S*=Z×(N+“Q”)層層計算,最終得到評價結(jié)果Sfin={0.171,0.324,0.138,0.131,0}。分析最終結(jié)果,得到其最終評價隸屬度項表示約32.4%的專家認(rèn)為經(jīng)過二級數(shù)據(jù)質(zhì)量評價后,該組衛(wèi)星裝備試驗鑒定數(shù)據(jù)結(jié)果為II級對應(yīng)“好”??梢愿鶕?jù)實際定義最終確定是否將數(shù)據(jù)繼續(xù)用于后續(xù)試驗鑒定工作使用。
數(shù)據(jù)質(zhì)量評價技術(shù)的探索是以提高衛(wèi)星裝備試驗鑒定數(shù)據(jù)質(zhì)量為目的,對試驗鑒定過程中需要使用的數(shù)據(jù)進行二級質(zhì)量評價,通過標(biāo)準(zhǔn)化數(shù)據(jù)質(zhì)量篩選初檢及構(gòu)建數(shù)據(jù)質(zhì)量評價指標(biāo),并對評價指標(biāo)進行配置,從不同試驗?zāi)繕?biāo)對衛(wèi)星裝備試驗鑒定數(shù)據(jù)進行整體把關(guān)。不過,數(shù)據(jù)質(zhì)量評價應(yīng)用于試驗鑒定領(lǐng)域仍然需要結(jié)合裝備特性、數(shù)據(jù)本身特性在方法側(cè)、指標(biāo)側(cè)等多方面進行繼續(xù)研究。二級數(shù)據(jù)質(zhì)量評價方法的提出不一定能100%應(yīng)對所有衛(wèi)星裝備試驗鑒定數(shù)據(jù)的質(zhì)量評價工作,但該方法的提出是對傳統(tǒng)分立、單一且不成體系的數(shù)據(jù)質(zhì)量評價的一種創(chuàng)新嘗試,具有一定的新意及實際研究價值。