田珂,常華俊
(中國人民解放軍63861部隊,吉林 白城 137001)
靶場試驗中,初速雷達相對火炮的布站位置決定著雷達的測速精度,而布站位置更多的是取決于參試人員的參試經(jīng)驗,具有一定隨意性。為了更加科學(xué)準確地選擇雷達布站的位置,提高雷達測速精度,選擇采用Apriori關(guān)聯(lián)規(guī)則算法從大量的歷史試驗數(shù)據(jù)中挖掘出能保證雷達測速精度最高時的布站位置。因為關(guān)聯(lián)規(guī)則適用于挖掘出影響某一指標的其他因素,可以為裝備試驗提供重要依據(jù)[1]。當雷達、火炮和外界因素均良好時,影響初速雷達測速精度的因素就是雷達相對火炮的布站位置,所以選擇把雷達相對火炮的布站位置作為關(guān)聯(lián)規(guī)則的左側(cè)規(guī)則,彈丸的炮口初速精度作為關(guān)聯(lián)規(guī)則的右側(cè)規(guī)則,利用Apriori關(guān)聯(lián)規(guī)則算法挖掘出測速精度最高時兩者之間的頻繁項集,為科學(xué)合理的選擇雷達布站位置提供重要依據(jù)。通過實測數(shù)據(jù)進行實驗驗證的結(jié)果表明,利用挖掘出的強關(guān)聯(lián)規(guī)則進行雷達布站,測試出的彈丸初速的精度有明顯提升。
Apriori算法是最常用的關(guān)聯(lián)規(guī)則挖掘算法,是由Rakesh Agrawal博士和Ramakrishnan Srikant博士于1990年聯(lián)合提出的[2],是一種逐層搜索的迭代方法。其核心思想是通過連接產(chǎn)生候選項及其支持度,然后通過剪枝生成頻繁項集。具體的原理是,如果一個項目是頻繁的,那么它的所有子集都是頻繁的;同理,如果一個項目是非頻繁的,那么它的所有子集也都是非頻繁的。
項集A和項集B同時發(fā)生的概率稱為關(guān)聯(lián)規(guī)則的支持度;如果項集A發(fā)生,則項集B發(fā)生的概率稱為關(guān)聯(lián)規(guī)則的置信度。支持度和置信度是衡量關(guān)聯(lián)規(guī)則的兩個重要指標[3]。支持度和置信度通常會設(shè)置一個閾值,分別為最小支持度閾值和最小置信度閾值。最小支持度表示項目集的最低重要性,最小置信度表示關(guān)聯(lián)規(guī)則的最低可靠性[4],只有同時滿足最小支持度閾值和最小置信度閾值的關(guān)聯(lián)規(guī)則被稱為強規(guī)則,這也是Apriori關(guān)聯(lián)規(guī)則算法挖掘的目標。
Apriori關(guān)聯(lián)規(guī)則算法是找出存在于事務(wù)數(shù)據(jù)集中的最大頻繁項集,然后利用得到的最大頻繁項集與預(yù)先設(shè)定的最小支持度閾值和最小置信度閾值生成強關(guān)聯(lián)規(guī)則。Apriori關(guān)聯(lián)規(guī)則算法運行的具體過程如圖1所示。
1)努力搜索找出事務(wù)數(shù)據(jù)集中所有的頻繁項集,這些頻繁項集的支持度必須大于等于給定的最小支持度閾值,直到找到最大頻繁項集為止。具體分為連接步和剪枝步,連接步的最終目的是找到最大頻繁項集,剪枝步就是剔除所有非頻繁的候選項集[5]。
2)由頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則,在過程1)中未達到預(yù)設(shè)的最小支持度閾值的項集已被剔除,剩下的就是同時滿足最小支持度閾值和最小置信度閾值的強關(guān)聯(lián)規(guī)則[6]。
初速雷達參與試驗時,在雷達、火炮以及所有外界因素均良好的情況下,雷達相對火炮的布站地點直接影響雷達的測速精度,其中影響最大的3個因素就是雷達距離火炮的后正、左正和下正,而同一試驗中雷達相對火炮的下正是固定不變的,只有后正和左正會因雷達布站的不同而發(fā)生變化,所以只研究雷達相對火炮的后正和左正對彈丸初速精度的影響。試驗時,雷達與火炮及射擊的目標靶之間的關(guān)系如圖2所示,由于雷達通常架設(shè)在火炮的側(cè)后方,雷達相對火炮的后正是指火炮耳軸到雷達天線面的水平垂直距離y,雷達相對火炮的左正是指雷達天線面的中心點到火炮身管后方延伸線的水平垂直距離x,雷達相對火炮的下正是指雷達天線面中心點距離地面的垂直距離減去火炮耳軸距離地面的垂直距離z。為了充分展示利用Apriori算法挖掘出雷達后正、左正與測速準確性之間關(guān)系的過程,選取某型初速雷達歷史實測數(shù)據(jù)進行挖掘,具體如表1所示。
續(xù)表1
從圖2中可以看出,雷達A在雷達B的左側(cè),短虛線之間是雷達A輻射的電磁波的照射范圍,長虛線之間是雷達B輻射的電磁波的照射范圍,火炮發(fā)射的彈丸在雷達B的電磁波束中的飛行時間要長于在雷達A的電磁波束中的飛行時間,所以雷達B測試的彈丸的徑向速度更加完整,擬合遞推出的初速數(shù)據(jù)更加準確,所以雷達B的測試狀態(tài)要好于雷達A,因此把雷達B的初速數(shù)據(jù)作為對比數(shù)據(jù)。表1中包含了彈序、雷達A的后正和左正的布站坐標、雷達A和雷達B測試的彈丸初速、雷達A相對于雷達B的誤差,以及雷達A相對雷達B的初速準確性。根據(jù)初速雷達本身的測速精度要求,試驗當中兩臺雷達的測速誤差最多不能大于2‰,所以根據(jù)表1把兩臺雷達的誤差設(shè)置為:如果雷達A相對雷達B的誤差絕對值小于等于雷達B初速的1‰,則雷達A初速的準確性設(shè)為“很好”;如果雷達A相對雷達B的誤差絕對值大于雷達B初速的1‰,且小于等于雷達B初速的1.5‰,則雷達A初速的準確性設(shè)為“好”;如果雷達A相對雷達B的誤差絕對值大于雷達B初速的1.5‰,且小于等于雷達B初速的2‰,則雷達A的初速準確性設(shè)為“一般”;如果雷達A相對雷達B的誤差絕對值大于雷達B初速的2‰,則雷達A的初速準確性設(shè)為“差”。
從表1中可以看出,雷達A的布站地點與雷達A測速準確性之間是存在一定關(guān)聯(lián)關(guān)系的,有的是強關(guān)聯(lián),有的是弱關(guān)聯(lián)。為了排除偶然性,挖掘出一般規(guī)律,選擇利用Apriori算法挖掘出雷達A的布站地點與雷達A測速準確性之間的強關(guān)聯(lián)規(guī)則,為該類型試驗進行雷達布站提供標準的布站模式[7]。根據(jù)表1中雷達A的后正和左正具體數(shù)據(jù),選擇把雷達A的后正和左正按照表2的形式進行區(qū)間分類。
表2 雷達A后正和左正不同范圍對應(yīng)的類別
將雷達A的后正和左正當作關(guān)聯(lián)規(guī)則的左側(cè)規(guī)則,將雷達A測速的準確性當作關(guān)聯(lián)規(guī)則的右側(cè)規(guī)則,構(gòu)建出雷達A相對火炮的后正和左正與雷達A測試彈丸初速準確性之間的對應(yīng)關(guān)系[8]。將表1作為歷史數(shù)據(jù),利用Apriori關(guān)聯(lián)規(guī)則算法挖掘出雷達A的后正、左正與測速準確性之間的關(guān)系時,選擇把支持度設(shè)為0.1,置信度設(shè)為0.95,通過挖掘得到了12條關(guān)聯(lián)規(guī)則[9],如表3所示。
表3 Apriori關(guān)聯(lián)規(guī)則算法挖掘結(jié)果
從表3的結(jié)果可以看出,所有關(guān)聯(lián)規(guī)則的支持度均為10%,置信度均為100%,都符合所設(shè)置的最小支持度閾值和最小置信度閾值,但是只有提升度大于1的強關(guān)聯(lián)規(guī)則是有效的[10]。結(jié)合開展試驗的實際情況可以確定,只有強關(guān)聯(lián)規(guī)則{A6,B3}?{很好}和{A3,B2}?{很好}是符合實際需求的,即這兩個規(guī)則才是挖掘的目標規(guī)則。即當后正處于(7,8]之間、左正處于(4,5]之間時,或者后正處于(4,5]之間、左正處于(3,4]之間時,雷達A的測速準確性為“很好”的可能性為10%,這種情況發(fā)生的可能性[11]為100%。這兩種規(guī)則的使用情況分別為:因為雷達與火炮的射角是一樣的,當火炮的射角不是很高時,為了確保雷達波束能夠長時間照射到彈丸,雷達的后正和左正都要大一些,此時采用關(guān)聯(lián)規(guī)則{A6,B3}?{很好}進行雷達布站;當火炮的射角很高時,雷達就要離火炮近一些,保證彈丸一出炮口就進入雷達波束并在雷達波束中飛行時間長一些,就要采用關(guān)聯(lián)規(guī)則{A3,B2}?{很好}進行雷達布站。
實際上,表1中所列舉的是某型試驗中雷達A和雷達B共同測試的70發(fā)初速數(shù)據(jù),每7發(fā)為一組,從第1組數(shù)據(jù)到第10組數(shù)據(jù),雷達A相對雷達B的平均相對誤差分別為0.113%、0.063%、0.157%、0.079%、0.041%、0.081%、0.099%、0.083%、0.088%、0.207%。關(guān)聯(lián)規(guī)則{A6,B3}?{很好}對應(yīng)的是第2組數(shù)據(jù),雷達A對雷達B的平均相對誤差為0.063%;關(guān)聯(lián)規(guī)則{A3,B2}?{很好}對應(yīng)的是第5組數(shù)據(jù),雷達A對雷達B的平均相對誤差為0.041%,這兩個規(guī)則的平均相對誤差均小于1‰,也是所有組數(shù)據(jù)中平均相對誤差最小的,也充分證明了挖掘出的兩個強關(guān)聯(lián)規(guī)則是準確可靠的。繪制表1各項事務(wù)頻率分布的可視圖,如圖3所示,可以看出關(guān)聯(lián)規(guī)則{A3,B2}?{很好}、{A6,B3}?{很好}出現(xiàn)的頻率是最高的,這也更充分說明挖掘出的兩個關(guān)聯(lián)規(guī)則是準確可信的。
實驗驗證選擇在RStudio軟件環(huán)境下進行數(shù)據(jù)分析、統(tǒng)計建模及數(shù)據(jù)可視化。為了驗證所挖掘出的關(guān)聯(lián)規(guī)則的準確性,針對同一試驗任務(wù),利用規(guī)則{A3,B2}?{很好}進行布站,對得到的測試數(shù)據(jù)進行驗證。測試數(shù)據(jù)如表4所示,表中誤差指的是雷達A相對于雷達B的誤差。雷達A與雷達B測試的初速數(shù)據(jù)的實測值關(guān)系曲線如圖4所示。
表4 測試數(shù)據(jù)
從表4和圖4可以看出,當采用關(guān)聯(lián)規(guī)則{A3,B2}?{很好}進行雷達布站時,測試的7發(fā)彈丸的初速數(shù)據(jù)中,雷達A相對雷達B的準確性為“很好”的可能性為57.1%,準確性為“好”的可能性為42.9%,兩者加起來的可能性為100%,沒有準確性為“差”和“一般”的結(jié)果,而且支持度明顯大于10%。雷達A相對雷達B測試的7發(fā)彈丸的初速數(shù)據(jù)的平均相對誤差為0.075%,遠小于1‰,整體的準確性為“很好”,同時也小于表3中除了挖掘出的兩個關(guān)聯(lián)規(guī)則以外的數(shù)據(jù)的平均相對誤差,表明按照所挖掘出的關(guān)聯(lián)規(guī)則進行雷達布站,有效提高了雷達的測速精度。
由于利用初速雷達測試彈丸初速的試驗中,確定雷達布站地點依靠的是參試人員的經(jīng)驗,導(dǎo)致雷達布站具有一定隨意性,雷達的測試準確性時好時壞,所以選擇將雷達的布站地點與測試準確性對應(yīng)起來,將布站地點作為左側(cè)規(guī)則、測試準確性作為右側(cè)規(guī)則,利用Apriori算法從歷史數(shù)據(jù)中挖掘出當雷達測試準確性為“很好”時對應(yīng)的布站地點,然后按照挖掘出的雷達布站地點進行試驗并獲取到實測初速數(shù)據(jù)。經(jīng)過計算發(fā)現(xiàn)獲取的實測初速數(shù)據(jù)的平均相對誤差小于1‰,整體的準確性為“很好”,沒有“一般”和“差”的情況,說明所采用的方法能夠提升雷達的測試精度。