沈文杰
(福建農(nóng)業(yè)職業(yè)技術(shù)學(xué)院 信息工程學(xué)院, 福建 福州 350119)
為了提高對多目標的檢測和參數(shù)識別能力,采用集成的多傳感信息處理方法進行目標數(shù)據(jù)采集和跟蹤,并結(jié)合對目標的探測回波模型進行目標檢測.通過對多目標分布狀態(tài)的特征檢測和信息重構(gòu),可以建立非平衡環(huán)境下多目標智能檢測模型.這樣可以提高對目標信息的檢測識別和方位估計能力.因此,研究相關(guān)的非平衡環(huán)境下多目標智能檢測方法對目標信號檢測識別具有重要意義[1-3].
對非平衡環(huán)境下多目標特征量的檢測是建立在對數(shù)據(jù)的優(yōu)化聚類和統(tǒng)計特征提取基礎(chǔ)上,通過提取非平衡數(shù)據(jù)多目標特征量的統(tǒng)計特征量,結(jié)合大數(shù)據(jù)信息采樣和特征提取方法進行非平衡環(huán)境下多目標檢測.傳統(tǒng)方法中,對非平衡環(huán)境下多目標檢測的研究較多.文獻[4]提出類別混疊度對非均衡數(shù)據(jù)分類的有效性分析方法.首先,在不同類數(shù)據(jù)非均衡率,不同邊界形狀、不同特征類型和不同概率分布的非均衡仿真數(shù)據(jù)上研究類別混疊度的有效性,其次,在實驗研究的基礎(chǔ)上,分析數(shù)據(jù)的非均衡性對類別混疊度的影響規(guī)律,找出類別混疊度指導(dǎo)非均衡分類的有效方法,最后,在真實的非均衡數(shù)據(jù)上驗證類別混疊度指導(dǎo)非均衡分類的實際效果;文獻[5]提出艦船通信系統(tǒng)非平衡數(shù)據(jù)多目標自動檢測算法,該算法通過計算通信數(shù)據(jù)集內(nèi)各數(shù)據(jù)點的歐幾里得距離,剔除帶有明顯維度特征的非平衡數(shù)據(jù)減少計算量,將剩余通信數(shù)據(jù)降維并建立一維空間映射,最后對空間映射內(nèi)的一維數(shù)據(jù)集特異值進行統(tǒng)計計算,實現(xiàn)非平衡數(shù)據(jù)檢測.但是以上兩種方法進行目標檢測時,檢測時間開銷較大;文獻[6]中提出基于NKSMOTE的非平衡數(shù)據(jù)集分類算法,該算法首先利用一個非線性映射函數(shù)將樣本映射到一個高維的核空間,然后在核空間上計算少數(shù)類樣本在所有樣本中的K個近鄰,最后根據(jù)少數(shù)類樣本的分布對算法分類性能的影響程度賦予少數(shù)類樣本不同的向上采樣倍率,從而改變數(shù)據(jù)集的非平衡度;文獻[7]提出基于廣義極值分布的非平衡數(shù)據(jù)分類算法,該算法在廣義線性模型的框架下,結(jié)合廣義極值分布作為鏈接函數(shù),校準損失函數(shù)作為目標優(yōu)化函數(shù),形成凸優(yōu)化問題,利用廣義極值分布的非對稱性解決非平衡數(shù)據(jù)分類問題.文獻[8]針對不平衡數(shù)據(jù)分類問題,提出基于統(tǒng)計信息聚類邊界的不平衡數(shù)據(jù)分類方法.首先去除數(shù)據(jù)集中的噪聲點,然后計算數(shù)據(jù)集中每個樣本的邊界度,通過判斷樣本點邊界度與領(lǐng)域值的大小區(qū)分出邊界集與非邊界集.在一定程度上該算法增加了數(shù)據(jù)集的分類效果.但是以上三種方法在對非平衡環(huán)境下多目標進行檢測時,檢測精度較低.文獻[9]提出基于改進SMOTE的非平衡數(shù)據(jù)集分類算法,將新樣本的產(chǎn)生限制在一定區(qū)域,使得樣本集分布趨于中心化,用更少的正類樣本點人為構(gòu)造樣本,從而達到限制樣本區(qū)域和降低算法復(fù)雜度的目的.文獻[10]提出基于混合采樣的非平衡數(shù)據(jù)分類算法,該算法首先利用SVM算法得到分類超平面,然后迭代進行混合采樣,主要包括刪除離分類超平面較遠的一些多數(shù)類樣本和對靠近真實類邊界的少數(shù)類樣本用SMOTE過采樣,使分類超平面向著真實類邊界方向偏移.但是以上兩種方法的檢測誤差較大,導(dǎo)致目標跟蹤性能較差.
針對上述問題,本文提出基于機器學(xué)習(xí)的非平衡環(huán)境下多目標智能檢測算法.為了優(yōu)化非平衡環(huán)境下的多目標智能檢測算法設(shè)計,提出了一種建立多目標跟蹤識別的非平衡數(shù)據(jù)采集模型.該模型采用空間網(wǎng)格聚類方法對非平衡數(shù)據(jù)進行多目標特征量分類挖掘,并結(jié)合機器學(xué)習(xí)方法進行非平衡數(shù)據(jù)多目標智能檢測過程中的尋優(yōu)控制.通過這種方法,實現(xiàn)了非平衡環(huán)境下多目標智能檢測算法的優(yōu)化,并得出有效性結(jié)論.
首先,對非平衡數(shù)據(jù)的多目標信息進行融合.其次,建立一個非平衡數(shù)據(jù)樣本采集模型,以便采集數(shù)據(jù).最后,可以采用模糊度辨識方法進行非平衡數(shù)據(jù)的分布式重建[11-12].定義多目標特征回波樣本數(shù)據(jù)分布矩陣為C,結(jié)合窄帶分布式重組方法,得到非平衡數(shù)據(jù)多目標檢測樣本分布集C2(m,n)的表達式為
其中C4s表示非平衡數(shù)據(jù)多目標樣本信號;e-ji表示少數(shù)類樣本j的采樣倍率;i表示多維數(shù)據(jù)集中的數(shù)據(jù)點;d為數(shù)據(jù)集維度.對非平衡數(shù)據(jù)多目標信息進行融合,結(jié)合特征優(yōu)化重組方法進行非平衡數(shù)據(jù)多目標檢測[13-14].通過非平衡數(shù)據(jù)的回波樣本數(shù)據(jù)分布,得到非平衡數(shù)據(jù)的參數(shù)融合矩陣為4P×4P矩陣,描述為
Se=E∑EHC×L,
(3)
其中E=[e1,e2,…e4P]為對非平衡數(shù)據(jù)多目標特征分布的酉矩陣;∑=diag[σ1,σ2,…σ4P]為特征值組成的對角矩陣.
在多傳感網(wǎng)絡(luò)模型中進行目標數(shù)據(jù)檢測,得到各個傳感器節(jié)點測量值,目標檢測的先驗概率Sx分布的表達式為
Sx=E[x3(t)]+b[se(t-τ0)],
(4)
其中E[x3(t)]為對目標跟蹤預(yù)測的衰減特征,t為目標跟蹤預(yù)測時間;b為抽頭延遲線;τ0為動態(tài)加權(quán)因子.引入非平衡數(shù)據(jù)多目標特征量的模糊集l和模糊度屬性值k,采用傳感器節(jié)點測量的方法,得到非平衡數(shù)據(jù)多目標特征量的模糊度函數(shù).
其中a(Hac)表示數(shù)據(jù)權(quán)值.對傳感器節(jié)點所獲得的信息進行分析檢驗,把規(guī)模為?的數(shù)據(jù)集 X 劃分到C個聚類簇中,得到非平衡數(shù)據(jù)多目標特征量的分布式重構(gòu)模型為
對具有wji(k)個分類屬性的非平衡數(shù)據(jù)多目標特征量進行回歸分析,構(gòu)建非平衡數(shù)據(jù)多目標特征量分布的標量時間序列為x(t),t=0,1,…,n-1.基于Grubbs準則得到非平衡數(shù)據(jù)多目標特征量的統(tǒng)計屬性和分類屬性,非平衡數(shù)據(jù)多目標特征量的模糊關(guān)聯(lián)規(guī)則分布序列為x1,x2,…xn∈Cm(m維復(fù)數(shù)空間),在模糊聚類中,采用協(xié)同濾波方法進行相似性特征提取和模糊度特征提取,建立狀態(tài)轉(zhuǎn)移矩陣和過程噪聲協(xié)方差矩陣,得到非平衡數(shù)據(jù)多目標特征量的模糊隸屬度函數(shù)為
(7)
其中x(τ)為非平衡數(shù)據(jù)多目標特征量時域分布集,τ為空間采樣時間尺度.將監(jiān)測區(qū)域分為多個小區(qū)域,采用關(guān)聯(lián)規(guī)則挖掘方法,對非平衡數(shù)據(jù)多目標特征βd進行提取,其表達式為
βd=(y(t)-d+1)/y(t),d∈[2,y(t)],
(8)
其中y(t)表示非平衡數(shù)據(jù)多目標特征量的關(guān)聯(lián)維特征.先建立多目標跟蹤識別的非平衡數(shù)據(jù)采集模型,然后采用關(guān)聯(lián)規(guī)則挖掘方法進行非平衡數(shù)據(jù)多目標特征提取,最后結(jié)合近場源回波檢測方法進行多傳感網(wǎng)絡(luò)下非平衡數(shù)據(jù)多目標特征檢測.
在建立多目標跟蹤識別的非平衡數(shù)據(jù)采集模型和采用關(guān)聯(lián)規(guī)則挖掘方法進行非平衡數(shù)據(jù)多目標特征提取的基礎(chǔ)上,將數(shù)據(jù)集推送到下一維空間,保證數(shù)據(jù)空間的方差為最大值.假設(shè)空間維度為1,數(shù)據(jù)集維度d的維量為u1,在數(shù)據(jù)集 X中的每個數(shù)據(jù)點i會產(chǎn)生一個高維原始空間數(shù)據(jù)標量值xi,則需建立數(shù)據(jù)集X的協(xié)方差公式
在過濾非平衡數(shù)據(jù)多目標特征量中的干擾成分分量,把Es分成四個P×L的矩陣E0、Ex、Ey和Ez,Es=[e1,e2,…eL]=[E0,Ex,Ey,Ez]H.設(shè)目標源級聲壓等參數(shù)為Γ、Ψ和Υ,傳感器節(jié)點中的非平衡數(shù)據(jù)特征值估計分別為wi、φ和φi,則非平衡數(shù)據(jù)多目標特征量檢測的參數(shù)估計值分別為
fi=angle(wi)/2π,
(12)
其中λi=c/fi為非平衡數(shù)據(jù)多目標特征量的聚類特征分布值,如果λi>0,則進行檢測;如果λi<0,則重新采集非平衡數(shù)據(jù).在信源中,對非平衡數(shù)據(jù)多目標特征量進行融合聚類和機器學(xué)習(xí),實現(xiàn)多目標特征量檢測,提高非平衡數(shù)據(jù)多目標檢測能力.綜上分析,得到算法的實現(xiàn)流程如圖1所示.
圖1 實現(xiàn)流程
由圖1可知,對非平衡數(shù)據(jù)多目標樣本信號提取采集到的非平衡數(shù)據(jù)多目標特征,并用流形學(xué)習(xí)方法對非平衡數(shù)據(jù)中的數(shù)據(jù)集做降維處理得到非平衡數(shù)據(jù)多目標特征量,再用空間網(wǎng)格聚類的方法對非平衡數(shù)據(jù)多目標特征量進行分類挖掘,最后根據(jù)挖掘結(jié)果對多目標特征量檢測的參數(shù)進行估計,如果λi>0,則進行檢測;如果λi<0,則重新采集非平衡數(shù)據(jù).
為了測試本文方法在實現(xiàn)非平衡環(huán)境下多目標檢測中的應(yīng)用性能,采用Matlab,CPU雙核2.53 GHz操作系統(tǒng),內(nèi)存為4.0 G,64位Windows10的開發(fā)環(huán)境進行仿真實驗分析.實驗中所使用的數(shù)據(jù)來源于機器學(xué)習(xí)數(shù)據(jù)集知識庫(網(wǎng)址:https://archive.ics.uci.edu/ml/index.php),共采集數(shù)據(jù)5000個,進行50組實驗,每次使用100個數(shù)據(jù).
本文以非平衡數(shù)據(jù)的均方根誤差、檢測時間和檢測精度為實驗指標,采用文獻[6]方法、文獻[7]方法、文獻[8]方法和本文方法進行對比實驗.
(i)檢測誤差:均方根誤差越低,目標跟蹤性能就越好,檢測結(jié)果越準確,所以以均方根誤差為測試指標,其公式如下.
其中di為非平衡環(huán)境下參量估計與真值的偏差,Ne為實驗次數(shù).
(ii)檢測時間:非平衡數(shù)據(jù)在檢測過程中產(chǎn)生的時間對檢測效率會產(chǎn)生影響,檢測時間越快,檢測效率越高.采用本文方法與文獻[6]方法、文獻[7]方法和文獻[8]方法對非平衡數(shù)據(jù)的檢測時間進行對比.
(iii)檢測精度:精度為驗證測試值的準確性.由于非平衡數(shù)據(jù)多目標特征量中的數(shù)據(jù)存在干擾現(xiàn)象,導(dǎo)致檢測精度較低,由此,采用本文方法與文獻[6]方法、文獻[7]方法和文獻[8]方法進行對比分析.
假設(shè)目標的初始位置為(2,40,60),采用200次Monte -Carlo實驗進行目標檢測,機器學(xué)習(xí)的迭代步數(shù)為120,目標信號能量為500 KJ,目標移動速度12.5 m/s,進行跟蹤性能測試,得到目標節(jié)點分布圖,如圖2所示.
圖2 目標節(jié)點分布圖
根據(jù)圖2的目標節(jié)點分布,采用本文方法與文獻[6]方法、文獻[7]方法和文獻[8]方法測試在2組不同的觀測噪聲下的非平衡數(shù)據(jù)多目標檢測誤差如圖3所示.
分析圖3可知,在不同觀測噪聲下采用本文方法進行非平衡環(huán)境下多目標檢測的誤差較低,目標跟蹤性能較好.為了驗證本文方法的有效性,對本文方法、文獻[6]方法、文獻[7]方法和文獻[8]方法的非平衡環(huán)境下多目標智能檢測時間進行對比分析,得到對比結(jié)果見表1.
表1 時間開銷對比(ms)
分析表1可知,隨著迭代次數(shù)的增加,四種方法的檢測時間逐漸增加,而本文方法進行非平衡環(huán)境下多目標檢測的時間開銷比其他方法檢測的時間開銷小.
根據(jù)目標節(jié)點分布進行數(shù)據(jù)采集,分別用本文方法、文獻[6]方法、文獻[7]方法和文獻[8]方法對采集到的非平衡數(shù)據(jù)進行檢測,將檢測結(jié)果與實際檢測結(jié)果進行對比,對比結(jié)果如圖4所示.
圖4 四種方法的檢測精度對比
分析圖4可知,本文方法對非平衡數(shù)據(jù)進行檢測的數(shù)據(jù)量與原始數(shù)據(jù)量幾近相同,而文獻[6]方法、文獻[7]方法和文獻[8]方法對非平衡數(shù)據(jù)進行檢測的數(shù)據(jù)量與原始數(shù)據(jù)量相差較大,說明本文方法進行非平衡環(huán)境下多目標檢測的精度較高.
通過對多目標分布狀態(tài)的特征檢測和信息重構(gòu),建立非平衡環(huán)境下多目標智能檢測模型,提高對目標信息的檢測識別和方位估計能力,本文提出基于機器學(xué)習(xí)的非平衡環(huán)境下多目標智能檢測算法.根據(jù)非平衡數(shù)據(jù)回波樣本數(shù)據(jù)的分布特征,結(jié)合統(tǒng)計分析的方法,對非平衡數(shù)據(jù)進行優(yōu)化結(jié)構(gòu)重組.該過程中,采用協(xié)同濾波方法來檢測相似性特征和提取模糊度特征,同時結(jié)合近場源回波檢測方法,在多傳感網(wǎng)絡(luò)下實現(xiàn)非平衡數(shù)據(jù)多目標特征檢測,實現(xiàn)了非平衡環(huán)境下多目標智能檢測算法的優(yōu)化設(shè)計.分析得知,采用本文方法進行非平衡環(huán)境下多目標檢測的精度較高,檢測時間開銷較短,提高了目標檢測性能.由于對非平衡數(shù)據(jù)進行檢測時,沒有考慮多目標檢測中的數(shù)據(jù)關(guān)聯(lián)性,導(dǎo)致數(shù)據(jù)關(guān)聯(lián)質(zhì)量較低,需要進一步對其研究.