霍麗娟 徐靜 黃西 韓文甫
摘 要:
武器裝備的費用是影響裝備發(fā)展的首要問題。在裝備壽命周期的各個階段,開展裝備費用的預(yù)測研究,對于促進裝備可靠性和維修性的提高,加強裝備使用和維修的科學管理有著十分重要的意義。
關(guān)鍵詞:
SVR;武器裝備;費用
中圖分類號:
F23
文獻標識碼:A
文章編號:16723198(2014)23011301
傳統(tǒng)的費用預(yù)測方法有類比估算法、專家判斷估算法、參數(shù)估算法和工程估算法等。類比估算法和專家判斷估算法以經(jīng)驗和主觀評價為基礎(chǔ),增加了方法的不確定性。參數(shù)估算法最大的問題是需要相當容量的歷史數(shù)據(jù),其精度取決于樣本數(shù)量的大小。工程估算法預(yù)測過程復雜、繁瑣、費時。
由于樣本限制,裝備費用預(yù)測問題是小樣本學習問題。支持向量機(Support Vector Machine, SVM)是由統(tǒng)計學習理論發(fā)展起來的一種新型學習機器,它以結(jié)構(gòu)風險最小化原理為理論基礎(chǔ),具有逼近復雜非線性系統(tǒng)、較強的學習泛化能力和良好的分類性能,同時所需要樣本數(shù)量少、建模方便、計算簡單、學習訓練時間短、泛化能力強。SVM最初是用來解決模式識別問題,隨著 Vapnik 的ε不敏感損失函數(shù)的引入, SVM已經(jīng)擴展到解決非線性回歸問題。
1 支持向量機回歸模型
支持向量機回歸(SVR)的基本思想是:基于Mercer核展開定理,通過非線性映射,把樣本空間映射到一個高維特征空間,在這個空間中構(gòu)造最優(yōu)決策函數(shù)。在構(gòu)造最優(yōu)決策函數(shù)時應(yīng)用結(jié)構(gòu)風險最小化原則,并利用原空間的核函數(shù)取代高維特征空間中的點積運算,把尋找最優(yōu)線性回歸超平面的算法歸結(jié)為求解一個凸約束條件下的一個凸規(guī)劃問題。
對線性規(guī)劃,設(shè)訓練樣本集(xi,yi),i=1,2,…,n具有ε相似性,即yi-f(xi)≤ε,i=1,2,…,n。該最優(yōu)問題可作如下描述:
minf=12wTw+C∑ni=1(ξi+ξ*i)(1)
s.t.wxi+bi-yi≤ε+ξ*i
-wxi-bi+yi≤ε+ξi
ξi,ξ*i≥0
其中C為懲罰因子,實現(xiàn)經(jīng)驗風險和置信范圍的折中;ξi,ξ*i為松弛因子,ε為損失函數(shù),采用ε不敏感 (insensitive)損失函數(shù),用于控制回歸逼近誤差和泛化能力。
在求解上式時,一般采用對偶理論,把它轉(zhuǎn)化成二次規(guī)劃問題。建立拉格朗日方程:
L(w,ξi,ξ*i)=12wTw+C∑ni=1(ξi+ξ*i)-∑ni=1αi(ε+ξ*i-wxi-bi+yi)-∑ni=1αi(ε+ξ*i+wxi+bi-yi)-∑ni=1(ηiξi+ηiξ*i) ?αi,αi,ηi,ηi≥0,i=1,2,…,n(2)
在極值處,上式對w,b,ξi,ξ*i求偏導為零,得:
w = ∑ni = 1(αi -α*i )xi
∑ni = 1(αi -α*i ) = 0
C-αi -ηi ?= 0
C-α*i♂-η*i♂ = 0
化簡后, 可得原約束表達式的對偶式:
min12∑ni,j = 1(α*i -αi )(α*j -αj )xTi xj -∑ni = 1α*i (yi -ε)-αi (yi ?+ ε)(3)
St.∑ni = 1(αi -α*i ) = 0,\\quadαi ,α*i ∈0,C
對于非線性問題,將原數(shù)據(jù)集通過一非線性映射,映射到一高維特征空間,在高維特征空間中進行線性回歸,則此時約束表達式為:
min12∑ni,j = 1(α*i -αi )(α*j -αj )Φ T(xi )Φ (xj )-∑ni = 1α*i (yi -ε)-αi (yi ?+ ε)(4)
St.∑ni = 1(αi -α*i ) = 0,\\quadαi ,α*i ∈0,C
定義K(xi,xj)=(Φ(xi)·Φ(xj))=ΦT(xj)Φ(xi)為核函數(shù)。
根據(jù)Karush-Kuhn-Tucker定理,可求得αi ,α*i ,b,最終可得SVM回歸函數(shù)為:
f(x) = ∑ni = 1(αi -α*i )K(xi ,x) + b(5)
2 支持向量機預(yù)測裝備費用的方法和步驟
基于支持向量機回歸的裝備費用預(yù)測的方法和步驟如下:
(1)確定樣本量。
武器裝備的費用受多方面因素的影響,如果只從單獨的一個方面對武器裝備費用進行考察評估,就不可能對裝備費用有正確的反映。一般選取對費用較為敏感的若干個主要物理與性能參數(shù)(如質(zhì)量、體積、射程、探測距離、平均故障間隔時間等)。對于單一費用的預(yù)測,其樣本量可以選擇前階段該項費用作為樣本量。
(2)數(shù)據(jù)的預(yù)處理。
支持向量機沒有對數(shù)據(jù)量綱的要求,這就可能造成兩個數(shù)量級相差很大的數(shù)據(jù)一起作為訓練樣本,造成模型訓練費時,誤差較大。因此對訓練樣本要進行數(shù)據(jù)的縮放處理。一般歸一化采用下式實現(xiàn):
xM=2(x-xmin)xmax-xmin-1(6)
式中,xM表示歸一化后的數(shù)據(jù),xmax,xmin是原始變量x的最大和最小值。
(3)選擇核函數(shù),進行學習訓練。
常用的核函數(shù)有線性核函數(shù),多項式核函數(shù),徑向基核函數(shù),高斯核函數(shù)。支持向量機回歸常用的核函數(shù)是徑向基核函數(shù),表示為:
K(xi,xj)=exp{-|xi-xj|2σ2}(7)
選擇參數(shù)C,ε以及核函數(shù)中σ2的合理取值,一般按經(jīng)驗選取,以所確定的模型的擬合精度作為標準。
(4)確定模型,用于預(yù)測。
將新的參數(shù)數(shù)據(jù)輸入到模型中進行預(yù)測。