秦 珩,張小海
● (1.海軍訓練艦支隊,遼寧大連 116018;2.海軍駐上海七○四所軍代表室,上海 200031)
全壽命費用的DEA優(yōu)化逐步回歸分析法及其應用
秦 珩1,張小海2
● (1.海軍訓練艦支隊,遼寧大連 116018;2.海軍駐上海七○四所軍代表室,上海 200031)
在全壽命費用估算建模領域,逐步回歸能對多因素進行篩選,克服了建模因素之間的多重相關性對最小二乘估計的干擾。逐步回歸分析法本質上是對數(shù)據(jù)平均趨勢的估算,無法避免“由失真數(shù)據(jù)得到無效模型”的根本問題。為此,提出用數(shù)據(jù)包絡分析(DEA)優(yōu)化逐步回歸的建模方法,用 DEA方法對數(shù)據(jù)進行評價,剔除無效數(shù)據(jù),將有效的數(shù)據(jù)用來逐步回歸建模。該方法能有效克服干擾數(shù)據(jù)對提取成分的影響,彌補逐步回歸方法的不足。通過實例計算并與逐步回歸、多元線性回歸比較分析,DEA優(yōu)化逐步回歸建模精度為2.64%,高于逐步回歸的3.39%和多元線性回歸的3.49%,具有實用價值。
全壽命費用;逐步回歸分析;數(shù)據(jù)包絡分析;多重相關性模
在全壽命費用估算應用領域,多元回歸分析是常用的建模方法。用多元回歸分析建模時,多重相關性問題常常導致最小二乘估計失效,逐步回歸分析法[1]能對建模因素進行篩選,從而降低因素之間多重相關性對回歸建模的影響。回歸統(tǒng)計建模方法本質上是對平均趨勢的估算,無法避免“由失真的數(shù)據(jù)得到無效的模型”根本問題。在實際回歸分析建模時,由于各個時期的數(shù)據(jù)樣本有效程度不等,而回歸分析對此并不加以區(qū)分。因此,得到的計算結果是“平均值”,不能提供“最優(yōu)值”,鑒于數(shù)據(jù)包絡分析(DEA,Data Envelopment Analysis)方法可對數(shù)據(jù)是否有效進行評價“優(yōu)選”,克服一般回歸分析方法的“平滑性”,進行“最優(yōu)性”回歸建模預測[2]。鑒于此,本文提出用DEA優(yōu)化的逐步回歸分析的全壽命費用估算方法。
數(shù)據(jù)包絡分析(DEA)是以相對效率概念為基礎發(fā)展起來的一種效率評價方法,自1978年第一個DEA模型—C2R模型發(fā)表后,相關的研究不斷涌現(xiàn),至今已形成關于效率、生產(chǎn)可能集、生產(chǎn)前沿面等概念的完整的理論、方法和模型,并廣泛應用于管理科學、系統(tǒng)工程和決策分析等各個領域,DEA已成為管理科學與系統(tǒng)工程領域處理復雜問題的重要而有效的分析工具[3]。文獻[4]介紹了DEA的起源,模型等內容;文獻[5]將DEA二次相對評價法對裝備效費進行評價,明確了非有效決策單元的調整量;文獻[6]將DEA、PCA及數(shù)值分類方法結合起來用于制造業(yè)中的能源消耗使用效率評價,但至今未見DEA在逐步回歸建模方面的應用。
DEA的基本模型:假設n決策單元 DMU1、DMU2、…,DMUn,每個DMU有m種輸入和s種輸出,DMUj的輸入和輸出向量分別為xj=(x1j,x2j,…xmj)T,yj=(y1j,y2j,…ysj)T,j=1,2,…n。
設DMUj0的輸入、輸出為(xj0,yj0),這里簡記為(x0,y0),評價DMUj0相對有效性的C2R模型為:
其中:v=(v1,v2,…vm)T,u=(u1,u2,…us)T分別為m種輸入和s種輸出的權系數(shù)。利用Charnes和Cooper關于分式規(guī)劃的Charnes-Cooper變換:
逐步回歸分析法的基本思想是:從所有解釋變量中先選擇影響最為顯著的變量建立模型,然后再將模型之外的變量逐個引入模型;每引入一個變量,就對模型中的所有變量進行一次顯著性檢驗,當原引入的變量由于后面變量的引入而變得不再顯著時,將其剔除;逐個引入—剔除—引入,反復這個過程,直到既無顯著變量引入回歸方程,也無不顯著變量從回歸方程中剔除為止[1]。
直接采用 DEA中的應用模型可不需要先驗信息直接對數(shù)據(jù)進行評價篩選,因此,在進行逐步回歸分析之前,利用DEA評價出有效的數(shù)據(jù)來進行逐步回歸建模。
計算方法和步驟:
1)采用DEA中的C2R模型,將多個自變量作為輸入指標,y作為單變量輸出指標,利用線性規(guī)劃的對偶理論求解得θ的效率值,采用有效的數(shù)據(jù)即效率θ=1的數(shù)據(jù)來進行逐步回歸建模。
2)明確引入變量的“貢獻”值,即為變量的偏回歸平方和:
3)在判斷變量的作用是否顯著前,給出引入和剔除變量的F值的下限Fα引和Fα剔回歸。
4)計算標準增廣矩陣R(0)。
b)計算正規(guī)方程組系數(shù):
c)構成正規(guī)方程組系數(shù)矩陣的增廣矩陣:
5)引入一個變量計算
c)進行F檢驗,,若F引>Fα引,則引進該變量,并進入;
d)否則,結束整個逐步回歸過程;4)對增廣矩陣R(l)進行變換(已經(jīng)引進了一個變量),使R(l)→R(l+1),則:
其中,k是被引進或剔除的變量的下標。
6)剔除一個變量計算
b)求出Uil的最小者,
c)進行F檢驗,若,F(xiàn)剔>Fα剔,則該變量不予剔除,終止剔除過程,否則,剔除該變量,并進入d);
d)對標準增廣矩陣R(l)進行變換,計算方法同4)-d)。
7)循環(huán)步驟4)和5),直到?jīng)]有變量進出,計算終止。
為體現(xiàn)客觀性,現(xiàn)采用文獻[7]中刀具磨損實驗數(shù)據(jù),來驗證DEA優(yōu)化逐步回歸建模方法的實際應用價值。刀具磨損數(shù)據(jù)見表1。
將此5個自變量的10組數(shù)據(jù)作為DEA應用模型的輸入,y作為DEA應用模型的輸出代入C2R模型中,利用MATLAB求解,可以算出各組數(shù)據(jù)的相應最優(yōu)值θ,計算結果如表2所示。
表1 實驗數(shù)據(jù)
表2 DEA評價結果
從表2中剔除效率值θ<1的序號為6,7兩組數(shù)據(jù),將表2中效率值θ=1的序號1,2,3,4,5,8,9,10組數(shù)據(jù)作為逐步回歸分析的建模數(shù)據(jù),數(shù)據(jù)如表3所示。
表3 建模數(shù)據(jù)
將表3的數(shù)據(jù)進行逐步回歸分析。根據(jù)文獻[7]可知,實驗數(shù)據(jù)的y與自變量之間是成指數(shù)關系的,因此,將表3的數(shù)據(jù)進行以10為底的對數(shù)變換得表4。進行逐步回歸分析,之后再反變換還原方程,即可得y與x的方程。
對表4的數(shù)據(jù)進行逐步回歸分析得表5,最終確定變量為x1、x3、x4、x5,建立模型為:
平均絕對誤差為:2.64%。
若在DEA評價后,經(jīng)對數(shù)變換后采用多元線性回歸建模,其平均絕對誤差為:2.65%。
在此,將表1的數(shù)據(jù)未通過DEA評價,直接進行逐步回歸作為比較,以體現(xiàn)DEA優(yōu)化逐步回歸分析建模的優(yōu)勢。
表4 對數(shù)后建模數(shù)據(jù)
表5 回歸計算結果
采用同樣的方法對數(shù)據(jù)進行處理,數(shù)據(jù)對數(shù)變換后進行逐步回歸分析計算,通過分析,最終確定變量為x2、x3、x5。
最終得回歸方程為:
平均絕對誤差為:3.39%
同樣,將表1的數(shù)據(jù)取對數(shù)變換,多元線性回歸分析計算得平均絕對誤差為3.49%。
若對表1數(shù)據(jù)直接進行回歸計算,其平均絕對誤差為5.60%,說明原始數(shù)據(jù)服從指數(shù)關系是有科學依據(jù)的。
1)提出用DEA優(yōu)化逐步回歸分析法,建模精度高。通過綜合DEA評價數(shù)據(jù)的有效性,利用有效數(shù)據(jù)進行逐步回歸建模,有效克服了無效數(shù)據(jù)對回歸建模的影響。通過實例分析多元線性回歸、逐步回歸分析法進行對比,DEA優(yōu)化逐步回歸建模精度為2.64%,多元線性回歸建模精度為3.49%,逐步回歸分析精度為3.39%,該方法具有一定的實用價值。
2)用DEA優(yōu)化逐步回歸方法突出利用有效的數(shù)據(jù)建立有效的回歸模型的思想,克服了常用的回歸統(tǒng)計建模方法無法避免“依據(jù)錯誤數(shù)據(jù)得到錯誤的模型”的不足。建立了以費用最優(yōu)為目標的回歸模型,這對于進行全壽命費用的科學預測,具有重要意義。
[1]狄鵬,胡濤,楊建軍.預測與決策[M].北京:國防工業(yè)出版社,2007.
[2]段永瑞.數(shù)據(jù)包絡分析—理論和應用[M].上海:上??茖W普及出版社,2006.
[3]Cooper W W,Seiford L M,Tone K.Data Envelopment Analysis[M].Kluwer Academic Publisher,Boston,Dordrecht,London,2000.
[4]魏權齡.數(shù)據(jù)包絡分析[M].北京:科學出版社,2003.
[5]廖武,陳云翔,孟飆.基于 DEA 的裝備費效分析[J].計算機工程與應用,2007,43(9):219-222.
[6]Azadeh A,Amalnick M S ,Ghaderi S F ,et al.An integrated DEA PCA numerical taxonomy approach for energy efficiency assessment and consumption optimization in energy intensive manufacturing sectors[J].Energy Policy,2007,35:3792–3806.
[7]王惠文,吳載斌,孟潔.偏最小二乘回歸的線性與非線性方法[M].北京:國防工業(yè)出版社,2006.
Optimized Stepwise Regression Analysis with DEA and Its Application
QIN Heng1,ZHANG Xiao-hai2
(1.1.Navy of Training Ships Detachment,Dalian 116018,China; 2.Navy Representative Office at No.704 Research Institute of CSIC,Shanghai 200031,China)
Stepwise regression filters independent variables while modeling,which overcome the multi-correlation between independent variables that disturb the least squares estimation in the life cycle cost modeling.The regression statistical modeling approach estimates the average trend of the data essentially,which cannot avoid the problem that obtain the wrong model according to the error data at all.Therefore,the optimized stepwise regression with Data Envelopment Analysis (DEA) was proposed to overcome the problem,which can evaluate the efficiency of the data and remove the inefficiency data for stepwise regression modeling.The new approach can overcome the effect of the disturbed data when filtering principal components in the independent variables.Compared with the method of stepwise regression and multiple linear regression,the precision of the optimum stepwise regression with DEA is 2.64%,which is higher than stepwise regression with 3.39% and multiple linear regression with 3.49%.
life cycle cost (LCC); stepwise regression analysis; data envelopment analysis (DEA); multi-correlation
N945.11
A
秦珩(1976-),男,工程師。主要研究方向:機電管理。