蒲天添
摘 要: 為了使企業(yè)能夠更好地適應(yīng)社會的需求,對市場的變化做出快速地反應(yīng)。針對工程項目的特點,運用改進的ID3決策樹算法對工程項目管理進行優(yōu)化。首先,構(gòu)建工程項目管理的優(yōu)化屬性,聘請相關(guān)專家對屬性與工程項目風(fēng)險進行評分,然后,對評分進行離散化處理,最后利用ID3決策樹算法對工程項目信息進行充分挖掘,生成工程項目管理優(yōu)化決策樹,找出其中影響工程項目優(yōu)化管理的分類規(guī)則,分析工程項目的實施情況,給出個性化提示,從而達到對企業(yè)工程項目的有效控制和優(yōu)化。
關(guān)鍵詞: 電力系統(tǒng); 工程項目管理優(yōu)化; 信息熵; ID3決策樹; 數(shù)據(jù)挖掘; 離散化處理
中圖分類號: TN911?34 文獻標(biāo)識碼: A 文章編號: 1004?373X(2018)01?0169?04
Abstract: In order to let the enterprises adapt to the society requirement better, and respond to the changes in the market rapidly, an improved ID3 decision tree algorithm is used to optimize the engineering project management according to the characteristics of engineering project. The optimization attribute of the engineering project management was constructed. The attribute and engineering project risk are graded by relevant experts. And then the scores are discredited. The ID3 decision tree algorithm is adopted to mine the engineering project information fully, generate the decision tree of the engineering project management optimization, find out the classification rules influencing the engineering project management optimization, analyze the implementation of the engineering project, and give the personalized reminder. The ID3 decision tree algorithm can control and optimize the enterprise′s engineering project effectively.
Keywords: electric power system; engineering project management optimization; information entropy; ID3 decision tree; data mining; discretization
0 引 言
隨著中國經(jīng)濟的快速發(fā)展,為了使企業(yè)能夠更好地滿足社會的需求,適應(yīng)市場的快速變化,據(jù)相關(guān)研究[1?2],我國有90%以上的國有大中型企業(yè)都實施了工程項目管理模式,這些企業(yè)因為采用工程項目管理模式,能夠?qū)κ袌龅淖兓龀隹焖俚胤磻?yīng),運行狀況良好,都取得了不錯的成果。但是,由于我國的管理技術(shù)落后于西方發(fā)達國家,我國推行工程項目管理起步較晚,與西方發(fā)達國家的工程項目管理運行效果進行比較,可以發(fā)現(xiàn)我國企業(yè)推行的工程項目管理與發(fā)達國家之間還存在一定的差距[3]。在配套改革、制度創(chuàng)新和機制轉(zhuǎn)變等方面還需要不斷發(fā)展與完善[4]。由于企業(yè)在管理方式、競爭程度等方面存在著一定的差異,因此,不同企業(yè)的工程項目管理效果有著明顯的不同,因此,為了更好地適應(yīng)社會、市場的需求,不同的企業(yè)應(yīng)根據(jù)自身的資源優(yōu)勢、行業(yè)競爭狀況,對工程項目進行優(yōu)化管理[5]。
本文將決策樹算法引入企業(yè)工程項目管理優(yōu)化過程中,決策樹算法主要用來對研究數(shù)據(jù)進行預(yù)測與分類,是目前一種應(yīng)用最為廣泛的數(shù)據(jù)挖掘算法[6]。研究中,為了加快工程項目管理優(yōu)化的速度,對傳統(tǒng)的ID3決策樹算法進行改進,將改進的ID3決策樹算法運用于工程項目管理中,通過對企業(yè)工程項目的實施信息進行充分挖掘,找到對工程項目實施效果有較大影響的那些分類規(guī)則,用于分析企業(yè)工程項目的實施情況,對企業(yè)的工程項目實施方式給出針對性建議,從而使企業(yè)的工程項目管理模式得到優(yōu)化。
1 ID3決策樹算法
1.1 決策樹算法
決策樹算法主要用于對數(shù)據(jù)的分類與預(yù)測,是目前一種應(yīng)用最為廣泛的數(shù)據(jù)挖掘算法之一。它從根節(jié)點開始遍歷,在搜索的過程中利用歸納算法選擇其中一個分支,直到選擇某個葉子節(jié)點,從而構(gòu)造成決策樹[7]。在決策樹中,為了實現(xiàn)對數(shù)據(jù)的分類,按照IF?THEN的分類規(guī)則,從根節(jié)點到葉子節(jié)點將決策樹轉(zhuǎn)化成多個分類規(guī)則。決策樹算法的優(yōu)點是生成的模式簡單、魯棒性強,同時分類的精度高、速度快。決策樹算法有多種,其中應(yīng)用最廣泛的是ID3決策樹算法[8]。
1.2 ID3決策樹算法的構(gòu)造
ID3決策樹算法是將信息增益用作選取分支節(jié)點的測試屬性,首先將信息增益最高的節(jié)點作為決策樹的根節(jié)點,然后找到次高節(jié)點,作為決策樹的分支,依次類推,最后遞歸生成一棵簡單的決策樹[9]。
1.2.1 設(shè)定信息熵
假設(shè)訓(xùn)練集[S]中包含了[Si](其中[i=1,2,…,m])個數(shù)據(jù)樣本,分成[m]個類[c1,c2,…,ci](其中[i=1,2,…,m])。endprint
[I(S1,S2,…,Sm)=-i=1mPilog2Pi] (1)
式中:因為信息采用二進制編碼,所以使用的函數(shù)為以2為底的對數(shù);[Pi]表示訓(xùn)練集[S]中某隨機數(shù)據(jù)樣本屬于類[ci]的概率,[Pi]使用[SiS]進行估算。
1.2.2 選擇根節(jié)點
設(shè)屬性[A]為樹的根節(jié)點,[A]中包含[v]個值[{a1,][a2,…,av}。]訓(xùn)練集[S]被分為子集[{S1,S2,…,Sv},]設(shè)其中[A]的值為[aj,]某子集為[Sj。][sij]是[Sj]中的樣本屬于[Ci]的個數(shù),則:
[E(A)=j=1vs1j+s2j+…+smjSI(s1j,s2j,…,smj)] (2)
式中:[s1j+s2j+…+smjS]是子集[Sj]的權(quán),利用式(2)推導(dǎo)出集合[S]的信息熵為:
[I(s1j,s2j,…,smj)=-i=1mPijlog2Pij] (3)
式中:[Pij]使用 [sijSj]估計,表示子集[Sj]中某隨機數(shù)據(jù)樣本屬于類[Ci]的概率。
分支[A]的信息增益為:
[Gain(A)=I(S1,S2,…,Sm)-E(A)] (4)
信息增益用來描述樣本子集的純度,信息增益越大,表明劃分后的樣本子集越純,越有利于進行集合的優(yōu)化與分類。
1.2.3 ID3決策樹算法性能分析
ID3決策樹算法從空樹開始,利用爬山策略遍歷假設(shè)空間,對大規(guī)模的數(shù)據(jù)集進行處理,其優(yōu)缺點如下[10]:
優(yōu)點:ID3決策樹算法以爬山策略對搜索空間進行遍歷,以信息增益作為測試屬性的技術(shù),為了能夠獲得被測數(shù)據(jù)的最大類別信息,對每個非葉子節(jié)點都進行測試,如果類別信息屬性是非離散性的,為了降低訓(xùn)練樣本的敏感性,需要對類別信息進行離散化處理。
缺點:由于決策結(jié)算法是從根節(jié)點開始,對整個決策樹進行遍歷,如果再增加訓(xùn)練樣例,則需要重新構(gòu)造新的決策樹,通用性很弱。在選擇分裂節(jié)點時,需要對每個屬性的信息熵進行計算來判斷其分裂屬性,計算量較大,如果屬性較多,則增大了決策樹的產(chǎn)生成本,同時,運行的效率亦會受到很大的影響。
1.3 ID3決策樹算法的改進
為了提高ID3決策樹算法的運行效率,利用泰勒公式和麥克勞林公式對傳統(tǒng)的ID3決策樹算法進行改進。當(dāng)[x-x0]很小時,高等數(shù)學(xué)中的微分理論知識見式(5):
[f(x)=f(x0)+f(x0)(x-x0)+o(x-x0)] (5)
麥克勞林公式如下:
[f(x)=f(0)+f(0)x+f(0)2!x2+…+f(n)(0)2!xn+R(x)] (6)
其中,[R(x)=f(n+1)(x)(n+1)?。▁-x0)n+1]
麥克勞林公式的近似公式見式(7):
[f(x)≈f(0)+f(0)x+f(0)2!x2+…+f(n)(0)2!xn] (7)
式中:若[f(x)=ln(1+x)],且當(dāng)[x→0],存在[ln(1+x)≈x]。
1.4 改進后屬性信息熵的運算公式推導(dǎo)
由等式:
[I(pi,ni)=-pipi+nilog2pipi+ni-nipi+nilog2nipi+ni] (8)
[E(A)=i=1npi+nip+nI(pi,ni)] (9)
整理得:
[E(A)=i=1n1(p+n)ln2-pilnpipi+ni-ninipi+ni] (10)
因為[1(p+n)ln2]是常量,設(shè)[G(A)=][i=1n-pilnpipi+ni-ninipi+ni],存在以下關(guān)系式成立:
[ln(1+x)≈x] (11)
[lnpipi+ni=ln1-nipi+ni≈-nipi+ni] (12)
同理:
[lnnipi+ni≈-pipi+ni] (13)
則:
[G(A)=i=1npinipi+ni+nipipi+ni=i=1n2pinipi+ni] (14)
改進后的屬性信息熵公式為:
[H(A)=i=1n2pinipi+niN] (15)
式中[N]表示屬性值的個數(shù)。
2 改進ID3決策樹算法的工程項目管理優(yōu)化算法
1) 選擇企業(yè)的某個工程項目,構(gòu)建工程項目管理優(yōu)化的相關(guān)屬性,聘請相關(guān)專家對屬性值進行打分,收集專家的打分結(jié)果,構(gòu)建工程項目管理優(yōu)化的訓(xùn)練集;
2) 利用粗糙集理論,對訓(xùn)練集進行離散化處理;
3) 利用改進ID3決策樹算法,選擇信息增益最高的節(jié)點屬性作為根節(jié)點;
4) 然后找到次高節(jié)點,作為決策樹的分支,依次類推,最后遞歸生成一棵決策樹;
5) ID3決策樹算法中每循環(huán)執(zhí)行一次,生成的決策樹都會被更新一次。
3 仿真試驗
3.1 工程項目管理的三要素分析
工程項目管理以最低成本均衡資源,控制工程質(zhì)量為目標(biāo),根據(jù)相關(guān)研究成果,可以將工程項目管理屬性歸納為計劃、技術(shù)、費用和進度4個基本屬性。在進行工程項目管理時,計劃是為了確保項目的順利實施與完成,事先需要做好周密的計劃安排,預(yù)測工程項目在實施時的各種風(fēng)險;技術(shù)是確保項目在設(shè)計和實施過程中的技術(shù)保障;費用是保證項目在實施過程中的財務(wù)預(yù)算;進度是指項目設(shè)計、建造和安裝等所估算和分配的作業(yè)時間。從經(jīng)濟學(xué)角度來看,工程項目管理中計劃、技術(shù)、費用和進度的相互制約關(guān)系產(chǎn)生了多目標(biāo)協(xié)同問題,即多目標(biāo)優(yōu)化。
3.2 基于ID3決策樹算法的工程項目管理優(yōu)化endprint
在Java平臺的Weka軟件進行試驗仿真,以某國有企業(yè)工程項目管理優(yōu)化為目標(biāo)屬性,選擇工程項目管理的計劃、技術(shù)、費用和進度4個屬性對工程項目管理進行優(yōu)化,利用ID3決策樹算法提取有用的分類規(guī)則,指導(dǎo)企業(yè)工程項目優(yōu)化運行。
3.3 數(shù)據(jù)準(zhǔn)備
分析該國有企業(yè)的某個工程管理項目的運行情況,聘請相關(guān)專家對這4個指標(biāo)分別根據(jù)樣本實際情況給出評分,并按一定規(guī)則得到綜合評分,最后,根據(jù)各屬性的綜合評分情況對該工程項目的風(fēng)險進行綜合評分。表1為收集的10個專家對該工程項目的評分。
3.4 傳統(tǒng)ID3決策樹算法的信息增益
為了減少運行的誤差,利用粗糙集算法對該工程項目的專家評分表進行離散化處理,然后利用式(1)~式(3)計算出該工程項目的項目風(fēng)險、計劃、技術(shù)、費用和進度的期望信息。
項目風(fēng)險的期望信息:Info(風(fēng)險程度)=0.998 8
計劃的期望信息:Info(計劃)=0.998 7
技術(shù)的期望信息:Info(技術(shù))=0.994 5
費用的期望信息:Info(費用)=0.987 9
進度的期望信息:Info(進度)=0.991 9
利用式(4)計算得到4個屬性的信息增益:
Gain(計劃)=0.998 8-0.998 7=0.000 1
Gain(技術(shù))=0.998 8-0.994 5=0.004 3
Gain(費用)=0.998 8-0.987 9=0.010 9
Gain(進度)=0.998 8-0.991 9=0.006 9
由于進度在屬性中具有最高信息增益,它被選作測試屬性。決策樹創(chuàng)建過程為: 創(chuàng)建一個節(jié)點,用進度指標(biāo)作為標(biāo)記,并對每個屬性值引出一個分枝,對各個分枝進行如上所述遞歸運算,最終得到的決策樹如圖1所示。
從生成的決策樹來看,為了實現(xiàn)該項目的有效管理,首先必須要保證該項目的進度,然后在確保計劃的完善,最后,要充分地確保項目實施技術(shù)的支撐能力,這樣就可以確保該項目的順利實施與完成。
3.5 改進ID3決策樹算法后的信息增益
為了提高工程項目管理優(yōu)化效率,對ID3決策樹算法進行改進,利用式(15)進行計算:
項目風(fēng)險的期望信息:Info(風(fēng)險程度)=0.999 7
計劃的期望信息:Info(計劃)=0.675 3
技術(shù)的期望信息:Info(技術(shù))=0.453 7
費用的期望信息:Info(費用)=0.653 4
進度的期望信息:Info(進度)=0.562 4
得到各屬性的屬性信息熵,計算出各指標(biāo)的信息增益如下:
Gain′(計劃)= 0.999 7-0.675 3=0.324 4
Gain′(技術(shù))=0.999 7-0.453 7=0.546
Gain′(費用)=0.999 7-0.653 4=0.346 3
Gain′(進度)= 0.999 7-0.562 4=0.437 3
Gain′(進度)相對不大,即應(yīng)把進度指標(biāo)作為測試屬性創(chuàng)建決策樹,然后對各個分支進行遞歸運算,構(gòu)建的決策樹與圖1相同。為了比較決策樹ID3決策樹算法改進前后性能的變化,針對不同個數(shù)的工程項目管理,處理相同數(shù)據(jù)所需的耗時對比見圖2。由圖2可見,改進后的ID3決策樹算法的速度要遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的ID3決策樹算法,工作效率大大增強。
4 結(jié) 論
為了企業(yè)能夠更好地適應(yīng)社會、市場的需求,傳統(tǒng)的管理方法已經(jīng)很難適應(yīng)環(huán)境的變化,因此,對企業(yè)工程項目進行針對化的管理成為一種必然趨勢。本文主要通過 ID3決策樹算法構(gòu)造企業(yè)工程項目管理決策樹,得到分類規(guī)則,對項目的管理信息進行充分挖掘,實現(xiàn)工程項目管理的個性化提示和針對化管理。
參考文獻
[1] 梁晨.基于神經(jīng)網(wǎng)絡(luò)的機械設(shè)備故障檢測技術(shù)[J].計算機與數(shù)字工程,2015(9):1685?1688.
LIANG Chen. Equipment failure prediction technology based on system network [J]. Computer and digital engineering, 2015(9): 1685?1688.
[2] 劉菁,賴芨宇,孫曉丹.基于物元分析法的施工項目管理績效評價模型[J].工程管理學(xué)報,2015(1):124?128.
LIU Jing, LAI Jiyu, SUN Xiaodan. The performance evaluation of construction project management model based on matter?element analysis method [J]. Journal of engineering management, 2015(1): 124?128.
[3] 段彥斌.電力能信工程項目管理組織優(yōu)化研究[D].北京:華北電力大學(xué),2014.
DUAN Yanbin. The power to channel project management organization optimization research [D]. Beijing: North China Electric Power University, 2014.
[4] 郭鵬,文曉閣.基于BP人工神經(jīng)網(wǎng)絡(luò)的BOT項目風(fēng)險評估研究[J].科技管理研究,2015,35(21):210?214.endprint
GUO Peng, WEN Xiaoge. Research of BOT project risk assessment based on BP neural network [J]. Science and technology management research, 2015, 35(21): 210?214.
[5] 林紅,孫雅娟.基于優(yōu)化決策樹的化工企業(yè)風(fēng)險監(jiān)測算法[J].計算機仿真,2013,30(8):368?371.
LIN Hong, SUN Yajuan. Chemical enterprise production steady quantitative measurement based on optimization decision tree [J]. Computer simulation, 2013, 30(8): 368?371.
[6] 樊妍妍.ID3決策樹算法對教學(xué)輔助系統(tǒng)的優(yōu)化[J].齊齊哈爾大學(xué)學(xué)報(自然科學(xué)版),2016,32(1):85?89.
FAN Yanyan. Application of lD3 decision tree mining in teaching assistant system [J]. Journal of Qiqihar University (natural science edition), 2016, 32(1): 85?89.
[7] 楊洋.決策樹ID3算法及其改進[J].軟件導(dǎo)刊,2016,15(8):46?48.
YANG Yang. Decision tree ID3 algorithm and its improvement [J]. Software guide, 2016, 15(8): 46?48.
[8] 王小巍,蔣玉明.決策樹ID3算法的分析與改進[J].計算機工程與設(shè)計,2011,32(9):3070?3072.
WANG Xiaowei, JIANG Yuming. Analysis and improvement of ID3 decision tree algorithm [J]. Computer engineering and design, 2011, 32(9): 3070?3072.
[9] 賈志剛,賀蓉,李仁發(fā),等.一種基于決策樹分類算法的家庭能量動態(tài)調(diào)度系統(tǒng)[J].計算機應(yīng)用研究,2016,33(9):2619?2624.
JIA Zhigang, HE Rong, LI Renfa, et al. Dynamic scheduling system of home energy based on decision tree classification algorithm [J]. Application research of computers, 2016, 33(9): 2619?2624.
[10] 溫瑞英,王紅勇.基于嶺回歸:BP神經(jīng)網(wǎng)絡(luò)的管制工作負(fù)荷預(yù)測方法[J].交通運輸系統(tǒng)工程與信息,2015,15(1):123?129.
WEN Ruiying, WANG Hongyong. A forecasting method of controller′s workload based on ridge regression?BP neural network [J]. Journal of transportation systems engineering and information technology, 2015, 15(1): 123?129.endprint