李素清,王洪禮
(1.天津大學(xué)管理與經(jīng)濟(jì)學(xué)部,天津300072;2.中鐵十三局集團(tuán)有限公司,天津300308)
可以預(yù)見(jiàn),未來(lái)20年,我國(guó)基本建設(shè)、房地產(chǎn)等固定資產(chǎn)的投資規(guī)模仍會(huì)保持較高的水平,這也將為建筑企業(yè)提供一個(gè)難得的發(fā)展機(jī)遇。中鐵十三局集團(tuán)是世界500強(qiáng)中國(guó)鐵建所屬的中央企業(yè),是集施工、設(shè)計(jì)、科研、地產(chǎn)等于一體的大型工程總承包企業(yè)集團(tuán),集團(tuán)擁有14 000余名職工,擁有70項(xiàng)施工資質(zhì)和7項(xiàng)咨詢(xún)、設(shè)計(jì)、勘察資質(zhì)以及200億元以上的年施工能力??茖W(xué)地預(yù)測(cè)集團(tuán)未來(lái)幾年的總產(chǎn)值和利潤(rùn),有助于制定合理的發(fā)展戰(zhàn)略,把握發(fā)展機(jī)遇。
目前,用于建筑等行業(yè)的預(yù)測(cè),多為灰色預(yù)測(cè)理論、神經(jīng)網(wǎng)絡(luò)等方法。方匡南等人[1]利用隨機(jī)森林方法預(yù)測(cè)了我國(guó)基金超額收益率方向,證明了我國(guó)金融市場(chǎng)的可預(yù)測(cè)性。郭嘉良[2]利用規(guī)則集成方法對(duì)天津市的漁業(yè)經(jīng)濟(jì)發(fā)展進(jìn)行了實(shí)證預(yù)測(cè)。
由于中鐵十三局集團(tuán)歷年以來(lái)的總產(chǎn)值和利潤(rùn)數(shù)據(jù)保存較好,所以本文從這些歷史數(shù)據(jù)出發(fā),利用規(guī)則集成[2,3]和隨機(jī)森林算法[4-7],對(duì)集團(tuán)的總產(chǎn)值和利潤(rùn)進(jìn)行了預(yù)測(cè)分析,并在此基礎(chǔ)上,對(duì)集團(tuán)的“十二五”發(fā)展提出了戰(zhàn)略性建議。
在某一個(gè)系統(tǒng)當(dāng)中,假設(shè)一系列相關(guān)變量x1,x2,x3,…,xn,y 為已知,將 x1,x2,x3,…,xn視為輸入變量,y為輸出變量,通過(guò)預(yù)測(cè)學(xué)習(xí)方法,可以求得估計(jì)函數(shù)為
從而可以預(yù)測(cè)出任一輸入變量所對(duì)應(yīng)的輸出變量。
集成學(xué)習(xí)技術(shù)是目前最有效的預(yù)測(cè)學(xué)習(xí)方法之一,學(xué)習(xí)過(guò)程中所選取的模型為
式中,fm(x)是基礎(chǔ)學(xué)習(xí)器,基礎(chǔ)學(xué)習(xí)器的不同從根本上決定了集成學(xué)習(xí)方法的不同,即使同一組基礎(chǔ)學(xué)習(xí)器,采用不同的回歸過(guò)程,也會(huì)得到不同的結(jié)果;m表示學(xué)習(xí)過(guò)程的規(guī)模。m{am}M0是基礎(chǔ)學(xué)習(xí)器的組合系數(shù)。
規(guī)則集成學(xué)習(xí)技術(shù)所采用的基礎(chǔ)學(xué)習(xí)器為
式中,Sjm為xj的所有可能取值集合Sj的某一特定子集,I(xj∈Sjm)是集合Sjm的示性函數(shù),其取值為0或1,因此,rm(x)的取值也為0或1。選定基礎(chǔ)學(xué)習(xí)器之后,將基礎(chǔ)學(xué)習(xí)器設(shè)定為決策樹(shù),并在每個(gè)節(jié)點(diǎn)生成1條規(guī)則。
經(jīng)過(guò)計(jì)算,可以得到最終的預(yù)測(cè)模型為
規(guī)則所生成的算法為
1 F0(x)=arg
2 For m=1 to M{
3 pm=arg minpΣieSm(η)L(yi,F(xiàn)m-1)(xi)+f(xi;p)
4 fm(x)=f(x;pm)
5 Fm(x)=Fm-1(x)=vfm(x)
6 }
其中,Sm(η)是從已知數(shù)據(jù)中隨機(jī)獲取的,樣本量為η的一個(gè)子樣本集合。
隨機(jī)森林是Breiman于2001年提出的一種由許多決策回歸樹(shù)集合在一起的預(yù)測(cè)或者分類(lèi)器。
在生成決策樹(shù)的過(guò)程中,隨機(jī)森林采用的是Bootstrap重采樣技術(shù),該技術(shù)通過(guò)對(duì)樣本的分布進(jìn)行有效放回的隨機(jī)抽樣,得到子樣本。假設(shè)原始樣本的容量為N,隨機(jī)有效放回地抽取N個(gè)新的樣本子集,在此基礎(chǔ)上即可以構(gòu)建k棵回歸樹(shù)。假設(shè)所研究的問(wèn)題有M個(gè)自變量,指定一個(gè)屬性數(shù)F(F≤M),從M個(gè)屬性中隨機(jī)抽取F個(gè)屬性作為分裂屬性集,以F個(gè)屬性中最好的分裂方式對(duì)結(jié)點(diǎn)進(jìn)行分裂。每顆樹(shù)按遞歸自分算法自由生長(zhǎng),不進(jìn)行剪裁。
所有生成的回歸樹(shù)組成隨機(jī)森林,用隨機(jī)森林即可以對(duì)新數(shù)據(jù)進(jìn)行回歸或者分類(lèi)。
隨著城市化進(jìn)程的日益加快,中鐵十三局終于迎來(lái)了難得的發(fā)展機(jī)遇。2008年集團(tuán)年度總產(chǎn)值突破百億大關(guān),2010年突破兩百億。2011年集團(tuán)的年度利潤(rùn)達(dá)到4.3億元。1984—2011年,集團(tuán)的年企業(yè)總產(chǎn)值和年企業(yè)利潤(rùn)分別如圖1和圖2所示。
為了研究總產(chǎn)值以及年企業(yè)利潤(rùn)之間的關(guān)系,首先,需要確定自變量和因變量,由于本文是通過(guò)歷史數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)的總產(chǎn)值和利潤(rùn),將前n年的數(shù)據(jù)視為自變量,將第n+1年的數(shù)據(jù)視為因變量,2010年和2011年的數(shù)據(jù)不被用來(lái)擬合,而用來(lái)留作驗(yàn)證的依據(jù)。其次,分析各自變量之間的關(guān)系以及其與因變量之間的關(guān)系,基于規(guī)則集成方法和隨機(jī)森林方法,求得因變量和自變量之間的擬合函數(shù)關(guān)系。最后,通過(guò)預(yù)測(cè)函數(shù),輸入新的自變量,求得總產(chǎn)值和利潤(rùn)的預(yù)測(cè)值。在利用規(guī)則集成計(jì)算的過(guò)程中,當(dāng)n=4時(shí),第4個(gè)自變量(即4年前的總產(chǎn)值)的重要性已經(jīng)很低,因此選取前4年數(shù)據(jù)作為自變量,各個(gè)自變量的重要性如圖3所示。
圖1 中鐵十三局集團(tuán)1984—2011年企業(yè)總產(chǎn)值
圖2 中鐵十三局集團(tuán)1984—2011年企業(yè)利潤(rùn)
圖3 n=4時(shí)規(guī)則集成方法中4個(gè)自變量的相對(duì)重要性
本文中,規(guī)則集成算法是由R軟件中的rulefit接口完成的,隨機(jī)森林算法是由R軟件中的randomForest程序包完成的。在具體計(jì)算過(guò)程中,將每年的總產(chǎn)值和利潤(rùn)的數(shù)值轉(zhuǎn)變?yōu)槟暝鲩L(zhǎng)率,通過(guò)對(duì)年增長(zhǎng)率的預(yù)測(cè)進(jìn)一步確定總產(chǎn)值和利潤(rùn)的預(yù)測(cè)值。總產(chǎn)值和利潤(rùn)的年增長(zhǎng)率見(jiàn)表1和表2。
表1 中鐵十三局總產(chǎn)值年增長(zhǎng)率
表2 中鐵十三局利潤(rùn)年增長(zhǎng)率
兩種方法對(duì)2010年和2011年數(shù)據(jù)的預(yù)測(cè)結(jié)果以及預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)的誤差如表3所示。由驗(yàn)證過(guò)程可知,兩種方法均可以作為有效的預(yù)測(cè)方法,因此,用兩種方法所得結(jié)果的平均值來(lái)表示最終的預(yù)測(cè)值見(jiàn)表4。
表3 基于規(guī)則集成和RFA預(yù)測(cè)結(jié)果的驗(yàn)證比較
表4 基于規(guī)則集成和RFA 2012—2015年的預(yù)測(cè)結(jié)果
以上預(yù)測(cè)結(jié)果顯示,到2015年集團(tuán)的年度總產(chǎn)值將超過(guò)700億元,利潤(rùn)將突破10億元。為了實(shí)現(xiàn)預(yù)測(cè)的結(jié)果,并進(jìn)一步增強(qiáng)企業(yè)的核心競(jìng)爭(zhēng)力,以實(shí)現(xiàn)企業(yè)持續(xù)和諧發(fā)展,需要在企業(yè)管理、信息化建設(shè)、人才引進(jìn)與培養(yǎng)方面進(jìn)行創(chuàng)新。
公司在承攬項(xiàng)目的過(guò)程中,要緊跟國(guó)家政策,積極掌握各大城市以及大型能源礦產(chǎn)企業(yè)的投資建設(shè)信息。在發(fā)揮地鐵等傳統(tǒng)優(yōu)勢(shì)項(xiàng)目的基礎(chǔ)上,進(jìn)一步拓展輕軌、水電、火電等市場(chǎng)領(lǐng)域。在海外市場(chǎng)的開(kāi)發(fā)中,要尋求突破,在規(guī)避風(fēng)險(xiǎn)的同時(shí),積極承攬大型國(guó)際工程。要提前做好對(duì)承攬項(xiàng)目的效益分析與評(píng)價(jià),避免出現(xiàn)大的虧損項(xiàng)目。資金管理方面,要避免資金斷鏈;成本管理方面,各級(jí)員工要明確自身權(quán)限空間,嚴(yán)格執(zhí)行預(yù)算。
項(xiàng)目管理要加快信息化實(shí)施過(guò)程。要建立項(xiàng)目管理信息系統(tǒng),全面把握在建項(xiàng)目的動(dòng)態(tài)信息;要建立財(cái)務(wù)管理信息系統(tǒng),集中分散資金,保證資金安全的同時(shí),提高資金的使用效率。為保證項(xiàng)目管理信息化的落實(shí),應(yīng)根據(jù)集團(tuán)公司制定的達(dá)標(biāo)督察考評(píng)標(biāo)準(zhǔn)對(duì)在建項(xiàng)目進(jìn)行督察,以確保管理制度落實(shí)到位,從而使各項(xiàng)管理效果達(dá)到標(biāo)準(zhǔn),確保集團(tuán)在推進(jìn)信息化管理中進(jìn)一步提高項(xiàng)目創(chuàng)收能力。
集團(tuán)業(yè)務(wù)的大規(guī)模發(fā)展對(duì)人才的數(shù)量和結(jié)構(gòu)均提出了更高的要求,要加強(qiáng)人才的引進(jìn)和培養(yǎng),并增加職工的企業(yè)歸屬感。根據(jù)集團(tuán)公司的安排,結(jié)合本單位目前缺少工程設(shè)計(jì)人員與注冊(cè)工程師的實(shí)際情況,成立相應(yīng)的研發(fā)機(jī)構(gòu),聯(lián)合集團(tuán)內(nèi)、外部的設(shè)計(jì)單位,吸納注冊(cè)技術(shù)人才,鼓勵(lì)本單位人員報(bào)考國(guó)家注冊(cè)巖石、結(jié)構(gòu)、造價(jià)、咨詢(xún)工程師,并在待遇問(wèn)題上與社會(huì)接軌。通過(guò)3~5年的努力,完備設(shè)計(jì)資質(zhì),從而適應(yīng)建筑市場(chǎng)承包方式轉(zhuǎn)變的需要。
總之,科學(xué)準(zhǔn)確地預(yù)測(cè)集團(tuán)的發(fā)展,有助于集團(tuán)提前作好各方面的準(zhǔn)備工作,從而保證“十二五”期間的快速發(fā)展。
[1]方匡南,朱建平,謝邦昌.基于隨機(jī)森林方法的基金收益率方向預(yù)測(cè)與交易策略研究[J].經(jīng)濟(jì)經(jīng)緯,2010(2):61-65.
[2]郭嘉良.海岸帶漁業(yè)生態(tài)經(jīng)濟(jì)系統(tǒng)的隨機(jī)梯度和規(guī)則集成評(píng)價(jià)預(yù)測(cè)[D].天津:天津大學(xué)管理學(xué)院,2010.
[3]Friedman J H,Popescu B E.Predictive Learning via Rule Ensembles[M].Stanford University:Department of Statistics,2005.
[4]段永桓,王洪禮,李飛鵬.影響RFA高爾夫產(chǎn)業(yè)發(fā)展的因素分析與對(duì)策[J].天津大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2011,13(3):198-201.
[5]邱一卉.隨機(jī)森林在電信行業(yè)客戶(hù)流失預(yù)測(cè)中的應(yīng)用[D].廈門(mén):廈門(mén)大學(xué)管理學(xué)院,2008.
[6]Liaw A,Wiener M.Classification and regression by Random Forest[J].Rnews,2002(2):18-22.
[7]彭國(guó)蘭,林成德.基于隨機(jī)森林的企業(yè)食用評(píng)估模型[J].福州大學(xué)學(xué)報(bào),2008(36):153-156.