劉冰+李長(zhǎng)軍
內(nèi)容摘要:本文從與企業(yè)績(jī)效相關(guān)的變量出發(fā),綜合國內(nèi)外相關(guān)文獻(xiàn),介紹回歸方法的基本概念?;谥圃鞓I(yè)上市公司財(cái)務(wù)數(shù)據(jù),研究分析與企業(yè)績(jī)效相關(guān)的24個(gè)變量,分別使用最小二乘法、相關(guān)系數(shù)法、嶺回歸、最優(yōu)子集選擇法和lasso方法進(jìn)行回歸,根據(jù)回歸結(jié)果比較不同方法的優(yōu)劣處,綜合選擇最優(yōu)的回歸方法得到最優(yōu)的模型為lasso模型,并解釋模型,通過交叉驗(yàn)證的方法進(jìn)行驗(yàn)證分析。最后通過模型提出建議:優(yōu)化高管結(jié)構(gòu),根據(jù)行業(yè)特征選擇最優(yōu)企業(yè)模型,保證審計(jì)意見準(zhǔn)確,并且由于公司規(guī)模較大后規(guī)模報(bào)酬遞減,因此在公司規(guī)模擴(kuò)大到一定程度后應(yīng)停止擴(kuò)張。
關(guān)鍵詞:企業(yè)績(jī)效 ? 嶺回歸 ? 最優(yōu)子集選擇法 ? lasso ? 交叉驗(yàn)證
問題的提出
(一)研究背景
本文旨在從眾多變量中篩選出有價(jià)值的變量,利用篩選出的變量進(jìn)行企業(yè)績(jī)效的相關(guān)性分析,以期發(fā)現(xiàn)實(shí)際意義。本文區(qū)別于傳統(tǒng)的根據(jù)專家選擇解釋變量建立回歸模型的方法,而將挑選和企業(yè)績(jī)效相關(guān)的因素的過程引入到建模。基于2015年制造業(yè)上市公司財(cái)務(wù)數(shù)據(jù),研究分析與企業(yè)績(jī)效相關(guān)的24個(gè)變量,分別使用最小二乘法、最優(yōu)子集選擇法、嶺回歸和lasso方法進(jìn)行分別回歸,根據(jù)回歸結(jié)果比較不同方法的優(yōu)劣處,綜合選擇最優(yōu)的模型并解釋模型。最后通過交叉驗(yàn)證的方法進(jìn)行驗(yàn)證分析。
本文在使用最小二乘法、最優(yōu)子集選擇法、嶺回歸和lasso算法后分析比較得出,lasso算法無論是在變量選擇還是擬合優(yōu)度方面都表現(xiàn)得更為出色。根據(jù)研究過程,本文也針對(duì)企業(yè)績(jī)效提出相關(guān)建議。
(二)數(shù)據(jù)來源及樣本處理
本文選用制造業(yè)上市公司2015年公開披露的財(cái)務(wù)數(shù)據(jù)1686個(gè),在此基礎(chǔ)上做了如下處理:刪除ST、*ST企業(yè)的樣本;刪除相關(guān)變量缺失的企業(yè)樣本,最終得到了1006個(gè)企業(yè)年度數(shù)據(jù),為消除離群值的影響,對(duì)所有連續(xù)型變量進(jìn)行了(1%,99%)的縮尾處理。本文數(shù)據(jù)均來自國泰君安數(shù)據(jù)庫。
本文用ROA表示企業(yè)績(jī)效,同時(shí)選取24個(gè)可能與它相關(guān)的變量,分別是董事會(huì)效率、董事會(huì)獨(dú)立性、公司規(guī)模、公司年齡、市凈率、比率結(jié)構(gòu)(有形資產(chǎn)比率、無形資產(chǎn)比率)、主營業(yè)務(wù)利潤占比、財(cái)務(wù)杠桿、總股數(shù)、國有股占比、資產(chǎn)負(fù)債率、歸屬于上市公司股東的扣除非經(jīng)常性損益的凈利潤、加權(quán)平均凈資產(chǎn)收益率、基本每股收益、審計(jì)意見、內(nèi)控評(píng)價(jià)報(bào)告(是否披露內(nèi)控評(píng)價(jià)報(bào)告、是否出具內(nèi)控評(píng)價(jià)報(bào)告結(jié)論、內(nèi)部控制是否有效、內(nèi)部控制是否存在缺陷)、高管資料(年齡、教育背景、年末持股數(shù))、公司年齡。
企業(yè)績(jī)效模型建立與實(shí)證分析
(一)最小二乘模型
本文采用最小二乘法為對(duì)照組,用以比較其它回歸方法得到的結(jié)果,并從中選出最優(yōu)模型。說明:所有數(shù)據(jù)已進(jìn)行了標(biāo)準(zhǔn)化處理,所以模型的系數(shù)大小說明的是比例,與量綱無關(guān)。在最后做出預(yù)測(cè)時(shí),只需根據(jù)均值和標(biāo)準(zhǔn)差進(jìn)行還原即可。關(guān)于目標(biāo)函數(shù)求得最小二乘解和顯著性檢驗(yàn)結(jié)果,如表1所示。
從回歸的結(jié)果可以看出,大部分變量的系數(shù)不能通過顯著性檢驗(yàn),說明回歸的結(jié)果不佳,模型里摻雜了很多不相關(guān)的變量。
加權(quán)平均凈資產(chǎn)收益率、資產(chǎn)負(fù)債率等指標(biāo)能較為直接的反映企業(yè)績(jī)效,因?yàn)樗鼈兪桥c企業(yè)績(jī)效直接相關(guān)的變量。需要引起關(guān)注的是顯著變量中的審計(jì)意見類型、高管年齡和高管持股數(shù),其對(duì)企業(yè)績(jī)效產(chǎn)生了顯著的影響。
(二)最優(yōu)子集選擇模型
最優(yōu)子集選擇法的思想是對(duì)p個(gè)變量的所有可能組合分別使用最小二乘回歸進(jìn)行擬合,最后在所有可能模型中選擇一個(gè)最優(yōu)模型。
將最優(yōu)子集選擇法運(yùn)用財(cái)務(wù)數(shù)據(jù)中,可以看到對(duì)于24個(gè)變量,模型中的變量數(shù)k的選擇也有24種,對(duì)于每個(gè)k都有一個(gè)最優(yōu)的模型。先對(duì)k=1,2,…,24分別選出最優(yōu)模型,最后綜合選出這24個(gè)不同的k的最優(yōu)模型。模型誤差與k的關(guān)系如圖1所示。
從圖1中可以看出,當(dāng)模型的變量個(gè)數(shù)k取4時(shí),模型的測(cè)試誤差達(dá)到了最小值,此時(shí)的模型正是所要求的模型。且當(dāng)模型中變量個(gè)數(shù)很大時(shí),模型的誤差大大增加,即達(dá)到擬合狀態(tài)。
在最優(yōu)子集選擇法中保留下來的變量為市凈率、資產(chǎn)負(fù)債率、凈資產(chǎn)收益率、基本每股收益。這樣的結(jié)果是有說服力的,因?yàn)檫@四個(gè)變量都可以作為企業(yè)績(jī)效的直接體現(xiàn),同時(shí)也得到一個(gè)結(jié)論,模型的準(zhǔn)確性極高,解釋性極強(qiáng)。但并不能作為很有意義的信息,以提出有效的結(jié)論。所以應(yīng)當(dāng)增加模型中的變量數(shù),找出與企業(yè)績(jī)效非直接相關(guān)的變量,當(dāng)模型的變量增加到5個(gè)時(shí),公司規(guī)模加入了模型;當(dāng)變量增加到6個(gè)時(shí),審計(jì)意見類型又加入了模型。
公司規(guī)模的系數(shù)為負(fù)數(shù),即公司規(guī)模越大,企業(yè)績(jī)效越差,這顯然與顯示情況不完全相同。直接觀察公司規(guī)模和企業(yè)績(jī)效的關(guān)系如圖2所示。
公司規(guī)模與企業(yè)績(jī)效有較明顯的相關(guān)關(guān)系,即公司規(guī)模與企業(yè)績(jī)效的關(guān)系是一個(gè)較為明顯的倒U凹函數(shù)。在短期內(nèi)小幅度增加公司規(guī)模對(duì)于企業(yè)績(jī)效有一個(gè)有益的促進(jìn),由斜率可以看出,公司規(guī)模的擴(kuò)大會(huì)使企業(yè)績(jī)效快速發(fā)展,但這只在小規(guī)模企業(yè)成立;當(dāng)企業(yè)規(guī)模漸漸擴(kuò)大時(shí),企業(yè)績(jī)效不再呈增長(zhǎng)趨勢(shì),而是緩緩下降,也由斜率可以看出,企業(yè)績(jī)效的下降速度較緩慢。
審計(jì)意見被證明是一個(gè)和企業(yè)績(jī)效顯著相關(guān)的變量。由于審計(jì)意見變量是個(gè)定性變量,因此在回歸時(shí)當(dāng)作啞變量來處理,并且賦予審計(jì)意見得分(見表2)。
審計(jì)意見類型對(duì)企業(yè)績(jī)效有著顯著的影響,處理數(shù)據(jù)得到的審計(jì)意見得分是根據(jù)審計(jì)意見類型的優(yōu)劣來排序的。對(duì)于審計(jì)意見得分這個(gè)變量,企業(yè)績(jī)效的最優(yōu)子集選擇的系數(shù)顯著為正。只有科學(xué)的結(jié)構(gòu)和良好的企業(yè)績(jī)效才會(huì)得到審計(jì)者的信任,因此公司績(jī)效的好壞是與審計(jì)意見類型直接相關(guān)的??梢哉f,企業(yè)績(jī)效良好的企業(yè)會(huì)更容易得到給出審計(jì)意見類型的注冊(cè)會(huì)計(jì)師的信任,并且審計(jì)意見類型良好的企業(yè)所給出的報(bào)表更加真實(shí)公允不做假,這樣的企業(yè)一般信譽(yù)較高,所以對(duì)公司績(jī)效有一個(gè)正的作用。
(三)嶺回歸模型
嶺回歸的目標(biāo)函數(shù)為,從目標(biāo)函數(shù)可以看出,它與最小二乘最大的不同是加入了一項(xiàng),稱為壓縮懲罰,當(dāng)β1、…、βp接近零時(shí)比較小,因此具有將βj的估計(jì)值往零的方向進(jìn)行壓縮的作用。當(dāng)λ=0時(shí),懲罰項(xiàng)不產(chǎn)生作用,嶺回歸與最小二乘估計(jì)結(jié)果相同。隨著λ→∞,壓縮懲罰項(xiàng)的影響力增加,嶺回歸系數(shù)估計(jì)值越來越接近零。與最小二乘法得到的唯一的估計(jì)結(jié)果不同,嶺回歸得到的系數(shù)估計(jì)結(jié)果βRλ隨λ的變化而變化。
從λ取值從0到5,等距取1000個(gè)值。圖3直接給出了在不同λ下的嶺回歸對(duì)企業(yè)績(jī)效的估計(jì)值和企業(yè)績(jī)效真實(shí)值之間的誤差。
從圖3中可以看出,在參數(shù)λ位于虛線之間時(shí),殘差平方和達(dá)到最小,即嶺回歸效果最好。在λ較小時(shí),誤差一致處于較低的水平,但是當(dāng)λ超過某個(gè)值后,誤差迅速增加。這是由于當(dāng)λ變得過大時(shí),懲罰項(xiàng)的作用太大,以至于在求解目標(biāo)函數(shù)最優(yōu)解時(shí)忽略了殘差平方和。通過十折交叉驗(yàn)證法,可以求出建模效果最好的λ的取值。
綜上所述,嶺回歸效果最好時(shí),則存在λ=0.08008008。即在λ=0.08008008時(shí)嶺回歸所得的模型最優(yōu)。由于篇幅所限,嶺回歸系數(shù)在此不一一列出,但通過結(jié)果能夠發(fā)現(xiàn),嶺回歸過程沒有實(shí)現(xiàn)篩選一些與企業(yè)績(jī)效顯著相關(guān)的變量的效果,而是將所有可能與企業(yè)績(jī)效相關(guān)的變量系數(shù)整體壓縮后得到回歸結(jié)果。但同時(shí)嶺回歸仍然提升了最小二乘估計(jì)的效果。嶺回歸的劣勢(shì)在于它的復(fù)雜度懲罰項(xiàng)可以將系數(shù)往0的方向進(jìn)行縮減,但是不會(huì)把任何一個(gè)變量的系數(shù)確切的壓縮至0(除非λ=∞)。本文將進(jìn)一步使用lasso方法來解決這個(gè)問題。
(四)lasso模型
lasso是近年來常用的用于克服嶺回歸上述缺點(diǎn)的方法。lasso的系數(shù)βLλ通過求解目標(biāo)函數(shù)得到。比較lasso和嶺回歸的目標(biāo)函數(shù),可以發(fā)現(xiàn)它們具有相似的擬合公式。唯一的區(qū)別是嶺回歸中的β2j項(xiàng)在lasso中被替代為上式中的|βj|。與嶺回歸相同,lasso也將系數(shù)估計(jì)值向0的方向進(jìn)行縮減。當(dāng)調(diào)節(jié)參數(shù)λ足夠大時(shí),它的懲罰項(xiàng)具有將其中某些系數(shù)的估計(jì)值強(qiáng)制設(shè)定為0的作用。因此,lasso建立的模型與嶺回歸建立的模型相比更易于解釋。研究中,lasso起到的作用和最優(yōu)子集選擇法較為相似,即把與企業(yè)績(jī)效顯著相關(guān)的變量篩選出來。
與嶺回歸的步驟相同,首先應(yīng)選定合適的參數(shù)λ,使得模型的交叉驗(yàn)證集誤差最小,從圖4中可以看出,參數(shù)λ在兩條虛線之間時(shí)達(dá)到最優(yōu)模型,此時(shí)λ=0.03503504,相比較嶺回歸而言,lasso的參數(shù)λ較小,說明收縮程度并不大,但仍然達(dá)到了篩選變量的效果。最優(yōu)模型的系數(shù)如表3所示。
最終選出的變量有資產(chǎn)負(fù)債率、歸屬于上市公司股東的扣除非經(jīng)常性損益的凈利潤、加權(quán)平均凈資產(chǎn)收益率、基本每股收益、公司規(guī)模、高管年齡、高管年末持股數(shù)七個(gè)變量。其中可以得到關(guān)于企業(yè)績(jī)效有效的結(jié)論和提升企業(yè)績(jī)效的建議的變量有公司規(guī)模、高管年齡、高管年末持股數(shù)這三個(gè)變量,因?yàn)槭O碌乃膫€(gè)變量可以直接表示企業(yè)經(jīng)營狀況,并不能提供建議。
公司規(guī)模顯然是一個(gè)與企業(yè)績(jī)效相關(guān)的變量,因?yàn)樗谧顑?yōu)子集選擇法和lasso中都被顯著挑選出來作為企業(yè)績(jī)效的解釋因素。從前面的分析中可知,公司規(guī)模對(duì)于企業(yè)績(jī)效在短期內(nèi)應(yīng)該是正相關(guān)的關(guān)系,但在公司規(guī)模擴(kuò)大到一定程度后,再進(jìn)行擴(kuò)張就會(huì)使企業(yè)績(jī)效向相反方向變動(dòng)。在信息完全且不考慮企業(yè)內(nèi)部腐敗成本的情況下,理論上的公司規(guī)模的擴(kuò)大會(huì)使生產(chǎn)、加工、管理、損耗都成規(guī)模,產(chǎn)品規(guī)格標(biāo)準(zhǔn)化,大量購入原材料致使單位成本下降,管理人員技術(shù)人員生產(chǎn)方案和資源分配的選擇更多,顯然會(huì)比公司規(guī)模較小時(shí)達(dá)到更優(yōu)的帕累托最優(yōu)狀態(tài)。但現(xiàn)實(shí)中的市場(chǎng)是不完全的市場(chǎng),企業(yè)規(guī)模擴(kuò)大到某種程度會(huì)讓生產(chǎn)管理成本都飛速增加,在大企業(yè)中也很難實(shí)現(xiàn)像小企業(yè)一樣的面面俱到的監(jiān)督管理。
高管年齡和高管年末持股屬于企業(yè)的高管特征變量。從系數(shù)可以看出,高管年齡對(duì)企業(yè)績(jī)效呈顯著的弱正相關(guān)關(guān)系,高管年末持股數(shù)與企業(yè)績(jī)效呈現(xiàn)較強(qiáng)的正相關(guān)關(guān)系。與過去較為封閉保守的市場(chǎng)環(huán)境不同,年齡較大且經(jīng)驗(yàn)豐富的管理者,比年輕的管理者對(duì)于企業(yè)績(jī)效的提升而言,優(yōu)勢(shì)并不明顯,因?yàn)槲覈袌?chǎng)已經(jīng)步入轉(zhuǎn)型期,機(jī)遇增多,高管年齡對(duì)于企業(yè)績(jī)效不再是一個(gè)至關(guān)重要的因素,但工作經(jīng)驗(yàn)仍然是優(yōu)勢(shì)。對(duì)于高管年齡的研究也很豐富, Wiersema M F和Bantel K A等認(rèn)為,高管年齡的多樣化程度高,異質(zhì)性較大,與企業(yè)績(jī)效負(fù)相關(guān);而高管年齡的同質(zhì)性較高對(duì)企業(yè)績(jī)效有正面影響但作用不大,這也與本文得到的顯著弱正相關(guān)關(guān)系一致。
高管年末持股數(shù)與企業(yè)績(jī)效呈現(xiàn)顯著正相關(guān)關(guān)系。每增加0.01%的高管持股數(shù),企業(yè)績(jī)效可以增加0.05%。高管的持股比例獎(jiǎng)勵(lì)會(huì)引發(fā)激勵(lì)效應(yīng)。但企業(yè)的高管持股比例普遍較低,這會(huì)影響激勵(lì)效應(yīng)的發(fā)揮;其次,很多企業(yè)的高管持股比例數(shù)據(jù)為零,即并無正式的股權(quán)激勵(lì)政策,沒有對(duì)所有高管人員進(jìn)行股權(quán)激勵(lì),因此激勵(lì)效果也會(huì)大打折扣。
模型比較與政策建議
(一)模型結(jié)果比較
不同的模型有各自的優(yōu)缺點(diǎn)。例如最小二乘法會(huì)引入很多不顯著相關(guān)的變量,信息冗雜,給影響企業(yè)績(jī)效的真實(shí)因素帶來了噪聲影響;最優(yōu)子集選擇法是一種不解析、不連續(xù)的方法,它對(duì)于系數(shù)的收縮不是循序的,估計(jì)結(jié)果的方差極大,數(shù)據(jù)有一點(diǎn)差異可能會(huì)給結(jié)果帶來很大的改變;嶺回歸方法克服了最優(yōu)子集選擇法不連續(xù)的缺點(diǎn),它實(shí)現(xiàn)了系數(shù)的連續(xù)變化,但是不能將一些變量的系數(shù)直接收縮到零;lasso是介于嶺回歸和最優(yōu)子集選擇法之間的一種方法,不僅實(shí)現(xiàn)了算法的連續(xù),并且它的解是稀疏的,即能夠?qū)⒉糠肿兞亢Y掉。表4給出了在研究企業(yè)績(jī)效相關(guān)性問題上運(yùn)用這幾種方法的效果。
由結(jié)果可以看出,所采用的三個(gè)降低模型復(fù)雜度的回歸方法的確在最小二乘法的基礎(chǔ)上改善了很多,在對(duì)企業(yè)績(jī)效的預(yù)測(cè)方面比原本的精度提高了5%以上,lasso算法甚至將精度提高了10%,其中最優(yōu)子集選擇法和嶺回歸的回歸效果相似,但是最優(yōu)子集選擇法只使用了6個(gè)變量(市凈率、資產(chǎn)負(fù)債率、凈資產(chǎn)收益率、基本每股收益、公司規(guī)模、審計(jì)意見類型)評(píng)價(jià)企業(yè)績(jī)效的預(yù)測(cè),而嶺回歸使用了24個(gè)變量,所以在評(píng)價(jià)最優(yōu)子集選擇法比嶺回歸更有意義。而lasso無論是在變量選擇和回歸精度方面的表現(xiàn)都更加出色。它只用了資產(chǎn)負(fù)債率、歸屬于上市公司股東的扣除非經(jīng)常性損益的凈利潤、加權(quán)平均凈資產(chǎn)收益率、基本每股收益、公司規(guī)模(總股數(shù))、高管年齡、高管年末持股數(shù)7個(gè)變量就使預(yù)測(cè)精度提高到75%,說明lasso模型更有意義。
(二)政策建議
公司規(guī)模與企業(yè)績(jī)效息息相關(guān),在短期內(nèi),企業(yè)規(guī)模的擴(kuò)大能夠?qū)崿F(xiàn)生產(chǎn)或經(jīng)銷單位成本的降低,處于規(guī)模報(bào)酬遞增狀態(tài),但當(dāng)公司規(guī)模擴(kuò)大到一定程度后會(huì)處于規(guī)模報(bào)酬遞減狀態(tài),應(yīng)穩(wěn)定企業(yè)發(fā)展,因此絕不能一味盲目擴(kuò)大規(guī)模。
審計(jì)意見類型良好的企業(yè)所給出的報(bào)表應(yīng)更加真實(shí),從而有較高的信譽(yù),審計(jì)意見類型可以一定程度上反映企業(yè)的經(jīng)營和誠信狀況。審計(jì)意見類型指標(biāo)較技術(shù)性的指標(biāo)處在一個(gè)更加重要的地位,所以相比較企業(yè)的經(jīng)營方式、營銷手段等技術(shù)指標(biāo),更應(yīng)注意企業(yè)的誠信建設(shè)。
高管特征在研究中處于重要地位。lasso方法選出的三個(gè)變量中有兩個(gè)是高管特征變量,因此應(yīng)當(dāng)注意培養(yǎng)人才留住人才,管理人員是企業(yè)命脈,適當(dāng)選擇經(jīng)驗(yàn)豐富的經(jīng)理人,保證管理階層的同質(zhì)性,少追求管理階層年齡和教育背景的多樣化。
尤為重要的是對(duì)管理人員適當(dāng)采取股權(quán)激勵(lì)機(jī)制。雖然高管的持股比例很小,但對(duì)其實(shí)施股權(quán)激勵(lì)將會(huì)發(fā)揮巨大的作用,當(dāng)經(jīng)理人股權(quán)達(dá)到一定數(shù)目后,不僅能夠提高忠誠度,還能監(jiān)督治理企業(yè)內(nèi)部腐敗。