摘要:回歸分析是常被應(yīng)用于商業(yè)管理領(lǐng)域的“萬金油”統(tǒng)計推斷方法,由于在統(tǒng)計工具中運用回歸分析十分便利,工具背后的統(tǒng)計原理和假設(shè)常常被人忽略,以致于在實際問題中運用時容易經(jīng)不起推敲,甚至誤人子弟。為了糾正管理工作者常出現(xiàn)的錯誤認識,本文將結(jié)合自身的管理實踐經(jīng)驗梳理九個常見的回歸陷阱。
關(guān)鍵詞:統(tǒng)計;回歸分析;陷阱;數(shù)據(jù)
統(tǒng)計學是研究如何收集、整理、分析和解釋涉及社會、經(jīng)濟、管理問題的數(shù)據(jù),并對研究對象進行統(tǒng)計推斷的一門科學。
商業(yè)管理活動需要能夠洞察個人、組織并對其行動和狀態(tài)進行部分改善的的統(tǒng)計學。人類個體多樣,決策機制復雜,用自己的行為去強制改變別人很困難,因此在商業(yè)管理領(lǐng)域從事分析工作時,無論身處哪個行業(yè)、哪種職業(yè),都需要用數(shù)據(jù)來洞察、預測個人和組織的行動,進而尋找干預方法。
在筆者管理咨詢工作經(jīng)歷中,直接或間接地看到、聽到了很多運用數(shù)學、統(tǒng)計工具的案例,其中最常被人掛嘴邊的、堪稱統(tǒng)計學王道的方法便是“回歸分析”。
回歸分析能夠在控制其他因素的前提下,對某個具體變量與某個特定結(jié)果之間的關(guān)系進行量化分析,是一件深奧到值得人研究一輩子,又簡單到人人能夠運用的強大的統(tǒng)計工具。咨詢或者說管理工作中,我們可以運用它量化地搭建預測模型、評估模型或者導出一些系數(shù)的值,但即便是行業(yè)內(nèi)的高材生,由于久疏研究,也會漸漸淡忘一些工具背后的原理和假設(shè)、忽視了每一步操作背后的實質(zhì)意義,以致于在實際問題中運用時容易經(jīng)不起推敲,甚至誤人子弟。為了糾正管理工作者常出現(xiàn)的錯誤認識,下面就梳理、介紹一些較為常見的回歸陷阱。
陷阱一:用線性回歸分析非線性關(guān)系
一般統(tǒng)計工具默認的回歸操作是線性回歸,生活中很多因素之間的關(guān)聯(lián)也確實是偏線性的,因此很多人建模時就習慣性地在工具中將自變量、因變量選上,然后導出結(jié)果。然而復雜的現(xiàn)實問題中也存在大量非線性關(guān)系,比如有規(guī)模經(jīng)濟效益的業(yè)務(wù)量增長與成本投入的關(guān)系、資本結(jié)構(gòu)與經(jīng)營績效的關(guān)系、經(jīng)濟增長與失業(yè)的關(guān)系、員工年齡與流失率的關(guān)系、物質(zhì)獎勵與激勵效果的關(guān)系等等。線性關(guān)系是互不相干的獨立關(guān)系,而非線性則是相互作用,而正是這種相互作用,使得整體不再是簡單地等于部分之和,而可能出現(xiàn)不同于"線性疊加"的增益或虧損,這時僅僅用單純的線性回歸,哪怕僥幸通過統(tǒng)計檢驗,結(jié)果也沒有任何意義,甚至會引人做出危險的決策。
陷阱二:迷信P值
做過實證研究的,哪怕對統(tǒng)計原理一知半解,也應(yīng)該知道P<0.05這個足以給研究結(jié)果判生死的指標,事實上它只是費舍爾提出的一個經(jīng)驗值,它的內(nèi)涵通俗點講就是“如果原假設(shè)是正確的,出現(xiàn)觀測樣本這種情況的可能性,如果低于5%,那就可視為小概率事件,拒絕原假設(shè)”。通過P值檢驗并不代表變量間的關(guān)聯(lián)度就有多大(significance在中文中被稱作“顯著性”,這種說法常常引起人們對其內(nèi)涵的誤解),未通過也并不意味著你所搭建的模型就一定不成立,很可能只是樣本量不夠、數(shù)據(jù)質(zhì)量不佳罷了,事實上增大樣本量確實是降低p值的有效手段。美國統(tǒng)計學協(xié)會
2016年專門發(fā)布了官方吐槽,認為P值已經(jīng)遭到了相當程度的誤解、迷信和濫用,有調(diào)查表明約有三分之一的號稱有統(tǒng)計學差異的P<0.05的研究結(jié)論都是錯誤的。這種迷信和濫用主要表現(xiàn)在:1.認為P值代表假說為真的概率率;2. 忘記了“合理的推斷過程需要完整的報告和透明度”,覺得只要把P值放出來就大功告成;3. 僅僅用P值來得出科學結(jié)論、商業(yè)決策或制定政策。
因此,成功的科學決策取決于很多方面,包括實驗的設(shè)計,測量的質(zhì)量,外部的信息和證據(jù),假設(shè)的合理性等等。僅僅看P值是否小于0.05是非常具有誤導性的。對于在商業(yè)管理領(lǐng)域應(yīng)用統(tǒng)計方法的我們,畢竟不是在做自然科學研究,在有充分外部證據(jù)以及對假設(shè)的信心時,適當放寬P值門檻也沒有問題。
此外,統(tǒng)計學研究方法并不只有一個P值,還有諸如95%可信區(qū)間、偽發(fā)現(xiàn)率、貝葉斯分析方法等大量的統(tǒng)計學方法指標,可以用做P值的補充或者替代品。一定程度上的聯(lián)合運用有助于彌補各個方法本身的漏洞,使得結(jié)論更為可信。
陷阱三:顯著但應(yīng)用價值不大
商業(yè)管理領(lǐng)域很多問題的影響因素都非常多非常復雜,說實話不是很推薦在資源有限的情況下去嘗試通過回歸分析建模。
R方的含義是預測值解釋了因變量的方差的多大比例,衡量的是預測值對于真值的擬合好壞程度。對于做學術(shù)研究的人來說,找到一個顯著的影響因素,哪怕R方不是太大,即對結(jié)果的解釋力度不是很大,也算是一種學術(shù)貢獻。但在商業(yè)應(yīng)用中,我們需要找到影響力度足夠大的那個因素或那一系列因素,并以最小的管理成本去進行干預,對結(jié)果變化影響甚微的所謂的模型再顯著也沒有太大的應(yīng)用價值。
陷阱四:缺乏對因果關(guān)系的深入探究
“因果”是個大命題,看似回歸分析成功導出了一個結(jié)果,也不意味著因果關(guān)系就必然確定了。一個古老的謬誤是:如果B緊跟著A出現(xiàn),那么A一定導致B。比如有的管理者曾費盡周折探求抽煙越多是否就越會導致員工績效變差,研究的結(jié)果似乎也給了肯定的結(jié)論,但此例難道不能是相反的解釋嗎?也許正是因為績效變差才促使員工壓力更大、抽更多煙呢?
要弄清楚因素之間的作用機制,我個人認為至少在復雜的管理領(lǐng)域就很有必要考慮是否可能存在調(diào)節(jié)效應(yīng)或者中介效應(yīng),以此找到真正有效的干預目標。當然也很有可能的是所有變量互相間均沒有任何影響,只是有一個第三因素恰好能影響這些變量,比如A銷售公司收入與某產(chǎn)品價格同步上漲,很可能只是因為全國物價水平上漲了,而非存在內(nèi)幕關(guān)聯(lián)。此外,必須避免出現(xiàn)因果倒置的情況,典型的例子就是拿失業(yè)率預測GDP,通過回歸分析很可能會得出降低失業(yè)率能促進GDP增長的結(jié)論,但事實上真正的作用機制應(yīng)該是通過促進GDP增長來降低失業(yè)率。甚至于,因果關(guān)系有時候是雙向的,比如某地K12教育投入和經(jīng)濟增長的關(guān)系,我們既可以說K12教育的發(fā)展推動了經(jīng)濟增長,也可以認為只有經(jīng)濟水平高的地方才有錢在K12教育領(lǐng)域投入更多資金,還可以說K12教育支出推動了經(jīng)濟增長,從而為進一步增大教育投入提供了可能,即互為因果。這里的關(guān)鍵就在于盡量避免使用受結(jié)果影響的因變量,不然因果的方向?qū)o休止地爭議下去。
陷阱五:選取的自變量相互之間高度相關(guān)
當兩個或兩個以上自變量彼此間高度相關(guān)時,回歸分析的結(jié)果將可能無法分清每一個自變量與因變量之間的真實關(guān)系,這種情況在統(tǒng)計學中稱為多重共線性。比如在引入財務(wù)變量時,常有人將總收入、營業(yè)收入、主營業(yè)務(wù)收入等一系列指標均導入工具跑回歸,事實上這些都是反映收入規(guī)模這一因素的變量。當變量較多時,我們主觀上未必能識別出所有變量之間的關(guān)系強弱,所以多重共線性是很容易發(fā)生的,研究者一定要對此足夠敏感,先用數(shù)據(jù)檢驗變量間的相關(guān)性,再通過變量取舍、創(chuàng)造新的綜合性變量或直接通過逐步回歸等方法來盡量消除多重共線性。
陷阱六:變量過多
有些人擔心遺漏重要的因素,會將大量可獲取的變量加入回歸分析,以期得到完美的模型。然而當變量過多,尤其是無關(guān)的變量過多時,回歸的結(jié)果反而容易被稀釋。當回歸中加入了過多無關(guān)變量,總會有一個兩個恰好顯著性水平達標,那研究者往往就會花大量精力去事后解釋這些看似有用的、具有統(tǒng)計意義的因素,徒增成本。
陷阱七:脫離數(shù)據(jù)進行推斷
嚴謹來說,回歸分析的結(jié)論僅僅是對與所分析樣本相似的對象有效,未必能泛化到更廣闊的群體。比如我們依據(jù)一家單位總部員工的數(shù)據(jù)搭建了一個模型,得到的各個系數(shù),甚至適用的變量都不一定能直接應(yīng)用到下屬單位、外地單位、其他業(yè)務(wù)線。還有常見的就是考慮到獲得方便,只拿行業(yè)內(nèi)上市公司的數(shù)據(jù)進行分析,但每個行業(yè)內(nèi)的上市公司只是少數(shù)經(jīng)營得好的代表,回歸分析前必須充分考慮分析結(jié)果是否能夠泛化到自己想論證的假設(shè)。
陷阱八:缺乏嚴格的統(tǒng)計診斷
統(tǒng)計診斷是數(shù)據(jù)分析的重要組成部分,是對實際問題中收集起來的數(shù)據(jù)和提煉出來的模型以及由此出發(fā)所作的推斷方法的合理性進行細致的分析,并通過一些診斷統(tǒng)計量來檢查數(shù)據(jù)、模型及推斷方法中可能存在的“毛病”,進而提出“治療”方案,也就是說對統(tǒng)計方法解決問題的全過程進行診斷。診斷的要點主要就是:1.模型或假設(shè)是否合理;2.數(shù)據(jù)與模型是否大體一致;3.是否有異常點、強影響點、高杠桿點;4.數(shù)據(jù)或模型的擾動對推斷的影響如何;5.是否需要作數(shù)據(jù)變換以及如何作變換。對非統(tǒng)計科班出身的經(jīng)營管理者來說,統(tǒng)計診斷或許是陌生的概念,很多人做回歸前甚至都不會考慮以上這些問題,但這些問題的存在都是有可能撼動模型基礎(chǔ)的,嚴格的診斷十分必要。
陷阱九:缺乏嚴謹?shù)某闃硬呗?/p>
調(diào)查數(shù)據(jù)有一個顯著特征,即一般情況下都存在一定誤差,管理活動中想獲得高質(zhì)量的、以人為調(diào)查對象的數(shù)據(jù)是比較困難的,要將人的主觀因素干擾降到最低限度不僅僅需要與人打交道的藝術(shù),還需要在技術(shù)上設(shè)計科學的抽樣策略。
在選取數(shù)據(jù)時,一定要想清楚目標對象的內(nèi)部結(jié)構(gòu)(確保能對總體有足夠的代表性),綜合測算抽樣誤差和抽樣成本后,最優(yōu)化地選擇簡單隨機抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多階段抽樣等。此外,一定要避免非概率抽樣,即根據(jù)自己的方便或主觀判斷抽取樣本的方法,方便抽樣、滾雪球抽樣均屬于非概率抽樣,這是在抽樣實踐中常常被人忽略的問題。
另外在抽樣中,如果我們建模的數(shù)據(jù)是通過問卷調(diào)查得來的,那問卷的話術(shù)和設(shè)計思路也必須嚴格起來,引入心理測量學的方法提高問卷信度和效度。
雖說有以上陷阱影響分析的結(jié)論,回歸分析依然是非常棒的統(tǒng)計學工具,但用數(shù)據(jù)說謊很容易,讓數(shù)據(jù)說真相缺很難(事實上,統(tǒng)計學的內(nèi)在原理并沒有那么直觀和易理解)。因此在使用時一是要想清楚選擇哪些變量、如何收集數(shù)據(jù);二是必須以觀察樣本為立足點(其他大部分統(tǒng)計推斷也是同樣道理)??傊鳛樯虡I(yè)管理領(lǐng)域的從業(yè)者,我們在運用統(tǒng)計科學解決現(xiàn)實問題時既不能盲目依賴便利的工具憑感覺搭建模型,也不能盲目迷信數(shù)據(jù)而忽略了對事實情況最起碼的觀察和理解。
參考文獻:
[1]查爾斯·惠倫. 赤裸裸的統(tǒng)計學[M]. 中信出版社,2013. 11.
[2]西內(nèi)啟. 統(tǒng)計思維[M]. 浙江人民出版社,2017. 12.
[3]金勇進. 抽樣:理論與應(yīng)用(第二版)[M]. 高等教育出版社,2016. 1.
[4]黃江寧. 統(tǒng)計學在現(xiàn)代企業(yè)管理中的應(yīng)用[J]. 統(tǒng)計與管理,2016,(08).
[5]毛青. 論現(xiàn)代企業(yè)管理中統(tǒng)計學的應(yīng)用[J]. 民營科技,2013,(01).
作者簡介:顧金鳴(1993.1—),男,漢族,江蘇蘇州人,碩士研究生學歷(在讀),中國人民大學研究生,研究方向:管理統(tǒng)計學。