周莊蝶 周曉東 王云娟
[摘 要]文章利用Kaplan-Meier生存分析法和Cox比例風險模型對我國2014—2017年間244家已倒閉互聯(lián)網(wǎng)企業(yè)和68家尚未倒閉企業(yè)進行實證研究,探尋我國互聯(lián)網(wǎng)企業(yè)生存期規(guī)律及其可能的影響因素。研究結(jié)果表明:我國互聯(lián)網(wǎng)企業(yè)生存期與企業(yè)的行業(yè)和地區(qū)都有顯著關(guān)系。建議互聯(lián)網(wǎng)企業(yè)應(yīng)認清所在行業(yè)特點,深入研究所在地區(qū)網(wǎng)民習慣及地域特點,才能更好地持續(xù)經(jīng)營。
[關(guān)鍵詞]互聯(lián)網(wǎng)企業(yè);Kaplan-Meier生存分析;Cox生存模型
[DOI]10.13939/j.cnki.zgsc.2018.12.070
隨著我國互聯(lián)網(wǎng)的普及和消費者消費習慣的改變,以計算機網(wǎng)絡(luò)技術(shù)為基礎(chǔ),利用網(wǎng)絡(luò)平臺提供服務(wù)并獲得收入的互聯(lián)網(wǎng)企業(yè)發(fā)展迅猛。但一個不爭的事實是,隨著市場競爭的加劇,大量的互聯(lián)網(wǎng)企業(yè)選擇退出甚至被擠出市場。與中國的大部分行業(yè)一樣,我國的互聯(lián)網(wǎng)企業(yè)也呈現(xiàn)出較高退出率的流轉(zhuǎn)特征(鮑宗客[1])。因此我國互聯(lián)網(wǎng)企業(yè)呈現(xiàn)的一個顯著特征是企業(yè)的持續(xù)經(jīng)營時期很短。相關(guān)研究調(diào)查表明,中國企業(yè)平均生存時間大約為3.6年,其中中小企業(yè)的平均生存時間更短,僅為2.5年,與歐美企業(yè)相比相差甚遠。除了壽命周期短,我國互聯(lián)網(wǎng)企業(yè)能做強和做大的也是寥寥無幾。因此,分析我國互聯(lián)網(wǎng)企業(yè)生存時間的規(guī)律及其影響互聯(lián)網(wǎng)企業(yè)生存的因素,并基于此為創(chuàng)業(yè)者提供投資借鑒具有重要意義。
關(guān)于我國企業(yè)的生存期及其影響因素已有不少文獻進行了研究。吳利華等[2]對企業(yè)生存理論研究進行了比較好的回顧,指出企業(yè)能否生存是外部環(huán)境因素和企業(yè)能力互為作用的結(jié)果。根據(jù)經(jīng)濟環(huán)境的變化,企業(yè)生存理論研究的側(cè)重點有所不同。不同的學者從不同的角度構(gòu)建企業(yè)生存理論以及論證影響企業(yè)生存的各種因素,如:資源投入、學習能力、規(guī)模與影響力(王淼薇等[3]、王峰[4]、林蘭等[5]);戰(zhàn)略選擇(林蘭等[5]、戚建梅等[6]、鄧子梁等[7]);技術(shù)創(chuàng)新(鮑宗客[1]、吳冰[8]);外部融資約束(曹獻飛[9])。由于企業(yè)生存數(shù)據(jù)普遍存在刪失的特征,因此在上述企業(yè)生存理論研究和實證研究中多數(shù)引入了生存分析的理論框架。應(yīng)用生存分析中的生命表分析、Kaplan Meier分析、Cox回歸模型描述企業(yè)生存過程(曹裕等[10])以及對企業(yè)生存過程的影響因素進行分析(陳鴿林等[11])。但上述研究存在的一個問題是其實證多數(shù)采用的是工業(yè)企業(yè)數(shù)據(jù)(逯宇鐸等[12]、王淼薇等[3]、戚建梅等[6]、鄧子梁等[7]),其他企業(yè)類型數(shù)據(jù)比較少見。因此這些文獻所得結(jié)論主要適用于工業(yè)企業(yè),對其他類型的企業(yè)如互聯(lián)網(wǎng)企業(yè)未必適用?;诨ヂ?lián)網(wǎng)企業(yè)的生存分析研究除少數(shù)工作(如林若飛等[13])外尚不多見。本文彌補這一不足,研究互聯(lián)網(wǎng)企業(yè)的生存期特征以及影響互聯(lián)網(wǎng)企業(yè)生存的因素。我們采用大數(shù)據(jù)網(wǎng)絡(luò)爬蟲技術(shù)獲取相關(guān)聯(lián)網(wǎng)企業(yè)的數(shù)據(jù),采用Kaplan-Meier生存分析法和Cox比例風險模型來探究不同行業(yè)、不同地區(qū)互聯(lián)網(wǎng)企業(yè)的生存規(guī)律及可能存在的影響因素。
1 我國互聯(lián)網(wǎng)企業(yè)數(shù)據(jù)
1.1 數(shù)據(jù)及變量
本文采用網(wǎng)絡(luò)爬蟲技術(shù)爬取了國家企業(yè)信用信息公示系統(tǒng)中2014—2017年互聯(lián)網(wǎng)企業(yè)數(shù)據(jù)。保留了注冊時間在2014—2017年之間的企業(yè)數(shù)據(jù)。共計312家。其中倒閉或退出的244家,68家仍在經(jīng)營。對于已經(jīng)倒閉的互聯(lián)網(wǎng)企業(yè),將注冊時間視為企業(yè)存活的開始時間,將國家企業(yè)信用信息公示系統(tǒng)中顯示的注銷時間視為企業(yè)倒閉的時間點,將注冊時間和注銷時間之間的天數(shù)視為該企業(yè)的生存時間;對于尚未倒閉的互聯(lián)網(wǎng)企業(yè),將注冊時間視為企業(yè)存活的開始時間,將注冊時間到2017年6月18日之間的天數(shù)視為企業(yè)的生存時間。
根據(jù)已有企業(yè)生存理論研究文獻,考慮到數(shù)據(jù)的可獲取性,在互聯(lián)網(wǎng)企業(yè)生存數(shù)據(jù)分析中,被解釋變量為企業(yè)的生存時間及到2017年6月18日止企業(yè)的生存狀態(tài)[0(存活)和1(倒閉)],解釋變量包含企業(yè)的注冊資本和第一股東出資比例兩個定量變量以及企業(yè)所屬行業(yè)和地區(qū)兩個定性變量。其中,根據(jù)隨機數(shù)據(jù)爬取的取樣結(jié)果中頻數(shù)由高到低,行業(yè)編號為:1(互聯(lián)網(wǎng)+金融)、……、8(互聯(lián)網(wǎng)+其他);根據(jù)截至2016年的全國各省份互聯(lián)網(wǎng)普及率由高到低,所在地區(qū)為:1(北京)、……、29(黑龍江)。數(shù)據(jù)概覽如下表所示。
1.2 統(tǒng)計特征
2 生存分析理論
2.1 生存分析概念
生存分析是研究生存現(xiàn)象和響應(yīng)時間數(shù)據(jù)及其統(tǒng)計規(guī)律的一門學科。在刻畫企業(yè)生存時間時通常用以下三個函數(shù)來描述:生存函數(shù)、概率密度函數(shù)和危險率函數(shù)。
2.2 Kaplan-Meier生存分析
為得到刪失數(shù)據(jù)下生存函數(shù)的估計,Kaplan和Meier(1958)給出了生存函數(shù)非參數(shù)估計方法——乘積極限法,其優(yōu)點是對數(shù)據(jù)的分布沒有要求,利用條件概率及概率乘法原理來計算生存率,適用于生存時間數(shù)據(jù)的原始資料(或未分組資料),可用于小、中或大樣本。應(yīng)用中可以通過繪制Kaplan-Meier曲線比較不同條件下樣本生存函數(shù)之間有無差異。除此之外,我們也可以采用log-rank test對數(shù)秩檢驗等定量分析不同樣本的風險函數(shù)有無顯著差異。
2.3 Cox比例風險回歸模型
為研究企業(yè)生存究竟受到哪些因素的影響,考慮到刪失數(shù)據(jù)的存在,通常采用Cox比例風險回歸模型。該模型是一種半?yún)?shù)模型,對數(shù)據(jù)的分布沒有要求。其基本形式如下:
該風險比與基準函數(shù)無關(guān),且不隨時間t變化。這也是Cox模型基本的比例風險(proportional hazards, PH)假定。通??梢酝ㄟ^Schoenfeld殘差圖進行PH假定的檢驗。
3 實證分析
3.1 Kaplan-Meier曲線
圖1為不同行業(yè)的Kaplan-Meier生存曲線圖。圖1表明不同行業(yè)的生存曲線存在很大差異,其中技術(shù)創(chuàng)新型互聯(lián)網(wǎng)企業(yè)有比較高的生存率。這與鮑宗客[1]
以《中國工業(yè)企業(yè)數(shù)據(jù)庫》中工業(yè)企業(yè)樣本的實證結(jié)果比較一致。圖1中結(jié)果還發(fā)現(xiàn)互聯(lián)網(wǎng)金融企業(yè)有著比較低的生存率。為驗證不同行業(yè)企業(yè)間生存函數(shù)之間的差異是否顯著,我們采用對數(shù)秩檢驗方法。檢驗結(jié)果(p=3.7e-06)表明,不同企業(yè)之間的差異比較顯著。我們采用同樣的方法按照地區(qū)對所獲取的互聯(lián)網(wǎng)企業(yè)進行分組并進行對數(shù)秩檢驗,得到的p值也小于顯著性水平0.05,因此不同地區(qū)的生存曲線也存在顯著差異。
3.2 Cox比例風險模型
基于已有數(shù)據(jù)構(gòu)建Cox比例風險模型,得到的參數(shù)估計和檢驗結(jié)果如表3所示。
由模型總體的檢驗p值為2.78×10-5小于顯著性水平0.05看出,該Cox風險比例模型顯著。由各個變量的檢驗可以看出,地區(qū)和行業(yè)的檢驗p值均小于0.05,這兩個變量對模型的影響顯著,這與本文前面用對數(shù)秩檢驗得出的結(jié)論一致。表3可知擬合的風險模型為:
其中,x1,x2,x3,x4分別表示注冊資本(萬人民幣)、第一股東出資比例、地區(qū)和行業(yè)。由系數(shù)可以解讀到,注冊資本越多,互聯(lián)網(wǎng)企業(yè)倒閉的概率越低但影響輕微;第一股東出資比例越高,互聯(lián)網(wǎng)企業(yè)倒閉的風險越高;地區(qū)編號越大,也就是互聯(lián)網(wǎng)普及率越低的省份,互聯(lián)網(wǎng)相關(guān)企業(yè)倒閉的概率越高;行業(yè)編號越大,即在隨機爬取過程中頻數(shù)越大的行業(yè)下的互聯(lián)網(wǎng)企業(yè)倒閉的風險越低。
3.3 Cox模型診斷檢驗
3.3.1 PH假定檢驗
PH假定可以通過假設(shè)檢驗和Schoenfeld殘差圖檢驗,殘差應(yīng)該與時間無關(guān)。如果殘差與時間有相關(guān)趨勢,則違反PH假設(shè)。殘差圖上,橫軸表示時間,如果殘差均勻分布,則表示殘差與時間相互獨立。根據(jù)上節(jié)建立的Cox模型進行PH假設(shè)檢驗,結(jié)果見表4。
由表4中第4列我們可以發(fā)現(xiàn)四個變量的p值都大于0.05,說明四個變量均通過PH檢驗,而模型的整體p值為0.746也大于0.05,因此模型整體也通過PH檢驗。圖2為Schoenfeld殘差圖,圖中曲線為樣本擬合曲線,虛線為樣本區(qū)間上下2個單位的標準差,由圖可以看出標準化Schoenfeld殘差在0的周圍波動,無明顯趨勢,因此和PH檢驗得到的結(jié)論一致,各變量滿足PH風險假設(shè)。
3.3.2 模型異常值識別
Dfbetas是一種通過考察剔去第i個觀測值對整體估計的影響來檢驗回歸異常值的方法,Dfbetas殘差檢驗可用來識別模型的異常值。對已建立的Cox模型繪制Dfbetas殘差檢驗圖,如圖3所示。由于殘差均勻地分布在0上下,表明該模型不存在明顯的異常點,不足以對模型系數(shù)的估計值產(chǎn)生影響。
3.3.3 估計的穩(wěn)健性
上述實證結(jié)果我們采用2014—2017年244家已倒閉互聯(lián)網(wǎng)企業(yè)和68家尚未倒閉企業(yè)共計312家數(shù)據(jù)進行實證分析,為彌補數(shù)據(jù)不足帶來的統(tǒng)計結(jié)果的偏差,考察表3中統(tǒng)計結(jié)果的穩(wěn)健性。我們采用非參數(shù)bootstrap 方法,通過有放回抽樣的方式抽取B=10000次容量為312的bootstrap樣本,針對每一組樣本估計Cox回歸模型的系數(shù)。結(jié)果見表5。
表5結(jié)果表明,模型參數(shù)估計與樣本選取具有一定的關(guān)系,但半數(shù)以上的抽樣結(jié)果生成的Cox模型變量系數(shù)與未經(jīng)Bootstrap抽樣的原數(shù)據(jù)所得擬合模型各變量系數(shù)的符號一致,因此可以認為模型是穩(wěn)健的,上述結(jié)論比較可靠。
4 結(jié) 論
本文運用Kaplan-Meier法和Cox比例風險回歸模型對2014年到2017年以來共計312家互聯(lián)網(wǎng)企業(yè)生存數(shù)據(jù)進行分析??紤]了可能影響企業(yè)生存的四個因素:企業(yè)的注冊資本、第一股東出資比例、企業(yè)所在行業(yè)、企業(yè)所在地區(qū)。研究發(fā)現(xiàn),我國互聯(lián)網(wǎng)企業(yè)的生存率受到企業(yè)所在行業(yè)和地區(qū)的影響比較顯著。由Kaplan-Meier法和Cox模型一致得出的結(jié)果可以看出,互聯(lián)網(wǎng)企業(yè)的生存存在明顯的行業(yè)效應(yīng)。其中信息服務(wù)、軟件開發(fā)、技術(shù)開發(fā)三大行業(yè)的互聯(lián)網(wǎng)企業(yè)生存期最長。近年來,各行各業(yè)的信息需求日益猛增,人們對手機的依賴更使得各種手機應(yīng)用獲得巨大市場。因此這三大行業(yè)的互聯(lián)網(wǎng)企業(yè)比例以及生存期都名列前茅。而結(jié)合房產(chǎn)、汽車等傳統(tǒng)行業(yè)的互聯(lián)網(wǎng)企業(yè)由于低頻消費問題和難以如線下一樣建立信任等原因,生存期最短。另外,我國網(wǎng)民的人數(shù)和互聯(lián)網(wǎng)普及率在各個省份大相庭徑,這直接導致互聯(lián)網(wǎng)企業(yè)的生存規(guī)律有很強的地域差別。以北上廣為首的互聯(lián)網(wǎng)普及率最高也是互聯(lián)網(wǎng)企業(yè)存活期最長的地區(qū),而靠近西部的寧夏、新疆等地區(qū)的互聯(lián)網(wǎng)企業(yè)由于互聯(lián)網(wǎng)用戶基數(shù)的原因,大多無法長期存活。不同行業(yè)在進入“互聯(lián)網(wǎng)+”時代的轉(zhuǎn)型中優(yōu)劣有別,行業(yè)領(lǐng)導者和其他創(chuàng)業(yè)者需要摸清行業(yè)特點,實行有效轉(zhuǎn)型;不同地區(qū)的互聯(lián)網(wǎng)企業(yè)創(chuàng)業(yè)者也應(yīng)針對本地區(qū)網(wǎng)民習慣及地域特點進行研究,采取具體措施彌補網(wǎng)民基數(shù)不足的先天劣勢,延長企業(yè)生存期。王淼薇[3]基于上海市規(guī)模以上工業(yè)企業(yè)的數(shù)據(jù)時實證了初始規(guī)模因素與企業(yè)生存之間有著顯著的非線性關(guān)系。王峰[4]分析第二次全國經(jīng)濟普查數(shù)據(jù)發(fā)現(xiàn)企業(yè)規(guī)模與企業(yè)生存存在正相關(guān)。本文以企業(yè)的注冊資本度量企業(yè)初始規(guī)模,表3表明企業(yè)的初始規(guī)模越大、企業(yè)的生存概率越大,但統(tǒng)計上不顯著??赡艿脑颍阂环矫媸菢颖镜臄?shù)據(jù)量不夠,另一方面從2014年3月1日開始,我國公司注冊資本從實繳制改為認繳制,只要在企業(yè)經(jīng)營期限內(nèi)將上報的注冊資金入繳即可,因此國家企業(yè)信息系統(tǒng)上顯示的注冊資本并不是在企業(yè)成立初期就一步到位,因此2014年后將注冊資金看作企業(yè)初始規(guī)模并不完全恰當。所以在驗證企業(yè)的初始規(guī)模對企業(yè)生存的影響時后期需要更加合適的度量指標。因此今后我們將繼續(xù)加大樣本量的收集,依據(jù)企業(yè)生存理論研究,引入更多的解釋企業(yè)生存的變量,為企業(yè)或國家相關(guān)決策提供參考。
參考文獻:
[1]鮑宗客.創(chuàng)新行為與中國企業(yè)生存風險:一個經(jīng)驗研究[J].財貿(mào)經(jīng)濟,2016,37(2).
[2]吳利華,劉賓.企業(yè)生存理論研究的文獻綜述與機理分析[J].科技進步與對策,2012,29(1).
[3]王淼薇,郝前進.初始規(guī)模、生產(chǎn)率與企業(yè)生存發(fā)展——基于上海市規(guī)模以上工業(yè)企業(yè)的實證研究[J].經(jīng)濟管理,2012(7).
[4]王峰.企業(yè)規(guī)模、效益、年齡和企業(yè)生存:理論與再認識[J].未來與發(fā)展,2011(7).
[5]林蘭,尚勇敏.影響我國小微企業(yè)生存發(fā)展的因素研究——來自上海浦東新區(qū)的證據(jù)[J].上海經(jīng)濟研究,2016(9).
[6]戚建梅,洪俊杰,儀珊珊.多產(chǎn)品出口對企業(yè)生存影響的微觀數(shù)據(jù)分析[J].世界經(jīng)濟研究,2017(2).
[7]鄧子梁,陳巖.外商直接投資對國有企業(yè)生存的影響:基于企業(yè)異質(zhì)性的研究[J].世界經(jīng)濟,2013(12).
[8]吳冰.生存分析及其應(yīng)用:以創(chuàng)業(yè)研究為例[J].上海交通大學學報:哲學社會科學版,2006,14(3).
[9]曹獻飛,于誠.外部融資約束加劇了企業(yè)生存風險嗎?——基于Cox比例風險模型的經(jīng)驗分析[J].中央財經(jīng)大學學報,2015(9).
[10]曹裕,陳曉紅,王傅強.中小企業(yè)生存分析——以湖南省工業(yè)企業(yè)為樣本[J].科研管理,2011,32(5).
[11]陳鴿林,夏洪勝.基于生存分析模型的企業(yè)生存問題及其影響因素研究綜論[J].江蘇商論,2013(3).
[12]逯宇鐸,于嬌,劉海洋,等.出口行為對企業(yè)生存時間的強心劑效應(yīng)研究——來自1999—2008年中國企業(yè)面板數(shù)據(jù)的實證分析[J].經(jīng)濟理論與經(jīng)濟管理,2013(8).
[13]林若飛,張惠萍.“互聯(lián)網(wǎng)+農(nóng)業(yè)”企業(yè)生存能力的實證研究[J].福建師范大學學報:哲學社會科學版,2016(1).