• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于大數(shù)據(jù)技術的中小企業(yè)成長性評價方法研究

      2019-07-27 01:35:34蔡高遠趙志偉
      統(tǒng)計與信息論壇 2019年7期
      關鍵詞:成長性測度分類

      喬 晗,蔡高遠,趙志偉

      (1.河南大學 經(jīng)濟學院,河南 開封 475004;2.天津財經(jīng)大學 統(tǒng)計學院,天津 300222)

      一、引言

      中小企業(yè)是我國國民經(jīng)濟的重要組成部分,但其衰減速度卻顯著高于其他國家(王永進等,2017),加大了國家支持和社會資本投入的風險。因此,如何有效評價及識別具有高成長價值的中小企業(yè),給出具有操作性的政策或投資依據(jù),進而實現(xiàn)供給側結構性改革相關政策對中小企業(yè)的精準扶持,以及提高金融資本的投資效率,成為近年來政府、社會和學界共同關注的熱點問題。相關研究具有服務經(jīng)濟及推進企業(yè)成長理論及綜合評價方法研究的學術與實踐價值。

      評價企業(yè)成長最直接的方式是尋找代理變量,如托賓Q或銷售額增長率,其優(yōu)勢是評價值為數(shù)值型數(shù)據(jù),便于定量分析其影響因素[1]。但企業(yè)成長是一個復雜概念,利用單一變量作為政府或資本的投資依據(jù)顯然不恰當。諸多因素共同決定企業(yè)成長的機制,意味相應測度(評價)需要多維因素的評價信息,并將其合成。因此,多指標綜合評價方法成為衡量企業(yè)成長性的另一個主流選擇,但國內外相關研究遵循不同路徑。其中,由于風險投資/私募股權(VC/PE)更善于識別高成長企業(yè)(Monika et al.,2015),國外文獻主要利用歷史信息或問卷調查,通過歸納投資實踐的項目評價準則,構建企業(yè)成長性評價指標體系,并傾向于選擇企業(yè)家素質等定性指標[2]。

      與國外文獻從實踐到理論的研究路徑不同,國內文獻更注重從企業(yè)成長理論出發(fā),構建以財務指標為主的評價體系。早期具有影響力的是國家經(jīng)貿委等(2001)提出的GEP評價法,通過10項財務指標信息反映各方面的成長優(yōu)勢,但未能直接反映成長的定性信息[注]GEP評價法假設定性信息最終將不同程度在企業(yè)財務指標中表現(xiàn)出來。,且缺乏理論支撐。后續(xù)研究逐步強調成長評價的理論基礎,主要分兩種模式:一是力求評價模型的實踐意義,指標體系構建時選用以財務指標為主的定量指標(張冬,2013),但存在缺失定性信息的問題;二是為求評價模型的完備性,指標體系通常涉及難以測度的定性指標,但受方法所限難以實證分析,導致研究成果難以指導實踐,如張玉明等(2012)利用仿生學構建企業(yè)成長評價模型中涉及企業(yè)家經(jīng)營能力等定性指標,但未實證檢驗模型的有效性。此外,目前已有中小企業(yè)成長性評價方法通常僅能給出成長性高低的排序信息,且難以檢驗評價結論的有效性,也在一定程度上降低了研究對于投資實踐的指導意義。

      本文基于相關理論構建中小企業(yè)成長性評價模型,通過引入大數(shù)據(jù)技術力圖實現(xiàn)兩個具體目標:一是利用網(wǎng)絡爬蟲和文本挖掘技術,解決中小企業(yè)成長性評價定性指標難以測度的問題,改善評價信息不充分的問題;二是構建基于機器學習算法的中小企業(yè)成長性分類模型,增加企業(yè)成長性的分類信息,提升傳統(tǒng)中小企業(yè)成長性評價結論的信息量,并通過比較分類信息與傳統(tǒng)綜合評價方法的排序信息的一致程度,檢驗成長性綜合評價模型的可靠性,為決策實踐提供更為有效的參考依據(jù)。

      二、評價理論基礎與模型構建

      企業(yè)的成長極為復雜,目前仍然是一個具有很強“黑箱性質”的問題(楊林巖等,2010)。本文力圖在進一步梳理企業(yè)成長理論的基礎上,構建一個中小企業(yè)成長性評價模型。

      (一)企業(yè)成長評價的理論基礎

      企業(yè)成長性評價框架是基于影響企業(yè)成長的因素及其作用機制理論構建的。

      1.古典經(jīng)濟學分工理論。企業(yè)作為一種分工組織,技術操作分工強化勞動者學習與經(jīng)驗積累效應,專注工具運用,推動機器改進和發(fā)明,其導致勞動生產率提高,出現(xiàn)規(guī)模經(jīng)濟(斯密,1776)。隨著分工的專業(yè)化,則衍生出新企業(yè),拉長社會生產鏈條,增加一國企業(yè)數(shù)量(阿·楊格,1928)。就成長性概念的測度而言,分工體現(xiàn)出勞動型技術與工具資本技術的合成進步,因此,分工理論實際上開創(chuàng)了將技術因素作為企業(yè)成長動因,以規(guī)模測度企業(yè)成長性的先河。

      2.新古典經(jīng)濟學的企業(yè)最優(yōu)規(guī)模理論。現(xiàn)實中,企業(yè)基于分工規(guī)模經(jīng)濟決定的成長不可能無限持續(xù)。隨著企業(yè)規(guī)模擴大,其靈活性和競爭力的下降,最終必然失去成長動力,另外也存在企業(yè)家精力和壽命制約企業(yè)成長的情況。馬歇爾提出引入外部經(jīng)濟、企業(yè)家有限生命和企業(yè)壟斷三個因素,建立企業(yè)成長等價于調整企業(yè)規(guī)模,追求最優(yōu)規(guī)模經(jīng)濟的企業(yè)成長動因邏輯。即當技術、需求等外在條件變化后,企業(yè)從原來最優(yōu)規(guī)模轉變到新最優(yōu)規(guī)模體現(xiàn)的企業(yè)成長邏輯(納爾遜 等,1982;楊小凱,1994)。該理論基于企業(yè)規(guī)模的最優(yōu)界定,提出技術、需求等外部因素對企業(yè)成長的影響機制,對企業(yè)成長評價具有重要價值。

      3.企業(yè)隨機成長理論。吉布萊特(1931)提出,企業(yè)成長獨立于企業(yè)規(guī)模,影響企業(yè)成長因素極為復雜,其成長是一個隨機過程。它被稱為“吉布萊特定律”。相關跟進研究發(fā)現(xiàn),產業(yè)組織(Lotti el al,2001)、技術與資本(Cabral,1995)、融資信譽機制和法律制度(As1i,1998)及宏觀政策(Thorsten,2002)等外部因素與企業(yè)規(guī)模成長呈現(xiàn)負相關。顯然該理論揭示了企業(yè)成長受到大量多種類型外部因素影響的高度復雜性。

      4.新制度經(jīng)濟學的企業(yè)成長邊界理論??扑?1937)以交易費用劃分企業(yè)與市場邊界的理論,為理解企業(yè)成長提供了將市場活動放置于企業(yè)內部,企業(yè)成長可以表現(xiàn)為企業(yè)功能多樣化邊界擴展的思路。威廉姆森(Williamson,1975,1985) 進一步提出企業(yè)與市場的相關邏輯。即企業(yè)是按一種技術流程先后連續(xù)生產的一體化組織,其生產的各個環(huán)節(jié)均可以通過交易與市場發(fā)生關聯(lián)。當交易存在信息不完全和不對稱情況,出現(xiàn)違約扯皮等影響生產連貫性問題時,企業(yè)可采取將其市場交易的生產活動納入企業(yè)內部,其成長表現(xiàn)出企業(yè)縱向邊界的擴展。其中,威廉姆森從核心技術角度,特別提出企業(yè)的“有效邊界”概念。該理論啟發(fā)企業(yè)成長研究對市場組織效率因素影響的深入思考。

      5.管理驅動的企業(yè)成長論。主要是Penrose提出企業(yè)資源決定能力,能力進而決定成長理論[3]。企業(yè)資源包括物質和人力資源,管理將二者結合創(chuàng)造出企業(yè)“主觀”動能,即在企業(yè)內部實現(xiàn)物質和人力資源的充分挖掘和創(chuàng)新利用的能力。其中,創(chuàng)新包括產品創(chuàng)新和組織創(chuàng)新,

      創(chuàng)新能力是發(fā)現(xiàn)潛在成長機會的前提。錢德勒(1977,1992)從歷史和宏觀角度對企業(yè)制度變遷研究中,推進了彭羅斯的理論,發(fā)現(xiàn)了現(xiàn)代企業(yè)出現(xiàn)的重大制度變化。即企業(yè)規(guī)模極度擴張引發(fā)相應管理的高度復雜化,導致所有權與管理權的分離。而兩者分離導致企業(yè)目標從所有者的利潤最大化,轉向管理者利益最大化。其表現(xiàn)為管理者從追求利潤轉換為追求與企業(yè)規(guī)?;蛟鲩L密切相關的企業(yè)價值的成長。由此,企業(yè)價值成為決定企業(yè)實現(xiàn)穩(wěn)定成長的因素。顯然管理者在現(xiàn)代企業(yè)成長中發(fā)揮著決定性作用。

      綜上所述,企業(yè)成長理論歷經(jīng)技術分工導致企業(yè)規(guī)模經(jīng)濟的成長,基于技術與需求變化的規(guī)模最優(yōu)決定,外部因素沖擊下企業(yè)成長的隨機演化,企業(yè)將市場交易納入內部的縱向邊界擴展成長,以及基于企業(yè)家價值的成長目標轉換這樣一個歷史過程。但當前隨著技術的快速進步,資源配置的全球化,金融交易的機制深化,人力資本的持續(xù)提升,企業(yè)成長決定因素及其機制的復雜性隨之持續(xù)增加。雖然經(jīng)典理論給出了企業(yè)成長因素研究的重要思路,但其目前還不能給出邏輯一致的體系化分析,相關研究仍然具有推進企業(yè)成長性探索的意義。

      (二)評價模型構建

      為充分反應評價對象特征的多維性,評價研究都傾向建立較為龐大的指標體系。但加入過多不重要信息可能稀釋真正核心重要指標的作用[4]。為此,本文在理論分析與趙志偉(2018)研究成果基礎上,構建中小企業(yè)成長性評價的簡化模型,包括企業(yè)家素質、創(chuàng)新成長能力、管理成長支撐、行業(yè)成長空間及產品成長動力五大要素,具體內容如表1所示。指標體系中含有5個難以直接測度的定性指標。

      表1 中小企業(yè)成長性評價指標體系

      三、定性指標測度方法

      基于大數(shù)據(jù)的經(jīng)濟變量測度方法近年來得到了快速發(fā)展,如喬晗利用超市電子數(shù)據(jù)測度消費價格水平,Baker等通過計算主流報紙的關鍵詞出現(xiàn)頻率測度經(jīng)濟政策的不確定性[5-6]。本文借鑒上述思路,編寫爬蟲程序抓取網(wǎng)絡文本信息,并利用文本挖掘技術測度中小企業(yè)成長性評價中的定性指標。

      (一)文本信息獲取與預處理

      首先根據(jù)指標特征,利用Python編寫爬蟲程序抓取指標測度所需的文本信息,如表2所示。然后利用Python第三方庫jieba對抓取的文本信息進行替換、刪除和分詞操作,并建立字典,提高分詞的準確性,為后續(xù)文本信息的挖掘奠定基礎。

      表2 定性指標測度方式

      (二)文本挖掘與定性指標測度

      百度AI語義分類器適合情感分析,而“企業(yè)家聲譽”與“市場認可度”的文本信息更多的是情感表達,因此利用百度AI語義分類器作為上述兩指標的語義分析與測度工具。以前者為例,假設抓取的企業(yè)i(i=1,2,…,k)企業(yè)家聲譽文本信息數(shù)量為ni,則對于特定某條文本j(0

      (1)

      同理,指標“市場認可度”亦如此。

      (2)

      其中wh(h=1,2,…,H)表示對應分類下的權重。

      四、成長性預測模型構建

      基于綜合評價方法構建的中小企業(yè)成長性評價模型,通常僅能給出企業(yè)成長性的排序信息,且難以檢驗評價結果的可靠性。本文利用隨機森林等四種機器學習分類算法,建立成長性預測模型,通過充分挖掘歷史信息的方式,增加評價結果的分類信息,并提供一種檢驗綜合評價模型可靠性的思路。

      (一)樣本與數(shù)據(jù)

      為保證數(shù)據(jù)的可得性、代表性與完整性,本文選取我國中小板699家上市公司年作為訓練樣本。其中輸入變量為樣本企業(yè)2013年49個財務指標數(shù)據(jù)。輸出變量選擇上,現(xiàn)有衡量成長性的單一指標主要采用主營業(yè)務收入增長率(Dunne & Hughes,2013)或托賓Q(于旭等,2012)。但實質兩者存在本質差異:前者反映給定時間內企業(yè)成長的歷史表現(xiàn),后者則是利用當期數(shù)據(jù)預測企業(yè)未來成長趨勢。顯然,前者作為機器學習的輸出變量更為恰當。因此,本文利用2011-2017年間樣本企業(yè)主營業(yè)務收入增長率作為輸出變量。所有數(shù)據(jù)來源于國泰安數(shù)據(jù)庫。

      在數(shù)據(jù)預處理方面,首先進行數(shù)據(jù)清洗,檢查是否有錯誤數(shù)據(jù),并利用拉格朗日插值法填補缺失數(shù)據(jù)。在此基礎上對輸出變量的連續(xù)型數(shù)據(jù)進行轉換,以適應分類算法的需要,即將主營業(yè)務收入增長率排名前30%標記為高成長企業(yè)(輸出變量記為1),剩余為非高成長企業(yè)(輸出變量記為0)。

      (二)模型訓練

      基于上述訓練樣本,本文選取隨機森林、Adaboost、支持向量機和樸素貝葉斯四種經(jīng)典分類算法,分別構建中小企業(yè)成長性預測模型,并采用十折交叉驗證法檢驗四種分類算法的可靠性,并評價不同算法對數(shù)據(jù)集的泛化能力。考慮到歷史數(shù)據(jù)的長度可能會對企業(yè)成長性預測產生影響,本文采用三個時間段的數(shù)據(jù)分別作為訓練模型,最終預測精度如表3所示。

      表3結果顯示,四種算法中除樸素貝葉斯分類算法預測精度稍低以外,其余三種均表現(xiàn)出了較好的預測能力;歷史數(shù)據(jù)長度沒有對預測精度構成較大影響。2012-2017年數(shù)據(jù)在四種算法中的預測精度均較高,表明當模型利用當前數(shù)據(jù)預測5年內的企業(yè)成長時更為有效。因此,基于隨機森林、Adaboost和支持向量機三種算法訓練的模型適合用于預測中小企業(yè)的成長性。應當指出的是,雖然上述機器學習算法能夠直接給出中小企業(yè)成長性的分類預測信息,但由于其沒有理論依據(jù),且缺乏政策空間,因此本文僅將其定位于成長性評價模型的檢驗與補充。

      3)用三根木條制作一個三角形的架子①,再用四根木條釘一個四邊形的架子②,分別拉動架子①和②的邊框,你有什么發(fā)現(xiàn)?(質疑4)

      表3 四種算法10折交叉驗證精度結果

      五、成長性評價方法應用研究

      這里選取中小板20家上市公司[注]本文遵循隨機原則選取樣本企業(yè),利用簡單隨機抽樣方法選取,根據(jù)抽樣結果顯示,20家企業(yè)分布于9個地區(qū)的7個行業(yè),具有一定代表性。為研究對象,利用上文構建的指標體系及相應測度方法評價其成長性,并通過基于機器學習算法建立成長性預測模型,在檢驗評價結論可行性與有效性的同時,提供企業(yè)成長性的分類信息,為投資決策提供更多依據(jù)。定量指標數(shù)據(jù)主要來源于國泰安數(shù)據(jù)庫、上市公司年報及評價企業(yè)主頁。由于存在敏感指標(如企業(yè)家聲譽等),本文隱去評價企業(yè)名稱,并用編號(j=1,2,…,20)代替。

      (一)指標測度

      首先借鑒趙志偉(2018)的研究成果,對各企業(yè)定量指標“研發(fā)費用占比(X3)”、“研發(fā)人員占比(X4)”、主營業(yè)務收入增長率(X6)、行業(yè)平均利潤率(X9)及產品利潤與營銷成本比(X11)進行測度。企業(yè)員工離職率(X7)是負向指標,通過用1減去該指標的方式正向化。企業(yè)文化創(chuàng)立時間(X8)通過查找公司主頁相關內容計算。

      對于指標“政策支持程度(X10)”,通過利用Python編寫爬蟲程序,抓取人民網(wǎng)財經(jīng)頻道2018年1月1日至6月20日期間,“行業(yè)名+國家+政策”或“行業(yè)名+部(委)+政策”的詞語組合在文本信息中出現(xiàn)的頻率進行測度:頻率越高說明企業(yè)所處行業(yè)受到政策支持力度越大。

      對于指標“企業(yè)家聲譽(X1)”、“市場認可程度(X12)”、“企業(yè)家能力(X2)”和“技術領先程度(X5)”,根據(jù)上文方法抓取2017年1月1日至2018年6月1日期間相應網(wǎng)頁(如表2所示)的評論信息,并進行語義分析。其中分類數(shù)量H的確定,需要同時權衡指標測度精度要求與分類精度。因為雖然H越大越有利于指標測度,但同時可能會大幅降低分類精度。為此,本文在相同訓練樣本條件下,設定H的取值分別為3和5進行驗證集精度的比較。與此同時,還利用百度AI語義分類器進行精度比較,以檢驗是否有必要利用樸素貝葉斯分類算法,具體結果如表4所示。其中wh在H=3和H=5下分別為0.5,0,0.5和0.3,0.2,0,0.2,0.3。

      通過表4可知,樸素貝葉斯分類器3分類時在驗證集上具有更高的預測精度,且精度要高,一方面說明了本文人工構建訓練集并使用樸素貝葉斯分類器的必要性,另一方面也表明樸素貝葉斯分類器在多分類預測時表現(xiàn)較差?;谏鲜龇治霰疚牧頗=3。在此基礎上利用公式(2)計算各企業(yè)在X2和X5下的指標值。

      表4 不同分類器的預測精度

      (二)評價信息集成

      首先無量綱化指標信息。無量綱化方法的選擇及所導致原始數(shù)據(jù)分布的變化,都會直接影響綜合評價的最終結果(喬晗,2015)。為了保證原始變量相對變異信息保持不變,本文選用如下均值化方法去除指標值的量綱,其中:

      (3)

      (三)有效性檢驗

      為了檢驗本文第二部分構建的中小企業(yè)成長性評價模型及第三部分的指標測度方法的有效性,除模型1以外,本文還依次列出了如下7個中小企業(yè)成長性評價(預測)模型結果,并將結果報告在表5中。模型2為表1去除5個定性指標后20家中小企業(yè)的成長性排名,通過結果可以發(fā)現(xiàn)排序結果發(fā)生了較大變化,說明本文加入的定性信息對中小企業(yè)成長性評價結論具有較大影響。為了進一步驗證本文建立的評價模型的有效性,本文利用國家經(jīng)貿委等(1999)及趙志偉(2018)的研究成果對本文20個企業(yè)樣本展開評價[7]。最終結果分別為模型3和模型4的排序,比較發(fā)現(xiàn)雖然模型1、3和4均為中小企業(yè)成長性評價,但評價結論表現(xiàn)出一定的差異。那么實踐中到底采用哪個評價模型指導投資決策呢?由此引出評價結論的檢驗問題,這是當前綜合評價方法研究始終面臨的一個難題。更為重要的是,雖然評價模型1-4均給出了20家中小企業(yè)的成長性排序,但依然無法為決策者提供出哪些企業(yè)是否具備高成長性的建議,因為即使排名第1的企業(yè)也不一定具備高成長型。上述兩方面問題降低了綜合評價方法對于實踐工作的指導價值。為此,本文利用第四部分構建的基于4種機器學習分類模型對評價結論進行檢驗,結果如表5模型5-8所示,分別為隨機森林、Adaboost、支持向量機與樸素貝葉斯四種算法。通過結果比較發(fā)現(xiàn),前三種分類算法結論較為一致,且與本文構建的綜合評價模型結論(模型1)更為接近:模型1排名前7位的企業(yè)幾乎均被三種算法視為高成長型企業(yè),排名后5位也被三種算法視為非高成長型企業(yè)。

      表5 20家中小企業(yè)成長性綜合評價值及相應排序與分類

      最終通過機器學習算法構建的中小企業(yè)成長性分類模型檢驗可知,本文構建的中小企業(yè)成長性評價模型更為有效,且在20個中小企業(yè)中,序號為6、3、10、16及1這五家企業(yè)具有高成長型,具備投資價值。

      六、主要結論

      本文在企業(yè)成長相關理論基礎上融入當前PE/VC投資理念,利用綜合評價方法與機器學習算法,分別建立了企業(yè)成長性的評價(排序)模型與預測(分類)模型,并利用網(wǎng)絡爬蟲和文本挖掘技術測度定性指標,力圖為政府對中小企業(yè)扶植政策的實施,及其政策效果識別提供評價依據(jù),同時也為金融資本向中小企業(yè)投資提供成長性評價的理論方法參考。

      具體主要完成以下工作:第一,在已有研究成果基礎上重構中小企業(yè)成長性評價模型及相應簡化指標體系,力圖用更少的信息預測企業(yè)成長。實證檢驗結果表明該模型及指標體系具備有效性。第二,利用基于靜態(tài)與動態(tài)網(wǎng)頁爬蟲技術抓取網(wǎng)絡文本信息,并以此為依據(jù)測度中小企業(yè)成長性評價指標體系中難以直接描述的定性指標,解決了評價指標信息不充分的問題。第三,利用機器學習算法構建了中小企業(yè)成長性預測模型,解決了中小企業(yè)成長性評價因結論信息量不足而難以直接投資實踐的問題,并為檢驗評價模型結論有效性提供一種新思路。

      猜你喜歡
      成長性測度分類
      三個數(shù)字集生成的自相似測度的乘積譜
      R1上莫朗測度關于幾何平均誤差的最優(yōu)Vornoi分劃
      分類算一算
      非等熵Chaplygin氣體測度值解存在性
      Cookie-Cutter集上的Gibbs測度
      分類討論求坐標
      2018上海成長性企業(yè)50強
      數(shù)據(jù)分析中的分類討論
      教你一招:數(shù)的分類
      分析師一致預期最具成長性個股
      临清市| 普兰店市| 山丹县| 峨边| 延吉市| 清远市| 方城县| 武定县| 墨竹工卡县| 丽江市| 鱼台县| 呼和浩特市| 上林县| 永仁县| 融水| 如东县| 佳木斯市| 台北市| 岑溪市| 崇州市| 理塘县| 华蓥市| 马山县| 古田县| 石狮市| 江山市| 陈巴尔虎旗| 无极县| 库车县| 怀来县| 康乐县| 丹巴县| 建始县| 汶川县| 唐海县| 保定市| 昔阳县| 天峨县| 南通市| 喀什市| 河间市|