王威 劉芬
【關鍵詞】 模糊間隔孿生支持向量機; 財務危機; 預警模型
【中圖分類號】 F275? 【文獻標識碼】 A? 【文章編號】 1004-5937(2021)22-0079-08
一、引言
財務危機是指企業(yè)無力償還到期債務或支付經(jīng)營費用而面臨破產(chǎn)的一種現(xiàn)象[ 1 ]。面對日益復雜的市場環(huán)境,許多看似財務健康的企業(yè)往往會突然陷入困境,這一方面嚴重影響了企業(yè)的正常經(jīng)營,另一方面也給企業(yè)股東和利益相關者帶來極大的損失。因此,在財務危機發(fā)生之前發(fā)出預警,提醒企業(yè)規(guī)避可能發(fā)生的財務風險,對企業(yè)經(jīng)營管理來說具有重要的意義。但從我國證券市場的歷史來看,在財務危機出現(xiàn)之前,一般很難從企業(yè)經(jīng)營過程中發(fā)現(xiàn)直接的證據(jù)。如何根據(jù)企業(yè)的內外部影響因素合理構建預警模型,有效地發(fā)現(xiàn)和防范可能出現(xiàn)的企業(yè)財務危機成為學術界研究的一個熱點問題。
從本質上來說,企業(yè)財務危機預警屬于典型的二分類問題,現(xiàn)有的預警方法主要包括兩大門類:統(tǒng)計學分析方法和機器學習方法。傳統(tǒng)的財務危機預警模型主要是基于統(tǒng)計學分析方法,其中應用較為廣泛的是Logistic模型。其主要優(yōu)點是計算比較簡單,同時模型具有較好的解釋性。Ohlson[ 2 ]使用Logistic模型對企業(yè)財務危機預警進行研究,證明了其有效性;方匡南等[ 3 ]考慮企業(yè)財務指標間的網(wǎng)絡結構關系,構建了基于網(wǎng)絡結構的Logistic模型;肖振紅和楊華松[ 4 ]針對財務危機預警模型中指標信息冗余及Logistic模型預測精度問題,提出了基于L1/2正則化Logistic回歸的上市企業(yè)財務危機預警模型;楊貴軍等[ 5 ]針對財務數(shù)據(jù)質量檢測問題,提出基于Benford-Logistic企業(yè)財務風險預警模型等。但Logistic模型在企業(yè)財務危機預警中仍存在一些難以克服的缺陷:一是基于線性模型,難以處理財務危機預警這種非線性問題;二是對樣本數(shù)量要求比較高,實踐中難以獲取大量合適的樣本來滿足模型要求;三是難以解決解釋變量的多重共線性對預警性能的影響等。這都嚴重限制了Logistic模型在財務危機預警中的應用范圍。
隨著人工智能技術的發(fā)展,機器學習方法在財務危機預警領域獲得了迅速發(fā)展。其中最具代表性的是支持向量機(Support Vector Machine,SVM),主要思想是VC維和結構風險最小化。SVM在處理財務危機預警這種小樣本、非線性和高維數(shù)據(jù)分類問題中體現(xiàn)出特有優(yōu)勢。Shin等[ 6 ]分別使用SVM和神經(jīng)網(wǎng)絡方法進行了財務危機預警研究,結果證明對于此類小樣本問題,SVM有更好的效果;Gestel等[ 7 ]根據(jù)荷蘭企業(yè)的財務數(shù)據(jù),使用SVM模型進行了財務危機預警;王妹禧[ 8 ]利用雙正交混合核函數(shù)修正SVM進行財務危機預警;石先兵[ 9 ]綜合主成分分析法與SVM構建財務危機預警模型,以滬深A股主板t-3年的制造業(yè)上市企業(yè)財務數(shù)據(jù)為研究樣本展開預測等。這些研究都證明SVM在財務危機預警中的良好效果。然而,SVM在實際應用中也遇到了一些難點,首先是樣本的數(shù)據(jù)不平衡問題。財務危機的定義很多,考慮到國內上市企業(yè)所處經(jīng)濟與監(jiān)管的環(huán)境,本文將發(fā)生財務危機的企業(yè)定義為因為財務狀況和其他財務狀況異常被滬深證券交易所進行特別處理(Special Treatment,ST)的上市企業(yè),并由此展開研究。根據(jù)中國證監(jiān)會截至2019年12月的數(shù)據(jù),中國歷年上市企業(yè)ST的比例只占總數(shù)約1%,因此樣本數(shù)據(jù)的類別分布極不均衡。在這種情況下,如使用隨機抽樣,SVM方法分類的結果會偏向多數(shù)類樣本,忽略了更為重要的少數(shù)類樣本。因此,在以往大多數(shù)研究中,通常會使用一一配對的非隨機抽樣解決這個問題,但這樣又會高估模型的預警性能。其次是“異?!睒颖镜挠绊?。受到人為或市場的影響,財務危機樣本數(shù)據(jù)中會出現(xiàn)一些無法完全剔除的野值和隨機噪聲的影響,由于SVM是通過同等對待所有樣本數(shù)據(jù)來構造決策超平面,這些野值和噪聲造成的擬合現(xiàn)象,也會對分類的精度和穩(wěn)健性產(chǎn)生較大影響。
隨著科學技術的進步,各種SVM的改進方法紛紛被提出。Jayadeva等[ 10 ]提出了孿生支持向量機(Twin Support Vector Machine,TSVM),其將原有的SVM問題轉化為兩個較小的凸規(guī)劃問題,構建兩個相互不平行的超平面,有效地減少了計算的復雜度。在此基礎上,為減弱噪聲數(shù)據(jù)的影響,Gao等[ 11 ]將模糊隸屬度的概念與孿生支持向量機相結合,并在其中引入間隔以使結構風險最小化,提出了模糊間隔孿生支持向量機(Fuzzy Margin Twin Support Vector Machine,F(xiàn)MTSVM),為SVM的應用提供了新工具。
因此,為解決SVM在財務危機預警應用中存在的問題,本文提出將FMTSVM引入企業(yè)財務危機預警領域展開研究。目的主要包括三點:一是利用其雙決策超平面的特性,通過對不同類型樣本數(shù)據(jù)設置不同的懲罰系數(shù)來減少財務危機預警中樣本數(shù)據(jù)不平衡對預警精度造成的影響;二是根據(jù)樣本數(shù)據(jù)特征,考慮不同類型中各樣本點作用的差異,通過給單個樣本設置不同的模糊隸屬度來消除財務危機預警中野值和噪聲等異常樣本數(shù)據(jù)對預警結果的影響;三是通過把原有SVM預警模型中的二次規(guī)劃問題轉換為兩個凸規(guī)劃問題進行求解,提高預警模型的學習效率,有效地縮短分類時間。從已掌握研究文獻來看,現(xiàn)有對FMTSVM模型的研究還是以對算法的改進和優(yōu)化為主,未發(fā)現(xiàn)有文獻運用該模型對企業(yè)財務危機預警問題展開研究,本文的研究具有一定的創(chuàng)新性。
二、模型與方法
(一)FMTSVM模型
給定(xj,yj)為財務危機預警樣本數(shù)據(jù)的集合,j=1,…,m。其中yj∈{-1,1}為預警變量,用來表示企業(yè)在短時間(1—3年)內發(fā)生財務危機的情況;xj∈Rn為解釋變量,用來表示企業(yè)相應的財務和非財務指標;m個樣本數(shù)據(jù)中包含m1個yj=1的正樣本(財務危機企業(yè))和m2個yj=-1的負樣本(正常企業(yè))。由此,正樣本數(shù)據(jù)點的集合可用矩陣A∈Rm ×n來表示,負樣本數(shù)據(jù)點的集合可用矩陣B∈Rm ×n來表示。同時在樣本集中引入一個模糊變量sj,0