陳 杰
(中國人民銀行重慶營業(yè)管理部,重慶渝北 401147)
重要經(jīng)濟金融指標數(shù)據(jù)的準確預測是決策者判斷和制定相應政策的重要參考依據(jù)。存貸款數(shù)據(jù)是金融統(tǒng)計工作中的基礎性指標,也是分析金融運行環(huán)境的關鍵性指標,在很大程度上會反映金融自身的“造血”能力以及對實體經(jīng)濟的支持力度,在國民經(jīng)濟金融統(tǒng)計中有著極其重要的地位。因此,對存貸款指標數(shù)據(jù)進行預測,可以為各級政府部門、金融監(jiān)管部門的前瞻性調控奠定基礎,也可以引導金融市場合理預期,對進一步完善各項金融工作、合理引導市場預期等具有重要的理論意義和現(xiàn)實意義。
金融預測指運用數(shù)據(jù)挖掘的方法對金融市場的大量歷史數(shù)據(jù)進行處理和分析,以此預測市場的未來發(fā)展趨勢。金融指標歷史數(shù)據(jù)屬于時間序列數(shù)據(jù),通常存在非平穩(wěn)現(xiàn)象,若根據(jù)時間序列本身的趨勢變化來預測,最常用的預測方法可采用簡單平均法、移動平均法、指數(shù)平滑法等構建預測模型,也可采用自回歸模型(AR模型)等進行預測分析;若時間序列包含可觀測影響因素,一般采用回歸方法構建模型,如一般線性回歸、自回歸滑動平均模型(ARMA模型)等。
機器學習是人工智能研究發(fā)展到一定階段的必然產(chǎn)物,隨著機器學習理論與實現(xiàn)算法的不斷進步和發(fā)展,機器學習將在未來改變經(jīng)濟學的研究方式,并對經(jīng)濟學的研究和發(fā)展產(chǎn)生深遠影響。
機器學習大致可以分為四類:有監(jiān)督機器學習、無監(jiān)督機器學習、半監(jiān)督機器學習和強化機器學習。有監(jiān)督機器學習主要解決預測問題,擁有輸入變量(自變量)和輸出變量(因變量),使用被標注過的樣本數(shù)據(jù),通過學習特征與標簽值間的對應關系,構建最優(yōu)模型進行預測,常用方法包括回歸樹、支持向量機、神經(jīng)網(wǎng)絡等方法。無監(jiān)督學習主要解決聚類問題,只有輸入變量,沒有相關的輸出變量,通過樣本集合中的特征,來發(fā)現(xiàn)和識別出代表性特征,并對預測數(shù)據(jù)進行聚類,常用于視頻、圖像和文本數(shù)據(jù)領域。半監(jiān)督機器學習使用大量的未標記數(shù)據(jù),以及同時使用標記數(shù)據(jù),來進行模式識別,常用的包括協(xié)同訓練、轉向支持向量機等方法。強化機器學習主要應用到人工智能領域,它并不只是使用已知固定的數(shù)據(jù)進行訓練,而是通過大量試錯練習,尋找最佳路徑選擇。
機器學習在經(jīng)濟金融領域尚未大量展開,在部分領域進行了初步探索,還處于起步階段。在經(jīng)濟領域,Chalfin et al(2016)利用教師的知識水平、教學方式,以及學校教學評估的大量信息,用機器學習方法預測個人的勞動生產(chǎn)率。Peysakhovich & Naecker(2017)研究了人們在面對金融市場風險時的選擇行為,預測效果較為準確。在金融領域,大部分是對股票市場的預測。Gu et al(2018)使用美國3萬多只股票在1957-2016年間的數(shù)據(jù)來預測股票的未來收益,作者發(fā)現(xiàn),在預測具有高流動性的股票或投資組合的未來收益時,機器學習方法比傳統(tǒng)的預測方法更加有效。在國內,孫存一(2017)以機器學習視角研究了利率定價機制,研究表明,大數(shù)據(jù)機器學習方法對相當時期的利率變動能夠精準地預測。景秋玉(2018)結合機器學習方法,基于PCA-SVM-GARCH模型建立股價預測模型,梁成(2018)基于小波核支持向量機回歸方法建立股指期貨價格預測模型,均取得較好預測效果。
本文將機器學習方法從股票高頻數(shù)據(jù)運用到存貸款低頻數(shù)據(jù),是對人工智能技術在金融預測領域的創(chuàng)新性嘗試;同時與以往傳統(tǒng)方法相比,機器學習又具有諸多優(yōu)點,能夠自動搜尋符合預測要求的自變量最優(yōu)交互項組合,這是傳統(tǒng)方法無法做到的。
有監(jiān)督機器學習方法的出發(fā)點是構建一個損失函數(shù),基于該損失函數(shù),通過代入訓練數(shù)據(jù)來選擇最優(yōu)的預測模型,這與傳統(tǒng)最小二乘法類似。但與傳統(tǒng)計量經(jīng)濟學方法不同的是,比如在一般線性回歸模型框架下,機器學習算法能夠允許損失函數(shù)忽略掉模型輸入與真實輸出之間很小的偏差,也能自動搜尋自變量最優(yōu)交互項組合以滿足模型的更多需求。支持向量機方法是最常用的有監(jiān)督學習算法之一,在各個預測領域被廣泛應用,它有多方面的優(yōu)點:一是支持向量機使用結構風險最小化準則在特征空間尋找最優(yōu)分類超平面,模型通過二次型進行優(yōu)化,能夠獲得全局而不僅僅是局部最優(yōu)解。二是支持向量機是基于有限樣本求取有限信息下的最優(yōu)解,在處理小樣本問題也具有很好的效果。三是對于線性不可分問題,模型將低維空間數(shù)據(jù)變換為高維特征向量,通過非線性轉換將非線性問題轉變?yōu)楦呔S空間中的線性問題,然后在高維特征空間構造最優(yōu)分類超平面,很好地解決了高維數(shù)據(jù)的非線性分類問題。四是支持向量機模型中引入核函數(shù)理論,簡化高維空間中特征向量內積的計算,解決了在擴維引發(fā)的維數(shù)災難問題。
(2)式即為支持向量機的基本型。為求解,通??紤]其如下的對偶問題:
求解該式可得到最優(yōu)劃分超平面所對應的模型:
在求解過程中,要將樣本空間映射到更高維特征空間,可采用核函數(shù)升維,常用的核函數(shù)有線性核、多項式核、高斯核、拉普拉斯核、Sigmoid核等。
傳統(tǒng)的支持向量機回歸模型只能通過影響因素預測當期數(shù)據(jù),這并不能充分滿足我們的預測需求。我們對其加以改進,得到改進的支持向量機回歸模型,能夠通過截至期數(shù)據(jù)預測期之后的數(shù)據(jù),從而達到預測目標。
支持向量機回歸模型與分類模型建?;舅悸芬恢?,但主要解決預測問題。這里,我們采用改進的支持向量機回歸方法。給定一個訓練集,其中,是輸入向量,表示第個觀測值,為輸出變量,通過期及之前的數(shù)據(jù)訓練得出期數(shù)據(jù),即為預測下一期數(shù)據(jù)。采用方法對數(shù)據(jù)進行訓練學習,支持向量回歸基本優(yōu)化模型如下:
其對偶問題為:
在實體經(jīng)濟金融運行過程中,影響存貸款的因素有很多,從宏觀上看,既受實體經(jīng)濟運行大環(huán)境的影響,也受國家宏觀政策和監(jiān)管政策的指導;從中觀上看,既受金融市場直接融資的影響,也受房地產(chǎn)等行業(yè)發(fā)展階段的影響;微觀上看,既受住戶的消費等個人因素影響,也受企業(yè)自身發(fā)展有效需求的制約。根據(jù)數(shù)據(jù)有效性和可獲得性,選取10個指標作為影響存貸款的主要因素,并且采用月度數(shù)據(jù)進行訓練。其中,由于GDP通常是季度數(shù)據(jù),采用工業(yè)增加值月度同比數(shù)據(jù)替代,反映實體經(jīng)濟大環(huán)境的基本面情況;M2同比增速、人民幣存款準備金率、短期貸款利率主要反映貨幣政策和貨幣環(huán)境,可部分反映貨幣供給端和需求端的情況,為更直接反映利率對貸款的影響,選取6個月至1年(含)短期貸款利率;股票流通市值、債券市場托管余額可部分反映金融市場對資金的吸引程度,以及直接融資等基本情況;CPI同比增速、70個大中城市新建商品住宅價格指數(shù)同比增速反映普通物價消費情況和房地產(chǎn)市場的冷熱程度;定期存款利率:1年,反映單位和個人存款的獲利程度;外匯儲備,外匯占款會部分在存款中體現(xiàn)(表1)。在存款預測中,影響的主要因素包括序號為1-3,5-10共9個指標;貸款預測中,影響的主要因素包括序號為1-8共8個指標。
表1 影響存貸款的主要因素
本文采用2015年以來的全國存貸款等公開數(shù)據(jù)進行模擬訓練和實證分析,選擇高斯核函數(shù),通過對已有截至期的存貸款余額數(shù)據(jù),對往后期的存貸款余額進行預測,實證中期為2019年2月末,整個實證在python3.7和keras環(huán)境下實現(xiàn)。參數(shù)選擇及實證結果見表2、表3、表4。
從實證結果看,各期預測結果很好,預測值和實際值的絕對誤差較小,相對于各項存款和各項貸款分別約190萬億和150萬億的體量來說,各項絕對誤差相當小,各項存款和各項貸款平均絕對誤差分別為4393億元和3772億元,相對誤差幾乎全部在0.5%以內,有的甚至小于0.1%,各項存款和各項貸款的平均相對誤差也分別僅為0.23%和0.25%??梢钥闯觯覀兊念A測結果很好地反映了真實情況,具有很強的預測能力,預測值完全可以作為經(jīng)濟金融分析工作的一項重要參考,具有重要的前瞻性指引和實踐指導意義。
表2 預測中參數(shù)值
表3 2019年各項存款預測結果表 單位:億元
表4 2019年各項貸款預測結果表 單位:億元
傳統(tǒng)時間序列模型僅從自身歷史數(shù)據(jù)出發(fā),沒有考慮到宏觀經(jīng)濟與政策等因素影響,導致預測結果出現(xiàn)一定偏差,而一般回歸模型又較難刻畫影響因素之間復雜的內在邏輯關系,傳統(tǒng)的支持向量機回歸模型也只能預測當期數(shù)據(jù)而不能實現(xiàn)“真正”的預測目標。我們通過改進傳統(tǒng)支持向量機回歸模型,在機器學習中創(chuàng)造性的實現(xiàn)了用期數(shù)據(jù)對期數(shù)據(jù)的預測,實證結果顯示,預測結果精度高,預測值的絕對誤差和相對誤差都相當小,能夠滿足各方對金融統(tǒng)計數(shù)據(jù)的前瞻性需求。