• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      關(guān)于股票融資跌漲幅的實證研究

      2019-12-30 01:43:35陳佳珊張丹
      時代金融 2019年33期
      關(guān)鍵詞:隨機森林

      陳佳珊 張丹

      摘要:對影響股票融資跌漲幅的主要因素的研究,及對跌漲幅預(yù)測精度的提高,是融資領(lǐng)域中的一個重要內(nèi)容,故本文對此展開相關(guān)研究。首先運用具有特征選取作用的Lasso模型對國內(nèi)融資數(shù)據(jù)進行因素影響性分析,結(jié)果顯示影響跌漲幅的主要因素為融資買入額、融資償還額及融資余額。接著,本文在集成學(xué)習(xí)思想的基礎(chǔ)上,運用方差倒數(shù)法對Lasso、XGBoost和隨機森林進行模型賦權(quán)并線性結(jié)合,從而構(gòu)造組合回歸模型,提高了預(yù)測精度;最后通過評價指標RMSE和MAPE的對比發(fā)現(xiàn)組合模型較單項模型具有更強的穩(wěn)健性和更高的預(yù)測精度。

      關(guān)鍵詞:股票融資跌漲幅? Lasso? XGBoost? 隨機森林? 組合回歸模型? 預(yù)測分析

      一、引言

      從廣義上講,融資也叫金融,即貨幣資金的融通,事主經(jīng)過各種方式到金融市場上設(shè)法籌集或貸放資金的行為。從狹義上講,是公司籌集資金的行為與過程??傊?,融資存在很大的風(fēng)險,故如何分析影響股票融資漲跌幅的因素,為購買者提供良好的信息服務(wù)顯得尤為重要。

      本文的實證分析分為兩個階段:階段一,本文借助同時具有正則化和特征選區(qū)作用的Lasso回歸模型對國內(nèi)融資數(shù)據(jù)進行分析,探究影響股票融資漲跌幅的主要因素。階段二,為充分發(fā)揮Lasso、XGBoost、RF三個模型的優(yōu)勢,基于集成學(xué)習(xí)思想,以SSE為衡量指標對三個模型進行賦權(quán)并線性結(jié)合,從而構(gòu)造回歸組合模型,以預(yù)測股票融資跌漲幅。

      二、相關(guān)理論與實證研究

      (一)數(shù)據(jù)選取與處理

      1.數(shù)據(jù)來源。本文采用的是股票代碼為725的京東方A股票數(shù)據(jù),來源于“狗熊會”官網(wǎng)中的“精品案例庫”模塊,共920個樣本。

      因變量為跌漲幅,自變量為現(xiàn)價x1、融資余額x2、融資余額增速x3、融資買入額x4、融資買入額增速x5、融資償還額x6、融券余量x7、融券賣出量x8。

      2.缺失值處理。在數(shù)據(jù)審核中發(fā)現(xiàn)缺失值樣本僅占4.9%,缺失比例較低,故可直接進行剔除。

      3.歸一化。由于數(shù)據(jù)集中各變量的量綱不一致,故需進行離差標準化(轉(zhuǎn)換函數(shù)如下),將值映射到[0,1]之間。

      4.數(shù)據(jù)劃分。在下文的模型訓(xùn)練中,為對模型的正確性進行檢驗,本研究將數(shù)據(jù)集分成測試集與訓(xùn)練集(比例為1:4)。

      (二)多重共線性檢驗

      多重共線性指變量之間具有高度相關(guān)的依存關(guān)系。在涉及經(jīng)濟的相關(guān)問題中,當多個自變量間相關(guān)性較強時,則認為違背了多元線性回歸中的基本假定,此時經(jīng)由最小二乘法得到的參數(shù)估計值不僅方差增大而且不穩(wěn)定,易使模型估計失真。因此,在面對多元回歸問題時應(yīng)先進行多重共線性檢驗。

      由于本文的輸入數(shù)據(jù)是一個八維向量,故需運用條件數(shù)法進行共線性診斷:設(shè)數(shù)據(jù)矩陣為X,若矩陣XTX的特征根至少存在一個近似為0,則X的列向量(自變量)必定存在多重共線性。下面的條件數(shù)公式可用于判斷是否近似為0,

      同時也用于衡量多重共線性的嚴重程度:

      ·k>100:程度很小;

      ·100≤k≤1000:程度較強;

      ·k>1000:程度嚴重。

      本文借助R語言來計算條件數(shù),結(jié)果為,即自變量間存在較強的多重共線性。故經(jīng)典多元線性回歸模型不再適用于本文所探究的問題,在下面的研究中本文選擇了能克服這一缺陷的Lasso、XGBoost和隨機森林模型。

      (三)因素評估:Lasso模型

      Lasso是一種收縮估計法,“在多重共線性的情況下基于懲罰函數(shù)篩選特征變量,通過壓縮系數(shù)來提取有效特征并直接剔除高自相關(guān)變量以提高識別精度,增加模型的可解釋性”[1]。其基本思想是在其最小二乘的目標函數(shù)基礎(chǔ)上加一個對系數(shù)的一階懲罰函數(shù),從而產(chǎn)生某些嚴格等于0的回歸系數(shù)。Lasso估計被定義為

      t≥0是約束值(對回歸系數(shù)βj的一范式懲罰),主要通過交叉驗證法確定。

      本文借助R語言計算得到漲跌幅與各影響因素的關(guān)系:

      故影響股票漲跌幅的因素重要性排序為:融資買入額、融券余量、融資余額、融資償還額、現(xiàn)價、融資買入額增速、融券賣出量。其中融資余額增速的回歸系數(shù)為0,表示對跌漲幅幾乎不產(chǎn)生影響。

      (四)漲跌幅的預(yù)測:回歸組合模型

      1.XGBoost與隨機森林回歸模型。XGBoost是一種新型梯度提升的集成學(xué)習(xí)方法,可集成許多CART回歸樹模型從而形成一個強分類器,并在算法上做了改進以達更高精度?!癤gboost利用損失函數(shù)的二階泰勒展開,同時添加正則項以衡量模型復(fù)雜度和損失函數(shù)下降程度,這在一定程度上避免了過擬合”[2]。

      隨機森林是一種基于分類樹的集成算法,在機器學(xué)習(xí)中占有重要地位。其算法的基本原理是:在CART算法的基礎(chǔ)上加入隨機化特點,即在樣本數(shù)據(jù)中進行隨機采樣,以生成大量分類回歸樹,最后以投票方式產(chǎn)生結(jié)果。RF模型可以處理大量的、高緯度的定量或定性數(shù)據(jù),且對缺失值和多重共線性不敏感,泛化能力強,相對其他算法有著很大的優(yōu)勢。

      2.回歸組合模型。Lasso、XGBoost、RF是多重共線性回歸問題中常用的三種模型,對數(shù)據(jù)的解釋能力各有側(cè)重點。在回歸預(yù)測中通常借助某種評估標準進行模型對比與選擇,但經(jīng)此選出的單一模型并不代表一定優(yōu)于其他模型。事實上,它們在回歸領(lǐng)域中各有優(yōu)勢,相互之間也存在差異性不足,僅憑某一評估標準來選擇模型并不是最優(yōu)做法。

      為了充分結(jié)合三種模型的優(yōu)勢并降低誤差風(fēng)險率,本文采用組合方法:訓(xùn)練得到三個回歸模型后,用方差倒數(shù)法進行模型賦權(quán),然后線性相加。方差倒數(shù)法的基本原理為:首先計算各個單項模型的誤差平方和SSE,然后分別取倒數(shù)并歸一化到[0,1]之間,即得到各模型權(quán)值。

      (五)模型評估

      本文以均方根誤差RMSE和平均絕對誤差百分率MAPE作為評價預(yù)測效果的指標,前者側(cè)重衡量偏差,后者側(cè)重衡量模型穩(wěn)健性。

      n為樣本數(shù),yi為真實值,為預(yù)測值。

      運用測試數(shù)據(jù),分別對構(gòu)建的四個模型進行測試,對比原測試表簽數(shù)據(jù)與預(yù)測數(shù)據(jù)并計算相應(yīng)RMSE與MAPE,結(jié)果如下:

      三、分析與總結(jié)

      (一)關(guān)于影響因素的評估

      股票融資跌漲一般經(jīng)過價值和供求關(guān)系這兩個根本法則起作用。根據(jù)Lasso的評估結(jié)果知,“融資買入額”對股票融資跌漲幅的影響最大,其次是“融券余量”和“融資余額”。

      融資買入額與融資余額對跌漲幅具有正相關(guān)性影響。主力資金的出入一般徑直影響股票的供求關(guān)系從而對股票產(chǎn)生重要作用,融資買入額增加可理解為發(fā)生了主力資金的流入,拉動了股票的供需從而促進股票上漲,且融資買入額越高越有可能出現(xiàn)持續(xù)上漲的態(tài)勢。融資余額能反應(yīng)股票市場的流動性和繁榮程度,可將其理解為融資助長,股票低位持續(xù)的融資買入,可視作中長期購入的機會,即融資余額越大且有持續(xù)增長勢頭,說明此股被大資金看好,值得投資。因此這兩個因素對跌漲幅有關(guān)鍵的正向影響作用。

      融券在跌漲幅分析中一般以融券余額為對象,由于本文數(shù)據(jù)缺乏這一指標,故此處以融券余量來替代說明,即假設(shè)融券余量高則融券余額多。在股市中,融券余額大且穩(wěn)定增加,說明該股不被看好的程度越大,即后市繼續(xù)看跌,不宜介入。簡而言之,融券余額增加表示“看空的投資倉位增加,市場趨向賣方;反之則趨向買方”[4]。因此,短時期內(nèi)融券余量上升(即融券余額增加)則股票一般具有下跌趨勢,故對跌漲幅的影響是負向的。

      (二)關(guān)于模型評估

      在單項回歸模型中,可發(fā)現(xiàn)Lasso在兩種評價標準之下的效果是最好的,說明相較之下Lasso對本文所采用的數(shù)據(jù)集具有更好的解釋能力,同時也進一步說明了運用Lasso進行因素評估的合理性。

      對比組合模型與單項模型,顯然無論是在RMSE還是MAPE上的對比,組合模型都具有明顯優(yōu)勢。因為組合回歸模型將三個單項模型作為基學(xué)習(xí)器,并運用方差倒數(shù)法對模型進行合理賦權(quán),這不僅充分發(fā)揮了各模型在回歸領(lǐng)域中的優(yōu)勢,還降低了隨機因素對模型的影響,使得模型呈現(xiàn)出來的效果更貼近實際數(shù)據(jù),即達到預(yù)測精度提高的目的。因此對于股票融資跌漲幅的預(yù)測,本文推薦使用回歸組合預(yù)測模型。

      參考文獻:

      [1]施國良,景志剛,范麗偉.基于Lasso和Xgboost的油價預(yù)測研究[J].工業(yè)技術(shù)經(jīng)濟,2018,37(07):31-37.

      [2]張鈺,陳珺,王曉峰,劉飛.Xgboost在滾動軸承故障診斷中的應(yīng)用[J].噪聲與振動控制,2017,37(04):166-160.

      [3]穆啟國,劉海龍,吳沖鋒.影響股票達到漲跌幅限制的因素分析[J].系統(tǒng)工程理論與實踐,2003(09):61-66.

      [4]戴建兵.我國證券市場系統(tǒng)性風(fēng)險防范的研究[D].上海:華東理工大學(xué),2015.

      (作者單位:華南師范大學(xué))

      猜你喜歡
      隨機森林
      隨機森林算法在中藥指紋圖譜中的應(yīng)用:以不同品牌夏桑菊顆粒指紋圖譜分析為例
      基于隨機森林的登革熱時空擴散影響因子等級體系挖掘
      基于隨機森林的HTTP異常檢測
      個人信用評分模型比較數(shù)據(jù)挖掘分析
      時代金融(2017年6期)2017-03-25 22:21:13
      隨機森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
      基于二次隨機森林的不平衡數(shù)據(jù)分類算法
      軟件(2016年7期)2017-02-07 15:54:01
      拱壩變形監(jiān)測預(yù)報的隨機森林模型及應(yīng)用
      基于隨機森林算法的飛機發(fā)動機故障診斷方法的研究
      基于奇異熵和隨機森林的人臉識別
      軟件(2016年2期)2016-04-08 02:06:21
      基于隨機森林算法的B2B客戶分級系統(tǒng)的設(shè)計
      柳江县| 抚远县| 兴业县| 朝阳县| 葫芦岛市| 太康县| 中山市| 阿鲁科尔沁旗| 遂平县| 乐昌市| 平塘县| 民和| 三台县| 独山县| 衡山县| 元阳县| 拉萨市| 青河县| 通州区| 称多县| 临夏市| 望谟县| 独山县| 宁海县| 馆陶县| 金昌市| 眉山市| 潮安县| 政和县| 广西| 东兴市| 依安县| 固原市| 忻城县| 金华市| 荃湾区| 高要市| 伊金霍洛旗| 江北区| 阳曲县| 光泽县|