• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于模式識別的“高送轉”預測模型

      2017-04-27 00:59石好邢小艷
      時代金融 2016年35期
      關鍵詞:主成分分析

      石好+邢小艷

      【摘要】近年來高送轉題材受到投資者的追捧,但是對高送轉股票的預測模型多采用主觀性較強的打分排序法。本文深入分析了各主要因素對高送轉行為的影響程度,采用Logistic回歸與主成分分析相結合的方法,構建了年報高送轉股票的預測模型,并用2009~2015年高送轉股票樣本數據對模型進行了驗證。實證結果顯示,模型正確率在55%以上,預測準確度最高可達80.91%。

      【關鍵詞】高送轉 logistic回歸 主成分分析

      一、引言

      高送轉股票(簡稱—高送轉)是高比例送股或高比例轉股的統(tǒng)稱。一般10股送轉合計5股(包括5股)以上才為高送轉。

      對投資者而言,實施高送轉被看作重大利好消息,如果能夠提前介入市場,在分享除權前的超額收益的同時,也可從除權后的填權行情中獲利。因此,為了賺取盡可能高的超額收益,如何準確預測可能實施高送轉的公司就成為關鍵。

      本文嘗試主成分分析與logistic回歸相結合的方法構建高送轉預測模型,該方法既避免了市場上常用的打分排序法在指標選取和權重分配上的主觀性,又通過降維解決了多元回歸中的多重共線性問題,還可以比較各個主要因素對高送轉行為的影響程度,并對未來實施高送轉的概率進行直接估計。因此,從方法的科學性和嚴謹性角度,本文的研究方法更具優(yōu)勢。

      二、研究設計

      (一)主成分分析與logistic回歸原理

      主成分分析,它通過變量變換的方法把相關的變量變?yōu)槿舾刹幌嚓P的綜合指標變量[4],從而實現對數據集的降維,使得問題得以簡化。

      邏輯回歸模型是一個非線性模型[5],但是它本質上又是一個線性回歸模型,是二項分類因變量常用的統(tǒng)計分析方法。

      (二)影響高送轉實施的主要因素

      對高送轉行為進行量化,變量名為gsz,如果公司實施了高送轉,gsz=1;否則,gsz=0。影響上市公司實施高送轉的因素有很多,包括市場環(huán)境、財務狀態(tài)、股價表現和監(jiān)管層政策等。經研究驗證后,本文選取因素如下:每股凈資產(mgjzc)、每股資本公積金(mgzbgj)、每股未分利潤(mgwflr)、每股現金凈流量(mgxjjll)、上市時間(years)、股價(price)、股本(gb)。

      (三)高送轉預測模型的構建

      在線性回歸模型中,若解釋變量之間存在精確相關關系或高度相關關系,會導致模型估計失真,所以本文采用主成分分析法消除自變量之間的共線性性,以便使模型更加準確。

      首先對上文所述自變量提取主成分,具體形式如下:

      其中式中l(wèi)n(.)為自然對數,pi是第i個樣本實施高送轉的概率。β0,β1,…,βs是回歸系數,εi為隨機擾動項。

      然后利用pi的大小來判斷樣本股票是否發(fā)生高送轉。若pi>0.5,則認為該樣本股票實施高送轉,gsz=1;否則,該樣本股票不實施高送轉,gsz=0。

      三、數據來源與處理

      (一)數據選取

      本文擬選取了2009~2015年間所有A股為樣本。上市公司的利潤分配方案包括中期方案和年度方案,從歷年情況來看,中期方案的高送轉股票較少,本文只考慮年度方案?;赥年年報做出的送轉方案,其對應的高送轉實施年份一般在T+1年中期,即存在財務年份和實施年份的區(qū)別,本文統(tǒng)一選取實施年份為高送轉年份,即,基于T年年報在T+1年實施的高送轉行為定義為T+1年高送轉。

      假定在T年年末預測T+1年實施高送轉的股票,因為此時T年年報未出,為了保持建模與預測一致性,每股凈資產等財務數據統(tǒng)一選取T年三季報數據,股價等非財務數據統(tǒng)一選取T年最后一個交易日數據。本文數據均來源于TinySoft金融數據庫。

      (二)數據處理

      為了消除由于計量單位和數量級不同對回歸模型產生的影響,本文對變量進行了Z值標準化的去量綱處理。

      (三)統(tǒng)計量描述

      我們把2009~2015年股票按照是否實施高送轉分為兩組,分別考察每年每股凈資產、每股資本公積等因子的差異情況,發(fā)現各指標存在顯著差異性,表明這些指標對高送轉行情是有一定識別作用。

      四、實證分析

      本文以2015年高送轉股票的預測為例,來實證上述模型的有效性,即用2014年高送轉股票數據預判2015年高送轉股票,其它年份方法類似。

      (一)主要變量相關性分析

      我們考察了2014年A股股票各變量之間的相關系數,發(fā)現每股凈資產與每股資本公積、每股凈資產與每股未分配利潤之間相關性較高,為了使模型結果更加準確,本文通過主成分分析法提取主成分來有效避免多重共線性。

      (二)主成分提取

      首先對樣本進行主成分分析,我們選擇七個變量為主成分分析的對象,分析結果見表1:

      如表1所示,前5個主成分的累計貢獻率為92.68%,說明前5個主成分已經反映原來7個指標92.68%的信息,因此確定選擇前5個主成分建立模型??梢愿鶕禂稻仃嘊,可以給出主成分的表達式:

      (F1,F2,F3,F4,F5)=(mgjzc,mgzbgj,mgwflr,mgxjjll,years,price,gb)*B (1)

      (三)模型建立

      對2014年高送轉股票的logistic模型,運用SAS9.3對模型參數進行極大似然估計,得到模型估計結果發(fā)現:變量F4的p值為0.1849,即使在顯著性水平為0.1的情況下也不顯著,即F4對gsz(是否高送轉)并無顯著影響。因此,我們可將F4從模型中剔除,重新建立Logistic回歸模型。

      運用SAS9.3對模型參數進行估計,得到模型整體檢驗結果中似然比、評分及Wald的p值都<0.0001,另外,模型回歸系數檢驗結果如表2:

      由表2可知,在0.05的顯著水平下,F1、F2、F3和F5對gsz(是否高送轉)具有顯著影響。根據表2中的參數估計值,我們可以把2014年高送轉的logistic回歸模型改寫為:

      則股票發(fā)生高送轉的概率為:

      (四)模型結果

      將股票數據代入模型中,可預測出2015年A股股票發(fā)生高送轉事件的概率,若p>=0.5則認為該只股票實施了高送轉,否則不實施。預測出147只股票會發(fā)生高送轉,與2015年真實實施高送轉股票對比,準確率達62.80%.

      為了模型穩(wěn)健性,下面采用同樣的方法對2010~2014的高送轉股票進行預測,預測準確率分別為69.77%、80.91%、66.10%、56.94%、55%。

      可以看出本文模型對高送轉股票的預測準確率維持在55%以上,其中2011年的準確率高達80.91%。

      五、結論

      每股凈資產、每股資本公積、每股未分配利潤、每股現金凈流量和股價對公司實施高送轉具有顯著的正面作用,這意味著這些變量越高,公司實施高送轉的概率越大。上市年限和股本對公司實施高送轉具有顯著的負作用,意味著這兩變量越高,公司實施高送轉概率越小。

      作者簡介:石好(1989-),女,漢族,湖北黃石人,就讀于華南理工大學,研究方向:隨機分析與金融工程;邢小艷(1989-),女,漢族,河南人,畢業(yè)于于華南理工大學,研究方向:隨機分析與金融工程。

      猜你喜歡
      主成分分析
      基于NAR模型的上海市房產稅規(guī)模預測
      主成分分析法在大學英語寫作評價中的應用
      江蘇省客源市場影響因素研究
      SPSS在環(huán)境地球化學中的應用
      融水| 莒南县| 万宁市| 黎川县| 临颍县| 西和县| 德令哈市| 尉犁县| 永川市| 丰原市| 濮阳市| 汝州市| 屯留县| 广安市| 阿拉善右旗| 红河县| 容城县| 吴堡县| 唐山市| 容城县| 凤城市| 唐山市| 永嘉县| 六盘水市| 郁南县| 安西县| 昌宁县| 册亨县| 顺昌县| 远安县| 德钦县| 常山县| 彰化县| 赤峰市| 金堂县| 卫辉市| 霍邱县| 中牟县| 仁化县| 铁岭市| 洱源县|