• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于支持向量機(jī)的股票預(yù)測與分析

      2021-12-09 09:23:08李嘉浩
      經(jīng)濟(jì)研究導(dǎo)刊 2021年32期
      關(guān)鍵詞:恒瑞醫(yī)藥寶鋼股份股票

      李嘉浩

      (貴州大學(xué)經(jīng)濟(jì)學(xué)院,貴陽 550025)

      一、研究背景及目的

      股市的變化與國家市場發(fā)展動態(tài)有著千絲萬縷的聯(lián)系,股票市場對國民經(jīng)濟(jì)不斷增長有著非常重要的影響。未來股價(jià)的行情走勢一直是投資者們關(guān)注的核心問題,正確的股價(jià)走勢判斷不僅對投資者做出正確的投資決策有利,而且對促進(jìn)資源有效配置,增強(qiáng)市場的有效性具有重要意義。本文通過借鑒國內(nèi)外學(xué)者在全國層面對證券投資發(fā)展的研究經(jīng)驗(yàn),結(jié)合股票一些基本指標(biāo)對我國股票市場行情進(jìn)行預(yù)測與分析。選取日收盤價(jià)作為股票行情預(yù)測的指標(biāo),對我國的股票發(fā)展趨勢進(jìn)行測度,通過現(xiàn)狀分析和行情測度結(jié)果對我國的股票發(fā)展趨勢提出解決對策(陳芳芳[1],2017)。

      二、國內(nèi)外股票預(yù)測文獻(xiàn)綜述

      劉慶霞[2](2017)驗(yàn)證了基于主成分分析改進(jìn)后的BP 網(wǎng)絡(luò)通過學(xué)習(xí)和訓(xùn)練可以很好適應(yīng)股票數(shù)據(jù)技術(shù),具有較好的預(yù)測效果。沈金榕[3](2017)以財(cái)務(wù)指標(biāo)作為分析對象,利用改進(jìn)的CART 決策樹與逐步回歸進(jìn)行測度,得出基于決策樹的逐步回歸模型可以減少影響目標(biāo)變量的財(cái)務(wù)指標(biāo),提高模型預(yù)測準(zhǔn)確性。李丹[4](2018)從視角角度研究股票預(yù)測問題并進(jìn)行實(shí)證分析,分析了SVFD-BPNN、MVFDIF-BPNN、MVFDIL-BPNN的股票預(yù)測最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)及預(yù)測結(jié)果、實(shí)驗(yàn)結(jié)果。胡迪、黃巍[5](2019)基于SVM 的組合算法和聚類股票預(yù)測算法近鄰傳播聚類對股票相關(guān)性進(jìn)行實(shí)證分析,驗(yàn)證了AP 算法和其他算法結(jié)合提高了股票預(yù)測的準(zhǔn)確率。張晶華、甘宇健[6](2019)提出,深度學(xué)習(xí)支持向量機(jī)對模型參數(shù)進(jìn)行優(yōu)化配置,利用該模型進(jìn)行仿真實(shí)驗(yàn),結(jié)果得出深度學(xué)習(xí)SVM 比現(xiàn)有的SVM 在預(yù)測精確度方面有明顯改善。國外關(guān)于股票預(yù)測的研究更甚于國內(nèi)。Charles Dow[7](1902)書寫了有關(guān)市場觀的評論。Sam Nelson 在他市場觀的評論的基礎(chǔ)上將他的觀點(diǎn)進(jìn)行發(fā)展,最終形成了道氏理論。W·D·Gann[8]研究了時(shí)間的重要性,提出了“價(jià)格- 時(shí)間等價(jià)”概念。Frank Rosenblatt(1957)發(fā)明了稱為感知器的線性分類器。Corinna Cortes和Vapnik 于在20 世紀(jì)90年代中期提出了基于統(tǒng)計(jì)學(xué)習(xí)的在面對非線性、小樣本、高維模式識別問題上具有許多獨(dú)特優(yōu)勢的SVM。Lerner 和Vapnik[9](1963)介紹了最大區(qū)間分類算法。軟間隔分類器由Cortes 和Vapnik(1995)引入,在同一年,SVM 被拓展到回歸模型上。Gavrishchaka[10]等(2006年)研究了股市的波動性和風(fēng)險(xiǎn),與現(xiàn)有主流模型相比,利用SVM 構(gòu)建波動性評價(jià)框架可以有效處理高維數(shù)據(jù),可以對波動性進(jìn)行更長期、更大規(guī)模的評價(jià),效果優(yōu)于其他主流評價(jià)模型。Funatsu 和Kaneko[11](2013)提出基于時(shí)間序列的在線支持向量機(jī)來研究自適應(yīng)軟件感知預(yù)測模型。此外還研究了窗口大小和適當(dāng)?shù)某瑓?shù)設(shè)置,得到了回歸可靠性預(yù)測。

      綜上所述,雖已對股市預(yù)測工作取得了很大進(jìn)展,但該理論的深度和適用范圍還有很多地方可以探索,而目前不僅是國民經(jīng)濟(jì)發(fā)展的重要時(shí)期,也是發(fā)展我國證券投資變化的重要時(shí)期。因此,如何在上述國內(nèi)外學(xué)者提出的先進(jìn)理論的基礎(chǔ)上,尋找一種能有效改進(jìn)目前這種缺陷的方法便成為關(guān)鍵?;谝陨峡紤],本文選擇具有較強(qiáng)泛化能力的SVM 中的SVC 作為預(yù)測股票價(jià)格的核心模型。

      三、理論基礎(chǔ)

      (一)支持向量機(jī)的概念

      支持向量機(jī)(SVM)是Vapnic 等人于1995年提出的基于VC 維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論的機(jī)器學(xué)習(xí)方法,是一種廣義線性分類器,它能根據(jù)有監(jiān)督學(xué)習(xí)的方法對數(shù)據(jù)信息進(jìn)行分類,同時(shí)還可以通過核方法研究進(jìn)行分析非線性分類,突破了基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化理論的傳統(tǒng)機(jī)器學(xué)習(xí)中很容易出現(xiàn)的小規(guī)模數(shù)據(jù)過度擬合現(xiàn)象。

      1.支持向量機(jī)的核函數(shù)介紹[12,13]

      在特征空間中,我們希望樣本線性可分的。但如果在不知道這些特征映射的情況下,我們自己無法明確知道哪個(gè)核函數(shù)是恰當(dāng)?shù)?。因此,核函?shù)的選擇是否正確對于支持向量機(jī)模型的優(yōu)劣顯得非常重要。以下是幾個(gè)常見的核函數(shù)。

      線性核函數(shù)(linear)是最簡單的一種核函數(shù),計(jì)算方法為:K(Xi,Xj)= XitXj。多項(xiàng)式核函數(shù)(poly)是一種非標(biāo)準(zhǔn)的核函數(shù),很適用于正交歸一化后的數(shù)據(jù)集,計(jì)算方法為:K(Xi,Xj)=(XitXj)d,d≥1。高斯核函數(shù)(rbf),在處理數(shù)據(jù)的噪音方面有較好的抗干擾能力。計(jì)算方法為:

      2.支持向量機(jī)的參數(shù)介紹

      SVM 參數(shù)的正確選擇對分類管理效果有著很大影響。一般來說,需要進(jìn)行優(yōu)化的參數(shù)分別是C 懲罰參數(shù)和σ 內(nèi)核參數(shù)。但就目前來說,還沒有一個(gè)很好的理論來進(jìn)行指導(dǎo)參數(shù)的優(yōu)化,常用的方法有實(shí)驗(yàn)、網(wǎng)格、梯度下降法等。本文采用網(wǎng)格法對C 進(jìn)行管理優(yōu)化,簡化了參數(shù)選擇的操作活動過程,提高了基于所選參數(shù)的SVM 的分類工作性能。

      四、樣本選取

      在本文股票預(yù)測的實(shí)證分析中,考慮股票市場是非常不穩(wěn)定的動態(tài)過程,其未來發(fā)展走勢還受政府宏觀調(diào)控的影響,且2020年疫情影響,醫(yī)藥方面可能產(chǎn)生影響較大,因此在數(shù)據(jù)選擇時(shí)選取了受影響較大的恒瑞醫(yī)藥和價(jià)格運(yùn)行穩(wěn)定的寶鋼股份作為研究對象,意在將兩類股票預(yù)測結(jié)果做對比驗(yàn)證SVM 的可信度。

      五、基于支持向量分類機(jī)股票預(yù)測的實(shí)證分析

      (一)數(shù)據(jù)的預(yù)處理

      本文選取寶鋼股份、恒瑞醫(yī)藥2018.01.01 到2020.03.01 數(shù)據(jù),共計(jì)523個(gè)數(shù)據(jù)。同時(shí),為了測試python的數(shù)據(jù)訓(xùn)練,本文對寶鋼股份和恒瑞醫(yī)藥建立了一個(gè)大樣本和一個(gè)小樣本數(shù)據(jù)訓(xùn)練集,大樣本數(shù)據(jù)采用全樣本數(shù)據(jù),小樣本數(shù)據(jù)采用2019.06.01 至2020.01.01 的數(shù)據(jù),數(shù)據(jù)來源于python 爬蟲在線抓取。

      (二)操作流程

      用python 在線抓取兩支股票2018.01.01 到2020.03.01歷史數(shù)據(jù),對兩支股票的數(shù)據(jù)初步整理。具體實(shí)施:用value(今天的收盤價(jià)減去昨天的收盤價(jià))表示漲跌,差值大于0 為上漲賦值為1,差值小于0 為下跌賦值為0。

      進(jìn)一步標(biāo)簽分類,取數(shù)據(jù)前80%為訓(xùn)練集,數(shù)據(jù)后20%為測試集,然后對樣本數(shù)據(jù)進(jìn)行規(guī)范化處理。開始使用核函數(shù)進(jìn)行周期預(yù)測,每次向前預(yù)測一個(gè)值,分別選取'ploy','linear','rbf' 對預(yù)測值進(jìn)行分類,最后計(jì)算測試集中的正確率,得出輸出value 實(shí)際值和預(yù)測值的結(jié)果如下:

      大樣本:'ploy':寶鋼股份Correct=91.43%,恒瑞醫(yī)藥Correct=93.33%;'linear':寶鋼股份Correct=96.19%,恒瑞醫(yī)藥Correct=96.19%;'rbf':寶鋼股份Correct=90.48%,恒瑞醫(yī)藥Correct=93.33%。

      小樣本:'ploy':寶鋼股份Correct=93.10%,恒瑞醫(yī)藥Correct=96.55%;'linear':寶鋼股份Correct=93.10%,恒瑞醫(yī)藥Correct=93.10%;'rbf':寶鋼股份Correct=89.66%,恒瑞醫(yī)藥Correct=96.55%。

      以上是基于參數(shù)在默認(rèn)情況下進(jìn)行的預(yù)測分析,由此可得,在三種核函數(shù)中,無論是大樣本還是小樣本,準(zhǔn)確率都在90%左右,可見SVM 預(yù)測效果是理想的。但由于SVM 參數(shù)對模型預(yù)測效果有重要影響,且rbf精準(zhǔn)度相對較低,因此本文選擇大樣本的rbf 進(jìn)行參數(shù)尋優(yōu):

      SVM 參數(shù)選優(yōu)得C=1 000 000.0,于是本文將rbf中的C 參數(shù)由默認(rèn)值1.0 改為最優(yōu)參數(shù)1 000 000.0,得出準(zhǔn)確率為Correct=98.10%,比之前90.48%提高了許多,可見修改了參數(shù)之后對預(yù)測效果有正向效果。打印預(yù)測成績混淆矩陣得:

      混淆矩陣是誤差矩陣,我們可以使用混淆矩陣來評估有監(jiān)督學(xué)習(xí)算法的性能。在混淆矩陣中,二、四象限出現(xiàn)的值越多越好;反之,在一、三象限出現(xiàn)的值越少越好。由上述輸出結(jié)果可知,在二、四象限出現(xiàn)的值分別為38、42,相較16、9 大很多,可見該模型的預(yù)測效果是可觀的。

      由于混淆矩陣的統(tǒng)計(jì)數(shù)只是個(gè)數(shù),面對大量的數(shù)據(jù),僅僅用數(shù)字很難衡量其模型優(yōu)劣。因此,在基本統(tǒng)計(jì)結(jié)果的基礎(chǔ)上又延伸了幾個(gè)指標(biāo):準(zhǔn)確度,指模型預(yù)測比上模型預(yù)測類別是Positive 的所有結(jié)果;敏感度,指模型預(yù)測比上實(shí)際類別是Positive 的所有結(jié)果;F1 Score,是綜合了精準(zhǔn)率與召回率兩者的產(chǎn)出結(jié)果。它的值范圍從0 到1。1 表示最佳預(yù)測模型,0 表示最差預(yù)測模型;Support 指原數(shù)據(jù)類別個(gè)數(shù)。

      打印預(yù)測成績報(bào)告得:

      由表1 可得各指標(biāo)數(shù)據(jù)都大于70%以上,距離1 的位置較近,可得出該模型的預(yù)測效果是理想的。對恒瑞醫(yī)藥進(jìn)行同樣操作得出其模型預(yù)測效果也是理想的。

      表1 打印預(yù)測成績報(bào)告

      六、主要結(jié)論及政策建議[14]

      (一)主要結(jié)論

      本文將SVM 應(yīng)用于我國股票市場的預(yù)測。利用SVM 對核函數(shù)進(jìn)行選擇和參數(shù)優(yōu)化,進(jìn)而找出測度股票走勢的最優(yōu)模型。主要結(jié)論如下:

      1.基于SVM 模型的收斂速度快、精度高,SVM 模型可以很好預(yù)測股票數(shù)據(jù),使預(yù)測結(jié)果非常接近實(shí)際值。

      2.核函數(shù)選擇和核參數(shù)選取對SVM 的學(xué)習(xí)和預(yù)測性能有著非常重要的影響。不同的核函數(shù)和核參數(shù)直接關(guān)系到運(yùn)算結(jié)果的準(zhǔn)確性。

      3. SVM 對股票價(jià)格的預(yù)測具有良好的準(zhǔn)確性,為廣大投資者提供了一個(gè)很有意義的分析工具。

      (二)政策建議[15]

      股票價(jià)格波動頻繁,且很多時(shí)候波動相當(dāng)劇烈。要想讓股市更穩(wěn)定地發(fā)展,就必須降低投資者和籌資者的不確定性,使股票預(yù)測能夠在投資者與籌資者之間更靈活地運(yùn)用,以達(dá)到最優(yōu)資源配置市場。本文建議從以下幾個(gè)方面來粗略地完善我國股票市場,以減少股票市場的不確定性。

      第一,通過廣泛的社會調(diào)研與討論,確定我國股票市場經(jīng)濟(jì)發(fā)展的階段性目標(biāo)。第二,盡快構(gòu)建股市質(zhì)量動態(tài)監(jiān)測體系,以期實(shí)現(xiàn)達(dá)到及時(shí)準(zhǔn)確地評估和掌握股市質(zhì)量。第三,在上述基礎(chǔ)上,監(jiān)管部門應(yīng)關(guān)注市場質(zhì)量的變化,以期達(dá)到股市的穩(wěn)定,降低投資者和籌資者的風(fēng)險(xiǎn)性。

      七、展望

      中國股市是一個(gè)政策性市場,一旦有壞消息或好消息泄露出去,將對股市造成很大沖擊。此外,一些經(jīng)銷商和機(jī)構(gòu)也在經(jīng)營著股市,因此很難準(zhǔn)確預(yù)測股票價(jià)格。所以,我們在實(shí)際操作過程中應(yīng)該參考一些政策指標(biāo)或信息,然后根據(jù)實(shí)際預(yù)測的趨勢進(jìn)行相關(guān)投資,只是單一的用SVM 預(yù)測股票走勢,還需要進(jìn)一步研究和改進(jìn)。本文中進(jìn)行股票預(yù)測選定的是寶鋼股份和恒瑞醫(yī)藥。但如果選擇波動性更強(qiáng)的股票,SVM 的預(yù)測效果是否還有優(yōu)勢?能否進(jìn)一步研究和探索選股?9 維輸入特征空間是否包括了模型訓(xùn)練和預(yù)測所需要的全部信息?如果沒有將全部信息包含進(jìn)去將大大降低預(yù)測效果和精度,因此如何找到最具代表性的預(yù)測信息屬性還需要進(jìn)一步研究。但總體來說,股市預(yù)測雖然具有很大的挑戰(zhàn)性,但其現(xiàn)實(shí)意義是顯而易見的。

      猜你喜歡
      恒瑞醫(yī)藥寶鋼股份股票
      供給側(cè)改革背景下寶鋼股份降成本對策研究
      新疆鋼鐵(2023年3期)2024-01-09 02:20:52
      恒瑞醫(yī)藥財(cái)務(wù)分析
      恒瑞醫(yī)藥股權(quán)激勵(lì)政策的實(shí)施效果分析
      本周創(chuàng)出今年以來新高的股票
      本周創(chuàng)出今年以來新高的股票
      基于自由現(xiàn)金流量模型的上市公司價(jià)值投資研究
      本周連續(xù)上漲3天以上的股票
      近期連續(xù)漲、跌3天以上的股票
      海正應(yīng)該向恒瑞學(xué)些什么?
      玉山县| 科技| 黔南| 鹤庆县| 德阳市| 定日县| 陕西省| 延安市| 卓尼县| 杂多县| 和田市| 泾阳县| 英山县| 河源市| 顺平县| 景东| 什邡市| 海伦市| 恭城| 桂平市| 昌宁县| 光山县| 武宁县| 西乌珠穆沁旗| 那坡县| 托里县| 蒙阴县| 湖州市| 吉木萨尔县| 大英县| 长阳| 建阳市| 叶城县| 顺昌县| 大埔区| 维西| 宣化县| 柏乡县| 应城市| 梅河口市| 环江|