• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      中國A股上市公司股票預(yù)測分析方法研究
      ——基于關(guān)聯(lián)規(guī)則

      2019-04-01 03:20:52牛丹辰韓曉琳山西財(cái)經(jīng)大學(xué)財(cái)政金融學(xué)院
      新商務(wù)周刊 2019年4期
      關(guān)鍵詞:項(xiàng)目組置信度股票

      文/牛丹辰 韓曉琳,山西財(cái)經(jīng)大學(xué)財(cái)政金融學(xué)院

      隨著計(jì)算機(jī)、數(shù)據(jù)庫和Internet技術(shù)的發(fā)展應(yīng)用,上市公司可以更為方便快捷地公布股票信息,同時投資者可以更為有效地、及時地獲取信息,這也就導(dǎo)致了股票市場涌現(xiàn)出了各式各樣的股票信息。面對新的發(fā)展形勢,如何從龐大的數(shù)據(jù)信息中找到有用的知識為投資者的投資行為提供指導(dǎo),已成為一個重要的研究方向。自Agrawal等提出關(guān)聯(lián)規(guī)則挖掘的Apriori算法以來,越來越多的研究應(yīng)用于證券市場。目前這些研究基本集中于兩大方面,一是挖掘各個股票的股價漲跌關(guān)聯(lián) ,另一方面則是以股票收益率為出發(fā)點(diǎn)進(jìn)行分析。本文集中研究挖掘各個股票收益率之間的關(guān)聯(lián)關(guān)系。

      1993年,Agrawal等人在首先提出關(guān)聯(lián)規(guī)則概念,同時給出了相應(yīng)的挖掘算法AIS,但是性能較差。1994年,他們建立了項(xiàng)目集格空間理論,并依據(jù)上述兩個定理,提出了著名的 Apriori算法,至今 Apriori算法仍然作為關(guān)聯(lián)規(guī)則挖掘的經(jīng)典算法被廣泛討論,以后諸多的研究人員對關(guān)聯(lián)規(guī)則的挖掘問題進(jìn)行了大量的研究。

      關(guān)聯(lián)規(guī)則挖掘過程主要包含兩個階段:第一階段必須先從資料集合中找出所有的高頻項(xiàng)目組,第二階段再由這些高頻項(xiàng)目組中產(chǎn)生關(guān)聯(lián)規(guī)則。

      關(guān)聯(lián)規(guī)則挖掘的第一階段必須從原始數(shù)據(jù)集合中,找出所有高頻項(xiàng)目組。高頻的意思是指某一項(xiàng)目組出現(xiàn)的頻率必須達(dá)到某一水平。某一項(xiàng)目組出現(xiàn)的頻率稱為支持度,以一個包含A與B兩個項(xiàng)目的2-itemset為例,我們可以經(jīng)由公式求得包含{A,B}項(xiàng)目組的支持度,若支持度大于等于所設(shè)定的門檻值時,則{A,B}稱為高頻項(xiàng)目組。一個滿足最小支持度的k-itemset,則稱為高頻k-項(xiàng)目組(Fr equent k-itemset),表示為 Large k。算法再從Large k的項(xiàng)目組中再產(chǎn)生 Large k+1,直到無法再找到更長的高頻項(xiàng)目組為止。關(guān)聯(lián)規(guī)則挖掘的第二階段是要產(chǎn)生關(guān)聯(lián)規(guī)則。從高頻項(xiàng)目組產(chǎn)生關(guān)聯(lián)規(guī)則,是利用前一步驟的高頻 k-項(xiàng)目組來產(chǎn)生規(guī)則,在最小信賴度的條件門檻下,若一規(guī)則所求得的信賴度滿足最小信賴度,稱此規(guī)則為關(guān)聯(lián)規(guī)則。

      本文采用中國證券A股市場2016~2017年共 260個交易日的數(shù)據(jù),刪除金融行業(yè)公司、數(shù)據(jù)不齊全的公司、ST公司,得到近2 000支股票的日收盤價,并據(jù)此計(jì)算出股票收益率作為測試值 ,加入主觀興趣度約束和客觀興趣約束,挖掘出真正感興趣的關(guān)聯(lián)規(guī)則。由于關(guān)聯(lián)規(guī)則挖掘的是布爾型數(shù)據(jù) ,這里需要對收益率數(shù)據(jù)進(jìn)行區(qū)間的劃分,為增強(qiáng)便利性與實(shí)用性,文章放棄使用SQL語句實(shí)現(xiàn)數(shù)據(jù)庫中收益率數(shù)據(jù)區(qū)間的劃分,而是選擇在程序設(shè)計(jì)中用代碼實(shí)現(xiàn)。文章將收益率劃分為三個區(qū)間 , 0~10 %(L),11%~25%(M),26%~100(H)。并且將所有數(shù)據(jù)隨機(jī)均分成兩部分,一部分為訓(xùn)練數(shù)據(jù) ,一部分為測試數(shù)據(jù)。

      文章采取應(yīng)用經(jīng)典 Apriori 算法在股票行情數(shù)據(jù)中挖掘關(guān)聯(lián)規(guī)則的方法 該方法的目標(biāo)是在股票行情數(shù)據(jù)中找出類似于“T 天內(nèi) ,如果 A 股票收益率上漲 ,則 B股票收益率也上漲的概率是80%”的關(guān)聯(lián)規(guī)則。設(shè)置最小支持度分別為 0.2、0.25、0.3和 0.35,最小置信度分別為0.7、0.8、0.9、0.95,客觀興趣度RI要求大于0。得到如下結(jié)果:

      由上圖可以看出 ,本文所設(shè)計(jì)的方法在上述現(xiàn)實(shí)數(shù)據(jù)源上可達(dá)到70 %以上的預(yù)警準(zhǔn)確率,通過合理設(shè)置參數(shù),最高可達(dá)到93 %的準(zhǔn)確率。隨著置信度的增加,預(yù)警準(zhǔn)確率總體呈上升趨勢;而支持度的影響就沒有那么明顯了,而且在置信度為0.9時,支持度與挖掘準(zhǔn)確率反而呈反比例趨勢。這可能是因?yàn)橛?xùn)練階段導(dǎo)出的規(guī)則集,測試數(shù)據(jù)源中支持度相對較低的部分,其置信度反而要高。

      本文在簡要介紹目前數(shù)據(jù)挖掘技術(shù)在股票數(shù)據(jù)的應(yīng)用,加入了“主觀興趣度”與“客觀興趣度”的雙約束條件進(jìn)行的數(shù)據(jù)挖掘,挖掘可以用來預(yù)測股價變動趨勢的規(guī)則,并運(yùn)用 Apriori 算法,使用中國證券市場2016—2017年的股票收盤價格數(shù)據(jù)庫作為測試集,發(fā)現(xiàn)了很多有價值的規(guī)則,這些規(guī)則很難通過肉眼分析或查看股票基本資料來確定它的原因,可以看出,關(guān)聯(lián)規(guī)則分析“挖掘”出了隱藏在數(shù)據(jù)中“知識”,且得到的關(guān)聯(lián)規(guī)則的準(zhǔn)確度大大地提高。

      猜你喜歡
      項(xiàng)目組置信度股票
      硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
      CSCO生物統(tǒng)計(jì)學(xué)專家委員會RWE項(xiàng)目組簡介
      Association between estradiol levels and clinical outcomes of IVF cycles with single blastocyst embryo transfer
      基于數(shù)字化平臺的項(xiàng)目組管理實(shí)踐
      正負(fù)關(guān)聯(lián)規(guī)則兩級置信度閾值設(shè)置方法
      本周創(chuàng)出今年以來新高的股票
      本周創(chuàng)出今年以來新高的股票
      本周連續(xù)上漲3天以上的股票
      近期連續(xù)漲、跌3天以上的股票
      置信度條件下軸承壽命的可靠度分析
      軸承(2015年2期)2015-07-25 03:51:04
      诸城市| 调兵山市| 清水河县| 瑞金市| 山西省| 常熟市| 福建省| 兰溪市| 石城县| 澄江县| 宜春市| 敖汉旗| 荥经县| 定结县| 金昌市| 遂昌县| 天门市| 南投县| 徐水县| 青田县| 福鼎市| 台山市| 油尖旺区| 获嘉县| 会东县| 京山县| 昭通市| 丽水市| 汝城县| 黄龙县| 利津县| 武川县| 长宁区| 威海市| 大埔县| 英山县| 泾川县| 明星| 天等县| 张家港市| 郎溪县|