余懷?婁必偉 余廷忠
針對(duì)股市常規(guī)基本面和技術(shù)面分析的局限性,基于大數(shù)據(jù)的股市預(yù)測及投資分析越加凸顯其投資收益的科學(xué)性和可靠性。文章從大數(shù)據(jù)技術(shù)視角,對(duì)神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)等算法、以及對(duì)投資情緒和量化投資等問題進(jìn)行研究綜述。
股票投資是高收益與高風(fēng)險(xiǎn)并存的,自股市誕生以來,股票波動(dòng)及走勢一直是每個(gè)投資者高度關(guān)注和研究的話題。投資者希望通過股市研究,揭示大盤及個(gè)股走勢規(guī)律,從而對(duì)個(gè)股行情及走勢進(jìn)行預(yù)判。但由于股票投資市場存在非線性、不平穩(wěn)性及高度復(fù)雜性等特征,使得投資者對(duì)股票走勢預(yù)測研判具有很多不確定性。但隨著大數(shù)據(jù)技術(shù)在各個(gè)行列的應(yīng)用不斷普及和深入,特別對(duì)股票走勢預(yù)測及研判的指導(dǎo)作用必將越來越凸顯其重要性。
一、股市行情分析概述
(一)常規(guī)股市行情分析方法
人們通常對(duì)股市行情分析主要包括基本面和技術(shù)面兩方面。
1.基本面分析
基本面分析有廣義和狹義之分:廣義的基本面分析,是指以經(jīng)濟(jì)學(xué)中的供求關(guān)系為研究基礎(chǔ),通過分析歷史經(jīng)濟(jì)數(shù)據(jù)和政治環(huán)境,主要對(duì)利率水平及通貨膨脹等為主要指標(biāo)的宏觀經(jīng)濟(jì)運(yùn)行狀況、企業(yè)素質(zhì)等為主導(dǎo)的微觀經(jīng)濟(jì)情況和政治環(huán)境等進(jìn)行分析,以便對(duì)金融市場趨勢進(jìn)行預(yù)測;狹義的基本面分析,主要針對(duì)企業(yè)財(cái)務(wù)報(bào)表中的機(jī)構(gòu)管理成員素質(zhì)、財(cái)務(wù)指標(biāo)、所屬行業(yè)發(fā)展及主打產(chǎn)品競爭強(qiáng)度等進(jìn)行分析,著重對(duì)公司的經(jīng)營管理分析、市場狀況和行業(yè)地位等方面的分析,主要分析公司主營業(yè)務(wù)成長性和宏觀經(jīng)濟(jì)運(yùn)行態(tài)勢,對(duì)公司價(jià)值及股價(jià)走勢的影響進(jìn)行預(yù)測及研判。基本面分析將為中長線投資者提供投資決策的主要依據(jù)。
2.技術(shù)面分析
技術(shù)面分析是通過對(duì)市場行為研究來預(yù)判市場運(yùn)作趨勢,通過市場運(yùn)作趨勢的變化周期來進(jìn)行股票交易的決策。技術(shù)分析者認(rèn)為股票市場行為具有重復(fù)性,市場交易的歷史必會(huì)重演。技術(shù)面分析著重以供求關(guān)系為基礎(chǔ)對(duì)股市行情進(jìn)行分析研究。主要研究股票價(jià)格動(dòng)向、換手率、交易量、交易趨勢等技術(shù)指標(biāo)(包括持股人對(duì)未來的希望、擔(dān)心及恐懼等,都將直接反映在股票價(jià)格和交易量上),使用這些指標(biāo),以便對(duì)該股票的未來價(jià)格進(jìn)行預(yù)判,從而進(jìn)行投資決策。
二、基于大數(shù)據(jù)技術(shù)的股市分析
隨著大數(shù)據(jù)技術(shù)應(yīng)用的普及,股票市場交易海量數(shù)據(jù)越來越引起眾多學(xué)者關(guān)注。當(dāng)前大數(shù)據(jù)在證券行業(yè)中的應(yīng)用大致分為三個(gè)方面,一是對(duì)股價(jià)進(jìn)行預(yù)測;二是對(duì)客戶關(guān)系進(jìn)行管理;三是對(duì)投資景氣指數(shù)預(yù)測。基于大數(shù)據(jù)技術(shù)的股市分析包含可視化分析、數(shù)據(jù)挖掘算法、預(yù)測性分析能力、語義引擎、數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理、數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)倉庫等六個(gè)基本方面。特別值得關(guān)注的是,支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹等方法已被廣泛應(yīng)用于股票預(yù)測領(lǐng)域。
(一)基于神經(jīng)網(wǎng)絡(luò)算法分析
基于神經(jīng)網(wǎng)絡(luò)的算法對(duì)股票進(jìn)行技術(shù)分析,主要通過確定預(yù)測樣本并設(shè)定目標(biāo)變量進(jìn)行預(yù)測,將實(shí)際值與預(yù)測值相互比較,最后通過建立擬合方程得出實(shí)際值與預(yù)測值之間的關(guān)系,以便為投資者提供決策參考。
(二)基于機(jī)器學(xué)習(xí)算法分析
股票研究學(xué)者還通過股票交易過程中獲得的歷史大數(shù)據(jù)使用機(jī)器學(xué)習(xí)算法,進(jìn)行建模和訓(xùn)練,并將訓(xùn)練出來的模型對(duì)股票預(yù)期走勢進(jìn)行預(yù)測研判。例如,就股票成交量來說,它是取值于非負(fù)整數(shù)的時(shí)間序列數(shù)據(jù),對(duì)此類數(shù)據(jù)的建模,常常會(huì)出現(xiàn)估計(jì)偏差過大或預(yù)測值是非整數(shù)等問題,使傳統(tǒng)時(shí)間序列模型不再適用。因此其主流建模方法采用基于各類稀疏算子所建立的整數(shù)值時(shí)間序列模型。由于INAR 模型結(jié)構(gòu)較簡單、解釋性強(qiáng),因此受到廣大學(xué)者普遍關(guān)注。當(dāng)前許多學(xué)者還利用大數(shù)據(jù)將股票每日收盤價(jià),按時(shí)間先后次序排列構(gòu)造成股票交易的時(shí)間序列模型,根據(jù)該模型來對(duì)股票未來變化趨勢預(yù)測。其中相當(dāng)著名的是ARIMA模型。
(三)基于高頻大數(shù)據(jù)的應(yīng)用
當(dāng)前基于大數(shù)據(jù)的倉庫存儲(chǔ)技術(shù)愈加成熟,而高頻數(shù)據(jù)是其中最常見的數(shù)據(jù)之一。人們對(duì)高頻數(shù)據(jù)的分析越來越關(guān)注和重視,特別是對(duì)金融交易規(guī)律高頻數(shù)據(jù)的分析, 已成為眾多投資者和金融研究者的共同訴求。每日股票交易成交量已真實(shí)地記錄并反饋出股市的走勢及盤口變化的趨勢,同時(shí)也反映出證券市場的交易活躍程度,研究股票日內(nèi)交易的高頻成交量變化規(guī)律,不僅能夠輔助機(jī)構(gòu)投資者有效評(píng)估并預(yù)測股市走勢及動(dòng)態(tài),還可使股民及時(shí)規(guī)避投資風(fēng)險(xiǎn),因此研究股票交易的高頻數(shù)據(jù)其重要性不言而喻。
(四)基于大數(shù)據(jù)的投資情緒分析
投資情緒包含影響投資者對(duì)股票估值及市場預(yù)期看法的眾多因素。長期以來,券商或證券研究者對(duì)投資者情緒的評(píng)估測量及量化分析,既是突出的難題也顯得至關(guān)重要。當(dāng)前利用大數(shù)據(jù)技術(shù)對(duì)投資情緒的分析,主要體現(xiàn)在通過網(wǎng)民微博、論壇、博客及各種龐大繁雜的網(wǎng)絡(luò)媒體介質(zhì)中挖掘獲取有價(jià)值的非結(jié)構(gòu)化的信息,并經(jīng)過數(shù)據(jù)分析和處理轉(zhuǎn)化為結(jié)構(gòu)化信息,結(jié)合情感詞典,應(yīng)用情感分析引擎獲取投資者情緒評(píng)價(jià)指標(biāo),從而得到投資者情緒分析的結(jié)果。
(五)基于大數(shù)據(jù)的量化投資分析
量化投資,是指對(duì)證券市場及產(chǎn)品根據(jù)歷史交易相關(guān)數(shù)據(jù)進(jìn)行量化分析,建立相關(guān)數(shù)據(jù)算法模型,并根據(jù)模型做出投資決策,再由算法自動(dòng)完成下單交易。通過人工智能、數(shù)據(jù)挖掘、支持向量機(jī)等大數(shù)據(jù)分析工具,可使證券投資實(shí)現(xiàn)智能化和高頻化。應(yīng)用量化投資,其特點(diǎn)是借助建模和編程方法,使用Python、MATLAB、R等工具軟件建立投資策略。通過投資策略進(jìn)行量化選股,可使工作效率大大提高,并且使用機(jī)器操作可排除人工操作的不理智及隨意性,使決策結(jié)果更加客觀,避免了盲目跟風(fēng)等決策方式。
下面我們將根據(jù)上市公司財(cái)務(wù)報(bào)表、股市行情基本數(shù)據(jù)及股票相關(guān)影響因素,結(jié)合學(xué)者盛光進(jìn)的股票價(jià)值量化投資模型,建立的股票量化分析模型如表1所示:
可根據(jù)股票量化分析模型對(duì)任何一個(gè)股票量化出一個(gè)分?jǐn)?shù),根據(jù)該分?jǐn)?shù)的高與低表示此股票的好與壞(得分越高,表明股票的投資價(jià)值越大)。
充分考慮股票得分,并結(jié)合股票所屬板塊、題材及國家政策支持等各種其他因素綜合分析,進(jìn)行股票買賣決策,投資收益概率會(huì)更高。
三、大數(shù)據(jù)及人工智能技術(shù)在股票交易市場中的應(yīng)用
顯然應(yīng)用股票量化分析模型進(jìn)行投資決策,需要對(duì)其模型中的各項(xiàng)指標(biāo)參數(shù)進(jìn)行量化,這需要統(tǒng)計(jì)和分析大量數(shù)據(jù)資料,才可能獲得真實(shí)可靠的參數(shù),其難度較大。這不是一般投資者能掌握的,為此下面介紹一般投資者都能掌握的方法。
目前很多股票交易軟件都使用了大數(shù)據(jù)及人工智能技術(shù)為投資者提供股市及股票咨詢、智能診股及選股,以及智能統(tǒng)計(jì)交易產(chǎn)生的各種數(shù)據(jù)等諸多服務(wù)。例如,同花順軟件提供了基于大數(shù)據(jù)的AI信息查詢及數(shù)據(jù)分析和智能選股的“問財(cái)”、動(dòng)態(tài)板塊、競價(jià)分析等功能,可以為投資者對(duì)當(dāng)日及未來的大盤指數(shù)及股票走勢預(yù)測作輔助研判;指南針炒股軟件應(yīng)用大數(shù)據(jù)技術(shù)為投資者提供了實(shí)時(shí)直觀顯示的主力資金流向圖(包括主力大單、主力資金、敢死隊(duì)資金及多空資金)。
下面以同花順“問財(cái)”投資策略為例,對(duì)基于大數(shù)據(jù)及人工智能技術(shù)的投資策略進(jìn)行分析。
(一)“問財(cái)”功能的技術(shù)背景分析
同花順的“問財(cái)”熱搜策略是基于人工智能技術(shù),利用多因子模型構(gòu)建的選股策略,洞察智能投資行業(yè)未來發(fā)展趨勢,致力于將人工智能、大數(shù)據(jù)、知識(shí)圖譜等信息技術(shù)和專業(yè)的投資理念相結(jié)合,打造下一代智能投資平臺(tái),致力于為中小投資者提供專業(yè)的數(shù)據(jù)服務(wù),具有對(duì)話算法、知識(shí)圖譜及智能搜索等功能。對(duì)話算法功能將多輪對(duì)話、圖譜問答、全雙工、多模態(tài)、機(jī)器閱讀等領(lǐng)域前沿算法技術(shù)轉(zhuǎn)化為智能投資、智能客服、智能營銷等智能機(jī)器人產(chǎn)品;知識(shí)圖譜功能將自然語言、圖像中的深度學(xué)習(xí)技術(shù)、本體推理技術(shù)、因果推理技術(shù),以及傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)集成到金融信息生產(chǎn)線、金融知識(shí)融合、金融邏輯框架自動(dòng)生成等產(chǎn)品中,為智能投資提供堅(jiān)實(shí)的數(shù)據(jù)支撐和邏輯支撐;智能搜索功能擁有百萬級(jí)站點(diǎn)的分布式抓取,整合百億級(jí)全網(wǎng)文本、視頻以及金融領(lǐng)域多年積累數(shù)據(jù),利用語義理解,情感分析和知識(shí)圖譜技術(shù),通過在海量信息中挖掘行業(yè)、公司及人物之間關(guān)系,構(gòu)建事件圖譜,為千萬用戶提供全面及時(shí)準(zhǔn)確的一站式智能搜索服務(wù)。
(二)“問財(cái)”投資策略功能的應(yīng)用分析同花順的“問財(cái)”投資策略在每個(gè)交易日都將根據(jù)大數(shù)據(jù)及人工智能算法模型,在集合進(jìn)價(jià)結(jié)束,即9:25及盤中的時(shí)候,分別按照跟著主力、溫和放量、趨勢向上、機(jī)構(gòu)大舉買入、主力進(jìn)入及趨勢良好等板塊推出1只或多只股票。
跟著主力板塊:系統(tǒng)將根據(jù)量能理論,使用成交量,主力資金等多維度指標(biāo)分析,在每日9:25開盤,選出當(dāng)日最具上漲潛力的股票。
溫和放量板塊:系統(tǒng)將根據(jù)量能理論,使用近兩日成交量,前一交易日漲停封流比等多維度指標(biāo)分析,在每日9:25開盤,選出當(dāng)日最具連板潛力的股票。
趨勢向上板塊:系統(tǒng)將根據(jù)道氏理論,使用均線,CR機(jī)構(gòu)多空線等多維度指標(biāo)分析,在每日9:25開盤,選出最具上漲潛力的股票。
機(jī)構(gòu)大舉買入板塊:系統(tǒng)根據(jù)機(jī)構(gòu)席位大額凈買入,籌碼集中在機(jī)構(gòu)手中等維度分析,在每日9:25開盤,選出近期最具上漲潛力的股票。
主力進(jìn)入板塊:系統(tǒng)將通過DDE大單、中單等多個(gè)資金指標(biāo)綜合判斷主力強(qiáng)弱,同時(shí)選取成交量放量,股價(jià)低于最高點(diǎn)50%以上的個(gè)股。
趨勢良好板塊:系統(tǒng)將根據(jù)均線和量能理論,結(jié)合近3天振幅大于5%、近5天漲跌幅小于15%,在盤中選出符合條件的股票,代表具備一定的趨勢潛力。
例如,表2表示“問財(cái)”投資策略系統(tǒng)從2021年8月10日至2021年8月20日(共9個(gè)交易日),跟著主力、股價(jià)低估、溫和放量、趨勢向上、機(jī)構(gòu)買入、主力進(jìn)入共六個(gè)板塊所推出的131支股票交易按板塊平均值計(jì)算的行情數(shù)據(jù)。
從表中可看出,在股票推出當(dāng)天如果投資者以開盤價(jià)買進(jìn),等到次日再以開盤價(jià)賣出都會(huì)獲得普遍不錯(cuò)的收益。特別是屬于機(jī)構(gòu)買入和趨勢向上的板塊,平均收益率會(huì)更高。如果按開盤價(jià)當(dāng)天買入所屬“機(jī)構(gòu)買入”板塊推出的股票,當(dāng)天的平均收益率將達(dá)到4.54%,次日開盤平均收益率為2.38%,若以次日開盤價(jià)賣出,平均收益率將達(dá)到6.92%。
結(jié) 語
雖然大數(shù)據(jù)及人工智能技術(shù)在證券市場得到廣泛應(yīng)用,為投資者提供股市及股票咨詢、智能診股及選股,以及智能統(tǒng)計(jì)交易產(chǎn)生的各種數(shù)據(jù)等諸多服務(wù),使投資者對(duì)股票的交易行為更加理智和科學(xué)。但投資者應(yīng)當(dāng)知道,影響證券市場的因素極其復(fù)雜,任何軟件和技術(shù)都有一定的局限性,故大數(shù)據(jù)及人工智能技術(shù)的使用只能作為參考。
(作者單位:貴州工程應(yīng)用技術(shù)學(xué)院;信息工程學(xué)院)
本文系2021年貴州工程應(yīng)用技術(shù)學(xué)院大學(xué)生創(chuàng)新訓(xùn)練省級(jí)項(xiàng)目“基于大數(shù)據(jù)的股票量化分析及趨勢研究” (編號(hào):S202110668070)。