胡耕端
【摘要】受到人們生活水平的不斷提升的影響,人們閑置資金的數(shù)量也是與日俱增,也就使得投資需求越發(fā)旺盛。股票市場因其自身的高風險、高回報特點,成為了人們投資的重要途徑之一。但是,因為人們專業(yè)知識的不足以及股市信息的不對稱性,導致人們在選擇股票的時候存在著一定的盲目性,為此,如何利用股市中大量數(shù)據(jù)降低投資者的投資風險,就成為了一個極為現(xiàn)實的問題,而數(shù)據(jù)挖掘技術的誕生和發(fā)展正好滿足了這個需求。本文基于數(shù)據(jù)挖掘技術在股票分析中的可行性,在分析其特點及過程的基礎上,就數(shù)據(jù)挖掘技術在股票分析選擇中的應用提出了意見,以期為今后數(shù)據(jù)挖掘技術在股票選擇分析中的應用提供參考。
【關鍵詞】股票選擇分析? 數(shù)據(jù)挖掘技術? 可行性? 過程? 特點
證券行業(yè)發(fā)展至今已經(jīng)逐漸趨向于飽和,券商的工作重心也從之前的新客戶開發(fā)轉變?yōu)楝F(xiàn)存客戶的維護,通過為客戶提供優(yōu)質證券服務,以便進一步擴大交易量,這也就是投資顧問服務得以快速發(fā)展的原因所在。但是,其中卻存在著海量數(shù)據(jù)分析過于簡化的問題,導致其中隱藏的規(guī)律模型無法真正得以挖掘。數(shù)據(jù)挖掘技術的使用正好解決了這個問題,借助數(shù)據(jù)挖掘技術的幫助,可以從海量的數(shù)據(jù)中得出真正有價值的投資模型,并為客戶提供真正有效的投資參考。
一、數(shù)據(jù)挖掘概述
近年來,我國的證券行業(yè)越來越來越開放,業(yè)內的競爭也與日俱增,市場上各種投資機會非常之多,這就對我們的決策效率和質量提出了較高的要求。同時,而發(fā)展較快的數(shù)據(jù)挖掘技術能夠很好地滿足這方面的需求,可以為我們提供更加方便、快捷的決策工具,通過數(shù)據(jù)挖掘技術的開發(fā),可以有效地促進股票市場的發(fā)展。
(一)數(shù)據(jù)挖掘概念
數(shù)據(jù)挖掘(data mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、潛在有用的信息和知識的過程。從商業(yè)的層面來分析,我們可以從海量的有關企業(yè)的商業(yè)信息,從中提取對我們決策有用的信息,同時發(fā)現(xiàn)隱藏其中的商業(yè)規(guī)律,以便更好地掌握第一手商業(yè)信息資料。數(shù)據(jù)挖掘不是單獨的學科,是一個多學科交織在一起的學科,其中包含了許多發(fā)展較早且豐富的計算機技術及其工具,分別是數(shù)據(jù)庫技術、統(tǒng)計學、機器學習、模型識別、人工智能、建模技術、電子技術、信息技術等等。
(二)數(shù)據(jù)挖掘過程
數(shù)據(jù)挖掘的第一步是明確業(yè)務的內容,而后根據(jù)業(yè)務內容提出數(shù)據(jù)挖掘的目標。第二步是為數(shù)據(jù)挖掘做準備,包括:選擇數(shù)據(jù)——在大型數(shù)據(jù)庫和數(shù)據(jù)倉庫目標中提取數(shù)據(jù)挖掘的目標數(shù)據(jù)集;數(shù)據(jù)預處理——進行數(shù)據(jù)再加工,包括檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性、去噪聲,填補丟失的域,刪除無效數(shù)據(jù)等。再次是數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)功能的類型和和數(shù)據(jù)的特點選擇相應的算法,在凈化和轉換過的數(shù)據(jù)集上進行數(shù)據(jù)挖掘。進而是結果分析:對數(shù)據(jù)挖掘的結果進行解釋和評價,轉換成為能夠最終被用戶理解的知識。最后是知識的運用:將分析所得到的知識集成到業(yè)務信息系統(tǒng)的組織結構中去。
二、數(shù)據(jù)挖掘技術的特點分析
數(shù)據(jù)挖掘技術尤其自身的特點,在各行各業(yè)的應用也非常廣泛,不同的行業(yè)在運用數(shù)據(jù)挖掘技術時所展現(xiàn)的特征是不同的。而數(shù)據(jù)挖掘技術在股票市場上有很多優(yōu)勢性的特點,主要有探索性、方法多樣性以及可靠性的特點,下面是從這三個角度去分析:
(一)探索性
在數(shù)據(jù)挖掘技術的使用過程中,可以借助數(shù)據(jù)統(tǒng)計工具開展大型且雜亂數(shù)據(jù)的探索工作,可以很輕易的探索出上面提及研究內容的結果。更有甚者,會在數(shù)據(jù)的探索過程中,發(fā)現(xiàn)出實現(xiàn)沒有預估到的關系,在樣本數(shù)據(jù)真實可靠的情況下,借助數(shù)據(jù)挖掘技術得到這個數(shù)據(jù)之間的新關系在真實性以及可靠性就會相當之高,也就是得到了一個比之前預估更為符合實際的認知,這正是數(shù)據(jù)挖掘技術的探索性所在。
(二)方法多樣性
數(shù)據(jù)挖掘技術中年具備著極為多樣化的技術手段及分析方式,在其中應用最為廣泛的技術就是分類技術,分類技術解決的問題就是將數(shù)據(jù)進行歸類處理,從樣本數(shù)據(jù)出發(fā),建立一個適當?shù)念A測模型,開展預測工作。除此之外,聚類分析的應用也較為頻繁,其主要作用就是在建立一種分類方式的基礎上,將樣本數(shù)據(jù)按照一定的屬性性質親疏進行分類。除了這兩種方式之外,回歸分析、人工神經(jīng)網(wǎng)絡、關聯(lián)規(guī)則挖掘等等方式也都在股票數(shù)據(jù)分析中發(fā)揮出了巨大的作用。這些方式可以從實際股票信息出發(fā),做出適當?shù)倪x擇。
(三)可靠性
在股票市場上運用數(shù)據(jù)挖掘技術能夠大大增加信息的可靠性。因為,在實際的抽樣中,樣本數(shù)據(jù)并不能完全真正地代表股票總體數(shù)據(jù),由于數(shù)據(jù)中會存在著偶然性以及隨機性誤差,很容易在這些特點的影響下,出現(xiàn)數(shù)據(jù)過度擬合的問題,最終導致模型無效化,很有可能得出錯誤的結論,進而誘導投資者作出不恰當?shù)耐顿Y策略。
在數(shù)據(jù)挖掘技術中,為了更好的避免出現(xiàn)過度擬合的方式,基本使用的都是數(shù)據(jù)拆分方式,這種方式就是在自行設計比例及方式的前提下,將樣本數(shù)據(jù)劃分為訓練、驗證以及測試三大集合,并通過合理使用三大數(shù)據(jù)集合,就可以很好的避免出現(xiàn)過度擬合的問題,從而更好的保障模型自身的可靠性以及有效性,增加數(shù)據(jù)的可信度。
三、數(shù)據(jù)挖掘技術在股票分析中的應用
在證券市場上投資是存在一定的風險的,這其中有諸多因素,而對券商來說最重要的是數(shù)據(jù)的及時性、準確性以及有效性。因此,數(shù)據(jù)挖掘技術對于證券公司顯得越來越重要,券商也非常注重對數(shù)據(jù)挖掘技術的應用。尤其是在股票市場上,股民們更信賴信息準確的券商,同時券商不僅是股票售賣機構而且也是市場上巨大的機頭投資者。所以,對數(shù)據(jù)挖掘技術在股票分析的應用研究迫在眉睫,在此主要從證券應用領域的三個方面來說明。
(1)在股市客戶層面上:客戶關系管理( Custom Relationship Management ,CRM )是指通過有效管理客戶信息資源,提供客戶滿意的產(chǎn)品和服務,與客戶建立起長期、穩(wěn)定、相互信任的密切關系,為企業(yè)吸引新客戶,鎖定老客戶,提供效益和競爭優(yōu)勢。從這個定義上說,CRM 也是企業(yè)信息管理發(fā)展的一個新的階段。
我國證券業(yè)不斷開放發(fā)展,有關證券市場的制度也在不斷完善,使之與我國經(jīng)濟發(fā)展能夠同步,同時證券市場主體與日俱增,競爭強度愈來愈大。雖然其不斷地發(fā)展,但是仍然有些不足,有關證券業(yè)的市場制度應繼續(xù)完善。其中最重要的就是客戶管理方面,股民是股市的主體,客戶關系應該放在證券市場管理的首要位置,借助數(shù)據(jù)挖掘技術為其提供良好的管理工具。
創(chuàng)建“以客戶為中心”核心思想的證券客戶關系管理(CRM) 以及合作伙伴關系管理(PRM)系統(tǒng),來適應日益激烈競爭的市場。其首要落實的基礎是必須實現(xiàn)網(wǎng)絡化的交易,并且在此條件下,與客戶維持良好的關系同時建立穩(wěn)定的客戶管理網(wǎng)絡系統(tǒng),而后形成一個完整的信息處理體系,而這個體系是圍繞客戶而展開的,其宗旨是為客戶決策提供更多的信息服務,優(yōu)化其投資方案。
證券CRM系統(tǒng)幾乎可以濃縮現(xiàn)有證券業(yè)務的所有服務、技術和形象,但證券CRM系統(tǒng)不是傳統(tǒng)證券服務的照搬。傳統(tǒng)的證券機構系統(tǒng)是由外向內的轉變,先完善機構的外部形象,進而漸漸地向服務客戶的方向發(fā)展,其與傳統(tǒng)的證券機構系統(tǒng)相比,證券CRM系統(tǒng)具備了更高的服務質量,其不是單純地為客戶提供傳統(tǒng)的服務,而是通過數(shù)據(jù)挖掘技術為客戶提供經(jīng)過處理的股市信息,圍繞客戶價值需求而展開,真正地為客戶提供了價值創(chuàng)造的深層次服務。
在為客戶服務的過程中,證券CRM系統(tǒng)首先是對數(shù)據(jù)系統(tǒng)中的交易信息作出預處理,然后為客戶提供了專用的股票交易數(shù)據(jù)系統(tǒng)。在這個數(shù)據(jù)庫中,保存了大量的歷史數(shù)據(jù),并且通過一定的聚類分析方法為客戶提供分類的服務。它是通過每個客戶的交易行為來為客戶提供分類的交易信息,而且根據(jù)交易行為對其進行客戶分群。如此一來,數(shù)據(jù)系統(tǒng)就會根據(jù)后臺的客戶交易信息自動識別出客戶的群類,分析出客戶的交易行為特征,通過為每個客戶提供個性化的信息服務,不斷提高客戶的貢獻度,這樣可以不斷地為股市的發(fā)展積累更多的資源。
(2)在股市技術層面上:利用時間序列預測股票價格。數(shù)據(jù)挖掘顧名思義在海量的數(shù)據(jù)中提取有用的數(shù)據(jù),并對其進行分析,其中可以按照時間序列的方式來處理數(shù)據(jù)信息,其時間序列模型可以直接為客戶提供股票的價格信息。在巨大的數(shù)據(jù)庫中,通過主成分分析的方法,去掉對與股市無關的信息,或者是誘導性的不正確信息,讓數(shù)據(jù)變成可以直接使用的信息,幫助我們可以有效地對股市進行分析和預測。
通過歷史交易數(shù)據(jù)和時間序列方法的綜合使用,可以做到各種類型或者是單體股票對于各種類型信息的的影響變動敏感度,并通過實際的數(shù)據(jù)分析,將其中可以最為精準預測股票價格走向的技術分析指標集合挖掘出來。同時,還可以通過歷史時間段上的各個時間間隔的股票價格漲跌及交易量的具體變動信息,將大眾總體上的投資心理和投資傾向進行分析,目前最為常用的的時間序列分析法就是建立ARIMA模型,可以實現(xiàn)對股價及綜合指數(shù)的精準化預測,以此來幫助投資者在在眾多項目中選擇最有價值的項目,實現(xiàn)其資金效率最大化的目標。
在上市公司中,財務報表可以很好地為公司提供財務信息,很好的反映上市公司的財務狀況,而不同的股東對財務報表的需求是不一樣的,一般情況下,大股東比較注重公司的利潤,而一些國家控股的股東更關注公司的債務,普通股的股東比較在意公司的發(fā)展?jié)摿?,這些不同的財務報表使用者分別有不同的報表需求。從時間的維度來看,短期的投資者更加重投機的需求,其資金的投資者更關注利潤的分配,或者非常注重股市中一些有炒作嫌疑的信息(包括資產(chǎn)重組、免稅等信息),這些投資者希望股市的股價發(fā)生變動,通過股價提升來獲取暴利。再者,一些長期的投資者更注重投資需求,他們更多關注所投資上市公司的運營前景以及行業(yè)發(fā)展?jié)摿?,不會因為股市上一時的利空信息而收回資金,他們認為股價的波動不足以成為其進行決策的決定性因素,更代表不了上市公司的經(jīng)營前景。單純的通過某些會計科目來判斷公司的整體長期的發(fā)展,是不嚴謹?shù)?,公司的發(fā)展離不開宏觀經(jīng)濟的發(fā)展。若想更精準地把握公司的發(fā)展,需要縱向結合歷史時間序列數(shù)據(jù),挖掘數(shù)據(jù)的深度,并且橫向分析各行業(yè)的宏觀發(fā)展情況,增加數(shù)據(jù)的廣度,這樣就可以擴大分析的數(shù)據(jù),避免一些偶然性的數(shù)據(jù)所帶來的錯誤性信息,使之最大限度的保障投資決策的客觀性。所以,總體來講,為了提高決策的準確性,第一是長期動態(tài)的數(shù)據(jù)信息,第二是面對不同用戶的知識挖掘工具。如若處理各種類型、不同特征的數(shù)據(jù)信息,進行數(shù)據(jù)挖掘,那么就要組建一個高效的數(shù)據(jù)庫,對挖掘的數(shù)據(jù)進行存放,并且可以自主分析處理。
在組建數(shù)據(jù)庫的同時,更要注重數(shù)據(jù)挖掘的方法原則,這對于數(shù)據(jù)挖掘有效性有很大的幫助。市盈率也可以稱為價益比,在對上市公司進行財務分析時,是非常重要的一個要素,能夠對市盈率水平做出精確判斷,這無疑對股票市場的研究具有重大意義。除此之外,政府的相關金融部門通過掌握市盈率水平的信息,可以更深入地及時了解股市情況,對股市出現(xiàn)的問題可以最快的做出應對措施,避免股市的不良發(fā)展,保障國民經(jīng)濟的穩(wěn)定增長。就廣大的股民而言,整個股市市場的市盈率水平可以有效地識別市場風險;而分析個別板塊、個別股票市盈率,有利于幫助搜尋投資潛力最大的股票,從中獲取比較高的投資報酬。通常條件下,如果應得收益小于期望收益,也就是說均衡市盈率大于市盈率,投資者才有可能買入股票,如果情況相反,則股民有可能賣出股票。但是我們經(jīng)常所提的市盈率,是不能與均衡市盈率直接進行對比的。每股收益需要采取預期每股收益,那么市場中的投資者可以根據(jù)二者來得出均衡價格。在股價小于均衡價格時,則可以投資該股票;在股價大于均衡價格時,則不能投資該種股票。就每股收益來說,能夠展示公司的增長預測情況,這是股市投資者關注的最為重要的指標,不應單獨直觀去判斷它,而應采取科學的分析工具,可以通過數(shù)據(jù)挖掘,建立系統(tǒng)完善的數(shù)據(jù)庫來為投資者的決策所服務。
(3)在宏觀股市層面上:宏觀經(jīng)濟信息、產(chǎn)業(yè)、地區(qū)和公司的基本信息和股票價格是有關系的。他們之間的關系是可以通過組建數(shù)據(jù)庫來體現(xiàn)的,使用數(shù)據(jù)挖掘手段來凸顯其中的規(guī)律,并且根據(jù)股票發(fā)行的特點和真實價格的規(guī)律,來輔助我們對其股票進行預測。如果能夠大致預測其未來的股市趨勢,而且在完全市場有效的條件下,股市的信息就是國民經(jīng)濟的晴雨表,就可以體現(xiàn)地區(qū)的經(jīng)濟狀況,展現(xiàn)行業(yè)內的發(fā)展態(tài)勢,較好地去把握國民經(jīng)濟的發(fā)展趨勢。
在預測方面,可以通過運用決策樹的知識。在財務管理方面,規(guī)定每一項資產(chǎn)的真實價值就等于投資者對該項資產(chǎn)所有期望收益流量所折現(xiàn)的現(xiàn)值,所以影響一項資產(chǎn)的價值,不僅包括該項資產(chǎn)給投資者帶來的預期現(xiàn)金流量,而且與該項資產(chǎn)所使用的折現(xiàn)率息息相關。具體分析來看,不但需要預測折現(xiàn)率,并且還要預測預測該種股票的每股平均收益和派息率。如果股票的實際價值一旦被測量出來,那么就能夠與該種股票的市場價格做對比,若實際價值大于股票市場價格,則股票價格被低估了,要買進;如果實際價值小于股票市場價格,則股票的市場價格被高估了,要賣出。如此一來,就可以通過這種數(shù)據(jù)挖掘技術工具對股票價格進行合理性的鑒定和識別。
總之,宏觀經(jīng)濟的發(fā)展與股市是密不可分的,而股市信息的精確性、及時性以及有效性又是必不可少的。傳統(tǒng)的信息獲取方式已經(jīng)跟不上股市發(fā)展的步伐,而由于數(shù)據(jù)挖掘技術不斷地發(fā)展,恰恰能夠滿足股市市場的需求。在股票分析的層面上,應大力推行數(shù)據(jù)挖掘技術的應用,滿足不同客戶的不同需求,方便客戶的股票選擇過程,進而建立起信息有效的股市市場,從而更好的服務于我國的宏觀經(jīng)濟。
四、總結
隨著證券市場飽和度的逐步提升,券商的工作重心也逐漸轉變?yōu)榱爽F(xiàn)存的客戶,通過為客戶提供對應的投資顧問服務,進一步提升交易量,但是,在這個過程中卻涉及到了海量數(shù)據(jù)的分析,傳統(tǒng)的定性分析方式完全無法勝任,為此,數(shù)據(jù)挖掘技術因為股票市場數(shù)據(jù)的海量性等特點,在股票選擇分析中得以應用。通過模型進行海量數(shù)據(jù)的分析工作,在發(fā)現(xiàn)這些數(shù)據(jù)潛藏規(guī)律的前提下,為投資者確定投資目標、方向以及組合提供可靠的數(shù)據(jù)支撐,并且在未來,在股票分析選擇中具備著廣闊的應用前景。
參考文獻:
[1]李艷斌.基于數(shù)據(jù)挖掘技術的股票選擇分析研究[D].東北財經(jīng)大學,2018.
[2]朱小舟.數(shù)據(jù)挖掘方法在股票選擇中的應用研究[D].對外經(jīng)濟貿(mào)易大學,2018.
[3]黃悅.基于數(shù)據(jù)挖掘技術的股票選擇分析[D].北京外國語大學,2017.
[4]劉德政.基于錯誤發(fā)現(xiàn)率的案例分析[D].山東財經(jīng)大學,2017.
[5]李秋汶.數(shù)據(jù)挖掘技術和財務報表分析在股票投資中的應用[D].重慶大學,2017.
[6]戴鶴忠.基于數(shù)據(jù)挖掘技術的證券投資決策研究[D].北京科技大學,2017.
[7]張曉艷.股市數(shù)據(jù)挖掘中偏模型的檢驗和應用[D].西南財經(jīng)大學,2017.