• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于文本挖掘和機器學習的股指預測與決策研究

      2019-05-22 00:53:48戴德寶蘭玉森范體軍
      中國軟科學 2019年4期
      關鍵詞:情緒預測文本

      戴德寶,蘭玉森,范體軍,趙 敏

      (1.上海大學 管理學院,上海 200444;2.華東理工大學 商學院,上海 200237;3.上海大學悉尼工商學院,上海 201800)

      一、引言

      《世界互聯(lián)網發(fā)展報告2018》和《中國互聯(lián)網發(fā)展報告2018》藍皮書數據顯示:2017年,中國數字經濟總量達27.2萬億元,對GDP增長貢獻率達55%,全球數字經濟規(guī)模達12.9萬億美元,中國位居全球第二。以互聯(lián)網為代表的信息技術和人類生產生活深度融合,引領創(chuàng)新,驅動轉型。社交平臺作為數字經濟呈現形式之一,現已是消費者或投資者交換觀點、情感和知識的重要渠道。與調查問卷、檔案數據和訪談記錄等信息源相比,社交平臺數據能夠規(guī)避傳統(tǒng)信息收集方式的滯后、缺失和高投入等弊端,具有用戶基數大、社交性強、涉入性高、響應速度快等優(yōu)勢。借助博客、微博和論壇等不同社交平臺在線文本,利用文本挖掘和情感分析技術可以研究許多相關主題[1]:使用在線評論分析結果減少網絡購物不確定性和風險[2],使用社交平臺用戶的產品感知和意見挖掘結果優(yōu)化產品品質和提高品牌價值[3],發(fā)現學習社區(qū)對學習效果的影響與促進作用[4],檢驗在線投資者情緒與資本市場的關聯(lián)狀況[5-6]。網絡社交平臺已成為在線商品和服務交易數據觀察利用空間。黨和政府給予高度評價、期望和要求,十九大報告提出“貫徹新發(fā)展理念,建設現代化經濟體系”?!盎ヂ?lián)網+金融”促進金融體制改革,允許優(yōu)質企業(yè)申辦網絡銀行[7-8],開放小額貸款平臺,允許互聯(lián)網企業(yè)施行消費貸款,利用用戶原創(chuàng)內容(user generated content,UGC)分析用戶行為和預測市場趨勢。

      金融市場規(guī)律研究或趨勢分析有助于金融機構和投資者防范金融風險、增強現代金融監(jiān)管并促進金融體系良性運轉。股市分析技術證明資本市場有后驗規(guī)律但難以把握未來,股價是否能夠預測莫衷一是。由于新信息隨機性和不可預知性,股票價格處于無規(guī)則行走模式,未來價格根本賭注是現在價格,預測準確率將不超過50%。然而許多研究結果表明股價不遵循隨機漫步理論,而是受公司財務情況、宏觀經濟指標和歷史交易數據等眾多因素影響,可以使用多維度的數據預測[9],股票走勢預測準確率到達56%即為滿意[10]。金融學、心理學和行為學等結合派生的行為金融學[11]認為股票價格并非只由企業(yè)內在價值決定,很大程度上受投資者心理和行為影響?;谕顿Y者情緒的股價預測研究框架主要涵蓋以下三個方面。

      (1)情緒資源。一是網上新聞:金融新聞否定句與股價相關關系[12]以及紐約時報和40個世界金融指數聯(lián)系研究有力支持行為金融學新經濟范式作用[13]。二是社交媒體資源:社交平臺的投資者文本情緒影響股價[14]。由于微博推文內容無法聚焦和用戶地理位置無法確定等缺陷[15],近期研究選擇股民聚集度高、話題專業(yè)性強、情緒傳遞性快的財經論壇(如StockTwits[16]、Yahoo財經網[10,17]和東方財富網[18-20])挖掘投資者情緒。

      (2)情緒指標。一是與數量相關指標:Google搜索量(Search Volume Index,SVI)的增長能夠預示未來兩周股價上漲[21],股吧社區(qū)發(fā)帖量影響股價[20];二是與情緒相關指標:各類社交媒體整體情緒與股票回報和投資風險有關,且優(yōu)越于傳統(tǒng)媒體[22]。影響股價的情緒可分為六個維度:Calm、Alert、Sure, Vital、Kind和Happy等[6],或者五個維度:強烈買入、買入、中性、賣出和強烈賣出等[18]。

      (3)預測對象。一是個股股價走勢:多家公司Twitter情緒和異常股票回報相關[5],投資者瀏覽行為及情緒變化能夠有效預測股票[23],投資者情緒通過網絡自媒體傳播會影響多只股票收益[20];二是股票價格指數(即股指)預測:滬深300指數探究投資者情緒與股價存在因果關系[15,19]。常見預測股指包括道瓊斯指數(DJIA)[6]、標準普爾指數(S&P500)[14]、上證指數(SSEC)[24]等。

      金融市場預測方法包含經典統(tǒng)計學的多元回歸模型[18,22]、自向量回歸模型[25]以及支持向量機(support vector machine, SVM)[10,14,24]、神經網絡[6,14,25]、隨機森林[14]等現代機器學習方法,SVM和BP神經網絡應用最多。傳統(tǒng)回歸分析以嚴格假設和充足先驗為前提,難以構建有效金融預測模型,機器學習能夠自主學習反復改善和優(yōu)化算法,結果滿意[26]。其他如Adaboost、LinearSVC等方法遜于SVM和BP神經網絡對復雜非線性問題的處理。

      許多基于文本挖掘的金融市場關聯(lián)或預測文獻研究直接將單一維度情緒變量(積極情緒或消極情緒)直接加入模型,而且少有對非線性和高噪音情緒數據進行處理,容易驗證是否與金融市場關聯(lián),難以取得較好的預測效果。本文通過抓取東方財富股票論壇數據,借鑒天氣或事件的金融關聯(lián)分析過程[27],不僅剔除中性或噪音數據,而且選取相關性強的情緒數據參與投資者情緒指數設計,基于情緒數據和股指數據非線性特征,利用SVM和BP神經網絡兩類模型進行股指預測,證明投資者情緒與股指存在內在聯(lián)系,并且預測高效,以期為投資者、上市公司和政府監(jiān)管部門的決策支持提供良好參考價值。

      二、基于文本挖掘和機器學習的股指預測

      基于文本挖掘和機器學習的股指預測內容包括股指和情緒兩種數據的預處理和平穩(wěn)性檢驗、預測組合指數構建及數據生成、常用兩種股指預測的機器學習算法檢驗等四個部分。

      (一)股指數據獲取與情緒數據預處理

      (1)情緒數據獲取與預處理。投資者情緒文本數據源于東方財富網股吧論壇實戰(zhàn)吧,使用Python共抓取帖子368586條,跨度:2016年7月19日至2017年12月29日。通過編寫帖子清洗規(guī)則剔除不能表達投資者情緒的主題帖,共保留帖子217445條。清洗規(guī)則包括圖片(無文字)、鏈接(無文字)、亂符(無意思)和實盤組合(系統(tǒng)自動生成)等四種相關類型;文本情緒分類方面,利用基于詞典的中文情感分析方法[28]對帖子情感打分。詞典由情感詞、程度副詞和否定詞三類詞匯組成,根據式(1)計算帖子綜合情感得分。情感詞包括通用情感詞典和專用情感詞(陰跌、利好、誘多、狗莊和割肉等)。

      PostScore=Wr·

      (1)

      其中,PostScore為情感綜合得分,m為一個帖子標題的情感詞數目,n和nn分別為第i個情感詞前面程度副詞數量和否定副詞數量;Ws、Wm和Wr分別為對應帖子標題的各情感詞分值、各標點符號分值和反問詞分值;Wd和Wn分別為對應情感詞前面的程度副詞分值和否定副詞分值。

      本實驗主要研究積極與消極情緒參與的股指預測,將不同情緒帖子數量按天歸類處理,得到一般積極、中度積極、高度積極、一般消極、中度消極、高度消極六個具有情緒傾向的時間序列數據[24],分別計入變量PI、PII、PIII、NI、NII、NIII。

      (2)股市交易數據獲取。上證指數(000001)交易數據導出自通達信金融終端,時段自2016年7月19日至2017年12月29日356個交易日的歷史信息:收盤價(CLOSE)、開盤價(OPEN)、最高價(HIGH)、最低價(LOW)、成交量(VOL)和成交額(AMO),綜合考慮相關系數矩陣結果及變量實際意義,選取收盤價表示上證指數數據(SSEC)。

      (二)股指數據與情緒數據平穩(wěn)性檢驗

      (1)數據標準化。為消除股票交易數據和投資者論壇情緒數據間的量綱關系,提高數據可比性,需對兩類數據按照式(2)進行標準化(Z-Score)處理,μ為樣本數據均值,σ為樣本數據標準差。

      z=(x-μ)/σ

      (2)

      (2)單位根檢驗。是通過對時間序列矩的隨機游走檢驗排除統(tǒng)計數據的偏誤及模型的偽回歸,保證預測模型的穩(wěn)定性,不存在單位根則時間序列平穩(wěn)。本文選用ERS(Eiliot, Rothenberg and Sock Point Optimal Test)檢驗單位根,避免檢驗包含常數項和趨勢變量項。

      檢驗結果(見表1)表明:SSEC、OPEN、HIGH、LOW四個時間序列變量的ERS檢驗統(tǒng)計值大于在10%置信度下的臨界值,這些時間序列變量包含單位根,是非平穩(wěn)的。

      注:表1和表2中,當顯著性水平為1%、5%和10%時,檢驗臨界值分別為1.972、3.240和4.447。

      (3)差分時間序列單位根檢驗。將所有變量按照式(3)進行一階差分運算后得到新的序列變量,分別記作:DSSEC、DOPEN、DHIGH、DLOW、DVOL、DAMO、DPI、DPII、DPIII、DNI、DNII、DNIII,Xt和Xt-1分別為t和t-1時段變量值。

      D(X)=Xt-Xt-1

      (3)

      對一階差分后各時間序列進行單位根檢驗(見表2)發(fā)現:ERS統(tǒng)計值均小于在1%置信度下的臨界值,最大ERS值為0.233,各時間序列趨于平穩(wěn)狀態(tài)。

      (三)選取相關數據生成組合指數數據

      (1)相關性分析。上證指數歷史交易數據變量差分后采用Pearson相關分析法發(fā)現各變量相互影響且存在相關性(見表3),可進行有效的股指預測。本文將選取DOPEN、DHIGH、DLOW、DVOL、DAMO五個變量構造上證交易組合指數。

      表2 差分時間序列的單位根檢驗

      表3 各變量間的相關系數矩陣

      注:**表示在1%水平(雙側)上顯著相關。

      (2)Granger因果關系檢驗。假設投資者易受其他投資者情緒影響而選擇非理性投資,需要對上證指數和六組投資者情緒時間序列進行Granger因果關系檢驗,分析和驗證投資者情緒變化是否關乎市場波動,是否能夠預測股指信息[6]。Granger因果關系檢驗解釋是:變量x是否為變量y的產生原因可以觀察當前y在多大程度上能被過去x解釋。如果x滯后值能提高y解釋程度,說明x有助于y的預測,y是由x的Granger因果引起[29]。盡管Granger因果關系檢驗結果不等于實際因果關系,但本文目的不是測試實際因果關系,而是測試投資者情緒時間序列是否存在上證指數時間序列的預測信息。

      除去雙休日和法定節(jié)假日,股票實際交易日為一周5天,滯后期可分別選取為1天到5天。Granger因果關系檢驗結果(見表4)表明:一般積極情緒(DPI)在滯后1天到滯后3天與上證指數存在較為顯著的Granger因果關系(p值<0.04)。圖1為DPI(t-3)和DSSEC(t)兩個時間序列對比圖,陰影部分表示DSSEC與滯后3天的DPI時間序列存在重疊或者有相同趨勢。無論是Granger因果關系檢驗結果還是時間序列圖,都可從中得出一般積極情緒與上證指數存在顯著相關關系,即DPI可用于預測上證指數。

      表4 Granger因果關系檢驗結果

      注:表格中的數值為p值,表示“檢驗行名稱不是SSEC因果關系”,其中*表示在顯著性水平為5%下顯著。

      圖1 上證指數與一般積極時間序列情緒對比圖注:灰色背景部分為上證指數和滯后3天的一般積極情緒走勢相同區(qū)域。

      (3)因子分析和指數構建。本文選用多維度指標方法避免投資者情緒使用單一指標代理變量的代理有偏和信息不足問題,通過對六個變量(DOPEN、DHIGH、DLOW、DVOL、DAMO、DPI)因子分析得出上證投資者情緒綜合指數(SSECInvestor Sentiment Index,SSECISI)。為驗證投資者情緒對股指預測的高效性,從SSECISI中剔除DPI,僅利用DOPEN、DHIGH、DLOW、DVOL、DAMO五個變量構建上證交易組合指數(SSECPortfolio Index,SSECPI)。使用主成分分析法先對因子載荷矩陣進行方差最大正交變換求得因子得分(式4)和方差貢獻率(見表5),然后根據因子得分和方差貢獻率的加權平均(式5)獲得SSECPI和SSECISI數據[29]。

      Fj=βj1X1+βj2X2+…+βjpXp,j=1,2,…,m

      (4)

      其中,Fj為因子j的因子得分,βjp為成份Xp的因子得分系數。

      (5)

      其中,F為綜合得分,即本文構造的指數,Vj為因子j的貢獻率。

      (四) 兩種預測方法股指預測檢驗

      (1)建模預測。Granger因果關系檢驗表明情緒數據含有股指走勢信息,可以選取預測方法構建預測模型?;谇榫w數據和股指數據的非線性特征以及機器學習模型的良好非線性數據處理能力[26],本文選取構建機器學習預測模型,希望能很好解釋投資者情緒與股指趨勢的非線性關系。因為SVM和BP神經網絡都能處理非線性數據而又各有所長,本文則采用SVM和BP兩種方法對比驗證,避免隨機和偶然,以發(fā)現更好的適用方法。

      建模前先將356個交易日的上證指數和投資者情緒數據作為樣本,根據不同時長分為三組:第1組時長18個月,起始日期為2016/07/19,樣本量、訓練集、測試集分別為365、267、89天;第2組時長9個月,起始日期為2017/04/05,樣本量、訓練集、測試集分別為185、136、49天;第3組時長4.5個月,起始日期為2017/08/16,樣本量、訓練集、測試集分別為93、72、21天。為檢驗上證投資者情緒綜合指數對上證指數收盤價預測結果的影響,特設計3組不同排列的輸入變量:P0,PSSECPI和PSSECISI。P0選取上證指數交易日t前3天的收盤價(SSECt-3,2,1),PSSECPI和PSSECISI是在P0基礎上分別加入滯后1天至3天的交易組合指數(SSECPIt-3,2,1)和投資者情緒綜合指數(SSECISIt-3,2,1),如式(6)所示:

      (6)

      本實驗使用BP神經網絡和SVM兩種方法對三組輸入向量分別實驗。實驗前通過歸一化處理消除變量量綱,將數據歸于[0,1]之間,如式(7)所示:

      X*=(X-Xmin)/(Xmax-Xmin)

      (7)

      其中,Xmax和Xmin分別為測試集中各變量的最大和最小值。

      運行環(huán)境與參數設置方面,BP神經網絡:Kosmogorov定理證明合理結構和恰當權值的三層前饋網絡具備逼近任意連續(xù)函數能力,故隱含層層數皆設置為1;根據反復實驗和擇優(yōu)原則,設置隱含層神經元個數為6;學習速率為0.01,最小訓練誤差目標為0.001,最大迭代次數為100。SVM:數值型變量分類方式采用∈類支持向量回歸機(EPS-SVR),Kernel非線性映射函數(核函數)選取雙曲正切函數(Tanhdot),核參數為1/k(k為特征向量的個數),懲罰參數C為1。

      表5 SSECPI與SSECISI因子分析結果

      采用走勢準確率(Direction,向上或向下)對SVM和BP神經網絡的預測精度進行評價。其定義如下:

      (8)

      (2)算法準確率檢驗。本文分別采用BP神經網絡和SVM方法對P0、PSSECPI、PSSECISI三組樣本進行實驗得股指走勢準確率對比結果(見表6):SVM預測準確率普遍優(yōu)于BP神經網絡;SVM-PSSECISI模型預測準確率在59%-70%,大于股指預測準確率滿意值56%[12],具有有效性;兩種預測方法的平均預測準確率發(fā)現PSSECISI>PSSECPI>P0,說明上證交易組合指數模型比純股指預測模型的預測準確率高,而上證投資者情緒綜合指數模型又比上證交易組合指數模型的預測準確率更高。綜合結果表明使用機器學習進行股指預測,SVM方法下的投資者情緒數據參與的綜合預測模型最優(yōu)。

      表6 BP神經網絡與SVM模型走勢準確率(%)

      (五)預測效果與技術分析

      (1)預測效果分析。本實驗中SVM預測效果優(yōu)于BP神經網絡,可能原因是BP神經網絡易陷入局部最優(yōu)的欠擬合和過擬合問題,而SVM核函數能將復雜非線性問題轉變?yōu)榫€性問題,增強魯棒性;PSSECPI>P0的原因在于市場交易的收盤價不由單一歷史收盤價決定,而是歷史多期多指標(開盤價、最高價、最低價、成交量、成交額)的共同作用,類似于量價技術分析模型(Trade Amount Per Index,TAPI)效果;PSSECISI>PSSECPI的原因是多指標數據綜合效應依然不能完全準確決定市場趨勢,不能全面反映投資者的主客觀決策依據。資本市場投資決策的復雜性說明需要補充更多的信息來源(如投資者情緒數據)才能盡量準確預判市場趨勢;時長對比結果并不全是第3組>第2組>第1組,但第3組最優(yōu),第2組在所有BP神經網絡算法下低于第1組,在SVM算法下PSSECPI效果低于第1組,說明時長在預測中的重要性,第3組單季度范圍數據預測效果可能因為無周期成分擾動而好于另外兩組,年度數據與三個季度數據則出現預測準確率排序不確定現象;另外,預測準確度還與數據采集和預處理相關,清洗規(guī)則、標準化方法和情感詞典完備性都會影響在線情緒數據質量。

      (2)文本挖掘技術。以文本格式為主導的網絡非結構化數據據稱占據全球全部數據量80%以上,包括電子郵件、文件、報告、表格、通話記錄、新聞稿、博客、微博、微信、問答、論壇、評論等,而純數字化數據占比較少。文本挖掘成為新型商業(yè)分析需求技術,用以觀察各類商業(yè)行為及其效果。本文預測效果分析先決條件就是文本挖掘系列技術:文本數據采集和清洗、文本數據分詞、文本情感詞典構建、文本數據情感打分、情感數據標準化等。如輿情和評價等其他文本數據一樣,一方面,金融論壇情緒數據獲取與加工過程雖然沒有太大的技術難度,但會遇到前所未有的相應領域數據處理規(guī)則問題:數據采集規(guī)則、數據清洗規(guī)則、情感詞判分規(guī)則、情感語句判分規(guī)則等。這些已有的文本數據加工規(guī)則都稱不上完善或標準,目前還需要根據具體場景生成相關參數。另一方面,預測只能利用部分數據成分,而且是參與預測。獲取文本時序數據后,再進行標準化后就可以參與分析和預測。本文在預測前還做對數據進行平穩(wěn)性檢驗和相關分析,發(fā)現股指數據和加工所得的情緒數據都存在較大波動(非平穩(wěn)性),轉而思考使用差分數據,檢驗合規(guī)后進行相關分析,結果是一般積極情緒與股指有明顯的相關。然后使用相關文本數據成分與股指其他指標組合構建新預測指數數據,而不是直接使用文本數據預測股指趨勢。

      (3)機器學習預測技術。機器學習技術用于解決常規(guī)非線性問題,本文股指與文本兩樣數據都是非線性數據,不宜使用平滑類預測模型,而是選取BP神經網路和SVM兩種常用機器學習模型進行股指預測,并發(fā)現更為適用的模型,結果是SVM算法優(yōu)于BP神經網絡,其他應用場景也可能相反。為觀察時長影響,在預測過程分別使用三組時長不等數據對比試驗,結果是短時預測效果更好。這說明基于文本非線性數據的預測研究需要考察方法、模型和時長等多維情形,更為復雜的數據可以采用機器學習與小波分析相結合預測。針對復雜的非線性數據源,預測的科學化、嚴謹性還需要更好的基準數據庫和算法才能實現??拼笥嶏w人為參與機器同傳事件說明機器學習目前還不具備理想的算法,要求機器實時隨機同傳翻譯則忽視個性化語音和專業(yè)化詞匯訓練過程。如無大量語料庫作用,機器學習難以勝任無規(guī)律的隨機問題(未加訓練的方言、術語和外來詞等)。如果允許預先降噪和優(yōu)化原始數據,滯后機器學習就會更好。另外,機器學習今天被廣泛地應用于人工智能,實現途徑就是完善地專業(yè)數據庫和場景適用算法,諸如可接受的網絡翻譯和語音識別等普適性業(yè)務以及多數據源的投資理財服務等。

      三、結論

      通過抓取網絡論壇情緒文本,提取金融專業(yè)詞匯進行文本挖掘,實現文本挖掘數據的專業(yè)化和精準化;應用關聯(lián)分析方法構建投資者情緒綜合指數,消除直接使用情緒數據進行預測的有偏性;利用機器學習方法設計良好的股指預測模型,提升股指走勢預測準確性,證明基于SVM的上證投資者情緒綜合指數模型進行股指預測更加有效。

      在線情緒數據可不可用?怎么利用?怎樣用得更好?“可不可用”其實還是認識問題:主觀性、隨意性和主體差異性綜合形成在線情緒數據的復雜性,情感詞匯量化精準性影響在線情緒數據測度的科學性。在線情緒數據為現代研究接受與采用的主要原因是規(guī)模上超越局部復雜性和科學性的大數據宏觀統(tǒng)計規(guī)律;“怎么利用”問題是要超越傳統(tǒng)科學的因果律以大數據思維發(fā)現事物內在或外在關聯(lián)性。在線情緒數據已被研究者用于數據挖掘,發(fā)現和驗證市場規(guī)律,預測市場走勢。專業(yè)數據公司和數據擁有者已開始使用在線大數據對用戶開展跟蹤畫像、精準推薦、輔助產品和服務設計、市場定價等諸多行為決策;在線情緒數據要“用得更好”前提是:建構包容網絡語言的數據化、科學化和動態(tài)化專業(yè)詞庫,使用結構化界面設計記錄網絡用戶結構化數據(星級、關鍵詞、摘要、數據圖片),通過文本分析算法自動生成關鍵詞,應對現階段人工智能技術還未完全成熟的情況。

      四、面向不同主體的決策支持建議

      數據分析和決策支持離不開國內外經濟形勢研判,中美貿易摩擦逐漸深入和激烈,科技和金融是中美最大差距領域,也是增強我國經濟驅動力的兩個方向:硬策略和軟策略?;ヂ?lián)網技術學習與應用最為成功,主要歸因于我國政府對此因勢而謀、應勢而動和順勢而為的默許、鼓勵、支持和管控。金融市場雖與市場經濟同時開啟,但未在經濟總量大幅攀升中獲取經驗,歷經多次股災,投資者、上市公司和監(jiān)管部門依然存在非理性行為。十九大報告強調我國當前三大攻堅戰(zhàn):防范和化解重大風險、精準脫貧、污染防治,以解決經濟快速發(fā)展引致的潛在和顯性的宏觀大問題。后兩項解決三農和環(huán)境問題,消除貧困和增加消費,改善環(huán)境和提高生活品質。重中之重的是重大風險問題,包括金融失控風險、結構失衡風險、生產過剩風險以及多種風險組合形成的整體系統(tǒng)風險。因此,資本市場各個主體和服務支持者(在線平臺和專業(yè)數據企業(yè))要充分利用各類大數據,順應國家和社會需求,積極穩(wěn)定地投資該投資的,支持該支持的,管制該管制的。積極收集網絡用戶的聲音和挖掘網絡用戶需求,汲取經驗,預判未來,理性決策,防范各類金融風險。

      第一,分析和利用在線投資者情緒數據,防范社會金融系統(tǒng)風險,保障市場健康發(fā)展。歷次金融危機說明資本市場有其自身的周期律,經濟過熱、流動失控、技術瓶頸、國家競爭和資本操控等復雜成因的單一或綜合作用會導致一國或多國金融系統(tǒng)風險,監(jiān)管部門需要將在線投資者情緒數據和行為金融學研究成果納入市場監(jiān)管新依據。僅采用交易數據甄別擾亂市場的違法違規(guī)操作不具備普遍監(jiān)管效果。監(jiān)管部門分析和利用在線投資者情緒數據:了解廣大投資者對于資本市場整體態(tài)度和輿情態(tài)勢以及對于監(jiān)管措施的意見和建議,追蹤金融事件和極端問題,及時調整監(jiān)管方向并快速切入監(jiān)管相關市場主體。監(jiān)管部門還能夠從數據分析在線投資者情緒,監(jiān)管和防范股市劇烈波動,杜絕個人或機構發(fā)表批量輿論操控股價。

      第二,完善面向大數據的技術能力,防范平臺技術安全風險,增加平臺數據收益。如電商平臺一樣,社交平臺正常運營需要設備和技術保證。阿里、百度、京東、騰訊、當當等國內著名互聯(lián)網公司都發(fā)生過宕機事件,折射出因用戶量、數據量和峰值要求的技術安全問題。目前用戶消費、溝通交流和娛樂等生活習慣都已經網絡化,勢必增加了平臺數據流量,同時也挑戰(zhàn)平臺承載能力。在軟硬件技術保障的前提下,除了收割廣告和流量收益外,平臺企業(yè)利用在線投資者情緒數據還可以:在法律允許范圍內售賣用戶行為數據獲利,采用外包或自行分析方式獲得數據分析中間成果或最終成果并進行售賣獲利。平臺企業(yè)進行數據分析的優(yōu)越性在于數據的完備性,有利于個股、單個投資者、板塊和整體股指的深入和精準分析,趨勢預測和薦股結果會更加讓人信服。平臺競爭本質上就是技術、服務和用戶的競爭,繼而是服務器群、數據量和數據分析與挖掘的競爭,保障安全,攫取數據收益。

      第三,成立大數據分析部門,助力上市公司研判市場趨勢,精準投融資決策。資本市場行情影響上市公司財務戰(zhàn)略決策,利好行情會有更多資本進入,方便增發(fā)股票和加大融資,也方便購買股票和加大投資。在線情緒數據能夠幫助上市公司判斷投資者對資本市場行情的主觀評價與投資愿望,相關研究結果有助于上市公司判斷資本市場行情,及時做好融資和投資決策。新建大型或小型社交網站或在著名社交網站平臺開設企業(yè)專欄用于發(fā)現投資者的情緒信息和評價細節(jié),并做好公司運營層面的管理與控制,通過積極的經營戰(zhàn)略和積極的在線承諾防止相關負面情緒擴大化,保持良好聲譽和品牌價值;有條件的上市公司建議成立大數據部門,招聘數據分析與挖掘人才,實現多源數據分析和利用的專業(yè)化和科學化,形成更為精準的投融資決策;小型上市公司可通過多種渠道購買在線情緒數據或者數據分析結果,觀察市場,了解自己,把握先機。

      第四,關注在線情緒數據和相關成果,增強個體投資合理性和穩(wěn)健性,避免盲從風險。投資成為人們日常生活關鍵訴求,然而普遍存在一種“賭徒式”投機心理和“傳銷式”操作模式,無視交易數據、基本面數據和資本市場規(guī)律,缺乏對在線情緒數據的觀察、分析與思考。非法股評專家、薦股師和金融衍生品的推銷者利用微信群或QQ群誘導盲目的投資者。大量股民的非理性為個人或機構提供操縱股票的信心而導致股市劇烈波動,形成監(jiān)管難度和散戶損失。因此,個體投資者需要關注網絡上其他投資者情緒數據和相關研究成果,輔助其他投資技術方法,參照基本面數據和交易走勢數據,利用在線情緒數據的共識性投資態(tài)度和傾向,進行合理投資決策,避免投資過熱和消極投資。

      第五,理性對待人工智能熱,優(yōu)化資本布局,遵循技術與商業(yè)協(xié)同發(fā)展規(guī)律。資本布局首要追求是高回報,也易在經濟熱度上迷信“高風險”。普華永道預測:2030年,中國GDP將達38萬億美金,有7 萬億美金為人工智能(AI)驅動。高盛預測:2025年,全球AI金融服務規(guī)模達340-430億美元,AI零售業(yè)規(guī)模將會高達540億美元。國際權威機構CB Insights統(tǒng)計:2017年,全球范圍內有152億美元投資進入AI領域,中國公司為73億美元,占比48%,位列第一。2017年被稱為AI商業(yè)化元年。與之相反的數據是騰訊研究院的AI研究報告:中美倒閉AI企業(yè)總數已超過50家,AI企業(yè)將迎來“倒閉潮”。原因是一些急功近利的資本誤入商業(yè)上的“偽創(chuàng)新”和“偽概念”,無視或不清楚“自動”、“智能”與“智慧”的區(qū)別。投資主體和支持平臺都需要理性認識技術演進和拓展規(guī)律,保障AI技術與商業(yè)協(xié)同發(fā)展,重實干、重過程和重階段,承擔機會風險而不是技術瓶頸風險。技術瓶頸的突破可由研究機構和部門借助政府基金和高風險研發(fā)資本先行攻關實現。

      第六,共享服務平臺與大數據信息,實現城市發(fā)展的智慧化、特色化和均衡化。全國范圍內,應該拆除各類公路收費站、取消各類通信區(qū)域限制(長途電話)、升級通信技術服務(5G技術)、完善各級政府辦公及政策信息和各類企業(yè)生產與服務信息。城市群范圍內,在交通、住房和相關配套服務都已逐步完備的條件下,需要通過現代通信和大數據技術獲取各類在線市民聲音,改進各類民生服務,逐步實現城市群內的各類信息智慧化共享。在此基礎上實現城市發(fā)展的特色化和均衡化:供應鏈上,大型城市發(fā)展企業(yè)集團總部,中型城市發(fā)展企業(yè)分部,小型城市發(fā)展零部件生產基地;產業(yè)升級上,相對發(fā)達的城市可以傾向于發(fā)展芯片、新材料、精密加工等高端研發(fā)和制造產業(yè),相對落后的城市可以優(yōu)先發(fā)展人工智能應用、大數據分析、軟件外包等輕、快、高產業(yè)。

      猜你喜歡
      情緒預測文本
      無可預測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預測卷(A卷)
      選修2-2期中考試預測卷(B卷)
      在808DA上文本顯示的改善
      基于doc2vec和TF-IDF的相似文本識別
      電子制作(2018年18期)2018-11-14 01:48:06
      小情緒
      小情緒
      小情緒
      不必預測未來,只需把握現在
      文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
      乐清市| 龙岩市| 上饶县| 当阳市| 德格县| 潜江市| 平潭县| 尚义县| 泸西县| 横山县| 枝江市| 郴州市| 湖南省| 东乡族自治县| 安岳县| 界首市| 策勒县| 什邡市| 榆社县| 贺州市| 雅江县| 江永县| 静安区| 施秉县| 冀州市| 胶州市| 绿春县| 濮阳县| 合阳县| 繁峙县| 邹平县| 大渡口区| 长乐市| 兴和县| 广德县| 兴国县| 南阳市| 晋江市| 林西县| 宝山区| 宝鸡市|