林政揚,倪肖婕,王 博
(杭州電子科技大學(xué)自動化學(xué)院,浙江 杭州 310018)
作為資本市場的長期信用工具,股票的存在可以在一定程度上反映當(dāng)前的經(jīng)濟形勢。對于投資者來說,預(yù)測越精確越能規(guī)避股票投資存在的風(fēng)險。而對于監(jiān)管機構(gòu)來說,預(yù)測未來走勢越準(zhǔn)確越能夠加強對股票市場的把控。由于股票波動趨勢受到多方因素的影響難以完全納入考慮范圍,因此相較于傳統(tǒng)方法,時間序列方法通過著重于其本身的概率或者隨機性質(zhì)對未來做出短期預(yù)測。Adebiyi 通過ARIMA 模型預(yù)測股票價格,結(jié)果顯示該模型具有短期預(yù)測潛力,說明ARIMA 是一類經(jīng)典且短期預(yù)測效果理想的時間序列模型?;瑒哟翱谑且环N簡單的降噪方法,其作用是限制窗口大小下不斷更新時間序列。一般ARIMA模型連續(xù)預(yù)測下始終保留所有數(shù)據(jù),本文結(jié)合滑動窗口的方法,選用不斷更新的數(shù)據(jù)序列,并在新的序列下估計ARIMA模型參數(shù)。
隨著國家《第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》的出臺,我國北京、上海等31地相繼發(fā)布光伏建筑一體化(下稱BIPV)未來三至五年相關(guān)政策,影響我國BIPV 和相關(guān)行業(yè)股市發(fā)展。本文以滬深股市中37家光伏建筑一體化相關(guān)企業(yè)的股票(見表1)為依據(jù),對BIPV 板塊建立模型,并利用2021 年5 月6 日至5 月28 日數(shù)據(jù)進行誤差分析并修正模型,根據(jù)修正后的模型對該板塊未來發(fā)展趨勢做出預(yù)測。
表1 滬深股市中37家光伏建筑一體化相關(guān)企業(yè)
●在研究37 家光伏建筑一體化相關(guān)企業(yè)組成的BIPV 板塊時,本論文在模型建立過程中選取2019 年4 月1日作為計算BIPV板塊指數(shù)的基準(zhǔn)日。
●在數(shù)據(jù)清洗過程對于缺失的交易數(shù)據(jù),本文默認(rèn)漲跌、漲跌幅、交易量、交易額為0,開盤價,收盤價保持上一個交易日的數(shù)據(jù)。
●市值計算中以交易量為權(quán)重,且以2019年4月1日的市值等價為1000點。
記M()為BIPV 板塊以2019 年4 月1 日為基準(zhǔn)日第天的加權(quán)市值,有
其中P()表示第股對應(yīng)的當(dāng)日收盤價,W()表示第股的當(dāng)日交易量,第天的板塊指數(shù)為
ARIMA模型與ARMA模型的區(qū)別在于ARMA模型研究的時間序列是平穩(wěn)的,ARIMA模型研究非平穩(wěn)時間序列,對于不平穩(wěn)的時間序列,可以同通過適當(dāng)階數(shù)的差分運算后變?yōu)槠椒€(wěn)序列,從而用于ARMA模型。BIPV板塊時間序列的差分時間序列為
其中?稱為階差分算子,定義為
其中為(自回歸序列)模型中定義的滯后算子。
差分運算后的時間序列?I,要求是平穩(wěn)時間序列,將差分平穩(wěn)序列代入ARMA(m,n)模型中即有
其中,…,θ是()模型中的自回歸系數(shù),,…,β是MA模型中的移動平均系數(shù),η是MA模型中第期的誤差值。當(dāng)為0 時,模型降為模型,為0 時則降為模型,對應(yīng)預(yù)測的平穩(wěn)差分序列可以通過式⑶推出原序列的預(yù)測值。
窗口大小為在第時刻的滑動序列窗口可定義為
如果時間序列確定,通過參數(shù)估計可以確定ARIMA 模型。一般ARIMA 模型連續(xù)預(yù)測下它始終保留所有數(shù)據(jù),滑動窗口的作用是限制窗口大小下不斷更新時間序列,在新的序列下估計參數(shù)。這樣就能在保證受歷史數(shù)據(jù)作用的同時減少過舊的數(shù)據(jù)作用,起到一定降噪。
本文選用均方根誤差說明模型預(yù)測與實際數(shù)據(jù)的誤差程度:
對于大部分金融數(shù)據(jù)而言其時間序列數(shù)據(jù)是非平穩(wěn)的,且具有非線性、波動聚集性和異方差性。如圖1 所示BIPV 板塊指數(shù)有一種趨勢,且數(shù)據(jù)偏度(Skewness)大于0,峰度(Kurtosis)大于3 即數(shù)據(jù)呈現(xiàn)“尖峰尾肥”的狀態(tài)。本文對數(shù)據(jù)進行單位根檢驗(即ADF 檢驗,實際操作中要分別對不考慮趨勢項和滯后項,僅考慮滯后項,考慮趨勢項和滯后項三個ADF 檢驗?zāi)P瓦M行檢驗,但凡有一個模型拒絕原假設(shè),時間序列視為平穩(wěn)時間序列),檢驗可得T統(tǒng)計量為-2.8639,P值為0.1754大于0.05,BIPV板塊指數(shù)具有單位根,另外分析得自相關(guān)明顯,因此BIPV 板塊指數(shù)并非平穩(wěn)時間序列。
圖1 BIPV板塊指數(shù)統(tǒng)計直方圖(統(tǒng)計分析軟件采用EViews 10)
本文選取2021 年4 月30 號前原I時間序列做一階差分處理(在股市中指數(shù)的一階差分是具有意義的,表示BIPV 板塊指數(shù)的對數(shù)收益率),確定差分后的時間序列為平穩(wěn)且非白噪聲序列,即ARIMA(,,)中取值為1。確定好值后根據(jù)自相關(guān)和偏相關(guān)圖以及AIC、SBIC、HQIC 準(zhǔn)則確定AR(p)和MA(q)模型的階次和參數(shù)(見表2),最后再對模型進行殘差正態(tài)分布檢驗,經(jīng)過檢驗最終的修正模型為ARIMA(1,1,1)。
表2 ARIMA(1,1,1)模型中參數(shù)
傳統(tǒng)的ARIMA 模型對BIPV 板塊進行動態(tài)趨勢預(yù)測可以得出在2021年4月30號后BIPV 板塊指數(shù)呈現(xiàn)緩慢上升,180 天滑動窗口下的ARIMA 模型預(yù)測則是緩慢下降(見圖2(a))。利用2021 年5 月6 日至5 月28 日數(shù)據(jù)進行誤差分析可知實際指數(shù)總體變化情況基本在180天窗口下ARIMA 的動態(tài)預(yù)測置信區(qū)間內(nèi),而傳統(tǒng)的ARIMA 模型基本脫離模型預(yù)測區(qū)間,說明本文提出的新模型對BIPV 板塊指數(shù)動態(tài)預(yù)測具有更好的效果。在定量預(yù)測BIPV 板塊指數(shù)的時候,本文采用循環(huán)單步預(yù)測的方法的同時通過確定移動窗口的大小來預(yù)測該窗口約束下下一交易日的BIPV 板塊指數(shù),要注意的是每一次新序列的生成均要重復(fù)前文的模型確定過程,重新進行新序列下的參數(shù)估計。從預(yù)測結(jié)果上看一般的ARIMA模型預(yù)測RMSE為219.5526,本文提出的模型預(yù)測RMSE 為206.5721,效果更優(yōu)(見圖2(b))。
圖2 ARIMA和基于180天滑動窗口的ARIMA模型對BIPV板塊指數(shù)預(yù)測
本文提出的基于滑動窗口ARIMA 模型預(yù)測精確度受限于滑動窗口的大小,滑動窗口的選擇起到了數(shù)據(jù)降噪的作用,圖3 給出了不同滑動窗口下的指數(shù)預(yù)測,從表3 可知不同窗口選擇的預(yù)測結(jié)果有顯著性差異。
表3 不同窗口預(yù)測誤差
圖3 不同滑動窗口下ARIMA模型預(yù)測
本文提出一種基于滑動窗口的ARIMA 模型,該模型通過選擇窗口大小,對窗口內(nèi)的時間序列進行ARIMA模型預(yù)測,最后得出光伏建筑一體化的相關(guān)股票在下半年短期內(nèi)總體趨勢會有下滑,可能處于板塊發(fā)展的瓶頸期,未來仍然需要相關(guān)政策的扶持。本文模型的難點在于選擇合適的時間窗口長度,對于一類長期穩(wěn)定的時間序列而言,可以深究能否優(yōu)化出一個普適的時間窗口長度來實現(xiàn)用簡單的方法進行高精度短期預(yù)測。此外讀者還可以考慮采用模型組合的方法進行其他改進,從而將模型應(yīng)用到糧食產(chǎn)量,水文變化,電力運輸?shù)确矫妗?/p>