羅裕凡,劉小蓉,朱淑雅,趙偉帆,李敏
(山東師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,山東 濟(jì)南 250014)
基于ARIMA模型的余額寶收益率的預(yù)測(cè)
羅裕凡,劉小蓉,朱淑雅,趙偉帆,李敏*
(山東師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,山東 濟(jì)南 250014)
選取2013年5月30日—2016年7月27日期間的余額寶收益率數(shù)據(jù),進(jìn)行數(shù)據(jù)處理并建立ARIMA模型,從而預(yù)測(cè)出余額寶在2016年7月28日—2016年8月21日期間的收益率。通過實(shí)際結(jié)果與預(yù)測(cè)結(jié)果之間的對(duì)比,確定了在允許誤差范圍內(nèi)該模型的有效性。
余額寶;收益率;ARIMA模型
2013年6月,阿里巴巴集團(tuán)和天弘基金合作在支付寶平臺(tái)上正式推出了余額寶,由于其操作的簡(jiǎn)便性和相對(duì)較高的利潤(rùn)而受到很多人的青睞。目前余額寶使用人數(shù)已達(dá)到2.6億,并成為我國(guó)市場(chǎng)上規(guī)模最大的貨幣基金。余額寶是互聯(lián)網(wǎng)的快速發(fā)展帶來的中國(guó)利率市場(chǎng)化的產(chǎn)物,因而受到了很多專家學(xué)者的廣泛關(guān)注。通過分析余額寶收益率的變化情況,并做出準(zhǔn)確合理的預(yù)測(cè),將有利于市場(chǎng)參與方做出自己的決策。王瑩[1]對(duì)余額寶的流動(dòng)性、收益性及風(fēng)險(xiǎn)性進(jìn)行綜合分析,并對(duì)投資者和余額寶自身提出相應(yīng)建議。相對(duì)于銀行的活期存款利息,余額寶的收益率比較高,但是,張大海[2]認(rèn)為將這兩者作比較是不恰當(dāng)?shù)?,并分析說真正和余額寶業(yè)務(wù)相似的是銀行發(fā)行的短期貨幣基金以及開放式無固定期限理財(cái)產(chǎn)品。李恒等[3]從監(jiān)管層面、商業(yè)銀行、產(chǎn)品自身和客戶對(duì)余額寶業(yè)務(wù)的認(rèn)知等多個(gè)方面對(duì)余額寶風(fēng)險(xiǎn)性作了研究。以上文獻(xiàn)都在定性方面對(duì)余額寶作了充分的分析,但是定量方面的研究并未涉及。另一方面,王雪飛等[4-9]基于自四歸積分滑動(dòng)平均模型(auto-regressive integrated moving average model,ARIMA)[10]對(duì)中國(guó)鋼材市場(chǎng)價(jià)格、土建專業(yè)群人才需求、短期風(fēng)速、商品住宅銷售價(jià)格、人口與醫(yī)療需求及中國(guó)人均糧食等方面做了有效的預(yù)測(cè)。本文將通過時(shí)間序列的方法,建構(gòu)ARIMA模型,對(duì)未來短期內(nèi)的余額寶收益率走勢(shì)進(jìn)行預(yù)測(cè)。為了避免因余額寶收益率有時(shí)變化較大而帶來的誤差,本文選取每天的余額寶七日年化收益率作為研究對(duì)象,給出一個(gè)合適的預(yù)測(cè)模型來進(jìn)行預(yù)測(cè)。
ARIMA模型是一種常用的隨機(jī)時(shí)間序列分析模型,這種模型是Box和Jenkins提出的,所以又被稱為B-J模型[10]。這是一種精度相對(duì)較高的短期的時(shí)間序列預(yù)測(cè)方法,其基本思想表現(xiàn)為,即便構(gòu)成時(shí)間序列t的任意一組隨機(jī)變量存在具有不確定性的單個(gè)序列值,但是縱觀整個(gè)時(shí)間序列,其變化卻具有某種規(guī)律。根據(jù)這種思想,我們可以使用相應(yīng)的數(shù)學(xué)模型近似地進(jìn)行描述,進(jìn)而建立數(shù)學(xué)模型,得到最小方差意義下的最優(yōu)預(yù)測(cè)。根據(jù)原序列是否平穩(wěn)以及回歸中所含部分的不同,可以將ARIMA模型分成自回歸模型(auto-regressive model,AR)、移動(dòng)平均模型(moving average model,MA)和自回歸移動(dòng)平均模型(auto-regressive moving average model,ARMA)。MARIMA(p,d,q)稱為差分自回歸移動(dòng)平均模型,其中AR代表自回歸,p代表自回歸項(xiàng);MA代表移動(dòng)平均,q代表移動(dòng)平均項(xiàng)數(shù);d代表時(shí)間序列成為平穩(wěn)時(shí)所做的差分次數(shù)。
如果時(shí)間序列yt是其前期值和隨機(jī)項(xiàng)組成的線性函數(shù),即可表示為:
yt=φ1yt-1+φ2yt-2+…+φpyt-p+ut,
(1)
令Bk為k步滯后算子,即Bkyt=yt-k,則(1)式可表示成為:
yt=φ1Byt+φ2B2yt+…+φpBpyt+ut,
令
表示滯后多項(xiàng)式,則上述模型可簡(jiǎn)化為:
如果時(shí)間序列yt是由其當(dāng)期隨機(jī)誤差項(xiàng)和前期隨機(jī)誤差項(xiàng)組成的線性函數(shù),即可表示為:
yt=ut-ξ1ut-1-ξ2ut-2-…-ξqut-q,
(2)
其中,ξ1,ξ2,…,ξq為實(shí)數(shù),稱為移動(dòng)平均系數(shù),則yt是一個(gè)移動(dòng)平均序列,相應(yīng)的(2)式就是一個(gè)q階的移動(dòng)平均模型,將其記作MMA(q)。
則(2)式可以簡(jiǎn)化為:
yt=ξ(B)ut。
為了使AR過程和MA過程能相互轉(zhuǎn)化,即為可逆過程,就必須保證移動(dòng)平均過程無條件平穩(wěn)。因此要求滯后多項(xiàng)式ξ(B)的根都在單位圓外。
如果時(shí)間序列yt是由其當(dāng)期隨機(jī)誤差項(xiàng),前期隨機(jī)誤差項(xiàng)和前期值組成的線性函數(shù),即可表示為:
yt=φ1yt-1+φ2yt-2+…+φpyt-p+ut-ξ1ut-1-ξ2ut-2-…-ξqut-q,
(3)
則該yt是一個(gè)自回歸序列,相應(yīng)地,(3)式就是一個(gè)(p,q)階的自回歸移動(dòng)平均模型,將其記作MARMA(p,q)。其中,φ1,φ2,…,φp是自回歸系數(shù),ξ1,ξ2,…,ξq是移動(dòng)平均系數(shù)。
引入滯后算子B,(3)式可以簡(jiǎn)化為:
2.1 ARIMA模型預(yù)測(cè)的主要步驟
(1) 對(duì)序列的平穩(wěn)性加以判別。具體是根據(jù)時(shí)間序列的散點(diǎn)圖、自相關(guān)函數(shù)以及偏自相關(guān)函數(shù)圖,對(duì)序列的方差、趨勢(shì)進(jìn)行檢驗(yàn)。如果時(shí)間序列是平穩(wěn)的,直接建立ARIMA模型;否則,必須通過適當(dāng)處理使其滿足平穩(wěn)性要求,具體過程是對(duì)于不平穩(wěn)的數(shù)據(jù)序列,因其具有一定程度的上升或下降的趨勢(shì),那么數(shù)據(jù)需要進(jìn)行差分處理,要保證處理之后的數(shù)據(jù)自相關(guān)函數(shù)值和偏相關(guān)函數(shù)值不顯著為0。
(2)建立相應(yīng)的模型并進(jìn)行參數(shù)估計(jì),避免高階的MA模型或者包含高階移動(dòng)平均項(xiàng)的ARMA。
(3) 進(jìn)行模型檢驗(yàn),檢驗(yàn)殘差序列是否為白噪聲。
(4)進(jìn)行預(yù)測(cè)分析[11]。
2.2 數(shù)據(jù)
本文數(shù)據(jù)來源于天天基金網(wǎng)中的天弘余額寶貨幣終端,選取對(duì)象是2013年5月30日—2016年7月27日期間的余額寶七日年化收益率。我們使用ARIMA模型給出2016年7月28日—2016年8月21日這25天的余額寶七日年化收益率。
2.3 建模過程
2.3.1 一階差分單位根檢驗(yàn)
對(duì)序列進(jìn)行一階差分之后,可得到序列圖(圖1),差分后的結(jié)果顯示圖像在零線上下波動(dòng),即模型的擬合值與實(shí)際值的變動(dòng)較小,對(duì)此,我們可假定序列已經(jīng)達(dá)到了平穩(wěn),接下來,為了探究其是否真的達(dá)到平穩(wěn),還需要對(duì)其進(jìn)行單位根檢驗(yàn)。
圖1 一階差分后序列圖Fig.1 The sequence diagram after the first order difference
通過單位根檢驗(yàn),得出結(jié)果如表1所示,其中原假設(shè)一階差分有一個(gè)單位根,外生變量是常數(shù),并且滯后長(zhǎng)度是13,該值自動(dòng)基于最大滯后長(zhǎng)度是22的SIC準(zhǔn)則。由表1可得,一階差分之后的序列t檢驗(yàn)的統(tǒng)計(jì)量明顯小于各個(gè)顯著性水平提供的臨界值,所以可以得出,經(jīng)過一階差分之后的時(shí)間序列是平穩(wěn)序列[12]。
表1 一階差分后序列單位根檢驗(yàn)結(jié)果
2.3.2 差分序列的相關(guān)性檢驗(yàn)
因?yàn)榧冸S機(jī)序列不具有建模的必要性,所以為了避免一階差分后的序列呈現(xiàn)純隨機(jī)序列的情況,我們需要對(duì)差分后的序列做相關(guān)性檢驗(yàn),根據(jù)差分后的自相關(guān)系數(shù)來判定其是否為純隨機(jī)序列。進(jìn)行一階差分之后,得出的自相關(guān)函數(shù),偏自相關(guān)函數(shù)以及相關(guān)統(tǒng)計(jì)量的情況如表2所示。
表2 自相關(guān)函數(shù)和偏自相關(guān)函數(shù)結(jié)果圖
從表2中我們可以發(fā)現(xiàn),自相關(guān)函數(shù)和偏自相關(guān)函數(shù)都是拖尾的。綜上所述,該時(shí)間序列不是純隨機(jī)序列,因此有建模必要。
2.3.3 模型最優(yōu)判定
表3 模型定階原則
我們通過對(duì)2016年7月27日之前的數(shù)據(jù)進(jìn)行一次差分之后序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)的分析,從一階差分的偏自相關(guān)函數(shù)中可以觀察到,在k=3以后的值都在置信區(qū)間內(nèi),偏自相關(guān)函數(shù)很快趨于0,偏自相關(guān)函數(shù)呈拖尾狀態(tài),因此可以確定p=3;從一階差分自相關(guān)函數(shù)可以觀察到,在k=5以后的值都在置信區(qū)間內(nèi),自相關(guān)函數(shù)也很快趨于0,自相關(guān)函數(shù)呈拖尾狀態(tài),因此可以初步確定q取5。在此基礎(chǔ)上我們建立MARIMA(3,1,5)模型,其中關(guān)于MARIMA(3,1,5)模型的相關(guān)參數(shù)和指標(biāo)分別見表4和表5。
表4 MARIMA(3,1,5)模型的相關(guān)參數(shù)
表5 MARIMA(3,1,5)模型的指標(biāo)
2.3.4 模型檢驗(yàn)
進(jìn)行參數(shù)估計(jì)后,模型的殘差序列還需要進(jìn)行白噪聲檢驗(yàn),主要是檢驗(yàn)其殘差序列是否屬于白噪聲序列[4]。如果殘差序列不屬于白噪聲序列,則還需對(duì)模型進(jìn)行進(jìn)一步的改進(jìn)。我們對(duì)MARIMA(3,1,5)模型殘差的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)進(jìn)行置信區(qū)間檢驗(yàn),LM檢驗(yàn)結(jié)果如圖2所示。
由圖2可以看出,殘差的自相關(guān)和偏自相關(guān)函數(shù)都處于置信區(qū)間內(nèi),這說明殘差通過了白噪聲檢驗(yàn),可以用于預(yù)測(cè)。
2.3.5 模型預(yù)測(cè)
通過上述一系列的分析以及文獻(xiàn)[14]的理論知識(shí),我們可以確定最佳擬合預(yù)測(cè)模型就是MARIMA(3,1,5),圖3是預(yù)測(cè)結(jié)果與實(shí)際結(jié)果,即預(yù)測(cè)和實(shí)際收益率的對(duì)比圖。
圖2 殘差的LM檢驗(yàn)Fig.2 LM test of the residual errors
圖3 預(yù)測(cè)結(jié)果與實(shí)際結(jié)果的對(duì)比圖 Fig.3 The comparison of the predicted results with the actual results
在表6中,我們給出了2016年7月28日—2016年8月21日期間每天的實(shí)際值、預(yù)測(cè)值以及其相對(duì)誤差,最大的相對(duì)誤差為1.146%,因此認(rèn)為該模型是有效的。
表6 余額寶收益率預(yù)測(cè)結(jié)果與實(shí)際結(jié)果的對(duì)比圖
續(xù)表6
日期實(shí)際值預(yù)測(cè)值相對(duì)誤差/%2016?08?182.3672.3820.6342016?08?192.3632.3810.7622016?08?202.3602.3810.8902016?08?212.3592.3800.890
本文使用的ARIMA模型,能近似地描述隨時(shí)間變化的序列,基本避免了由于其他經(jīng)濟(jì)原因帶來的誤差,因而本文的預(yù)測(cè)對(duì)象,即余額寶的收益率所組成的序列可以被有效地識(shí)別出來,從而建立相應(yīng)的數(shù)學(xué)模型,通過研究時(shí)間序列的現(xiàn)在值和過去值,對(duì)未來值進(jìn)行預(yù)測(cè)。
本文首先對(duì)余額寶收益率的原始序列進(jìn)行一階差分,并通過相關(guān)函數(shù)來分析序列的平穩(wěn)性。其次,按照序列的不同性質(zhì)來選用最合適的模型,通過對(duì)模型的運(yùn)用,可以對(duì)序列進(jìn)行短期預(yù)測(cè),并將其與實(shí)際情況進(jìn)行誤差分析,結(jié)果表明,我們使用的模型預(yù)測(cè)效果可信。本文可為更多新型金融衍生品的風(fēng)險(xiǎn)函數(shù)研究提供參考價(jià)值。
[1]王瑩. 余額寶的流動(dòng)性、收益性及風(fēng)險(xiǎn)分析[J]. 中國(guó)商貿(mào),2013(35):65-66.
[2]張大海. “余額寶”的機(jī)會(huì)與風(fēng)險(xiǎn)[J]. 創(chuàng)新時(shí)代,2013(8):37-37.
[3]李恒,郝國(guó)剛. 余額寶的風(fēng)險(xiǎn)及防范研究[J]. 時(shí)代金融旬刊,2014(5):60.
[4]王雪飛,劉志偉. 基于ARIMA模型的中國(guó)鋼材市場(chǎng)價(jià)格預(yù)測(cè)[J]. 中國(guó)城市經(jīng)濟(jì),2011,(1):20-23.
[5]肖凱成,蔣春霞,楊波. ARIMA模型在土建專業(yè)群人才需求預(yù)測(cè)中的應(yīng)用[J]. 科技信息,2013(6):42,44.
[6]陳平,夏敏. 基于ARIMA模型的短期風(fēng)速預(yù)測(cè)方法[J]. 華章,2011(15):266-267.
[7]谷秀娟,梁潤(rùn)平. 基于ARIMA模型的鄭州市商品住宅銷售價(jià)格預(yù)測(cè)研究[J]. 金融理論與實(shí)踐,2012(1):51-54.
[8]鄭紅云.ARIMA模型在深圳人口與醫(yī)療需求預(yù)測(cè)的應(yīng)用[J]. 齊魯工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,26(4):44-49.
[9]吳秀芝,劉穎博. 基于ARIMA模型對(duì)中國(guó)人均糧食的預(yù)測(cè)[J]. 金融經(jīng)濟(jì),2010(24):109-110.
[10]易丹輝.數(shù)據(jù)分析與Eviews應(yīng)用[M].2版.北京:中國(guó)人民大學(xué)出版社,2014.
[11]高鐵梅.計(jì)量經(jīng)濟(jì)分析方法和建?!狤views應(yīng)用及實(shí)例[M]. 北京:清華大學(xué)出版社,2009:78-80.
[12]王周偉,崔百勝,朱敏. 經(jīng)濟(jì)計(jì)量研究指導(dǎo)——實(shí)證分析與軟件實(shí)現(xiàn)[M]. 北京:北京大學(xué)出版社,2015.
[13]李正宏. 波羅的海運(yùn)價(jià)指數(shù)波動(dòng)規(guī)律與預(yù)測(cè)[J]. 上海海事大學(xué)學(xué)報(bào),2004,25(4):69-72.
[14]段洪濤,曾繁聲,李景春.一種預(yù)測(cè)頻段占用度的時(shí)間序列分析方法[J].無線電工程,2011,41(7):17-20.
Prediction of the Yu Ebao yield based on ARIMA model
LUO Yu-fan, LIU Xiao-rong, ZHU Shu-ya, ZHAO Wei-fan, LI Min*
(School of Mathematics and Statistics, Shandong Normal University, Jinan 250014, China)
∶The research object of this paper is the yield of Yu Ebao. By selecting the yield data during May 30, 2013 to July 27, 2016, the ARIMA model was established for data processing, thus predicating the yield of Yu Ebao between July 28, 2016 and August 21, 2016. Finally, by comparing the actual results with the predicted results, the validity of the model within the allowable error range was determined.
∶Yu Ebao; prediction of the Yu Ebao yield ; ARIMA model
10.3976/j.issn.1002-4026.2017.04.016
2016-10-31
教育部留學(xué)回國(guó)人員科研啟動(dòng)基金資助項(xiàng)目(教外司留[2015]1098)
羅裕凡(1995—),女,研究方向?yàn)樾畔⑴c計(jì)算科學(xué)。
*通信作者,李敏。E-mail: liminemily@sdnu.edu.cn
O2.3
A
1002-4026(2017)04-0099-07