文/鄧生財(cái) 陳卓
基于經(jīng)驗(yàn)?zāi)B(tài)分解和徑向基函數(shù)網(wǎng)絡(luò)的匯率預(yù)測(cè)
文/鄧生財(cái) 陳卓
為提高非線性外匯交易的預(yù)測(cè)精度,本文提出了一種基于經(jīng)驗(yàn)?zāi)B(tài)分解和徑向基函數(shù)網(wǎng)絡(luò)結(jié)合的預(yù)測(cè)方法,并通過(guò)絕對(duì)誤差、均方誤差和相關(guān)系數(shù)指標(biāo)來(lái)評(píng)估提出模型的性能。首先對(duì)原始匯率數(shù)據(jù)進(jìn)行經(jīng)驗(yàn)?zāi)J椒纸?,得到若干個(gè)平穩(wěn)的本征模態(tài)函數(shù)和一個(gè)殘差向量,然后用徑向基函數(shù)網(wǎng)絡(luò)分別對(duì)分解后的每個(gè)分量進(jìn)行預(yù)測(cè),最后對(duì)各分量預(yù)測(cè)進(jìn)行求和,求和值作為預(yù)測(cè)結(jié)果。本論文以美元對(duì)人民幣交易案例為研究對(duì)象,實(shí)驗(yàn)結(jié)果表明,與單一的徑向基函數(shù)網(wǎng)絡(luò)模型相比,基于經(jīng)驗(yàn)?zāi)J椒纸夂蛷较蚧瘮?shù)網(wǎng)絡(luò)結(jié)合的預(yù)測(cè)方法具有更高的預(yù)測(cè)精度。
外匯交易;匯率預(yù)測(cè);經(jīng)驗(yàn)?zāi)B(tài)分解;徑向基函數(shù)網(wǎng)絡(luò)
匯率的波動(dòng)會(huì)對(duì)國(guó)內(nèi)的通貨膨脹[1]和進(jìn)出口[2]等產(chǎn)生一定的影響。而利用歷史匯率數(shù)據(jù),構(gòu)造相應(yīng)的預(yù)測(cè)模型來(lái)預(yù)測(cè)未來(lái)的匯率變化,可以防患于未然。傳統(tǒng)的股票時(shí)間序列預(yù)測(cè)方法有指數(shù)平滑法[3]自回歸滑動(dòng)平均模型[4]等。這些模型對(duì)線性時(shí)間序列的預(yù)測(cè)可獲得良好的效果,但在實(shí)際應(yīng)用中,大多數(shù)的時(shí)間序列具有不穩(wěn)定和非線性等特征。為此,基于非線性特征的支持向量機(jī)[5]和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型[6]被相繼提出,并在股票預(yù)測(cè)方面取得了較好成果。由于股票受到各方面因素的影響,使序列變得復(fù)雜而難以預(yù)測(cè),倘若單一地使用這些方法來(lái)進(jìn)行股票時(shí)間序列的預(yù)測(cè),會(huì)使訓(xùn)練陷入局部最優(yōu),而難以達(dá)到滿意的效果,因此具有一定的局限性。為解決這個(gè)問(wèn)題,本文提出了一種基于經(jīng)驗(yàn)?zāi)B(tài)分(EMD)和徑向基函數(shù)網(wǎng)絡(luò)(RBF)結(jié)合的方法,來(lái)預(yù)測(cè)美元兌人民幣的匯率。該方法具有以下幾點(diǎn)優(yōu)勢(shì):(1)因?yàn)闀r(shí)間序列具有不穩(wěn)定和非線性等特點(diǎn),首先利用EMD方法對(duì)原始匯率數(shù)據(jù)進(jìn)行處理,可以使得原始信號(hào)更平穩(wěn),降低外界噪音對(duì)預(yù)測(cè)的影響;(2)RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度快,且具有全局最優(yōu)的特點(diǎn),克服了BP神經(jīng)網(wǎng)絡(luò)陷入局部最優(yōu)的情況,從而獲得更高精度的預(yù)測(cè)結(jié)果;(3)本文還對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了最優(yōu)參數(shù)的挖掘與分析,以獲得最佳的預(yù)測(cè)結(jié)果。
本文的剩余部分組織如下:第2部分分別介紹了EMD和RBF網(wǎng)絡(luò)的理論并建立了EMD-RBF預(yù)測(cè)模型;第3部分進(jìn)行了案例分析與參數(shù)挖掘;第4部分得出了實(shí)驗(yàn)結(jié)論。
2.1 經(jīng)驗(yàn)?zāi)B(tài)分解
經(jīng)驗(yàn)?zāi)B(tài)分解方法[7]是黃鍔等人在1998年提出的一種新型自適應(yīng)信號(hào)時(shí)頻處理方法,適用于非線性、非平穩(wěn)信號(hào)的分析處理。經(jīng)驗(yàn)?zāi)B(tài)分解方法是依據(jù)數(shù)據(jù)自身的時(shí)間尺度特征來(lái)進(jìn)行信號(hào)分解。該方法能使復(fù)雜信號(hào)分解為若干個(gè)本征模函數(shù)和一個(gè)殘差。所分解出來(lái)的各IMF分量包含了原信號(hào)的不同時(shí)間尺度的局部特征信號(hào),殘差從某種程度上代表著原始信號(hào)的趨勢(shì)。分解出來(lái)的IMF必須滿足以下兩個(gè)條件:
(1)在全部時(shí)間序列觀測(cè)點(diǎn)中,極值點(diǎn)的個(gè)數(shù)必須要與零交叉點(diǎn)的個(gè)數(shù)相等或者最多相差一個(gè)。
(2)在任意一點(diǎn)上,由局部極大值形成的上包絡(luò)線和局部極小值形成的下包絡(luò)線求得的均值為零。
通常,大多數(shù)要分析的時(shí)間序列并不是IMF,往往包含一個(gè)或多個(gè)震蕩模式。因此,需要對(duì)數(shù)據(jù)進(jìn)行EMD分解,以獲得IMF。EMD分解必須滿足以下三個(gè)條件:
(1)信號(hào)必須有兩個(gè)極值,一個(gè)極大值和一個(gè)極小值。
(2)通過(guò)極值之間的跨度確定特征時(shí)間尺度。
(3)如果數(shù)據(jù)沒(méi)有極值點(diǎn)但包含拐點(diǎn),可以通過(guò)對(duì)它進(jìn)行一次或多次微分來(lái)求得極值。
EMD分解原始信號(hào),其實(shí)就是信號(hào)篩選的過(guò)程。原始信號(hào)通過(guò)EMD方法分解得到若干個(gè)IMF和一個(gè)殘差向量。信號(hào)篩選步驟如下所示:
第一步:繪制上、下包絡(luò)線。找到原始信號(hào)x(t)中的所有極大值點(diǎn)max和極小值點(diǎn)min,并利用三次樣條插值方法分別繪制出上、下包絡(luò)線。
第二步:計(jì)算上下包絡(luò)線對(duì)應(yīng)各點(diǎn)的均值m1。
第三步:計(jì)算原始信號(hào)x(t)和均值m1的差值d1。
第四步:理論上d1應(yīng)該是一個(gè)IMF,但大多數(shù)情況下d1不滿足IMF的特性,因此用d1替代原始信號(hào),重復(fù)步驟1,2和3進(jìn)行s次篩選,以分解出第一個(gè)IMF,用c1表示。
第五步:設(shè)置篩選停止條件。用標(biāo)準(zhǔn)方差SD來(lái)控制,其計(jì)算公式如下所示:
按照經(jīng)驗(yàn),SD一般取值在0.2到0.3之間。
第六步:計(jì)算剩余信號(hào)r1。
第七步:一般情況下,r1仍然還包含著多個(gè)內(nèi)在的震蕩模式,故把r1當(dāng)成信號(hào),繼續(xù)上述分解篩選過(guò)程,直到不能分解為止,其結(jié)果可表示為:
第八步:當(dāng)滿足以下任意一個(gè)條件時(shí),篩選過(guò)程會(huì)停止:
(1)當(dāng)cn或rn小于預(yù)先設(shè)定的的值時(shí),篩選過(guò)程停止。
(2)當(dāng)余量rn是單調(diào)函數(shù)或者不能再提取出IMF時(shí),篩選過(guò)程停止。
原始信號(hào)x(t)經(jīng)過(guò)n次篩選,分解出來(lái)了n個(gè)IMF和一個(gè)殘差,對(duì)原始信號(hào)重構(gòu)有:
2.2 徑向基函數(shù)網(wǎng)絡(luò)
RBF是由Moondy等在20世紀(jì)80年代提出的一種具有單隱藏層的三層前饋網(wǎng)絡(luò)。它能以任意精度逼近任意非線性函數(shù),在一定程度上克服了BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度慢,訓(xùn)練時(shí)間長(zhǎng),參數(shù)調(diào)節(jié)多等缺點(diǎn)。由于RBF網(wǎng)絡(luò)具有能夠逼近任意的非線性函數(shù),處理系統(tǒng)內(nèi)的難以解析的規(guī)律性和良好的泛化能力等特點(diǎn),所以在模式識(shí)別、經(jīng)濟(jì)預(yù)測(cè)等領(lǐng)域被廣泛應(yīng)用。RBF網(wǎng)絡(luò)的分布函數(shù)為:
其中i表示輸入數(shù)據(jù),b表示偏置,m表示基函數(shù)個(gè)數(shù),即為隱藏層神經(jīng)元數(shù)目,w為連接權(quán)重,gi(.)為隱藏層第i個(gè)神經(jīng)元的徑向基函數(shù),為歐幾里得范數(shù),σ為基函數(shù)的擴(kuò)展常數(shù),控制函數(shù)的徑向作用范圍。
2.3 EMD-RBF模型構(gòu)建
構(gòu)建的EMD-RBF模型,首先對(duì)原始匯率交易數(shù)據(jù)進(jìn)行EMD變換,然后再使用RBF神經(jīng)網(wǎng)絡(luò)來(lái)訓(xùn)練預(yù)測(cè)模型。具體的實(shí)驗(yàn)步驟如下所示。
第一步:加載數(shù)據(jù)并對(duì)數(shù)據(jù)預(yù)處理,設(shè)數(shù)據(jù)長(zhǎng)度為L(zhǎng)。
第二步:對(duì)處理好的外匯數(shù)據(jù)進(jìn)行EMD變換,分解出n個(gè)分量,分別是:(n-1)個(gè)IMF和1個(gè)殘差向量。
第三步:分別對(duì)每個(gè)IMF和殘差向量以時(shí)間窗口長(zhǎng)度為k生成樣本。如第一個(gè)樣本為第1個(gè)數(shù)據(jù)到第k個(gè)數(shù)據(jù)作為輸入,第(k+1)個(gè)數(shù)據(jù)作為目標(biāo)輸出;第二個(gè)樣本為第2個(gè)數(shù)據(jù)到第(k+1)個(gè)數(shù)據(jù)作為輸入,第(k+2)個(gè)數(shù)據(jù)作為目標(biāo)輸出;以此類推,故每個(gè)分量都可生成(L-k)個(gè)樣本。
第四步:分別隨機(jī)選取每個(gè)分量的q個(gè)樣本作為訓(xùn)練樣本來(lái)分別訓(xùn)練每個(gè)RBF網(wǎng)絡(luò),剩余的樣本作為測(cè)試樣本。
第五步:把測(cè)試樣本輸入對(duì)應(yīng)訓(xùn)練好的RBF網(wǎng)絡(luò)中,進(jìn)行仿真預(yù)測(cè),并對(duì)每個(gè)RBF網(wǎng)絡(luò)輸出的預(yù)測(cè)值求和,求和值作為最終預(yù)測(cè)值。
第六步:模型性能評(píng)價(jià):為了驗(yàn)證模型的可靠性,本文選擇平均絕對(duì)誤差(MAE)、均方誤差(MSE)作為模型性能的評(píng)價(jià)指標(biāo)。它們的計(jì)算公式分別如下所示:
表1 不同時(shí)間窗的MAE、MSE和相關(guān)系數(shù)統(tǒng)計(jì)表
其中(i=1,2,3…51),n表示樣本的數(shù)量,xi表示第i個(gè)樣本真實(shí)輸出值,表示樣本真實(shí)值得均值,yi表示第i個(gè)的樣本的網(wǎng)絡(luò)預(yù)測(cè)輸出值,表示預(yù)測(cè)值的均值。計(jì)算出的MAE和MSE的值越小,則表明預(yù)測(cè)結(jié)果越準(zhǔn)確,預(yù)測(cè)模型就越可靠。
在本小節(jié),以美元兌換人民幣為案例研究對(duì)象,對(duì)提出的模型進(jìn)行性能評(píng)估。使用的數(shù)據(jù)為美元兌換人民幣的日匯率值,時(shí)間從2013年1月2日到2016年6月1日,共855個(gè)該數(shù)據(jù),其來(lái)源于http://fx.sauder.ubc.ca/data.html。
首先對(duì)交易數(shù)據(jù)進(jìn)行EMD分解,分解結(jié)果如圖1所示,然后采用徑向基函數(shù)網(wǎng)絡(luò)來(lái)訓(xùn)練。
由于在適當(dāng)范圍內(nèi),不同樣本長(zhǎng)度(即輸入神經(jīng)元的個(gè)數(shù))的選擇會(huì)對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生重要的影響,并且徑向基函數(shù)的密度常數(shù)越大,網(wǎng)絡(luò)預(yù)測(cè)的性能也越好,因此選擇出最優(yōu)的參數(shù)組合就顯得尤為重要。所以,本文通過(guò)多次實(shí)驗(yàn)來(lái)確定最合適的時(shí)間窗長(zhǎng)度和最優(yōu)的密度常數(shù)參數(shù),并依據(jù)Eq.(9),Eq.(10),Eq.(11)來(lái)分析實(shí)驗(yàn)結(jié)果和驗(yàn)證模型的準(zhǔn)確性與可靠性。
圖1 EMD分解結(jié)果
3.1 最優(yōu)時(shí)間窗長(zhǎng)度
選擇不同時(shí)間窗長(zhǎng)度的數(shù)據(jù)來(lái)訓(xùn)練模型并預(yù)測(cè)下一次的匯率,會(huì)對(duì)預(yù)測(cè)模型的準(zhǔn)確性產(chǎn)生重要的影響,這部分通過(guò)試探實(shí)驗(yàn),分別設(shè)定時(shí)間窗口長(zhǎng)度為3、4、5、6、10這五個(gè)參數(shù),并分別計(jì)算它們的MAE、MSE和與原外匯序列的相關(guān)系數(shù)R,來(lái)確定最優(yōu)的時(shí)間窗口長(zhǎng)度。
由表1知,當(dāng)時(shí)間窗長(zhǎng)度由3、4到5時(shí),實(shí)驗(yàn)所獲得的MAE和MSE在減小,這說(shuō)明預(yù)測(cè)模型具有更準(zhǔn)確的預(yù)測(cè)能力;當(dāng)時(shí)當(dāng)時(shí)間窗長(zhǎng)度由5、6到10時(shí),實(shí)驗(yàn)所獲的MAE和MSE在增大,這表明,預(yù)測(cè)模型的準(zhǔn)確性在下降。也由表1知,時(shí)間窗長(zhǎng)度由3增加到5時(shí),預(yù)測(cè)所得序列與真實(shí)序列的相關(guān)性呈現(xiàn)正相關(guān)的關(guān)系;由時(shí)間窗長(zhǎng)度5增加到10時(shí),預(yù)測(cè)序列與真實(shí)序列的相關(guān)性呈負(fù)相關(guān)關(guān)系。這再一次驗(yàn)證了,當(dāng)取時(shí)間窗長(zhǎng)度為5時(shí),可以獲得最佳的實(shí)驗(yàn)效果。
3.2 最優(yōu)密度常數(shù)
這部分是在時(shí)間窗長(zhǎng)度為5的情況下,通過(guò)計(jì)算單一RBF網(wǎng)絡(luò)預(yù)測(cè)模型和EMD-RBF預(yù)測(cè)模型這兩種模型分別在密度常數(shù)參數(shù)為2、3、4和5這四組常數(shù)下的MAE、MSE這兩個(gè)個(gè)指標(biāo)來(lái)確定預(yù)測(cè)模型的最優(yōu)密度常數(shù)。
表2 不同密度常數(shù)的MAE與MSE統(tǒng)計(jì)表
由表2知,在密度常數(shù)為5時(shí),RBF網(wǎng)絡(luò)預(yù)測(cè)所得的最小MAE為0.0072,最小MSE為0.0242。而EMD-RBF模型預(yù)測(cè)所得的最小MAE和最小MAE在密度常數(shù)為3時(shí)獲得,它們分別為0.0029和0.0013。故表明,單一的RBF網(wǎng)絡(luò)最優(yōu)密度常數(shù)為5,EMD-RBF預(yù)測(cè)模型最優(yōu)密度常數(shù)為3。
綜上所述,由于在各預(yù)測(cè)模型最優(yōu)參數(shù)設(shè)置下,EMD-RBF預(yù)測(cè)模型計(jì)算得到的MAE和MSE都是最小的,這表明,基于EMD-RBF的外匯匯率預(yù)測(cè)較單一的RBF網(wǎng)絡(luò)預(yù)測(cè)具有更穩(wěn)定和更可靠的特點(diǎn)。
本文提出了基于EMD-RBF預(yù)測(cè)模型方法來(lái)預(yù)測(cè)美元兌換人民幣的外匯時(shí)間序列,首先對(duì)數(shù)據(jù)進(jìn)行EMD分解得到若6個(gè)IMF和1個(gè)殘差向量,然后把IMF和殘差分別輸入RBF網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),最后對(duì)相應(yīng)的每個(gè)預(yù)測(cè)結(jié)果求和作為預(yù)測(cè)值。通過(guò)美元兌人民幣的案例研究,可得出如下結(jié)論:(1)通過(guò)EMD-RBF模型預(yù)測(cè),所獲得的最小MAE和MSE都小于單一使用RBF網(wǎng)絡(luò)預(yù)測(cè)所獲得的MAE和MSE;(2)基于EMD-RBF模型進(jìn)行美元兌人民幣外匯時(shí)間序列的預(yù)測(cè)比基于RBF徑向基函數(shù)網(wǎng)絡(luò)進(jìn)行外匯時(shí)間序列預(yù)測(cè)更高的準(zhǔn)確性和可靠性。因此該預(yù)測(cè)模型在實(shí)際應(yīng)用中具有一定的參考價(jià)值。本文只是對(duì)匯率進(jìn)行單步預(yù)測(cè),在以后的研究中,將對(duì)外匯數(shù)據(jù)進(jìn)行多步預(yù)測(cè)的建模和驗(yàn)證分析,以提高該預(yù)測(cè)模型的適用范圍。
(作者單位:重慶工商大學(xué)電子商務(wù)與供應(yīng)鏈系統(tǒng)重慶市重點(diǎn)實(shí)驗(yàn)室)
[1]王家瑋,孫華妤,門明. 人民幣匯率變動(dòng)對(duì)通貨膨脹的影響——基于進(jìn)口非競(jìng)爭(zhēng)型投入產(chǎn)出表的分析[J]. 國(guó)際金融研究,2011(10),30~39.
[2]譚小芬,王雅琦,盧冰. 匯率波動(dòng)、金融市場(chǎng)化與出口[J].金融研究,2016(3):15~30.
[3]徐建新,嚴(yán)勇,嚴(yán)復(fù)海. 指數(shù)平滑法在典型城市GDP預(yù)測(cè)中的應(yīng)用[J]. 水利科技與經(jīng)濟(jì),2008,14(17):551~554.
[4]楊一文,楊朝軍. 基于支持向量機(jī)的金融時(shí)間序列預(yù)測(cè).系統(tǒng)管理學(xué)報(bào),2005,14(2):176~181.
[5]楊娟麗,徐梅,王福林等. 基于BP神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)問(wèn)題研究. 數(shù)學(xué)的認(rèn)識(shí)與實(shí)踐. 2013,43(4):158~164.
[6]梁強(qiáng),范英,魏一鳴. 基于小波分析的石油價(jià)格長(zhǎng)期趨勢(shì)預(yù)測(cè)方法及其實(shí)證研究[J]. 中國(guó)管理科學(xué),2005,13(1):30~36.
[7]HUANG N E,SHEN Z. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis [J]. Royal Society of London Proceedings Series A,1998(454):903~995.