嚴(yán)天嘯
(上海大學(xué) 悉尼工商學(xué)院,上海 201900)
基于EMD-SVM的商品期貨交易策略研究
嚴(yán)天嘯
(上海大學(xué) 悉尼工商學(xué)院,上海 201900)
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)能有效處理非平穩(wěn)和非線性信號(hào),本文利用EMD對(duì)期貨的價(jià)格信號(hào)進(jìn)行分解從而得到趨勢(shì)項(xiàng)和IMF,并在此基礎(chǔ)上提取相關(guān)特征,運(yùn)用基于機(jī)器學(xué)習(xí)理論的支持向量機(jī)(SVM)來(lái)對(duì)價(jià)格漲跌進(jìn)行預(yù)測(cè)形成交易策略,同時(shí)使用網(wǎng)格法進(jìn)行參數(shù)尋優(yōu)。
EMD;SVM;量化交易
隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,人們對(duì)復(fù)雜事物的處理方法也更加高效。量化投資就是隨之而發(fā)展起來(lái)的交易方法,主要理論來(lái)自于數(shù)量金融學(xué)。從20世紀(jì)50年代至20世紀(jì)末,數(shù)量化金融從馬克維茨的均值-方差模型到CAPM(資本資產(chǎn)定價(jià))模型、ATP(套利定價(jià))模型,再到ARCH、GARCH等計(jì)量經(jīng)濟(jì)學(xué)模型都取得了驚人的成績(jī)。21世紀(jì)至今,非線性的研究方法取得了重大突破,極大地豐富了金融研究的手段和方法。在前人理論的基礎(chǔ)上,本文利用EMD(經(jīng)驗(yàn)?zāi)B(tài)分解)算法對(duì)原始價(jià)格信號(hào)去噪,再利用SVM(支持向量機(jī))對(duì)價(jià)格漲跌進(jìn)行預(yù)測(cè)確定交易。
1.1EMD
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是由NASA院士黃鍔提出的一種處理非平穩(wěn)和非線性信號(hào)的分析方法。與其他信號(hào)處理方法不同的是,EMD是一種自適應(yīng)的分析方法,在不同的工程領(lǐng)域得到了成功應(yīng)用。EMD假設(shè)任一復(fù)雜的信號(hào)都由本征模態(tài)函數(shù)(IMF)和趨勢(shì)項(xiàng)(r)構(gòu)成,其數(shù)學(xué)表達(dá)式如式(1)。IMF的提取關(guān)鍵步驟是獲得原信號(hào)的上下包絡(luò)線并求得其均值,最后再將原始信號(hào)減去其均值即可獲得IMF。其中包絡(luò)線一般采取插值法來(lái)獲得。
1.2SVM
支持向量機(jī)(SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的模式識(shí)別方法,其在生物信息學(xué)、文本和語(yǔ)音識(shí)別等領(lǐng)域取得成功。算法的核心思想是:確定一個(gè)最優(yōu)的分類超平面使分類誤差最小同時(shí)類別間隔最大,對(duì)于線性不可分問(wèn)題通過(guò)核函數(shù)(本文采用高斯徑向基函數(shù))映射到高維空間再進(jìn)行求解。SVM的本質(zhì)是最優(yōu)化問(wèn)題,式(2)即為問(wèn)題表達(dá)式,其中超平面分類為:WTφ(x)+b=0,松弛變量為。對(duì)于式(2)的求解筆者采用拉格朗日乘子法并根據(jù)KKT條件得到最優(yōu)解,從而找到最優(yōu)分類超平面。
1.3交易策略構(gòu)建
首先,筆者將原始2天共46個(gè)10分鐘級(jí)的價(jià)格進(jìn)行EMD分析,從而得到趨勢(shì)項(xiàng)數(shù)據(jù)。筆者將趨勢(shì)項(xiàng)信號(hào)的標(biāo)準(zhǔn)差除以原始信號(hào)減去趨勢(shì)項(xiàng)信號(hào)的標(biāo)準(zhǔn)差所得值取對(duì)數(shù),得到第一個(gè)特征——波動(dòng)信噪比,該值越大表明趨勢(shì)越明顯。其次,三個(gè)特征是對(duì)分解后低頻部分的IMF的最后5個(gè)和10個(gè)數(shù)據(jù)做OLS回歸,所得的回歸系數(shù)即為特征值。第四個(gè)特征是上述兩個(gè)回歸直線夾角的cosine值。第五個(gè)特征則是成交量,由于該數(shù)據(jù)與其他數(shù)據(jù)數(shù)量級(jí)不同,筆者采取歸一化處理。
本文所構(gòu)建的SVM訓(xùn)練滑動(dòng)窗口為500,約一個(gè)月的數(shù)據(jù)量。數(shù)據(jù)的標(biāo)簽筆者定義為當(dāng)價(jià)格漲幅大于0.04%時(shí)為+1,小于0.04%時(shí)為-1,其余為0,然后將5個(gè)特征值帶入,滾動(dòng)訓(xùn)練出SVM模型,并預(yù)測(cè)下一期價(jià)格是漲是跌,預(yù)期價(jià)格上漲及標(biāo)簽為+1做多,反之做空。
2.1交易樣本選擇
本文選擇上海期貨交易所的螺紋鋼期貨的活力合約作為交易品種(數(shù)據(jù)來(lái)源Wind,品種代碼RB.SHF),數(shù)據(jù)為2015年1月5號(hào)至2016年1月29號(hào)的日盤10分鐘級(jí)數(shù)據(jù)。螺紋鋼因其交易量較大所以選為測(cè)試品種。開(kāi)倉(cāng)、平倉(cāng)交易費(fèi)用萬(wàn)分之四,不考慮杠桿和滑點(diǎn)。
2.2回測(cè)結(jié)果展示
圖1展示了該策略累積收益率曲線圖,在測(cè)試期內(nèi)實(shí)現(xiàn)累計(jì)收益46.24%,年化收益達(dá)43.32%,夏普比率為1.89(設(shè)無(wú)風(fēng)險(xiǎn)利率為3%)。
圖1 累計(jì)收益率
本文應(yīng)用信號(hào)處理的EMD算法作趨勢(shì)分解,從分解后的趨勢(shì)項(xiàng)及高頻IMF,并結(jié)合使用網(wǎng)格法進(jìn)行參數(shù)尋優(yōu)的SVM作價(jià)格漲跌分類預(yù)測(cè)?;販y(cè)結(jié)果表明該方法能夠獲得超額收益,具有一定的應(yīng)用價(jià)值,今后可進(jìn)一步對(duì)標(biāo)簽閾值、數(shù)據(jù)窗口進(jìn)行改進(jìn)優(yōu)化。
主要參考文獻(xiàn)
[1]S Prasaddas ,S Padhy. Support Vector Machines for Prediction of Futures Prices in Indian Stock Market[J].International Journal of Computer Applications,2012(3).
10.3969/j.issn.1673 - 0194.2016.20.043
F224
A
1673-0194(2016)20-0065-01
2016-09-02