王犇
關(guān)鍵詞:平穩(wěn)性 協(xié)整 去中心化價(jià)差 配對交易 參數(shù)優(yōu)化 樣本外檢驗(yàn)
一、 統(tǒng)計(jì)套利的理論基礎(chǔ)
傳統(tǒng)上,期貨投資分兩大流派:趨勢跟蹤與套利。前者即狹義上的CTA策略是一種單邊交易模式,這類策略受市場單邊波動的影響較大。套利類策略則是一種既能避險(xiǎn)又能盈利的模式,是一種風(fēng)險(xiǎn)較小、收益較為穩(wěn)定的市場中性策略。兩類策略各有所長,實(shí)踐中一般互為補(bǔ)充、組合使用,賺取不同市場波動情況下的收益。
(一) 統(tǒng)計(jì)套利概述
套利,也稱價(jià)差交易,是指在買入或賣出某種交易合約的同時(shí),賣出或買入相關(guān)的另一種合約,利用相關(guān)合約之間的價(jià)差變化進(jìn)行方向相反的交易,以期望價(jià)差發(fā)生變化而獲利的交易行為。套利可分為無風(fēng)險(xiǎn)套利和統(tǒng)計(jì)套利兩大類。前者一般基于某種經(jīng)濟(jì)、金融理論,當(dāng)相關(guān)關(guān)系式不滿足時(shí)即觸發(fā)交易機(jī)會,若交易收益能覆蓋交易成本則有利可圖,這類套利策略一般不承擔(dān)或只承擔(dān)極低的風(fēng)險(xiǎn),典型例子如期權(quán)平價(jià)套利。后者是指根據(jù)歷史數(shù)據(jù)的統(tǒng)計(jì)分析,找到不合理定價(jià)的資產(chǎn)標(biāo)的進(jìn)行套利的行為,其主要方法為數(shù)理統(tǒng)計(jì)與金融計(jì)量。該套利模式主要依賴于資產(chǎn)價(jià)格的統(tǒng)計(jì)、計(jì)量規(guī)律,對于交易標(biāo)的的經(jīng)濟(jì)、金融意義關(guān)注較少。
廣義上講,一切應(yīng)用數(shù)理統(tǒng)計(jì)知識來分析證券價(jià)格走勢及差異進(jìn)而制定套利交易策略的方式都可被稱為統(tǒng)計(jì)套利。狹義上的統(tǒng)計(jì)套利則指配對交易策略。配對交易是統(tǒng)計(jì)套利的一種,其盈利模式是通過分析兩只證券的不合理價(jià)差來獲取。兩只證券的價(jià)格走勢雖然在中途會有所偏離,但最終都會趨于一致,配對交易就是利用這種價(jià)格偏離與回歸來獲取收益。本文所論述的統(tǒng)計(jì)套利特指配對交易。配對交易有若干種方法,如最小距離法、時(shí)間序列法、隨機(jī)價(jià)差法、協(xié)整法等,其中協(xié)整法原理相對簡單,業(yè)界應(yīng)用最為廣泛。
統(tǒng)計(jì)套利具有以下幾個(gè)顯著特點(diǎn):第一,統(tǒng)計(jì)套利的理論基礎(chǔ)是均值回歸,其概念是當(dāng)價(jià)差高于或低于中樞(或均值)時(shí),會以很高的概率回歸,因此價(jià)差擴(kuò)大時(shí),做空價(jià)格較高的證券,做多價(jià)格較低的證券,當(dāng)價(jià)差回歸均值時(shí)平倉,價(jià)差縮小時(shí)則反之;第二,統(tǒng)計(jì)套利一般都是程序化交易,其大量應(yīng)用了統(tǒng)計(jì)計(jì)算等數(shù)量化知識,需要借助計(jì)算機(jī)技術(shù)的幫助,同時(shí)其交易周期一般偏高頻,也需要程序化、自動化的交易;第三,統(tǒng)計(jì)套利是一種典型的市場中性策略,普遍采取多空同時(shí)交易進(jìn)而對沖市場風(fēng)險(xiǎn)的模式,但需要指出,雖然市場風(fēng)險(xiǎn)能夠通過市場中性有效規(guī)避,但統(tǒng)計(jì)套利仍是一種風(fēng)險(xiǎn)套利而非無風(fēng)險(xiǎn)套利;第四,統(tǒng)計(jì)套利是相對價(jià)值投資,勝率較高,風(fēng)險(xiǎn)較低,收益較為穩(wěn)定,該策略注重價(jià)差這一相對價(jià)值,相對于價(jià)格的波動,價(jià)差的波動率要更低,交易的風(fēng)險(xiǎn)更小,同時(shí)統(tǒng)計(jì)套利具有對沖性,也降低了投資組合的風(fēng)險(xiǎn)。
目前統(tǒng)計(jì)套利策略在我國的股票、期貨市場上均有廣泛應(yīng)用,期貨市場的統(tǒng)計(jì)套利策略主要有以下4種:跨期套利、跨市場套利、跨品種套利、期現(xiàn)套利。微觀層面上,統(tǒng)計(jì)套利策略是一種承擔(dān)有限風(fēng)險(xiǎn),獲取穩(wěn)定收益的交易模式;宏觀層面上,統(tǒng)計(jì)套利對期貨市場的正常運(yùn)行也起到了非常重要的作用,有助于扭曲的期貨市場價(jià)格重新恢復(fù)到正常水平,其作用主要體現(xiàn)在以下3個(gè)方面:第一,有助于價(jià)格發(fā)現(xiàn)功能的有效發(fā)揮;第二,有助于市場流動性的提高;第三,有助于減緩價(jià)格的過度波動。
(二)統(tǒng)計(jì)套利的數(shù)學(xué)基礎(chǔ)
首先論述平穩(wěn)性。簡單地說,平穩(wěn)性是一個(gè)序列在時(shí)間推移中保持穩(wěn)定不變的性質(zhì),是本文在進(jìn)行數(shù)據(jù)分析和預(yù)測時(shí)一個(gè)非常重要的性質(zhì)。平穩(wěn)性可以分為嚴(yán)平穩(wěn)和弱平穩(wěn)兩種。嚴(yán)平穩(wěn)在實(shí)踐中較難檢驗(yàn),實(shí)際意義不大,實(shí)踐中經(jīng)常使用的都是弱平穩(wěn)。若時(shí)間序列的均值、方差和自協(xié)方差都不依賴于時(shí)間t,則可以稱其為弱平穩(wěn)或協(xié)方差平穩(wěn)。實(shí)踐中對于平穩(wěn)性通常采用單位根檢驗(yàn),常見的有DF檢驗(yàn)、ADF檢驗(yàn)、KPSS檢驗(yàn)等,筆者后文中使用的是DF/ADF檢驗(yàn)。
許多經(jīng)濟(jì)、金融的計(jì)量模型只能在序列平穩(wěn)的情況下進(jìn)行,但現(xiàn)實(shí)中的大量金融數(shù)據(jù)是非平穩(wěn)的。一種解決方案是采用差分的方法消除序列中的非平穩(wěn)趨勢,使得序列平穩(wěn)化后建立模型;另一種途徑是依靠Engle和Granger提出的協(xié)整理論及其方法。若兩組時(shí)間序列都是非平穩(wěn)的,但是經(jīng)過一階差分后都是平穩(wěn)的,并且這兩組序列經(jīng)過某種線性組合后也是平穩(wěn)的,就稱它們之間存在協(xié)整關(guān)系。協(xié)整可被看作變量之間長期穩(wěn)定的均衡關(guān)系的統(tǒng)計(jì)表示,基于協(xié)整的統(tǒng)計(jì)套利策略的盈利模式是通過兩只證券的價(jià)差來獲取。若發(fā)現(xiàn)兩只證券的走勢雖然在中途有所偏離,但是最終都會趨于一致,則這兩只證券統(tǒng)計(jì)上具有協(xié)整關(guān)系,它們的價(jià)差會圍繞某一個(gè)均值來回?cái)[動,這是統(tǒng)計(jì)套利可以盈利的理論基礎(chǔ)。
需要注意的是協(xié)整性和相關(guān)性是兩個(gè)不同的概念,兩個(gè)變量的相關(guān)性強(qiáng)不意味著具有協(xié)整性(在后文會看到實(shí)例)。對于協(xié)整性檢驗(yàn),一般采取EG兩步法,其原理是對回歸方程的殘差進(jìn)行單位根檢驗(yàn)。從協(xié)整的角度看,若因變量能被自變量的線性組合所解釋,則兩者之間具有穩(wěn)定的均衡關(guān)系,因變量不能被自變量解釋的部分就構(gòu)成了一個(gè)殘差序列,這個(gè)殘差序列不應(yīng)該是序列相關(guān)的,即殘差應(yīng)該是平穩(wěn)的。EG檢驗(yàn)一般分為以下兩步:第一,估計(jì)協(xié)整回歸方程,得到協(xié)整系數(shù)及殘差,常用方法是最小二乘回歸;第二,對殘差進(jìn)行平穩(wěn)性檢驗(yàn),通常是ADF檢驗(yàn)。
二、統(tǒng)計(jì)套利的工程化實(shí)現(xiàn)
統(tǒng)計(jì)套利的實(shí)施流程一般包括交易對象的選取、投資組合的構(gòu)建、進(jìn)出場和止損信號機(jī)制的建立、回測與參數(shù)優(yōu)化4個(gè)步驟,其中第3步尤為重要,這一步的優(yōu)劣很大程度上決定了統(tǒng)計(jì)套利策略實(shí)施的成功與否和套利利潤的大小。下面以上海期貨交易所的滬銅期貨合約為例,闡釋如何工程化的實(shí)現(xiàn)一個(gè)統(tǒng)計(jì)套利策略。
(一)配對交易合約的選擇
首先設(shè)定樣本內(nèi)的時(shí)間范圍為2020.11.1 - 2020.11.30,備選證券為上期所的滬銅合約cu2101、cu2102、cu2103、cu2104、cu2105,分鐘線級別,每個(gè)合約有約10000條數(shù)據(jù)。之所以選擇1個(gè)月的數(shù)據(jù)量作為樣本數(shù)據(jù),部分原因是不同于股票,期貨合約都是有生命期的,且每個(gè)期貨合約的活躍生命期都不太長。對于滬銅期貨,一般選擇2個(gè)月后的合約作為第一個(gè)候選合約,比如現(xiàn)在是2020年11月,則考慮cu2101\cu2102\cu2103\cu2104\2105合約;若現(xiàn)在是2020年12月,則相應(yīng)考慮cu2102\cu2103\cu2104\cu2105\cu2106合約,以此類推。在分鐘K線這個(gè)級別上,滬銅各個(gè)合約的相關(guān)性很強(qiáng)。但請注意,如前所述,相關(guān)性強(qiáng)不意味著具有協(xié)整關(guān)系。
接下來做協(xié)整檢驗(yàn),兩兩配對,共需要10次檢驗(yàn)。在所有滿足協(xié)整關(guān)系的配對中,選擇t-value最小(或p-value最?。┖霞s對,也即協(xié)整關(guān)系最強(qiáng)的合約對。該協(xié)整檢驗(yàn)1%、5%、10%置信度下的臨界值分別為:-3.8975903、-3.33677162、-3.04489535,因此本文選擇協(xié)整關(guān)系最強(qiáng)的兩個(gè)合約cu2104和cu2105作為后續(xù)建模的對象。
(二)計(jì)算去中心化的價(jià)差及設(shè)定滑動窗口
首先計(jì)算cu2104和cu2105兩個(gè)合約的價(jià)差序列,使用前5000條數(shù)據(jù):
然后計(jì)算去中心化的價(jià)差序列:
接下來計(jì)算去中心化的價(jià)差序列的標(biāo)準(zhǔn)差:
去中心化的價(jià)差序列具有較明顯的均值回復(fù)性,此外我們也計(jì)算了2倍標(biāo)準(zhǔn)差和3倍標(biāo)準(zhǔn)差,可以作為開倉與止損的閾值。
以上是靜態(tài)計(jì)算的結(jié)果,在實(shí)務(wù)中價(jià)格是不斷變化的,筆者也希望價(jià)差及其均值、標(biāo)準(zhǔn)差能動態(tài)的計(jì)算并更新,為此本文引入了滑動窗口的概念。對于每一個(gè)分鐘數(shù)據(jù),我們回溯其window_len個(gè)數(shù)據(jù),然后計(jì)算該滑動窗口內(nèi)的價(jià)差及閾值。編程中一般會使用雙端隊(duì)列 (deque) 這種數(shù)據(jù)結(jié)構(gòu)來緩存數(shù)據(jù)。與之前結(jié)果相比,價(jià)差仍顯示出很強(qiáng)的均值回復(fù)性,但閾值不再是一條直線,而是動態(tài)變化的。
(三) 制定交易策略并回測
依據(jù)前面的分析,我們制定交易策略如下:
交易標(biāo)的:cu2104和cu2105
交易時(shí)段:2020.11.1至2020.11.30
交易周期:1分鐘K線,對于每一根K線,計(jì)算過去一段窗口期的去中心化價(jià)差(mspread)及開倉止損閾值
交易信號:多空均無倉位,價(jià)差高于正向開倉閾值,空cu2104多cu2105
多空均無倉位,價(jià)差低于負(fù)向開倉閾值,多cu2104空cu2105
空cu2104多cu2105時(shí),價(jià)差大于正向止損閾值,平倉
空cu2104多cu2105時(shí),價(jià)差低于0軸,平倉
多cu2104空cu2105時(shí),價(jià)差小于負(fù)向止損閾值,平倉
多cu2104空cu2105時(shí),價(jià)差高于0軸,平倉
資金管理:總資金10萬元,每次同時(shí)交易兩手滬銅(多空各1手),保證金占用6萬元左右,故倉位約60%。
交易成本:目前滬銅手續(xù)費(fèi)標(biāo)準(zhǔn)為合約價(jià)值的0.5%%,開倉平倉均按此標(biāo)準(zhǔn)收取,無平今優(yōu)惠,回測時(shí)需考慮傭金及滑點(diǎn)。
以上交易策略回測結(jié)果如下:勝率56.1%,最大回撤0.52%,總收益率14.56%,年化收益率404.38%,年化夏普率12.59,盈虧額比1.26,交易次數(shù)287。
(四) 參數(shù)優(yōu)化
期貨量化交易策略一般都是需要參數(shù)優(yōu)化的,統(tǒng)計(jì)套利也不例外。筆者對于參數(shù)優(yōu)化總的態(tài)度是:參數(shù)優(yōu)化是需要的,但不可過度優(yōu)化,更不可迷信參數(shù)優(yōu)化的結(jié)果。無論采用何種優(yōu)化方法,本質(zhì)上都是樣本內(nèi)尋優(yōu),均無法保證樣本內(nèi)的最優(yōu)值也是樣本外最優(yōu)的。此外,基于筆者的實(shí)務(wù)經(jīng)驗(yàn),避免參數(shù)過擬合最好的方法是減少參數(shù)的數(shù)量,參數(shù)應(yīng)盡可能固化或自適應(yīng),策略迭代的核心是優(yōu)化邏輯而非優(yōu)化參數(shù)。
在本策略中,一共涉及3個(gè)參數(shù),分別是滑動窗口期window_len、開倉系數(shù)k_open和止損系數(shù)k_stop。最簡單的方式是在三維空間里對這3個(gè)參數(shù)進(jìn)行網(wǎng)格尋優(yōu),但筆者從交易實(shí)戰(zhàn)出發(fā),不打算采用這個(gè)模式,而是希望盡量減少參數(shù)數(shù)量以避免過度擬合?;瑒哟翱谄趙indow_len之前設(shè)定為50,從實(shí)戰(zhàn)經(jīng)驗(yàn)來看,這個(gè)參數(shù)調(diào)整的意義不大,故暫時(shí)固化下來。開倉和止損均與標(biāo)準(zhǔn)差有關(guān),故設(shè)置止損系數(shù) = 開倉系數(shù) + 1,也就是止損閾值永遠(yuǎn)比開倉閾值高一個(gè)標(biāo)準(zhǔn)差。這樣參數(shù)的維度就被縮小為1維,只需對k_open進(jìn)行遍歷。此外,由于這類偏高頻的策略對于手續(xù)費(fèi)、滑點(diǎn)非常敏感,希望在考慮總利潤的同時(shí)盡量減少交易次數(shù)。
計(jì)算結(jié)果表明,當(dāng)開倉閾值過小時(shí),回測結(jié)果不理想,原因是交易信號質(zhì)量不高,且交易過于頻繁導(dǎo)致交易成本較大。隨著開倉閾值的不斷提升,交易次數(shù)和手續(xù)費(fèi)逐漸減少,總收益呈現(xiàn)先增后減的態(tài)勢。綜合考慮交易成本和總利潤,本文選擇k_open = 2.4這個(gè)參數(shù),相應(yīng)的k_stop = 3.4。另外也可以看出,2.4附近的回測結(jié)果沒有出現(xiàn)太明顯的變化,可見這個(gè)參數(shù)大概率是位于參數(shù)高原而非參數(shù)孤島之上的,這也增強(qiáng)了我們在樣本外/實(shí)盤中使用該參數(shù)的信心。
(五)樣本外檢驗(yàn)
樣本外的數(shù)據(jù)筆者選擇2020.12.1——2020.12.7,1周的時(shí)間長度,樣本內(nèi)外的數(shù)據(jù)長度之比約為4:1。這個(gè)模式也可應(yīng)用于實(shí)盤,比如用過去1個(gè)月的數(shù)據(jù)訓(xùn)練模型,然后應(yīng)用于未來1周,并以此類推滾動優(yōu)化。利用優(yōu)化好的參數(shù)k_open = 2.4,k_stop = 3.4,驗(yàn)證樣本外的表現(xiàn)如下:勝率60%,最大回撤0.00%,總收益率4.21%,年化收益率686.58%,年化夏普率19.56%,盈虧額比1.2,交易次數(shù)36??梢娫摬呗约皟?yōu)化后的參數(shù)在樣本外的表現(xiàn)還算滿意。
三、 總結(jié)與展望
統(tǒng)計(jì)套利是典型的壁虎式投資法,沒有交易機(jī)會時(shí)保持空倉,出現(xiàn)交易機(jī)會時(shí)及時(shí)捕捉,相比其它策略呈現(xiàn)風(fēng)險(xiǎn)較低收益穩(wěn)定的特征。基于協(xié)整法的統(tǒng)計(jì)套利策略擁有比較堅(jiān)實(shí)的計(jì)量金融學(xué)基礎(chǔ),更適合趨勢不明顯的震蕩行情,其風(fēng)險(xiǎn)收益特征與趨勢跟蹤類策略形成了較好的互補(bǔ),值得深入研究及實(shí)盤配置。當(dāng)然,實(shí)盤中也需考慮交易成本沖擊、政策風(fēng)險(xiǎn)、市場風(fēng)險(xiǎn)、資金風(fēng)險(xiǎn)等,通過積極風(fēng)控和長期投資最終獲得較為穩(wěn)定的收益。
參考文獻(xiàn):
[1]金志宏.統(tǒng)計(jì)套利——理論與實(shí)戰(zhàn)[M].第一版.北京.電子工業(yè)出版社.2016(5).
[2]周佰成,劉毅男.量化投資策略[M].第一版.北京.清華大學(xué)出版社.2019(2).
[3]朱順泉.計(jì)量經(jīng)濟(jì)分析及其Python應(yīng)用[M].第一版.北京.清華大學(xué)出版社.2020(12).
作者單位:海通期貨股份有限公司,碩士研究生,海通期貨研究員