无码人妻精品一区二|京东快递查询快递单号|亚洲男人AV天堂午夜在|成人毛片18女人毛片免费看网站|人善交ZZZZXXXXX另类

量化專題 · 基于dtw距離的量?jī)r(jià)類策略研究

2024-4-5 07:21| 發(fā)布者: 仟茂傳媒| 查看: 1308| 評(píng)論: 0|來(lái)自: 互聯(lián)網(wǎng)

摘要: 來(lái)源:中信建投期貨微資訊

來(lái)源:中信建投期貨微資訊

本報(bào)告觀點(diǎn)和信息僅供符合證監(jiān)會(huì)適當(dāng)性管理規(guī)定的期貨交易者參考。因本平臺(tái)暫時(shí)無(wú)法設(shè)置訪問(wèn)限制,若您并非符合規(guī)定的交易者,為控制交易風(fēng)險(xiǎn),請(qǐng)勿點(diǎn)擊查看或使用本報(bào)告任何信息。對(duì)由此給您造成的不便表示誠(chéng)摯歉意,感謝您的理解與配合!

作者 | 彭鯨橋 中信建投期貨金融工程量化分析師

本報(bào)告完成時(shí)間 | 2024年3月24日

摘 要

上一篇中,我們利用動(dòng)態(tài)時(shí)間彎曲(dtw)距離來(lái)判斷相似度,將待考察片段與歷史片段進(jìn)行比對(duì),選取歷史最相似片段的下一日收益來(lái)預(yù)測(cè)漲跌,構(gòu)建了一種基于日頻量?jī)r(jià)數(shù)據(jù)的形態(tài)識(shí)別策略。

本文中,我們對(duì)原策略進(jìn)行改進(jìn),構(gòu)建漲跌庫(kù)”的思路,用余弦相似度替代動(dòng)態(tài)彎曲距離,并嘗試施加閾值的限制,在商品品種等權(quán)組合上測(cè)試改進(jìn)的效果。分析原策略結(jié)果不夠穩(wěn)健的原因,可能是不同的品種趨勢(shì)性不同導(dǎo)致與歷史片段的相似性差別較大,進(jìn)一步對(duì)閾值參數(shù)k進(jìn)行了敏感性分析,后續(xù)還有進(jìn)一步研究的空間。

風(fēng)險(xiǎn)提示:模型誤設(shè)風(fēng)險(xiǎn)、歷史統(tǒng)計(jì)規(guī)律失效等風(fēng)險(xiǎn)。

引言

上一篇中,我們利用動(dòng)態(tài)時(shí)間彎曲(dtw)距離來(lái)判斷相似度,將待考察片段與歷史片段進(jìn)行比對(duì),選取歷史最相似片段的下一日收益來(lái)預(yù)測(cè)漲跌,構(gòu)建了一種基于日頻量?jī)r(jià)數(shù)據(jù)的形態(tài)識(shí)別策略。由于該策略在不同品種上的效果不夠穩(wěn)健且對(duì)參數(shù)敏感,在本文中我們對(duì)策略進(jìn)行改進(jìn),并尋找可能的原因。

一種改進(jìn)方法是滾動(dòng)地構(gòu)建“漲跌庫(kù)”。即對(duì)于每一個(gè)交易日,取其過(guò)去一年中漲幅最大和跌幅最大的各5日,前L天的序列納入“漲庫(kù)”和“跌庫(kù)”,將該交易日的前L天片段分別與“漲庫(kù)”和“跌庫(kù)”中的片段進(jìn)行比對(duì),計(jì)算平均距離來(lái)判斷其下一日的漲跌情況。

另一種改進(jìn)方法是將動(dòng)態(tài)時(shí)間彎曲距離替換為余弦相似度。由于動(dòng)態(tài)時(shí)間彎曲距離作為距離只能取正數(shù),區(qū)分不同序列的走勢(shì)情況的能力較弱,并且考察片段和歷史序列的片段長(zhǎng)度其實(shí)是相等的,在這一點(diǎn)上沒(méi)有最大化發(fā)揮出動(dòng)態(tài)時(shí)間彎曲算法的優(yōu)勢(shì),因此考慮將動(dòng)態(tài)時(shí)間彎曲距離改為余弦相似度,這樣以來(lái)走勢(shì)為上漲的片段和下跌的片段就會(huì)有正負(fù)上的差異。基于余弦相似度的度量,結(jié)合漲跌庫(kù)的思路,如果片段與漲庫(kù)內(nèi)片段的平均余弦相似度大于閾值,與跌庫(kù)內(nèi)的平均余弦相似度為負(fù),則發(fā)出看漲信號(hào),否則看跌。

此外,之前的策略是在日頻數(shù)據(jù)上實(shí)現(xiàn)的,可以將日頻數(shù)據(jù)換為60分鐘數(shù)據(jù)??紤]到方法計(jì)算速度較慢,可以將信號(hào)進(jìn)行延遲,觀察策略效果。也可以在比對(duì)相似片段時(shí)設(shè)置一個(gè)動(dòng)態(tài)時(shí)間彎曲距離的閾值k,只有在距離小于k時(shí)才認(rèn)為是相似片段,而不是每天都固定地選取十個(gè)相似片段。

分析原策略結(jié)果不夠穩(wěn)健的原因,可能是不同的品種與歷史片段的相似性差別很大。因?yàn)椴煌贩N的趨勢(shì)性不同,比如豆粕趨勢(shì)性不好,而螺紋趨勢(shì)性就較強(qiáng)。進(jìn)一步對(duì)閾值參數(shù)k進(jìn)行了參數(shù)敏感性分析。

漲跌庫(kù)的思路

之前的思路是“先找相似,后看漲跌”的順序,即首先在歷史片段中尋找最相似的若干片段,然后觀察這些片段的下一日收益,去計(jì)算待匹配片段的下一日收益。而漲跌庫(kù)的思路順序相反,可以描述為“先找漲跌,后看相似”,即首先尋找歷史片段中漲幅和跌幅最大的片段,然后計(jì)算待匹配片段與這些片段的動(dòng)態(tài)時(shí)間彎曲距離來(lái)刻畫相似度,得出待匹配片段下一日的漲跌情況。

其中,“漲跌庫(kù)”是每日滾動(dòng)構(gòu)建的。即對(duì)于每一個(gè)交易日,取其過(guò)去一年中漲幅最大和跌幅最大的各5日,前L天的序列納入“漲庫(kù)”和“跌庫(kù)”。判斷漲跌時(shí),具體做法是將該交易日的前L天片段分別與“漲庫(kù)”和“跌庫(kù)”中的片段進(jìn)行比對(duì),計(jì)算出平均動(dòng)態(tài)彎曲距離。

基于漲跌庫(kù)的策略的具體步驟如下。

1.第一次循環(huán)確定閾值參數(shù)。循環(huán)當(dāng)日及之前計(jì)算所有待匹配價(jià)格序列和歷史價(jià)格漲庫(kù)、跌庫(kù)中序列的動(dòng)態(tài)時(shí)間彎曲距離,取其第K個(gè)次序統(tǒng)計(jì)量的大小k作為距離的閾值。

2.第二次循環(huán)得出信號(hào)。對(duì)于每一個(gè)日期更新漲跌庫(kù),求出其過(guò)去n天內(nèi)上漲最多的若干日期和下跌最多的若干日期,將這些日期之前的片段分別納入漲庫(kù)和跌庫(kù)。分別計(jì)算當(dāng)日待匹配價(jià)格序列與漲庫(kù)、跌庫(kù)中片段的平均動(dòng)態(tài)時(shí)間彎曲距離,如果與漲庫(kù)內(nèi)片段的平均動(dòng)態(tài)時(shí)間彎曲距離小于等于閾值k,并且與跌庫(kù)內(nèi)片段平均動(dòng)態(tài)時(shí)間彎曲距離大于閾值k,就看漲;反之亦然。?

基于余弦相似度的形態(tài)識(shí)別

之所以考慮用余弦相似度來(lái)替代動(dòng)態(tài)彎曲距離,是出于以下兩點(diǎn)原因。一是考慮到動(dòng)態(tài)時(shí)間彎曲算法的一個(gè)主要優(yōu)勢(shì)是可以將不同長(zhǎng)度的片段進(jìn)行比對(duì),通過(guò)壓縮、拉伸和平移等操作識(shí)別其形態(tài)上的相似性;而策略中我們考察的片段和歷史數(shù)據(jù)的待比對(duì)片段長(zhǎng)度其實(shí)是相等的,并沒(méi)有利用上動(dòng)態(tài)時(shí)間彎曲算法主要的優(yōu)勢(shì)。二是動(dòng)態(tài)時(shí)間彎曲距離本質(zhì)上仍然是距離,取值始終是正數(shù),在處理上漲行情和下跌行情時(shí)一定程度上不能很好地區(qū)分開;而余弦相似度的取值可正可負(fù),更方便對(duì)相似度進(jìn)行判斷,對(duì)不同的行情進(jìn)行區(qū)分。

基于余弦相似度的策略的具體步驟如下。

1.第一次循環(huán)確定閾值參數(shù)。循環(huán)當(dāng)日及之前計(jì)算所有待匹配價(jià)格序列和歷史價(jià)格漲庫(kù)、跌庫(kù)中序列的余弦相似度,取其第K個(gè)次序統(tǒng)計(jì)量的大小k作為相似度的閾值。

2.第二次循環(huán)得出信號(hào)。對(duì)于每一個(gè)日期更新漲跌庫(kù),求出其過(guò)去n天內(nèi)上漲最多的若干日期和下跌最多的若干日期,將這些日期之前的片段分別納入漲庫(kù)和跌庫(kù)。分別計(jì)算當(dāng)日待匹配價(jià)格序列與漲庫(kù)、跌庫(kù)中片段的平均相似度,如果與漲庫(kù)內(nèi)片段的平均相似度大于等于閾值k,并且與跌庫(kù)內(nèi)片段平均相似度小于0,就看漲;反之亦然。

實(shí)證分析

標(biāo)的選取為IF、IH、IC、T四種期貨,參考的技術(shù)指標(biāo)為收盤價(jià)和成交量,交易頻率為日頻。每次調(diào)倉(cāng)時(shí),計(jì)算截至在所有商品品種等權(quán)重的品種組合上進(jìn)行測(cè)試,其中所有品種統(tǒng)一參數(shù)。具體的權(quán)重分配方法為,初始時(shí)所有已上市品種的權(quán)重相同,在有新品種引入時(shí)會(huì)進(jìn)行權(quán)重的再平衡,再平衡后每個(gè)品種的權(quán)重再次相同。參考的技術(shù)指標(biāo)為收盤價(jià)和成交量,交易頻率為日頻。每次調(diào)倉(cāng)時(shí),計(jì)算截至當(dāng)天長(zhǎng)度為L(zhǎng)的當(dāng)前片段與過(guò)去n = 250天歷史片段的動(dòng)態(tài)時(shí)間彎曲距離,其中歷史片段長(zhǎng)度同樣設(shè)置為L(zhǎng),閾值k取值為第K=300個(gè)距離次序統(tǒng)計(jì)量的值。其中,選取的標(biāo)的品種如下表。

為了消除行情序列非平穩(wěn)性造成的偏差,對(duì)每一個(gè)待考察的序列和歷史序列,將其價(jià)格標(biāo)準(zhǔn)化處理,價(jià)格除以序列最后一天的價(jià)格。成交量數(shù)據(jù)則全部進(jìn)行移動(dòng)平均的標(biāo)準(zhǔn)化,將所有成交量數(shù)據(jù)除以50天的移動(dòng)均值。需要較大的數(shù)據(jù)量進(jìn)行片段的比對(duì),故回測(cè)期在n = 250個(gè)交易日之后開始,回測(cè)期為2013年1月30日至2023年3月2日,不考慮交易費(fèi)。

4.1??余弦相似度漲跌庫(kù)的思路

基于余弦相似度漲跌庫(kù)的思路,得到的各個(gè)商品品種和等權(quán)重組合上的策略表現(xiàn)如下表。

其中,距離閾值k設(shè)為0.8,dtw距離小于k則認(rèn)為片段相似,如果沒(méi)有相似片段則沿用上一次的買入或賣出信號(hào)。

上述策略在等權(quán)重品種組合上的凈值曲線如下圖:

原始思路的表現(xiàn)優(yōu)于漲跌庫(kù)的思路,在大多數(shù)品種上都能取得正收益。與單品種相比,等權(quán)重的品種組合最大回撤顯著減小,具有較好的表現(xiàn)。

4.2?dtw原策略上施加閾值的限制

如果在原始的動(dòng)態(tài)時(shí)間彎曲距離策略上,不使用漲跌庫(kù)的思路,僅施加閾值限制進(jìn)行改進(jìn),得到的各個(gè)商品品種和等權(quán)重組合上的策略表現(xiàn)如下表。

其中,距離閾值k設(shè)為0.8,dtw距離小于k則認(rèn)為片段相似,如果沒(méi)有相似片段則沿用上一次的買入或賣出信號(hào)。

上述策略在等權(quán)重品種組合上的凈值曲線如下圖:

原始思路的表現(xiàn)優(yōu)于漲跌庫(kù)的思路,在大多數(shù)品種上都能取得正收益。與單品種相比,等權(quán)重的品種組合最大回撤顯著減小,具有較好的表現(xiàn)。

參數(shù)敏感性分析

考慮在dtw原策略上施加的閾值k參數(shù)大小。不同品種的趨勢(shì)性不同,待匹配片段與歷史片段的距離大小不同,所以不同品種上k的篩選作用會(huì)有差別。分別計(jì)算所有品種的動(dòng)態(tài)時(shí)間彎曲距離集合,兩個(gè)特殊品種——豆粕、螺紋各自的動(dòng)態(tài)時(shí)間彎曲距離集合,得到距離的分位數(shù)如下表。

可見螺紋趨勢(shì)性較強(qiáng),與歷史片段的動(dòng)態(tài)彎曲距離較小,而豆粕趨勢(shì)較差,所以與歷史片段的動(dòng)態(tài)彎曲距離較大。前文策略中所使用的閾值k=0.8約為全品種閾值的1/4分位數(shù)。下面對(duì)閾值k進(jìn)行參數(shù)敏感性分析,在IF品種上進(jìn)行測(cè)試,得出如下指標(biāo)結(jié)果和凈值曲線。

可見在IF單品種上,策略效果對(duì)閾值參數(shù)k的變化是敏感的,夏普和凈值變動(dòng)較大。

總結(jié)

本文在第一篇的基礎(chǔ)上,進(jìn)一步對(duì)基于dtw距離的量?jī)r(jià)類策略進(jìn)行了改進(jìn)。分別通過(guò)引入“漲跌庫(kù)”的新思路,將動(dòng)態(tài)時(shí)間彎曲距離改為余弦相似度的度量,對(duì)原始思路的距離閾值進(jìn)行設(shè)定,得出了改進(jìn)后的策略在商品品種上的表現(xiàn),其中余弦相似度漲跌庫(kù)的思路效果欠佳,原始思路施加閾值后效果明顯提升。最后分析原因可能是不同品種的趨勢(shì)性不同,進(jìn)一步對(duì)閾值參數(shù)k進(jìn)行了參數(shù)敏感性分析,發(fā)現(xiàn)單品種上閾值參數(shù)k仍較為敏感,后續(xù)我們將會(huì)進(jìn)一步分析研究。

相關(guān)分類

圖文推薦
熱門排行