基于残差分析的大类资产轮动策略

基于残差分析的大类资产轮动策略

大类资产轮动的特殊性

所谓大类资产,指的是具有相似收益特征和投资用途的资产类别。一般而言,大类资产轮动策略通常分为两类:一类是从宏观经济数据出发,依据对经济周期和相关品种基本面的判断,做多预期表现较强的一类资产来实现轮动;而另一类自下而上的方法则与传统意义上的跨品种套利思路略相近,即:从各类资产的价格序列出发,依据数量分析方法实现不同资产间的轮动。

1.1、跨品种套利

期货跨品种套利通常指的是利用两个相关联的、不同品种的期货合约之间价差进行买卖的交易方式,即:当相关联期货合约之间的价差背离其正常水平时,买入某一期货合约的同时,卖出另一期货合约,以期二者价差返回正常水平时,对冲平仓以获取稳定的价差收益。

根据参与跨品种套利中不同期货品种间的相关关系,通常可将跨品种套利区分为以下两种:1)相关商品间的套利,这类商品往往受多个相同因素影响而表现出较强的联动性,并在价格变动上存在着共同的趋势,例如:可作为粮食及饲料的玉米和小麦,由于其价格同时受季节、气候等因素影响,价差往往维持在一定的区间内,并表现出相当的规律性;2)同一产业链上下游品种间的套利,由于下游产品产量和供给量较大程度受上游产品的制约,而下游产品价格也极大地影响了上游企业利润,进而影响上游产品的需求和价格,因此这类品种价格波动也往往表现出较强的联动性,例如:同在一个产业链上的大豆与豆粕,铁矿石与螺纹钢。

一般来说,跨品种套利能够得以成功,关键在于:1)套利组合中的品种之间具有高度相关性,如:同属于基本金属的铜和铝,由于在工业用途上具有部分可替代性,而具有较高的相关性,而处于同一产业链上下游的铁矿石和螺纹钢同样具备较高的相关性(关注私募工场ID:Funds-Works,加私募工场老板娘微信guo5_guoguo)。2)不同合约间的价差(或比价)变化具有一定的规律性,通常情况下,跨品种套利交易的合约价差变化在一定区间内波动,且从历史的角度看属大概率事件,当价差突破合理区间边界,随着偏离合理区间程度越来越大,回归正常区间的可能性也就越大,而跨品种套利交易正是利用价差短暂性偏离合理区间的机会进行套利交易而获利。

1.2、大类资产轮动与跨品种套利

1)相比用于跨品种套利的商品对,不同大类资产之间相关性普遍较低。以黄金和原油为例,虽然两者均受共同的宏观经济及地缘政治影响,但原油价格更易受原油库存、季节性因素、原油供给结构等因素影响,而黄金则经常受避险情绪、相关联动商品价格、投资需求等因素影响,当某个独立的因素影响程度较大,超过黄金和原油价格的共同影响因素时,两者间的价格运动趋势便可能发生背离;反映在相关性数据上,不难发现,黄金和原油间的相关性表现出显著的时高时低的特点。

2)不同大类资产之间的价差(或比价)缺乏规律性。仍以黄金和原油为例,除商品属性外,黄金还表现出较为明显的避险属性,而原油则具备战略物资属性,资产的不同属性决定了同一突发事件对两类资产价格走势可能产生完全不同的影响,这也经常导致伦敦金与WTI原油间所具备的共同走势经常容易被打破;反映在数据上,通常表现为:在经历一段长时间的协整关系后,伦敦金和WTI原油的协整残差序列经常因受突发事件冲击而导致原先的均值回复规律被打破,协整关系亦因此而中断。

基于以上事实,在制作基于价格序列的大类资产轮动策略(例:伦敦金与WTI原油)时,我们将在考察协整残差项均值回复特性的同时,格外关注大类资产间的协整关系是否发生突变,并在协整关系因外部事件冲击而发生突变时,使用其他方案。

从协整出发

2.1 关于协整

在传统的计量经济学中,有许多建模方法是基于最小二乘估计的渐进理论,以解释便利的平稳性为前提,在平稳的短记忆时间序列的基础上进行的。而在实际的经济系统和金融市场中,各类数据却普遍表现为长记忆性和非平稳性,若用非平稳的时间序列作为解释变量,建立回归模型,就会产生“伪回归”现象。上世纪七十年代,Granger和Newbod对伪回归现象进行了实证检验,他们通过Monte Carlo模拟指出,回归模型中随机误差项的序列相关性最终将导致传统的模型检验方法的失败。

为解决模型设定中的伪回归现象,Granger和Engle提出了协整理论。协整检验的思想在于,如果两个时间序列向量的某种线性组合可以得到一个平稳的误差序列,则这些非平稳时间序列存在长期的均衡关系。关于协整性的检验方法,从检验手段上可以分为两种:一种是基于回归残差的Engle-Granger两步协整检验法,即:将因变量与自变量之间是否存在协整关系等同于检验回归方程的残差序列是否平稳,并通常使用ADF检验来完成;另一种是基于回归系数的Johansen协整检验,它将对向量yt的协整检验转化为对矩阵П秩的分析。

对于普通的跨品种套利,由于相关套利品种之间具有可替代性或处于同一产业链的上下游,因此,两者间相关度普遍较高,并具备较强的协整性;从数据上看,表现为收益率序列相关性较高,且协整后的残差序列具有较强的均值回复特性。通常意义上的跨品种套利,也正是以协整为前提,在此基础上,通过考察残差序列的均值回复特性,来确定开平仓信号。

2.2 序列的周期性

对时间序列的分析一直存在两种观察、分析和解释方法,第一种是直接分析数据序列随时间变化的结构特征,即人们通常说说的时域分析法,该方法将时间序列作为一个整体进行研究,而无法区分原时间序列所包含的各种周期分量的作用效果,这方面的缺陷可能使研究者对相应时间序列的波动本质产生错误的认识(关注私募工场ID:Funds-Works,加私募工场老板娘微信guo5_guoguo)。另一种方法是把时间序列看作不同谐波的叠加,并通过傅里叶变换和谱密度函数研究时间序列在频域范围内的结构特征,即通常所谓的谱分析法。该方法在将时间序列看作互不相关的周期分量叠加的同时,通过研究和比价各分量的周期变化,以充分揭示时间序列的频域结构,掌握其主要波动特征,因此,在研究时间序列的周期波动方面,具有时域方法所无法企及的优势。

2.2.1傅里叶变换及谱分析

傅里叶分析的研究和应用已有两百多年的历史。1807年,傅里叶首先提出傅里叶级数的概念,即:任一周期信号均可分解为复正弦信号的叠加。1822年,傅里叶又提出了非周期信号分解的概念(即:傅里叶变换),而能量有限信号的傅里叶变换及逆变换可分别表示为:
image

此外,在工程技术应用中,对于平稳随机信号,通常使用功率谱密度函数来表征信号的功率特性。一般意义上的功率谱定义为:

image

通常情况下,时间序列的分析分为时域分析和频域分析。相比使用较多的时域分析,频域分析有助于分析时间序列潜在的波动周期。作为频域分析中的主要内容之一,谱分析则是建立在严密数学基础上的定量测量工具。

经典功率谱分析又称为线性估计法,它通过傅里叶变换将平稳时间序列的自协方差函数和频域中的功率谱密度函数建立对应关系,将平稳时间序列看做无数具有随机振幅和相位的周期震荡的叠加某一频率处的功率谱密度反映了该频率的周期震荡的强度,因此,若功率谱密度函数在某频率处有明显的峰值点,即可判定原序列中该频率分量强度较大,是一个主周期分量。同时,亦可通过衡量各周期分量的相对重要性,找出序列中隐含的各主要周期分量,从而能有效识别出周期。

根据功率谱密度函数的定义及其与自相关函数之间的关系,经典功率谱估计可分为直接法(周期图法)和间接法。直接法是在对相关信号数据进行必要的预处理后,对处理后数据进行离散Fourier变换,并依据功率谱定义求功率谱。而间接法则先由相应信号数据估计出自相关函数,并依据Wiener-Khintchine定理,对自相关函数作傅里叶变换得到功率谱。

在傅里叶谱的基础上,上世纪60年代,J.P.Burg采用最大熵法进行谱估计(最大熵谱):仅假设在所观测到的有限数据以外的数据为随机的,在信息熵为最大的前提下,将未知的那一部分相关函数用迭代方法外推至无穷后,再作频域变换从而得到功率谱;其实质是选择这样一种谱,它对应着最随机或最不可预测的时间序列,而这个时间序列的自相关函数又与一组已知值相同(关注私募工场ID:Funds-Works,加私募工场老板娘微信guo5_guoguo)。最大熵谱是一种非线性谱分析方法,它的主要特点是:1)比普通线性谱估计有更高的分辨率,2)用于进行谱分析的数据长度较短,但最大熵谱结果的准确性严重依赖于阶的选择,阶数过低会丢失真实的谱峰,而过高的阶次则将导致虚假谱峰。

2.2.2谱分析应用

一般而言,传统的跨品种套利策略以协整为前提,在此基础上通过考察残差序列的均值回复特性,来制定相应多空套利策略;其重点在于开平仓信号的确定,而开平仓位置的确认又往往挂钩于波动率值,因此,此类问题的关键在于波动率的取值。而波动率 (如:历史波动率 )的值除了受历史时间序列影响外,还与所取的数据长度N休戚相关。

对于给定的时间序列,当N取不同长度(如下图,N=10、15、20、25、30)时,随着时间的推移,波动率值表现出不同的性态,只有当N取作时间序列y(t)的周期(即下图中N=20)时,波动率值才不会随着时间的演进而出现大幅波动。

image

而对于传统的跨品种套利策略而言,在协整关系不变前提下,若任意选取数据长度,将可能导致波动率值随着时间推移而发生大幅震荡,并进而影响整个套利策略开平仓信号的稳定性(关注私募工场ID:Funds-Works,加私募工场老板娘微信guo5_guoguo)。在此背景下,当两类资产因满足协整关系而沿用传统跨品种套利思路时,我们在计算波动率值时,将所需的数据长度取作一个周期,以此避免波动率值因所取数据长度的原因而产生大幅波动。通过回测,不难发现,固定的数据长度与通过谱分析方法得到的数据长度对轮动策略的结果影响较为显著(相关详细结论见本文第三部分)。

2.3协整机制的监测

2.3.1关于小波分析

时间和频率是描述信号的两个极重要的参数,Fourier变换将信号的时域特征和频域特征有机联系起来,使之成为信号分析和处理的有力工具。但Fourier分析仅适用于平稳信号,对于非平稳信号,则无法精细地跟踪其时频特征。

上世纪80年代,法国地球物理学家Morlet在分析处理地震信号时,首次引入“小波”概念。其后,理论物理学家Grossman采用平移和伸缩不变性建立了小波变换的理论体系。1988年,比利时数学家Daubechies证明了紧支撑正交标准小波基的存在性,并使离散小波分析成为可能。1989年,Mallat提出多分辨率概念,建立了小波理论的统一体系,并提出二进小波变换的快速算法(Mallat算法),使小波在许多领域得到了广泛应用。

采用小波变换作奇异性检测是Grossman在作图像边缘检测时首先采用的,Mallat等人发展并完善了小波奇异性检测的理论,成为以后各种小波奇异性检测应用的基石。传统的奇异性检测方法是基于Fourier变换,它只能反映信号的整体奇异性,而对信号的局部奇异性无法描述,而基于小波变换的奇异性检测方法可以实现对信号局部奇异性的刻划。因此,自该方法提出以来,便获得了广泛的应用。

2.3.2小波变换方法

小波分析方法是一种时间和频率窗口大小(即窗口面积)固定但形状可变的时频局域化分析方法,即:在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率;小波分析的目的是——既见到森林(信号的概貌),又要看到树木(信号的细节),因此被誉为“数学显微镜”。

通常,小波变换可被定义为如下形式:

image

此时,f(t)的小波变换 是a和b的函数,其中,b是时移因子,a是尺度伸缩因子, 称为母小波, 是母小波经位移和伸缩后所产生的一组函数,称为小波基函数,故f(t)的小波变换可视为f(t)与一组小波基的内积。

2.3.3小波变换的模极大值和多分辨率分析

原始信号可以按一定的尺度被分解成几个具有不同分辨率的分量,而且由这些分量能够不失真地重构原始信号。多分辨分析理论为人们讨论信号的局部信息提供了一个直观的框架,即认为任何一个信号都可以分解为两部分:低频(主体信息)和高频(细节纹理)。为了将信号的低频与高频部分分开处理,Mallat提出了信号的多分辨分解与重构的算法,其地位在小波分析中相当于快速Fourier算法在经典Fourier分析中的地位。

2.3.4奇异性的数学描述

一般情况下,信号的奇异性通常分为两种:一种是信号在某一时刻其幅值发生变化,使得信号出现非连续的跳跃,被称为第一类间断点;另一种是信号外观光滑,但信号的一阶导数不连续且发生突变,被称为第二类间断点。通常而言,人们用Lipschitz指数α来描述函数的局部奇异性。Lipschitz指数给出了信号f(t)在x0处光滑性的精确信息:α越大,则函数越光滑,α越小,说明函数奇异性越大。

2.3.5信号奇异性的小波检测

根据一致Lipschitz指数的性质,当我们采用二进小波变换时,
image

上式将小波变换的尺度特征i与李氏指数α联系起来,并给出小波变换的对数值随尺度特征的变化规律:当α>0时,小波变换的极大值将随尺度特征i的增大而增大,当α<0时,小波变换的极大值将随尺度特征i的增大而减小,当α=0时,小波变换的极大值将不随尺度特征i的改变而改变。同时,若在两个连续的二进尺度i和i+1上均取等式,则

image

此时,该式描述了信号f(t)在奇异点t0领域内能量的变化趋势:若 α>0,信号在奇异点t0的某个领域内自2i尺度至2i+1尺度能量呈增加趋势,若 α<0,信号在奇异点t0的某个领域内自2i尺度至2i+1尺度呈衰减趋势。

利用小波变换分析信号的奇异点时,主要是利用一般信号与突变信号能量分布的不同频带为奇异点定位,利用能量在频带内的不同分配情况来区分奇异点类型(关注私募工场ID:Funds-Works,加私募工场老板娘微信guo5_guoguo)。因而,利用小波方法检测信号奇异点的一般方法是:对信号进行多尺度分析,在信号出现突变时,其小波变换后的系数具有模量极大值,从而可以通过模量极大值的确定来检测奇异点的位置。

小波奇异值监测举例
我们以2005年2月1日为数据起始点,检测2007年至2008年间黄金与原油的协整关系。通过使用小波分析的奇异值检测方法对收益率回归后的残差序列进行监测,我们发现自2008年9月22日(图中t=900)起,黄金与原油间协整关系发生突变。

image

通过查找相关日历,我们找到了在历史上与之相对应的突发事件:2008年9月15日,雷曼兄弟宣布申请破产保护,而美联储在2008年9月16日至9月18日举行的会议(FOMC)上,对该事件并无反应,导致自9月中旬开始,黄金与原油间保持1年多时间的弱平衡被打破,原油在此后一个季度内出现暴跌,而黄金在此后短短2个月内出现宽幅震荡。

同时,这也在伦敦金与WTI原油间的协整残差序列中得到了印证:自2008年9月22日(图中t=600)起,伦敦金和WTI原油间均值回复规律突然被打破。

image

2.4非协整情形

若两类资产间不满足协整关系,基于协整的残差序列均值回归策略将不再可行,此时,我们将引入相对强弱指标来制作大类资产轮动策略:
设a、b为两类资产, Ra、Rb 为过去一段时间资产a、b的累计收益,σ为资产a、b收益差的波动率值,则相对强弱指标表示为

image

其中,β为资产a、b日收益率序列的回归系数。实际上,相对强弱指标 描述了两类资产间的相对风险收益状况;同时,由于相对强弱指标RY具有较为良好的均值回复特性,且与两类资产间的累计收益差具有较好的负相关关系,因此,通常将其作为资产轮动策略的建模依据。

WTI原油Vs伦敦金轮动策略

(1)数据选取:我们选取2010年1月2日至2016年6月30日WTI原油与伦敦金的日收盘价数据;

(2)策略实施:
对WTI原油与伦敦金对数价格序列作协整检验:
1)当两者间满足协整关系时,通过傅里叶谱分析,确定残差序列的周期,并藉此确定计算波动率的计算公式,并依据波动率值倍数确定相应的多空开平仓信号及位置;
2)依据小波分析的模极大值原理检测两类资产的收益率残差序列是否存在突变点,当发现突变点时,即停止原先的基于残差序列的均值回复策略;
3)当WTI原油与伦敦金的对数价格序列不协整时,考虑不进行操作或制定基于相对强弱指标的均值回复多空策略。

(3)策略结论:
依据WTI原油与伦敦金不协整时是否实施轮动策略,我们将策略区分为:策略1(WTI原油与伦敦金不协整时暂停实施轮动策略)和策略2(WTI原油与伦敦金不协整时,实施基于相对强弱指标的均值回复策略)两种。

image

由上表可见,对于策略1,其年化收益达18.04%,最大回撤-11.24%;而由于2010年至2016年间伦敦金与WTI原油不协整时间所占比例相应较小,因此,当两者间不协整时,通过基于相对强弱指标的轮动策略可有效提高年化收益,同时,从Sharp率及收益回撤比的角度看,策略2亦具备一定优势。

image

考察WTI原油与伦敦金轮动策略收益率曲线图,不难发现,相比于策略1,策略2中有相当比例收益来源于黄金和原油不协整时间段,即:当两类资产不协整时,通过相对强弱指标构建的轮动策略可提供较为明显的收益。

同时,深入考察当两类资产满足协整关系时,使用不同数据长度计算波动率值 ,并进而在此波动率值基础上制定均值回复策略的效果;不难发现,相比于使用固定的数据长度来计算波动率值,通过使用谱分析方法确定数据长度(关注私募工场ID:Funds-Works,加私募工场老板娘微信guo5_guoguo),并在此基础上确定均值回复策略的效果更佳。由此可见,使用谱分析方法主动寻找合适的数据长度方法在收益、稳定性两方面能给策略带来更好的效果。

不同期货品种间的套利策略应用

我们将该策略应用于股指期货沪深300合约和股指期货中证500合约(IF主力合约与IC主力合约)间套利,仅以日频换仓为例,发现亦可取得不俗效果。

(1)数据选取:我们选取2015年6月30日至2016年8月31日间IF、IC当月主力合约的日收盘价、结算价数据;
(2)模型假设:假设总资金为1000万,期货开平仓手续费万分之二,保证金比例45%,开平仓交易滑点0.2点,期货仓位60%,若信号显示继续持有,则于交割日前一天实施换月,当出现开平仓信号后以当日收盘价开、平仓;
(3)策略表现:

image

自2015年6月30日至2016年8月31日,IF与IC主力合约间的跨品种套利的年化收益为33.50%,其中,该策略在2015年(2015年6月30日至2015年12月31日)的年化收益达55.70%,最大回撤7.34%,2016年(2016年1月4日至2016年8月31日)的年化收益和最大回撤分别下滑至18.81%、4.12%。

image