漫谈基础金融量化分析技术


#1

出自笔者的一段随口的谈话整理,主要是出于科普的目的,重要的框架性的思维。具体的技术本协会提供相关技术性书籍(PS主要是英文材料,没办法,国内的翻译行业发展似乎不够快)

金融业的核心业务是投融资活动,或者说金融机构本质上扮演的是中介的角色。当然,金融业的从业人员总是不遗余力的试图向世人说明,他们这个“中介”是必不可少的。于是就引出了一个问题,为什么有些行业可以做到“没有中间商赚差价”而有些行业就非要有中介来进行撮合交易不可呢?简单的考察可以发现,那些没有中间商赚差价的市场,其交易品的基本特征是信息对称性极高,无论是信息的独立性、及时性、准确性、完整性等方面都有着较好的保障。例如市面上出售的手机,你基本上不需要知道这个手机的牌子,只需要查阅手机的CPU、GPU、内存、存储空间、屏幕类型与分辨率、相机像素等参数就可以决定了,因为这些模块都是高度标准化的,负责“拼装”的手机厂商只需要稍微做好品控和适配就可以了。反过来,这也是为什么金融领域的中介不可或缺,最主要的原因是金融市场上的大量交易,并不满足如上提到的信息对称性要求,甚至可以说这里到处都是陷阱,且很多是那种“分分钟百万上下”的陷阱,面对这样的市场,你敢说你不需要金融中介服务?当然了,还有一个原因是,部分金融服务是被金融中介“垄断”起来的,他们已经搭建好了金融基础设施,只有他们才有能力完成相应的服务。

随着金融业的发展,金融业的大量基础业务已经完成标准化,收费也已经很低了。比如商业银行所提供的大部分基础服务——商业银行在世界各国都是金融系统的主流和基础服务提供商。没有了商业银行体系,存款、贷款、货币代收代付、资产代买代卖等基础业务都难以想象。早些年此类基础金融业务的手续费还相当高,不过随着银行间的联网体系发展、大部分地区经济活动活跃、资本匮乏的现象有了极大缓解,银行在此类基础业务上的收费也越来越小,所以银行也在积极的拓展更加“非标准化”的表外业务。非标准化对于中介来说是一个极大的好处,因为这才是他们存在的意义——设想N年后,前面提到的标准化业务可能都会由机器人自动完成,服务费甚至会接近免费;而真正带来丰厚利润的永远是那些非标准化的部分,从另一个角度说,所谓金融业的发展,本质上就是金融业的精英们逐渐攻克“非标准”的业务并将其转化为“标准”业务的过程。

既然说到了非标准,那么就需要进一步谈谈金融界比较公认的最“非标准”的部分——投资。投资在过去是一门“艺术”,算得上是最“非标准”的东西了。既然投资管理人都是“艺术家”,那么当然可以收更高的费用了。早期的投资活动也的确是严重的非标准过程,期间充满了市场操纵、内幕消息等活动,属于典型的“宫斗剧”,而缺少这些资源的人只好搞“投机”,并努力宣称自己得到某种神学启示(比如观星学)或者伪装他们也可以持有内幕消息。即使到了今天,这些可以提供市场操纵、内幕消息的人,也依然是价格不菲的。这种严重的市场不公平、不有效的问题一直持续到1929年资本主义世界经济大危机,以美国为代表的发达资本主义国家才下定决心研发一整套市场监管机制,这个斗智斗勇的过程持续到2007年再次证明了监管永远追不上市场创新,因此2007年经济危机之后,美国又一次开启了大幅度的市场监管体制大跃进。整体而言,美国的市场监管者也是足够聪明的,他们基本上保障了市场的有效性,因此理论界才有了一个所谓市场有效假说(EMH),我是不相信在1929年之前有人敢假设市场是有效的。也只有在这种市场有效的基础的条件下,金融世界才会向着标准化转型。设想,在一个毫无规则的丛林世界里,你想搞标准化?分分钟就会死的很惨好不好!因此我们不禁要问,中国封建王朝两千年,皇帝们看了这么多年的宫斗戏码,为什么不考虑研发一套有效的宫廷监管体系呢?难道是因为都是自己的老婆,不好意思下手?

回过头来,既然说到了将“投资活动”从艺术变成标准化的技术,那就要从底层开始做起,逐步标准化起来。用什么工具来标准化呢?主要是借助两个方面的工具,数学和流程化。数学不难理解,毕竟要“标准化”怎么能少得了“量化”,所谓流程化,指的是将投资决策的流程标准化。例如对于项目投资,需要安排项目多个层面的考察,安排尽职调查,第三方出具各种证明,投资过程也要分阶段投资,且不定期提交监控报告等。流程化不是本文讨论的重点,让我们聚焦到量化上来。

投资活动中的量化,主要依赖的数学知识是随机数学,包括概率论(测度论)、数理统计、随机过程等领域。其实绝大部分的标准化,用到的都是相当基本的均值、标准差、偏度、峰度、单侧标准差等基本统计量,以及回归分析下的基本常见变量例如斜率、截距等。最基础的量化技术包括收益的量化、风险的量化、回归分析以及群体对比分析四大部分。

收益的量化:资产的单期简单收益定义为R = (End Value)/(Start Value) – 1, 也可以用对数差表示。此外,单个资产在一段时间的现金流分析可以计算其内部收益率(IRR),在IRR的基础上,Dietz定义了IRR的简化计算方法(本质上是IRR的泰勒一阶近似)。随后人们发展了ICAA方法,进一步优化了Dietz的度量方法。在单个资产的收益率定义的基础上,人们又发展了针对多期、多资产的加权平均收益,权重的选择方法也是多种多样的。至此,收益的量化方法已经有了相当丰硕的成果,满足了多种多样的收益量化的要求(详细的计算方法细节,欢迎参加本协会学习讨论,毕竟真的展开讲,又是一节课)。

风险的量化:如果说人们对收益的量化还有着相对统一的认知,人们对风险的认知则存在着极大的分歧,实际上现代投资理论诞生的数十年来,“新的风险因子的发现与定量度量”的问题一直都是金融市场研究的前沿领域。在Fama French开拓性的研究之后,按照他们的方法,目前已经确认发现的风险因子已经有大概上千个了吧,虽然目前比较流行的还是三因子和五因子模型。我认为最重要的原因是当前人们对于风险的定义还太一般(我们将风险定义为“不确定性”,这个词包含的内容实在太广),其次发现和确认风险因子的研究范式也可能有问题,我认为以后应该会研发出来某种统一的整合性的描述方式。为了管理如此多的风险因子,人们通常将其进行分类,通常的分类方式例如市场风险、信用风险、流动性风险、操作风险、法律风险、会计风险等,所有这些风险又可以进一步细分,然后每一种细分风险都可以建模计算,这也是为什么风险管理学科如此复杂。说了这么多,总要给几个模型吧。以市场风险中的收益率风险为例,最简单的度量收益率风险的指标是一段时间内收益的方差与标准差,当然这两个指标之所以被广泛引用是基于一个基本假设——资产的收益是一个正态变量(或分布接近正态)——毕竟对于一个非正态分布,说标准差似乎并没有太大的意义。对于接近正态的变量,还要进一步给出偏度、峰度等指标。另一个常用的方法是在针对风险因子的回归模型中的回归系数β,这是从属于回归分析的量化方法。对于那些严重偏离正态分布的风险,人们往往更关注其一侧的风险——例如Downside Risk,该风险通常用尾部风险VaR等指标来度量(同样欢迎参加本协会学习讨论)。

在量化了收益与风险之后,进一步衍生出来一系列的结合了收益与风险的指标。例如Sharpe Ratio就是单位标准差获得的超额收益;Treynor Ratio则是单位β获得的超额收益;Appraisal Ratio则是用单位σ获得的Jensen Alpha来表示;Calmar Ratio定义为单位最大回撤风险上获得的收益;Sortino Ratio定义为单位Downside Deviation上获得的超目标的收益。

回归分析与前面的基于统计的计算方法都不一样。在常见的收益对风险因子的线性回归模型中,Beta表示资产在对应风险因子上承担的风险,Alpha表示策略获得的绝对收益,回归的共线性问题来自于风险因子之间的相关性等。

最后,还有一种常见的量化方法,群体对比分析,也就是在各类报告中常见的“在同类公司中排名x%”的表述。这种排名往往是为了突出“能力”因素,因此必须排除掉大盘的影响。前面的绝对收益、绝对风险等度量方法都没有很好的达到这个目标。当然,这种分析的前提是——分类必须准确,同时分类的各个分组中需要有足够多的观测,否则假如一组中只有2个人,你算是在50%还是100%呢?

以上,本文介绍了基础的四大类金融量化分析技术——收益的量化、风险的量化、回归分析以及群体对比分析。“基础”,是因为一方面这些技术很常用,金融从业者们需要耳熟能详;另一方面也是这部分技术所用到的数学知识很基础,只需要有初步的概率论与数理统计知识就可以掌握。日后我们会进一步给大家介绍更高级的金融量化技术,欢迎持续关注本协会的相关活动。