《多因子模型在固定收益前瞻性市场风险监控中的研究与实践(一).docx》由会员分享,可在线阅读,更多相关《多因子模型在固定收益前瞻性市场风险监控中的研究与实践(一).docx(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多因子模型在固定收益前瞻性市场风险监控中的研究与实践(一)摘要:自Markowitz(1952)提出现代投资组合理论(MPT)以来,分散化投资成为组合构建的重要思想,但在应用于固收组合的构建时,若直接对所有债券头寸应用均值方差分析法会出现计算复杂度过高,结果对输入参数过于敏感等问题,极端情况下,甚至出现波动率为0但预期收益率为正的“无风险套利”组合。其本质原因,是参数估计的目标协方差矩阵维度过大,历史数据相对不足。Stephen Ross(1976)提出多因子模型(APT),固收组合收益预期可以由一系列系统性风险因子的线性组合来解释。从APT出发,结合海外最新实践,本课题对人民币债券构建了利率
2、、利差、套息三大类收益风险因子,并通过损益归因方式验证了其合理性。多因子体系解决了组合构建中的参数估计问题,形成分散化投资的可行方法论。在对因子协方差矩阵的估计中,本课题从准确性和稳定性两个角度对各种波动率预测模型和各类因子相关性矩阵估计方法的回测结果给出了评价。最终为固收组合管理全流程提供了模型化解决方案,包括:组合构建与优化,组合风险分析,组合业绩归因和组合压力测试。在将上述所有模型方法论转化为实际可用工具的工程化实践过程中,产生了模型实施与落地的大量经验积累和实践创新,本课题也一并进行了归纳总结。关键词:多因子模型、前瞻性风险计量、固收组合管理、风险管理、模型工程化。第一章 绪论第一节
3、研究背景和意义一、研究背景据波士顿咨询研究显示,全球资产管理行业从新冠疫情中恢复,发展势头强劲,2020年末达到103万亿美元。其中,中国大陆是全球第二大资产管理市场,仅次于美国。2020年中国资产管理规模增长10%,总量约达9.4万亿美元。据中国保险资产管理业协会统计,作为我国资管行业的重要组成部分,保险资管在2021年9月的资金运用余额达224426亿元人民币,其中银行存款26059亿元,占比11.63%;债券87806亿元,占比39.12%;股票和证券投资基金27293亿元,占比12.16%,其他投资83232亿元,占比37.09%。债券投资在保险资管投资中占据了重要地位。另一方面,随着
4、我国利率市场化的推进,利率对经济环境变化的敏感性增加,加大了债券市场的波动和市场风险。无论是国际金融市场利率上升或下降,还是各种市场经济变化,甚或是银行客户变更还贷或取款时间等,都可能对利率产生一定程度的影响。关于规范金融机构资产管理业务的指导意见进一步指出:我国资产管理业务在快速发展的同时,存在“部分业务发展不规范、多层嵌套、刚性兑付、规避金融监管和宏观调控等问题”,要求“金融机构对资产管理产品应当实行净值化管理,净值生成应当符合企业会计准则规定,及时反映基础金融资产的收益和风险,由托管机构进行核算并定期提供报告,由外部审计机构进行审计确认,被审计金融机构应当披露审计结果并同时报送金融管理部
5、门”。债券组合从摊余法向净值化管理的转变要求债券投资者必须能够在合理定价债券产品的基础上,准确的计量和控制各类风险敞口,从而有效管理净值波动的风险。二、研究意义对于金融市场而言,某种金融产品要想在市场中存在并且稳定和有序的交易,一个重要的前提是市场必须能科学地对该金融产品进行定价,同时还要让定价和风险模型在配套信息化系统中有效地实施部署,以为其市场运行提供服务。作为金融产品中对计量模型要求较高的债券产品和复杂金融衍生品,其定价和风险计量更是离不开作为金融市场基础设施的市场风险系统。外资厂商的市场风险系统如Aladdin,RiskMetrics,Algo等具有多年的发展历史和项目实施经验,不论在
6、金融模型还是技术方案上,相对于国内同类产品而言客观上都具有领先性与某种程度的不可替代性。因此,如何打造中国本土具有先进性、影响力和竞争力的市场风险乃至投资分析系统,打破外资厂商的垄断,受到了空前的关注。特别是,在中美大国竞争的背景下,中国近年在芯片和基础研究的诸多领域不同程度地遇到了“卡脖子”的问题,我们不禁要问,中国金融行业是否存在类似的问题?中国本土金融机构是否具备了自主制造金融领域的“芯片”的能力?由此可见,当下对金融领域复杂金融模型和先进技术方案的研究探索,具有空前的必要性和紧迫性。第二节 研究方法和内容一、研究方法针对多因子模型在固定收益前瞻性市场风险监控中的研究与实践,本课题从如下
7、四个方面展开:固收多因子体系,前瞻性风险计量,组合管理中的运用,模型实施与落地。其中,固收因子体系解决了Markowitz现代投资组合理论应用于实践中遇到的计算复杂度、参数敏感性以及最重要的模型与市场相结合等问题;前瞻性风险计量用于估计因子协方差矩阵;固收因子体系与前瞻性风险计量二者相结合,解决了固收组合风险计量问题,形成了组合分散化投资的可行方法论。组合管理中的运用介绍了该方法论在固收组合管理各个环节的实际应用,模型实施与落地则介绍了该方法论在平安资管KYZ平台落地实施、从方法变为工具过程中的工程实践。(一)固收多因子体系本课题基于现代投资组合理论(Modern Portfolio Theo
8、ry, MPT)和套利定价理论(Arbitrage Pricing Theory, APT),结合国际先进经验和中国市场实践,构建了固收多因子体系。1.现代投资组合理论(MPT)早期人们不能清楚的认识到投资的“风险”概念,投资被认为是简单地持有一系列“好”的资产的活动。Harry M. Markowitz(1952)提出现代投资组合理论(MPT),其核心思想是从收益与风险两个维度去综合衡量一笔投资,并使用概率统计的数学工具来分析投资问题:用随机变量R代表一笔投资的收益,用其期望E(R) 衡量投资收益,方差D(R) 衡量投资风险。有效投资组合定义为在特定的风险水平D(R)上,最大化期望收益E(R
9、)的组合,即所谓的均值方差(Mean-Variance)分析法。所有有效投资组合的集合构成马科维茨有效前沿(Markowitz Efficient Frontier)。基于Markowitz投资组合理论,可通过分散化(Diversification)投资获得更有效的投资组合,当组合中资产个数足够多时,投资组合的方差趋近于证券间的平均协方差。Markowitz模型在投资组合理论上具有重大意义,但在应用于实践中时会遇到各种问题。其中,最显而易见的问题是计算繁琐,当资产个数n=50时,需要:n=50个期望收益率的估计量,n=50个方差的估计量,n(n-1)/2=1225个协方差的估计量,总共1325
10、个估计量。当n=3000时,需要450万个估计量!另外,模型应用层面存在更深层次问题。Michaud(1989)完整地分析了在使用Markowitz理论时遇到的问题,主要有以下几点:首先,模型的输出对输入参数非常敏感,经常会给高收益产品过高权重,低收益产品过低权重。这样会导致非正常结果出现。其次,模型不关心资产市值,这样小市值高收益的资产会得到更高权重,也会带来问题。2. 套利定价理论(APT)James Tobin(1958)提出两步投资原则:投资者先确定最优风险资产,再根据自身风险偏好,确定风险资产和无风险资产的投资比例。并指出,在均值方差分析法框架下,对所有风险偏好的投资者而言,存在相同
11、的最优风险资产市场组合,对股票市场而言就是市场指数。William F. Sharpe(1964)将单个股票的系统风险(systematic risk)定义为股票与市场组合价格的协方差,用此协方差除以股票自身方差,得到的系数定义为系数,用系数来度量股票系统性风险大小,从而提出CAPM(Capital Asset Pricing Model)模型:其中,Ri代表股票投资收益,Rm是市场组合投资收益,rf是无风险资产投资收益。从经济意义上理解,系统风险是指整个市场的波动,主要是宏观经济、政治以及社会环境等因素的变化所造成,系统风险不可通过分散化投资避免。与之相对应,非系统风险/异质风险/个别风险(
12、non-systematic risk / idiosyncratic risk / unique risk)是由公司的异质因素所引起,如公司的经营状况和财务状况等。异质风险可以通过分散化投资消除。CAPM模型假设完全竞争市场,无税收和交易成本,所有投资者具有相同的无风险利率、投资期以及对资产的期望收益、标准差、协方差。其假设较强,应用范围有限。CAPM模型本身是一个单因子模型,是该模型的唯一风险因子系数。单因子模型假设证券的收益率受到一个系统因子的影响(比如宏观因素的加总),并假设除此以外的不确定性是公司特有的。单因子模型在现实投资活动中,也受到各种挑战,其中最著名的是关于小盘股相对大盘股能
13、产生超额收益的讨论。Stephen Ross(1976)基于一价定律和资本市场无套利的假设,提出套利定价理论APT,其普适性更强,无需市场组合的前提假设,就可以得出“期望收益率系数”关系。APT且并未对投资者的风险偏好做出规定,CAPM假定了投资者对待风险的类型,即风险规避的投资者。同时,APT可以扩展为多因子模型,即所有资产(如市场上所有的个债)的未来收益可以归结为由一系列的系统因子驱动:3. 固收因子体系构建有效的因子体系需能同时解释大量资产的未来收益,同时要直观、好用。基于多因子的债券风险模型在国外已有成熟的实践。雷曼兄弟的Dynkin和Hyman(Fabozzi & Markowitz
14、,2002)详细论述了基于多因子的债券风险模型。MSCI Barra 的Breger(Fabozzi 2003)也详细论述了MSCI的固定收益风险风险模型。知名机构PIMCO的体系中,组合的风险管理是多方面的:既包括多因子结构化风险模型,也包括常规的个券集中度约束、压力测试、跟踪误差控制等。本课题将人民币债券和固收组合的因子定义为利率、利差、套息三大类因子,每类因子有其相关的一系列因子指标。在利率风险因子中,除了久期和凸性,更强调关键久期因子的运用;在信用风险因子中,除了利差久期外,重点实施行业调整后利差久期;套息因子指如果没有市场变化,在未来的一定时期的静态持有收益。从回测债券历史收益的多因
15、子归因解释度的角度上,本课题验证了所构建多因子体系的有效性。借助基于APT的固收多因子体系,先分析所有个券在各因子上的风险暴露程度,再在组合层面汇总,结合因子间的协方差矩阵(前瞻性波动率*相关性矩阵),可得投资组合风险测量公式:上述基于因子体系的组合波动率模型大大简化了均值方差分析中的估计量和计算量,同时较好的解决了在组合模型应用层面的参数敏感性等实际问题,形成了实现投资分散化的可行方法论。(二)前瞻性组合风险度量在多因子框架下,测算投资组合风险(即组合波动率)需对因子间的协方差矩阵进行合理估计。金融资产的收益序列通常具有斜偏、厚尾、尖峰等非正态属性,因此有研究采用更加复杂的数理模型,如Cop
16、ula、机器学习等方法。Sklar(1959)提出了Copula理论。Copula这个单词源于拉丁语,意为“连接”,能将每个变量自身的边缘分布和这些变量之间的联合分布连接起来,因此Copula函数也被称为“连接函数”。假设X1,X2,Xd是d个随机变量,其边缘分布分别为F(X1),F (X2) ,,F(Xd),且d维的联合分布为F,则存在F(X1,.,Xd)=C(F1(X1),.Fd(Xd)。也就是说,分别给定一个边缘分布和一个Copula函数,我们就可以构建一个联合分布。而协方差矩阵是因子之间多维联合分布的数字特征。本课题吸取借鉴了Copula模型的思想,将因子风险模型构建分为两步:第一步为
17、度量单个因子的风险水平,即预测各个因子的边际分布,常用方法包括简单移动平均法、指数加权移动平均法、衍生品隐含波动率法、Garch法等;第二步为预测因子之间风险传导路径,即连接函数。本课题实现了学界业界常用的因子前瞻性风险指标计量方法,并通过回测客观比较在固定收益因子上的分布拟合效力,选择在不同市场环境下适当的方法。1.边缘分布简单移动平均法(SMA)是估计因子波动率的最简单的方式,即用样本方差作为因子方差的估计值。SMA概念直观,计算简单,不需要假定因子的统计分布或者输入参数,能够有效避免模型风险。但SMA无法反映金融时间序列时变性,且对每一天的方差被赋予了相同的权重,但实际中越贴近当前观察期
18、的方差对预测值的影响越大。在指数加权移动平均模型(EWMA)下,当前的方差是前一期方差和前一期收益率平方的加权平均,且加权系数呈指数式衰减。EWMA给近期的收益率赋予的权重要高于远期,更能反映近期波动率变化的趋势,但无法实现波动率的均值回复。Engle(1982)提出了ARCH模型以分析时间序列的异方差性,解决了传统的计量经济学假定时间序列变量的方差恒定,不能反映实际中金融时序的波动率时变和聚集的问题。Bollerslev(1986)提出GARCH模型,即广义自回归条件异方差模型。GARCH模型将ARMA模型应用在了时间序列的方差上,方差由一个自回归项和一个移动平均项构成。GARCH(p,q)
19、模型下的条件异方差满足下式,其中,为条件方差,Wt为独立同分布的随机变量:但由于GARCH(p,q)假定条件方差是滞后的残差平方的线性函数,正负价格变化对条件方差的影响是对称的,无法解释实务中利空消息出现伴随波动的增加,利好消息出现波动趋于减小的现象。另外,GARCH(p,q)模型为了保证条件方差的非负性,等式右边所有系数均大于零,使得GARCH模型可能随着任意滞后项的变化而剧烈震荡。故本课题采取Bootstrap的方法对波动率增加上下限的限制,以防止波动率过度波动,后文中简化为VolonVol的设置。具体方法为:首先在原始样本中用重抽样的方式得到Bootstrap样本,计算每一个Bootst
20、rap样本的波动率,然后计算这组波动率的波动率以及置信区间,最后结合该置信区间对单元GARCH的估计结果进行修正。衍生品隐含波动率法将期权市场价格及波动率以外的4个参数代入BS公式,反解波动率其中,V0为看涨期权的期初价值;S0为标的股票的期初价格;K为期权的执行价格;r为连续复利的年化无风险利率;T为期权有效期限;为波动率;N()为正态分布的累计概率分布函数。2. 连接函数连接函数的简单移动平均法SMA与边缘函数中的SMA相似,用过去一段时间的两个时间序列和的样本相关系数作为因子间相关系数的估计值。Bollerslev(1988)提出Vector Garch model,即多元GARCH模型
21、。对协方差矩阵中的每个元素建立一元GARCH模型,但在定义上难以保证估计量的正定性。Bollerslev(1990)提出的常相关多元GARCH模型(CCC)和Engle(2003)优化的动态相关系数模型(DCC),对每个资产都建立了一个一元GARCH模型,同时对相关系数建立了一个多元GARCH模型,大大减少了估计参数。假设有N个资产,其未知参数的总数为N(p+q)+N(N+1)/2。Engle和Kroner(1995)提出的BEKK模型虽相比VEC模型大大减少了所需参数但依旧太多。Ledoit-Wolf(2004)将压缩矩阵估计法应用在了方差协方差矩阵的估计中,先后提出了最为经典的三种线性压缩
22、目标。其核心思想为:S是利用样本估计出的协方差矩阵,为真实协方差矩阵的无偏估计,但估计误差大;F是压缩目标,通过多因子模型等结构化方法估计得到,估计误差较小;是压缩强度,为0-1之间的常数。简单来说,压缩法通过在F和S中间寻找一个平衡点,用Frobenius距离来衡量并最小化组合方差协方差矩阵与真实矩阵之间的距离。压缩估计方法推导复杂,但在实际应用中模型参数相对较少,输入简单。且压缩目标F的正定和压缩强度的非负性能很容易保证最终压缩得到的矩阵是正定的。(三)组合管理中的运用固收多因子体系及前瞻性风险模型可运用于组合管理的投前、投中、投后的全过程,包括:组合构建及优化,组合风险分析,组合业绩归因
23、和组合压力测试。其中,组合业绩归因过程在第二章的第三节对固收因子体系的验证过程中进行详细展示。另外三个应用场景在第四章详述。(四)模型实施与落地理论方法论在实际数据中得到回测验证之后,将进入工程部署阶段。这部分涉及到大数据量因子库的计算、客户持仓数据的ETL处理、模型代码的工程化等环节。在处理海量公开市场数据、加速模型计算效率、提升系统并发访问性能等关键性问题上,我们也进行了多次的试错和尝试,最终形成了一套高效、稳定地模型工程化方案。目前已在平安资管债券一体化平台KYZ系统中上线,以7*24小时的实时服务方式持续赋能平安集团内外部投资、风控条线用户。二、 研究内容本文介绍了平安资管KYZ平台开
24、发过程中固收多因子体系的构建以及利用前瞻性风险计量模型对因子协方差模型的研究及其在KYZ平台上落地过程中的技术实践方案。其中,第一章是绪论,介绍了研究背景和意义,研究方法和内容,创新与难点。研究背景和意义方面,指出当今金融市场大环境下,中国本土市场风险类工具的研发具有空前的必要性和紧迫性;研究方法和内容方面,概述了本课题的主要内容和文章结构安排,对涉及到的主要参考文献的前人的研究成果进行了综述小结。第二章介绍了KYZ固收多因子体系。本章从组合构建的角度,介绍了固收多因子体系的必要性;对固收多因子体系构建过程的介绍,侧重指出了其主要构建逻辑和假设,而不是简单给出因子计算公式;最后,从组合业绩归因
25、的角度,验证了多因子体系的合理性和准确性。第三章是本文的核心,介绍了KYZ前瞻性风险模型的构建与验证过程。主要是实现和回测了海外主要波动率和相关系数的预测模型,从准确性和稳定性角度,对回测结果进行了讨论分析。第四章介绍了模型在固收组合管理中的具体应用。在组合构建和优化方面,结合遗传算法,构建了多目标优化MOPO组合构建工具;在风险分析方面,模型给出了组合波动率,参数法VaR、CVaR和跟踪误差的估计方法;在压力测试方面,模型提供了估计因子风险传导的因子协方差矩阵工具。第五章介绍了金融模型在KYZ平台落地的技术实践方案。对KYZ系统的架构和主要技术实用场景的实现方案进行了较为全面的介绍。第六章是
26、总结、建议以及对未来的展望。总结了本课题所做的工作,给出了加强对金融机构端金融科技产品研发支持力度的政策建议,同时对未来金融市场发展和金融科技在金融市场领域发挥越来越重要作用的前景进行了展望。第三节 研究创新与难点一、 研究创新(一)风险指标构建客观科学本课题运用国内外前沿的数理方法科学定量分析固定收益中前瞻性风险指标的建立和度量,同时依照固定收益产品和国内市场的数据特点进行方法迭代。指标构建客观科学。(二)因子划分结合国内实际国内多因子法在股票行业应用较多,在固收领域运用还处于初期,考虑到固定收益在保险资管行业占比较高,具有研究价值。因此在结合国外成熟经验的同时,本课题在因子的提炼和划分上密
27、切结合了国内实务背景。(三)综合考虑工程化难度除了理论研究和数据回测之外,本课题希望最终完成工程化并实际落地,因此在考虑模型效果的同时也平衡工程难度。二、 研究难点(一)国内固收市场的特殊性,难以直接沿用国外经验其一,国内债券市场还处在发展中,流动性较高的活跃券在市场上占比较少,而流动性水平较低的券定价干扰因素较多。其二,国内打破刚兑时间较短,市场对于信用风险的反应还在培育中,因此需要对国内违约状况有充分了解。其三,中国衍生品市场还在发展中,因此国外隐含波动率模型在国内效果有待考察。(二)风险指标无法直接观测风险水平在实际中无法直接观测,因此相对于收益率的预测验证而言,前瞻性风险指标的验证相对困难。(三)金融数据的特殊属性金融数据一般具有非对称、尖峰厚尾等非正态性属性,并且在经济环境、政策指导的变化下,金融数据的分布一般具有时变性,因此建模难度较大。(四)工程化计算中量和速度的平衡计算多因子模型和风险模型一般涉及大量数据和复杂模型计算,而模型结果对于投资经理和风控经理有较强的时效性要求,因此在工程实现上有较大难度。23