《机器学习系列报告之五:锦上添花机器学习算法助力组合优化.docx》由会员分享,可在线阅读,更多相关《机器学习系列报告之五:锦上添花机器学习算法助力组合优化.docx(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1、主流组合优化方法51.1 、线性优化:个股集中度高51.2 、二次规划6121、“因子一收益”线性假设下的二次规划组合 71.2.2、 风格因子数据估计协方差矩阵的二次规划组合82、配置型组合优化102.1 借鉴资产配置模型的开展方向 102.2 、运用机器学习算法来克服难点 11221、坐标下降算法12222、交替方向乘子算法133、配置型优化下指数增强效果133.1 、中证500指数增强143.2 沪深300指数增强164、总结185、风险提示19附录20A.风格因子构造方式20B.风险预算优化问题转换 21C.标准差风险测度下ADMM算法:x更新与y更新的具体方法 22大类资产配置上
2、没什么问题,但股票组合的资产数量成百上千,优 化效率急剧下降。2.不像在大类资产配置,优化问题中基本没什么约束条件,当我们进 行组合优化时,普遍会有个股权重约束、风格约束、行业约束等各 类约束条件。这些更为苛刻的约束条件,使得优化问题更为复杂化。2.2、运用机器学习算法来克服难点在上述讨论中,我们知道如果想对股票组合直接套用风险预算模型并不现 实。该小节将介绍一些机器学习算法,并阐述如何借用它们来克服上述难点。首先我们定义问题,不失一般性,我们的风险预算股票组合要满足以下数 学表达:#(11)Risk(w) lTw = 1 w e c其中,。为所有约束条件的集合。实际上,如果上述问题在没有约束
3、。时的解w 那么式(11)所描述 的问题是无解的。因此在有约束时,我们的目标应该改为风险贡献占比尽可 能地接近预设的风险预算。此时,式(10)的描述仍然成立,只是有了更多 的约束条件。nMinimizew Risk(w) 2 RBt * In wi i=l5. t. w E fl#(12)或者等价地,写为:nMinimizew (w;A) = Risk(w) 4* In牝 + 1q(w)#(13)i=l#(14)其中,lc(w)是指示函数:lc(w)=在式(13)中,对于任意大于o的参数九 优化问题都有对应的解w(a)。 我们对于;i选取,那么选择使得wQ)的和为1的a值。该值我们可以通过二分
4、法 求得其数值解,只需确保两个;i初始值分别使得w(a)的和大于1与小于1。 具体算法如下:1 .确认两个初始值4加力 Xmax,使得W(2m出) 1;2 .取2=那么学吧,并求解w(Q= arga讥w(w;Q;3 .假设w(A) 1,那么tUqx用4更新;.重复循环步骤2与3,直至w(2)的和与1之间的差距小于事先定下 的收敛误差标准;4 .以最后一次循环的;I值与w(a)值作为优化问题的结果。这里一个关键性的问题是,上述算法步骤2中,w(A) = argminw (w; A) 的求解。如果求解速度很慢,那么势必会大大影响整个算法的效率。下面我 们介绍一些适合该问题求解的机器学习算法。2.2
5、.1、 坐标下降算法梯度下降(Gradiant Descent)是机器学习(尤其是神经网络模型)中 最常用的算法之一,它每次计算出目标函数在当前点的梯度方向,并沿其反 方向偏移从而获得更新值。而坐标下降(Coordinate Descent)是梯度下降 的一个衍生变种,它每一次更新并不计算完整的梯度,而是仅在其中一个坐 标方向上进行微分计算,并保持其它坐标值不变,仅沿着该坐标偏移一小步。 其算法步骤如下:对于无约束优化问题Minimize f(w),其中w =W2,,wQ1 .获得初始值w= w();2 .选择一个方向计算在这个方向上的梯度%/(w);3 . W 更新为 W =(W1,,Wi-
6、T*Wi+1,,W/1),其中为学习速率。即除了坐标i有更新以外,其它坐标保持不变;4 .重复循环步骤2与3,直至收敛;5 .以最后一次循环的w值作为优化问题的结果。上述算法中,步骤2涉及挑选一个方向。主流的挑选方式有两种,一种 是随机挑选(Random Coordinate Descent), 一种是固定顺序的循环挑选(Cyclical Coordinate Descent)。这两种方式并没有明显的优劣之分,从 简便性角度出发,我们这里使用循环坐标下降算法(后简称CCD) o由于我们是有约束的优化问题,因此在运用CC D的过程会额外多一步: 将无约束下的更新值w,投影到约束空间。上,以投影w
7、 = Rc(w)作为该轮循 环的更新值,算法步骤入下:对于优化问题 Minimize /(w), s.t.weC,其中w = (wlw%,皿)1 .获得初始值w= w();2 .选择一个方向ie12,词,计算在这个方向上的梯度Z/(w);3 . W更新为W =(W1,,Wt, Wi-T*Wi+l,,wQ,其中为学习速率。即除了坐标i有更新以外,其它坐标保持不变;4 .将更新后的点投影到。上,w = Rc(w);5 .重复循环步骤2、3与4,直至收敛;6 .以最后一次循环的w值作为优化问题的结果。但是这个方式能否收敛到正确的最优解,取决于约束条件与变量如何排 序(Roncalli, 2019)。
8、因此在股票组合优化中,仅运用CCD算法并缺乏以 保证获得优化后的权重。所以我们还需要配合另一个算法:交替方向乘子。、交替方向乘子算法交替方向乘子(Alternating direction method of multipliers,后简称 ADMM)是Gabay与Mercier在1976年引入,是一种算子拆分技巧,用以 解决如下问题:Minimize /(%)+g(y)s. t. Ax + By = c#(15)其中,a 脓px- b e 衣pxce rp o 函数 /: nr T股u+8, g:脓小7眩11+8都是闭凸函数。该问题的的优化算法如下(Boyd, 2010):1 .获得X()与
9、y()的初始值,初始化凉)= 0,并确定参数8;2 .对于每一轮循环k,依次:2更新 x(k)= argmin /(%) + |A- + By( J) c + uk x222a) 更新 y(*)= argmin g(y) + 出 + By c +y 22C) 更新 a(“)= u(kT) + (A%(k) + By 一 c)3 .在步骤2不断循环,直至收敛;4 .以最后一次循环的x, y作为优化问题的结果。对于我们组合的优化问题,式(13)可以改写成:nMinimize Risk(x) 一 2 RBt * In + lc(y) i=l5 . t. x y = 0#(16)其中 f(x) = R
10、isk(x) - 入EWRBt * In瑞,g(y) = lc(y)。如果我们进一步取标准差风险测度Risk(x) =+ c * yfxTXx,那么算法步骤2中,x更新局部的优化问题便成为一个无约束风险预算问题,可 以通过上一小节的CCD算法求解。而y更新局部那么成为一个投影算子 y=Pq(x)+这一局部的求解在有多个约束条件构成凸约束空间。时,涉及到运用邻近算子(Proximal Operator)与Dykstra算法。x更新 及y更新的具体优化求解过程放在文末附录。3、配置型优化下指数增强效果上一章介绍了用以优化配置型组合优化的优化算法。这一章节将实证该优 化方式在指数增强组合上的效果。我
11、们分别选取目前市场上最主流的增强指数: 中证500与沪深300。比拟配置型优化下指数增强的效果与线性优化的差异。在我们之前的研报沪深300指数增强模型构建与测试多因子系列报 告之二十三中,我们得出了对个股权重(尤其是权重股权重)的约束控制是 沪深300增强表现的关键之一。因此该章节的优化测试中参考该结论,也将设 置个股相对基准权重的约束条件。具体的基本假设与约束条件如下: 采用综合质量因子EBQC对指数内成分股打分,成分股内选股; 个股权重满足:大于0%,小于100%,权重和为1; 约束行业相对偏离度不超过10%; 约束市值因子暴露度不超过5%; 个股权重相对基准绝对偏离度不超过1%; 月度调
12、仓,费率假设为单边0.3%; 样本区间为 2009-01-01 至 2019-12-31。其中,“个股权重相对基准绝对偏离度不超过1%”的约束与我们第一章 线性优化测试中“个股权重必须处于0,2%范围内”的约束有所差异。参与比拟的具体优化方式如下:1 .线性优化:Minimize wTa;2 .有约束风险平价:为 一Minimize wTa + c * VwTXw 工 In % + 1 (y)(x,y)-i 。n i=l3 .有约束风险预算: 0,月R么。3.1、 中证500指数增强我们首先测试不同优化方式在中证500指数增强上的效果。组合线性优 化下年化超额收益7.0%,信息比率1.54,相
13、对最大回撤7.7%,平均双边换 手56.5%o这个表现相比于第一章节中的线性优化结果(信息比率1.38,相 对最大回撤9.1%,平均双边换手48.5%)已经有了不小提升。可见对个股 权重相对与基准偏差的约束在中证500增强里也能有效提升组合表现。风险平价优化组合的表现与其它优化组合差异较大,它的相对年化波动 3.0%,明显小于其它组合;且换手率很低,平均双边仅21.2%,同时逐年稳 定性很强,每年表现基本一致。但它在收益端明显弱于其它组合,仅3.0% 的年化超额。信息比仅0.98。风险预算优化组合收益表现与线性优化组合相当,年化超额收益7.0%, 但风险端优势明显,相对年化波动3.8%,信息比
14、率1.80,显著高于线性优 化组合;相对最大回撤6.4%,好于线性优化组合的7.7%O其双边换手率平 均41.0%,略低于线性优化组合的48.4%。表4: EBQC因子500增强组合统计数据线性优化风险平价风险预算年化收益 年化波动 夏普比率15.2%28.5%0.6411.3%29.0%0.5215.8%28.8%0.65图4:不同优化下EBQC因子500增强净值比拟最大回撤-52.2%-61.3%-52.5%年化超额收益7.0%3.0%7.0%相对年化波动4.4%3.0%3.8%信息比率1.540.981.80相对最大回撤-7.7%-6.5%-6.4%图4:不同优化下EBQC因子500增强
15、净值比拟资料来源:光大证券研究所,Wind;注:测试区间为2009-02-01至20191231图5:不同优化下EBQC因子500增强相对净值比拟资料来源:光大证券研究所,Wind;注:基准为中证500指数 测试区间为 2009-02-01 至 2019-12-31资料来源:光大证券研究所,Wind;注:测试区间为2009-02-01至20191231从分散化的角度,线性优化组合平均每期持仓93只股票,风险平价组 合平均每期持仓395只股票,风险预算组合平均每期持仓240只股票。风险 平价组合的持股最为分散,这也是其收益较低的一个重要原因。风险预算组 合的持股集中度较为适中。除了持股集中度,我
16、慢也可以通过分散比率这个 统计量比拟不同组合的分散化程度,立.该值越大说明组合风 wTXw险越分散。从下列图可以看出,风险预算优化组合的分散比率始终高于线性优 化组合,其分散比率均值为1.68,而线性优化组合分散比率均值为1.64。结 合其它收益及风险统计数据。我们最为推荐风险预算组合优化方式。图6:不同优化方式下500增强组合分散比率序列资料来源:光大证券研究所,Wind;注:测试区间为2009-02-01至2019-12-31风险预算优化中证500增强组合除了 2009年小幅跑输基准以外,从 2010年至今每年都跑赢中证500指数。2015年组合相对基准波动较大,除 此之外,每年相对波动基
17、本保持在3%以内。相对最大回撤近4年未超过2%o表5:风险预算优化EBQC因子中证500增强分年度表现统计年化收益年化波动夏普比率最大回撤年化超额收益 相对年化波动信息比率相对最大回撤200974.7%34.2%2.1818.1%-1.6%3.2%-0.515.0%201021.0%28.1%0.7524.9%7.5%2.9%2.621.6%2011-32.5%23.9%-1.3636.2%5.3%2.3%2.321.3%20127.4%23.6%0.3125.4%4.3%2.4%1.751.6%201324.1%22.2%1.0915.7%5.8%2.8%2.101.8%201435.2%1
18、9.4%1.8210.6%1.1%2.7%0.413.9%201559.8%50.2%1.1952.5%14.9%8.6%1.736.4%2016-6.9%31.0%-0.2226.2%7.9%2.9%2.711.5%201712.5%14.9%0.8412.1%11.7%2.8%4.211.4%2018-28.7%24.1%-1.1933.2%8.5%3.1%2.751.7%201932.4%21.7%1.4917.3%6.8%2.9%2.351.9%Summary15.8%28.8%0.6552.5%7.0%3.8%1.806.4%资料来源:光大证券研究所,Wind; 注:基准为中证500
19、指数,测试区间为20090201至2019-12-313.2、 沪深300指数增强我们也测试了不同优化方式在沪深300指数增强上的效果。组合线性优 化下年化超额收益4.6%,信息比率1.49,相对最大回撤4.4%,平均双边换 手 37.4%。与上一节的测试类似,风险平价优化组合的表现与其它优化组合差异依 然很大,它在超额收益更小,年化2.7%o信息比1.04。它的优势局部中, 相对年化波动2.6%,换手率平均双边仅16.9%。风险预算优化组合年化超额收益4.4%,稍低于线性优化组合。相对年 化波动2.7%,信息比率1.61,相对最大回撤3.6%,均优于线性优化组合的 表现。其双边换手率平均33
20、.0%,略低于线性优化组合的37.4%。表6: EBQC因子300增强组合统计数据资料来源:光大证券研究所,Wind;注:测试区间为2009-02-01至2019-12-31线性优化风险平价风险预算年化收益11.3%9.7%11.6%年化波动24.2%24.5%24.3%夏普比率0.560.500.57最大回撤-43.1%-47.1%-43.7%年化超额收益4.6%2.7%4.4%相对年化波动3.1%2.6%2.7%信息比率1.491.041.61相对最大回撤-4.4%-3.9%-3.6%图7:不同优化下EBQC因子300增强净值比拟资料来源:光大证券研究所,Wind;注:测试区间为2009-
21、02-01至 2019-12-31图8:不同优化下EBQC因子300增强相对净值比拟资料来源:光大证券研究所,Wind;注:基准为沪深300指数 测试区间为20090201至2019-12-31线性优化组合平均每期持仓84只股票,风险平价组合平均每期持仓288 只股票,风险预算组合每期持仓77只股票。从持股集中度的角度来说,风 险预算优化300增强组合与线性优化组合差异不大,风险预算组合持股反而 更集中一些。但如果观察分散比率序列,可以看出风险预算组合的风险分散 程度仍始终高于线性优化组合,其分散比率均值为1.68,而线性优化组合分 散比率均值为1.650图9:不同优化方式下300增强组合分散
22、比率序列风险预算优化沪深300增强组合从2009年至今每年都跑赢沪深300指 数,且超额收益十分稳定。2015年组合相对基准波动较大,除此之外,每 年相对波动基本保持在2.5%以内。该组合相比线性优化组合,在稳定性与 风险控制上更胜一筹。表7:风险预算优化EBQC因子沪深300增强分年度表现统计年化收益年化波动夏普比率最大回撤年化超额收益 相对年化波动信息比率相对最大回撤200967.7%31.6%2.1523.6%4.3%2.6%1.681.9%2010-4.6%24.9%-0.1927.8%5.6%2.5%2.251.5%2011-21.8%19.7%-1.1128.3%4.5%2.0%2
23、.191.6%201211.7%19.4%0.6019.3%2.5%1.7%1.451.6%2013-2.7%20.4%-0.1320.0%3.0%2.4%1.231.6%201445.8%18.3%2.508.8%3.2%1.8%1.772.1%201520.9%40.6%0.5142.9%8.0%5.1%1.583.6%2016-5.9%23.1%-0.2619.2%3.4%2.6%1.312.4%201724.4%10.1%2.416.4%4.5%2.0%2.241.2%2018-23.5%20.9%-1.1329.0%3.1%2.4%1.302.1%201935.7%19.2%1.86
24、11.7%3.5%2.3%1.551.3%Summary11.6%24.3%0.5743.7%4.4%2.7%1.613.6%资料来源:光大证券研究所,Wind;注:基准为沪深300指数,测试区间为20090201至201912314、总结结合测试结果,本文重点阐述并推荐风险预算优化算法来构建约束条件下 的股票组合。具体结论如下: 组合优化常用构建方式:线性优化缺点较明显线性优化是目前主流的因子组合构建方式之一,它有着简单直观、优化 计算复杂程度低,计算耗时极少的优点。但相应的,它的缺乏之处是丢弃了 不同个股之间的相关性信息,同时会使得最终的优化结果中,个股集中程度 较大。 二次规划带来的边际
25、提升有限采用二次规划的优化方式,可以融入个股间相关性信息。但通过测试, 以历史收益估计协方差矩阵的二次规划基本不能在线性优化基础上带来边 际改善。而通过风格因子数据估计协方差矩阵的二次规划虽能小幅提高组合 的信息比率,但波动与最大回撤也相应增大,整体带来的边际改善较为有限。 同时二次规划对于参数的敏感性过高也是其痛点之一。 借鉴风险预算模型:运用机器学习算法克服优化难点借鉴资产配置中的风险预算模型构建因子组合的优化问题,并运用机器学 习中的循环坐标下降(CCD)与交替方向乘子(ADMM)算法,解决在有各类 约束条件下的优化实现。使优化问题具有可操作性。 风险预算增强组合更稳定:跟踪误差小、换手
26、低、持股更分散以综合质量因子EBQC因子为例,分别比拟线性优化、风险平价优化、风 险预算优化下的中证500指数增强与沪深300指数增强(测试区间为 2009-02-01至2019-1231) 其中风险预算优化中证500增强组合相比线性 优化组合,信息比从1.54提升至1.80,最大回撤由7.7%降至6.4%,换手率从 48.5%降至41.0%,分散比率均值由1.64升至1.68。风险预算优化沪深300增强组合相比线性优化组合,信息比从1.49提升至1.61,最大回撤由4.4%降 至3.6%,换手率从37.4%降至33.0%,分散比率均值由165升至168。5、风险提示不被甯慧黎历,模型存在失效
27、的可能,历史数据存在附录A.风格因子构造方式在Barra的针对中国市场的风险因子构建中,通常将公共因子分为行业 因子和风格因子两大类。行业因子是股票所属行业的哑变量,本文均一致选用 中信一级行业分类。风格因子是影响股票投资组合收益的重要系统性因素,其 涵盖了基本面因子、技术面因子和预期因子等多方面影响。九大类风格因子(Size、Beta、Momentum、Volatility Value、Liquidity、 Earnings、Growth、Leverage)共由20个细分因子复合而成,遵循Barra 的赋权方式,具体构造方式及含义见下表。表8:风格因子分类及构造方式风格大类细分因子因子计算方
28、式Size (规模)LNCAP对数总市值Beta (CAPM 模型 Beta)RFTA该因子用以衡量市场性风险:Ui = a + Prm + ei按照CAPM理论使用沪深300指数收益率对个股收益率进行半衰期为60个交易日的指 数加权滚动回归,取回归模型斜率即为beta;其中滚动回归的序列长度为240个交易日该因子衡量股票前期业绩持续能力:过去一段时间T个股累积收益率Momentum (动量)RSTRT+LRSTR =ln(l + n) t=LT=500, L=20,wt为半衰期指数,半衰期为120个交易日。Volatility = 0.74* DASTD + 0.16* CMRA+0.10
29、* HSIGMATDASTD = (X 做(兀-u(r)2)0 5 t=iDASTDrt表示个股t日的收益率,(r)表示过去250个交易日个股收益率均值,指数加权半衰期Residual Volatility (波动)为40个交易日。CMRA = Zn(l + maxZ(T) -Zn(l + minZ(T)CMRATz(7)=ln(l + n) t=i表示个股月收益率,T=1,2, . ,12.HSIGMAHSIGMA = std(a) 务算beta所得残差标准差Value (价值)BTOP市净率倒数=股东权益/总市值Liquidity = 0.35 * STOM + 0.35 * STOQ +
30、 0.30 * STOASTOM2。匕STOM = In)Liquidity (流动性)匕为t日的成交量,一57为t日流通股本STOQSTOQ = lnexp(STOM),7 = 37Wt1t=i表示个月(20日)换手率STOASTOQ = In厂exp(STOM ), T = 12STOM T 心t1t=iEarnings Yield (盈利)Earnings = 0.68 * EPFWD + 0.21 * CETOP + 0.11 * ETOP图目录图1 :线性优化下的EBQC中证500指数增强净值表现 6图2 :式(5 )二次规划下的EBQC中证500指数增强信息比 8图3 :式(7 )
31、二次规划下的EBQC中证500指数增强信息比 9图4 :不同优化下EBQC因子500增强净值比拟15图5 :不同优化下EBQC因子500增强相对净值比拟 15图6 :不同优化方式下500增强组合分散比率序列15图7 :不同优化下EBQC因子300增强净值比拟17图8 :不同优化下EBQC因子300增强相对净值比拟 17图9 :不同优化方式下300增强组合分散比率序列17EPFWDEPFWD =est_eps (TTM) / close_price,未来12个月一致预期每股收益/收盘价CETOPCETOP:过去12个月每股现金收益/当前收盘价ETOPETOP=过去12个月净利润/当前总市值Gro
32、wth = 0.18* EGRLF+0.11 * EGRSF + 0.24 * EGRO + 0.47 * SGROEGRLF未来1年净利润增长率Growth (成长)EGRSF未来2年净利润复合增长率EGRO过去5年企业营业总收入复合增长率SGR0过去5年企业归属母公司净利润复合增长率Leverage = 0.38 * MLEV + 0.35 * DTOA + 0.27 * BLEVLeverage (杠杆)MLEVMLEV= (ME+LD) /ME, ME总市值,LD非流动性负债DTOADTOA=TD/TA, TD总负债,TA总资产BLEVBLEV = (BE+LD) /BE, BE账面权
33、益,LD非流动性负债资料来源:BarraCNE5,光大证券研究所.风险预算优化问题转换我们将从式(9)开始推导,论证该优化问题的解即满足我们需要的风险 预算组合。Minimize Risk(w)nst 五RBi*lnWiNc#l* JLw 0那么不难得出它的拉格朗日方程为:n(w; A, Ac) = Risk(w) A7w Ac O RBt * In Wi c), A E Ac G i=l进一步求解 d(w; A,Ac) = 0, d(w; A, dRisk(w) _ =A.dwidwi此时K-T条件为:min(AbWi) = 0nmin RBi * m 叱 _ c) = oi=l这里w0,那
34、么min(九w。= 0就意味着尢=0。于是就有:dRiskfw) adwiRBtWi进一步,dRisk(w) * rbwi =4 idwi等式两边求和,根据式(8)以及RBi = l,那么有:RiskM = 1AMisk(w)ARB xO = a“ FL二c 乙 / c c i=lt=li=l替换进上式,那么有:dRisk(w) , 、w= Risk(w) * RB1 -dwi-这正是风险预算的资产权重所需满足的条件。C.标准差风险测度下ADMM算法:x更新与y更新的具 体方法在标准差风险测度Risk(x) =-” + c *下,问题如下:Minimize,/(%) + g(y)s.t. x
35、- y = 0#(17)其中 /(%) =” + c * 7%丁二% * Inxt, g(y) = lc(y)。X更新对于%(%)的更新变为求解另一个最优化问题:(P2argminxf(x) +-1)|2)乙不妨设= y(l)-,那么最终的目标函数变为:/ n02f(k)(x) = 丁 + c * y/xTSx - A RBi * lnxt + |x - v(*一|2 i=lL利用CCD来求解上述最优化问题,对于每一个坐标方向,对其一阶偏导为:3八廿(%)(3初 RBi(九)a =+ C * r 2+(P QXi- Vx )- 0dxt d 4xTXx xi上述等式是关于招的一元二次方程:a
36、屠 + PiXt + % = 0其中,OCi = ci,i仅=c : j -内 Ox六Yi A RB(Jx由于i0,因解上述一元二次方程,可得:_四+ V/? 4仇小Xi =因此,x更新运用CCD算法步骤如下:1 .获得初始但、(一1);.沿着12,几12 的顺序选择下一个坐标防线i;、-Pi+yJ p2-4aiYi2 .漉新为M ,上1,%);.重复循环步骤2与3,直至收敛;3 .以最后一次循环的作为,完成x更新。y更新对于yg)的更新变为求解最优化问题:(p2argminxg(y) + 那)- y + 解一,.不妨设那么最终的目标函数变为:(0?9 (y) = ln(y) + |yZ乙上式
37、恰是邻近算子(Proximal Operator)的形式,邻近算子的定义是:1 ?prox (v) = argmin /(%) + + x - v| 而如果/是指示函数,/(%):= lc(%),其中Q是一个凸集。那么pro%f(u)=对于一些常见的约束集合,丸(切有以下表达式:表9:常见约束集合的投影表达2222a1 w = bcTw d(cTv d)+w w w+w w w+%+, W+W-一V+WV-WVWV22资料来源:光大证券研究所而假设约束集合是有多个基本约束集合的交集,那么需要借助Dykstras算 法来求解。对邻近算子及Dykstras算法感兴趣的读者,推荐Proximal A
38、lgorithms(Parikh and Boyd, 2014)与Dykstras Algorithm, ADMM, and Coordinate Descent: Connections, Insights, and Extensions(Tibshirani, 2017)o表目录表1 :线性优化下的EBQC中证500指数增强统计数据 6表2 :式(5 )二次规划下的EBQC中证500指数增强统计数据 7表3 :式(7 )二次规划下的EBQC中证500指数增强统计数据 9表4 : EBQC因子500增强组合统计数据14表5 :风险预算优化EBQC因子中证500增强分年度表现统计 16表6 :
39、 EBQC因子300增强组合统计数据16表7 :风险预算优化EBQC因子沪深300增强分年度表现统计 18表8 :风格因子分类及构造方式 20表9 :常见约束集合的投影表达 23因子研究一直是量化领域的重心。研究者在基于新数据新想法不断努力 挖掘有效因子的同时,如何将手头上已有的因子转化为最终的投资组合也是 摆在基金经理们眼前的现实问题。本篇报告的主要研究目的,即在于给定最终复合因子的前提下,探索新 的多头股票组合构建及优化方式,并运用机器学习算法实现具有操作意义的 指数增强模型建议。1、主流组合优化方法在没有任何约束的条件下,一种简单的组合构建方式是:按因子大小排 序自上而下选取固定个数的股
40、票,等权持有。这种组合构建方式简单直观, 长期效果也不错。但对于市场不同风格的暴露程度并不稳定,致使这样的组 合更容易受到某些风格表现的影响。因此现在市场上更多的组合是基于一定 参考基准,在一些约束条件下优化权重后构建而成的。最典型的就是各类指 数增强产品。1.1、 线性优化:个股集中度高线性优化是目前主流的组合优化方式之一,它的目标函数是:Maxmizew w%#或者等价的:Minimize wa#(2)其中,W:个股权重向量;a:个股复合因子值向量。线性优化的优点很明显,能够以最简单直观的方式结合所需要的各种约 束条件,获得最终的优化权重。同时由于仅有一次项,它的优化计算复杂程 度很低,计
41、算耗时极少。但相应的,这样的优化方式相当于丢弃了不同个股 之间的相关性信息,同时会使得最终的优化结果中,个股集中程度较大。我们以构建一个中证500指数增强为例。这里我们使用的复合因子是 EBQC光大综合质量因子,因子仅作为例如使用,故其构造方式不在此展开, 感兴趣的读者可参考研报以质取胜:EBQC综合质量因子详解多因子 系列报告之十七。具体约束条件设置与主要假设如下: 采用综合质量因子EBQC对中证500成分股打分,中证500成分股内选股; 约束行业偏离度不超过10%;约束市值因子暴露度不超过5%; 个股权重必须处于0, 2%范围内;月度调仓,费率假设为单边0.3%; 样本区间为2009-01
42、-01至20191231。从测试结果上可以看出,在因子有较好选股能力时,简单的线性优化就 能使组合有较好地收益特征。这个例子里,EBQC中证500指数增强组合相 对于中证500基准,年化超额7.3%,信息比率1.38,最大回撤9.1%。表1:线性优化下的EBQC中证500指数增强统计数据资料来源:光大证券研究所,Wind;注:测试区间为2009-02-01至2019-12-31统计项年化超额收益相对波动信息比率相对最大回撤统计值7.28%5.20%1.38-9.14%图1:线性优化下的EBQC中证500指数增强净值表现1.2同时我们观察该组合的持仓与调仓信息。平均下来组合每期持仓64.3 只股
43、票,双边换手56.5%。由于个股最大持仓占比受到不能超过2%的约束, 理论上每期股票个数极限不能少于50只,而该组合平均每期持仓不到65只, 且超过一半持仓接近2%的最大持仓限制,因此可以看出该线性优化下的组 合,个股集中程度较高。、二次规划除了线性优化以外,得益于马科维兹组合优化理论,二次规划是我们非 常熟悉的另外一种优化方式。在均值方差优化理论中,它的目标函数是:1Minimizew - wTw 2其中,w:资产权重向量;:资产预期收益向量;二:资产协方差矩阵。二次规划大局部运用于资产配置中。相比于线性优化,二次规划考虑了各 个资产间的相互关系。但假设要将其运用于基于现有复合因子的组合优化,最明 显的问题是如何将因子值与预期收益进行转换。同时在股票池很大的时候,直 接用收益率估计协方差矩阵,运算效率会有一定影响。接下来我们尝试两种二 次规划组合的效果。121、“因子一收益”线性假设下的二次规划组合一种简单的转换方式是仅假设因子值跟预期收益成线性关系:a = A * #其中,2是比例系数。那么上述式(3)那么变为:M加加zew )一卬%#(5)这里Z依然是由历史收益数据估计的协方差矩阵,这里我们由最近一年 (250 EJ)的日收益率数据估计。基于上一小节同