《股票-量化选股策略—多因子模型.docx》由会员分享,可在线阅读,更多相关《股票-量化选股策略—多因子模型.docx(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、量化选股策略多因子模型丁鹏多因子模型是量化选股中最重要的一类模型,其根本思想就是找到某些以及收益率最相关的指标。并根据该指标,构建一个股票组合,期望该组合在将来的一段时间跑赢或跑输指数。假如跑赢,那么可以做多该组合,同时做空期指,赚取正向阿尔法收益;假如是跑输,那么可以做多期指,融券做空该组合,赚取反向阿尔法收益。多因子模型的关键是找到因子与收益率之间的关联性根本概念多因子模型是应用最广泛的一种选股模型,根本原理是采用一系列的因子作为选股标准,知足这些因子的股票那么被买入,不知足的那么卖出。举一个简单的例子:假如有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即
2、可。那些安康指标靠前的运发动,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上,第二是在怎样用多因子综合得到一个最终的判断。一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。打分法就是根据各个因子的大小对股票进展打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进展挑选。回归法就是用过去的股票的收益率对多因子进展回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对将来股票收益的预判,然后再以此为根据进展选股。多因子选股模型的建立经过主要分为候选因子的选取、选股
3、因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立以及模型的评价及持续改良等5个步骤。候选因子的选取候选因子的选择主要依赖于经济逻辑以及市场经历,但选择更多以及更有效的因子无疑是增强模型信息捕获才能,进步收益的关键因素之一。例如:在2020年度1月1日,选取流通市值最大的50只股票,构建投资组合,持有到2020年度底,那么该组合可以获得10%的超额收益率。这就讲明了在2020年度这段时间,流通市值与最终的收益率之间存在正相关关系。从这个例子可以看出这个最简单的多因子模型讲明了某个因子与将来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些根本面指标,如PB、PE、EP
4、S增长率等,可以能是一些技术面指标,如动量、换手率、波动等,或是其他指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或一年度,对最终的收益率影响很大。选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验,详细而言,对于任意一个候选因子,在模型形成期的第一个月初开场计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进展排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。上面的例子就
5、已经讲明了这种检验的方法,同样的可以隔N个月检验,比方2个月、3个月,甚至更长时间。还有一个参数是候选组合的数量,是50只,还是100只,都是非常重要的参数。详细的参数最优的选择,需要用历史数据进展检验。有效但冗余因子的剔除不同的选股因子可能由于内在的驱动因素大致一样等原因,所选出的组合在个股构成以及收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保存同类因子中收益最好、区分度最高的一个因子。例如成交量指标以及流通量指标之间具有比拟明显的相关性。流通盘越大的,成交量一般也会比拟大,因此在选股模型中,这两个因子只选择其中一个。冗余因子剔除的方法:假设需要选出k个有效因子,
6、样本期共m月,那么详细的冗余因子剔除步骤为:1先对不同因子下的n个组合进展打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高;2按月计算个股的不同因子得分间的相关性矩阵;3在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值;4设定一个得分相关性阀值MinScoreCorr,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保存与其他因子相关性较小、有效性更强的因子,而其他因子那么作为冗余因子剔除。综合评分模型的建立以及选股综合评分模型选取去除冗余后的有效因子,在模型运行期的某个时间开场,例如每个月初,对市场中正常交易的个股计算每个因子的最新得分并按照一定的权
7、重求得所有因子的平均分。最后,根据模型所得出的综合平均分对股票进展排序,然后根据需要选择排名靠前的股票。例如,选获得分最高的前20%股票,或选获得分最高的50到100只股票等。举个例子:可以构建一个多因子模型为PE,PB,ROE,在月初的时候,对这个几个因子进展打分,然后得分最高的50个股票作为投资组合,在下个月按照同样的方法进展轮流交换。持续一段时间后,考场该投资组合的收益率是否跑赢比拟基准,这就是综合评分模型的建立以及后验经过。当然这个例子是一个最简单的例子,实战中的模型可能会比拟复杂,比方沃尔评分法就是一个复杂的多因子模型,它是对股票进展分行业比拟,算每个行业的得分高的组合,然后再组合成
8、投资篮子。模型的评价及持续改良一方面,由于量选股的方法是建立在市场无效或者弱有效的前提之下,随着使用多因子选股模型的投资者数量的不断增加,有的因子会逐渐失效,而另一些新的因素可能被验证有效而参加到模型当中;另一方面,一些因子可能在过去的市场环境下比拟有效,而随着市场风格的改变,这些因子可能短期内失效,而另外一些以前无效的因子会在当前市场环境下表现较好。另外,计算综合评分的经过中,各因子得分的权重设计、交易本钱考虑以及风险控制等都存在进一步改良的空间。因此在综合评分选股模型的使用经过中会对选用的因子、模型本身做持续的再评价以及不断的改良以适应变化的市场环境。多因子的模型最重要是两个方面:一个是有效因子,另外一个是因子的参数。例如到底是PE有效还是ROE有效;到底是采用1个月做调仓周期还是3个月做调仓周期。这些因子以及参数的获取只能通过历史数据回测来获得。但是在回测经过中,要注意,不能过度优化,否那么结果可能反而会不好。为?量化投资策略与技术?的编著者