登陆注册
86553

建投量化:电子、医药、食品饮料和建材可作为长期战略配置行业

新浪财经-自媒体综合2020-06-30 15:31:380

炒股就看锤子财富,权威,专业,及时,全面,助您挖掘潜力主题机会!

原标题:【建投金工丁鲁明团队】资本市场百花齐放,因子选股进入精耕时代——2020年中期投资策略报告

来源:鲁明量化全视角

核心结论

A股自下而上分析:始于2019下半年的库存周期因疫情再次探底

ROE从2018Q2高位9.49%持续下行到2020Q1的6.42,杜邦分析三项(销售净利率、总资产周转率和资产负债率)共同导致ROE下行;供需结构方面,在需求不足和投资不足同时存在的情况下,供需增速差2016Q3至2019Q4期间一直维持正数,表明供给小于需求,企业的固定资产周转率持续提升;上市公司业绩预告方面,景气向上的公司占比自2017Q4持续下降到2019Q3,2019Q4景气度有所回升,2020Q1因新冠疫情和隔离措施大幅下行到37.20%。

周期定位:基本面触底回升

周期定位方面,当前处于全球康波周期萧条,中国人口周期下行,复苏于2016年的产能周期和复苏于2019Q4的库存周期,因新冠疫情及隔离措施而受到紊乱,预测上市公司的ROE和归母净利润于2020Q2见底,2020Q3开启上行周期,并将持续到2021年。

行业量化基本面深度剖析与横向比较:战略做多电子、医药、食品饮料和建材;复苏初期,大市值板块中可做多地产

预测老16家上市银行未来两个季度(2020Q2、2020Q3)的ROE为5.00%和9.65%,对银行(中信一级)2020年的估值为7,604点。由于25-55岁人口从2018年开始下行,地产长周期下行;短周期依然支持看多房地产行业。当前处于猪周期顶部。我们挑选处于中周期产能扩张阶段的未来两年价值正增长和处于中周期产能收缩且具备高ROE和良好格局的行业;则对未来比较看好的行业有电子、医药、食品饮料和建材,作为长期战略配置的行业。

多因子选股视角的再开拓

陆股通数据的择时与选股实证:对“净流入占比”因子作分组考察,TOP组合年化超额收益22.32%,累计多空收益差42.34%。在市值和行业中性前提下,将该因子应用于沪深300指数增强组合,则可获得8.69%的年化超额收益,信息比率2.43。

分析师预期修正动量效应选股策略:我们用分析师预期均值和离散程度将分析师预期修正分段,其中第一个阶段(即分析师预期和离散程度均上调)的股票未来表现最好。因此我们采用多指标叠加选股法,将预期EPS FY1、EPS FY2、预期净利润FY1三个分析师预期指标进行叠加选股。经过回测,组合年化超额收益16.3%,超额收益夏普比率1.74,超额收益最大回撤10.8%。

分析师超预期因子选股策略:我们计算单季度的净利润超预期幅度ESP因子,然后进行条件选股:每月底根据EP_TTM和过去一个月收益率两个风格因子限定样本池,然后选取净利润超预期幅度最大的20只股票,构建超预期20组合。从2009年4月至2020.5,相对中证500指数的年化超额收益为20.92%,相对沪深300指数的年化超额收益为20.47%。2020年的超额收益-4.85%,

A股质量因子有效性的根源:我们基于传统定价模型,将公司质量分为盈利、成长以及安全性三类。基于三类因子,最终发现将合成大类因子后的等权组合是最优的。质量因子IC达到4.19%,IC_IR1.62。而质量因子与估值存在质量越高的公司估值相对也更高的特点。在结合估值因子后,质量+估值因子效果进一步提升,IC达到6.51%,IC_IR2.77,信息比率提升到2,月度胜率67.57%。

行为金融学中前景理论因子的选股能力:我们从行为金融学的前景理论出发,进行两类因子检验:未实现盈利量CGO因子与个股前景价值TK因子。对于CGO因子,剔除反转因子后仍有良好效果:IC2.23%,多空年化收益11.97%。2016年至2020年5月每年都收益显著。对于TK因子,我们基于PB对其修正:IC提升为2.92%,多空年化收益7.91%,胜率接近70%,同时其表现的动量效应与理论一致,即个股前景价值与未来收益正相关。

人工智能算法中XGBOOST算的应用:我们对中证500指数和沪深300指数建立Xgboost指数增强模型。在对基础策略优化的情况下,中证500指数增强策略年化超额收益10%,信息比率1.4,跟踪误差7.2%,2016年以来最大回撤7.8%;沪深300指数增强策略年化超额收益4.6%,信息比率0.70,2016年以来最大回撤22%。

指数增强策略跟踪效果:目前我们在跟踪的多因子模型共有四个,表现如下:

因子轮动下的500增强策略,年化超额收益11.02%。信息比率1.54;

因子动态调整的500增强策略,年化超额收益10.50%,信息比率2.09,今年以来超额收益2.25%;

质量体系下的500增强策略,年化超额收益12.02%,信息比率1.68,今年以来超额收益10.43%;

质量体系下的300增强策略,年化超额收益8.94%,信息比率1.54,今年以来超额收益9.15%。

风险提示:模型为历史数据,存在失效可能。

报告正文

一、来自A股自下而上的财务分析及展望

我们用增速差(收入增速-固定资产增速)来衡量供需矛盾,可以发现在需求不足和投资不足同时存在的情况下,供需增速差2016Q3至2019Q4期间一直维持正数,表明供给小于需求,相应的企业的固定资产周转率从2016Q2低位1.92持续提升到2019Q4的2.53,2020Q1因疫情导致的收入下行而大幅下行到2.29。“存货周转率”从2007Q1高位(4.77)下降到2016Q3低位(2.36)后开始窄幅震荡,2020Q1因疫情导致的收入下行而大幅下行到2.33。预计企业将进一步去产能,而需求在疫情消退后可能慢慢恢复,我们可以期待供给相对需求依然不足,从而供需增速差维持正数,投资增速小于需求增速有助于固定资产周转率提升,而固定资产周转率的提升有助于企业ROE提升。

我们可以通过业绩预警数据,计算上市公司的景气度;定义上市公司景气度为业绩预告中“预增”、“续盈”、“略增”和“扭亏”的整体占比,反映上市公司中业绩好转的比例。历史上看,当整体财报加总的盈利能力好转或恶化时,景气度会同向变化,基本上是同步指标,但因为业绩预警数据相对财报披露时间更早,所以可以作为跟踪指标,提前了解上市公司的盈利能力概况。

二、行业量化基本面深入刨析及横向对比

行业基本面量化,基于行业研究员的研究和理解,梳理行业特有的的主要逻辑链、关键变量和投资主线,发挥金融工程在数据分析、程序编写和模型建立方面的优势,建立量化模型,使得行业配置的推荐更加科学化、系统化。对于价值投资者来说,可以从量化的角度去理解一个行业的主要逻辑链,甚至启发他们将自己的投资逻辑设计成量化模型,辅助决策;对于量化投资者来说,可以提高对行业特有基本面信息(如关键指标、行业特有逻辑链)的认识,以便设计量化交易策略的时候把行业的一些基本面信息、指标加入到模型中。

2.1

银行

实体企业的盈利能力影响银行的盈利能力,而银行的盈利能力影响其信贷规模并进而影响货币供给。记为B基础货币,rd为存款准备金率,则最终产生货币量M=B/rd,v=1/rd其中为货币乘数。基础货币供应量B由中央银行决定,中央银行的资产负债表是资产驱动负债扩张模式,所以基础货币供应量增速应当与名义GDP增速一致。假设法定存款准备金率维持当前值不变,采取移动平均法:

预测名义GDP增速、基础货币余额/名义GDP、超额准备金率和货币乘数。

预测未来两个季度(2020Q2、2020Q3)的净息差为0.41%和1.43%,由2020年一季报计算得到老16家上市银行最新净息差为1.31%。预测ROE处于逐步下行过程,预测未来两个季度(2020Q2、2020Q3)的ROE为5.00%和9.65%,由老16家上市银行2020年一季报计算得到ROE(TTM)为10.82%,对银行(中信一级)2020年的估值为7,604点(关于银行业的详细研究请参考深度报告《行业基本面量化系列之银行篇》(2019/9/24))。

2.2

房地产

影响房地产超额收益的因素包括:商品房的销售增速和房价同比增速,以及与货币和利率相关的M2同比和房贷利率水平。我们综合这些可能影响房地产超额收益的因素,设计一个综合的房地产择时策略:1、当房价同比下行、M2同比增长和首套平均房贷利率下行时,是一个非常有利于购买商品房的环境,可以预期接下来商品房销售会慢慢转暖,并且利率下行和M2同比增长也有利于房地产企业成本降低和业务扩张,这个时候做多房地产;2、当房价同比上行、M2同比下行和首套房平均房贷利率上行时,是一个极其不利于商品房的环境,可以预期接下来商品房销售会慢慢低迷,并且利率上行和M2同比放缓会增加房地产企业的成本且不利于房地产企业的业务扩张,这个时候做空房地产;3、在情形1和情形2都不满足的情况下,我们维持上期仓位,这样也能降低交易次数。

由于25-55岁人口从2018年开始下行,地产长周期下行;短周期目前依然支持做多房地产行业。

2.3

农林牧渔

全部样本农林牧渔企业的ROE和销售净利率的相关性为1,ROE和总资产周转率的相关性为-0.15,ROE和权益乘数的相关性为0.34,所以影响农林牧渔行业ROE的关键因素是销售净利率。农林牧渔行业的ROE、毛利率和销售净利率与生猪年均价的相关性分别为0.95、0.73和0.91。

2.4

行业横向对比

假设行业指数在相应年份年底收敛到根据盈利能力估计相应年份的点位,则可以推出接下来的潜在涨跌幅,进一步的我们可以把潜在涨跌幅分为估值修复贡献的涨跌幅和价值增长贡献的涨跌幅。由于行业未来盈利能力的变化,可能导致估值体系的变迁,估值收敛到历史水平是一个比较强的假设;所以,我们给予盈利增长更大的权重(估值修复更小的权重)。行业周期为按照分析师对行业未来盈利的预期结合历史盈利情况的周期定位,景气度为行业内公司业绩向好的比例。

产能周期从本质上是产业周期,周期上升期的产能扩张实际是由产业变迁推动。当一个理性的企业决定是否要投入产能时,需要考虑的是一个行业的生存问题:(1)行业现有产能是否已经开满?(2)未来行业需求是否会持续上升?(3)能否通过并购竞争者来替代投入新产能?。所以,我们通过现金流量表中企业的长期资产和并购相关现金流能够观察一家企业的产能是处于扩张状态还是收缩状态,结合经营现金流则能进一步观察产能扩张的资金来源是激进的通过外部融资还是保守地通过内生经营积累,对于整个行业的研究也是如此。

我们挑选处于中周期产能扩张阶段的未来两年价值正增长、行业周期上行和景气度上行的行业,和处于中周期产能收缩且具备高ROE和良好格局的行业;则对未来比较看好的行业有:电子、医药、食品饮料和建材,作为长期战略配置的行业。

三、多因子选股视角再开拓

2020年以来,随着北上资金的加速流入,市场风格继续维持指数优于个股的特征,也为传统的低频量化选股带来了新的挑战。我们在近半年来,从多个角度尝试进一步拓展我们的多因子选股体系和框架。不仅完成了相应因子库和体系的更新,同时也在研究领域深入挖掘,成果斐然,主要成果如下:一是基于陆股通资金构建了相应的选股因子,获取增量信息;二是基于我们深耕的分析师预期数据,从超预期与预期调整两个角度对选股策略进行了进一步优化;三是对A股传统的上市公司综合质量体系进行再挖掘;四是从最新的行为金融学视角构建逻辑清晰的新因子,使其适用于最新的市场环境;五是在机器学习领域进一步挖掘,以XGBOOST作为基础探讨机器学习方法的效果。最后,也展示了目前我们团队在跟踪的中证500和沪深300指数增强模型,在今年这些模型仍旧能够获得稳定的超额收益。

3.1

如何解读陆股通资金

3.2

分析师预期修正动量效应选股策略

为探究分析师预期调整的趋势性,我们首先选取了朝阳永续底层数据库预期EPS、利润总额、营业收入、净利润、营业利润以及目标价格(采用目标价区间均值)六个基础指标,并通过分析师覆盖度进行初步筛选。其中,除营业利润之外,其他预期指标覆盖率均值都在50%以上,且较为平稳。接下来,我们对预期EPS、利润总额、营业收入、净利润以及目标价格的第一财年FY1一致预期(即预期均值)修正趋势进行统计。数据来自朝阳永续数据库。以月度为频率进行统计,当机构当月未对指标做出预测时,用向前追溯至多半年的预期数据进行填充,测试区间为2009年7月至2019年7月十年时间,每个月月底每个机构的预测值取其最新的预测值。具体以预期EPS为例,其他指标类似:

当月EPS一致预期值=(机构1当月最新预测EPS+机构2当月最新预测EPS+…+机构n当月最新预测EPS)/n,假设最近半年有n个机构对其有预测,如某机构当月未做出预测则往前追溯至多半年的最新预期数据进行填充

当月预期EPS调整=当月EPS一致预期值-上月EPS一致预期值,当月预期EPS调整大于0则为上调,小于0则为下调,等于0则为不变。

综合来看,统计结果初步显示,分析师预期修正的调整对下一月的分析师预期值有着同向的影响。这一影响在预期EPS、净利润以及目标价格上表现得最为明显。其中,预期EPS、预期净利润和预期目标价格的上调和下调均有较强的趋势性,其可以作为后续模型的候选选股因子。

经过历史样本内回测和样本外跟踪(自2019年7月31日开始样本外跟踪),2009年7月31日至2020年5月31日,组合累计绝对收益491%,相对中证全指累计超额收益414%,年化超额收益16.3%,超额收益夏普比率1.74,超额收益最大回撤10.8%。策略超额收益如下。

3.3

分析师超预期因子选股策略

然后我们通过条件选股的方法,具体选股流程如下:每月底根据EP_TTM和过去一个月收益率两个风格因子限定样本池(即选择低估值超跌股票),然后选取净利润超预期幅度最大(ESP因子值最大)的20只股票,构建我们的超预期20组合。其中样本池踢掉了停牌、上市半年之内新股、ST和当天涨跌停的股票,另外我们每期会考虑停复牌情况固定选取20只股票(即假设这个月底有4只停牌股票,则另外选取16只股票),这个组合我们称为分析师超预期20组合。

经过历史样本内回测和样本外跟踪(自2019年9月30日开始样本外跟踪),从2009年4月至2020年(截至5月底)10年时间,组合年化收益26.10%,相对中证500指数的年化超额收益为20.92%,相对沪深300指数的年化超额收益为20.47%。组合每年相比中证500指数基本均有超额收益,2020年(截至5月底)的超额收益-4.85%,每年超额收益最大回撤只有7.4%,夏普比率达1.71。分析师超预期20组合相对中证500指数的超额收益净值如下图,最近十年的超额收益净值基本上稳定向上:

3.4

优质公司溢价根源—A股质量因子的有效性分析

对于盈利、成长与安全我们分别选取以下有效因子作为代表。

盈利因子:GPOA、ROE、ROA、CFOA

成长因子:GPOA_g,ROE_g,ROA_g,CFOA_g,GMAR_g

安全性因子:beta_bab、ROE_VOL、AT_g

在构建盈利、成长与安全性因子时,上述小类因子我们采用等权配置。我们最终选用合成大类因子后等权组合的方式来合成最终的质量因子。

我们将质量因子与传统的bp因子结合(均进行中性化后),检验了两者的相关性。发现他们确实存在明显的负相关关系,且该关系在历史上表现稳定,对高质量的公司会给出更高的估值。2014年,质量因子与估值因子的负相关性降至最低,这也和我们之前所说在2014年质量因子会有明显的回撤,市场投机氛围较重,质量受到低估有很大的关系。

3.5

行为金融学中前景理论因子的选股能力

从结果来看,TK因子和反转因子在算法上具有较高的相似性,但基于TK因子在前景理论下的原理,我们认为从个股前景价值的想法仍然是值得借鉴的。

一个很直接的想法是:投资者真的是基于收益率来对股票价值进行判断的吗?与未实现盈利量CGO因子不同,TK因子与投资者当前是否盈利或亏损并无关系,他想研究的是当前时点,投资者对不同股票的价值“打分”。这样的情况下,我们并不一定要使用历史收益率来判断股票价值,反而可以使用其他衡量公司价值的变量。在这里,我们采用一个公司质量和价格结合的信息作为替代:PB。

3.6

人工智能算法再探索—XGBOOST算法的应用

我们在中证500指数数据集上采取相同的特征工程。数据集时间为2007年初至2019年年底,我们同样在以4:1的比例划分训练集与测试集的基础上构建Xgboost选股模型。在每一期选取成分股中的部分股票,等权构成组合,以全部成分股等权收益作为基准。

因子数据预处理与前面全A股处理一致,包括按照下月收益率对把截面股票等分为10类,从小到大依次打上0到9的标签,如下月收益率最高的10%股票标签为9,下月收益率最低的10%股票标签为0。在训练集上拟合模型后,对测试集的股票预测其下月收益率所属的收益类别,并按类别计算收益率。每一类仅选取其中预测概率最大的前20只股票构成对应类的组合。

将十分类改为三分类,即下月收益率最高的1/3股票标签为2,而下月收益率最低的1/3股票标签为0,其他数据处理不变,此外考虑到对投资者来说,最关心的是算法对头尾类别(即0类和2类)的股票预测能力强弱,我们将样本权重进行调整,其中0类和2类的样本权重设为1.5,而1类的样本权重保持不变为默认值1(十分类测试中也进行过修改样本权重的尝试,结果改善微弱,不作展示),在此处理下,模型会对0类和2类样本预测错误的惩罚加大,从而达到0类和2类更准确的目的。(需强调的是,根据没有免费的午餐定理,即NFL定理,算法对于解决问题的能力或者说预期效用是和随机算法一致的,不过有的算法对于解决我们部分关注的问题效果是优于其他算法,但同时其在其他我们较弱关注的问题上必然表现差于其他算法,这里正是这样的例子,提升召回率必然会使精确率降低)。三分类中每一类选取概率最大的前50只股票构成组合。

从收益率指标来看,三分类下从0类到2类年化超额收益(等权基准)呈单调上升,2类年化超额收益最高,为10%,0类最低,为-19%,2类收益相对十分类的9类收益得到了较大幅度提升,将2类组合作为中证500指数增强组合,其年化超额收益10%,信息比率1.4,跟踪误差7.2%,2016年以来最大回撤7.8%。2011年到2019年每年均跑赢基准,月度胜率70%。

3.7

多因子模型上半年跟踪效果

目前我们在跟踪的多因子模型共有四个,一个是基于因子轮动思路出发的中证500增强策略,一个是基于因子动态调整的中证500增强策略;另两个是基于质量因子的沪深300增强以及中证500增强策略。在中期报告中,我们将其表现进行回溯与展示:

新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表新浪立场。若内容涉及投资建议,仅供参考勿作为投资依据。投资有风险,入市需谨慎。

责任编辑:逯文云

0000
评论列表
共(0)条
热点
关注
推荐