哪些行业应该分别选择股票?天丰金工因子选股系列[八大】

不同行业的股票选择在整个市场中的作用是不同的。当多因素模型被用于预测股票收益时,我们通常选择在整个市场表现较好的因素,并对它们进行加权,从而给整个市场的股票一个综合得分。

一般来说,为了确保投资组合不会过度偏离行业,基准指数将进一步用于行业中性。

这种方法隐含地假设在整个市场中具有重要因素的股票选择在各个行业中具有重要的股票选择能力,但这种假设在某些行业中是无效的。

造成这种现象的主要原因是,整个市场的有效因素在某些行业不一定有效,而整个城市的每个因素的选股能力可能与行业的选股能力不一致。

基于以上观察,我们希望能够筛选出一些行业,例如,以行业为单位,在这些行业中单独选择重要因素进行选股,而其他行业仍在选择城市市场的股票,从而提高整体投资组合的绩效。

在样本中,我们选择了一个相对全面的行业内选股因素库,包括规模、动量、波动性、流动性、估值、增长、利润等多个维度的30个因素。更全面地涵盖各种行业中可能有效的因素。

在这个因素库的基础上,根据重测区间内因素的历史表现,我们可以看出是否存在一些行业,行业内具有有效因素的选股效果优于整个市场上具有有效因素的选股效果。

样本外的行业内要素股票选择上述样本中的结论存在前瞻性偏差问题。因此,我们需要通过推出样本来筛选有效因素,从而比较行业内和行业内有效因素库存选择的绩效。

我们提出了一种在样本之外动态筛选因子的方法来检验是否有一些行业可以独立选择股票。

从调查结果来看,我们可以分别选择轻工业、非银行业、医药、食品饮料、银行业、电子元器件、计算机、电力公用事业、家电、传媒等行业的股票,也可以选择合成、煤炭、石油石化、餐饮旅游、国防军工、汽车、有色金属等行业的全市场股票。

研究背景在使用多因素模型预测股票收益时,我们通常会选择在整个市场表现较好的因素,并对其进行加权,从而对整个市场股票进行综合评分。

一般来说,为了确保投资组合不会过度偏离行业,基准指数将进一步用于行业中性。

这种方法隐含地假设在整个市场中具有重要因素的股票选择在各个行业中具有重要的股票选择能力,但这种假设在某些行业中是无效的。

首先,不同行业的影响因素可能不同。

例如,下图显示了反转因子在整个市场和银行业中的多重空表现。反转因子在整个市场中具有显著的选股能力,但在银行中不是有效因子。

第二,在不同的股票池中对同一只股票进行标准化后,因子暴露的值是不同的。

例如,下图显示了全市银行业市场价值的对数因子解极值标准化后的值,以及银行业市场价值解极值标准化后的值。

由于中国银行和招商银行的市场价值因子在全市处于极端区域,去极端化和标准化后的因子暴露是相同的,而行业内计算的因子暴露是0.3的差异。

在不同股票池中计算的因子暴露将使相邻股票因子暴露之间的距离不同,这将导致因子得分的差异。

此外,同一因素在不同行业的选股能力可能不同。

下图显示了整个市场和银行中一些常见因素的月度集成电路平均值。

可以看出,该市市场非流动性影响因子的平均集成电路值为0.09,而银行的平均集成电路值为-0.02,该市市场BP因子的平均集成电路值为0.04,银行的平均集成电路值为0.12。

如果以要素集成电路的平均值作为权重,则整个城市的要素权重偏向于市值、反转、换手等因素,而银行业的要素权重偏向于像英国石油这样的估值因素。两者在银行业的选股效果可能会有很大差异。

使用整个城市的有效因素来预测该行业的股票回报可能不如使用该行业的有效因素来预测股票回报有效。

因此,我们希望能够筛选出一些行业,例如,以行业为单位,单独选择这些行业中的重要因素进行选股,而其他行业仍在选择城市市场中的股票,从而提高整体投资组合的绩效。

我们使用以下筛选流程来筛选能够独立选股的行业:为了全面涵盖各行业可能有效的因素,我们使用了一个相对全面的因素库,包括规模、动量、波动性、流动性、估值、增长、盈利能力等多个维度的总共30个因素。

在此因子库的基础上,我们筛选了2010-2017年全市场和各行业的有效因子,并比较了复试期间全市场有效因子选股的效果和行业有效因子选股的效果。

然而,这种方法是在样本中处理的,并且存在前瞻性偏差的问题。我们在不同时间点看到的有效因素可能不同。

因此,我们提出了一种动态因子筛选方法,利用样本外有效因子的动态筛选方法来考察是否有一些行业可以独立选股。

以下是重新测试的因素列表。

我们从规模、动量和波动性三个维度构建了一个由30个因子组成的因子库。

每一个因子都被MAD(中位数溶质偏差绝对中位数法)去除极值,并执行Z分数归一化。

在行业内因素选股样本下,我们首先对整个市场和各个行业的有效因素进行重新测试和筛选,然后将各个行业的全市场有效因素选股能力与行业有效因素选股能力进行比较。

我们选股的股票池必须符合以下条件:上市时间超过6个月;脱帽后3个月以上的非ST股和ST股。

复试参数如下:复试间隔:2010 ~2017年;反测频率:每月频率;多头比例,空头:30%;库存重量:同等重量。

1整个市场和行业的影响因素我们计算2010-2017年所有因素的历史绩效。

根据以下标准筛选整个市场和各行业的影响因素:集成电路平均值的绝对值大于0.03;年ICIR高于0.69(相当于非年ICIR高于0.2);长期超额回报的平均值大于0;大于空收益均值大于0。

根据因子筛选标准,在整个市场中选择了11个因子,在最少的行业(煤)中选择了4个因子,在最多的行业(电子元件)中选择了19个因子。

影响城市市场因素的表现如下表所示:我们可以看到城市市场的流动性、增长性、动量、波动性和规模因素表现良好。

由于空间的限制,这里我们只展示银行业中有效因素的表现,如下表所示:我们可以发现银行中的估值因素表现更好,而大部分价格指数没有显著的选股能力。

全市市场总市值的对数因子为-1.25,银行为1.04。

各行业的有效因素清单见报告。

由于所选因素往往集中在大类风格中,例如,银行中表现较好的因素大多是估值类因素,且这些因素之间的共线性较高,直接因素加权会使组合过度暴露于某类因素。

为了避免各因素的共线性对选股的影响,我们对各因素进行了对称正交处理后再加权。关于对称正交的处理方法,请参阅《因子正交——理论、框架与实践》报告。

2全市场和全行业因素选股能力的比较为了能够识别哪个行业单独选股优于全城市市场,我们在每个行业中进行以下步骤:对全城市市场的有效因素进行对称正交,并与全市场24只股票中的ICIR加权,用综合得分对每只股票进行排名,得到当前行业的股票排名。我们把这种方法简称为“全市场选股模型”;行业内的有效因素是对称和正交的(行业内),由ICIR对行业内24个问题进行加权,行业内股票按综合得分排序。我们把这种方法简称为“行业股票选择模型”。比较行业内两种方法的选股能力。

让我们以一家银行为例。以下分别是全市场选股模型和行业选股模型在本行的多重空表现。

从多重空组合的相对强度曲线来看,行业选股模型的性能优于整体市场选股模型。

从下表可以看出,在银行业的独立选股中,多头年化超额从5.62%增至8.67%,多头空年化收入从12.61%增至18.97%,综合因素ICIR从0.81%增至1.59%。

然而,独立选股并不是在每个行业都有好的效果。例如,家用电器行业的独立选股使多空年化收入从34.38%降至26.51%,综合因素ICIR从2.09%降至1.73%。

经过对各行业的调查,银行、餐饮、电力和公用事业、房地产、非银行、商业和零售、电子元件等行业的选股在组合的多空年化回报率方面有了很大提高,而煤炭、石油和石化、建筑、国防和军工、钢铁、家电等行业的选股表现不如整个市场的选股表现。

具体的统计数据可以在报告中找到。

3 .前视偏差问题在样本中的上述表现是样本中的结果,并且存在前视偏差问题。

例如,从表3中可以看出,在重新测试期间,银行的市盈率倒数因子是一个有效因子,而下图显示了银行市盈率因子的多重空表现。

从相对强弱曲线来看,该因素在2014年4月至2017年2月之间没有显著的选股能力。

站在2017年2月,我们可能很难将EP因素视为银行业的一个有效因素。

下表列出了24个月来我们在不同时间点在银行业看到的有效因素。

可以看出,我们看到的有效因素在不同的时间点差异很大。

在银行业,每一个问题都由过去24个月通过动态筛选获得的有效因素加权,从而避免了前瞻性错误的问题。

下图显示了这种股票选择方法的多重空性能。在图7所示的样本中,这种组合的性能比固定因素股票选择组合的性能弱。

该组合的综合因子年化ICIR为0.83,多头年化超额为6.11%。与表4中产业内股票选择模型的表现相比,多头年化超额和综合因素ICIR均有所下降。

在实践中,为了避免前瞻性误差的问题,我们需要提供一种有效因素的动态筛选方法,并通过将筛选因素滚动出样本来比较全市场选股模型和行业选股模型的性能。

在样本行业之外的要素股票选择部分,我们首先给出了各部分的要素筛选方法,然后在此筛选方法的基础上,考察了整个市场股票选择模型与行业股票选择模型之间的差异。

1因子筛选标准总的来说,我们希望在每个部分进行因子筛选时,确保所选因子在长期内具有有效的选股能力。但是,在2017年市值和反转因素失败后,我们认为在收集长期有效因素时,应该首先选择近期表现较好的因素。

我们选择的因子选择标准如下:长期有效选股能力:因子集成电路在过去5年的绝对值大于0.03;在过去5年中,ICIR的年化系数高于0.35(即ICIR的非年化系数高于0.1);在过去5年中,要素长期超额收益的平均值大于0;在过去5年中,多因素空回报率的平均值大于0。

最近,它具有显著的选股能力:过去两年因子集成电路的绝对值高于0.03;在过去两年中,ICIR的年化系数高于0.69(即ICIR的非年化系数高于0.2);在过去2年中,要素长期超额收益的平均值大于0;在过去两年中,多因素空回报率的平均值大于0。

因子集成电路在过去5年的绝对值大于0.03;在过去5年中,ICIR的年化系数高于0.35(即ICIR的非年化系数高于0.1);在过去5年中,要素长期超额收益的平均值大于0;在过去5年中,多因素空回报率的平均值大于0。

因子集成电路在过去两年的绝对值大于0.03;在过去两年中,ICIR的年化系数高于0.69(即ICIR的非年化系数高于0.2);在过去2年中,要素长期超额收益的平均值大于0;在过去两年中,多因素空回报率的平均值大于0。

在每个部分,符合上述筛选标准的因素被选为下一阶段要配置的因素。

这里对长期选股能力的要求相对宽松。只要这些因素具有有效的选股能力,我们就会加以考虑。短期选股能力要求我们略高于长期要求。我们希望能够从长期有效因素中选择短期绩效稳定的因素进行分配。

由于为每个相位选择的因子可能不同,我们需要对这些因子进行正交化,并计算过去24个相位中正交化因子的集成电路,因此在为每个相位选择因子之后,我们将为当前相位选择的因子作为过去24个相位窗口中的对称正交性,并计算24个相位中正交因子的ICIR作为当前相位的因子分配权重。

由于我们已经度过了过去5年,后续测试将于2013年开始。

下图显示了自2013年以来银行业EP(市盈率倒数)因子的多空组合趋势,以及因子筛选后EP因子的选择时间。

由此可见,因子的选择时间是合理的。

2全市场和行业中机车车辆选择因素的选车能力比较下面,我们使用上述筛选标准对全市场和行业进行机车车辆选择。在此基础上,我们将衡量整个市场选股模型与行业选股模型之间的差异。

在每一个行业中,我们进行以下步骤:在每一个板块上筛选全市的有效因素,对过去24个周期中选择的因素进行对称正交,计算正交因素的集成电路,用整个市场24个周期的ICIR加权每只股票,用综合得分对每只股票进行排序,得到当前行业的股票排序,计算多头、多头空组合在下一个周期的实际表现,简称“滚动筛选整个市场股票选择模型”;行业中的有效因素在每个部分都进行了筛选。对于在过去24个周期内对称和正交的选定因素(在行业内),并计算正交因素,行业份额由行业内24个周期的ICIR加权,并计算多头、多头空组合在下一个周期的实际性能。我们简称为“工业车辆选择模型”;比较两种方法下组合的性能。

我们在每个行业都做了上述比较。

下面,我们将分别介绍非银行、银行、电子元器件等行业的比较业绩。其他行业的具体数据请参考报告。

非银行滚动筛选因子的股票选择能力的比较以下两个图表显示了滚动筛选市场范围股票选择模型在非银行多头对行业和多头对空中的性能。

从相对强弱曲线来看,模型的选股能力并不稳定,多头投资组合自2016年4月以来一直处于相对退出阶段。

下图显示了非银行多头对全行业和多头对空的机车车辆选择模型的性能。

可以看出,行业选股模型的multi 空表现优于整个市场选股模型,尤其是2016-2017年。

与图13和15、14和16相比,行业股票选择模型在收益和稳定性方面的性能优于整个市场股票选择模型。

上表统计了两种选股模式的具体表现。

可以看出,在非银行选股中,平均长期超额从0.82%上升到1.04%,长期超额从10.48%上升到15.72%,平均长期空收益率从1.23%上升到1.49%,长期空年收益率从14.71%上升到23.46%,综合因子ICIR从0.95上升到2.63,改善效果显著。

银行滚动筛选因子的股票选择能力比较以下两个图表显示了银行多头对行业和多头对空的滚动筛选市场范围股票选择模型的性能。

从相对强度曲线来看,模型的选股能力不显著。

以下两个数字显示了本行行业机车车辆选择模型的性能,该模型面向整个行业,面向空。

与图17和图19、图18和图20相比,行业选股模型在收益和稳定性方面优于整个市场选股模型。

上表统计了两种选股模式的具体表现。

可以看出,银行业选股中,平均长期超额从0.29%上升到0.75%,年长期超额从3.81%上升到10.69%,平均长期空收益率从1.04%上升到1.45%,年长期空收益率从14.13%上升到20.77%,综合因素ICIR从1.01上升到1.57,改善效果明显。

电子元件中滚动筛选因子的选股能力比较以下两个数字分别是电子元件中滚动筛选市场选股模型的多头对全行业和多头对空头的性能。

从相对强弱曲线来看,多头投资组合自2016年底以来一直处于相对退出阶段。

以下两幅图显示了车辆选择模型在多头对全行业和多头对空电子元件中的性能。

可以看出,与整个市场选股模型的multi 空投资组合的表现相比,行业选股模型的multi 空投资组合相对稳定,尤其是在2017年。

与图21和23、22和24相比,行业股票选择模型在收益和稳定性方面的性能优于整个市场股票选择模型。

上表统计了两种选股模式的具体表现。

可以看出,在电子元器件行业的选股中,平均长期超额从1.29%上升到1.48%,年度长期超额从19.16%上升到23.06%,平均长期空收益率从2.59%上升到3.38%,年度长期空收益率从36.72%上升到48.42%,综合因子ICIR从1.88上升到4.03,具有显著的改善效果

计算机中滚动筛选因子选股能力的比较下面两个数字分别是计算机中滚动筛选全市场选股模型多头对全行业和多头对空头的性能。

从相对强度曲线来看,multi 空组合将于2017年上半年进入退出阶段。

下图显示了计算机中车辆选择模型的多头对整个行业和多头对空头的性能。

与图25和图27、图26和图28相比,行业选股模型的多头对全行业和多头对空头组合的表现相对稳定,2017年上半年也处于上升阶段,在收益和稳定性方面优于整个市场选股模型的表现。

上表统计了两种选股模式的具体表现。

可以看出,在计算机行业的选股中,平均长期超额从1.49%上升到1.68%,年度长期超额从22.50%上升到26.75%,平均长期空收益率从2.64%上升到3.31%,年度长期空收益率从37.99%上升到49.52%,综合因子ICIR从2.60上升到3.54,改善效果明显。

电力和公用事业中滚动选择因素的选股能力比较以下两个图表显示了电力和公用事业中多头对全行业和多头对空的整个市场滚动选择模型的性能。

以下两个数字显示了电力和公用事业行业机车车辆选择模型的性能,采用多头对多头和多头对空。

与图29和图31、图30和图32相比,行业选股模型在收益和稳定性方面优于整个市场选股模型。

上表统计了两种选股模式的具体表现。

可以看出,在电力和公用事业行业的选股中,平均长期超额从0.81%上升到1.05%,年度长期超额从11.62%上升到15.46%,平均长期空收益率从1.84%上升到2.20%,年度长期空收益率从25.81%上升到30.96%,综合因素ICIR从2.30%上升到3.11%,具有明显的优势

轻工业制造业中滚动筛选因素的选股能力的比较以下两个数字显示了在轻工业制造业中多头到行业和多头到空的滚动筛选市场范围的选股模型的性能。

从相对强度曲线来看,多空组合稳定性差。

下图显示了轻工业制造中机车车辆选择模型的多头对全行业和多头对空头的性能。

与图33和图35、图34和图36相比,行业选股模型在收益和稳定性方面优于整个市场选股模型。

上表统计了两种选股模式的具体表现。

可以看出,在轻工制造业的选股中,平均长期超额从0.69%增加到1.23%,长期年度超额从9.50%增加到17.18%,平均长期空收入从1.62%增加到2.81%,长期空年度收入从22.84%增加到37.95%,综合因素ICIR变化不大。

各行业滚动筛选因子选股能力对比下表显示了各行业滚动筛选的整体市场选股模型与行业选股模型的对比效果。股票按同等重量加权。

根据行业选股模型的多空年化收益率相对于整个市场选股模型的多空年化收益率的变化率,表中行业按降序排列。

可以看出,与整体市场选股模式相比,轻工制造业、非银行、医药、餐饮、银行、电子元器件、计算机、电力公用事业、家电、媒体等行业产业内选股组合的整体绩效有了很大提高,而综合、煤炭、石油石化、餐饮旅游、国防军工、汽车、 有色金属等行业的总体市场选股模式不如,而其余行业的两种选股方法的结果相差不大。

因此,我们可以分别选择轻工业制造、非银行、医药、餐饮、银行等行业的股票,同时选择综合、煤炭、石油、石化等行业的全市场股票。

市场系统风险、有效因素变化风险。

相关报告《协方差矩阵的一般估计与评价方法》2017-11-16《因子正交策略——理论、框架与实践》,2017-10-30,基于动态风险控制的投资组合优化模型,2017-09-21,MHKQ因子时序模型在a股中的应用,2017-08-15,投资组合优化的投资组合构建,2017-08-14,半递减集成电路加权在多因子选股中的应用,2017-017 金融工程:基于动态风险控制的投资组合优化模型,2017-09-2113,2017-09- 1814,2017-09-1815,2017-09-08162017-09-0417,金融工程:MHKQ因子时序模型在a股中的应用,2017-08-1518,2017-08-14192017-08-1008

发表评论