债基|持仓集中度—权益基金不可忽视的点( 三 )


2.2.未来三个月收益可持续性研究
根据研究发现 , 持仓集中度类因子与未来一个月收益rankIc大体呈现负向关系 。 基金持股集中度标准差、total variance与行业配置集中度均值中部分因子通过rankIc检测 , 且持股集中度的rankIC表现整体好于行业配置集中度 。 分层检测来看 , 通过rankIc检测的因子基本没有因子具备显著分层效应 , 不过存在一定的因子存在明显尾部效应 , 例如持股集中度波动率36M、持股集中度total variance36M、行业配置集中度12M 。 综合来看 , 虽然该类维度对未来三个月收益的预测效果不高 , 但是可以通过该因子底部效应作为非线性条件来剔除一部分未来收益大概率在底部的基金 。
二、基金因子研究体系
3.数据选取与处理
针对wind分类下开放式权益基金 , 包含;股票型基金、偏股混合型、平衡混合型以及灵活配置型基金;股票基准数据选取沪深300指数 , 无风险利率选取shibor 3M 。
为了便于后期因子合成 , 我们需要对数据进行规范化预处理 , 主要包括去极值与标准化 。 去极值采用绝对中位数法 , 将极值压缩在3倍绝对中位数之间;标准化采用Z-Score方式 , 使因子均值为0方差为1 。
4单因子检测
计算因子基金t时期因子与t+1时期收益的秩相关系数RankIc , 同计算其均值、保准差、IR、胜率等指标对因子进行初步筛选 , 选取有效因子 。 对于持仓类因子 , RankIc均值定在2% , 通过RankIc均值判断因子方向性 , 有效因子的RankIc均值需要大于2% 。 对于负向因子 , RankIc均值需要小于-2% 。
5.分层检测
【债基|持仓集中度—权益基金不可忽视的点】基于单因子检测初筛后的因子需要经过分层检测 。 分层检测将按照一定频率每一期因子由高到低排序 , 分成五档构建成五组不同的策略;基于五组不同的策略 , 跑历史回测数据 , 检查这五个组合的回测收益率、夏普比率是否明显保序 。 例如正向因子 , 越大代表未来一期收益越高 , 每次筛选因子值高的策略是否一直比筛选因子值低档高 。 若有明显分层保序 , 则可以推断该因子回测有效 。
三、因子有效性检测
6.RankIc检测6.1.未来一个月收益可持续性检测
可以看出持仓集中度类因子与未来一个月收益rankIc大体呈现负向关系 。 其中基金持股集中度的波动率与total variance相对而言rankIc较显著 , 且期限越大 , 负比例越显著 , 但持股集中度过去均值的rankic总得来说不显著 。 表现较好的是基金持股集中度过去36个月total variance与标准差 。 基金行业集中度rankIc相较于持股集中度而言稍差 。 其中表现较好的是行业配置集中度过去36个月均值 。 可以看出 , 经过统计检验 , 基金持股集中度过去波动越大或约波动 , 未来一个月收益可能越小 , 但过去集中度的均值大小对未来一个月收益影响不显著 。 基金行业持仓集中度而言 , 若行业配置比例越集中 , 未来一个月收益会表现可能较差 , 波动与total variance维度相关性不显著 。