微信扫一扫联系客服

微信扫描二维码

进入报告厅H5

关注报告厅公众号

494

机器学习系列报告之二:机器学习合成非线性因子,增强效果如何?-20210312-申万宏源-42页

# 机器学习 # 合成非线性因子 大小:2.60M | 页数:42 | 上架时间:2021-03-15 | 语言:中文

类型: 行研

上传者: ZF报告分享

撰写机构: 申万宏源

出版日期: 2021-03-12

摘要:

⚫ 因子有效性随市场变化,因子合成面临挑战。在经典的多因子选股框架里,等权法合成因子较为常见,特点是简单直观,但无法体现因子间的差异。IC 加权法包含了因子的动量信息,以及因子之间的差异,但无法体现因子之间的交互作用。而机器学习可以寻找大量数据之间的映射(非线性)关系。

⚫ 机器学习因子合成:使用规模、估值、分红、盈利、财务质量、成长、反转、波动率、流动性、分析师一致预期10 大类风格因子。应用机器学习模型,进行24 个月滚动训练。

分别测试逻辑回归、朴素贝叶斯、支持向量机、决策树、随机森林、梯度提升树、XGBoost、 LightGBM、神经网络九种模型。

⚫ 合成因子的多头组合相对等权组合有一定的增强作用,空头组合不同机器学习模型表现分化加大。多头组合中神经网络表现最好,其次是随机森林和XGBoost。决策树表现最差,几乎没有提升效果。空头组合中基于决策树的集成模型表现最好,较好地控制了年化波动率和最大回撤。合成因子多数年份表现优于追求动量的IC 加权法,2017、2018 年表现较差。

⚫ 通过对单因子的边际依赖函数进行线性回归拟合,可以将单因子的边际影响拆分为线性和非线性两部分。以神经网络为例在2020 年的训练结果为例,规模、流动性、盈利、成长因子的变化对预测值的非线性影响较大,而分红、财务质量、分析师一致预期的变化则几乎全部为线性影响。机器学习模型训练过程中,各类因子的贡献变化与IC 的变化较为一致。

⚫ 合成因子与流动性、波动率这两个因子相关性最高,其次是反转、估值、规模,与财务质量因子相关性最低。机器学习模型或许更适用于技术面因子,但提升的是空头组合收益。

基本面因子的回测结果显示,不论是多头组合还是空头组合,机器学习模型相对于等权组合并没有提升。而从技术面因子的回测结果看,机器学习模型可以一定程度上提高空头组合的年化表现。

⚫ 在特征和数据较少的情况下,模型很难充分学习数据的特征。在这种情况下,线性模型的表现也要优于复杂的非线性模型。将样本池由全市场换为中证500,由于训练样本数量明显减少,机器学习模型的效果并不突出。对于多头组合的表现并没有提升效果,可以一定程度上提升空头组合的表现。即使我们已经尽量避免使用复杂度过高的模型,但机器学习的表现非常依赖于数据量和特征数。

⚫ 风险提示:机器学习模型根据历史数据构建,历史表现不代表未来,市场环境发生重大变化时可能失效。

展开>> 收起<<

请登录,再发表你的看法

登录/注册

相关报告

更多

浏览量

(409)

下载

(5)

收藏

分享

下载

*

投诉主题:

  • 下载 下架函

*

描述:

*

图片:

上传图片

上传图片

最多上传2张图片

提示

取消 确定

提示

取消 确定

提示

取消 确定

积分充值

选择充值金额:

30积分

6.00元

90积分

18.00元

150+8积分

30.00元

340+20积分

68.00元

640+50积分

128.00元

990+70积分

198.00元

1640+140积分

328.00元

微信支付

余额支付

积分充值

填写信息

姓名*

邮箱*

姓名*

邮箱*

注:填写完信息后,该报告便可下载

选择下载内容

全选

取消全选

已选 1