微信扫一扫联系客服

微信扫描二维码

进入报告厅H5

关注报告厅公众号

124

NLP增强的主动权益基金标签体系-20220822-国联证券-25页

# 基金 # 2022 大小:1.48M | 页数:25 | 上架时间:2022-08-24 | 语言:中文

类型: 策略

上传者: 智释雯

撰写机构: 国联证券

出版日期: 2022-08-24

摘要:

 NLP抽取合同文本信息,全面增强基金分类基金分类是FOF管理流程的起点,传统的分类方法大都过度依赖文本或持仓信息。本文则以NLP技术深挖基金合同的文本信息,对未建仓的主动权益基金实施有监督的文本分类算法;对已建仓的基金则在聚合文本、持仓、净值等信息的基础上采用无监督的层次化聚类方法,全面增强基金分类的效果。

 对未建仓基金进行有监督的文本分类合同文本是未建仓基金唯一可用的信息,且人们常以既有的标签体系对新基金归类。本文即根据业界习惯预定义一个含15个类别的标签体系,按基金名称标注部分样本作为训练集,然后采用中文NLP领域领先的百度 ERNIE模型对主动权益基金实施有监督的文本分类。模型在测试集上的准确率达89.83%,对行业、主题类基金的预测准确率多在80%以上。

 对已建仓基金聚合文本、持仓等信息实施无监督聚类在以TF-IDF算法将量化抽取文本主题的基础上,本文从持仓组合、净值走势、交易偏好、截面特征、合同文本维度对已建仓基金画像,并实施基于预定义距离矩阵的层次化聚类。针对平替产品投资的需求,我们使用距离阈值横切出组内相似度高的社区结构;针对FOF组合投资的需求,我们先以CH指标遴选构建组间异质性强的文本聚类结构,然后结合持仓等信息优化迭代出细化、稳健的聚类体系。

 结合文本、持仓信息识别基金“风格漂移”基金分类的事前法、事后法均无法识别风格漂移现象。本文在结合文本、持仓信息聚类的基础上,提出了两种量化识别基金“风格漂移”的方法。第一种是通过度量与基准产品的文本、持仓向量距离差来定义风格漂移的产品;第二种则是在文本聚类的基础上根据组内样本的行业分布差异进行定义。

 风险提示:基金的业绩分析基于历史数据,计量模型则带有一定的假设,据此预测未来收益存在失准、失效的可能。

展开>> 收起<<

请登录,再发表你的看法

登录/注册

智释雯

相关报告

更多

浏览量

(81)

下载

(3)

收藏

分享

下载

*

投诉主题:

  • 下载 下架函

*

描述:

*

图片:

上传图片

上传图片

最多上传2张图片

提示

取消 确定

提示

取消 确定

提示

取消 确定

积分充值

选择充值金额:

30积分

6.00元

90积分

18.00元

150+8积分

30.00元

340+20积分

68.00元

640+50积分

128.00元

990+70积分

198.00元

1640+140积分

328.00元

微信支付

余额支付

积分充值

填写信息

姓名*

邮箱*

姓名*

邮箱*

注:填写完信息后,该报告便可下载

选择下载内容

全选

取消全选

已选 1