微信扫一扫联系客服

微信扫描二维码

进入报告厅H5

关注报告厅公众号

474

金工深度研究:人工智能51,文本PEAD选股策略-20220107-华泰证券-30页

# 人工智能 # PEAD选股 # 金工 大小:1.98M | 页数:30 | 上架时间:2022-01-10 | 语言:中文

类型: 策略

上传者: YXM-187

撰写机构: 华泰证券

出版日期: 2022-01-07

摘要:

基于业绩公告相关文本的 SUE.txt 因子可以刻画 PEAD 效应盈余后价格漂移效应(PEAD)是指股价在盈余公告发布后有较大概率向业绩高于或低于预期的方向漂移。传统 SUE 因子基于公告财务数据来衡量 PEAD 效应并预测股票的异常收益,而本文尝试从纯文本的角度出发构建文本 SUE.txt 因子,对文本进行解构从而挖掘 alpha 信息。基于业绩预告与相关研报文本的数据实证表明,SUE.txt 因子具有较强的选股能力,机器学习模型对文本的拆分和解构与直观逻辑相符,模型可信度较高。最后使用华泰金工因子库对 SUE.txt 基础池进行增强,20130104-20211231 回测期年化收益 43.47%,相对中证 500 超额年化收益 29.98%;2021 年收益 52.79%。

滚动训练构建 SUE.txt 因子,特征为词频矩阵,标签为公告前后 2 日 AR本文使用的公告为业绩预告,相关文本为分析师点评业绩预告研报文本标题和摘要。在对上述文本进行分词后,保留给定词性并选择样本内标题出现次数最多的 100 词和摘要出现次数最多的 500 词构建词频矩阵,作为模型的训练特征。同时计算业绩预告发布前后 2 个交易日相对中证 500 的超额收益,将其分为“上涨”、“震荡”、“下跌”三类,作为训练标签。最后,本文分别测试了 Logistic 模型和 XGBoost 模型,将模型预测的上涨和下跌类别的 log-odds 值之差,在进行指数衰减后,作为最终的 SUE.txt 因子。

展开>> 收起<<

请登录,再发表你的看法

登录/注册

YXM-187

相关报告

更多

浏览量

(410)

下载

(3)

收藏

分享

下载

*

投诉主题:

  • 下载 下架函

*

描述:

*

图片:

上传图片

上传图片

最多上传2张图片

提示

取消 确定

提示

取消 确定

提示

取消 确定

积分充值

选择充值金额:

30积分

6.00元

90积分

18.00元

150+8积分

30.00元

340+20积分

68.00元

640+50积分

128.00元

990+70积分

198.00元

1640+140积分

328.00元

微信支付

余额支付

积分充值

填写信息

姓名*

邮箱*

姓名*

邮箱*

注:填写完信息后,该报告便可下载

选择下载内容

全选

取消全选

已选 1