基于业绩公告相关文本的 SUE.txt 因子可以刻画 PEAD 效应盈余后价格漂移效应(PEAD)是指股价在盈余公告发布后有较大概率向业绩高于或低于预期的方向漂移。传统 SUE 因子基于公告财务数据来衡量 PEAD 效应并预测股票的异常收益,而本文尝试从纯文本的角度出发构建文本 SUE.txt 因子,对文本进行解构从而挖掘 alpha 信息。基于业绩预告与相关研报文本的数据实证表明,SUE.txt 因子具有较强的选股能力,机器学习模型对文本的拆分和解构与直观逻辑相符,模型可信度较高。最后使用华泰金工因子库对 SUE.txt 基础池进行增强,20130104-20211231 回测期年化收益 43.47%,相对中证 500 超额年化收益 29.98%;2021 年收益 52.79%。
滚动训练构建 SUE.txt 因子,特征为词频矩阵,标签为公告前后 2 日 AR本文使用的公告为业绩预告,相关文本为分析师点评业绩预告研报文本标题和摘要。在对上述文本进行分词后,保留给定词性并选择样本内标题出现次数最多的 100 词和摘要出现次数最多的 500 词构建词频矩阵,作为模型的训练特征。同时计算业绩预告发布前后 2 个交易日相对中证 500 的超额收益,将其分为“上涨”、“震荡”、“下跌”三类,作为训练标签。最后,本文分别测试了 Logistic 模型和 XGBoost 模型,将模型预测的上涨和下跌类别的 log-odds 值之差,在进行指数衰减后,作为最终的 SUE.txt 因子。
相关报告
哈佛1.6万字最新报告:中美AI霸权之争:鹿死谁手?(中英对照)
1.9w+
类型:专题
上传时间:2020-08
标签:中美、AI、人工智能)
语言:中英
金额:10元
哈尔滨工业大学:ChatGPT调研报告
1.7w+
类型:专题
上传时间:2023-03
标签:ChatGPT、OpenAI、人工智能)
语言:中文
金额:5积分
1200页2020北京智源大会文集:AI 下一个十年
1.4w+
类型:科技
上传时间:2020-11
标签:AI、人工智能、芯片)
语言:中文
金额:免费
清华-人工智能发展报告(2011-2020)
1.3w+
类型:行研
上传时间:2021-01
标签:人工智能、发展)
语言:中文
金额:5积分
深度研究:中美人工智能之比较分析
9553
类型:经管职场
上传时间:2021-08
标签:中美、人工智能、科技)
语言:中文
金额:免费
177页AI 全景报告 2020(英)
8518
类型:行研
上传时间:2020-10
标签:AI、人工智能)
语言:英文
金额:5积分
顶级投行万字报告:人工智能对经济增长的潜在巨大影响(中英对照)
7779
类型:宏观
上传时间:2023-04
标签:人工智能、经济增长、就业)
语言:中英
金额:3元
《AI未来》读书笔记
6997
类型:读书笔记
上传时间:2021-09
标签:人工智能、AI)
语言:中文
金额:9.9元
从CHAT_GPT到生成式AI(Generative AI):人工智能新范式,重新定义生产力
6821
类型:行研
上传时间:2023-01
标签:人工智能、生成式AI)
语言:中文
金额:5积分
人工智能专题课System for AI
5884
类型:学习教育
上传时间:2021-08
标签:人工智能、机器学习、神经网络)
语言:中文
金额:免费
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册