华安证券-量化研究系列报告之十一:ChatGPT与研报文本情绪的碰撞-230814-29页

VIP专享
3.0 方新侠2024 2024-08-16 101 23 2.16MB 29 页 免费
侵权投诉
敬请参阅末页重要声明及评级说明 证券研究报告
ChatGPT 与研报文本情绪的碰撞
——量化研究系列报告之十一
[Table_RptDate]
报告日期:2023-08-14
[Table_Author]
分析师:骆昱杉
执业证书号:S0010522110001
邮箱:luoyushan@hazq.com
分析师:严佳炜
执业证书号:S0010520070001
邮箱:yanjw@hazq.com
[Table_CompanyReport]
相关报告
1.股价和资金流间的引力和斥力
量化基本面系列报告之十》2023-
06-12
2.《可比公司法的量化实践:重塑价值
因子 ——量化基本面系列报告之九》
2023-03-12
3.《寻找选股策略与行业轮动策略的
“舒适区”——量化基本面系列报告
之八》2023-03-10
4.个股 alpha 与行业 beta 的双剑合
——量化基本面系列报告之七》
2022-11-23
5.《震荡行情下,如何挑选估值合
理、成长性强的“宝藏股”?——量
化基本面系列报告之六2021-12-07
主要观点:
[Table_Summary]
本篇报告探讨 ChatGPT 在金融文本中的应用,使用 ChatGPT 对分析
师点评标题进行情感评分,验证了其在金融文情绪评分方面的优越
性和实用价值。
使用 ChatGPT 对分析师点评标题进行情感评分
本文将使用 ChatGPT 分析卖方分析师对公司盈余公告点评标题中
的情感态度,探讨其在金融文本分析领域的潜力。我们通过适当的提
示、模型设置和调用策略,提升模型回复的准确性和模型使用的性价
比。从 ChatGPT 对标题情感的评分与解释看,ChatGPT 在情感分析
上表现卓越,能够准确、连续地评分,并精确捕捉关键情感信息,明显
优于传统模型BERT
GPT 评分刻画的“超预期”确能带来收益增量
我们分别尝试了使用文本方式ChatGPT 分的方式对预期
进行刻画。实证表明,ChatGPT 对于高评分的股票确实具有良好的收
益预测能力,证实了其在金融文本评分方面的优越性和实用价值。与文
本分析方法相比,通过 ChatGPT 评分筛选出的“GPT 超预期股票池数
量更多,但其整体收益表现更为出色。此外,盈余跳空因子 JOR 在全
样本、GPT 超预期和文本超预期的样本空间中的表现也表明,无论从
因子本身还是优选组合的表现,GPT 超预期样本空间下的 JOR 子有
显著收益增量,超预期 Beta 本身失效的近两年尤为突出
GPT 评分因子,新型另类因子
本文基于 ChatGPT 评分构建了“GPT 评分因子包括等权、指
衰减加权和 GPT 评分波动因子,这些因子可认为是新型另类因子。理
论上,分析师对盈余的评论主要是文字描述,很少涉及具体的数值数
据,构造的因子的预测能力难以达到很高的水平。但其在中证 500
数域中仍然显示出了一定的选股能力,2017-2023.06.30GPT 合成因
子的 RankIC 3.6%,多头年化超额为 9.3%多头组合每年均为正超
额,近三年超额分别为 7.04%17.09%2.96%
风险提示
量化模型基于历史数据,过去的回测业绩不代表未来;量化模型本身存
在失效的风险。
[Table_StockNameRptType]
金融工程
专题报告
[Table_CommonRptType]
金融工程
敬请参阅末页重要声明及评级说明 2 / 29 证券研究报告
正文目录
1 CHATGPT:金融本文情绪分析的新篇章 ..................................................................................................................................... 5
2如何使用 CHATGPT 对点评标题进行情感评分?........................................................................................................................ 6
2.1 模型输出的一致性:系统提示与模型设置 ............................................................................................................................. 7
2.1.1 提示ChatGPT 执行任务的起点 ........................................................................................................................ 7
2.1.2 优化 ChatGPT 回复质量,调整输出随机性 ........................................................................................................ 8
2.2 批量请求以提升模型调用效率 .................................................................................................................................................. 9
2.3 CHATGPT 评分的合理性与连续性 ........................................................................................................................................... 10
2.4 BERT 情感分析较难适应研报标题场景 .............................................................................................................................. 10
3 GPT 评分视角下的超预期刻画 ................................................................................................................................................... 12
3.1 文本超预期的刻画 ............................................................................................................................................................... 13
3.2 “GPT 预期刻画 ............................................................................................................................................................... 13
3.3 GPT 评分刻画的超预期是否能带来增量? ......................................................................................................................... 16
3.3.1 超预期样本池的表现 ...................................................................................................................................................... 16
3.3.2 超预期样本空间下的 JOR 因子 ................................................................................................................................. 17
3.3.3 超预期 JOR 因子测试 ................................................................................................................................................... 19
3.3.4 超预期 JOR 组合构建 ................................................................................................................................................... 20
4 透视 GPT 评分,挖掘新型另类因子 ............................................................................................................................................. 22
4.1 全域中 GPT 评分因子的表现 ................................................................................................................................................... 23
4.2 指数域中 GPT 评分因子的表现 ............................................................................................................................................... 26
5 总结 ..................................................................................................................................................................................................... 27
风险提示: ............................................................................................................................................................................................. 28
[Table_CommonRptType]
金融工程
敬请参阅末页重要声明及评级说明 3 / 29 证券研究报告
图表目录
图表 1 CHATGPT 的训练过程 ................................................................................................................................................................................. 5
图表 2 OPENAI CHAT COMPLETIONS 请求示例 ................................................................................................................................................... 6
图表 3 OPENAI CHAT COMPLETIONS 回复示例 ................................................................................................................................................... 6
图表 4 公司研究类的分析师研报数量 ................................................................................................................................................................. 6
图表 5 CHATGPT 情绪评分的提示 ........................................................................................................................................................................ 7
图表 6 OPENAI 模型的 TOKEN ........................................................................................................................................................................... 8
图表 7 CHATGPT PLAYGROUND 提问示例 ........................................................................................................................................................... 8
图表 8 API 接口成本与耗时:逐个请 ............................................................................................................................................................. 9
图表 9批量请求模板 .................................................................................................................................................................................................. 9
图表 10 CHATGPT 情绪评分示例 1 ................................................................................................................................................................... 10
图表 11 CHATGPT 情绪评分示例 2 .................................................................................................................................................................... 10
图表 12 BERT 研报标题情感分析流程 .......................................................................................................................................................... 11
图表 13 BERT 研报标题情感分析结果 .............................................................................................................................................................. 12
图表 14 盈余点评样本的年度分布情况 ....................................................................................................................................................... 12
图表 15 盈余点评样本的月度分布情况 ....................................................................................................................................................... 12
图表 16 文本超预期样本的年度分布情况 ................................................................................................................................................... 13
图表 17 文本超预期样本的月度分布情况 ................................................................................................................................................... 13
图表 18 CHATGPT 超预期主体判别能力较强 ...................................................................................................................................... 14
图表 19 CHATGPT 具备上下文语义理解能力和逻辑能力 ........................................................................................................................ 14
图表 20 CHATGPT 对盈余点评评分的分布图 ................................................................................................................................................ 15
图表 21 标题不含超预期“GPT 超预期样本示例 .............................................................................................................................. 15
图表 22 “GPT”文本超预期样本的年度分布情况 ................................................................................................................................ 16
图表 23 “GPT”文本超预期样本的月度分布情况 ................................................................................................................................ 16
图表 24 超预期样本池数量 .................................................................................................................................................................................. 16
图表 25 超预期样本池的收益指标..................................................................................................................................................................... 17
图表 26 超预期样本池的分年度收益 ................................................................................................................................................................ 17
图表 27 JOR_DELAY40 因子的构造逻辑举例 ................................................................................................................................................ 18
图表 28 超预期 JOR 子列表 ........................................................................................................................................................................... 18
图表 29 超预期 JOR 因子的覆盖度(DELAY40 ........................................................................................................................................ 18
图表 30 超预期 JOR 因子的覆盖度(DELAY60 ........................................................................................................................................ 18
图表 31 超预期 JOR 因子的分组数设置 ......................................................................................................................................................... 19
图表 32 超预期 JOR 因子的单因子测试结果 ............................................................................................................................................... 19
图表 33 超预期 JOR 因子的 RANKIC 序列 ..................................................................................................................................................... 20
图表 34 不同样本空间下 JOR 因子的分组年化收益(% .................................................................................................................... 20
图表 35 超预JOR 因子的多空净值曲线 .................................................................................................................................................... 20
图表 36 不同样本空间下 JOR 的多头分年度收益(% ......................................................................................................................... 20
图表 37 优选 50 等权组合的 指标..................................................................................................................................................................... 21
图表 38 优选 50 等权组合净值曲线 .................................................................................................................................................................. 21
图表 39 优选 50 等权组合分年度收 ............................................................................................................................................................. 21
图表 40 优选 100 等权组合的 指标 ................................................................................................................................................................... 21
图表 41 优选 100 等权组合净值曲线 ............................................................................................................................................................... 21

标签: #量化

摘要:

敬请参阅末页重要声明及评级说明证券研究报告ChatGPT与研报文本情绪的碰撞——量化研究系列报告之十一[Table_RptDate]报告日期:2023-08-14[Table_Author]分析师:骆昱杉执业证书号:S0010522110001邮箱:luoyushan@hazq.com分析师:严佳炜执业证书号:S0010520070001邮箱:yanjw@hazq.com[Table_CompanyReport]相关报告1.《股价和资金流间的引力和斥力——量化基本面系列报告之十》2023-06-122.《可比公司法的量化实践:重塑价值因子——量化基本面系列报告之九》2023-03-123.《寻...

展开>> 收起<<
华安证券-量化研究系列报告之十一:ChatGPT与研报文本情绪的碰撞-230814-29页.pdf

共29页,预览9页

还剩页未读, 继续阅读

作者:方新侠2024 分类:按报告类型 价格:免费 属性:29 页 大小:2.16MB 格式:PDF 时间:2024-08-16

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 29
客服
关注