金融工程研究报告:基于随机森林算法的信用风险识别模型-240823-东北证券-30页

VIP专享
3.0 西装暴徒 2024-09-09 35 1.61MB 30 页 免费
侵权投诉
请务必阅读正文后的声明及说明
[Table_Info1]
证券研究报告
[Table_Date]
发布时间:2024-08-23
[Table_Invest]
信用增强前
信用增强后
年化超额
5.64%
6.71%
年化波动
3.83%
3.89%
信息比率
1.47
1.72
[Table_Report]
相关报告
《沪深 300 好大高正,华安增强严快稳省》
--20240819
ROE CFO 效率因子》
--20240816
《红利指数的投资价值分析》
--20240811
《上月波动率、规模、价值因子表现较优》
--20240803
《主动权益基金规模变化拆解和市场判断》
--20240731
[Table_Author]
证券分析师:王琦
执业证书编号:S0550521100001
021-61002390
wangqi_5636@nesc.cn
研究助理:江雨航
执业证书编号:S0550123070023
15822355669
jiangyh1@nesc.cn
[Table_Title]
证券研究报告 /金融工程研究报告
基于随机森林算法的信用风险识别模
报告摘要:
[Table_Summary]
2015-2024 年,信用债违约大致经历了初步显现集中爆发和缓和趋稳的
三个阶段。2015-2017 年,逐步出现违约事件,但数量较少。2018 年进
入爆发期,最高2019 年违约主体数量达212 ,违约金额 1226.48
亿元。2022 年后形势转好,违约主体数和金额均大幅下降但在监管趋
严的背景下,今年以来违约金额小幅同比提升,截2024/08/15,共 20
家发行主体违约,涉及债券数量 47 只,违约金额 374.44 亿元。
传统的债券违约模型包括被广泛应用的 Altman Z-score,通过计算财务
比率加权得到风险评分以及基于期权定价理论设计Merton 模型,
企业违约定义为企业资产价值小于债务账面价值,使用 Black-Scholes
式对企业股票和负债进行估值,并推算违约概率。近年来,由于机器学
习对变量形式限制较少且具有筛选能力,兼顾样本内拟合优度和样本外
预测能力,适用于二分类的监督学习算法被逐渐应用于债券市场。
基于 Logistic 归和随机森林算法,以上市公司信用债违约和信用评级
下调事件作为样本,选取能够直观反映企业资本结构及运营情况的各项
财务指标、交易性退规定相关的股票量价信息(累计成交量、平均收
盘价、累计收益等)以及债券性质相关的指标(债券余额、票面利率、
剩余期限、最新主体评级)作为特征,以每年三个业绩期为周期,采用
欠采样技术平衡训练集,通过交叉验证确定最优参数,搭建和训练信用
风险识别模型。
综合评估,随机森林模型表现更优。Logistic 回归拥有更高AUC,但
召回率仅有 0.55随机森林虽然 AUC 稍低,但召回率达到 0.86,即 Logistic
回归区分样本能力相对较强,但存在较多漏检FN的情况,鉴于信用
风险识别模型的目的为进行风险预警秉持着“宁可信其有不可信其无”
的原则,召回率更高的随机森林模型是优选。
利用信用模型识别出具有信用事件风险的信用/主体,及时进行排雷,
可一定程度上增强组合表现,规避信用暴雷的影响。以可转债为例,在
2022 半年报后的每个业绩期,使用随机森林信用风险识别模型对下一期
前可能产生信用事件的转债进行排除处理,回测结果显示今年以来低波
因子和估值因子多头表现显著改善,超额相对提升,收益波动降低,最
大回撤收窄,全区间表现也得到优化
风险提示:以上结果基于数学模型与历史数据,在模型失效的可能性
请务必阅读正文后的声明及说明 2 / 30
[Table_PageTop]
金融工程研究
1. 信用风险事件 ...................................................................................................... 4
1.1. 违约事件统计 ........................................................................................................................... 4
1.2. 信用评级下调事件统计 ........................................................................................................... 6
2. 分类模型概述 ...................................................................................................... 8
2.1. 逻辑回归(Logistic Regression ........................................................................................... 8
2.2. 随机森林(Random Forest ................................................................................................... 9
2.3. 极端梯度提升(XGBoost .................................................................................................. 10
3. 信用风险识别模型 ............................................................................................ 10
3.1. 模型搭建准备 ......................................................................................................................... 10
3.1.1. 特征的选取 ................................................................................................................................................. 10
3.1.2. 不平衡样本数据的处............................................................................................................................... 11
3.1.3. 模型评估标 ............................................................................................................................................. 12
3.1.4. 参数的调整 ................................................................................................................................................. 14
3.2. Logistic 回归 ........................................................................................................................... 15
3.3. 随机森林 ................................................................................................................................. 19
3.4. 模型效果对比 ......................................................................................................................... 23
4. 可转债因子信用增强 ........................................................................................ 23
4.1. 低波因子 ................................................................................................................................. 24
4.2. 估值因子 ................................................................................................................................. 26
5. 总结 ..................................................................................................................... 27
6. 参考文献 ............................................................................................................ 27
7. 风险提示 ............................................................................................................ 28
请务必阅读正文后的声明及说明 3 / 30
[Table_PageTop]
金融工程研究
图表目录
1:历年违约主体数量与违约金额 (2015/01/01-2024/08/15) ............................................................................. 4
2:违约类型分布:违约金额 ............................................................................................................................... 5
3:违约类型分布:违约债券数量 ....................................................................................................................... 5
4:债券类型分布:违约金额 ............................................................................................................................... 5
5:债券类型分布:违约债券数量 ....................................................................................................................... 5
6:违约债券申万一级行业分布 ........................................................................................................................... 6
7:违约债券主体最新评级分布 ........................................................................................................................... 6
8:历年信用评级下调主体与债券数量 (2015/01/01-2024/08/15) ..................................................................... 7
9:信用评级下调主体申万一级行业分布 ........................................................................................................... 7
10:信用评级下调债券类型分布 ......................................................................................................................... 7
11:信用评级下调主体上次评级分布 .................................................................................................................. 8
12:标准逻辑函数 ................................................................................................................................................. 9
13:随机森林算法示意图 ..................................................................................................................................... 9
14XGBoost 算法示意图 ................................................................................................................................... 10
15:过采样和欠采样示意图 ............................................................................................................................... 12
16:混淆矩阵示意图 ........................................................................................................................................... 13
17ROC 曲线示意图 ......................................................................................................................................... 13
18K-折交叉验证示意 ................................................................................................................................... 14
19Logistic 回归 ROC 曲线 .............................................................................................................................. 15
20Logistic 回归召回率 ..................................................................................................................................... 15
21Logistic 回归系数 ......................................................................................................................................... 17
22:随机森林单决策树最大深度分布 ............................................................................................................... 19
23:随机森林单决策树抽取特征数量分布 ....................................................................................................... 19
24:随机森林 ROC 曲线 .................................................................................................................................... 19
25:随机森林召回率 ........................................................................................................................................... 20
26:随机森林重要性前 10 的特征 ..................................................................................................................... 20
27:信用事件后 1M 可转债区间收益分布 ........................................................................................................ 24
28:信用事件后 1M 可转债区间振幅分布 ........................................................................................................ 24
29:低波因子多头信用增强前后净值对比 ....................................................................................................... 25
30:低波因子多头超额信用增强前后净值对比 ............................................................................................... 25
31:估值因子多头信用增强前后净值对比 ....................................................................................................... 26
32:估值因子多头超额信用增强前后净值对比 ............................................................................................... 26
1:信用风险识别模型特征选取 .......................................................................................................................... 11
2:训练集与测试集的划分 ................................................................................................................................. 12
3Logistic 回归 LASSO 正则化特征选中比例 ................................................................................................ 16
4Logistic 回归预测信用风险事件概率与实际情况对比(24/04/30-24/08/15) ............................................... 18
5:随机森林特征平均重要性 ............................................................................................................................. 21
6:随机森林预测信用风险事件概率与实际情况对比(24/04/30-24/08/15) ..................................................... 22
7Logistic 回归与随机森林效果对比 ............................................................................................................... 23
8:低波因子多头信用增强前后表现对比 ......................................................................................................... 25
9:低波因子多头超额信用增强前后表现对比 ................................................................................................. 25
10:估值因子多头信用增强前后表现对比 ....................................................................................................... 26
11:估值因子多头超额信用增强前后表现对比 ................................................................................................ 27

标签: #金融工程

摘要:

请务必阅读正文后的声明及说明[Table_Info1]证券研究报告[Table_Date]发布时间:2024-08-23[Table_Invest]信用增强前现信用增强后前年化超额5.64%6.71%年化波动3.83%3.89%信息比率1.471.72[Table_Report]相关报告《沪深300好大高正,华安增强严快稳省》--20240819《ROE和CFO效率因子》--20240816《红利指数的投资价值分析》--20240811《上月波动率、规模、价值因子表现较优》--20240803《主动权益基金规模变化拆解和市场判断》--20240731[Table_Author]证券分析师:王琦...

展开>> 收起<<
金融工程研究报告:基于随机森林算法的信用风险识别模型-240823-东北证券-30页.pdf

共30页,预览9页

还剩页未读, 继续阅读

作者:西装暴徒 分类:按报告类型 价格:免费 属性:30 页 大小:1.61MB 格式:PDF 时间:2024-09-09

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 30
客服
关注