重庆理工大学学报(自然科学) ›› 2022, Vol. 36 ›› Issue (7): 293-302.

• 数学·统计学 • 上一篇    

基于改进 SMOTE自适应集成的信用风险评估模型

于勤丽,于海征   

  1. 新疆大学 数学与系统科学学院,乌鲁木齐
  • 发布日期:2022-08-17
  • 作者简介:于勤丽,女,硕士研究生,主要从事机器学习研究,Email:1693496911@qq.com;通讯作者 于海征,男,博士,副 教授,主要从事大数据分析研究,Email:haizheng_yu@163.com。

  • Published:2022-08-17

摘要: 针对 SMOTE等过采样方法对每个少数类合成相同数量新样本以及合成边界噪声 样本的缺点,提出了一种改进的 SMOTE过采样方法。为提高违约用户识别率,构建高效准确的 信用风险评估模型,利用改进的 SMOTE过采样方法对不平衡数据进行平衡化处理,并构建基于 基模型差异性的 Stacking集成模型识别违约用户。为解决 Stacking模型容易出现过拟合的问 题,同时最大程度保证模型的准确率,根据 JC指标为模型自适应的选择基模型,既要保证准确 率,又要存在一定的差异性。LendingClub数据集的实验结果表明,JC指标挑选出的基分类器 所构成的 Stacking集成模型性能更优。

关键词: 过采样;Stacking模型;自适应集成;不平衡数据集

中图分类号: 

  • TP92 F830