重庆理工大学学报(自然科学) ›› 2022, Vol. 36 ›› Issue (7): 293-302.
• 数学·统计学 • 上一篇
于勤丽,于海征
摘要: 针对 SMOTE等过采样方法对每个少数类合成相同数量新样本以及合成边界噪声 样本的缺点,提出了一种改进的 SMOTE过采样方法。为提高违约用户识别率,构建高效准确的 信用风险评估模型,利用改进的 SMOTE过采样方法对不平衡数据进行平衡化处理,并构建基于 基模型差异性的 Stacking集成模型识别违约用户。为解决 Stacking模型容易出现过拟合的问 题,同时最大程度保证模型的准确率,根据 JC指标为模型自适应的选择基模型,既要保证准确 率,又要存在一定的差异性。LendingClub数据集的实验结果表明,JC指标挑选出的基分类器 所构成的 Stacking集成模型性能更优。
中图分类号: