重庆理工大学学报(自然科学) ›› 2021, Vol. 35 ›› Issue (8): 136-143.doi: 10.3969/j.issn.1674-8425(z).2021.08.018
李 波,谢玖祚
摘要: 对于常用机器学习分类算法在不均衡数据上分类性能较差的问题,提出了一种基 于生成对抗网络(GAN)的不平衡数据分类策略。所提出的策略首先利用生成对抗网络通过训 练生成少数类样本,改善样本不均衡问题。使用机器学习分类器对改善后的数据集进行分类, 提升该模型的分类性能。实验使用了商业银行客户数据集,采用 Precision、Fmean等作为度量 指标,并与 SMOTE等传统数据不均衡处理方法进行对比。实验结果表明:对于不平衡数据集的 二分类问题,提出的 GAN模型在银行客户流失分类问题中具有可行性和适应性。最终取得了 良好的度量效果,有很强的适用性及应用价值。
中图分类号: