重庆理工大学学报(自然科学) ›› 2021, Vol. 35 ›› Issue (10): 180-186.

• 信息·计算机 • 上一篇    下一篇

基于邻域密度的Kmeans初始聚类中心优选方法

雒明雪 ,苑迎春 ,陈江薇 ,王克俭   

  1. 1.河北农业大学 信息科学与技术学院;2.河北农业大学 教务处
  • 出版日期:2021-11-09 发布日期:2021-11-09
  • 作者简介:雒明雪,女,硕士研究生,主要从事数据挖掘研究

  • Online:2021-11-09 Published:2021-11-09

摘要: 传统 Kmeans算法初始聚类中心的选择具有随机性且对离群点敏感,导致聚类结 果不稳定、准确率低等问题。针对上述问题,提出基于邻域密度的 NDKmeans算法。首先,通 过多维网格划分得到样本的网格分布特性;然后,通过定义网格密度和网格邻域密度,确定多个 局部高密度网格,同时引入迭代因子合并相邻高密度网格中心得到初始聚类中心候选集;最后, 结合网格密度和距离,利用最大最小距离算法得到 K个初始聚类中心。在 UCI数据集上进行实 验,实验结果表明:相对于其他局部邻域算法,新算法提高了聚类结果的准确率,具有较好的稳 定性。

关键词: 多维网格, 网格邻域, K-means算法, 最大最小距离

中图分类号: 

  • TP301.6