基于邻域密度的Kmeans初始聚类中心优选方法

重庆理工大学学报（自然科学） ›› 2021, Vol. 35 ›› Issue (10): 180-186.

基于邻域密度的Kmeans初始聚类中心优选方法

雒明雪，苑迎春，陈江薇，王克俭

1.河北农业大学信息科学与技术学院;2.河北农业大学教务处

出版日期:2021-11-09 发布日期:2021-11-09
作者简介:雒明雪，女，硕士研究生，主要从事数据挖掘研究

Online:2021-11-09 Published:2021-11-09

摘要/Abstract

摘要： 传统Ｋｍｅａｎｓ算法初始聚类中心的选择具有随机性且对离群点敏感，导致聚类结果不稳定、准确率低等问题。针对上述问题，提出基于邻域密度的ＮＤＫｍｅａｎｓ算法。首先，通过多维网格划分得到样本的网格分布特性；然后，通过定义网格密度和网格邻域密度，确定多个局部高密度网格，同时引入迭代因子合并相邻高密度网格中心得到初始聚类中心候选集；最后，结合网格密度和距离，利用最大最小距离算法得到Ｋ个初始聚类中心。在ＵＣＩ数据集上进行实验，实验结果表明：相对于其他局部邻域算法，新算法提高了聚类结果的准确率，具有较好的稳定性。

关键词: 多维网格, 网格邻域, K-means算法, 最大最小距离

中图分类号:

TP301.6

. 基于邻域密度的Kmeans初始聚类中心优选方法[J]. 重庆理工大学学报（自然科学）, 2021, 35(10): 180-186.

[1]	. 基于大数据的改进模糊Ｋ-ｍｅａｎｓ算法[J]. 重庆理工大学学报（自然科学）, 2018, 32(12): -.
[2]	. 基于动态离差平方和准则的无监督机器学习[J]. 重庆理工大学学报（自然科学）, 2018, 32(11): -.

基于邻域密度的Kmeans初始聚类中心优选方法

PDF (PC)

赞

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 2

Metrics

本文评价

推荐阅读 0