摘要: 随着当前计算机与移动互联网中数据的增长,在海量的网络招聘数据中如何有效 挖掘可用信息成为当前教育和社会供需发展的技术瓶颈。为突破该技术瓶颈,提出了一种模糊 启发式的KNN文本分类算法:基于ABC(artificialbeecolony)的启发式搜索方法,以此来调整特 征的权重,并利用模糊距离度量方法以测量测试观察和训练观察之间的相似性。先将招聘信息 分词,利用TFIDF(termfrequencyinversedocumentfrequency)算法与AP(affinitypropagation)聚 类算法进行特征选择和噪声数据剔除,最后采用结合启发式搜索和模糊距离度量的KNN算法 对文本信息分类。通过实验结果发现:该方法有效地解决了传统KNN算法在人才需求文本分 类方法中稳定性差和分类精度低的问题。