重庆理工大学学报(自然科学) ›› 2020, Vol. 34 ›› Issue (1): 71-76.doi: 10.3969/j.issn.1674-8425(z).2020.01.011

• 智能技术 • 上一篇    下一篇

基于非固定长度散列表的无监督式海明距离搜索

李明兰   

  1. 青岛大学 数学与统计学院,山东 青岛 26607
  • 收稿日期:2018-12-04 发布日期:2020-02-16
  • 作者简介:李明兰,女,硕士,副教授,主要从事数据检索、海明空间与欧式空间等方面研究,Email:izhijingwow@ 163.com。
  • 基金资助:
    山东省杰出青年科学基金项目(JQ201419);山东省自然科学英才基金项目(ZR2015FM023)

  • Received:2018-12-04 Published:2020-02-16

摘要: 为提高大规模数据的检索效率,提出一种无监督式的海明距离搜索方法。首先,为 了提高散列表处理效率,通过放宽尺寸约束得到具有可变长度散列键的多个散列表;然后,基于 多散列表检索概率的理论分析,通过一个搜索算法,得到适合的散列键长度(HKL)的集合,并由 此得到检索机制。实验采用了 SIFT、ANN和 Flickr三个大规模数据集,利用最小召回率和检索 阈值验证方法的性能。实验结果表明:所提方法可高效处理大规模数据集,实现了 1~3个数量 级的加速度。

关键词: 数据检索, 大规模数据集, 多散列表, 海明空间, 散列键长度

中图分类号: 

  • TP391