重庆理工大学学报(自然科学) ›› 2020, Vol. 34 ›› Issue (6): 189-194.doi: 10.3969/j.issn.1674-8425(Z).2020.06.027

• 信息·计算机 • 上一篇    下一篇

基于FP-growth关联规则的图书馆数据快速挖掘算法研究

文 芳1,黄慧玲1,李腾达1,王佳斌2   

  1. 1.南昌师范学院,南昌 330032;2.华侨大学 工学院,福建 泉州 36202
  • 收稿日期:2019-05-23 发布日期:2020-07-08
  • 作者简介:文芳,女,馆员,硕士,主要从事图书情报?图书信息化研究,E-mail:uerwenwenfang@163.com;黄慧玲,女,副 研究馆员,主要从事图书情报?信息化建设。
  • 基金资助:
    江西省社会科学规划项目“面向 MOOCs环境高校图书馆的功能定位研究”(15YD006);厦门市科技局产 学研协同创新项目(3502Z20173046)

  • Received:2019-05-23 Published:2020-07-08

摘要: 作为一种模糊关联规则挖掘算法,FP-growth算法在执行效率上明显优于 Apriori算 法。但是由于模糊属性的不足和空间复杂度较大,导致 FP-growth算法在处理大型事务数据库, 例如图书馆数据库时,无法实现有效的多层关联规则挖掘。因此,提出一种改进的 FP-growth关 联规则算法,能够快速向读者进行个性化图书推荐。首先,该算法把大型图书事务数据库根据 首项的事务,划分为若干子数据库,并构建相应的子 FP-tree结构;然后,采用实时过滤掉层次树 中不是频繁项的父项来缩小扫描空间。实验结果表明:相比 Apriori算法和标准 FP-growth算 法,提出的改进 FP-growth关联规则算法在运行效率方面有明显提升,为图书的推荐工作提供了 科学依据。

关键词: 数据挖掘, 图书馆, 模糊关联规则, Apriori, FP-growth, 运行效率

中图分类号: 

  • TP391