重庆理工大学学报(自然科学) ›› 2019, Vol. 33 ›› Issue (12): 184-188.doi: 10.3969/j.issn.1674-8425(z).2019.12.026

• 信息·计算机 • 上一篇    下一篇

运用改进型LDA算法的电商微博热点话题研究

姚 洁,孟小璐   

  1. 福州外语外贸学院,福州 350202
  • 收稿日期:2018-11-18 发布日期:2020-01-18
  • 作者简介:姚洁,女,硕士,讲师,主要从事数据挖掘研究,E-mail:2027487@qq.com。
  • 基金资助:
    福建省中青年教师教育科研项目(JAT170729)

  • Received:2018-11-18 Published:2020-01-18

摘要: 作为每日数据高达TB级的社交网络,需要准确而有效地对电商企业发布的热点话题进行主题挖掘。在传统的主题挖掘模型(LDA)的基础上加入文本的一些属性信息(如标签、转发数、评论数、时间等属性信息),对传统的LDA模型进行改进和扩展,提出了将MA-LDA模型应用在电商微博的热点话题挖掘中。在确定合适的主题个数后,MA-LDA算法能有效抑制传统LDA算法因社交平台文本短、稀疏性强、用语不规范等问题。MA-LDA 模型主要适应于短时间内被普遍关注的微博热点话题,未对隐式电商话题进行讨论。采集腾讯微博的电商微博文本信息,最终实验结果证明了MA-LDA模型可提高电商微博热点话题识别的准确率。

关键词: 热点话题, 主题挖掘, MA-LDA, 电商微博

中图分类号: 

  • TP181