重庆理工大学学报(自然科学) ›› 2019, Vol. 33 ›› Issue (12): 184-188.doi: 10.3969/j.issn.1674-8425(z).2019.12.026
姚 洁,孟小璐
摘要: 作为每日数据高达TB级的社交网络,需要准确而有效地对电商企业发布的热点话题进行主题挖掘。在传统的主题挖掘模型(LDA)的基础上加入文本的一些属性信息(如标签、转发数、评论数、时间等属性信息),对传统的LDA模型进行改进和扩展,提出了将MA-LDA模型应用在电商微博的热点话题挖掘中。在确定合适的主题个数后,MA-LDA算法能有效抑制传统LDA算法因社交平台文本短、稀疏性强、用语不规范等问题。MA-LDA 模型主要适应于短时间内被普遍关注的微博热点话题,未对隐式电商话题进行讨论。采集腾讯微博的电商微博文本信息,最终实验结果证明了MA-LDA模型可提高电商微博热点话题识别的准确率。
中图分类号: