重庆理工大学学报(自然科学) ›› 2020, Vol. 34 ›› Issue (5): 187-195.doi: 10.3969/j.issn.1674-8425(z).2020.05.024

• 信息·计算机 • 上一篇    下一篇

RHS-CNN:一种基于正则化层次Softmax的CNN文本分类模型

王 勇,何养明,陈荟西,黎 春   

  1. 重庆理工大学计算机科学与工程学院,重庆 400054
  • 发布日期:2020-06-13
  • 作者简介:王勇,男,博士,副教授,主要从事人工智能、图像图形研究,E-mail:ywang@cqut.edu.cn;何养明,男,硕士研究生,主要从事自然语言处理研究,E-mail:1370865601@qq.com。
  • 基金资助:
    国家社会科学基金西部项目(17XXW005)资助;重庆市巴南区技术合作项目(2016TJ08)

  • Published:2020-06-13

摘要: 传统的卷积神经网络分类模型(CNN)的输出层采用扁平式架构的标准Softmax,在数据量较大、类别较多的文本分类任务中计算复杂度高,训练耗时长;而基于霍夫曼树(Huffmantree)构建的改进算法———层次Softmax(hierarchicalsoftmax,H-Softmax)能极大地提高训练速度,但由于加入了大量的节点参数,使得优化难度增加,优化需要更长的迭代步,且容易过拟合,继而影响模型的拟合速度和分类效果。为此,提出了改进算法模型RHS-CNN(regularizationhierarchicalsoftmaxCNN),采用正则化的方法,对H-Softmax的节点参数进行约束,避免过拟合,增强模型的泛化能力。实验分析结果表明:所提出的方法在相应评价指标上相对Softmax、H-Softmax有着一定的提升。

关键词: 文本分类, 正则化, H-Softmax, RHS-CNN

中图分类号: 

  • TP391