重庆理工大学学报(自然科学) ›› 2021, Vol. 35 ›› Issue (7): 125-130.doi: 10.3969/j.issn.1674-8425(z).2021.07.015

• 智能技术 • 上一篇    

基于随机森林的 N1+N2结构语法关系判定方法研究

杨 泉   

  1. 北京师范大学 汉语文化学院,北京 100875
  • 收稿日期:2020-09-18 发布日期:2021-08-11
  • 作者简介:杨泉,女,博士,副教授,主要从事计算语言学、自然语言处理、人工智能研究,Email:yangquan@bnu.edu.cn。
  • 基金资助:
    国家语委科研项目(YB13591)

  • Received:2020-09-18 Published:2021-08-11

摘要: 提出了一种基于随机森林的 N1+N2结构语法关系分类判定方法,在自建熟语料 库的基础上,为每个短语结构建立用于分类决策树的 7个特征,使用 C4.5方法生成决策树,构 造随机森林算法,通过投票原则给出最终判断结果。经训练集学习后,在含有 1020条语料的 测试集中进行测试,正确率达到 94.8%。结果表明:使用随机森林算法进行汉语短语结构语法 关系分类判定是行之有效的。

关键词: 随机森林, 决策树, 短语层级, 语法关系, 词义相似度, 人工智能

中图分类号: 

  • TP391.1