重庆理工大学学报(自然科学) ›› 2020, Vol. 34 ›› Issue (5): 139-149.doi: 10.3969/j.issn.1674-8425(z).2020.05.018

• “第二十五届全国信息检索学术会议”(CCIR2019)专栏 • 上一篇    下一篇

面向金融知识图谱的实体和关系联合抽取算法

胡 扬1,闫宏飞1,2,陈 罛3   

  1. 1.北京大学信息科学技术学院,北京 100871;2.北京大学大数据科学研究中心大数据分析与应用技术国家工程实验室,北京 100871;3.北京师范大学政府管理学院,北京 100875
  • 出版日期:2020-06-13 发布日期:2020-06-13
  • 作者简介:胡扬,女,硕士研究生,主要从事知识图谱研究,E-mail:1901213321@pku.edu.cn;闫宏飞,男,博士,副教授,主要从事计算金融研究,E-mail:yanhf@pku.edu.Cn。
  • 基金资助:
    国家自然科学基金项目(61772044,U1536201)

  • Online:2020-06-13 Published:2020-06-13

摘要: 在知识图谱的构建过程中,传统方法先进行命名实体识别,再进行关系抽取,导致任务间关联信息的丢失,而且忽略了实体间的重叠关系。为此,基于能识别重叠关系的BiLSTM+CRF模型,通过参数共享实现两个任务联合学习,充分利用任务间联系来优化结果。公开数据集上的实验结果表明:所提出模型在实体识别上取得了78.4%的f1值,在非重叠关系和重叠关系的抽取上取得了50.5%和45.0%的f1值。为验证该方法可后续用于金融知识图谱构建,提取了小型金融数据集来验证其在金融数据上的泛化能力。

关键词: 命名实体识别, 关系抽取, 联合抽取, 知识图谱

中图分类号: 

  • TP391.1