重庆理工大学学报(自然科学) ›› 2022, Vol. 36 ›› Issue (9): 98-109.

• 信息·计算机 • 上一篇    

结合神经文本生成的 FLAT模型的中文电子病历命名实体识别

陈 鹏,苏志同,余肖生   

  1. 三峡大学 计算机与信息学院,湖北 宜昌 44300
  • 发布日期:2022-10-31
  • 作者简介:陈鹏,男,博士,教授,主要从事大数据分析技术研究,Email:chenpeng@ctgu.edu.cn;通讯作者 余肖生,博士,副 教授,主要从事健康医疗大数据分析研究,Email:yuxiaosheng@ctgu.edu.cn。

  • Published:2022-10-31

摘要: 随着医疗信息化的发展,电子病历命名实体识别受到了广泛关注。电子病历中包 含大量的专业词汇,而专业词汇的切分错误会使命名实体识别效果不佳。FLAT模型在引入词 边界信息时能有效避免分词错误信息的传播,提高命名实体识别效果,但 FALT模型依赖于高 质量的词典信息。针对这一问题,提出了结合神经文本生成的 FLAT模型,使用神经文本生成 方法生成大量新病历文本,通过提出的评分函数筛选通顺的文本训练词向量作为 FLAT模型的 词典信息。实验表明:结合神经文本生成的 FLAT模型在 CCKS2017数据集上取得了 95.32% 的 F1分 数,比 BiLSTM CRF模 型 提 高 了 1.16%,比 BERTCRF模 型 提 高 了 0.89%;在 CCKS2019数据集上取得了 85.87%的 F1分数,比 BiLSTM CRF模型提高了 5.19%,比 BERT CRF模型提高了 1.34%。

关键词: 命名实体识别;电子病历;FLAT;神经文本生成

中图分类号: 

  • TP391.1