重庆理工大学学报(自然科学) ›› 2022, Vol. 36 ›› Issue (9): 98-109.
• 信息·计算机 • 上一篇
陈 鹏,苏志同,余肖生
摘要: 随着医疗信息化的发展,电子病历命名实体识别受到了广泛关注。电子病历中包 含大量的专业词汇,而专业词汇的切分错误会使命名实体识别效果不佳。FLAT模型在引入词 边界信息时能有效避免分词错误信息的传播,提高命名实体识别效果,但 FALT模型依赖于高 质量的词典信息。针对这一问题,提出了结合神经文本生成的 FLAT模型,使用神经文本生成 方法生成大量新病历文本,通过提出的评分函数筛选通顺的文本训练词向量作为 FLAT模型的 词典信息。实验表明:结合神经文本生成的 FLAT模型在 CCKS2017数据集上取得了 95.32% 的 F1分 数,比 BiLSTM CRF模 型 提 高 了 1.16%,比 BERTCRF模 型 提 高 了 0.89%;在 CCKS2019数据集上取得了 85.87%的 F1分数,比 BiLSTM CRF模型提高了 5.19%,比 BERT CRF模型提高了 1.34%。
中图分类号: