重庆理工大学学报(自然科学) ›› 2019, Vol. 33 ›› Issue (10): 155-160.doi: 10.3969/j.issn.1674-8425(z).2019.10.024

• 信息·计算机 • 上一篇    下一篇

基于Transfer-crf 神经网络的电子表格智能识别算法

毛尚伟1,2,张志清3,汤 槟1,2, 郑成坤1,2,翟 波1,2,符云清3   

  1. (1.中冶赛迪技术研究中心有限公司,重庆 401122;2.重庆中冶赛迪信息技术有限公司,重庆 401122;3. 重庆大学,重庆 400044)
  • 收稿日期:2019-03-28 出版日期:2019-12-10 发布日期:2019-12-10
  • 作者简介:毛尚伟,男,硕士,高级工程师,主要从事软件工程、计算智能、数据挖掘等方面的研究,E-mail:ShangWei.Mao@cisdi.com.cn。
  • 基金资助:
    重庆市人工智能技术创新重大主题专项重点研发项目(cstc2017rgzn-zdyfX0042)

  • Received:2019-03-28 Online:2019-12-10 Published:2019-12-10

摘要: 电子表格是一种使用非常广泛的数据存储和分析工具,但其数据结构形式多样、结构复杂。为了快速准确地识别电子表格结构,提出了基于深度学习序列标注模型的电子表格结构自动识别方法。 首先,确定待识别的电子表格数据结构;其次,采用中国国家统计局数据对模型进行训练;最后,将本文提出的算法与基于条件随机场序列标注的电子表格结构识别方法进行实验对比。实验结果表明:提出的算法在多个评估指标上都取得了较好的结果。

关键词: 电子表格, 结构识别, 行类别识别

中图分类号: 

  • TP18