重庆理工大学学报(自然科学) ›› 2023, Vol. 37 ›› Issue (4): 174-181.
魏晓聪,于 澜
摘要: 中文在线教育评论情感识别在很大程度上受到有标注数据不足的限制,针对此问 题,基于 806门中国大学 MOOC以自动和人工相结合的方式构建中文慕课情感识别语料库,共 计 10340条评论,其中褒义 5411条,贬义 4929条,保证了语料库的平衡性和学科覆盖的广泛 性。制定语料收集和预处理策略、标注规范、标注体系、一致性检测方法;提出了神经网络模型 以及基于大规模预训练语言模型的情感识别方法;实现了情感识别结果面向教学管理部门、教 师 2种使用角色的应用。该语料库为面向在线教育评论的情感分析研究奠定数据基础,对赋能 教学评价、助力智能教学系统具有重要意义。
中图分类号: