基于统计的汉语叠词自动识别研究

重庆理工大学学报（自然科学）

• •

基于统计的汉语叠词自动识别研究

杨帆，刘亮亮

出版日期:2016-07-25 发布日期:2016-07-20

Online:2016-07-25 Published:2016-07-20

摘要/Abstract

摘要： 提出一种汉语叠词的自动获取方法。首先利用结构合理的五元组模型对分词后的语料进行统计以获得各类叠词候选集；在此基础上，通过叠词度的运算判断实现“ＡＡＢ”式、“ＡＢＢ”式、“ＡＢＡ”式、“ＡＢＡＢ”式、“ＡＡＢＢ”式叠词的自动获取；在叠词度判断的基础上，通过左、右邻接熵的运算判断实现“ＡＡ”式叠词的自动获取。该方法根据结构合理的五元组模型获得的统计信息，结合叠词度和信息熵的判断，实现了叠词的量化判断和自动获取。实验结果证明：该方法能有效实现汉语叠词的自动获取，且准确率高。

. 基于统计的汉语叠词自动识别研究[J]. 重庆理工大学学报（自然科学）, 2016, 30(7): -.

参考文献

Metrics

Viewed

Full text

809

HTML			PDF

Just accepted	Online first	Issue	Just accepted	Online first	Issue
0	0	0	0	0	809

From	Others	local

Times	794	15
Rate	98%	2%

Abstract

529

Just accepted	Online first	Issue

0	0	529

	From	Others

	Times	529
	Rate	100%

Cited

Web of Science	Crossref	ScienceDirect	Search for Citations in Google Scholar >>


This page requires you have already subscribed to WoS.

Shared

基于统计的汉语叠词自动识别研究

PDF (PC)

赞

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

Metrics

本文评价

推荐阅读 0