摘要: 问句相似度算法是问答系统的核心问题,直接影响着问答系统的准确性。针对公
共词块算法(CCS)对于中文文本的不适用性,提出一种改进的问句相似度算法(CNS)。该方法
结合Ngram模型及公共词块来计算问句向量的相似度,其主要思路是把问句分解成一元模型
和二元模型,然后再分析问句之间的公共词块并考虑其顺序结构。实验结果表明:新算法在
TopN条数据集的平均相似度和不同相似度阈值下的准确率均优于常用的问句相似度算法。
. 基于公共词块及Ngram模型的问句相似度算法[J]. 重庆理工大学学报(自然科学), 2017, 31(10): -.