重庆理工大学学报(自然科学) ›› 2021, Vol. 35 ›› Issue (12): 140-146.

• “机器博弈”专栏 • 上一篇    下一篇

一种棋类计算机博弈强化学习智能体的决策依据解释方法

刘 贺,张小川,刁志东,王 森   

  1. 重庆理工大学 两江人工智能学院
  • 发布日期:2022-01-19
  • 作者简介:刘贺,男,硕士研究生,主要从事机器博弈、机器学习研究

  • Published:2022-01-19

摘要: 提出一种针对棋类智能体,基于显著图的解释方法,用来解释棋类智能体的决策依 据。该解释方法将智能体面对的棋局状态分为落子区域和空白区域,从特征与最终决策的相关 性和重要性两方面对棋局落子区域特征进行显著性分析,同时从博弈行为角度出发,分析棋局 空白区域特征对于智能体决策的显著性,将两区域的特征显著性进行合并输出,从而较为全面 地评估整个棋局特征的显著性。针对基于强化学习的围棋智能体和国际象棋智能体,使用该方 法对智能体的决策进行解释性输出,实验结果表明:可以全面地解释智能体的决策依据,验证了 该方法的有效性。

关键词: 计算机博弈, 强化学习, 决策依据, 显著图, 解释方法

中图分类号: 

  • TP303