重庆理工大学学报(自然科学) ›› 2024, Vol. 38 ›› Issue (5): 130-136.

• 机器博弈 • 上一篇    

维护全局博弈图的蒙特卡洛图搜索

徐长明,周其磊,王 川,王栋年,金张根,王军伟   

  1. 1.东北大学秦皇岛分校 计算机与通信工程学院,河北 秦皇岛 066004;2.东北大学研究生院,河北 秦皇岛 066004
  • 发布日期:2024-06-24
  • 作者简介:除长明,男,工学博士,讲师,主要从事基于深度学习的机器博弈、时间序列异常检测等研究,E-mail:changmingxu@heuq.edu.en;通信作者周其磊,男,本科生,主要从事机器博弈研究,E-mail:1423022996@qq.com。

  • Published:2024-06-24

摘要: AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展。而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平。在此基础上,提出了一种新的基于蒙特卡洛图搜索的方法——维护全局博弈图的蒙特卡洛图搜索算法。该方法通过维护一个全局的博弈图,采用过期结点删除算法清除无价值的结点和边,并利用对手的时间进行推理计算等措施,提高了程序的博弈水平。以海克斯棋为实验对象,结果证明,在计算资源受限情况下相比其他搜索算法胜率有所提升。

关键词: AlphaGo 系列算法;计算机博弈;蒙特卡洛图搜索;计算资源

中图分类号: 

  • TP311