重庆理工大学学报(自然科学) ›› 2024, Vol. 38 ›› Issue (5): 115-120.

• 机器博弈 • 上一篇    下一篇

融合经验知识与深度强化学习的久棋Alpha-Beta算法优化研究

张小川,杨小漫,涂 飞,王 鑫,严明珠,梁渝卓   

  1. 重庆理工大学两江人工智能学院,重庆401135
  • 发布日期:2024-06-24
  • 作者简介:张小川,男,教授,主要从事计算智能、计算机博弈研究,E-mail:zxc@cqut.edu.cn;通信作者杨小漫,女,硕士,主要从事计算机博弈研究,E-mail:1093550752@qq.com。

  • Published:2024-06-24

摘要: 藏族久棋作为 种传统的棋类博弈游戏,具备高度复杂的规则体系以及变幻莫测的棋局演变。传统的博弈策略在面对不同对手和棋局时不稳定,性能差,需要新的方法提高藏族久棋A1的博弈水平。以藏族久棋为研究对象,针对布局阶段,改进传统Alpha-Beta剪枝搜索算法,并结合经验知识,融入深度强化学习算法完成棋盘布局合理性的落子选择,以此为后续阶段铺路。在行棋阶段与飞子阶段,结合经验知识使用Alpha-Beta算法,完成行棋路径。最后,将所提算法和策略集成于久棋A1程序,在中国计算机博弈锦标赛中取得了良好的成绩,验证了该方法的有效性。

关键词: 藏族久棋;经验知识;Alpha-Beta 算法;深度强化学习;计算机博弈

中图分类号: 

  • TP311