重庆理工大学学报(自然科学) ›› 2024, Vol. 38 ›› Issue (5): 108-114.

• 机器博弈 • 上一篇    

改进深度神经网络在爱恩斯坦棋中的应用研究

蔡 彪,徐昕怡,谢 婷,胡洋成   

  1. 1.成都理工大学成都理工大学宜宾校区,四川宜宾 644000;2.成都理工大学计算机网络与安全学院,成都 610059
  • 发布日期:2024-06-24
  • 作者简介:蔡彪,男,教授,主要从事数据挖掘、机器博弈、计算机视觉研究,E-mail:caibiao@cdut.edu.cn。

  • Published:2024-06-24

摘要: 爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,使其能精确地评估各种棋盘状态,生成有效的游戏策略。通过结合改进的残差神经网络和蒙特卡洛树搜索,提取棋局特征并进行局面评估,动态生成策略和进行决策。结合强化学习,以期望胜率为准则,通过自我对弈不断优化权重,改进策略生成效果。实验结果表明:改进的深度学习方法优于全国计算机博弈大赛冠军组算法,进-步验证了深度学习方法在爱恩斯坦棋随机性完美信息博弈中的有效性和可行性。

关键词: 计算机博弈;非完美信息博弈;爱恩斯坦棋;深度神经网络

中图分类号: 

  • TP18