重庆理工大学学报(自然科学) ›› 2022, Vol. 36 ›› Issue (12): 110-120.

• “机器博弈”专栏 • 上一篇    

藏族久棋的一种两阶段计算机博弈算法

李霞丽,陈彦东,杨子熠   

  1. 中央民族大学 信息工程学院,北京 10008
  • 发布日期:2023-01-28
  • 作者简介:李霞丽,女,教授,主要从事计算机博弈研究,Email:xiaer_li@163.com;通讯作者 吴立成,男,教授,主要从事智 能系统及机器人、计算机博弈研究,Email:Wulicheng@tsinghua.edu.Cn

  • Published:2023-01-28

摘要: 为了进一步提升布局的质量以提升藏族久棋博弈智能体程序棋力,提出了藏族久棋 的一种两阶段计算机博弈算法,为藏族久棋的布局阶段设计了基于卷积神经网络和蒙特卡洛树搜 索的自对弈算法,通过卷积神经网络指导蒙特卡洛树进行搜索,训练出最优模型并生成质量更高 的着法;为战斗阶段设计了基于领域知识的 AlphaBeta剪枝算法。通过设计分阶段算法的方式将 深度强化学习与领域知识相结合,试图解决藏族久棋博弈算法研究棋谱数据匮乏、博弈智能体的棋力水平较低等问题。实验结果表明:基于两阶段算法的博弈智能体程序与全局使用 AlphaBeta 剪枝算法的博弈程序、人类一段棋手进行对弈,分别取得了 65%、60%的胜率。基于两阶段算法的 博弈智能体程序在一定程度上具备了“学习”和“思考”的能力,棋力得到了提升。

关键词: 藏族久棋;卷积神经网络;蒙特卡洛树搜索;自对弈;AlphaBeta剪枝

中图分类号: 

  • TP183