重庆理工大学学报(自然科学) ›› 2021, Vol. 35 ›› Issue (7): 259-265.doi: 10.3969/j.issn.1674-8425(z).2021.07.032

• “第四届亚洲人工智能技术大会”专栏 • 上一篇    

结合神经网络的改进 UCT在国际跳棋中的应用

王亚杰,祁冰枝,张云博,丁傲冬   

  1. 沈阳航空航天大学 工程训练中心,沈阳 110135
  • 收稿日期:2020-09-02 发布日期:2021-08-11
  • 作者简介:王亚杰,女,博士,教授,主要从事模式识别、图像融合、机器博弈研究,Email:wangyajie@sina.com;通讯作者 祁冰枝,女,硕士研究生,主要从事机器博弈研究,Email:qbz1691@163.com。
  • 基金资助:
    辽宁省兴辽英才计划项目(XLYC1906003)

  • Received:2020-09-02 Published:2021-08-11

摘要: 针对 UCT算法的准确性受搜索次数影响较大的问题,提出一种结合神经网络的改 进 UCT算法。利用神经网络输出每一步的平均行动价值 Q,结合改进的 UCT算法寻找搜索过 程中的高潜力节点。将传统 UCT搜索改进为 3个阶段:首先,通过已训练好的神经网络模型和 UCT算法对当前所有子节点进行初次搜索,获得高潜力子节点;其次,利用剪枝操作去掉部分子 节点,提升被搜索节点的质量;最后,二次搜索保留的高潜力子节点获得最优策略。另外,在分 次搜索的过程中引入节点保留数量因子 R和搜索比例因子 P,辅助分次搜索,增加搜索的有效 性。将其引入国际跳棋游戏中,实验结果表明:改进后的算法与其他算法相比胜率有所提升,验 证了该算法的可行性。

关键词: UCT算法, MCTS, 剪枝, 分次搜索, 神经网络, 机器博弈, 国际跳棋

中图分类号: 

  • TP18