重庆理工大学学报(自然科学) ›› 2024, Vol. 38 ›› Issue (5): 102-107.

• 机器博弈 • 上一篇    

一种大众麻将计算机博弈的快速出牌方法

张小川,严明珠,涂 飞,陈俊宇,魏乐天   

  1. 重庆理工大学两江人工智能学院,重庆401120
  • 发布日期:2024-06-24
  • 作者简介:张小川,男,教授,主要从事计算机软件、机器博弈研究,E-mail:zxc@cqut.edu.cn。

  • Published:2024-06-24

摘要: 麻将是 种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将 AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何在对弈中快速出牌就成为主要问题。针对以上问题,对出牌动作进行研究,以启发式快速出牌为思路,提出了面向敌方胡牌牌张的蒙特卡洛评估法,将启发式快速出牌方法和蒙特卡洛评估法相结合,对每张手牌进行估值计算,通过估值分数决定每轮出牌牌张。以历史出牌次数为分界点,以此分界将博弈过程时序化为前后2个决策时段,前段采用启发式快速出牌方法,后段采用蒙特卡洛评估法。通过前后时段法分层递进决策处理过程,给出最佳出牌着法,能有效减少出牌的决策时间并降低点炮率。采用所提方法的程序在中国计算机博弈锦标赛中获得了 等奖,证明了该方法的有效性

关键词: 计算机博弈;不完美信息博弈;麻将;启发式快速出牌;蒙特卡洛评估法

中图分类号: 

  • TP311