Q学习实现亚马逊棋评估函数自调参
邱虹坤,王浩宇,王亚杰
重庆理工大学学报(自然科学) . 2022, (12): 136 -141 .