重庆理工大学学报(自然科学) ›› 2023, Vol. 37 ›› Issue (9): 134-140.
何联格,李天华,聂远航
摘要: 针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深 度确定策略梯度算法(deepdeterministicpolicygradient,DDPG)的控制算法,以更好地解决 6轴 机械臂在三维空间中的控制难题。在 MuJoCo平台上建立仿真环境,引入所设计机械臂为测试 对象,并采用 DDPG算法、柔性动作评估算法(softactorcriticalgorithms,SAC)和双延迟深度确 定策略梯度算法(twindelayeddeepdeterministicpolicygradient,TD3)对仿真环境下的机械臂进 行了几组对比测试。研究表明:以 DDPG算法为基础的机械臂控制方法能够有效地提高机械臂 的控制精度,相对于 SAC、TD3等算法稳定性较好。
中图分类号: