摘要: 目前,工业机器人识别可抓取物品大多是先通过图像传感器收集作业场景信息,然 后通过粒子滤波或条件随机场等各类相关算法提取可抓取物品的像素块特征来进行的。但是, 这些可抓取物品的识别方法都存在着在同一像素块内部不同类别像素有误差,只考虑邻近区 域、而不考虑全局信息和结构信息等问题或缺点。为此,在引入基于像素点的全卷积网络(fully convolutionalnetworks,FCN)的基础上,提出了基于FCN的改进模型进行可抓取物品识别,其优 势在于该模型经过学习能够预测各个像素所属物品类别的概率,并且能将结果恢复成为背景与 前景分割的图像,从而识别作业场景中可抓取物品的位置与类别。由于FCN模型不限制输入、 输出图像的尺寸大小,所以它克服了传统卷积深度学习模型的缺点,同时也考虑了全局信息与 结构信息。以康奈尔抓取数据集(cornellgraspingdataset,CGD)作为实验样本对提出的改进模 型进行验证。实验结果表明:改进后的全卷积深度学习模型的正确率较全卷积深度学习模型提 高了6.2%,同时该方法也可用于其他分割前景的感知任务。