当前您的位置: 首页 > 科学研究 > 正文

基于图神经网络和强化学习的多机器人协作规划

时间:2025-09-22 浏览量: 作者:马聪聪

【《Science Robotics, 202593日】 Science Robotics刊登了来自Google DeepMindRoboBallet多机器人协作规划系统的研究论文 《RoboBallet: Planning for multirobot reaching with graph neural networks and reinforcement learning》。该研究提出了一种名为RoboBallet的新型框架,它结合了图神经网络(GNN)和强化学习(RL),旨在自动化地解决多机器人的任务分配、调度和运动规划问题。

RoboBallet的核心创新在于其场景的图表示和基于GNN的策略网络,它将整个协同场景抽象为“动态图”,节点(Nodes)表示每个机器人个体,其特征包含位置、速度、目标状态等;边(Edges)表示机器人之间的交互关系,通常根据空间邻近性定义。通过GNN能够高效处理这种结构化信息,使得模型具备极强的泛化能力,能够轻松应对在训练中从未见过的障碍物布局、机器人位置和任务分布。在强化学习框架设计方面,RoboBallet采微调TD3Twin-Delayed Deep Deterministic Policy Gradient)算法来训练策略网络,使模型能够生成多机械臂轨迹,同时解决任务分配、调度和运动规划等子问题。在计算效率方面,RoboBallet表现更为突出,可用于实时重新规划、动态响应环境变化等需要快速决策的场景。

南阳理工学院电子信息学科研究院马聪聪编译)