CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?

发布于 2025-3-18 11:12
浏览
0收藏

     

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

文章链接:https://arxiv.org/pdf/2503.10743

亮点直击

  • 与现有方法仅在笛卡尔空间中优化末端执行器姿态不同,提出了一种新颖的时空机器人图,显式地建模机器人物理配置,以指导生成动作的去噪过程。
  • 引入了一种运动学正则化器,通过引入关节空间监督来增强NBP(Next-Best Pose)学习目标。该正则化器利用前向运动学提供符合运动学约束的参考姿态,有效引导扩散过程以符合运动学约束。
  • 大量实验表明,本文提出的KStar Diffuser在仿真和实际场景中均表现优异,成功率超过基线方法10%以上。

总结速览

解决的问题

  • 物理结构约束:现有方法在预测末端执行器姿态时,往往忽略了机器人的物理结构,导致自碰撞或干涉。
  • 运动学约束:现有方法在预测末端执行器姿态时,未充分考虑运动学限制,导致预测的姿态可能超出机器人关节的实际限制。

提出的方案

提出了Kinematics enhanced Spatial-TemporAl gRaph Diffuser (KStar Diffuser) 框架,具体包括:

  • 动态时空图:根据物理双机械臂关节运动构建动态时空图,作为机器人结构条件用于去噪动作预测。
  • 可微分运动学模块:引入可微分运动学,为优化KStar Diffuser提供参考,使策略预测更可靠且符合运动学约束的末端执行器姿态。

应用的技术

  • 图卷积网络 (GCN):用于编码动态时空图,提供显式的物理约束。
  • 可微分运动学:通过可微分前向运动学将预测的关节位置映射到参考末端执行器姿态,确保生成的动作符合运动学约束。

达到的效果

  • 物理结构信息利用:有效利用物理结构信息,生成符合机器人结构的动作。
  • 运动学感知动作生成:在仿真和实际应用中生成符合运动学约束的动作,提高了动作的可靠性和可行性。

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

方法

任务定义

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

KStar Diffuser

概述

主流方法 [17, 23, 65] 训练策略以预测动作,但很少考虑决定其运动的机械机器人结构。因此,我们提出了一种时空图来建模静态物理结构和动态历史运动信息。此外,为了减少末端执行器姿态的运动学不可行预测,引入了一个可微分运动学模块,为策略网络提供运动学感知的参考。本文提出的运动学增强时空图扩散器(KStar Diffuser)的概述如下图所示。

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

骨干网络

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

学习目标为:

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

时空机器人图

物理架构影响整个机器人的运动,决定其是否能完成任务。同时,历史空间信息对未来运动也很重要。因此,我们提出了一种时空图方法,用于建模每一步的机器人架构和连续时间步的机器人运动,以表示静态空间信息和动态运动特征。

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

运动学正则化器

为了有效控制末端执行器,生成的姿态轨迹必须通过逆运动学(IK)求解器进行处理,该求解器计算关节配置以实现指定的姿态。然而,由于预测轨迹的生成未考虑机器人运动学约束,它常常超出 IK 求解器的可行范围,导致执行过程中失败率较高。为了解决这一限制,在末端执行器姿态学习目标中引入了运动学正则化器。该正则化器将预测姿态与机器人运动学约束对齐,确保生成的轨迹保持在 IK 求解器的可解空间内,从而提高轨迹执行的可靠性。

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

将可微正向运动学(DFK)引入扩散过程,使得姿态损失的梯度能够通过运动学函数反向传播,确保每个去噪步骤都符合关节约束,从而优化末端执行器的控制精度和鲁棒性。

训练与推理

训练

使用条件动作生成模式来训练 KStar Diffuser,其被建模为条件去噪扩散。损失函数定义为均方误差(MSE),如下所示:

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

实验

数据集与评估设置

数据集

双机械臂操作任务对两个机械臂之间的协调性、同步性和对称性提出了更高的要求,因此比单臂任务更具挑战性。为了评估 KStar Diffuser 在这些方面的能力,使用 RLBench2 基准测试 进行了全面的实验。RLBench2 是 RLBench 的扩展版本,专为双机械臂操作设计,包含与真实场景高度相似的任务。


评估设置

为了评估策略性能,采用成功率作为主要指标。尽管策略在执行过程中会生成多个连续动作,但我们主要关注最终目标的实现,而非中间步骤。每个任务都有其目标状态定义的成功标准。为了全面评估策略的能力,我们在训练过程中使用不同数量的演示(20 和 100)进行实验。下图 3 展示了我们的实验设置,包括仿真环境和 Cobot Agilex ALOHA 机器人。仿真任务和真实世界实验设置的详细描述见附录 B。

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

基线方法

系统地评估了 KStar Diffuser 与以下两类最先进方法的对比:

基于 Transformer 的方法

  1. 动作分块 Transformer (ACT):采用条件变分自编码器(CVAE)架构,包含用于关节角度序列预测的编码器-解码器框架。
  2. 机器人视角 Transformer 领导者跟随 (RVT-LF):以 RVT 为骨干,结合多视角 Transformer 进行跨视角信息聚合和图像重渲染,并通过领导者跟随机制进行动作预测。
  3. 感知-动作领导者跟随 (PerAct-LF):基于 PerAct 的领导者跟随范式,利用感知 Transformer 编码指令和体素观察,以生成最优体素动作。
  4. PerAct2:通过为双机械臂动作实现统一特征空间并结合自注意力机制进行同步双机械臂动作预测,增强了 PerAct。

基于扩散的方法

  1. 基于关节的扩散策略 (DP-J):在模仿学习框架中采用扩散模型进行机器人操作,专注于关节角度预测。
  2. 基于末端执行器的扩散策略 (DP-EE):重新实现了 Diffusion Policy,以预测末端执行器姿态而非关节角度,提供了一种替代控制范式。
  3. 3D 扩散策略 (DP3):通过结合点云进行关节角度预测,增强了 3D 感知能力。

与 SOTA 方法的对比结果

RLBench2 上的实验结果

如下表 1 所示,KStar Diffuser 显著优于其他最先进的基线方法,在 20 和 100 个训练演示的情况下,整体性能均提高了 20% 以上。

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

  • 类似于学习单臂策略,学习双机械臂策略的过程可以快速适应并实现较高的成功率,前提是任务轨迹分布相对一致。例如,在“推箱子”任务中,目标是让两个机械臂沿固定轨迹将箱子推向指定目标,KStar Diffuser 和其他基线模型表现良好。然而,随着任务复杂性的增加,成功率会下降。例如,在“举球”任务中,两个机械臂必须同时举起一个大球才能完成任务。任何运动的不同步都可能导致不稳定,使球滑落并最终导致任务失败。KStar Diffuser 通过显式建模两个机械臂之间的空间和运动关系,在此类双机械臂任务中实现了稳健的性能,比其他方法高出 6% 以上。
  • 与单臂系统不同,双机械臂系统具有协作操作的能力。直接从单臂操作适应到双机械臂操作的方法在任务中表现出较高的失败率,例如“拿笔记本电脑”任务,因为它们缺乏对机械臂之间空间和运动关系的考虑。具体来说,如图 4 所示,该任务涉及从柜子表面拿起一个平放的笔记本电脑。由于笔记本电脑完全贴合桌面,机械臂无法直接抓取。相反,有效的策略是控制一个机械臂将笔记本电脑从柜子向外推一小段距离,使另一个机械臂能够拿起它。KStar Diffuser 的成功率比其他方法高出约 9%,展示了其捕捉双机械臂协作操作所需协调运动模式的能力。

真实世界实验结果

为了全面评估策略的有效性,我们基于仿真基准在真实世界中构建了 2 个任务。真实世界任务的表现如下表 2 所示。

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

与仿真结果类似,未考虑双机械臂场景的策略(如 ACT、DP 和 DP3)在所有双机械臂任务中表现有限,平均成功率约为 20%。尽管 PerAct2 通过将双机械臂动作映射到共享学习空间来设计双机械臂任务,但它未能捕捉双机械臂系统的空间结构,导致执行过程中机械臂协调无效。此外,我们还发现 PerAct2 在其预测的末端执行器姿态上存在显著的逆运动学问题,包括关节配置冲突和不可达位置,如下图 4 所示。这可能是由于 PerAct2 在捕捉双机械臂系统中复杂空间约束和运动学关系方面的能力有限。相比之下,KStar Diffuser 实现了卓越的双机械臂协调能力,比其他方法高出 10% 以上,因为它成功捕捉了双机械臂之间的运动模式并预测了可行的末端执行器姿态。

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

消融实验

模型组件的影响

为了系统评估 KStar Diffuser 中每个组件的贡献,在仿真和真实环境中对“传递物品”任务进行了消融实验。我们设计了一个逐步消融的过程:首先移除可微正向运动学(DFK)模块,同时保留时空图(ST Graph),然后完全禁用时空图和运动学正则化器(KR)。下表 3 中的实验结果展示了每个组件的关键作用。移除 KR 导致成功率显著下降,在真实场景中尤为明显。这种性能下降可归因于仿真环境和真实环境之间的根本差异。仿真环境保持一致的、无噪声的输入,而真实场景引入了各种扰动(如传感器噪声和光反射),在没有 KR 正则化作用的情况下,策略更容易违反运动学约束。进一步移除 ST Graph 和 KR 会导致所有实验设置中的性能大幅下降。这一观察结果说明了两个关键点:首先,ST Graph 有效地捕捉了关节之间的时空依赖性,这对于协调机械臂之间的相对位置和交互至关重要;其次,图结构对机器人物理架构的显式编码通过保持空间和时间一致性,增强了策略对意外扰动的鲁棒性。我们对动作分块大小、历史长度和权衡系数进行了广泛的消融研究。

CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区

定性分析

在前面图 4 中进一步展示了定性分析。分别比较了 KStar Diffuser 与 DP3 和 PerAct2 在仿真和真实环境中执行双机械臂操作任务的表现。


在仿真任务中,由于笔记本电脑平放在柜子上,直接抬起是不可行的。一个机械臂开始向前推,创造空间,而另一个机械臂同时抓取并抬起笔记本电脑。KStar Diffuser 有效地建模了这种双机械臂协调,生成了精确的同步动作轨迹。相反,从单臂策略适应到双机械臂配置的 DP3 未能实现有效协调。具体来说,在执行推动动作后,右臂没有停止,阻碍了左臂的抬起过程。


在真实世界任务中,KStar Diffuser 生成了左右机械臂之间可执行的物品传递轨迹,整个任务过程中没有发生碰撞,体现了其强大的环境适应性和碰撞避免能力。相反,PerAct2 在传递过程中发生了碰撞(用红色标记),表明其对动态真实世界变量的处理能力较弱,且缺乏对机器人运动的运动学感知。

结论

本文提出了一种新颖的运动学增强时空图扩散模型(KStar Diffuser),它将机器人结构和运动学显式地结合到双机械臂运动生成过程中。该模型包括一个时空机器人图,显式建模机器人物理配置以指导生成动作的去噪过程,以及一个运动学正则化器,通过引入关节空间监督来增强 NBP 学习目标。大量实验表明,KStar Diffuser 在仿真和真实世界任务中均大幅优于基线方法。


局限性与未来方向

虽然通过 GNN 建模和运动学约束探索了机器人结构的影响,但末端执行器姿态预测和逆运动学的核心控制逻辑仍然存在。未来,我们计划利用神经网络直接建模关节运动,将机器人运动空间与人类世界的笛卡尔空间对齐。


CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?-AI.x社区


本文转自AI生成未来 ,作者:AI生成未来


原文链接:​​https://mp.weixin.qq.com/s/IjBtYRSw_h5YVJegUyrg2g​

收藏
回复
举报
回复
相关推荐