基于大规模人类视频数据的视觉预训练在开发机器人操作算法方面展示了潜力。然而,人-机器人动作之间的数据域差异是实现有效迁移的关键障碍。香港科技大学团队提出HR-Align新范式,利用人类与机器人的动作对来弥合这一差距,从而提高从预训练模型中学习到的视觉系统在实际机器人任务中的性能。
2025-04-11 14
没有账号?注册  忘记密码?