您的位置:首页 > 财经观察 > 科技 > 正文

Facebook最新研究:4小时让机器人学会2千种操作

2021-11-16 16:02   原文来源:

  来源:VentureBeat  编辑:鹏飞【新智元导读】Facebook AI Research团队在训练两个Sawyer机械臂操作目标对象时提出了一种模式训练方法,研究人员认为许多任务学习的过程都可分为两个阶段:一是学习任务模式(如动作是抓、握、扭、拾取等),二是学习使用相关动作着力的依据(如施力位置、力的大小、目标姿势等)。通过这两个阶段的视觉图像学习,大约4到10小时即学会了2000种操作技能,成功率超过90%。 >>> 人工智能改变中国,我们还要跨越这三座大山 | 献礼 70 周年

  双臂机器人如何完成打开瓶子的任务?

  总是需要用一只手抓住瓶子的底部,同时用另一只手抓住瓶盖并拧开,这种对人类来说小儿科的操作,让机器来做就要费很多事。这种高级操作步骤,就是所谓的Schema。

  不过值得庆幸的是,它不受对象的几何和空间状态的影响。不过,与旨在通过学习策略来解决任务的强化学习技术相比,schema的优势在于:不需要在数小时、数周甚至数月的时间内提取数百万个示例。

  最近,Facebook AI Research的一个团队,试图使用两个可以从库中选择正确步骤的Sawyer机械臂来实现这个目的。在每个时间步长上,他们的智能体都必须决定使用什么技能、以及要使用哪些论据来达成目标。例如,施加力的位置、力的大小、要移动的目标姿势等等。

  尽管涉及复杂性,不过该团队表示他们的方法提高了学习效率,因此仅需几个小时的训练,机械臂就可以发现操纵技能。

  团队的主要见解是:对于许多任务,学习过程可以分为两个部分,分别是(1)学习任务模式和(2)学习为不同技能选择适当参数化的策略。

  他们认为,这种方法可以加快学习速度,部分原因是可以使用来自给定任务不同版本的数据来提高共享技能。而且,他们说这允许在相关任务之间转移学习到的模式。

  该论文的共同作者详细解释称,假设我们已经学会了一种很好的方案,在一个模拟环境中我们可以访问对象的姿势、几何信息等、以及更多内容,然后在这个模拟环境中举起个长条,那么我们就可以将该模式重新用于相关任务,例如仅从原始摄像机观察结果中拾取现实世界中的托盘。

  即使状态空间和最佳参数化(例如,抓握姿势)都存在显著差异。由于该模式是固定的,因此针对该任务栏提取任务的策略学习将非常有效,因为它仅需要学习每种技能的(与观察相关的)参数。

  研究人员为上述两个机械臂提供了一个通用的技能库,例如扭转、提升和伸展,他们必须将其应用于涉及不同对象、几何形状和初始姿势的多个横向提升、拾取、打开和旋转任务。

  在MuJoCo(模拟环境)中,通过使用低维输入数据进行训练,例如几何和本体感受特征(关节位置,关节速度,末端执行器姿势)等,然后在模拟和现实世界中都转换为可视输入。

  在实验过程中,Sawyer手臂(配备摄像头,并由Facebook的PyRobot开源机器人平台控制)的任务是操纵包括面杖、足球、玻璃罐和T型扳手在内的9个常用物品。

  完成任何任务都需要两个相互配合的爪子。尽管必须从原始视觉图像中学习,但他们说系统在大约4到10个小时的训练中学会了使用2000种技能来操纵大多数项目,并且成功率超过90%。

  论文的共同作者写道:“我们已经研究了如何利用与状态无关的技能序列来大大提高无模型强化学习的样本效率。此外,我们已经通过实验表明,将在模拟环境中学习到的技能序列,转移到现实世界中的任务,使我们能够非常有效地解决图像中的稀疏奖励问题,从而使训练真正的机器人执行诸如双手操作之类的复杂技能变得可行。”

  参考链接:https://venturebeat.com/2019/10/07/facebooks-ai-teaches-robots-to-manipulate-objects-in-less-than-10-hours-of-training/

本文首发于微信公众号:新智元。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

版权与免责声明:
1、凡本站及其子站注明"文章类型:原创"的所有作品,其版权属于中国财经观察网站及其子站所有。其他媒体、网站或个人转载使用时必须注明:"文章来源:中国财经观察网"。
2、凡本站未注明来源为"中国财经观察网"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站及其子站赞同其观点和对其真实性负责。其他媒体、网站或个人转载使用时必须保留本站注明的文章来源,并自负法律责任。
3、如您不希望作品出现在本站,可联系我们要求撤下您的作品。邮箱:sue@xsgou.com

相关阅读

    无相关信息
投诉举报:sue@xsgou.com 在线投稿:tougao@xsgou.com 广告投放:ad@xsgou.com 商业合作:bd@xsgou.com
版权声明: 本网站部分文章和信息来源互联网,并不意味着赞同其观点或证实其内容的真实性,不构成投资建议。如转载稿涉及版权等问题,请立即联系管理员,我们会予以改正或删除相关文章,保证您的权利!
版权所有: 中国财经观察报·中国财经观察网www.xsgou.com (2012-2018)互联网ICP备案 中ICP备120056699号-1
站长统计