首页 > 技术知识 > 正文

可以自主探索现实世界环境的机器人-主动探索能力的例子

ALAN在真实的厨房环境中运行

机器人专家在过去十年左右的时间里开发了许多先进的系统,但这些系统中的大多数仍然需要一定程度的人类监督。理想情况下,未来的机器人应该自主和独立地探索未知环境,不断收集数据并从这些数据中学习。

卡耐基梅隆大学的研究人员最近发明了一种可以自主探索陌生环境的机器人代理ALAN。在arXiv上预先发表的一篇论文中介绍了这个机器人,并将在国际机器人与自动化会议(ICRA 2023)上发表,经过短暂的探索试验后,人们发现它可以成功地在现实世界中完成任务。

“我们一直对建立一种通过设定自己的目标来学习的人工智能感兴趣,”开展这项研究的研究人员之一拉塞尔·门东卡(Russell Mendonca)表示。“通过不依赖人类的监督或指导,这些代理人可以在自己的好奇心驱使下,在新的场景中不断学习。这将使他们能够不断推广到不同的领域,并发现越来越复杂的行为。”

该团队最近研究的主要目标是创建一个框架,可以应用于世界上的物理机器人,提高它们探索周围环境和完成新任务的能力。他们创造的ALAN系统能够自主学习探索环境,而不需要接受人类代理的奖励或指导。随后,它可以重新利用过去所学到的知识来解决新的任务或问题。

“ALAN学习了一个世界模型来计划它的行动,并使用以环境为中心和以代理为中心的目标来指导自己,”Mendonca解释说。“它还使用现成的预训练检测器将工作空间减少到感兴趣的区域。经过探索,机器人可以将发现的技能缝合起来,执行通过目标图像指定的单阶段和多阶段任务。”

研究人员的机器人具有一个视觉模块,可以估计周围物体的运动。然后,该模块使用这些物体如何移动的估计来最大化物体的变化,并鼓励机器人与这些物体进行交互。

卡耐基梅隆大学(Carnegie Mellon University)的机器人小组已经引入了一些自主智能体,这些智能体可以很好地执行新任务,只需很少或根本不需要额外的训练,包括一个经过训练的玩马里奥视频的模型,以及一个可以完成多阶段物体操纵任务的系统。然而,这些系统仅在模拟环境中进行训练和测试。

“这是一个以环境为中心的信号,因为它不依赖于代理人的信念,”Mendonca说。“为了提高对物体变化的估计,ALAN需要对它感到好奇。为此,ALAN使用其学习的世界模型来识别不确定预测对象变化的操作,然后在现实世界中执行这些操作。随着机器人看到更多数据,这种以智能体为中心的信号会不断发展。”

可以自主探索现实世界环境的机器人-主动探索能力的例子1

以前提出的自主机器人探索方法需要大量的训练数据。这阻碍或极大地限制了它们在真实机器人上的部署。相比之下,Mendonca和他的同事提出的学习方法允许ALAN机器人在探索周围环境的同时,连续自主地学习完成任务。

“我们发现,在两个不同的厨房 中,ALAN可以在1-2小时内学会如何操纵大约100个轨迹的物体,”Mendonca说。“因此,使用视觉先验可以大大提高机器人学习的效率。该系统的扩展版本以24/7的方式运行,将能够在跨领域的最小人为干预下不断获得新的有用技能,使我们更接近通用智能机器人。”

在最初的评估中,该团队的机器人表现非常好,因为它能够在没有任何训练或人类代理的帮助下快速学会完成新的操作任务。在未来,ALAN和支撑它的框架可以为创建更好的环境探索自主机器人系统铺平道路。

“接下来,我们想研究如何利用其他先验来帮助构建机器人的行为,比如人类执行任务的视频和语言描述,”Mendonca补充道。“能够有效地建立在这些数据基础上的系统,将能够通过在结构化空间中运行,更好地自主探索。此外,我们对多机器人系统感兴趣,这些系统可以汇集它们的经验,不断学习。”

猜你喜欢