您的位置:首页 >百科快讯 >

研究人员通过新的视觉感知方法帮助机器人在拥挤的空间中导航

多伦多大学的一组研究人员找到了一种通过耦合两种不同类型的神经网络来增强机器人系统视觉感知的方法。这项创新可以帮助自动驾驶汽车在繁忙的街道上行驶,或者使医疗机器人能够在拥挤的医院走廊中有效工作。

多伦多大学航空航天研究所助理教授乔纳森·凯利说:“在我们的领域中,往往发生的情况是,当系统性能不如预期时,设计者会扩大网络——他们会添加更多参数。”应用科学与工程学院。

“相反,我们所做的是仔细研究这些部分应该如何组合在一起。具体来说,我们研究了运动估计问题的两个部分——深度和运动的准确感知——如何以一种稳健的方式结合在一起。”

凯利太空和陆地自主机器人系统实验室的研究人员旨在建立可靠的系统,帮助人类完成各种任务。例如,他们设计了一种电动轮椅,可以自动执行一些常见任务,例如在门口导航。

最近,他们专注于帮助机器人走出如今常用的精心控制的环境,进入人类习惯于导航的难以预测的世界的技术。

“最终,我们希望为人们工作的高度动态环境开发态势感知能力,无论是拥挤的医院走廊、繁忙的公共广场还是充满交通和行人的城市街道,”凯利说。

机器人必须在所有这些空间中解决的一个具有挑战性的问题被机器人界称为“运动中的结构”。这是机器人将移动摄像机拍摄的一组图像拼接在一起以构建它们所处环境的3D模型的过程。该过程类似于人类用眼睛感知周围世界的方式。

在当今的机器人系统中,运动结构通常分两步实现,每一步都使用来自一组单目图像的不同信息。一种是深度感知,它告诉机器人其视野中的物体有多远。另一个称为自我运动,描述了机器人相对于其环境的3D运动。

“任何在空间内导航的机器人都需要知道静态和动态物体相对于自身的距离,以及它的运动如何改变场景,”凯利说。“例如,当火车沿着轨道行驶时,从窗外看的乘客可以观察到远处的物体似乎移动得很慢,而附近的物体却在飞速掠过。”

挑战在于,在许多当前系统中,深度估计与运动估计是分开的——两个神经网络之间没有明确的信息共享。将深度和运动估计结合在一起可确保彼此保持一致。

“有由运动定义的深度限制,也有由深度定义的运动限制,”凯利说。“如果系统不耦合这两个神经网络组件,那么最终结果就是无法准确估计世界上所有事物的位置以及机器人的相关位置。”

在最近的一项研究中,凯利的两个学生—博士布兰登·瓦格斯塔夫(BrandonWagstaff)。候选人,前博士。学生ValentinPeretroukhin——通过运动方法研究和改进现有结构。

他们的新系统使自我运动预测成为深度的函数,从而提高了系统的整体准确性和可靠性。他们最近在日本京都举行的智能机器人和系统国际会议(IROS)上展示了他们的工作。

“与现有的基于学习的方法相比,我们的新系统能够将运动估计误差降低约50%,”Wagstaff说。

“运动估计精度的这种改进不仅在与用于训练网络的数据相似的数据上得到了证明,而且在显着不同形式的数据上也得到了证明,这表明所提出的方法能够在许多不同的环境中进行泛化。”

在新环境中操作时保持准确性对于神经网络来说是一项挑战。此后,该团队将他们的研究扩展到视觉运动估计之外,包括惯性传感——一种类似于人耳前庭系统的额外传感器。

“我们现在正在研究可以模仿人类眼睛和内耳的机器人应用程序,它可以提供有关平衡、运动和加速度的信息,”凯利说。

“这将使运动估计更加准确,以处理戏剧性场景变化等情况-例如当汽车进入隧道时环境突然变暗,或者当相机直视太阳时出现故障。”

这种新方法的潜在应用是多种多样的,从改进自动驾驶车辆的处理到使无人机能够安全地穿越拥挤的环境以运送货物或进行环境监测。

“我们不是在制造被关在笼子里的机器,”凯利说。“我们希望设计出能够在人和环境中安全移动的健壮机器人。”

免责声明:本文由用户上传,如有侵权请联系删除!