丰田研究院在计算机视觉国际会议上宣布机器学习进展

2022-03-18 23:18:20
导读 丰田研究院 (TRI) 在国际计算机视觉会议 (ICCV) 上宣布接受机器学习领域的六篇研究论文。该研究促进了对机器人感知至关重要的各种任务

丰田研究院 (TRI) 在国际计算机视觉会议 (ICCV) 上宣布接受机器学习领域的六篇研究论文。该研究促进了对机器人感知至关重要的各种任务的理解,包括语义分割、3D 对象检测和多对象跟踪。

在过去六年中,TRI 的研究人员在机器人技术、自动驾驶和材料科学方面取得了重大进展,这在很大程度上归功于机器学习——计算机算法的应用,随着经验和数据的不断改进。

“机器学习是我们研究的基础,” TRI 首席执行官Gill Pratt博士说。“我们正在努力在机器学习学科本身创造科学突破,然后将这些突破应用于加速机器人技术、自动驾驶以及电池测试和开发方面的发现。”

随着计算机视觉国际会议 (ICCV) 的开始,TRI 分享了六篇论文,展示了 TRI 在机器学习方面的强大研究,包括用于 3D 视觉的几何深度学习、自我监督学习和模拟到真实或“模拟到真实”的迁移。

“在机器学习领域,可扩展的监督是我们关注的重点,” TRI 机器学习团队负责人Adrien Gaidon说。“以丰田的规模手动标记你需要的所有东西是不可能的,但这是最先进的方法,特别是对于深度学习和计算机视觉。幸运的是,我们可以利用丰田在车辆、机器人或电池方面的专业知识来发明可扩展监督的替代形式,无论是通过模拟还是从原始数据中进行自我监督学习。这种方法可以提高各种任务的性能,这对于自动驾驶汽车随时随地更安全、机器人学习更快、电池开发加快漫长的测试周期。”

在ICCV接受的六篇论文中,TRI 研究人员报告了几个关键发现。值得注意的是,他们表明几何自监督学习显着改善了场景理解的模拟到真实传输。由此产生的无监督域适应算法 能够识别真实世界的类别,而不需要任何昂贵的手动真实世界标签。

此外,TRI 对多对象跟踪的研究 表明,合成数据可以赋予机器基本的人类认知能力,例如对象持久性,这在历史上对机器学习模型来说很难,但对人类来说是第二天性。这一新发展增加了计算机视觉算法的鲁棒性,使其更符合人们的视觉常识。

最后,TRI 对伪激光雷达的研究 表明,大规模的自我监督预训练大大提高了基于图像的 3D 对象检测器的性能。所提出的几何预训练能够从有限的 3D 标签中训练强大的 3D 深度学习模型,这些标签很昂贵,有时甚至无法仅从图像中获得。

免责声明:本文由用户上传,如有侵权请联系删除!