视觉(也称为计算机视觉感知环境的过程)是复杂的,原因有很多,像大多数复杂的事情一样,它可以通过许多不同的方式处理,每种方式都有其优点和缺点。在汽车中处理这项任务的一些更常见的方法包括雷达、超声波、激光雷达和普通的旧相机。
事实上,这些都不是特别擅长以足够的分辨率快速关闭一个物体,然后以足够快的速度将信息发送到汽车的计算机,使车辆能够操作它。例如,当你开车的时候,一个孩子撞到了马路上。现在你的车一定要先看到孩子,再刹车再刹车。一家名为Terranet的公司认为,它已经找到了解决这个问题的方法。该公司周四宣布,它被称为Voxelflow。
如果你和我一样,看到“体素流”这个名字后,你可能想到的第一件事就是,“什么是体素?听起来像是编的。”好吧,我也不确定,所以我向机器视觉专家安东尼罗伊博士请教了整个外行人的解释:
“体素就像一个像素。像素是二维空间中具有x和y坐标的点,就像电视上的像素一样。体素是相同的,只是它在3D空间中,所以它有一个x,y和z坐标。”
好的,那么体素流系统是如何生成需要定义空间中物体的体素云(又称点云)的呢?嗯,与大多数使用传统快门和基于传感器的相机的汽车相机不同,Voxelflow系统使用一种称为“事件相机”的设备,或者更具体地说,三个相机和一个激光器。
事件摄像机没有快门。相反,当亮度变化时,组成相机传感器的像素将独立做出反应。与基于快门的相机相比,这使得事件相机响应更快,并且运动模糊的机会更少。是不是很酷?
因此,现在我们有三个摄像头来捕捉我们试图不击中的物体的图像,但这些摄像头只能提供x和y坐标。体素流系统的一大创新是扫描激光,它可以锁定摄像头检测到的物体并提供Z坐标,在空间中定位物体并将像素转换为体素。
罗伊博士继续说道,“你可以使用多台2D相机来生成第三个坐标。”“问题是计算机处理数据需要更长的时间。激光雷达或这样的[Voxelflow]系统的使用将变得更快。”
因此,系统可以在五毫秒内看到、分析和应对可能的碰撞。但是,正如他们所说,还有更多。Voxelflow不仅在本地存储所有数据,还与奔驰合作,将其应用于奔驰的实时地图技术。
从事梅赛德斯地图和导航项目的Nihat Kuecuek描述了实时地图将使用三种物质状态(固态、液态和气态)来整合体素流数据的方式。
恒定物体(如建筑物等。)都像实体。偶尔会改变的东西——人行横道、交通灯等。就像液体一样。车辆行驶时收集的体素流数据记录了频繁变化的事物,就像气体一样。这三者都用于生成更完整的实时地图,然后将其流式传输,而不是下载到车辆上。
实时地图集成的最终结果将是更有效的导航和更安全的路线规划。传统的自动驾驶汽车会感受到这种好处,但当4级和5级自动驾驶汽车开始广泛出现在公共道路上时,这才是真正的回报。