如果你在野外看到一辆自动驾驶汽车,你可能会注意到其车顶上有一个巨大的旋转圆柱。那是一个激光雷达传感器,它的工作原理是发出红外光脉冲,并测量它们在物体上反弹的时间。这将创建一个三维点的地图,作为汽车周围环境的快照。


​研究人员开发了更高效的自动驾驶汽车激光雷达


激光雷达的一个缺点是它的三维数据是巨大的和计算密集的。例如,一个典型的64通道的传感器,每秒产生超过200万个点。由于额外的空间维度,最先进的三维模型在推理时需要比其二维图像对应的计算多14倍。这意味着,为了有效地进行导航,工程师们通常首先要将数据折叠成二维--这样做的副作用是,它引入了大量的信息损失。


但是麻省理工学院的一个团队一直在研究一个自动驾驶系统,该系统使用机器学习,因此不需要定制手工调整。他们新的端到端框架可以只使用原始3D点云数据和低分辨率的GPS地图进行自主导航,类似于今天智能手机上的地图。


从原始激光雷达数据中进行端到端学习是一个计算密集型的过程,因为它涉及到给计算机提供大量丰富的感官信息来学习如何转向。正因为如此,该团队不得不实际设计新的深度学习组件,更有效地利用现代GPU硬件,以便实时控制车辆。


"我们从算法和系统的角度优化了我们的解决方案,与现有的3D激光雷达方法相比,实现了大约9倍的累积速度,"博士生刘志坚说,他与Alexander Amini是这篇论文的共同第一作者。


在测试中,研究人员表明,他们的系统减少了人类司机不得不从机器上接管的频率,甚至可以承受严重的传感器故障。


例如,想象一下自己开车穿过隧道,然后出现在阳光下--在一瞬间,你的眼睛可能会因为强光而出现问题。类似的问题也出现在自动驾驶汽车的摄像头上,以及天气状况不佳时系统的激光雷达传感器上。


为了处理这个问题,麻省理工学院团队的系统可以估计它对任何给定预测的确定程度,因此可以在做决定时给予该预测或多或少的权重。在走出隧道的情况下,它将基本上不考虑任何由于不准确的传感器数据而不应该被信任的预测。


该团队将他们的方法称为 "混合证据融合",因为它将不同的控制预测融合在一起,得出其运动规划选择。


论文的资深作者之一、麻省理工学院教授Daniela Rus说:“通过根据模型的不确定性融合控制预测,该系统可以适应意外事件。”


在许多方面,该系统本身是麻省理工学院以前三个项目的融合。


MapLite——一个手工调整的框架,用于在没有高清晰度三维地图的情况下进行驾驶。SPVNAS——一个高效的3D深度学习解决方案,优化了神经架构和推理库。阿米尼说:“我们已经采取了无地图驾驶方法的好处,并将其与端到端的机器学习相结合,这样我们就不需要专家程序员来手工调整系统。”


作为下一步,该团队计划继续扩展他们的系统,以应对现实世界中越来越多的复杂性,包括恶劣的天气条件和与其他车辆的动态互动。

免责声明

我来说几句

不吐不快,我来说两句
最新评论

还没有人评论哦,抢沙发吧~