仅使用摄像头的自动驾驶系统
最终,将只使用 8 个摄像头来确保特斯拉的车辆可以安全地自动驾驶。
出于多种原因,这种系统是非常需要的。最明显的是,它减少了每辆车所需的技术数量,从而降低了成本和重量。正如特斯拉首席执行官埃隆马斯克在 4 月份在 Twitter 上指出的那样,“视觉具有更高的精度,因此比传感器融合更好地将视觉加倍。”
然而,使用纯视觉需要大量训练,这就是 Dojo 的用武之地。 正如TechCrunch 报道的那样,Dojo 是一种神经网络训练计算机,特斯拉打算用它来处理训练这样一个自我所需的“大量视频数据” – 驱动系统。问题是,Dojo 还不存在,但特斯拉刚刚透露了它打算用作 Dojo 原型的超级计算机。根据特斯拉人工智能总监安德烈·卡帕西 (Andrej Karpathy) 的说法,这台超级计算机由 5,760 个 GPU 组成,可提供 1.8 EFLOPS (exaFLOPS) 的性能,并由 10 PB 的 NVMe 存储支持,连接速度为 1.6 TBps。
在CVPR 2021自动驾驶研讨会上,Karpathy 解释了 LiDAR 方法如何依赖于预先创建的高清地图,然后在开车时定位到该地图。特斯拉的方法是在本地完成所有工作,依靠安装在车辆上的八个摄像头提供的视频。Karpathy 说这是一种更困难的方法,但它也比 LiDAR + HD 地图替代方案更具可扩展性,因为你根本无法足够快地更新地图数据。
特斯拉的解决方案已经足够先进,摄像头可以完成大部分繁重的工作,而且 Karpathy 确认汽车在三周前开始发货,没有雷达。该车间视频(开始观看在八个小时大关),你的镜头的八台摄像机特斯拉依靠的自治系统显示。现在特斯拉需要做的就是记录大量驾驶视频,存储 PB 级数据,并训练其系统对所有车辆都足够安全和有效。