观点:如何理解自动驾驶领域的“热”和“乱”?
黄浴
讲述:初明明大小:4.38M时长:04:47
谈到自动驾驶现状,有人说“热”和“乱”,其实正常。众多有钱的公司都投入的方向能不热吗,而乱说明了它的“新”,实践方面的”新“。
所谓“乱”,主要因为它没有唯一的方向。目前自动驾驶发展基本两条路,一条是谷歌和百度走的,直接做 L4 级别的自动驾驶;另外一条是 Mobileye 和 Tesla 走的,从 L2 做起再演进到 L3/L4 (其实主机厂基本也是这条路,只是不是软件 OTA 模式,而是需要硬件一起迭代升级)。
谷歌和百度一类互联网公司,现金流充足,利润客观,可以不计较成本,索性直接做技术最有挑战性的东西。另外一些做 L4 的创业公司,主要靠 VC 输血。
现在有一种观点认为, L2 演进到 L3/L4 存在系统障碍,我不这么认为。我们分析一下:首先,感知是一样的,越成熟越好。其次,规划会发生变化,特别是采用高清地图的话。再者,控制都一样,相对来说,互联网公司没有多少这方面的积累,最好用线控(wire control)车以及电动车方便。V2X 目前还没有普及,有的话障碍物检测就简单了。
有人说 L2 基本靠人接管,L3 需要 fail-safe,需要提前 10 秒左右报警让人接管,而 L4 要求 fail-operational,需要及时检测自动驾驶系统失效而进入安全模式,在 1-2 分钟内停靠至安全的地方等待救援,包括远程遥控驾驶等。这都不妨碍系统迭代演进的开发模式,只是要求系统硬件软件的冗余和容错能力提高罢了。
再来看 Mobileye 和特斯拉模式,先做出 ADAS 给用户使用,直接赚钱产生利润,这方面 Mobileye 应该是市场份额最大的。而特斯拉卖车顺便增加 Autopilot 这个卖点挣现金流,然后继续投入研发提升自动驾驶级别,是一个很现实的商业模式。
综上,在这两条开发道路上,可见前者不在乎是否能快速盈利,所以在系统搭建方面就不计成本了,像激光雷达这种目前昂贵的传感器,基本都用上了。而后者大多采用摄像头和毫米波雷达搭配。最近 Mobileye 的自动驾驶车就只用 5 个摄像头,在耶路撒冷的大街上开起来了。另一方面,特斯拉用 8 个摄像头,5 个毫米波雷达,还有 12 个超声波雷达一起构建第二代 Autopilot 硬件平台。
Autopilot 总监安德烈·卡帕西(Andrej Karpathy)决定采用 E2E 的机器学习方法来处理他们收集到的数据(基本就是深度学习网络),希望能解决自动驾驶问题,他定义为软件 2.0 时代。以前模块化的软件都算 1.0 时代,debug 复杂,要求高。目前看,这个方向还没有成功。其实大多数人还是采用模块化的方法,就是前面提及的感知、定位、规划和控制的分解模式,主要是人们没有胜算能用一个模型解决这么多的 corner case。
在地图方面,Mobileye 提出的 REM 建图方法,可以通过摄像头提取特征和路标(车道线和交通标志等),通过众包方式建高清地图,这难度较大,而且应用在定位的难度也大,好处就是便宜。其实特斯拉也在做这方面的工作,它最早的团队成立了一个创业公司叫 Lvl5。国内也有好几家这么干,其中 Momenta 还拿到了甲级资质。
回头看,高清地图的几家公司,像谷歌、百度、HERE、TomTom、高德、四维图新等等,都是采用激光雷达在扫图,然后回去标注重要的车道线、路牌、红绿灯等等,其中可以提供视觉层和语义层给客户用做定位,当然成本非常高,特别是地图更新的时候。今后用户实用的带宽要求也高(现在也有不少数据压缩的方法,降低数据传输带宽需求)。当然了,精度容易保证。现在定位和感知一样,都是多种方式融合,像采用 DGPS 定位的,都可以结合起来。
另外,谈到传感器融合,我认为其实它拓宽了数据维度,以前只用激光雷达、图像的,现在融合在一起,要么构成冗余,要么互补提高精度。但是,它并没有改变感知定位是个概率决策的本质,所以还是有误差的,也必须小心定义和优化融合模型,比如 Uber 车祸就是融合后出现误判的情况。
总而言之,技术在进步和更新,不少问题会得到解决,但有可能出现新的问题,这就是“长尾“效应,同时也说明自动驾驶研发的长期性,即所谓剩下的 10% 问题还要用解决 90% 的时间来研究。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论