极客视点
极客时间编辑部
极客时间编辑部
113241 人已学习
免费领取
课程目录
已完结/共 3766 讲
2020年09月 (90讲)
时长 05:33
2020年08月 (93讲)
2020年07月 (93讲)
时长 05:51
2020年06月 (90讲)
2020年05月 (93讲)
2020年04月 (90讲)
2020年03月 (92讲)
时长 04:14
2020年02月 (87讲)
2020年01月 (91讲)
时长 00:00
2019年12月 (93讲)
2019年11月 (89讲)
2019年10月 (92讲)
2019年09月 (90讲)
时长 00:00
2019年08月 (91讲)
2019年07月 (92讲)
时长 03:45
2019年06月 (90讲)
2019年05月 (99讲)
2019年04月 (114讲)
2019年03月 (122讲)
2019年02月 (102讲)
2019年01月 (104讲)
2018年12月 (98讲)
2018年11月 (105讲)
时长 01:23
2018年10月 (123讲)
时长 02:06
2018年09月 (119讲)
2018年08月 (123讲)
2018年07月 (124讲)
2018年06月 (119讲)
时长 02:11
2018年05月 (124讲)
时长 03:16
2018年04月 (120讲)
2018年03月 (124讲)
2018年02月 (112讲)
2018年01月 (124讲)
时长 02:30
时长 02:34
2017年12月 (124讲)
时长 03:09
2017年11月 (120讲)
2017年10月 (86讲)
时长 03:18
时长 03:31
时长 04:25
极客视点
15
15
1.0x
00:00/04:47
登录|注册

观点:如何理解自动驾驶领域的“热”和“乱”?

讲述:初明明大小:4.38M时长:04:47
谈到自动驾驶现状,有人说“热”和“乱”,其实正常。众多有钱的公司都投入的方向能不热吗,而乱说明了它的“新”,实践方面的”新“。
所谓“乱”,主要因为它没有唯一的方向。目前自动驾驶发展基本两条路,一条是谷歌和百度走的,直接做 L4 级别的自动驾驶;另外一条是 Mobileye 和 Tesla 走的,从 L2 做起再演进到 L3/L4 (其实主机厂基本也是这条路,只是不是软件 OTA 模式,而是需要硬件一起迭代升级)。
谷歌和百度一类互联网公司,现金流充足,利润客观,可以不计较成本,索性直接做技术最有挑战性的东西。另外一些做 L4 的创业公司,主要靠 VC 输血。
现在有一种观点认为, L2 演进到 L3/L4 存在系统障碍,我不这么认为。我们分析一下:首先,感知是一样的,越成熟越好。其次,规划会发生变化,特别是采用高清地图的话。再者,控制都一样,相对来说,互联网公司没有多少这方面的积累,最好用线控(wire control)车以及电动车方便。V2X 目前还没有普及,有的话障碍物检测就简单了。
有人说 L2 基本靠人接管,L3 需要 fail-safe,需要提前 10 秒左右报警让人接管,而 L4 要求 fail-operational,需要及时检测自动驾驶系统失效而进入安全模式,在 1-2 分钟内停靠至安全的地方等待救援,包括远程遥控驾驶等。这都不妨碍系统迭代演进的开发模式,只是要求系统硬件软件的冗余和容错能力提高罢了。
再来看 Mobileye 和特斯拉模式,先做出 ADAS 给用户使用,直接赚钱产生利润,这方面 Mobileye 应该是市场份额最大的。而特斯拉卖车顺便增加 Autopilot 这个卖点挣现金流,然后继续投入研发提升自动驾驶级别,是一个很现实的商业模式。
综上,在这两条开发道路上,可见前者不在乎是否能快速盈利,所以在系统搭建方面就不计成本了,像激光雷达这种目前昂贵的传感器,基本都用上了。而后者大多采用摄像头和毫米波雷达搭配。最近 Mobileye 的自动驾驶车就只用 5 个摄像头,在耶路撒冷的大街上开起来了。另一方面,特斯拉用 8 个摄像头,5 个毫米波雷达,还有 12 个超声波雷达一起构建第二代 Autopilot 硬件平台。
Autopilot 总监安德烈·卡帕西(Andrej Karpathy)决定采用 E2E 的机器学习方法来处理他们收集到的数据(基本就是深度学习网络),希望能解决自动驾驶问题,他定义为软件 2.0 时代。以前模块化的软件都算 1.0 时代,debug 复杂,要求高。目前看,这个方向还没有成功。其实大多数人还是采用模块化的方法,就是前面提及的感知、定位、规划和控制的分解模式,主要是人们没有胜算能用一个模型解决这么多的 corner case。
在地图方面,Mobileye 提出的 REM 建图方法,可以通过摄像头提取特征和路标(车道线和交通标志等),通过众包方式建高清地图,这难度较大,而且应用在定位的难度也大,好处就是便宜。其实特斯拉也在做这方面的工作,它最早的团队成立了一个创业公司叫 Lvl5。国内也有好几家这么干,其中 Momenta 还拿到了甲级资质。
回头看,高清地图的几家公司,像谷歌、百度、HERE、TomTom、高德、四维图新等等,都是采用激光雷达在扫图,然后回去标注重要的车道线、路牌、红绿灯等等,其中可以提供视觉层和语义层给客户用做定位,当然成本非常高,特别是地图更新的时候。今后用户实用的带宽要求也高(现在也有不少数据压缩的方法,降低数据传输带宽需求)。当然了,精度容易保证。现在定位和感知一样,都是多种方式融合,像采用 DGPS 定位的,都可以结合起来。
另外,谈到传感器融合,我认为其实它拓宽了数据维度,以前只用激光雷达、图像的,现在融合在一起,要么构成冗余,要么互补提高精度。但是,它并没有改变感知定位是个概率决策的本质,所以还是有误差的,也必须小心定义和优化融合模型,比如 Uber 车祸就是融合后出现误判的情况。
总而言之,技术在进步和更新,不少问题会得到解决,但有可能出现新的问题,这就是“长尾“效应,同时也说明自动驾驶研发的长期性,即所谓剩下的 10% 问题还要用解决 90% 的时间来研究。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
9
沉浸
阅读
分享
手机端
快捷键
回顶部