自动驾驶系统应该如何设计?一直都有两个思路:一个是偏学术的,倾向于统一建模,端到端的解决问题;另外一个思路是偏向工程的,去拆分系统,分治突破。
百度自动驾驶首席架构师陈竞凯,从整体图景上分析了Apollo自动驾驶系统的核心原则和架构。
端到端的建模非常的简洁优美,从长远来看,也是一个非常有前途的方向。
在这种思路下,在其他的领域里面也看到了一些不错的进展,比如说技术模型在NLP领域里面已经取得了统治性的地位。在图像领域,大模型也给我们带来很多的惊喜。同样,我们对于这种端到端的大模型的解决方案, 在自动驾驶系统的发展也充满了期待。
这个方案的问题在于存在很大的不确定性。我们不能确定它究竟何时成熟,是两年还是十年,这是一个问题。
所以我们目前的主要的思路还是沿着工程化的路线推进,同时也没有放弃我们在端到端方面上的一些探索。探索的过程中间,也会把阶段性的成果应用到一些路线上。
车载系统大体分成四个部分:地图、感知、预测决策、规划控制。
地图系统不管是离线或在线地图,总是自动驾驶系统的底层表达。离线地图是超视距整体性的感知,它在自动驾驶系统中发挥着重要的作用。
离线地图制作成本是不是很高?会不会成为障碍?在实践过程中间我们发现,离线地图并不是一个高成本的障碍,反而是前进的助力。
问题在于地图的实时性才是它的问题,而不是它的更新率或者它的成本。
目前的实践中,车端实时生产的地图和规模化生产的地图其实上还是有质量上的一些差距。需要通过我们自动驾驶策略去适应这两种地图差异。但这种适应对自动驾驶能力来说是有折损的。
所以我们认为,在目前的条件下,一个规模化生产的高精地图还是不可或缺的,实时地图更多的会被我们用在应对现实世界的变更,这时候我们会把自动驾驶的策略调整到一个更加安全谨慎的方式。
感知系统目前在整个业界的发展思路还是比较统一的,基本上是一个数据加模型驱动的系统。
主要的分歧在于传感器的配置。
我们的判断是这样的:应该去充分发挥各个传感器的能力,先要把事情做成,然后再去追求更好、更低成本。具体实践中从后融合的方案转向前融合的方案。
前融合使得我们能够充分地发挥各个传感器的优势。另外,我们也会充分的利用百度大模型技术方面的积累提升感知能力。
预测决策系统直接面对复杂外部环境的一个非常重要的部分。
百度最初的自动驾驶系统,预测和决策是分开的。预测带有自标注的任务,一直都是数据驱动的,决策、规划、控制,当初沿用的都是一些偏规则的传统方案。
基于规则的方案,通常是把遇到的问题划分成各种场景,在每个场景下,针对不同出现的问题,再做相应的处理。为了不让各个规则之间发生冲突,通常会仔细地限定每个规则的作用范围,一层一层地拆分下去,如果做得好的话,我们会形成一个类似树形的拆分结构;如果处理得不好的话,就会变成一个补丁摞补丁的系统。
上述规则系统在最初的时候,可以最大化人类的经验和知识,迅速地提升自动驾驶能力,但是随着时间的推移,有两个问题不可避免。一是策略分叉;二是面对城市扩展、场景变化的时候,需要调整规则去适应。
因此,百度认为学习性的PNC是实现全无人的一个必由之路。陈竞凯表示:“预测和决策其实是一个问题的两面,预测是决策的自我预言实现。所以我们构造了一个预测和决策的多任务系统,联合处理这个问题。我们对信号灯、道路元素等都做了一些建模和交互的处理,最后形成预测和决策的一个结果。”
百度的最终目标也不是用学习系统去完全替代规则系统。陈竞凯称,一方面因为交通系统本来就是一个靠规则约束的系统;另一方面也需要规则去守护最后的底线。
仿真系统方面,百度追求的是做一个有用的仿真系统,要能够满足对于问题迭代的需求。为此,其做了大量工作。如Worldsim系统,使得能够批量地去构造大量的场景,去验证在各种场景下的综合能力;L2W系统,能够精确地复现道路的场景,帮助其去分析和验证路上的问题。
另外,从一个城市向另一个城市迁移过程中,数据统计、数据分布是有变化的,这时候要求我们的自动驾驶能力、策略要做一些细微的调整,整体的场景库也对迁移过程提供很多保障。
仿真系统在自动驾驶技术迭代的过程中间发挥了非常重要作用,是技术能力提升的重要支撑。
关闭