【视频】百度Apollo Day|王亮:探索L4/L2+技术共生路线

发布时间:2022-12-21 16:22:47

阅读量:6326

标签:

百度Apollo Day技术开放日

2022年11月29日,百度Apollo Day技术开放日活动线上举办。百度自动驾驶技术专家全景化展示Apollo技术实力及前沿技术理念。

【视频】

汽车智能化时代,百度也积极将自动驾驶技术落地高级辅助驾驶产品,探索L4/L2+技术共生路线。百度赋能汽车智能化的信心和底气源于十年自动驾驶技术沉淀。目前,技术栈层面已实现L4与L2+智驾产品视觉感知方案统一、技术架构统一、地图统一、数据打通及基础设施共享。L4将持续为L2+智驾产品提供先进的技术迁移,L2数据反哺也将助力L4泛化能力提升。同时,百度自动驾驶技术专家王亮也强调高精地图是保障L2+城市级智驾产品高安全、体验好的必需必要条件

以下为演讲全文

王亮:大家好,我是王亮,今天我分享的主题是:《汽车智能化时代的L4/L2+技术共生》。

汽车行业正在经历百年一遇的变革,电动化、智能化正在加速到来。

第一阶段

是电动化,凭借国家政策支持、三电技术巨大进步,成功车型的引领作用,电动化在2019年开启跨沟,2021年完成跨沟。

第二阶段

汽车智能化紧随电动化之后而来。百度认为2023年具备城市道路辅助驾驶能力的产品上市,会带动C端用户需求,并在2025年左右实现跨沟。

第三阶段

智能电动车的综合竞争中,百度判断用户对智能化的诉求会接近完全自动驾驶,也就是所说的L4级自动驾驶。

再来看看L4技术的演进趋势,根据百度内部的规划,在2025年技术将跑通限定区域的无人化,Robotaxi的商业模式得到初步验证,紧接着将进入多城区商业化运营的新阶段,这意味着Robotaxi的数量和规模将大幅增加,规模增长也预示着L4技术对安全性的要求将更加严苛,对新技术和数据的需求更为迫切。

百度深耕L4自动驾驶已十年,期间经历了几个重要阶段,也取得了很多成绩。

安全层面

L4自动驾驶运营测试里程累计超过4000万公里,系统和算法经过专业的路测验证。

规模层面

萝卜快跑在多个城市开启对市民的运营,累计订单超过140万,规模已是全球第一,期间也积累了大量高价值的场景数据。

今年8月,百度在武汉和重庆国内首次实现"全无人商业化运营",这是中国自动驾驶历史上的重要里程碑

十年技术深耕,让百度有底气用自动驾驶技术赋能汽车智能化赛道,深度参与汽车行业改变。

当然,仅有底气是不够的,面对激烈的竞争还要有真功夫。接下来是我今天要分享探讨的第一个问题,汽车智能化时代,百度如何用"好"技术从0到1打造一款"好"的辅助驾驶产品

好产品首先离不开产品定义,目前国内市场上的智驾产品主要以高速领航辅助驾驶和记忆泊车为主,数据显示,在中国,人民日常出行的城市通勤占比在70%以上,百度相信,有城市自动驾驶能力的L2+产品将是未来市场的主流趋势

我们将在2023年面向市场推出一款L2+领航辅助驾驶旗舰产品ANP3.0,能在国内率先支持复杂城市道路场景,并且衔接融通高速和泊车场景。相信务实领先的产品定义,以用户真实需求为中心设计产品,才能为用户创造最大价值。

硬件方案上,百度同样坚守务实领先的理念,兼顾成本不盲目堆料,因为堆料绝对换不来好体验

智能驾驶计算单元采用百度自主研发的智驾域控制器,搭载了2颗英伟达Orin-x芯片,AI算力500 TOPS。传感器方面,部分搭载了800万像素高清摄像头,视距可以达到400米。同时搭配state-of-the-art半固态激光雷达,每秒产生百万以上的点云,进一步保障安全性。

用户在选择一款辅助驾驶产品,是否愿意日常使用,最核心的原因是安全。百度对传感器方案的判断是:激光雷达和视觉感知具备相同的重要性和不可替代性,缺一不可。ANP3.0以视觉方案为主,百度历经4年打磨的Apollo Lite,是世界唯三、中国唯一能够支持复杂城市道路的纯视觉自动驾驶感知方案;安全的保障是冗余,我们的系统也搭配激光雷达,在激光雷达领域,百度Apollo十年深耕,算法理解、实践经验和数据储备全方位领先,激光雷达已具备成熟可靠的感知系统。

ANP3.0视觉、激光雷达两套系统独立运作、低耦合,大概率是国内唯一能够做到真冗余的环境感知方案。

ANP3.0视觉感知技术始于2019年启动的Apollo Lite项目,采用了“单目感知”加“环视后融合”的技术框架。

Lite感知系统的前端,是基于深度学习的2D目标检测与3D位姿估计;模型输出的观测经过单相机跟踪、多相机融合等步骤,输出最终的感知结果。这一方案在常规场景取得了很不错的效果,但随着测试规模的逐步扩大,在面对一些需要多相机协同解决的Corner case时逐渐显得力不从心;基于规则的跟踪、融合方案也无法充分发挥数据的优势,成为感知能力快速提升的瓶颈。

今年百度对视觉感知框架进行了升级,推出了第二代纯视觉感知系统Lite++。Lite++通过Transformer把前视特征转到BEV,在特征层面对相机观测进行前融合后,直接输出三维感知结果,并融合时序特征实现运动估计Learning化;

模型设计层面,基于transformer结构,实现时空特征融合。

在空间融合阶段将位置编码变换从全局BEV空间转换到局部相机坐标系,消除相机内外参差异带来的差异。时序上尽可能多的融合主车运动与多帧信息,提升障碍物检测稳定性。同时基于时序特征,障碍物的速度、意图、未来轨迹预测等关键信息都可以进行端到端的输出。

Lite++:对后处理的多相机融合依赖更低,算力需求更轻,泛化性更好

相比于此前Lite单相机感知后融合策略,BEV的环视时序感知对于训练数据的标注品质与数量都有极高的要求,数据的持续生产能力决定了模型的演进迭代效率。依托百度在自动驾驶领域多年的数据积累,ANP 3.0在BEV数据供给上有先天的优势。L4 Robotaxi累积的4000万公里测试里程覆盖了不同城市、不同季节和时间段,保证了数据的多样性。测试运营过程中实时传感器数据全量落盘上云。

由于摆脱了对2D标注的依赖,融合LiDAR信息的L4感知结果天然成为BEV模型的标注数据,可直接用于模型预训练。

为进一步提升标注质量,利用原始传感器记录的4D数据,也就是space-time的时序数据,配合图像和点云大模型技术,百度搭建离线pipeline进行比车端在线算法更精细化、更复杂的感知计算。全计算流程在云上完成,自动化率达到90%以上,数据生产速度可达到每周数百万帧,为BEV模型研发提供了有力的支撑

安全之后,介绍ANP 3.0的第二个特色,熟路;

目前智能驾驶行业内流行无高精地图的在线地图学习路线,这样做的目标很清晰:希望能摆脱高精地图的依赖,让智驾系统能够Drive everywhere;

反之带来的问题也很明显,道路结构的推理对自动驾驶决策规划算法至关重要,一旦算法在感知物理世界的道路结构层面出现问题,车辆的行为将难以预测,给用户带来极大的不安全感。

百度认为,在今天做城市级高级辅助驾驶,高精地图是安全、体验好智驾产品的必需品,是must-have

ANP3.0的目标也是让自动驾驶能够随时随地的开启,给用户带来更大的获得感,但是这一切都是在保证安全的前提下实现的。

我们的技术路径,是用好百度多年深耕高精地图积累的优势;结合百度对自动驾驶算法的理解,共同定义为智驾规模化泛化而生的”轻量化”自动驾驶地图,降低地图的制作成本;此外,通过建设在线地图学习能力,用算法应对现实变更,冗余地图的标注问题。

为了提升泛化能力、扩大地图覆盖规模,百度精益车端算法,通过提升容错能力大幅度降低地图制作成本。

首先是地图数据采集阶段的减负

原先通过同路线、多次进行采集的手段,降低误差,通过线上PNC算法优化和地图点云拼接算法的升级,提升对地图精度误差的容错力,每条路线仅需要采集1次即可制图,大幅降低了地图生产的外业成本。

其次是定位图层的降维

原先一份地图需要制作、存储特征点、激光点云反射值和Landmark三份图层,给制作流程工艺和线上存储都带来了压力。现在定位算法降低对点云和特征点的依赖,仅依靠Landmark定位图层即可支撑ANP3.0的城市道路高精自定位。

最后是地图元素标注需求的瘦身

高精地图既包含众多物理世界的道路元素,也需要标记为自动驾驶算法适配所需要的复杂关联对应关系。以路口红绿灯识别为例,此前需要对每个灯头都进行单独标注,并且灯头也需要与其对应的车道线进行绑定关联,标注人员的操作极为繁复,容易出错。通过提升感知红绿灯的能力以及提升对场景语义的理解能力,瘦身后的标注仅需要标注一个框,且仅需要和停止线建立一条绑定关系,降低了人工标注出错的概率和成本。

和传感器方案一样,地图也需要冗余,轻地图落地依赖于背后强感知的支撑。精准实时的道路结构感知能力是其中最为关键的一环。

为此百度设计研发了基于BEV的纯视觉实时在线地图学习框架,以百度自研高精地图为原始监督数据,端到端地学习从环视图像到矢量化道路结构的映射,解决现实变更的发现问题和城市道路的泛化难题。

模型设计方面,在Transformer模型基础上,结合道路结构特点,加入道路几何与道路元素实例级Query在线融合,并通过自回归Decoder实现车端实时在线建图,算法由数据驱动,伴随数据的增加,学习效果好,泛化能力强

与BEV障碍物感知方案一样,BEV 实时在线建图成功的关键也在于真值监督数据的质量和规模。环视4D数据人工标注产线搭建复杂,将多视角的时序道路结构数据进行关联的难度很大,数据产能和质量是影响模型快速迭代的最大障碍。在这个问题的解决上,百度高精地图的积累和L4多地覆盖有效地帮助百度解决自动化数据生产的问题。目前已经实现了数千万静态道路数据标注,完成从地图表达到BEV实例化、矢量化、时序化的全面升级。最后,通过大模型初筛与人工质检,保证数据质量,实现像素级精准标注。

刚才在介绍智驾软件方面进展布局的同时,也在强调数据的自动化生产、质量保证和持续供给。根据我在百度的多年实践经验,自动驾驶向更高级别能力演进的道路上,数据所发挥的作用将会越来越大

这里每个柱状图的长度,反映了百度在不同研发阶段、在各个方向上的技术压强力度。在将车端的规则方法和参数压缩固化、提升系统Learning化占比之后,更多研发资源和精力投入在对数据的研究和使用层面,下一步是完成研发人员心智从Model-centric到Data-centric的转变。

在介绍ANP3.0软件安全、熟路的优势后,我还想借着数据话题谈一谈怎么做好用户体验。智能汽车作为一个智能体,也需要和智能生物一样具备可自移动,可在环境中自成长、自演进的能力。

百度作为汽车智能化赛道的新型、专业、本土技术供应商,一方面可为车企提供软硬一体的完整解决方案,同时也希望借助多年深耕自动驾驶沉淀的对AI、对数据的理解和积累的硬核技术向ANP3.0的客户提供数据增值服务,让数据驱动自动驾驶体验提升,为终端用户带来更大的价值。

这是百度在L4研发过程中打造的数据闭环技术栈架构图。包括了从车端原始数据的获取,数据的在线和离线挖掘提纯,数据标注及模型的迭代训练和完整评测,最后回到车端模型的持续集成、发版和部署。这套成熟架构支持了百度践行数据驱动的研发理念,持续不懈地将数据转化为驾驶能力。

结合百度在AI、 云计算和自动驾驶的积累,为内外部用户打造了一款创新的数据闭环SaaS产品。通过对数据挖掘、标注、模型训练、仿真验证的全生命周期管理,实现数据驱动智驾能力进化。

数据采集层面,因为云驾一体的特点,能够有针对性地在线挖掘每个模型任务最需要的长尾数据。通过动态挖掘和车云交互技术,做到有的放矢地对补充模型AI能力所需的数据片段进行精准、动态低成本的挖掘,实现数据资产的快速积累。

海量的数据对数据消化能力和模型稳定性也是巨大挑战。结合MLOps工程文化和流程机制,百度将复杂的模型训练步骤进行标准化封装,让训练过程更高效,模型产出更稳定,可实现模型日常周级别迭代和高优问题的迅速修复。

平台以SaaS形态提供服务,即开即用,可一站式地完成数据管理和模型训练操作,提高整个组织的运转效率。

再回顾下ANP3.0领航辅助驾驶产品的3大核心优势:安全、熟路、体验好。


安全

ANP3.0继承百度L4技术,系统和核心算法经过4000万公里的专业路测考验,纯视觉和激光雷达系统独立工作,真冗余让自动驾驶更安全。

熟路

百度是国内唯一同时精通自动驾驶和地图技术的智驾供应商。为ANP3.0安全泛化打造了领先一代、覆盖广、成本低的智能驾驶高精地图,力求智驾功能随时随地开启,带给用户更高的获得感。

体验层面

为智驾模型量身定制的数据挖掘系统动态回收高价值数据,数据闭环SaaS工具链,支持机器学习工程师持续推动用户体验提升,让搭载ANP3.0的车型具备自演进的能力。

目前ANP3.0已经进入北上广深多地泛化测试阶段,将在2023年夏天随着第一个客户的车型上市与大家见面

接下来讨论第二个问题,随着L4规模化商业试运营的到来和高级辅助驾驶产品的普及,百度如何利用L2+产品反哺L4技术,加速Robotaxi的规模化商用。

扩大L4的运营规模一定意味着长尾问题的发生次数线性增长,没见过的问题会伴随车辆数和里程规模出现。L4和其他AI应用的最大区别是需要Safety guarantee安全保障。数据驱动Data-driven的自动驾驶系统,如何用Data-driven的方式先验它的安全性?

AI解决问题前需要训练数据,往往不是一个问题对应一两个训练样本,而是解决一个Case背后需要数倍甚至数十倍的数据积累。如果手头的数据规模不能支撑下一阶段目标车辆的规模,L4的商业化进程将会非常缓慢。

百度认为实现无人驾驶商业化的最佳路径是:前期在限定区域实现技术积累,通过技术降维和L4数据,为L2+产品做热启动;更长期看,利用L2的规模优势,提前收集L4泛化所需要储备的长尾问题。这也正是百度目前所采取的技术路径。百度领航辅助驾驶产品未来3-5年搭载有望突破百万。百万量级行驶在城市道路上的L2+乘用车,可有效地收集和补充长尾问题,加速L4无人驾驶系统在更大范围运营,数据壁垒也将成为百度的L4技术护城河。

在2025年,L2+产品将跨越消费者鸿沟,L4的商业模式也将在局部区域和城市实现跑通,两者的紧密配合将正式开启,二者的结合将比任何单一路径都更快速、更高效地实现自动驾驶。

目前,L4技术降维L2+产品已经走通,能够快速从0到1,百度打造领先的ANP3.0产品就是很好的证明。

2023年后ANP3.0数据反哺L4的规划也在进行中,并已经完成了前期的技术布局。这两年进行了L4、L2+整体技术架构的统一,视觉BEV方案的统一,轻量化高精地图的统一,同时两边数据打通,数据闭环和仿真基础设施、配套工具链完全共享。

随着2023年智驾ANP3.0产品上市,后续L4和L2+技术的协同飞轮将运转起来,创新带动增长,形成正反馈

最后的总结部分让我们回到今天分享主题中的关键词—— "共生"。百度这个词条就可以看到它的定义。在自动驾驶攀峰道路上,百度的L4、L2+技术和定义描述的一样:一方为另一方提供有利于生存的帮助,同时也获得对方的帮助,两种技术方案和产品形态共存,相互依赖,彼此有利

我今天的分享就到这里,谢谢大家。

相关文章

立即下载

只需填写一次,即可下载Apollo所有资料

关闭

留言到专家信箱

请选择您要咨询的业务? (多选, 最多两个)

  • 自动驾驶 *

  • 汽车智能化 *

  • 智能交通 *

  • 开发者与生态 *

留言到专家信箱

  • 您想与Apollo合作的项目类型是? *

  • 姓名 *

  • 电话*

  • 地区 *

  • 行业 *

  • 职位 *

  • 公司*

    • 邮箱*

    • 预算

    • 采购时间

    • 项目背景 *

    留言到专家信箱

    • 您想与Apollo合作的项目类型是? *

    • 姓名 *

    • 电话 *

    • 地区 *

    • 公司 *

    • 职位 *

    • 行业 *

    • 邮箱 *

    • 项目背景 *

    留言到专家信箱

    • 您想与Apollo合作的项目类型是? *

    • 姓名 *

    • 电话*

    • 公司 *

      • 邮箱 *

      • 项目背景 *

      留言到专家信箱

      • 您想与Apollo合作的项目类型是? *

      • 姓名 *

      • 电话*

      • 公司 *

      • 行业 *

      • 邮箱 *

      • 项目背景 *

      留言到专家信箱

      • 您想与Apollo合作的项目类型是? *

      • 姓名 *

      • 电话*

      • 地区 *

      • 行业 *

      • 公司 *

        • 邮箱 *

        • 项目背景 *

        留言到专家信箱

        • 您想与Apollo合作的项目类型是? *

        • 产品分类 *

        • 姓名 *

        • 电话*

        • 地区 *

        • 行业 *

        • 职位 *

        • 公司 *

          • 邮箱 *

          • 预算

          • 采购时间

          • 项目背景 *

          留言到专家信箱

          请选择您的企业类型和项目类型:

          请填写您的身份信息:

          • 姓名 *

          • 电话*

          • 地区 *

          • 行业 *

          • 职位 *

          • 公司*

            • 邮箱

            • 预算

            • 预计采购时间

            • 项目背景 *