2025-09-17 20:01:47
作者:科技
分享:
传统自动驾驶依赖工程师编写的“硬编码”规则,面对复杂路况时往往力不从心。例如,极端天气下的长尾场景(如暴雨中突然出现的障碍物)需人工逐一设计应对策略,研发效率低且覆盖有限。2025年,VLA(视觉-语言-动作)范式成为行业焦点,它通过整合视觉、语言指令和动作决策,结合思维链推理和强化学习,让车辆像人类一样“边思考边开车”。以百度Apollo的VLA模型为例,其训练需消耗20万+ GPU小时的强化学习微调,是传统监督训练的3-5倍,但换来的是对复杂场🔒景的深度理解——在模拟测试中,车辆能通过“视觉+地图语义”的慢思考推理,自主决策绕行高速路上的溢洒物(如纸箱),决策准确率提升23%。这种“类人智能”的突破,让自动驾驶从“能用”迈向“好用”。

VLA模型的训练堪称“算力黑洞”。以SparseDrive模型为例,其多模态融合阶段需合并数据拷贝、优化reduce操作,单次迭代依赖数千张GPU卡的协同计算。百度智能云推出的百舸AI计算平台5.0,通过昆仑芯超节点架构实现32卡/64卡的高速互联,卡间带宽提升8倍,单机训练性能跃升10倍。更关键的是,平台预置了80+热门模型加速方案,针🔰对智驾模型可提速100%+。实测数据显示,某车型的VLA模型在百舸平台上迭代速度提升70%-100%,训练周期从数月压缩至数周。这种“算力自由”为车企量产高阶智驾提供了可能——2025年,搭载百度VLA方案的车型已覆盖31个品牌、134个车型,累计量产超700万辆。
真实数据采集成本高、效率低,尤其是偶发但关键的场景(如高速路上的树枝掉落)。百度智能云的数据合成技术通过“场景重建+模型生成”双路径破局:一方面,利用3D GS技术重建真实采集的单点场景,调整光照、天气等参数生成定制化场景;另一方面,依托预训练世界模型,通过自然语言Prompt(如“夕阳下积水路段”)直接生成复杂场景。以某车企的需求为例,传统采集需封闭道路数周才能获取10个溢洒物场景,而数据合成技术1天内即可生成1000+变体,覆盖90%以上长尾场景。这种“以虚补实”的策略,让VLA模型在训练阶段就能“预演”罕见风险,大幅提升开放道路的安全性。
自动驾驶的终极目标是让用户“敢用、爱用”。百度Apollo的“驾舱图”产品矩阵通过三大创新实现这一目标:在智驾层面,纯视觉方案Apollo City Driving Max以508TOPS算力实现城市全域领航,成本较激光雷达方案降低40%,且在2025年Q4量产落地;在智舱层面,文心大模型赋能的语音SDK支持全时全双工交互,响应速度达百毫秒级,用户可通过自然语言直接控制车窗、空调;在地图层面,百度地图V20实现手车数据同步,真车道级导航覆盖率达95%,用户无需手机支架即可精准导航。以新岚图FREE为例,其行泊一体功🆗能激活率达83.74%,高速NOA单次最长行驶364公里无接管,用户评价“像老司机一样可靠”。这种“技术+体验”的双轮驱动,让高阶智驾从“奢侈品”变为“标配”——百度宣布,2025年15万元级车型即可标配ANP3 Pro高阶智驾。
2025年,百度自动驾驶的全球影响力持续扩大:萝卜快跑获得香港首批自动驾驶先导牌照,并在新加坡、中东启动路测;Apollo技术入选《麻省理工技术评论》“全球十大突破性技术”,与特斯拉、Waymo同台竞技。更值得关注的是其生态开放战略——通过“芯片X计划”,只要芯片算力≥100TOPS即可兼容ANP3 Pro方案,目前已与黑芝麻智能等国产芯片厂商达成合作。这种“技术输出+生态共建”的模式,正在重塑全球智驾产业格局:正如岚图CEO卢放所言,“百度将L4级算法和数据赋能量产车,让我们用1/3的成本实现了同等体验”。
站在2025年的节点回望,自动驾驶已从“技术竞赛”转向“体验战争”。百度智能驾驶的突破,不仅在于算力、数据、算法的硬核实力,更在于对用户需求的深刻洞察——让科技回归“以人为本”的本质。当车辆能像人类一样思🈸考、决策,甚至比人类更安全时,一个真正的“智变时刻”已然到来。