何小鹏:端到端颠覆智驾,大模型时代难有Tier1
张马也
编辑
2024年进入第二季度,新能源车的渗透率已经超过了50%。
但何小鹏认为,真正高阶智能的汽车现在还没有到来,现在的汽车都是介于「功能机和智能机之间」。
小鹏汽车在内部认为,大模型是一个重要的变量。大模型将会加速高阶智能汽车到来,并且「以一个合适的价格」。
上周,在小鹏的新一季财报发布前一天,小鹏汽车在北京举办了「开启AI智驾时代」的AI Day。小鹏汽车在这次发布会上发布了将AI与大模型全面融入到座舱和智驾的新一代操作系统「AI天玑」。
更为重磅的是,在这代系统上,基于端到端大模型对智驾系统进行了重构。何小鹏甚至略有歉意地表示,「因为架构重写,这次升级花了比较长的时间」。
大模型,尤其是端到端的智驾架构,在今年影响了小鹏多项内部的预判:
- 在接下来很长一段时间内,「大模型对于自动驾驶,是颠覆性的变革,而不是比例上的优化。」
- 在当前硬件性能不变的情况下,「未来的12 - 18个月,要有10 - 30倍体验上的提高。」
- 甚至对无人驾驶的看法,「今年以前我觉得中国的全无人驾驶还要好多年。但今年端到端大模型开始上车测试,我们看到数据后,觉得机会就在不远的将来,也许在数年内就会看到更强力的无人驾驶的到来。」
作为整个国内在智能化领域,尤其在智能驾驶上投入最早、最坚决的车企,连雷军都在前不久的直播中提到十分佩服小鹏。
小鹏今年总计将投入70亿的研发费用,仅算力采买就将投入了1亿多美金。
基于端到端的新一代自动驾驶,何小鹏认为「基本上会跟所有的友商拉开一个非常大的差距,它会有数十倍的提高。」
这次发布会恰逢小鹏的财报会前夕,它向外界吐露其端到端智驾的研发初具成效,是小鹏对于其长期技术战略的肯定和强化梳理。
这次发布会距离其MONA系列车型发布还有一个月左右,今年小鹏在产品组合、商业模式上都在发生重要的变化。
小鹏也谈到了外界关注的销量,他认为今年纯电市场正在经历周期性的波动,但波动不能完全反映一家车企的销售能力和整体能力。
「过分关注短期销量没有价值,但在研发投入上要非常坚定。」
小鹏在智能化上长期笃定的笃定投入,也是小鹏如今在智驾和智舱上持续领先行业,实现AI大模型上车,并且在端到端上快速取得进展的根本原因。
一、小鹏端到端架构:XNet + XBrain + XPlanner
外界通常认识的端到端是一张大网络,从感知信息的输入,到直接输出驾驶决策的控制信号。
而小鹏这次发布的端到端大模型在架构上略有不同。
它包含了3部分:侧重感知和场景语义理解的XNet,侧重大场景认知的XBrain,以及侧重规划控制的XPlanner。
- 感知大模型XNet:聚合动态XNet、静态XNet、纯视觉2K占用网络,能够让自动驾驶系统对现实世界中的可通行空间进行3D还原,清晰识别静态障碍物细节,感知范围提升2倍,面积有1.8个足球场大小,能精准识别50+个目标物。
- 大语言模型XBrain:通过大语言模型网络,提高自动驾驶对复杂甚至未知场景的泛化处理能力,及对宏观逻辑的推理能力,从而做出兼顾安全及性能的拟人驾驶决策。能够认识待转区、潮汐车道、特殊车道、路牌文字,理解各种令行禁止、快慢缓急的行为指令。
- 规控大模型XPlanner:基于图像数据的感知输入,实现对智驾行驶路径的规划控制。规划大模型基于数据驱动模式迭代,取代人类手写规则代码,使得驾驶策略向拟人进化,目前在效果上,前后顿挫减少50%、违停卡死减少40%、安全接管减少60%。
小鹏自动驾驶中心负责人李力耘解释了这套架构设计的出发点:
在工作时,三个部分紧密协调,并且通过联合的训练标注,构成非常有机的整体。同时,在工程实践中如果真的出现问题,每个部分有它侧重的方向,这样很容易理解到是因为系统的理解出现了问题,还是因为感知没有看到,或者是感知看到了但动作执行出现问题。
简单来说,这解决了端到端大模型可解释性和安全性问题,是「小鹏能真正量产端到端大模型的一个最重要前提。」
从技术开发的角度,端到端大模型上车的最大价值,李力耘认为是:
「AI天生能够在一个非常有不确定性、非常模糊、非常需要博弈的空间里,找出一个非常好的解。不仅如此,如果我们运用很好的模型架构能力和体系,AI 还具备自己进化和学习的能力。」
端到端的大模型突破了过去靠工程师编写代码构建的规则体系规模,「我们以前的自动驾驶的规则,我估计在10万条级别。现在我们用大模型,将来会做到亿、十亿条或更大的规模。」
不过小鹏也认可当前仍在大模型探索的早期阶段:「说实话,今天我们的升级也只是第一步,但是我们看到了方法论,并且把它真正落地,能够每两天一次内部OTA的循环。」
根据小鹏披露的数据,目前其端到端大模型基于折算10亿+里程的视频训练、超646万累计公里数的实车测试、超2.16亿累计公里数的仿真测试,能做到2天迭代一次,月月焕新,在未来18个月内智驾能力提升30倍。
30倍的能力提升,核心是针对城区的智驾能力,何小鹏进一步解释:
「今天所有的城市辅助驾驶, 我认为安全接管可能是每百公里或者每一两百公里,但因体验接管,我认为是十公里以内。如果在一个城区内,有效率、安全、舒适,开 100 公里、开 300 公里、开 500 公里接管一次,体验完全不一样。」
小鹏在这次发布会上还重申了体验对标Waymo的目标,2025年在中国实现类L4级智驾体验,并且正在全球范围对XNGP端到端的能力进行测试,智驾技术开始走向全球。
二、行业首个量产超长AI代驾,Q3实现全面无图
基于大模型的全面融入,小鹏在发布会当晚开始陆续推送AI天玑系统,范围将逐步覆盖小鹏汽车所有在售的车型。
AI天玑系统是一个将AI技术全面应用于智能座舱与智能驾驶的操作系统。
这次有三大核心功能的更新:
- AI小P:升级了LLM的AI助理,具有感知、推理、理解复杂需求的能力,小鹏的XGPT大语言模型,整合了自研及第三方LLM,将大模型的通用智能能力用于车载交互。
- AI司机:包括AI代驾、AI泊车、XNGP等智能驾驶功能。
- AI保镖:车辆环境的大范围感知及预警。
其中,XNGP将在第三季度实现全面无图,不仅全国都能开,且每条路都能开,在2025年城市智驾体验追平高速智驾体验。
AI代驾则是与XNGP的智能辅助驾驶功能,它基于AI自主学习能力,可学习用户驾驶习惯,主动记忆用户的驾驶路径,一次记忆,24h内生成定制路线,从而实现整条路线智能驾驶。
AI 代驾不依赖XNGP开城节奏,不限城市范围、不限道路属性。这个功能目前可存储10条记忆路线,最长100km。
过去一年行业中有不少车企发布记忆领航/通勤模式这样的功能,但到目前为止量产的仍在少数。
三、大模型时代,没有Tier 1
2024年,小鹏汽车在研发上将投入70亿元。
何小鹏也披露,目前公司已有7000+张GPU卡,小鹏今年将再投入超过7亿元在训练算力上,「国内有万卡以上的公司非常稀少,具有5000 - 1万卡的公司也屈指可数。」
自动驾驶的头部效应将更加明显,「不是靠钱、靠人就可以做得到的,它有成功的概率,它有非常大的数据门槛,而且越往后越难成,这是第一个。
第二个,在过去的一年里面,我们看到行业里面有很多公司都在跟着小鹏做去高清地图,没有成功。
真正开一下他们的车,只在非常少的区域用到了轻地图或者说非高清地图,实际上在这方面的技术难度远超原来的NGP。高速辅助驾驶,在高清地图上是比较容易做的,但是在城区里面去掉地图很难。」
端到端的大模型需要庞大的算力和数据训练,何小鹏认为,这会颠覆很多原来自动驾驶公司的模式。
「因为随着高阶自动驾驶和无人驾驶的实现,智能辅助驾驶技术不可能以单一软件功能的方式售卖,智驾会带来高昂的数据费用。」
「在大模型领域里面甚至很难有Tier 1。
因为作为一个 Tier 1,卖给你一个自动辅助驾驶软件,假设它后面只是做少量更新的。大模型可不是这样,你的数据要循环起来,一年的算力费用今年是一个多亿美金,明年呢,后年呢?如果你想把90、91、99、99.1、99.991%不断地往前推进,这个费用是多少?
我想说的是以前用Tier1 做集成商、在软件时代、在智能的软件时代也OK,在大数据的AI 时代,也就是大模型时代,是非常困难的,所以整个合作方式在将来都会有质的颠覆。」
与大众汽车的合作,让更多人认识到了小鹏汽车的实力。
据何小鹏透露,有一些厂商一直在沟通,期望通过这样的方式进行更多合作。但何小鹏认为,小鹏汽车不是一个标准的Tier1,而是「期望能够有更深度的合作伙伴,走向全球」。
四、MONA来袭,转折或在Q3
所有的投入与积累,都需要迎来销量的爆发,否则就没有意义。
对于小鹏汽车来说,这个爆发点可能是在今年第三季度。
在财报发布时,小鹏汽车表示,从今年三季度起,将开启强劲的产品周期,在未来三年内推出十多款全新车型,覆盖10万到40万价格带主要细分市场,满足不同客群差异化需求。
其中就包括20万以内的MONA系列的首款车型,它将在今年6月亮相,并于第三季度上市和规模交付;第四季度,小鹏汽车品牌还将交付一款全新B级纯电轿车。
在国际化上,小鹏的步伐也在加快。今年上半年,小鹏汽车的国际化2.0战略已宣布进入德国、法国、泰国、新加坡、马来西亚、香港、澳门、澳大利亚等市场。第三季度,小鹏G6的右舵版车型就将正式开启交付。
何小鹏表示:「我们的目标是在智能电动车时代打造一个像大众汽车一样覆盖全球市场、多种产品类型、拥有广阔客群的一个超级品牌,并且让AI智驾汽车成为最主要的品类。」
所有的豪言壮语,还有投入产出,或许都会在今年下半年见分晓。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。