业务合作发布作品

    小鹏汽车启动VLA基模研发,2亿Clips训练720亿超大规模模型

    驾仕派头像驾仕派头像
    驾仕派昨天 09:55

    小鹏汽车在新X9发布上市之前,做了一场AI技术分享会,再次强调了自己是一家AI驱动的技术公司。而这次技术分享会的一个核心内容就是:小鹏汽车正在研发VLA基座模型,也在研发“世界模型”,而且小鹏汽车已经拥有10 EFLOPS的算力。

    可以说,小鹏汽车整个智驾技术路线也已经向业界下一代主流路线VLA开始迭代。

    1、正在研发的“小鹏世界基座模型”是一个720亿参数的超大规模自动驾驶大模型,可以理解为一个VLA基座模型。据介绍,小鹏基模是一个以大语言模型为骨架网络、使用海量优质驾驶数据训练的多模态大模型,具备视觉理解能力、长思维链式推理能力(CoT)和动作生成能力,从而在充分理解现实世界的基础上,能够像人类一样进行复杂的常识推理,并将推理结果转化为行动。

    2、需要强调的是,“小鹏世界基座模型”里面的“世界”只是一个修饰词,并非是“World Model”的真实含义。但是小鹏之所以将新的基座模型称为“世界基座模型”,或许是考虑到小鹏已经开始研发真正意义上的物理世界大模型。今后世界模型将作为“云端模型工厂”的重要一环,支持基座模型的性能优化,相当于世界模型是基座模型的训练场。

    3、此次小鹏汽车基座模型参数量达到了72B,是主流VLA模型的35倍左右。这个35倍我们猜测小鹏应该是对比友商的2.2B的VLM参数量来衡量的。之所以小鹏要研发超大规模的VLA基座模型,主要是因为他们已经初步验证了VLA依然有规模法则(Scaling Law)效应——参数规模越大,模型的能力越强;同样的模型大小,训练数据量越大,模型的能力也会越强。

    4、只有足够强大的基座模型,才能够被强化学习(Reinforcement Learning)充分激发上限,小鹏汽车已经逐步搭建了针对强化学习的模型训练框架,包括2B、7B、72B,其训练数据了从100万Clips一直到2000万Clips,最终为了满足72B超大模型会用到2亿Clips。

    5、这里小鹏汽车专门提到,云端大模型的规模越大,从蒸馏出来的端侧模型效果来说才会更好。未来,小鹏将通过云端蒸馏小模型的方式将基模部署到车端,最终可让车端模型的性能超越车端算力“一亩三分田”的限制。强化学习和云端蒸馏等技术方案已经在DeepSeek上做了验证,所以小鹏汽车很有信心。

    6、小鹏汽车透露他们已经在后装算力的车端成功以小尺寸基模实现了控车,尽管是非常早期的实车测试,但是结果依然让人满意。一个值得注意的细节是,小鹏强调了是“后装算力”,这意味着要跑VLA基座模型还是需要更大算力。

    7、有意思的是,小鹏汽车还提到一点:即便来到“大模型时代”,过去“规则时代”的领先经验仍在发挥作用。在开发强化学习的奖励模型(Reward Model)时,研发团队基于规则经验设计了奖励函数,将规则时代的沉淀转化为了训练基座模型的生产力。这似乎是小鹏在强调其过去积累的经验依然可以帮助他们实现继续领先,而不完全是推倒重来。

    8、最后是小鹏汽车已经着手开发世界模型(World Model)。小鹏的世界模型是一种实时建模和反馈系统,能够基于动作信号模拟出真实环境状态,渲染场景,并生成场景内其他智能体(也即交通参与者)的响应,从而构建一个闭环的反馈网络,帮助基座模型不断进化,逐渐突破过去“模仿学习”的天花板。

    文|JackieLXX

    图|网络

    次阅读
    评论
    1赞同
    收藏
    分享

    评论·0

    头像头像
    提交评论
      加载中…

      热门资讯