业务合作发布作品

    小鹏搭建国内汽车行业首个万卡智算集群,开启720亿参数基模研发

    新浪财经头像新浪财经头像
    新浪财经前天 23:30

    来源:VDGER唯界

    4月14日,在香港举办的AI技术分享会上,小鹏汽车投下一枚“重磅炸弹”,宣布正在研发720亿参数的超大规模自动驾驶大模型——“小鹏世界基座模型”。这一消息瞬间点燃行业热情,标志着小鹏汽车在自动驾驶领域迈向新高度,也为汽车行业的AI变革注入强大动力。

    小鹏汽车自动驾驶负责人李力耘介绍,这款以大语言模型为骨干网络的多模态大模型,具备视觉理解、链式推理和动作生成能力。通过海量优质驾驶数据训练和强化学习,它能不断自我进化,有望实现媲美甚至超越人类的自动驾驶技术,处理全场景自动驾驶问题,包括从未遇到过的复杂路况。这意味着智能驾驶系统将从单纯“模仿人类驾驶”向“超越人类驾驶”迈进,为未来出行带来更多可能。

    为了支撑如此庞大的模型研发,小鹏汽车早在去年就开始布局AI基础设施,如今已建成国内汽车行业首个万卡智算集群,打造出“云端模型工厂”。该工厂涵盖从基座模型预训练、后训练到模型蒸馏、车端模型训练与部署的完整生产链路。其算力储备达10EFLOPS,集群运行效率常年保持在90%以上,全链路迭代周期平均5天一次,实现了高效的模型生产与优化。

    值得一提的是,小鹏汽车自主开发了底层的数据基础设施,大幅提升数据上传规模和训练数据带宽,联合优化GPU/CPU及网络I/O后,模型训练速度提升5倍。目前,用于训练基座模型的视频数据量高达2000万clips,预计今年将激增至2亿clips。这些数据和算力的支撑,为小鹏世界基座模型的研发奠定了坚实基础。

    在此次分享会上,小鹏汽车还披露了基模研发的三大阶段性成果,每一项成果都意义非凡。

    首先,小鹏团队首次验证了规模法则在自动驾驶领域持续生效。规模法则被视为AI领域的“摩尔定律”,此前在大语言模型领域已得到充分验证,但在自动驾驶领域,由于训练数据的多模态性和复杂性,其有效性一直未得到充分验证。小鹏通过大量实验,在不同参数规模的模型上均观察到明显的规模法则效应,即参数规模越大、训练数据量越多,模型能力越强。这一验证为自动驾驶大模型的研发提供了重要理论依据,证明了加大模型投入的可行性和必要性。

    其次,小鹏汽车成功在后装算力的车端实现基模控车。尽管处于早期实车测试阶段,但全新基模已展现出令人惊喜的基础驾车技能,如随前车减速、主动绕行、红绿灯主动停车、转弯避让掉头车等。这一成果标志着小鹏世界基座模型从理论研究走向实际应用迈出了关键一步,让人们看到了智能驾驶在现实场景中的可行性。

    最后,小鹏汽车启动72B参数基模训练,并搭建针对强化学习的模型训练框架。强化学习能够帮助模型自我进化,处理训练数据中未出现的长尾问题,实现更安全的自动驾驶。小鹏选择云端蒸馏路线,在云端训练强大的模型,再蒸馏到适配车端算力的小尺寸模型上,突破车端算力限制,提升模型性能。

    在研发过程中,小鹏汽车巧妙融合“规则时代”的经验与“大模型时代”的技术。在开发强化学习的奖励模型时,研发团队基于规则经验设计奖励函数,将过去的沉淀转化为训练基座模型的生产力。此外,小鹏汽车正在开发世界模型,这是一种实时建模和反馈系统,能模拟真实环境状态,构建闭环反馈网络,助力基座模型不断进化,突破“模仿学习”的局限。

    小鹏汽车致力于通过探索科技,引领未来出行变革。此次720亿参数自驾基模的研发,不仅是小鹏汽车“AI化”转型的关键一步,也为整个汽车行业的智能化发展提供了新思路和方向。今年6月,小鹏汽车还将在计算机视觉国际顶会CVPR上进一步分享研发细节,相信会给行业带来更多惊喜。未来,小鹏汽车有望凭借这一技术优势,在自动驾驶领域持续发力,重塑未来出行格局。

    次阅读
    评论
    赞同
    收藏
    分享
    评论
    赞同
    收藏
    分享

    评论·0

    头像头像
    提交评论
      加载中…

      热门资讯