理想发布下一代自动驾驶架构MindVLA 7月份与理想i8同步推出

理想汽车发布MindVLA：重新定义自动驾驶的未来

在自动驾驶技术飞速发展的今天，理想汽车再次引领行业潮流，发布了下一代自动驾驶架构——MindVLA。这一全新架构不仅是一个技术突破，更是一个能与用户深度沟通、理解用户意图的智能体，堪称一位“能听懂人话的专职机器人司机”。据悉，MindVLA将于7月份与理想i8同步推出，现款搭载英伟达双Orin X芯片的车型也将支持这一技术，为用户带来前所未有的智能出行体验。

MindVLA：视觉-语言-行为大模型的革命性突破

MindVLA是一种视觉-语言-行为大模型，它将空间智能、语言智能和行为智能统一在一个模型中，开创了机器人大模型的新范式。这种整合不仅让车辆具备了更高的感知能力，还使其能够像人类一样理解环境、执行任务并与用户互动。

“听得懂”：语音指令的深度理解与执行

MindVLA的核心能力之一是“听得懂”。用户可以通过自然语言与车辆进行交互，例如在陌生园区寻找超市时，只需对车辆说：“带我去找超市”，车辆便能在没有导航信息的情况下，自主漫游并找到目的地。此外，用户还可以在行驶过程中通过语音指令调整车辆行为，比如“开太快了”或“应该走左边这条路”，MindVLA能够准确理解并执行这些指令，真正实现了“人车对话”的智能化体验。

“看得见”：强大的通识与定位能力

MindVLA还具备强大的“看得见”能力。它不仅能够识别星巴克、肯德基等商店招牌，还能在用户找不到车辆时，通过用户发送的附近环境照片，自动搜寻并定位车辆位置。这种能力不仅提升了用户的便利性，还解决了“找车难”这一常见痛点。

“找得到”：自主漫游与智能停车

“找得到”是MindVLA的另一大亮点。车辆可以自主在地库、园区和公共道路上漫游，甚至在复杂的商场地库中，用户只需对车辆说：“去找个车位停好”，车辆便会自主寻找车位并完成停车。即使遇到死胡同，车辆也能自如倒车并重新寻找合适车位，整个过程完全不依赖地图或导航信息，完全依靠MindVLA的空间理解和逻辑推理能力。

技术细节：Diffusion与RLHF的深度应用

MindVLA利用Diffusion技术将Action Token解码为优化的轨迹，并通过自车行为生成和他车轨迹预测的联合建模，显著提升了在复杂交通环境中的通行能力。此外，理想汽车还创新性地应用了RLHF（基于人类反馈的强化学习）技术，通过人类偏好数据集微调模型的采样过程，使MindVLA能够学习并对齐人类驾驶行为，从而大幅提升自动驾驶系统的安全性和可靠性。