李想再度发声:不追特斯拉FSD VLA模型引领智能驾驶新阶段
李想再度发声:不追特斯拉FSD VLA模型引领智能驾驶新阶段!今年3月,英伟达2025春季GTC大会上,理想汽车自动驾驶技术研发负责人贾鹏介绍了他们的最新成果:MindVLA大模型。这是一个拥有22亿参数的视觉-语言-动作模型,已经成功部署于车端。理想认为,VLA模型是解决AI与物理世界交互难题最有效的方法。
在过去的一年里,端到端架构成为智能驾驶领域的技术热点,推动车企从传统的分模块规则设计转向一体化系统。理想在智能驾驶上的进步显著,7月份率先实现了全国无图NOA,并推出了独特的「端到端(快系统)+VLM(慢系统)」架构,受到行业广泛关注。
随着理想AI Talk第二季的进行,我们对李想口中的「人工智能公司」有了更深的了解。理想汽车CEO李想提到,他们在做的Mind GPT是一个大语言模型,而自动驾驶则被称为行为智能或空间智能。他认为,基座模型最终会变成VLA,因为语言模型只能通过语言和认知理解三维世界,显然不够。VLA的诞生是对语言智能和空间智能深度结合的一次大胆尝试,也是理想汽车对「智能汽车」概念的一次重新诠释。
李想进一步定义VLA为一个司机大模型,像人类司机一样工作。它不仅是一项技术,更是一个能与用户自然沟通、自主决策的智能伙伴。VLA的核心在于整合视觉感知、自然语言理解和动作生成能力,让车辆变成一个能与人沟通、能自己做决定的「司机Agent」。