理想汽车 VLA:自动驾驶的 “超级大脑”,用AI大模型教会汽车“思考”?

智车科技

2天前

但真正的杀手锏藏在世界模型里——这个云端“元宇宙”每天生成3.2万个极端场景,让自动驾驶系统在虚拟世界“死"够10万次。...原文标题:理想汽车VLA:自动驾驶的“超级大脑”,用AI大模型教会汽车“思考”。

引言

家人们,无人车来也(公众号:无人车来也)要聊一个超级酷炫的话题 —— 理想汽车在自动驾驶领域的重大突破 VLA。

这玩意儿可不得了,简直就是给汽车装上了一个 “超级大脑”,让自动驾驶直接 “起飞”!

(参考阅读请点击:

《理想汽车高管:把别人的拿来起个山海经的名字就算自己技术突破,好像没人质疑!自研也是有区别的》)

一、地狱级副本:中国自动驾驶的"高考题"

当马斯克在2024年财报会议上承认"FSD在中国遇到公交车道挑战"时,全行业都在憋笑——这位硅谷钢铁侠终于领教了东方神秘力量的杀伤力。

在中国,自动驾驶面临的不是普通关卡,而是地狱级副本。

最让特斯拉"折戟"的公交车道,堪称中国道路的"高考压轴题":地面文字、空中指示牌、动态LED屏三位一体,不同城市采用"早7-9晚5-7限行""仅限公交优先"等30余种文字表述规则。

更魔幻的是,某地因施工临时划设的公交专用道,使用"蓝色虚线+迷你文字"标注,连本地司机都直呼看不懂。

但这只是开胃菜:

潮汐车道每天变换方向,高峰期车道数量堪比俄罗斯方块;

待行区需要"先读秒再冲刺",成功率堪比科目二倒车入库;

ETC收费站存在15种不同版本的标识组合,部分收费站夜间关闭人工通道时,收费员会在窗口贴A4打印的"请走ETC"手写告示

更恐怖的是动态更新速度:某新一线城市去年新增87处可变车道,平均每周诞生1.67个新规则;某三线城市道路施工期间,同一路口连续3天出现"直行改左转→左转改禁行→恢复原状"的魔幻操作。

数据不会说谎

理想汽车实测发现,依赖高精地图的方案在3个月内鲜度衰减42%;

特斯拉FSD中国版在待行区场景的误判率达37%,是北美的4.6倍;

某新势力车型在动态车道路口平均需要2.3次接管才能通过

"这根本不是技术问题,而是阅读理解+逻辑推理+博弈论的综合考试。"理想自动驾驶工程师自嘲道。

当马斯克团队还在纠结"如何识别中文"时,中国玩家已经进入更高维度的战场。

二、AI大模型调教实录:让汽车学会"快思考"与"慢思考"

2024年GTC大会上,理想汽车抛出一个"反常识"结论:人类大脑的"双系统理论",才是破解中国路况的终极密码

快系统犹如条件反射:

单颗Orin-X芯片运行端到端模型;

输入8摄像头+激光雷达数据,直接输出驾驶轨迹;

处理速度达到200帧/秒,比人类眨眼快4倍;

慢系统则像老司机的大脑:

22亿参数视觉语言大模型(VLM)实时解析路况;

能理解‘前方200米潮汐车道启用中“等复杂语义;

遇到特殊场景自动启动”思维”(CoT)推理。

双系统配合的实战案例

某测试车在青岛遇到“积雪覆盖+临时施工+潮汐车道”三重Buff时,VLM用0.8秒完成推理:

1、识别积雪反光中模糊的「7-9点东向西」字样

2、结合高德/百度地图数据矛盾,判断应以实时标牌为准

3、指挥端到端模型执行「借道逆行200米」的高危操作

更绝的是数据驱动的进化速度

训练数据从100万段视频提升到1000万段时

平均接管里程(MPI)从15公里暴涨至107公里

潮汐车道通过率从58%提升至92%

但真正的杀手锏藏在世界模型里——这个云端“元宇宙”每天生成3.2万个极端场景,让自动驾驶系统在虚拟世界“死"够10万次。

某次压力测试中,系统在24小时内遭遇了"暴雨+冰雹+道路塌方+救护车逆行"的魔鬼组合,最终交出「0接管」的成绩单。

三、VLA物理智能体觉醒:当汽车开始"自主思考"

2025年,理想汽车放出终极大招:VLA(视觉-语言-行为)大模型

这不是简单的技术升级,而是让汽车从"工具"进化为"智能体"的质变。

六大核心技术突破

1、3D高斯空间编码器:自监督训练让模型自动理解“积雪盖住的车道线”暴雨中的障碍物”

2、MoE稀疏架构:在Orin-X芯片上塞入530亿参数,推理速度仍保持10Hz

3、混合注意力机制:CoT推理用时仅23ms,比人类“思考要不要加塞”快5倍

4、扩散模型轨迹生成:2步采样生成6秒轨迹预测,博弈成功率提升41%

5、3D场景生成引擎:重建速度提升7倍,1小时生成某省会城市全路网

6、价值观对齐技术:用450万段接管数据训练,让系统学会“宁等3分不抢1秒”

产品端的“灵魂时刻”:

找车位模式:在北京某商场实测中,车辆自主绕行3层地库,识别出“柱子后方隐藏车位”,完成难度系数9.8的倒车入库

方言理解能力:四川用户说“走抵拢倒左拐”,系统准确执行“直行到尽头左转”

极端天气应对:哈尔滨-35℃暴雪天,VLA通过融雪剂痕迹判断真实车道走向

最震撼的当属思维可视化

用户界面实时显示“注意右后方外卖电动车”、“正在计算超车成功率”

遇到施工路段时,系统用语音解释“将借道非机动车道行驶50米,已确认无行人”

在ETC通道前主动询问:“检测到余额不足,是否切换人工通道?”

某科技博主实测后感叹:“这不是自动驾驶,是找了个AI老司机坐在方向盘后面。”

四、万亿市场的“寒武纪大爆发”

当其他车企还在卷“无图城市NOA”时,理想汽车已经打开新战场:Physical AI(物理智能体)的潘多拉魔盒。

行业颠覆正在进行

某物流公司测试显示,搭载VLA的货车在园区内自主接货成功率提升73%;

与某机器人公司合作开发的“家庭服务形态”,能让车辆自动接送儿童上下学;

在雄安新区试点中,VLA车队实现“无交通灯协同通行”,路口通过效率提升210%。

更深远的影响在数据飞轮

40万量产车每天贡献450万公里真实路况数据;

云端世界模型每月新增800TB训练数据;

模型迭代速度达到'小时级",某次暴雨预警后,系统2小时内更新涉水策略.

"这不再是单点技术突破,而是整个出行生态的重构。"某券商分析师在最新研报中指出,VLA带来的不仅是驾驶体验变革,更可能催生"移动智能空间"、“自动驾驶服务订阅”等万亿级新市场。

五、写在最后:当汽车学会“思考”

回看自动驾驶发展史:

2015年,行业在争论“要不要用激光雷达”;

2020年,焦点变成“如何摆脱高精地图”;

2025年,理想汽车用VLA给出终极答案:让汽车真正理解物理世界。

在某次会议上,李想抛出一个“灵魂拷问”:“如果汽车能自主思考,我们还需要方向盘吗?”

这个问题没有标准答案,但可以确定的是:当车辆开始理解“星巴克”不只是三个汉字,而是带有咖啡香气的目的地;当系统能识别“积雪路面”不仅是白色像素,而是需要缓行的危险场景——我们正站在智慧出行的奇点时刻。

总之,无人车来也(公众号:无人车来也)认为,或许用不了太久,当孩子问“为什么汽车要人开”时,我们会像解释“马车需要车夫”一样,讲述这个充满挣扎与突破的自动驾驶大时代。

而此刻,中国工程师正在用AI大模型,在物理世界写下新的答案。

亲!你说呢?参考文献:智猩猩Auto  文章《VLA:迈向自动驾驶物理智能体的关键一步 | 理想汽车贾鹏GTC 2025演讲全文》

原文标题 : 理想汽车 VLA:自动驾驶的 “超级大脑”,用AI大模型教会汽车“思考”?

但真正的杀手锏藏在世界模型里——这个云端“元宇宙”每天生成3.2万个极端场景,让自动驾驶系统在虚拟世界“死"够10万次。...原文标题:理想汽车VLA:自动驾驶的“超级大脑”,用AI大模型教会汽车“思考”。

引言

家人们,无人车来也(公众号:无人车来也)要聊一个超级酷炫的话题 —— 理想汽车在自动驾驶领域的重大突破 VLA。

这玩意儿可不得了,简直就是给汽车装上了一个 “超级大脑”,让自动驾驶直接 “起飞”!

(参考阅读请点击:

《理想汽车高管:把别人的拿来起个山海经的名字就算自己技术突破,好像没人质疑!自研也是有区别的》)

一、地狱级副本:中国自动驾驶的"高考题"

当马斯克在2024年财报会议上承认"FSD在中国遇到公交车道挑战"时,全行业都在憋笑——这位硅谷钢铁侠终于领教了东方神秘力量的杀伤力。

在中国,自动驾驶面临的不是普通关卡,而是地狱级副本。

最让特斯拉"折戟"的公交车道,堪称中国道路的"高考压轴题":地面文字、空中指示牌、动态LED屏三位一体,不同城市采用"早7-9晚5-7限行""仅限公交优先"等30余种文字表述规则。

更魔幻的是,某地因施工临时划设的公交专用道,使用"蓝色虚线+迷你文字"标注,连本地司机都直呼看不懂。

但这只是开胃菜:

潮汐车道每天变换方向,高峰期车道数量堪比俄罗斯方块;

待行区需要"先读秒再冲刺",成功率堪比科目二倒车入库;

ETC收费站存在15种不同版本的标识组合,部分收费站夜间关闭人工通道时,收费员会在窗口贴A4打印的"请走ETC"手写告示

更恐怖的是动态更新速度:某新一线城市去年新增87处可变车道,平均每周诞生1.67个新规则;某三线城市道路施工期间,同一路口连续3天出现"直行改左转→左转改禁行→恢复原状"的魔幻操作。

数据不会说谎

理想汽车实测发现,依赖高精地图的方案在3个月内鲜度衰减42%;

特斯拉FSD中国版在待行区场景的误判率达37%,是北美的4.6倍;

某新势力车型在动态车道路口平均需要2.3次接管才能通过

"这根本不是技术问题,而是阅读理解+逻辑推理+博弈论的综合考试。"理想自动驾驶工程师自嘲道。

当马斯克团队还在纠结"如何识别中文"时,中国玩家已经进入更高维度的战场。

二、AI大模型调教实录:让汽车学会"快思考"与"慢思考"

2024年GTC大会上,理想汽车抛出一个"反常识"结论:人类大脑的"双系统理论",才是破解中国路况的终极密码

快系统犹如条件反射:

单颗Orin-X芯片运行端到端模型;

输入8摄像头+激光雷达数据,直接输出驾驶轨迹;

处理速度达到200帧/秒,比人类眨眼快4倍;

慢系统则像老司机的大脑:

22亿参数视觉语言大模型(VLM)实时解析路况;

能理解‘前方200米潮汐车道启用中“等复杂语义;

遇到特殊场景自动启动”思维”(CoT)推理。

双系统配合的实战案例

某测试车在青岛遇到“积雪覆盖+临时施工+潮汐车道”三重Buff时,VLM用0.8秒完成推理:

1、识别积雪反光中模糊的「7-9点东向西」字样

2、结合高德/百度地图数据矛盾,判断应以实时标牌为准

3、指挥端到端模型执行「借道逆行200米」的高危操作

更绝的是数据驱动的进化速度

训练数据从100万段视频提升到1000万段时

平均接管里程(MPI)从15公里暴涨至107公里

潮汐车道通过率从58%提升至92%

但真正的杀手锏藏在世界模型里——这个云端“元宇宙”每天生成3.2万个极端场景,让自动驾驶系统在虚拟世界“死"够10万次。

某次压力测试中,系统在24小时内遭遇了"暴雨+冰雹+道路塌方+救护车逆行"的魔鬼组合,最终交出「0接管」的成绩单。

三、VLA物理智能体觉醒:当汽车开始"自主思考"

2025年,理想汽车放出终极大招:VLA(视觉-语言-行为)大模型

这不是简单的技术升级,而是让汽车从"工具"进化为"智能体"的质变。

六大核心技术突破

1、3D高斯空间编码器:自监督训练让模型自动理解“积雪盖住的车道线”暴雨中的障碍物”

2、MoE稀疏架构:在Orin-X芯片上塞入530亿参数,推理速度仍保持10Hz

3、混合注意力机制:CoT推理用时仅23ms,比人类“思考要不要加塞”快5倍

4、扩散模型轨迹生成:2步采样生成6秒轨迹预测,博弈成功率提升41%

5、3D场景生成引擎:重建速度提升7倍,1小时生成某省会城市全路网

6、价值观对齐技术:用450万段接管数据训练,让系统学会“宁等3分不抢1秒”

产品端的“灵魂时刻”:

找车位模式:在北京某商场实测中,车辆自主绕行3层地库,识别出“柱子后方隐藏车位”,完成难度系数9.8的倒车入库

方言理解能力:四川用户说“走抵拢倒左拐”,系统准确执行“直行到尽头左转”

极端天气应对:哈尔滨-35℃暴雪天,VLA通过融雪剂痕迹判断真实车道走向

最震撼的当属思维可视化

用户界面实时显示“注意右后方外卖电动车”、“正在计算超车成功率”

遇到施工路段时,系统用语音解释“将借道非机动车道行驶50米,已确认无行人”

在ETC通道前主动询问:“检测到余额不足,是否切换人工通道?”

某科技博主实测后感叹:“这不是自动驾驶,是找了个AI老司机坐在方向盘后面。”

四、万亿市场的“寒武纪大爆发”

当其他车企还在卷“无图城市NOA”时,理想汽车已经打开新战场:Physical AI(物理智能体)的潘多拉魔盒。

行业颠覆正在进行

某物流公司测试显示,搭载VLA的货车在园区内自主接货成功率提升73%;

与某机器人公司合作开发的“家庭服务形态”,能让车辆自动接送儿童上下学;

在雄安新区试点中,VLA车队实现“无交通灯协同通行”,路口通过效率提升210%。

更深远的影响在数据飞轮

40万量产车每天贡献450万公里真实路况数据;

云端世界模型每月新增800TB训练数据;

模型迭代速度达到'小时级",某次暴雨预警后,系统2小时内更新涉水策略.

"这不再是单点技术突破,而是整个出行生态的重构。"某券商分析师在最新研报中指出,VLA带来的不仅是驾驶体验变革,更可能催生"移动智能空间"、“自动驾驶服务订阅”等万亿级新市场。

五、写在最后:当汽车学会“思考”

回看自动驾驶发展史:

2015年,行业在争论“要不要用激光雷达”;

2020年,焦点变成“如何摆脱高精地图”;

2025年,理想汽车用VLA给出终极答案:让汽车真正理解物理世界。

在某次会议上,李想抛出一个“灵魂拷问”:“如果汽车能自主思考,我们还需要方向盘吗?”

这个问题没有标准答案,但可以确定的是:当车辆开始理解“星巴克”不只是三个汉字,而是带有咖啡香气的目的地;当系统能识别“积雪路面”不仅是白色像素,而是需要缓行的危险场景——我们正站在智慧出行的奇点时刻。

总之,无人车来也(公众号:无人车来也)认为,或许用不了太久,当孩子问“为什么汽车要人开”时,我们会像解释“马车需要车夫”一样,讲述这个充满挣扎与突破的自动驾驶大时代。

而此刻,中国工程师正在用AI大模型,在物理世界写下新的答案。

亲!你说呢?参考文献:智猩猩Auto  文章《VLA:迈向自动驾驶物理智能体的关键一步 | 理想汽车贾鹏GTC 2025演讲全文》

原文标题 : 理想汽车 VLA:自动驾驶的 “超级大脑”,用AI大模型教会汽车“思考”?

展开
打开“财经头条”阅读更多精彩资讯
APP内打开