不久前,退网多时的李想再次出现在公众视野。归来的李想一改往日单人演讲式的发言方式,选择了用接受媒体采访的对谈方式,探讨了理想汽车在人工智能领域的战略布局和未来愿景。当然,形式虽然变了,但李想依然理想,本次对谈保持了他一贯高信息密度、体系化的谈话输出。上一次还是在2023年春天,李想选择的主题是如何理解造车。这一次,李想的主题已经进化成了如何理解AI,以及,如何用造车通向AGI。对这一次主题略显宏大的谈话,各方质疑正如采访者张小珺所问:一个造车时选择用增程开局的实用主义者,怎么似乎突然间变成了拥有宏伟AI愿景的理想主义者?李想没有直接回答,但三小时的问答和理想过去九年的实践,本身构成了回答:做不做AI对他来说不构成问题,何处切入AI,何时All in AI,如何做好AI,才是真正的问题。
不过这不足以解释另一个问题:作为宣称对AI有信仰的一家公司,理想为什么不是在自动驾驶创业浪潮兴起的2016年All in AI,也不是在Transfomer大放异彩的2021年All in AI,而是在2023年才把AI作为阳谋,在2024年末才喊出了AGI的目标?以李想的“创业节奏论”解释则是,一家企业不应在0-10的阶段,做10-100阶段的事。OpenAI的例子表明,AGI很可能是有史以来最壮烈、复杂的商业/技术竞赛,它需要海量的资金、数据、算力,以及顶级人才,有着漫长的实现周期,竞争维度也超越了既有商业组织的边界。以AGI为己任的OpenAI创立于2015年,汇聚了过去十余年AI领域的超级大脑,至2024年累计融资179亿美元且越亏越多,为了训练模型OpenAI几乎爬光整个互联网的公开数据,其最大股东微软为了提供算力支持,去年向英伟达购买了近50万颗Hopper GPU。在这样的竞赛中,即使是市值万亿的顶级企业也心惊胆战。而理想如果没有选择“先造车,广积粮”的迂回路线,很可能连AGI的友谊赛名额都拿不到。如果以AGI为目的地回望,理想成立这九年主要的经营目标可以总结为:度过企业的0-1、1-10阶段,找到一块有足够利润和数据产出的根据地,点出AGI的前置科技树,筹集AGI竞争的入场券。正因为对创业节奏的理解,理想选择了以增程路线切入造车。同样,对节奏的把握也贯穿在理想打造AI产品的过程中。比如在早期资源受限的情况下,理想在智驾产品上采取了跟随策略,同时做好了可以长期发挥效用的数据沉淀与基建工作,等待算力、算法、数据升级。在2023有了进一步的商业成功,智驾的营养系统——现金、算力和数据都足够充沛后,理想果断转向端到端+VLM,引领了技术范式,实现了智驾体验的快速提升,带动了高配车型销售。理想率先量产了端到端+VLM双系统架构高阶智驾这种变道超车一方面离不开智驾部门打硬仗的战役能力,另一方面也考验企业对内部能力、资源进行评估,对外部环境、需求变化进行感知,做出决断的战略能力。理想在2024年末All in AI,实际是管理层进一步看到了内外部条件的变化,判断可以、也需要开启下一篇章:于内,以理想同学和智能驾驶为代表,理想的AI产品在2024年打了胜仗,积累了数据,培养了人才队伍,收获了商业回报,AI能力的建设度过了1-10阶段,在认知智能和空间智能上都取得了一定建树,通往AGI的路径不再是空谈。于外,无论是马斯克创办xAI,还是量化出身的幻方推出技惊四座的DeepSeek V3,都表明人工智能正在进一步打破不同类型企业的边界,在AI上不思进取会面临被跨行业而来的对手用AI端掉饭碗的风险。但同时,在基座模型上领先的企业们,在Scaling Law的规则下一路狂飙后,终于撞到了一堵无形的墙——网络上的公开数据已经耗竭,接下来将考验垂直场景和物理世界数据的收集利用,成本与难度要高得多。而智能电动汽车恰好是一个足够大的细分场景,也是绝佳的物理世界数据生产终端。对理想来说,All in AI最好的时机到了。
该用什么方式All in AI
选择全面躬身入局后,理想的AI方法论也依然带着鲜明的理想式烙印:把AI的产品做得更好,吸引更多人。12月27日,理想AI Talk的最后一天,理想同学APP在App Store、小米应用商城等上线,这是车企研发的智能助手首次从车机进入手机。此前,车企的语音助手只搭载于车上,用在车内,服务自家车主,超出汽车场景与其他设备抢用户,会被认为偏离造车主线。但这一“不务正业”的举动,在理想的规划中是通往AGI的必由之路。一方面,只在车内单一场景发挥作用的智能助手,最终不可能是一个好的助手——用户很难指望一个在你开车时唠会儿嗑的对话机器人真的懂你。跨越不同的设备、场景,被足够多的用户使用足够长的时间,智能助手才会越来越智能,越来越好用。另一方面,ChatGPT横空出世后,对话机器人成为AI最广泛的应用。更重要的,自然语言很可能会成为AGI时代最通用的交互入口,以对话形式与人交互的智能助手,将是最基本且普遍的产品形态。如果一家企业的目标是AGI,智能助手的产品打造和技术建设都是不可绕过的一环。但将理想同学推向手机、进入更多场景,也意味着加入一个更激烈的战场,需要更强的实力。理想选择在基座模型上下功夫。理想新一版端到端多模态模型Mind GPT3o已正式上线为理想同学提供支持,其响应速度达到百毫秒级,能够理解不同模态,记忆、规划、工具、表达能力均得到提升。手机上的理想同学,会展现思考过程李想向团队提出了目标,未来几年在国内保证理想大语言模型的基座模型位于行业前三,这是一个颇具挑战性的任务。2024年末,国内排行前三的智能助手豆包、文心一言、Kimi月活分别约6000万、1300万、1280万,比理想同学的月活用户有一个数量级的领先,且同时登陆PC与手机,提供的能力也更多元。再次扮演追赶者的理想,势必要在2025年对Mind GPT的资金、人才密度进一步加码。在另一头,去年让理想成功跻身智驾第一梯队的智驾团队,也并无闲暇享受胜利。因为理想智驾业务的阶段性目标并非问鼎L2辅助驾驶,而是实现有监督的自动驾驶即L3。在2025年,理想将寻求高阶智驾产品能力的进一步提升,比如将接管里程提升至500公里。这需要更快地转动数据飞轮。理想预估,要达成接管里程500公里的目标,需要从50亿乃至100亿公里驾驶里程中,筛选2000万个老司机驾驶视频片段供端到端网络训练。这是一项对数据和算力体系的魔鬼考验。但理想以每个月超2万辆速度扩充的高阶智驾车队,成倍增长的智驾里程,高度自动化的标注体系,以及8.1EFlops的云端算力储备,提供了可行性。与此同时,理想也开始努力巩固在国内智驾领域“先进技术量产先锋”的地位。在最新一版智驾系统中,理想将高速场景纳入到端到端架构,并首次推出了智驾的AI推理可视化——引入思维链技术, 在AD Max车型上展示端到端和VLM系统的感知、推理过程。在直播中实时运行的理想智驾推理可视化UI智驾系统对自身思考过程进行展现,是解决端到端架构黑箱难题的重要方法。打开神经网络的黑箱,既可赢取用户的信任,也便于智驾团队对问题场景追根溯源,持续提升智驾模型的能力。用一句话总结理想在2025年的AI战略,便是理想同学和高阶智驾将继续作为理想AI拳头产品,成倍接入资源,获取更多用户,在产品形态和性能方面向上“摸高”。理想之所以选择两手抓,是因为两者分别代表认知(语言)智能和空间(行为)智能,也是人类主要的两种智能表现方式。但人类能够将两种智能融汇应用,这是AI目前的短板。反过来意味着,如果能让AI同时掌握两种智能,很可能就找到了AGI的钥匙。因此在All in AI的阶段,理想已经开启下一代基座模型VLA(视觉语言行动模型)的预研——目的是将认知智能和空间智能统一起来,让一辆理想像人一样同时拥有认知智能和空间智能,从而实现L4自动驾驶,成为李想定义中“你的助手”。三年之后,理想计划推出首款为L4级自动驾驶定义的汽车。届时,或许就是理想开启机器人产品线,迈向打造“硅基家人”的开始。
不久前,退网多时的李想再次出现在公众视野。归来的李想一改往日单人演讲式的发言方式,选择了用接受媒体采访的对谈方式,探讨了理想汽车在人工智能领域的战略布局和未来愿景。当然,形式虽然变了,但李想依然理想,本次对谈保持了他一贯高信息密度、体系化的谈话输出。上一次还是在2023年春天,李想选择的主题是如何理解造车。这一次,李想的主题已经进化成了如何理解AI,以及,如何用造车通向AGI。对这一次主题略显宏大的谈话,各方质疑正如采访者张小珺所问:一个造车时选择用增程开局的实用主义者,怎么似乎突然间变成了拥有宏伟AI愿景的理想主义者?李想没有直接回答,但三小时的问答和理想过去九年的实践,本身构成了回答:做不做AI对他来说不构成问题,何处切入AI,何时All in AI,如何做好AI,才是真正的问题。
不过这不足以解释另一个问题:作为宣称对AI有信仰的一家公司,理想为什么不是在自动驾驶创业浪潮兴起的2016年All in AI,也不是在Transfomer大放异彩的2021年All in AI,而是在2023年才把AI作为阳谋,在2024年末才喊出了AGI的目标?以李想的“创业节奏论”解释则是,一家企业不应在0-10的阶段,做10-100阶段的事。OpenAI的例子表明,AGI很可能是有史以来最壮烈、复杂的商业/技术竞赛,它需要海量的资金、数据、算力,以及顶级人才,有着漫长的实现周期,竞争维度也超越了既有商业组织的边界。以AGI为己任的OpenAI创立于2015年,汇聚了过去十余年AI领域的超级大脑,至2024年累计融资179亿美元且越亏越多,为了训练模型OpenAI几乎爬光整个互联网的公开数据,其最大股东微软为了提供算力支持,去年向英伟达购买了近50万颗Hopper GPU。在这样的竞赛中,即使是市值万亿的顶级企业也心惊胆战。而理想如果没有选择“先造车,广积粮”的迂回路线,很可能连AGI的友谊赛名额都拿不到。如果以AGI为目的地回望,理想成立这九年主要的经营目标可以总结为:度过企业的0-1、1-10阶段,找到一块有足够利润和数据产出的根据地,点出AGI的前置科技树,筹集AGI竞争的入场券。正因为对创业节奏的理解,理想选择了以增程路线切入造车。同样,对节奏的把握也贯穿在理想打造AI产品的过程中。比如在早期资源受限的情况下,理想在智驾产品上采取了跟随策略,同时做好了可以长期发挥效用的数据沉淀与基建工作,等待算力、算法、数据升级。在2023有了进一步的商业成功,智驾的营养系统——现金、算力和数据都足够充沛后,理想果断转向端到端+VLM,引领了技术范式,实现了智驾体验的快速提升,带动了高配车型销售。理想率先量产了端到端+VLM双系统架构高阶智驾这种变道超车一方面离不开智驾部门打硬仗的战役能力,另一方面也考验企业对内部能力、资源进行评估,对外部环境、需求变化进行感知,做出决断的战略能力。理想在2024年末All in AI,实际是管理层进一步看到了内外部条件的变化,判断可以、也需要开启下一篇章:于内,以理想同学和智能驾驶为代表,理想的AI产品在2024年打了胜仗,积累了数据,培养了人才队伍,收获了商业回报,AI能力的建设度过了1-10阶段,在认知智能和空间智能上都取得了一定建树,通往AGI的路径不再是空谈。于外,无论是马斯克创办xAI,还是量化出身的幻方推出技惊四座的DeepSeek V3,都表明人工智能正在进一步打破不同类型企业的边界,在AI上不思进取会面临被跨行业而来的对手用AI端掉饭碗的风险。但同时,在基座模型上领先的企业们,在Scaling Law的规则下一路狂飙后,终于撞到了一堵无形的墙——网络上的公开数据已经耗竭,接下来将考验垂直场景和物理世界数据的收集利用,成本与难度要高得多。而智能电动汽车恰好是一个足够大的细分场景,也是绝佳的物理世界数据生产终端。对理想来说,All in AI最好的时机到了。
该用什么方式All in AI
选择全面躬身入局后,理想的AI方法论也依然带着鲜明的理想式烙印:把AI的产品做得更好,吸引更多人。12月27日,理想AI Talk的最后一天,理想同学APP在App Store、小米应用商城等上线,这是车企研发的智能助手首次从车机进入手机。此前,车企的语音助手只搭载于车上,用在车内,服务自家车主,超出汽车场景与其他设备抢用户,会被认为偏离造车主线。但这一“不务正业”的举动,在理想的规划中是通往AGI的必由之路。一方面,只在车内单一场景发挥作用的智能助手,最终不可能是一个好的助手——用户很难指望一个在你开车时唠会儿嗑的对话机器人真的懂你。跨越不同的设备、场景,被足够多的用户使用足够长的时间,智能助手才会越来越智能,越来越好用。另一方面,ChatGPT横空出世后,对话机器人成为AI最广泛的应用。更重要的,自然语言很可能会成为AGI时代最通用的交互入口,以对话形式与人交互的智能助手,将是最基本且普遍的产品形态。如果一家企业的目标是AGI,智能助手的产品打造和技术建设都是不可绕过的一环。但将理想同学推向手机、进入更多场景,也意味着加入一个更激烈的战场,需要更强的实力。理想选择在基座模型上下功夫。理想新一版端到端多模态模型Mind GPT3o已正式上线为理想同学提供支持,其响应速度达到百毫秒级,能够理解不同模态,记忆、规划、工具、表达能力均得到提升。手机上的理想同学,会展现思考过程李想向团队提出了目标,未来几年在国内保证理想大语言模型的基座模型位于行业前三,这是一个颇具挑战性的任务。2024年末,国内排行前三的智能助手豆包、文心一言、Kimi月活分别约6000万、1300万、1280万,比理想同学的月活用户有一个数量级的领先,且同时登陆PC与手机,提供的能力也更多元。再次扮演追赶者的理想,势必要在2025年对Mind GPT的资金、人才密度进一步加码。在另一头,去年让理想成功跻身智驾第一梯队的智驾团队,也并无闲暇享受胜利。因为理想智驾业务的阶段性目标并非问鼎L2辅助驾驶,而是实现有监督的自动驾驶即L3。在2025年,理想将寻求高阶智驾产品能力的进一步提升,比如将接管里程提升至500公里。这需要更快地转动数据飞轮。理想预估,要达成接管里程500公里的目标,需要从50亿乃至100亿公里驾驶里程中,筛选2000万个老司机驾驶视频片段供端到端网络训练。这是一项对数据和算力体系的魔鬼考验。但理想以每个月超2万辆速度扩充的高阶智驾车队,成倍增长的智驾里程,高度自动化的标注体系,以及8.1EFlops的云端算力储备,提供了可行性。与此同时,理想也开始努力巩固在国内智驾领域“先进技术量产先锋”的地位。在最新一版智驾系统中,理想将高速场景纳入到端到端架构,并首次推出了智驾的AI推理可视化——引入思维链技术, 在AD Max车型上展示端到端和VLM系统的感知、推理过程。在直播中实时运行的理想智驾推理可视化UI智驾系统对自身思考过程进行展现,是解决端到端架构黑箱难题的重要方法。打开神经网络的黑箱,既可赢取用户的信任,也便于智驾团队对问题场景追根溯源,持续提升智驾模型的能力。用一句话总结理想在2025年的AI战略,便是理想同学和高阶智驾将继续作为理想AI拳头产品,成倍接入资源,获取更多用户,在产品形态和性能方面向上“摸高”。理想之所以选择两手抓,是因为两者分别代表认知(语言)智能和空间(行为)智能,也是人类主要的两种智能表现方式。但人类能够将两种智能融汇应用,这是AI目前的短板。反过来意味着,如果能让AI同时掌握两种智能,很可能就找到了AGI的钥匙。因此在All in AI的阶段,理想已经开启下一代基座模型VLA(视觉语言行动模型)的预研——目的是将认知智能和空间智能统一起来,让一辆理想像人一样同时拥有认知智能和空间智能,从而实现L4自动驾驶,成为李想定义中“你的助手”。三年之后,理想计划推出首款为L4级自动驾驶定义的汽车。届时,或许就是理想开启机器人产品线,迈向打造“硅基家人”的开始。