端到端智驾燃爆中关村!2025首场自动驾驶峰会圆满落幕,清华李升波教授、理想智驾一号位给出研判

车东西

5小时前

其目的是通过对边缘场景数据的采集、上传、清洗、训练和部署,不断优化自动驾驶系统的行驶策略,达到边开车边学习,驾驶性能越来越好的效果。

近30位嘉宾分享,一文看尽万字干货。
作者 |  车东西
编辑 |  志豪
2025年首场自动驾驶峰会,燃爆北京!
车东西1月14日消息,就在今天,由智一科技旗下智猩猩、车东西共同发起的第四届全球自动驾驶峰会在北京中关村国家自主创新示范区展示交易中心-会议中心圆满落幕。
作为智一科技面向自动驾驶领域打造的会议IP,第四届全球自动驾驶峰会以“技术新周期 产业新征程”为主题,设置“主会场+分会场+展区”三个板块。
其中,主会场进行开幕式、端到端自动驾驶创新论坛、城市NOA专题论坛;分会场则进行自动驾驶视觉语言模型技术研讨会、自动驾驶世界模型技术研讨会,全方位呈现全民智驾时代端到端自动驾驶新周期里的科研成果、技术探索、产品方案创新与未来趋势。
整场活动,近30位自动驾驶学术领袖、产业大咖与青年学者齐聚一堂,共同探讨了端到端、世界模型、视觉语言模型、城市NOA等行业内最火热的热门话题。

▲主会场现场

现场嘉宾精彩观点不断,清华大学车辆与运载学院/人工智能学院教授、博导李升波认为车路云一体化是自动驾驶基座模型的开发框架,需要政府、企业、高校三者组建联合体解决数据和算力等方面的难题。
理想汽车自动驾驶研发副总裁郎咸朋表示,理想汽车将致力于“人工智能的汽车化”,从模型、工程、产品等方面提升自动驾驶能力。
零一汽车智能驾驶合伙人王泮渠,昇启科技联合创始人、CTO刘敏俊,朗歌科技副总经理李战斌,都认为端到端带来了研发模式的革新。
峰会全天有接近九百位观众来到现场。无论是主会场上下午,还是分会场的两场闭门研讨会,均是座无虚席。尤其是开幕式,场内观众席两侧通道及后排空间更是站了不少观众。与此同时,20+媒体平台与视频号直播了本次峰会,直播观看量超过百万。

▲分会场-自动驾驶视觉语言模型技术研讨会

▲分会场-自动驾驶世界模型技术研讨会

作为2025年国内首场自动驾驶峰会,本次会议不仅系统呈现了智能驾驶过去一年的发展态势和量产进展,也为端到端自动驾驶开启的新一轮变革指明了前进方向,也燃动了世界模型在国内自动驾驶领域的研究与开发热度。
01.
智驾商业化迎来重要节点
端到端+大模型掀起行业新变革

峰会现场,智一科技联合创始人、CEO龚伦常作为主办方代表进行了开场致辞,他表示,过去一年,端到端与大语言模型、视觉语言模型协同,成为自动驾驶的主要技术路线。同时,世界模型也获得了更高的关注。

▲智一科技联合创始人、CEO龚伦常

基于此,峰会希望通过充分探讨,梳理行业的发展现状,进一步厘清未来的发展趋势。
本次峰会围绕端到端自动驾驶、城市NOA、自动驾驶视觉语言模型技术、自动驾驶世界模型技术等方向设置了多个话题。
数字化和智能化正在成为中国新一轮高质量发展的重要驱动力,智一科技成立以来一直聚焦在这一驱动力背后的核心技术和行业需求,构建了智东西、芯东西和车东西三大媒体品牌,持续提供专业优质的图文和视频内容,在相关领域具有广泛影响力。
同时,智一科技围绕企业服务,打造了智猩猩品牌,采用线上公开课和研讨会等形式提供高质量的技术向内容。
在最后,龚伦常感谢了中关村科学城管委会对本次峰会的大力支持。
龚伦常致辞结束后,清华大学车辆与运载学院/人工智能学院教授、博导李升波率先登台,分享了“数据驱动的端到端自动驾驶”发展历史、关键技术与未来趋势。
他首先回顾了人工智能领域的里程碑事件,包括2015年ResNET、2017年AlphaGo、2022年ChatGPT等,标志着人工智能时代的到来,并强调,自动驾驶是人工智能的重要应用方向之一,具有市场规模大、牵引链条长、技术难度高的特点。

▲清华大学车辆与运载学院/人工智能学院教授、博导李升波

紧接着,李升波指出,狭义上“自动驾驶”主要是指面向复杂城市交通工况的高级别智能驾驶系统。
这类系统对感知、决策、控制技术的安全性要求极高,因为控制权、风险监控、失效应对都是归属于系统本身处理,系统必须能够独立地完成所有驾驶任务。
李升波表示,安全性不足是现有自动驾驶系统走向实用化的核心难题,典型指标是行驶过程的万公里接管数,还远远不能达到人类驾驶员的平均水平,核心难题在于如何处理边缘驾驶场景(即发生数量的稀少,但危险度高的场景)。
为了解决这一问题,行业已经形成的共识是:以数据闭环为基础,以神经网络为策略载体,走“端到端”自动驾驶的技术路线。
其目的是通过对边缘场景数据的采集、上传、清洗、训练和部署,不断优化自动驾驶系统的行驶策略,达到边开车边学习,驾驶性能越来越好的效果。
李升波指出,端到端的本质是“神经网络化”,而非只有一个黑箱的神经网联。
他介绍了端到端自动驾驶的技术优势,与传统的分模块设计相比,端到端的设计方案一方面能够更有效地传递信息,减少信息损失,能够充分挖掘数据资源潜力;另一方面具有更多的神经网络参数,具有更大的训练自由度,性能的上界更高。
李升波提到,我国科研机构开展端到端自动驾驶的技术研究并不比国外晚,清华大学车辆学院的智能汽车团队自2018年起就开始探索这一技术路径。
他指出,六年前启动这一技术的研发,并不像今天具备这么好的条件,数据不足、算力匮乏都是制约模型训练性能的挑战性难题。
该团队也是于行业内率先提出“数据不足仿真补、算力不足算法超”换道研发思路,并于仿真软件、AI训练器等诸多方面取得了一系列重要进展,包括研发自主知识产权的大规模自动驾驶训练软件LasVSim和首个面向工业控制的最优策略强化学习求解器GOPS。
李升波分享了清华大学在强化学习和神经网络训练方面的研究成果,特别是针对稳定性和效率的改进。
该团队提出了强化学习领域性能排名第一的算法DSAC(Distributional Soft Actor-Critic),过拟合状态动作价值的连续分布,等价学习了无限多个价值函数,有效抑制了传统强化学习仅拟合单值函数导致的过估计难题,较之已有强化学习算法性能大幅提升;研发了工业控制领域性能排名第一的神经网络优化器RAD(Relativistic Adaptive gradient Descent),将神经网络参数的优化过程建模为多粒子相对论系统状态的演化过程,从动力学视角保障了强化学习的训练稳定性和收敛性。
以此为基础,清华大学成功开发出国内首个三段式端到端自动驾驶系统iDrive,并率先完成城市工况的开放道路测试,这一技术方案后续成功在广汽、东风、智行者等企业进行了实车部署,能够在拥堵、无信号交叉口等城市复杂道路条件下实现非机动车让行、路侧停车绕行等行为。
最后,李升波展望了未来的发展方向,指出车路云一体化是自动驾驶基座模型的开发框架,亟需建立统一的数据平台以促进数据共享,同时强调算力对自动驾驶的重要性,呼吁由政府、企业、高校三者组建联合体共同解决这些制约自动驾驶发展的瓶颈难题。
李升波教授从学术的角度分享了对于自动驾驶的思考,理想汽车自动驾驶研发副总裁郎咸朋则站在了产业的角度,发表了主题为《理想自动驾驶技术创新应用》的演讲。

▲理想汽车自动驾驶研发副总裁郎咸朋

郎咸朋介绍了过去一年理想自动驾驶的研发进展。
理想汽车创新性地提出自动驾驶端到端+VLM双系统架构,并结合基于世界模型的训练评价体系,率先完成车位到车位的全量推送。而自动驾驶模型性能的提升同样符合Scaling Law,基于1000万clips训练的模型即将推送用户,全场景接管率(MPI)将超过100公里。
他表示,当前自动驾驶模型训练总里程基数超过30亿公里,云端算力超过8E Flops,下一阶段将着重以创新技术手段提升资源利用效能。
郎咸朋还指出,从端到端+VLM到VLA,是AI能力从“行为智能”到“空间智能”的再次进阶,后续理想汽车将着力于“人工智能的汽车化”,从模型、工程、产品三个维度提升自动驾驶的综合能力。
为实现L3,全场景接管率(MPI)要超过500km,等效双周一次接管,平均事故里程(MPA)要超过350万公里,约等于人类安全里程的5倍,AD里程渗透率要大于25%,实现跨越鸿沟。
而要达到L4,这三方面的能力需要进一步提升至更高维度。
为实现L4,全场景接管率(MPI)要超过2500km,等效每季度一次接管,平均事故里程(MPA)要超过660万公里,约等于人类安全里程的10倍,AD里程渗透率要大于60%。
郎咸朋在最后强调,理想的使命愿景是成为全球领先的人工智能企业,并以此为方向持续进行自动驾驶技术与产品的创新与应用,还请大家拭目以待。
一些供应链行业代表也分享了关于自动驾驶的一些思考。
元戎启行副总裁、技术合伙人刘轩指出,当前的智能驾驶系统已摆脱传统模块化的规则驱动,转向以AI为核心的数据驱动模式。

▲元戎启行副总裁、技术合伙人刘轩

但现在的端到端智驾系统缺乏可解释性,无法解释它驾驶决策的逻辑。另外如果碰到难以用常识理解读懂的情况,系统就很难推理出好的驾驶决策。
目前,元戎启行正在研发VLA模型。实际上,VLA模型也属于端到端框架,但和现在用的端到端模型不同。
VLA模型融合了VLM和E2E模型,对比上一代模型,VLA模型更简洁,信息传递更直接,对于复杂场景的解读更到位,可以更透彻地理解人类的驾驶文化。
最后刘轩表示相信很快智能市场就会迎来一个暴涨期。搭乘着市场的东风,元戎启行也会全力冲刺。
极佳科技的副总裁毛继明在演讲中深入探讨了生成式世界模型如何引领自动驾驶和具身智能走向新的时代。
当下,消费者对智能驾驶功能的体验和要求不断提高,这种高规格的要求使得智能驾驶算法的迭代面临高质量数据、低频场景需求激增的困境。
为了解决这一问题,业界开始探索使用生成数据的可能性,以辅助提升算法性能。毛继明指出,「生成数据」是世界模型的首要应用之一,也是端到端自动驾驶最重要最高效的数据来源。

▲极佳科技合伙人副总裁毛继明

毛继明强调智能驾驶算法的表现需超越人类驾驶员才能获得人类司机的信任和使用。因此,构建一个实时可交互的环境让算法进行实践显得尤为重要,而生成式世界模型就负责构建这个环境。
进而,毛继明介绍了世界模型的基本概念,尽管目前尚无统一的定义,但业界的共识认为核心功能包括建模、想象、预测和行动。
世界模型是现实世界的投影,能够为智能体提供想象能力、预测未来结果,并进行结果评判。毛继明强调,构建世界模型的过程中,需要引入视频生成、空间几何和物理引擎等多种技术,以实现更全面的世界建模。
在具体应用方面,毛继明提到,世界模型可以用于数据生成和泛化,通过生成多样化的数据来提升感知算法的鲁棒性,还可用于4D场景构建,以支持实时闭环仿真等应用。在此过程中,毛继明展示了如何通过激活不同功能区来实现这些目标。
在演讲的最后,毛继明分享了极佳世界模型与合作伙伴落地的成功案例,展示了不同的模块和功能在行业落地应用的情况,以及极佳在此过程中积累的行业经验和“武器库”。
毛继明在演讲中对生成式世界模型在智能驾驶和具身智能领域的突破性应用进行了全面阐释,并结合实际案例展示了极佳科技的技术成果。
正如他所强调的,世界模型并非仅是技术工具,而是推动未来人工智能迈向通用智能时代的核心引擎。通过融合视频生成、空间几何和物理引擎等多种技术,世界模型不仅为算法的性能提升提供了高效的模拟环境,更为整个行业带来了新的应用可能性。
在未来的人工智能技术版图中,世界模型的地位举足轻重。它为实现高效、低成本的数据生成,增强智能体的预测与决策能力铺平了道路。极佳科技致力于将世界模型的潜力进一步转化为实际应用,加速推动技术从专有领域向更广泛场景的扩展,为通用智能的全面实现打下坚实基础。
智加科技首席科学家崔迪潇则从更细分的角度入手,围绕走向更安全更智能的干线物流带来了深入分享。

▲智加科技首席科学家崔迪潇

崔迪潇指出,中国的干线物流是一个万亿级别的巨大市场,卡车的存有量达到800万台。然而在这个巨大的市场背后,一系列结构性的问题正日益凸显。一方面,干线物流安全事故频发,另一方面,人力与燃油成本攀升挤占利润空间,降本增效需求显著。
针对这些痛点,智加科技始终坚持不懈地推进自动驾驶重卡的研发工作。目前,搭载智加领航系统的智能重卡已率先实现量产,并且智加领航系统也已在头部物流企业投入实际运营。
值得关注的是,崔迪潇也就业内盛行的端到端热潮作出回应。他指出,端到端在某种程度上可谓是一种资源“恐吓”,尤其对于部分初创型企业而言更是如此。
与此同时,他也提到,尽管资源有限,但这些创业团队同样面临着机遇。当技术发展至一定阶段后,能够以十分之一的成本达成同样出色的效果。这是因为在端到端智能驾驶中,大量冗余的标注与计算实际上并无必要。
针对这些,智加科技提出了基于人类的驾驶驾驶指令来引导模型高效学习场景表征的SSR框架,成功实现了不依赖于感知标注的真正端到端训练。
最后,崔迪潇总结说:“L4级自动驾驶是我们的终极目标,在朝着这一目标前进的过程中,我们势必会遇到各种变化和挫折,也会发现一些新的技术方向。不过,这些新的技术方向仅仅是我们实现目标的手段,而非目标本身。不能走了太远,忘了为何而出发。为达成无人化这一目标,还有很多更重要的工作要大家一起坚持继续去做。”
辰韬资本执行总经理刘煜冬博士从智能驾驶产业投资的角度,分享了关于端到端新范式下的智能驾驶产业投资思考。

▲辰韬资本执行总经理刘煜冬

刘煜冬表示,过去的半年整个行业有很大的变化,乘用车高阶智驾渗透率接近10%,整个高阶辅助系统向更低的车型渗透,智驾产品处于从早期市场迈向主流市场的重要拐点。
刘煜冬提到,目前端到端已经不仅仅是一个技术名词,破圈成为用户体验和用户心智的一部分。
关于端到端范式加速演进,刘煜冬表示大模型将赋能VLM/VLA,提到端到端1.0是从规则到数据驱动,端到端2.0引入大模型和强化学习范式,会进一步强化数据带来的壁垒,行业向车企和头部智驾公司集中。
但是,刘煜冬表示端到端落地面临着路采数据回灌开环验证,实车性能差异大Sim2Real gap无法避免和Corner Case采集成本高、效率低等挑战。
刘煜冬认为生成式世界模型成为端到端落地的重要工具,其可以充分利用海量的无标注数据,包括互联网数据、跨车型和传感器参数的数据。还可以低成本生成高保真度的测试验证数据,用于端到端算法的闭环验证。
端到端在乘用车辅助驾驶领域大放异彩,而在无人驾驶领域,2024年已经是无人驾驶的商业化元年,诸多场景的无人驾驶公司开始了规模化复制和指数增长。
例如,易控智驾在矿区部署超 1000 台无人车,Waymo在美国运营超千台Robotaxi ,订单量急剧增长。目前头部无人驾驶公司也开始进行端到端的早期探索,更加关注新技术在L4无人驾驶降本增效和场景拓展的能力。
刘煜冬最后总结道,端到端自动驾驶2.0阶段将开启VLM/VLA的新范式,主机厂和掌握数据的自动驾驶公司进一步掌握话语权。
而随着无人驾驶开始规模商业化,率先完成商业闭环的公司更有机会布局投入新范式,并扩展至更通用的无人驾驶开放场景。
而上午场嘉宾演讲结束后,本次峰会也进入圆桌讨论环节,本次圆桌讨论围绕 “全民智驾时代开启,端到端掀起新一轮变革” 的主题展开,在智一科技联合创始人、总编辑张国仁的主持下,零一汽车智能驾驶合伙人王泮渠、辰韬资本执行总经理刘煜冬共同探讨了自动驾驶领域在2024年的重要变化和未来发展趋势。
与会专家普遍认为,2024年是自动驾驶商业化的重要节点。

▲圆桌讨论现场

零一汽车智能驾驶合伙人王泮渠提到,wayve的技术进展和融资事件标志着端到端架构的可行性,这为整个行业注入了信心。随着无人驾驶技术的不断成熟,多个领域如出租车、矿区无人驾驶、无人物流等开始实现商业化应用,展现出良好的市场前景。
这一趋势不仅促进了投资者的信心,也推动了相关企业的上市,标志着行业进入了一个新的发展阶段。
论坛中,专家们强调了技术迭代和数据驱动对自动驾驶行业的重要影响。
辰韬资本执行总经理刘煜冬指出,自动驾驶行业正在从传统范式向数据驱动的范式转变,新的开发模式使得技术进步和产品落地的速度加快。尤其是人工智能技术的快速发展,为自动驾驶的实现提供了强有力的支持。
专家们认为,过去几年的数据积累和技术创新为行业的快速迭代奠定了基础,使得自动驾驶的落地应用得以迅速推广。
在讨论未来市场时,专家们认为自动驾驶领域将会出现多种技术路线的共存。
王泮渠表示,尽管市场上有许多自研厂商,但第三方供应商依然有生存空间。随着市场规模的扩大,自动驾驶技术的渗透率仍在提升,为不同团队提供了发展机会。
刘煜冬则指出,未来的商业化发展会更加依赖于技术的创新和应用场景的多样化,尤其是在物流和交通运输等领域,仍然存在大量未被开发的市场机会。
02.
端到端革新智驾研发范式
掌握数据或掌握更多话语权

在今天下午峰会现场,主会场举行了两场论坛,分别是端到端自动驾驶创新论坛和城市NOA专题论坛。
在下午的端到端自动驾驶创新论坛上,中科院自动化所副研究员张启超首先带来主题报告,从科研角度讲解监督学习范式下端到端自动驾驶的新进展及其面临的关键挑战。

▲中科院自动化所副研究员张启超

张启超指出,2016年后端到端走向两条路,一派是去做开环的端到端,然后另一派是做Carla仿真闭环的端到端。
值得注意的是,在其团队的科研实践中,张启超指出监督式端到端自动驾驶存在规模化定律,数据量的大规模增加带来了两方面的影响。
好消息是,Data Scaling带来了“组合泛化”能力,数据规模化为端到端自动驾驶提供了“组合泛化”能力,为自动驾驶安全落地提供理论支撑。
坏消息则是,闭环性能提升随着数据量的指数增加有变缓趋势。他指出,由于监督数据拖后腿,随着算力、模型增大,收益将饱和。
而对于成为业内热词的“世界模型”,张启超也给出了一些值得进一步探索的研究方向。
张启超表示,端到端从开环走到闭环,需要打造世界模型。
用途一是打造闭环测试验证世界模型,把世界模型作为一个演练场,去评估和测试当前的端到端模型能不能上车。
用途二则是打造闭环世界模型用于RL策略训练,即高保真的交互的世界模型,这也是一条不错的路径。
零一汽车智能驾驶合伙人王泮渠以《端到端+大模型: 加速新能源重卡智能化之路》为主题展开分享。

▲零一汽车智能驾驶合伙人王泮渠

王泮渠表示,辅助驾驶已经进入量产状态,2023年,具备辅助驾驶功能的智能网联乘用车销量995.3万辆,市场渗透率达47.3%,而目前,商业车对无人驾驶的需求还更高一些。
但是王泮渠提出,目前无人驾驶没有走在软件行业的商业模型上。
王泮渠以Waymo为例,表示其复制成本高、不同场景之间壁垒高,不具备通用性和跨越性。
而当前L4算法架构的问题,有模块过多且分散、泛化性较差、研发成本巨大和大规模产品化落地困难等。
那么如何解决?王泮渠表示零一汽车选择了多模态大语言模型端到端。为什么选择端到端?因为端到端框架简易、泛化性强、成本有优势和量产友好。
关于如何保证大语言模型的安全性,王泮渠认为原理大语言模型的逻辑输出可以被追溯,在算法上可以通过多模态对齐、生成对抗式学习和强化学习三种方法。
在流程上可以通过线下大规模开环与闭环仿真验证,让模块快速进化。在系统上通过硬件与车辆冗余设计,让系统更可靠。
王泮渠最后总结道,要做量产无人驾驶大模型是最优路径,量产自动驾驶一定需要量产车,车是一个平台,可以百倍地下降自动驾驶的成本。
强泛化的算法,可量产的车辆,以及快闭环的场景是实现无人驾驶量产落地的必由之路。
以神经网络为载体的“端到端”自动驾驶规控方案,使得全栈模块具备利用数据闭环进行快速更新的能力,这为高级别自动驾驶的智能性提升提供一条全新的技术路径,昇启科技联合创始人、CTO刘敏俊登台,对其一站式端到端自动驾驶研发平台进行了深入解读。

▲昇启科技联合创始人、CTO刘敏俊

刘敏俊表示,从2023年12月份以来,端到端已经成为行业趋势,而且在行业内端到端整体的发展方式也变成主流。
其中,国内企业动作较快,不管说是两段式的还是一段式的端到端,甚至在组织架构上面有很多的团队有做了适配和调整。
他紧接着介绍了端到端的意义,端到端带来的是研发模式的革新。
从之前的模块化到现在的端到端一体化,一方面数据驱动的模式取代了以往的人工专家规则设计的范式,让其信息传递产生的损失能够大大减少,能够保留的有效信息更高更完整。
另一方面在性能层面,端到端能够通过数据驱动的方式去突破边界,而在迭代速度和维护成本上也有一个极大的优势。
而在整个范式升级的过程中,其实核心的三要素就是数据、算法和算力。
围绕这三要素,昇启科技打造了一整套研发工具链,帮助主机厂完成端到端的模型开发。
昇启科技自主研发的千行平台,覆盖数据生成、模型训练、仿真测试以及模型部署等全栈功能,提供场景泛化、性能评估、数据挖掘、场景回放等开发工具,可实现大批量、自动化、高覆盖度的端到端自动驾驶模型训练。
目前千行平台已服务合作多家企业,帮助研发团队完成数据驱动的AI能力建设,实现自动驾驶端到端模型的落地,并在全国多个城市完成开放道路的实车测试验证。
除了端到端一体化平台的作用日益凸显外,智驾地图的重要性日渐提升,对此,朗歌科技副总经理李战斌博士则探讨了智驾地图在端到端时代的重要性,分析了其先验知识与关键模态的应用。
这场演讲主要围绕三个核心点展开:传统地图的局限性、端到端智驾地图的构建新范式,以及智驾地图的未来进化方向。

▲朗歌科技副总经理李战斌

他首先指出,传统地图在自动驾驶领域的应用存在明显的局限性。
传统地图依赖于规则和小模型的后融合方式,导致感知和地图之间存在“信任”问题。当出现错误时,如何处理这些错误的维护成本高且周期长。此外,传统地图的建图周期较长,更新速度慢,容易导致事故隐患和通行效率降低。这些问题使得人们对地图在智驾中的作用产生了误解,认为其地位在下降。
随后,李博士介绍了在端到端时代,智驾地图构建的新范式。
他提到,采用“影子模式”构建的数据闭环系统,能够有效解决传统地图的不足。在这一模式下,数据从采集到清洗、标注、模型训练再到仿真,形成一个完整的闭环。这种模式不仅提高了地图的更新效率,还增强了其在复杂场景下的应用能力。
李博士强调,虽然无图技术在简单场景下表现良好,但在复杂场景中仍需依赖智驾地图的支持,以确保安全和路径规划的有效性。
最后,李博士展望了智驾地图的进化方向。他指出,未来的智驾地图将更加注重数据的实时更新和多模态信息的融合。通过利用大数据技术和云计算能力,智驾地图能够实现快速的更新和高效的信息处理。
同时,李博士提到,地图在提供超视距感知能力方面具有独特优势,能够在传感器受限的情况下,依然保证自动驾驶的安全性和可靠性。
总的来说,李战斌博士的演讲强调了智驾地图在自动驾驶领域的重要性,指出其在传统地图应用中的局限性,并介绍了端到端时代的新构建范式及未来发展方向。随着技术的不断进步,智驾地图将成为提升自动驾驶安全性和效率的关键要素。
03.
车企重仓城市NOA量产
数据算法算力是关键

本次峰会的最后一个论坛是城市NOA专题论坛,城市NOA是当前各大车企重点投入的方向。北汽研究总院智能网联中心专业总师林大洋从主机厂视角,对城市NOA量产应用展开了分享。

▲北汽研究总院智能网联中心专业总师林大洋

林大洋表示,NOA功能,尤其是城市NOA功能,能覆盖更多用户出行场景,是近期行业重点发展方向。当前,L3级自动驾驶正在推进试点准入,预计应用场景聚焦在高速快速路的单车道通行,中长期逐步覆盖更多场景。
而“数据”、“算法”、“算力” 是驱动城市NOA的关键技术。林大洋指出,现在针对端到端方案,实现一个城市的量产需要的投入非常高。
同时他也指出,算法、算力和数据的突破将推动智能汽车由量变到质变,未来车端通用大模型将整合座舱、智驾,实现“类人” 能力。
在最后,林大洋也介绍了北汽城市NOA的量产进展。北汽智能驾驶已量产产品覆盖L2级ADAS系统到城市NOA。
为给驾驶者带来更加智能、轻松且安全的驾驶体验,北汽正加快BEV+OCC、端到端等智能驾驶核心算法的自研、建立数据闭环机制,通过构建 “数据+算法+算力” 技术生态体系,聚焦关键技术自主可控,支撑北汽高阶智能驾驶技术快速发展。
黑芝麻智能产品管理总监周勇以“NOA走向普及,智能汽车“芯”平台“芯”思考”从芯片方面对NOA进行了分享。

▲黑芝麻智能产品管理总监周勇

周勇表示,半导体创新是每个技术变革时代的重要推动力,大模型的出现为汽车智能化带来更多发展机会,大模型的演进给智能座舱交互和高阶自动驾驶带来明确的方向和道路选择。
汽车智能化的关键是车载计算,黑芝麻智能致力于成为智能汽车计算芯片的引领者。
关于智驾技术的演进趋势,周勇表示AI算法的快速演进对芯片的算力持续突破和架构创新带来驱动力;而高算力和创新架构的车载计算SOC芯片反过来能推动汽车智能化向高阶智能驾驶和无人驾驶发展。
关于NOA功能的进一步演进和落地,周勇表示将会有两个方向,其中一种会以高速(含城区快速路)NOA普及为主,覆盖的区域主要为区域高速/城区快速路。
另一方向是城市NOA,特点是场景复杂不确定性很高,第一阶段覆盖区域为城市主干道,第二阶段覆盖城市毛细路。
除了强大的算力基础外,更优秀的感知技术运用也在当下的智驾竞赛中越来越重要,对此上海昱感微电子科技有限公司的创始人兼CEO蒋宏分享了多维像素多模态感知技术的应用与发展。

▲上海昱感微电子科技有限公司的创始人兼CEO蒋宏

其演讲主题为“多维像素多模态雷达融合技术,构建自动驾驶超级感知能力”,重点介绍了该技术如何提升AI系统的环境与事件感知能力,从而推动AI从计算智能向感知智能,再到认知智能的演进。
蒋宏首先指出当前自动驾驶市场的快速发展,他强调,昱感微的产品定位在于为客户提供“多模态感知融合技术“的方案以及对接的多维像素融合信号处理芯片,以更快地支持客户完成智能感知的系统产品实现。
蒋宏介绍了“多维像素”的概念,指出该技术通过将不同传感器的信息映射到可见光的图像像素上,从而扩大感知的物理维度。通过时空对齐,这些传感器的信息能够有效地同可见光摄像头图像融合(完成像素级别的融合),为自动驾驶系统提供更全面的环境感知。
在技术实现方面,蒋宏展示了昱感微的原型机,强调了时空对齐在多模态感知中的重要性。通过对图像和点云数据的融合,昱感微能够实现像素级的多传感器融合感知精度,显著提升自动驾驶系统的感知能力。
此外,蒋宏提到,昱感微的技术不仅在可见光条件下表现出色,在低光和复杂环境下也能有效识别目标。例如,远红外传感器能够在各种天气条件下探测到目标(而且对人体识别场景有特别地针对性),为自动驾驶提供额外的安全保障。
蒋宏表示,昱感微的多维像素多模态感知技术通过将不同传感器的数据融合在一起,能够为自动驾驶系统提供更丰富的信息,提升其智能化水平。他表示,未来昱感微将继续推动技术的进步,以满足日益增长的智能驾驶需求。
全道科技CTO刘斌以“从1到10:新生态数据闭环重塑高阶智驾”进行了分享。

▲全道科技CTO刘斌

刘斌表示,今天汽车行业的机会是数据驱动形成智驾技术代差,大算力与数据闭环成为胜负手。
在高级别智能驾驶方面,刘斌认为需要丰富和准确的数据才能做到车智能大于人工智能。
刘斌表示时空先验数据在人可感知数据的视距范围内可以与感知数据融合,交叉验证,提升可靠性。在车辆实时感知数据的视距范围内时空先验数据可以弥补感知,增加可用性与体验。
而时空先验数据在视距范围外可以提供超越人脑的记忆内容、范围、经验、大数据规律与临时交通或事件干预,同时提供人类世界的先验规则,提高模型的安全底线,为驾驶安全兜底。
刘斌提出,车载端到端模型是“全国都能开”的终点,却是“全国都好用”的起点。
刘斌认为,为了实现2025年NOA功能全国都好用,会分为端到端+先验数据的借助先验数据的NOA和借助VLM大模型的端到端+VLM两条线路。
04.
结语:全民智驾时代来临

回望过去一年,自动驾驶迎来商业化重要节点,端到端被确立为行业趋势,AI推动智驾体验从“可用”向“好用”的突破,2025年L2+级别自动驾驶的国内渗透率有望进一步提升,全民智驾时代已经到来。

其目的是通过对边缘场景数据的采集、上传、清洗、训练和部署,不断优化自动驾驶系统的行驶策略,达到边开车边学习,驾驶性能越来越好的效果。

近30位嘉宾分享,一文看尽万字干货。
作者 |  车东西
编辑 |  志豪
2025年首场自动驾驶峰会,燃爆北京!
车东西1月14日消息,就在今天,由智一科技旗下智猩猩、车东西共同发起的第四届全球自动驾驶峰会在北京中关村国家自主创新示范区展示交易中心-会议中心圆满落幕。
作为智一科技面向自动驾驶领域打造的会议IP,第四届全球自动驾驶峰会以“技术新周期 产业新征程”为主题,设置“主会场+分会场+展区”三个板块。
其中,主会场进行开幕式、端到端自动驾驶创新论坛、城市NOA专题论坛;分会场则进行自动驾驶视觉语言模型技术研讨会、自动驾驶世界模型技术研讨会,全方位呈现全民智驾时代端到端自动驾驶新周期里的科研成果、技术探索、产品方案创新与未来趋势。
整场活动,近30位自动驾驶学术领袖、产业大咖与青年学者齐聚一堂,共同探讨了端到端、世界模型、视觉语言模型、城市NOA等行业内最火热的热门话题。

▲主会场现场

现场嘉宾精彩观点不断,清华大学车辆与运载学院/人工智能学院教授、博导李升波认为车路云一体化是自动驾驶基座模型的开发框架,需要政府、企业、高校三者组建联合体解决数据和算力等方面的难题。
理想汽车自动驾驶研发副总裁郎咸朋表示,理想汽车将致力于“人工智能的汽车化”,从模型、工程、产品等方面提升自动驾驶能力。
零一汽车智能驾驶合伙人王泮渠,昇启科技联合创始人、CTO刘敏俊,朗歌科技副总经理李战斌,都认为端到端带来了研发模式的革新。
峰会全天有接近九百位观众来到现场。无论是主会场上下午,还是分会场的两场闭门研讨会,均是座无虚席。尤其是开幕式,场内观众席两侧通道及后排空间更是站了不少观众。与此同时,20+媒体平台与视频号直播了本次峰会,直播观看量超过百万。

▲分会场-自动驾驶视觉语言模型技术研讨会

▲分会场-自动驾驶世界模型技术研讨会

作为2025年国内首场自动驾驶峰会,本次会议不仅系统呈现了智能驾驶过去一年的发展态势和量产进展,也为端到端自动驾驶开启的新一轮变革指明了前进方向,也燃动了世界模型在国内自动驾驶领域的研究与开发热度。
01.
智驾商业化迎来重要节点
端到端+大模型掀起行业新变革

峰会现场,智一科技联合创始人、CEO龚伦常作为主办方代表进行了开场致辞,他表示,过去一年,端到端与大语言模型、视觉语言模型协同,成为自动驾驶的主要技术路线。同时,世界模型也获得了更高的关注。

▲智一科技联合创始人、CEO龚伦常

基于此,峰会希望通过充分探讨,梳理行业的发展现状,进一步厘清未来的发展趋势。
本次峰会围绕端到端自动驾驶、城市NOA、自动驾驶视觉语言模型技术、自动驾驶世界模型技术等方向设置了多个话题。
数字化和智能化正在成为中国新一轮高质量发展的重要驱动力,智一科技成立以来一直聚焦在这一驱动力背后的核心技术和行业需求,构建了智东西、芯东西和车东西三大媒体品牌,持续提供专业优质的图文和视频内容,在相关领域具有广泛影响力。
同时,智一科技围绕企业服务,打造了智猩猩品牌,采用线上公开课和研讨会等形式提供高质量的技术向内容。
在最后,龚伦常感谢了中关村科学城管委会对本次峰会的大力支持。
龚伦常致辞结束后,清华大学车辆与运载学院/人工智能学院教授、博导李升波率先登台,分享了“数据驱动的端到端自动驾驶”发展历史、关键技术与未来趋势。
他首先回顾了人工智能领域的里程碑事件,包括2015年ResNET、2017年AlphaGo、2022年ChatGPT等,标志着人工智能时代的到来,并强调,自动驾驶是人工智能的重要应用方向之一,具有市场规模大、牵引链条长、技术难度高的特点。

▲清华大学车辆与运载学院/人工智能学院教授、博导李升波

紧接着,李升波指出,狭义上“自动驾驶”主要是指面向复杂城市交通工况的高级别智能驾驶系统。
这类系统对感知、决策、控制技术的安全性要求极高,因为控制权、风险监控、失效应对都是归属于系统本身处理,系统必须能够独立地完成所有驾驶任务。
李升波表示,安全性不足是现有自动驾驶系统走向实用化的核心难题,典型指标是行驶过程的万公里接管数,还远远不能达到人类驾驶员的平均水平,核心难题在于如何处理边缘驾驶场景(即发生数量的稀少,但危险度高的场景)。
为了解决这一问题,行业已经形成的共识是:以数据闭环为基础,以神经网络为策略载体,走“端到端”自动驾驶的技术路线。
其目的是通过对边缘场景数据的采集、上传、清洗、训练和部署,不断优化自动驾驶系统的行驶策略,达到边开车边学习,驾驶性能越来越好的效果。
李升波指出,端到端的本质是“神经网络化”,而非只有一个黑箱的神经网联。
他介绍了端到端自动驾驶的技术优势,与传统的分模块设计相比,端到端的设计方案一方面能够更有效地传递信息,减少信息损失,能够充分挖掘数据资源潜力;另一方面具有更多的神经网络参数,具有更大的训练自由度,性能的上界更高。
李升波提到,我国科研机构开展端到端自动驾驶的技术研究并不比国外晚,清华大学车辆学院的智能汽车团队自2018年起就开始探索这一技术路径。
他指出,六年前启动这一技术的研发,并不像今天具备这么好的条件,数据不足、算力匮乏都是制约模型训练性能的挑战性难题。
该团队也是于行业内率先提出“数据不足仿真补、算力不足算法超”换道研发思路,并于仿真软件、AI训练器等诸多方面取得了一系列重要进展,包括研发自主知识产权的大规模自动驾驶训练软件LasVSim和首个面向工业控制的最优策略强化学习求解器GOPS。
李升波分享了清华大学在强化学习和神经网络训练方面的研究成果,特别是针对稳定性和效率的改进。
该团队提出了强化学习领域性能排名第一的算法DSAC(Distributional Soft Actor-Critic),过拟合状态动作价值的连续分布,等价学习了无限多个价值函数,有效抑制了传统强化学习仅拟合单值函数导致的过估计难题,较之已有强化学习算法性能大幅提升;研发了工业控制领域性能排名第一的神经网络优化器RAD(Relativistic Adaptive gradient Descent),将神经网络参数的优化过程建模为多粒子相对论系统状态的演化过程,从动力学视角保障了强化学习的训练稳定性和收敛性。
以此为基础,清华大学成功开发出国内首个三段式端到端自动驾驶系统iDrive,并率先完成城市工况的开放道路测试,这一技术方案后续成功在广汽、东风、智行者等企业进行了实车部署,能够在拥堵、无信号交叉口等城市复杂道路条件下实现非机动车让行、路侧停车绕行等行为。
最后,李升波展望了未来的发展方向,指出车路云一体化是自动驾驶基座模型的开发框架,亟需建立统一的数据平台以促进数据共享,同时强调算力对自动驾驶的重要性,呼吁由政府、企业、高校三者组建联合体共同解决这些制约自动驾驶发展的瓶颈难题。
李升波教授从学术的角度分享了对于自动驾驶的思考,理想汽车自动驾驶研发副总裁郎咸朋则站在了产业的角度,发表了主题为《理想自动驾驶技术创新应用》的演讲。

▲理想汽车自动驾驶研发副总裁郎咸朋

郎咸朋介绍了过去一年理想自动驾驶的研发进展。
理想汽车创新性地提出自动驾驶端到端+VLM双系统架构,并结合基于世界模型的训练评价体系,率先完成车位到车位的全量推送。而自动驾驶模型性能的提升同样符合Scaling Law,基于1000万clips训练的模型即将推送用户,全场景接管率(MPI)将超过100公里。
他表示,当前自动驾驶模型训练总里程基数超过30亿公里,云端算力超过8E Flops,下一阶段将着重以创新技术手段提升资源利用效能。
郎咸朋还指出,从端到端+VLM到VLA,是AI能力从“行为智能”到“空间智能”的再次进阶,后续理想汽车将着力于“人工智能的汽车化”,从模型、工程、产品三个维度提升自动驾驶的综合能力。
为实现L3,全场景接管率(MPI)要超过500km,等效双周一次接管,平均事故里程(MPA)要超过350万公里,约等于人类安全里程的5倍,AD里程渗透率要大于25%,实现跨越鸿沟。
而要达到L4,这三方面的能力需要进一步提升至更高维度。
为实现L4,全场景接管率(MPI)要超过2500km,等效每季度一次接管,平均事故里程(MPA)要超过660万公里,约等于人类安全里程的10倍,AD里程渗透率要大于60%。
郎咸朋在最后强调,理想的使命愿景是成为全球领先的人工智能企业,并以此为方向持续进行自动驾驶技术与产品的创新与应用,还请大家拭目以待。
一些供应链行业代表也分享了关于自动驾驶的一些思考。
元戎启行副总裁、技术合伙人刘轩指出,当前的智能驾驶系统已摆脱传统模块化的规则驱动,转向以AI为核心的数据驱动模式。

▲元戎启行副总裁、技术合伙人刘轩

但现在的端到端智驾系统缺乏可解释性,无法解释它驾驶决策的逻辑。另外如果碰到难以用常识理解读懂的情况,系统就很难推理出好的驾驶决策。
目前,元戎启行正在研发VLA模型。实际上,VLA模型也属于端到端框架,但和现在用的端到端模型不同。
VLA模型融合了VLM和E2E模型,对比上一代模型,VLA模型更简洁,信息传递更直接,对于复杂场景的解读更到位,可以更透彻地理解人类的驾驶文化。
最后刘轩表示相信很快智能市场就会迎来一个暴涨期。搭乘着市场的东风,元戎启行也会全力冲刺。
极佳科技的副总裁毛继明在演讲中深入探讨了生成式世界模型如何引领自动驾驶和具身智能走向新的时代。
当下,消费者对智能驾驶功能的体验和要求不断提高,这种高规格的要求使得智能驾驶算法的迭代面临高质量数据、低频场景需求激增的困境。
为了解决这一问题,业界开始探索使用生成数据的可能性,以辅助提升算法性能。毛继明指出,「生成数据」是世界模型的首要应用之一,也是端到端自动驾驶最重要最高效的数据来源。

▲极佳科技合伙人副总裁毛继明

毛继明强调智能驾驶算法的表现需超越人类驾驶员才能获得人类司机的信任和使用。因此,构建一个实时可交互的环境让算法进行实践显得尤为重要,而生成式世界模型就负责构建这个环境。
进而,毛继明介绍了世界模型的基本概念,尽管目前尚无统一的定义,但业界的共识认为核心功能包括建模、想象、预测和行动。
世界模型是现实世界的投影,能够为智能体提供想象能力、预测未来结果,并进行结果评判。毛继明强调,构建世界模型的过程中,需要引入视频生成、空间几何和物理引擎等多种技术,以实现更全面的世界建模。
在具体应用方面,毛继明提到,世界模型可以用于数据生成和泛化,通过生成多样化的数据来提升感知算法的鲁棒性,还可用于4D场景构建,以支持实时闭环仿真等应用。在此过程中,毛继明展示了如何通过激活不同功能区来实现这些目标。
在演讲的最后,毛继明分享了极佳世界模型与合作伙伴落地的成功案例,展示了不同的模块和功能在行业落地应用的情况,以及极佳在此过程中积累的行业经验和“武器库”。
毛继明在演讲中对生成式世界模型在智能驾驶和具身智能领域的突破性应用进行了全面阐释,并结合实际案例展示了极佳科技的技术成果。
正如他所强调的,世界模型并非仅是技术工具,而是推动未来人工智能迈向通用智能时代的核心引擎。通过融合视频生成、空间几何和物理引擎等多种技术,世界模型不仅为算法的性能提升提供了高效的模拟环境,更为整个行业带来了新的应用可能性。
在未来的人工智能技术版图中,世界模型的地位举足轻重。它为实现高效、低成本的数据生成,增强智能体的预测与决策能力铺平了道路。极佳科技致力于将世界模型的潜力进一步转化为实际应用,加速推动技术从专有领域向更广泛场景的扩展,为通用智能的全面实现打下坚实基础。
智加科技首席科学家崔迪潇则从更细分的角度入手,围绕走向更安全更智能的干线物流带来了深入分享。

▲智加科技首席科学家崔迪潇

崔迪潇指出,中国的干线物流是一个万亿级别的巨大市场,卡车的存有量达到800万台。然而在这个巨大的市场背后,一系列结构性的问题正日益凸显。一方面,干线物流安全事故频发,另一方面,人力与燃油成本攀升挤占利润空间,降本增效需求显著。
针对这些痛点,智加科技始终坚持不懈地推进自动驾驶重卡的研发工作。目前,搭载智加领航系统的智能重卡已率先实现量产,并且智加领航系统也已在头部物流企业投入实际运营。
值得关注的是,崔迪潇也就业内盛行的端到端热潮作出回应。他指出,端到端在某种程度上可谓是一种资源“恐吓”,尤其对于部分初创型企业而言更是如此。
与此同时,他也提到,尽管资源有限,但这些创业团队同样面临着机遇。当技术发展至一定阶段后,能够以十分之一的成本达成同样出色的效果。这是因为在端到端智能驾驶中,大量冗余的标注与计算实际上并无必要。
针对这些,智加科技提出了基于人类的驾驶驾驶指令来引导模型高效学习场景表征的SSR框架,成功实现了不依赖于感知标注的真正端到端训练。
最后,崔迪潇总结说:“L4级自动驾驶是我们的终极目标,在朝着这一目标前进的过程中,我们势必会遇到各种变化和挫折,也会发现一些新的技术方向。不过,这些新的技术方向仅仅是我们实现目标的手段,而非目标本身。不能走了太远,忘了为何而出发。为达成无人化这一目标,还有很多更重要的工作要大家一起坚持继续去做。”
辰韬资本执行总经理刘煜冬博士从智能驾驶产业投资的角度,分享了关于端到端新范式下的智能驾驶产业投资思考。

▲辰韬资本执行总经理刘煜冬

刘煜冬表示,过去的半年整个行业有很大的变化,乘用车高阶智驾渗透率接近10%,整个高阶辅助系统向更低的车型渗透,智驾产品处于从早期市场迈向主流市场的重要拐点。
刘煜冬提到,目前端到端已经不仅仅是一个技术名词,破圈成为用户体验和用户心智的一部分。
关于端到端范式加速演进,刘煜冬表示大模型将赋能VLM/VLA,提到端到端1.0是从规则到数据驱动,端到端2.0引入大模型和强化学习范式,会进一步强化数据带来的壁垒,行业向车企和头部智驾公司集中。
但是,刘煜冬表示端到端落地面临着路采数据回灌开环验证,实车性能差异大Sim2Real gap无法避免和Corner Case采集成本高、效率低等挑战。
刘煜冬认为生成式世界模型成为端到端落地的重要工具,其可以充分利用海量的无标注数据,包括互联网数据、跨车型和传感器参数的数据。还可以低成本生成高保真度的测试验证数据,用于端到端算法的闭环验证。
端到端在乘用车辅助驾驶领域大放异彩,而在无人驾驶领域,2024年已经是无人驾驶的商业化元年,诸多场景的无人驾驶公司开始了规模化复制和指数增长。
例如,易控智驾在矿区部署超 1000 台无人车,Waymo在美国运营超千台Robotaxi ,订单量急剧增长。目前头部无人驾驶公司也开始进行端到端的早期探索,更加关注新技术在L4无人驾驶降本增效和场景拓展的能力。
刘煜冬最后总结道,端到端自动驾驶2.0阶段将开启VLM/VLA的新范式,主机厂和掌握数据的自动驾驶公司进一步掌握话语权。
而随着无人驾驶开始规模商业化,率先完成商业闭环的公司更有机会布局投入新范式,并扩展至更通用的无人驾驶开放场景。
而上午场嘉宾演讲结束后,本次峰会也进入圆桌讨论环节,本次圆桌讨论围绕 “全民智驾时代开启,端到端掀起新一轮变革” 的主题展开,在智一科技联合创始人、总编辑张国仁的主持下,零一汽车智能驾驶合伙人王泮渠、辰韬资本执行总经理刘煜冬共同探讨了自动驾驶领域在2024年的重要变化和未来发展趋势。
与会专家普遍认为,2024年是自动驾驶商业化的重要节点。

▲圆桌讨论现场

零一汽车智能驾驶合伙人王泮渠提到,wayve的技术进展和融资事件标志着端到端架构的可行性,这为整个行业注入了信心。随着无人驾驶技术的不断成熟,多个领域如出租车、矿区无人驾驶、无人物流等开始实现商业化应用,展现出良好的市场前景。
这一趋势不仅促进了投资者的信心,也推动了相关企业的上市,标志着行业进入了一个新的发展阶段。
论坛中,专家们强调了技术迭代和数据驱动对自动驾驶行业的重要影响。
辰韬资本执行总经理刘煜冬指出,自动驾驶行业正在从传统范式向数据驱动的范式转变,新的开发模式使得技术进步和产品落地的速度加快。尤其是人工智能技术的快速发展,为自动驾驶的实现提供了强有力的支持。
专家们认为,过去几年的数据积累和技术创新为行业的快速迭代奠定了基础,使得自动驾驶的落地应用得以迅速推广。
在讨论未来市场时,专家们认为自动驾驶领域将会出现多种技术路线的共存。
王泮渠表示,尽管市场上有许多自研厂商,但第三方供应商依然有生存空间。随着市场规模的扩大,自动驾驶技术的渗透率仍在提升,为不同团队提供了发展机会。
刘煜冬则指出,未来的商业化发展会更加依赖于技术的创新和应用场景的多样化,尤其是在物流和交通运输等领域,仍然存在大量未被开发的市场机会。
02.
端到端革新智驾研发范式
掌握数据或掌握更多话语权

在今天下午峰会现场,主会场举行了两场论坛,分别是端到端自动驾驶创新论坛和城市NOA专题论坛。
在下午的端到端自动驾驶创新论坛上,中科院自动化所副研究员张启超首先带来主题报告,从科研角度讲解监督学习范式下端到端自动驾驶的新进展及其面临的关键挑战。

▲中科院自动化所副研究员张启超

张启超指出,2016年后端到端走向两条路,一派是去做开环的端到端,然后另一派是做Carla仿真闭环的端到端。
值得注意的是,在其团队的科研实践中,张启超指出监督式端到端自动驾驶存在规模化定律,数据量的大规模增加带来了两方面的影响。
好消息是,Data Scaling带来了“组合泛化”能力,数据规模化为端到端自动驾驶提供了“组合泛化”能力,为自动驾驶安全落地提供理论支撑。
坏消息则是,闭环性能提升随着数据量的指数增加有变缓趋势。他指出,由于监督数据拖后腿,随着算力、模型增大,收益将饱和。
而对于成为业内热词的“世界模型”,张启超也给出了一些值得进一步探索的研究方向。
张启超表示,端到端从开环走到闭环,需要打造世界模型。
用途一是打造闭环测试验证世界模型,把世界模型作为一个演练场,去评估和测试当前的端到端模型能不能上车。
用途二则是打造闭环世界模型用于RL策略训练,即高保真的交互的世界模型,这也是一条不错的路径。
零一汽车智能驾驶合伙人王泮渠以《端到端+大模型: 加速新能源重卡智能化之路》为主题展开分享。

▲零一汽车智能驾驶合伙人王泮渠

王泮渠表示,辅助驾驶已经进入量产状态,2023年,具备辅助驾驶功能的智能网联乘用车销量995.3万辆,市场渗透率达47.3%,而目前,商业车对无人驾驶的需求还更高一些。
但是王泮渠提出,目前无人驾驶没有走在软件行业的商业模型上。
王泮渠以Waymo为例,表示其复制成本高、不同场景之间壁垒高,不具备通用性和跨越性。
而当前L4算法架构的问题,有模块过多且分散、泛化性较差、研发成本巨大和大规模产品化落地困难等。
那么如何解决?王泮渠表示零一汽车选择了多模态大语言模型端到端。为什么选择端到端?因为端到端框架简易、泛化性强、成本有优势和量产友好。
关于如何保证大语言模型的安全性,王泮渠认为原理大语言模型的逻辑输出可以被追溯,在算法上可以通过多模态对齐、生成对抗式学习和强化学习三种方法。
在流程上可以通过线下大规模开环与闭环仿真验证,让模块快速进化。在系统上通过硬件与车辆冗余设计,让系统更可靠。
王泮渠最后总结道,要做量产无人驾驶大模型是最优路径,量产自动驾驶一定需要量产车,车是一个平台,可以百倍地下降自动驾驶的成本。
强泛化的算法,可量产的车辆,以及快闭环的场景是实现无人驾驶量产落地的必由之路。
以神经网络为载体的“端到端”自动驾驶规控方案,使得全栈模块具备利用数据闭环进行快速更新的能力,这为高级别自动驾驶的智能性提升提供一条全新的技术路径,昇启科技联合创始人、CTO刘敏俊登台,对其一站式端到端自动驾驶研发平台进行了深入解读。

▲昇启科技联合创始人、CTO刘敏俊

刘敏俊表示,从2023年12月份以来,端到端已经成为行业趋势,而且在行业内端到端整体的发展方式也变成主流。
其中,国内企业动作较快,不管说是两段式的还是一段式的端到端,甚至在组织架构上面有很多的团队有做了适配和调整。
他紧接着介绍了端到端的意义,端到端带来的是研发模式的革新。
从之前的模块化到现在的端到端一体化,一方面数据驱动的模式取代了以往的人工专家规则设计的范式,让其信息传递产生的损失能够大大减少,能够保留的有效信息更高更完整。
另一方面在性能层面,端到端能够通过数据驱动的方式去突破边界,而在迭代速度和维护成本上也有一个极大的优势。
而在整个范式升级的过程中,其实核心的三要素就是数据、算法和算力。
围绕这三要素,昇启科技打造了一整套研发工具链,帮助主机厂完成端到端的模型开发。
昇启科技自主研发的千行平台,覆盖数据生成、模型训练、仿真测试以及模型部署等全栈功能,提供场景泛化、性能评估、数据挖掘、场景回放等开发工具,可实现大批量、自动化、高覆盖度的端到端自动驾驶模型训练。
目前千行平台已服务合作多家企业,帮助研发团队完成数据驱动的AI能力建设,实现自动驾驶端到端模型的落地,并在全国多个城市完成开放道路的实车测试验证。
除了端到端一体化平台的作用日益凸显外,智驾地图的重要性日渐提升,对此,朗歌科技副总经理李战斌博士则探讨了智驾地图在端到端时代的重要性,分析了其先验知识与关键模态的应用。
这场演讲主要围绕三个核心点展开:传统地图的局限性、端到端智驾地图的构建新范式,以及智驾地图的未来进化方向。

▲朗歌科技副总经理李战斌

他首先指出,传统地图在自动驾驶领域的应用存在明显的局限性。
传统地图依赖于规则和小模型的后融合方式,导致感知和地图之间存在“信任”问题。当出现错误时,如何处理这些错误的维护成本高且周期长。此外,传统地图的建图周期较长,更新速度慢,容易导致事故隐患和通行效率降低。这些问题使得人们对地图在智驾中的作用产生了误解,认为其地位在下降。
随后,李博士介绍了在端到端时代,智驾地图构建的新范式。
他提到,采用“影子模式”构建的数据闭环系统,能够有效解决传统地图的不足。在这一模式下,数据从采集到清洗、标注、模型训练再到仿真,形成一个完整的闭环。这种模式不仅提高了地图的更新效率,还增强了其在复杂场景下的应用能力。
李博士强调,虽然无图技术在简单场景下表现良好,但在复杂场景中仍需依赖智驾地图的支持,以确保安全和路径规划的有效性。
最后,李博士展望了智驾地图的进化方向。他指出,未来的智驾地图将更加注重数据的实时更新和多模态信息的融合。通过利用大数据技术和云计算能力,智驾地图能够实现快速的更新和高效的信息处理。
同时,李博士提到,地图在提供超视距感知能力方面具有独特优势,能够在传感器受限的情况下,依然保证自动驾驶的安全性和可靠性。
总的来说,李战斌博士的演讲强调了智驾地图在自动驾驶领域的重要性,指出其在传统地图应用中的局限性,并介绍了端到端时代的新构建范式及未来发展方向。随着技术的不断进步,智驾地图将成为提升自动驾驶安全性和效率的关键要素。
03.
车企重仓城市NOA量产
数据算法算力是关键

本次峰会的最后一个论坛是城市NOA专题论坛,城市NOA是当前各大车企重点投入的方向。北汽研究总院智能网联中心专业总师林大洋从主机厂视角,对城市NOA量产应用展开了分享。

▲北汽研究总院智能网联中心专业总师林大洋

林大洋表示,NOA功能,尤其是城市NOA功能,能覆盖更多用户出行场景,是近期行业重点发展方向。当前,L3级自动驾驶正在推进试点准入,预计应用场景聚焦在高速快速路的单车道通行,中长期逐步覆盖更多场景。
而“数据”、“算法”、“算力” 是驱动城市NOA的关键技术。林大洋指出,现在针对端到端方案,实现一个城市的量产需要的投入非常高。
同时他也指出,算法、算力和数据的突破将推动智能汽车由量变到质变,未来车端通用大模型将整合座舱、智驾,实现“类人” 能力。
在最后,林大洋也介绍了北汽城市NOA的量产进展。北汽智能驾驶已量产产品覆盖L2级ADAS系统到城市NOA。
为给驾驶者带来更加智能、轻松且安全的驾驶体验,北汽正加快BEV+OCC、端到端等智能驾驶核心算法的自研、建立数据闭环机制,通过构建 “数据+算法+算力” 技术生态体系,聚焦关键技术自主可控,支撑北汽高阶智能驾驶技术快速发展。
黑芝麻智能产品管理总监周勇以“NOA走向普及,智能汽车“芯”平台“芯”思考”从芯片方面对NOA进行了分享。

▲黑芝麻智能产品管理总监周勇

周勇表示,半导体创新是每个技术变革时代的重要推动力,大模型的出现为汽车智能化带来更多发展机会,大模型的演进给智能座舱交互和高阶自动驾驶带来明确的方向和道路选择。
汽车智能化的关键是车载计算,黑芝麻智能致力于成为智能汽车计算芯片的引领者。
关于智驾技术的演进趋势,周勇表示AI算法的快速演进对芯片的算力持续突破和架构创新带来驱动力;而高算力和创新架构的车载计算SOC芯片反过来能推动汽车智能化向高阶智能驾驶和无人驾驶发展。
关于NOA功能的进一步演进和落地,周勇表示将会有两个方向,其中一种会以高速(含城区快速路)NOA普及为主,覆盖的区域主要为区域高速/城区快速路。
另一方向是城市NOA,特点是场景复杂不确定性很高,第一阶段覆盖区域为城市主干道,第二阶段覆盖城市毛细路。
除了强大的算力基础外,更优秀的感知技术运用也在当下的智驾竞赛中越来越重要,对此上海昱感微电子科技有限公司的创始人兼CEO蒋宏分享了多维像素多模态感知技术的应用与发展。

▲上海昱感微电子科技有限公司的创始人兼CEO蒋宏

其演讲主题为“多维像素多模态雷达融合技术,构建自动驾驶超级感知能力”,重点介绍了该技术如何提升AI系统的环境与事件感知能力,从而推动AI从计算智能向感知智能,再到认知智能的演进。
蒋宏首先指出当前自动驾驶市场的快速发展,他强调,昱感微的产品定位在于为客户提供“多模态感知融合技术“的方案以及对接的多维像素融合信号处理芯片,以更快地支持客户完成智能感知的系统产品实现。
蒋宏介绍了“多维像素”的概念,指出该技术通过将不同传感器的信息映射到可见光的图像像素上,从而扩大感知的物理维度。通过时空对齐,这些传感器的信息能够有效地同可见光摄像头图像融合(完成像素级别的融合),为自动驾驶系统提供更全面的环境感知。
在技术实现方面,蒋宏展示了昱感微的原型机,强调了时空对齐在多模态感知中的重要性。通过对图像和点云数据的融合,昱感微能够实现像素级的多传感器融合感知精度,显著提升自动驾驶系统的感知能力。
此外,蒋宏提到,昱感微的技术不仅在可见光条件下表现出色,在低光和复杂环境下也能有效识别目标。例如,远红外传感器能够在各种天气条件下探测到目标(而且对人体识别场景有特别地针对性),为自动驾驶提供额外的安全保障。
蒋宏表示,昱感微的多维像素多模态感知技术通过将不同传感器的数据融合在一起,能够为自动驾驶系统提供更丰富的信息,提升其智能化水平。他表示,未来昱感微将继续推动技术的进步,以满足日益增长的智能驾驶需求。
全道科技CTO刘斌以“从1到10:新生态数据闭环重塑高阶智驾”进行了分享。

▲全道科技CTO刘斌

刘斌表示,今天汽车行业的机会是数据驱动形成智驾技术代差,大算力与数据闭环成为胜负手。
在高级别智能驾驶方面,刘斌认为需要丰富和准确的数据才能做到车智能大于人工智能。
刘斌表示时空先验数据在人可感知数据的视距范围内可以与感知数据融合,交叉验证,提升可靠性。在车辆实时感知数据的视距范围内时空先验数据可以弥补感知,增加可用性与体验。
而时空先验数据在视距范围外可以提供超越人脑的记忆内容、范围、经验、大数据规律与临时交通或事件干预,同时提供人类世界的先验规则,提高模型的安全底线,为驾驶安全兜底。
刘斌提出,车载端到端模型是“全国都能开”的终点,却是“全国都好用”的起点。
刘斌认为,为了实现2025年NOA功能全国都好用,会分为端到端+先验数据的借助先验数据的NOA和借助VLM大模型的端到端+VLM两条线路。
04.
结语:全民智驾时代来临

回望过去一年,自动驾驶迎来商业化重要节点,端到端被确立为行业趋势,AI推动智驾体验从“可用”向“好用”的突破,2025年L2+级别自动驾驶的国内渗透率有望进一步提升,全民智驾时代已经到来。

展开
打开“财经头条”阅读更多精彩资讯
APP内打开