端到端类脑自动驾驶 | DeepSeek如何影响国内智能汽车行业

智车科技

1天前

端到端自动驾驶技术将原始传感器数据(如摄像头、雷达和激光雷达)作为输入,并通过深度学习网络进行处理,直接输出车辆的控制命令(如方向盘转角、油门和刹车)。

本文来源:智车科技

国内智能汽车行业正经历一场由AI驱动的技术变革,而DeepSeek凭借其开源生态与高效训练能力,迅速引起国内车企的共情和合作。在传统汽车向“软件定义汽车”转型的浪潮下,车联网、自动驾驶等技术的迭代对算力与研发成本提出了更高要求。

开源+高效训练

车企拥抱DeepSeek的底层逻辑

DeepSeek的开源模式为汽车行业提供了新思路

2月6日,吉利汽车宣布自研大模型星睿与DeepSeek已完成深度融合。吉利将对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。届时,吉利智能汽车AI不仅能对用户的模糊意图实现精准理解,进而准确调用约2000个车载接口,还能基于车内外场景主动分析用户潜在需求,并为用户主动提供车辆控制、主动对话、售后等服务,智能交互体验将大幅提升。

2月7日,岚图汽车旗下车型岚图知音完成与DeepSeek模型的深度融合,成为汽车行业首个搭载该技术的量产车型。此前,岚图座舱已完成DeepSeek全系列模型接入和部署,AI智能体将在云端与DeepSeek大模型融合,带来精准智能交互体验。

图1 吉利凌渡座舱,搭载吉利与DeepSeek整合AI模型

业界的普遍共识是,汽车行业正在从传统的电动汽车(EVs)向智能电动汽车(EIVs)演变。AI和云计算正在推动新能源汽车竞争力。AI和云计算的整合已成为中国新能源汽车(NEV)市场的一个重要趋势。汽车制造商正在利用这些技术提升车辆性能,为用户提供更个性化的驾驶体验。

在近期于达沃斯举行的世界经济论坛上,宁德时代联席主席潘健强调,智能与中国电动汽车市场的快速增长密不可分。他表示,电力和智能的无缝整合是这一转型的关键。他强调,电动力为汽车提供了先进的智能功能,结合DeepSeek类大模型,将进一步巩固了中国在全球智能电动汽车领域的领导地位。

在追求模型高效落地的过程中,蒸馏(Distillation)技术成为DeepSeek赋能车企的另一张王牌。传统大模型虽性能强悍,但高昂的存储与运行成本使其难以适配车载场景。DeepSeek R1通过知识蒸馏,将大型语言模型的“经验”迁移至轻量化模型中,既保留了核心能力,又大幅降低了硬件负载。据悉,吉利将对星睿车控 FunctionCall 大模型、汽车主动交互端侧大模型等进行蒸馏训练,将DeepSeek R1的语义理解与优先级决策能力注入车辆控制模块,这种“类人思考”的决策逻辑,将为车企在成本与性能间找到了平衡点,加速了AI模型从实验室到量产车的转化。

DeepSeek在智能车辆行业的未来扩展

-类脑思考的端到端自动驾驶

在自动驾驶领域,还没有自动驾驶模型在大数据统计检验意义上公认优于人类驾驶员。如何让机器理解“人类用语义表达的操作优先级”,这正是DeepSeek和其它潜在大语言模型最好的切入点之一。而且,这种技术切入是融合到最新的端到端(end to end)自动驾驶技术潮流的。

图2 三阶段和端到端自动驾驶对比,图片来自Research Gate

传统的自动驾驶系统通常由多个独立的模块或者阶段组成,如感知、决策和控制。而端到端自动驾驶技术试图通过将这些模块整合成一个统一的庞大神经网络模型,直接将原始传感器输入(图像、点云、超声波雷达等等)映射到车辆的控制命令,以实现自动驾驶的功能。

具体而言,端到端自动驾驶技术将原始传感器数据(如摄像头、雷达和激光雷达)作为输入,并通过深度学习网络进行处理,直接输出车辆的控制命令(如方向盘转角、油门和刹车)。这种方法消除了传统自动驾驶系统中的中间步骤和模块,简化了系统的设计和实施过程。

端到端自动驾驶技术的主要优势在于它可以通过使用大规模的数据集进行端到端的训练,从而提高系统的性能和鲁棒性。它能够从原始数据中学习到更高级别的特征和抽象表示,自动发现和理解复杂的交通场景和驾驶行为。此外,端到端自动驾驶技术还能够适应不同的道路和环境条件,具有更好的泛化能力。

端到端自动驾驶技术有许多潜在的优势,但它的优势面也同步带来对应的劣势,如对大规模数据的需求、对计算资源的要求以及解释性和安全性等问题。其中最大的潜在劣势是最终结果的统一单一模型可能极为庞大,带来巨大的存储、训练,运行开销和巨大的能耗。因此,尽管业界普遍接受端到端方案是自动驾驶的未来,但主要实践端到端自驾的还是巨头Tesla。

一般而言,作为现状的当前自动驾驶系统通常采用混合方法,结合传统的模块化方法和端到端技术,以实现更可靠和安全的自动驾驶功能。

那么如果有一个破局者,具有低训练成本、低使用成本,最终模型采用蒸馏distillation技术极小化,又能理解“人类用语义表达的操作优先级”如何呢?

这个回答似乎是训练费用560w美元,单个token使用费用约chatGPT o1的三十分之一,且不依赖海外高端芯片的DeepSeek R1,以及它的多模态前身DeepSeek V3。

图3 学术界使用多模态大语言模型LLM处理自动驾驶传感器输入的多模态数据(来自next-GPT)

随着智能驾驶向“全场景化”迈进,端到端(End-to-End)技术成为行业竞争的高地。传统自动驾驶依赖感知、决策、控制分阶段执行的模块化架构,存在系统复杂、响应延迟等短板。DeepSeek通过多模态大模型,将传感器数据直接映射为控制指令,构建起“输入-输出”一体化的新范式。

以DriveGPT4、商汤DriveAGI、Senna架构为代表的端到端方案,已展现出显著优势。

1.DriveGPT4:DriveGPT4是将大模型应用于可解释的端到端自动驾驶的一个重要里程碑。它通过引入更强大的感知能力和更高的决策透明度,推动了自动驾驶技术向更加智能的方向发展。

2.Senna架构:Senna采用了独特的解耦行为决策-轨迹规划思路,利用大规模驾驶数据进行微调,以增强对驾驶场景的理解能力。此外,该架构还能通过自然语言输出高维决策指令,进一步提升了系统的灵活性和适应性。

3.商汤绝影DriveAGI:商汤绝影推出的新一代自动驾驶大模型DriveAGI,凭借其宽泛适用场景、高性能以及低门槛的特点,成为行业内的一大亮点。该模型特别注重增强端到端自动驾驶方案的可解释性和交互能力

除此以外,我们还可以再加上前文提到的吉利将自身AI模型和deepseek整合得到混合模型。

也许近期就会出现DeepSeek独立的Driving AGI,这些模型在技术架构上都一般包含如下特点作为基础部件:

1.多模态数据融合:

多模态大模型能够处理来自不同传感器的数据,如摄像头、激光雷达(LiDAR)、毫米波雷达等。这些数据被整合成一个统一的表示形式,从而为后续的决策和规划提供全面的信息支持。

2.端到端学习:

端到端学习是指从原始传感器数据直接输出驾驶指令或轨迹规划的过程。这种方式省去了传统方法中复杂的中间步骤,简化了系统设计,并提高了系统的实时性和鲁棒性。例如,EMMA(End-to-End Multimodal Model for Autonomous Driving)技术可以直接将原始摄像头数据映射到具体的驾驶动作。

3.自然语言处理与交互:

一些先进的多模态大模型不仅限于视觉信息,还结合了自然语言处理能力,可以理解并生成人类语言描述的驾驶意图或指令。这使得系统能够更好地理解和响应复杂环境中的动态变化,同时也增强了人机交互的可能性。

其应用场景包括:

1.乘用车自动驾驶:在城市道路、高速公路等多种路况下,多模态大模型可以帮助车辆安全地完成变道、避障、停车等操作。据报道,理想汽车已经基于快慢双系统的思路实现了量产上车的应用。

2.商用车及物流配送:商用车辆和物流配送机器人不仅可以在NOA模式下使用多模态大模型实现L1-L4级别自驾,特别是在面对非结构化环境时,如港口(比如东风商用车和招商集团合作的厦门港、妈湾港无人集卡)、矿区(远安磷矿地下矿区自动矿车)、工地、仓库内部等特殊场景。这些模型能够提高运输效率,减少人为干预的需求,减少司乘人员的精力消耗。

结语

值得关注的是,DeepSeek通过开源生态与高效训练框架,正在打破特斯拉对端到端技术的垄断。其模型支持分布式训练与边缘计算部署,即便在国产芯片上也能实现低延迟推理。随着蒸馏技术的进一步优化,未来车载模型的体积与能耗有望再降,为L4级自动驾驶的规模化落地铺平道路。

从开源赋能到蒸馏提效,再到端到端重构驾驶逻辑,DeepSeek正在以“技术普惠”的姿态重塑国内智能汽车行业。在这场变革中,车企借助AI大模型的“智力杠杆”,实现安全、高效与人性化驾驶体验的全面升级。当DeepSeek的“类脑思考”真正融入车轮之上,中国智能汽车产业的全球领导地位或将不再遥远。

免责声明:

凡本公众号注明“来源:XXX(非智车科技)”的作品,均转载自其它媒体,转载目的在于传递和分享更多信息,并不代表本平台赞同其观点和对其真实性负责,版权归原作者所有,如有侵权请联系我们删除。

原文标题 : 端到端类脑自动驾驶 | DeepSeek如何影响国内智能汽车行业

端到端自动驾驶技术将原始传感器数据(如摄像头、雷达和激光雷达)作为输入,并通过深度学习网络进行处理,直接输出车辆的控制命令(如方向盘转角、油门和刹车)。

本文来源:智车科技

国内智能汽车行业正经历一场由AI驱动的技术变革,而DeepSeek凭借其开源生态与高效训练能力,迅速引起国内车企的共情和合作。在传统汽车向“软件定义汽车”转型的浪潮下,车联网、自动驾驶等技术的迭代对算力与研发成本提出了更高要求。

开源+高效训练

车企拥抱DeepSeek的底层逻辑

DeepSeek的开源模式为汽车行业提供了新思路

2月6日,吉利汽车宣布自研大模型星睿与DeepSeek已完成深度融合。吉利将对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。届时,吉利智能汽车AI不仅能对用户的模糊意图实现精准理解,进而准确调用约2000个车载接口,还能基于车内外场景主动分析用户潜在需求,并为用户主动提供车辆控制、主动对话、售后等服务,智能交互体验将大幅提升。

2月7日,岚图汽车旗下车型岚图知音完成与DeepSeek模型的深度融合,成为汽车行业首个搭载该技术的量产车型。此前,岚图座舱已完成DeepSeek全系列模型接入和部署,AI智能体将在云端与DeepSeek大模型融合,带来精准智能交互体验。

图1 吉利凌渡座舱,搭载吉利与DeepSeek整合AI模型

业界的普遍共识是,汽车行业正在从传统的电动汽车(EVs)向智能电动汽车(EIVs)演变。AI和云计算正在推动新能源汽车竞争力。AI和云计算的整合已成为中国新能源汽车(NEV)市场的一个重要趋势。汽车制造商正在利用这些技术提升车辆性能,为用户提供更个性化的驾驶体验。

在近期于达沃斯举行的世界经济论坛上,宁德时代联席主席潘健强调,智能与中国电动汽车市场的快速增长密不可分。他表示,电力和智能的无缝整合是这一转型的关键。他强调,电动力为汽车提供了先进的智能功能,结合DeepSeek类大模型,将进一步巩固了中国在全球智能电动汽车领域的领导地位。

在追求模型高效落地的过程中,蒸馏(Distillation)技术成为DeepSeek赋能车企的另一张王牌。传统大模型虽性能强悍,但高昂的存储与运行成本使其难以适配车载场景。DeepSeek R1通过知识蒸馏,将大型语言模型的“经验”迁移至轻量化模型中,既保留了核心能力,又大幅降低了硬件负载。据悉,吉利将对星睿车控 FunctionCall 大模型、汽车主动交互端侧大模型等进行蒸馏训练,将DeepSeek R1的语义理解与优先级决策能力注入车辆控制模块,这种“类人思考”的决策逻辑,将为车企在成本与性能间找到了平衡点,加速了AI模型从实验室到量产车的转化。

DeepSeek在智能车辆行业的未来扩展

-类脑思考的端到端自动驾驶

在自动驾驶领域,还没有自动驾驶模型在大数据统计检验意义上公认优于人类驾驶员。如何让机器理解“人类用语义表达的操作优先级”,这正是DeepSeek和其它潜在大语言模型最好的切入点之一。而且,这种技术切入是融合到最新的端到端(end to end)自动驾驶技术潮流的。

图2 三阶段和端到端自动驾驶对比,图片来自Research Gate

传统的自动驾驶系统通常由多个独立的模块或者阶段组成,如感知、决策和控制。而端到端自动驾驶技术试图通过将这些模块整合成一个统一的庞大神经网络模型,直接将原始传感器输入(图像、点云、超声波雷达等等)映射到车辆的控制命令,以实现自动驾驶的功能。

具体而言,端到端自动驾驶技术将原始传感器数据(如摄像头、雷达和激光雷达)作为输入,并通过深度学习网络进行处理,直接输出车辆的控制命令(如方向盘转角、油门和刹车)。这种方法消除了传统自动驾驶系统中的中间步骤和模块,简化了系统的设计和实施过程。

端到端自动驾驶技术的主要优势在于它可以通过使用大规模的数据集进行端到端的训练,从而提高系统的性能和鲁棒性。它能够从原始数据中学习到更高级别的特征和抽象表示,自动发现和理解复杂的交通场景和驾驶行为。此外,端到端自动驾驶技术还能够适应不同的道路和环境条件,具有更好的泛化能力。

端到端自动驾驶技术有许多潜在的优势,但它的优势面也同步带来对应的劣势,如对大规模数据的需求、对计算资源的要求以及解释性和安全性等问题。其中最大的潜在劣势是最终结果的统一单一模型可能极为庞大,带来巨大的存储、训练,运行开销和巨大的能耗。因此,尽管业界普遍接受端到端方案是自动驾驶的未来,但主要实践端到端自驾的还是巨头Tesla。

一般而言,作为现状的当前自动驾驶系统通常采用混合方法,结合传统的模块化方法和端到端技术,以实现更可靠和安全的自动驾驶功能。

那么如果有一个破局者,具有低训练成本、低使用成本,最终模型采用蒸馏distillation技术极小化,又能理解“人类用语义表达的操作优先级”如何呢?

这个回答似乎是训练费用560w美元,单个token使用费用约chatGPT o1的三十分之一,且不依赖海外高端芯片的DeepSeek R1,以及它的多模态前身DeepSeek V3。

图3 学术界使用多模态大语言模型LLM处理自动驾驶传感器输入的多模态数据(来自next-GPT)

随着智能驾驶向“全场景化”迈进,端到端(End-to-End)技术成为行业竞争的高地。传统自动驾驶依赖感知、决策、控制分阶段执行的模块化架构,存在系统复杂、响应延迟等短板。DeepSeek通过多模态大模型,将传感器数据直接映射为控制指令,构建起“输入-输出”一体化的新范式。

以DriveGPT4、商汤DriveAGI、Senna架构为代表的端到端方案,已展现出显著优势。

1.DriveGPT4:DriveGPT4是将大模型应用于可解释的端到端自动驾驶的一个重要里程碑。它通过引入更强大的感知能力和更高的决策透明度,推动了自动驾驶技术向更加智能的方向发展。

2.Senna架构:Senna采用了独特的解耦行为决策-轨迹规划思路,利用大规模驾驶数据进行微调,以增强对驾驶场景的理解能力。此外,该架构还能通过自然语言输出高维决策指令,进一步提升了系统的灵活性和适应性。

3.商汤绝影DriveAGI:商汤绝影推出的新一代自动驾驶大模型DriveAGI,凭借其宽泛适用场景、高性能以及低门槛的特点,成为行业内的一大亮点。该模型特别注重增强端到端自动驾驶方案的可解释性和交互能力

除此以外,我们还可以再加上前文提到的吉利将自身AI模型和deepseek整合得到混合模型。

也许近期就会出现DeepSeek独立的Driving AGI,这些模型在技术架构上都一般包含如下特点作为基础部件:

1.多模态数据融合:

多模态大模型能够处理来自不同传感器的数据,如摄像头、激光雷达(LiDAR)、毫米波雷达等。这些数据被整合成一个统一的表示形式,从而为后续的决策和规划提供全面的信息支持。

2.端到端学习:

端到端学习是指从原始传感器数据直接输出驾驶指令或轨迹规划的过程。这种方式省去了传统方法中复杂的中间步骤,简化了系统设计,并提高了系统的实时性和鲁棒性。例如,EMMA(End-to-End Multimodal Model for Autonomous Driving)技术可以直接将原始摄像头数据映射到具体的驾驶动作。

3.自然语言处理与交互:

一些先进的多模态大模型不仅限于视觉信息,还结合了自然语言处理能力,可以理解并生成人类语言描述的驾驶意图或指令。这使得系统能够更好地理解和响应复杂环境中的动态变化,同时也增强了人机交互的可能性。

其应用场景包括:

1.乘用车自动驾驶:在城市道路、高速公路等多种路况下,多模态大模型可以帮助车辆安全地完成变道、避障、停车等操作。据报道,理想汽车已经基于快慢双系统的思路实现了量产上车的应用。

2.商用车及物流配送:商用车辆和物流配送机器人不仅可以在NOA模式下使用多模态大模型实现L1-L4级别自驾,特别是在面对非结构化环境时,如港口(比如东风商用车和招商集团合作的厦门港、妈湾港无人集卡)、矿区(远安磷矿地下矿区自动矿车)、工地、仓库内部等特殊场景。这些模型能够提高运输效率,减少人为干预的需求,减少司乘人员的精力消耗。

结语

值得关注的是,DeepSeek通过开源生态与高效训练框架,正在打破特斯拉对端到端技术的垄断。其模型支持分布式训练与边缘计算部署,即便在国产芯片上也能实现低延迟推理。随着蒸馏技术的进一步优化,未来车载模型的体积与能耗有望再降,为L4级自动驾驶的规模化落地铺平道路。

从开源赋能到蒸馏提效,再到端到端重构驾驶逻辑,DeepSeek正在以“技术普惠”的姿态重塑国内智能汽车行业。在这场变革中,车企借助AI大模型的“智力杠杆”,实现安全、高效与人性化驾驶体验的全面升级。当DeepSeek的“类脑思考”真正融入车轮之上,中国智能汽车产业的全球领导地位或将不再遥远。

免责声明:

凡本公众号注明“来源:XXX(非智车科技)”的作品,均转载自其它媒体,转载目的在于传递和分享更多信息,并不代表本平台赞同其观点和对其真实性负责,版权归原作者所有,如有侵权请联系我们删除。

原文标题 : 端到端类脑自动驾驶 | DeepSeek如何影响国内智能汽车行业

展开
打开“财经头条”阅读更多精彩资讯
APP内打开