华为、阿里巴巴都已经下场,未来AI的关键「具身智能」到底是啥?

智车科技

1周前

这三位“明星选手”从不同侧面展示了具身智能的未来图景:Atlas定义了“身体”的潜能,Optimus探索了大规模应用的可能,而Figure01则展示了“大脑”与“身体”结合的魅力。

你是否注意到,人工智能领域正出现一个重要的新方向?过去我们熟悉的AI,大多像个聪明的“虚拟大脑”,在电脑和云端处理数据。而现在,科学家和工程师们正努力为AI装上“身体”,让它能像我们一样,在物理世界中感知、学习和完成任务。这就是“具身智能”。

它不仅仅是让机器人动起来,更是一种让AI通过与环境的真实互动来获得智能的新思路。

作者:Debbie

排版:燕子

什么是具身智能?——给AI一个“身体”

要理解“具身智能”,我们可以先从我们熟悉的人工智能(AI)说起。

一直以来,大部分我们接触到的AI,比如手机上的语音助手、能和我们对话的聊天机器人(如ChatGPT),或是那些下棋高手(如AlphaGo),都可以被称为“离身智能”(Disembodied AI)。

它们更像一个个运行在服务器里的“超级大脑”,非常擅长处理数字化的信息。你给它们文字、数据或图片,它们能快速学习、分析并给出结果。但它们本身没有实体,无法直接与我们身处的物理世界进行互动。

而“具身智能”(Embodied AI)则提出了一个核心观点:真正的智能,离不开身体以及与环境的真实互动。

简单来说,具身智能研究的就是如何让AI拥有一个“身体”(比如机器人),并通过这个身体去感知周围的世界,然后做出行动,最后从行动的结果中学习和进步。

这个过程可以用一个简单的循环来概括:“感知-思考-行动-反馈”

这很像婴儿学习新技能的方式。一个婴儿不是靠阅读“如何走路”的说明书来学会走路的,而是通过一次次地尝试站立、迈步、摔倒,再根据摔倒的“反馈”不断调整身体的平衡和肌肉的力度,最终才掌握这项复杂的技能。

具身智能希望机器也能以这种“身体力行”的方式来学习。它不再仅仅是被动地“喂”给它海量数据,而是要主动地去探索、去试错、去感受。比如,一个具身智能机器人要学会“开门”,它需要通过摄像头“看到”门把手的位置和形状(感知),规划出手臂的运动轨迹(思考),伸出手去抓住并转动(行动),并根据门是否被打开(反馈)来判断自己的动作是否成功,如果不成功下次该如何调整。

所以,我们可以这样简单区分:

• 传统AI(离身智能):一个在虚拟世界里博览群书、精于计算的“大脑”。• 具身智能:一个既有“大脑”又有“身体”,必须在现实世界中摸爬滚打、积累经验的“行动派”。

正是这种与物理世界直接互动的能力,让具身智能被看作是通往更通用、更强大的人工智能的关键一步。

全球明星选手大盘点——谁是具身智能的“头号玩家”?

如果说具身智能是一个竞技场,那么以下几位“选手”无疑是目前最受瞩目的焦点。它们不仅技术领先,也代表了行业发展的不同路径。

1. 波士顿动力Atlas:机器人界的“运动健将”

• 开发者: 波士顿动力 (Boston Dynamics)• 标签: 动态平衡、高难度动作

你很可能在网上刷到过它的视频:一个外形酷似人类的机器人,轻松地在复杂地形上跑酷、跳跃,甚至完成后空翻等高难度体操动作。它就是Atlas。

Atlas是机器人硬件和运动控制领域的标杆。它通过先进的液压系统(老版本)或全新的全电动系统(新版本),实现了无与伦比的平衡性和敏捷性。它主要被用作一个尖端研究平台,不断探索机器人在物理世界中运动能力的极限。虽然离商业化应用还有距离,但Atlas每一次的技术展示,都在告诉我们未来机器人的身体可以有多么灵活和强大。

2. 特斯拉Optimus:为规模化生产而生的“打工人”• 开发者: 特斯拉 (Tesla)• 标签: 工业应用、大规模量产

由埃隆·马斯克力推的Optimus(擎天柱)机器人,从诞生之初就有着明确的目标:进入工厂和家庭,代替人类从事重复、乏味或危险的劳动。

与追求极限运动能力的Atlas不同,Optimus更注重于在真实场景下完成具体任务。特斯拉利用其在自动驾驶领域积累的AI、视觉识别和计算硬件技术,让Optimus能够学习并执行诸如在工厂流水线上搬运零件、分拣物品,甚至叠衣服等精细操作。马斯克的目标是实现Optimus的大规模量产,使其成本足够低,从而像汽车一样改变社会生产力。

3. Figure 01 (与OpenAI合作):拥有“大模型大脑”的对话能手开发者:Figure AI OpenAI标签: 语言交互、多模态AI

Figure 01的惊艳之处在于它将一个灵活的“身体”与一个顶级的“大脑”完美结合。通过与OpenAI合作,Figure 01接入了强大的多模态大模型,这让它不仅能“看懂”世界,还能用流畅的语言与人交流。

在演示视频中,Figure 01能够一边与人对话,一边准确理解人的意图,并执行相应操作,比如根据口头指令递上苹果、将垃圾收拾进篮筐。它展示了“视觉-语言-行动”一体化的巨大潜力,证明了让大模型来指挥机器人身体,是实现通用人机交互的一条有效路径。

这三位“明星选手”从不同侧面展示了具身智能的未来图景:Atlas定义了“身体”的潜能,Optimus探索了大规模应用的可能,而Figure 01则展示了“大脑”与“身体”结合的魅力。正是这些先行者的努力,让具身智能的未来充满了想象空间。

中国力量的崛起——我们的“机器人军团”正在集结!

如果说全球科技巨头为具身智能的发展开辟了道路,那么中国的入局者则在加速将这项技术推向广阔的产业和生活应用。它们不仅紧跟世界前沿,更展现出结合本土市场需求的独特优势。

1. 华为:技术深厚的“全能型选手”

作为通信和ICT领域的领导者,华为入局具身智能可谓“厚积薄发”。其推出的“夸父”人形机器人,背后是华为在AI大模型、高性能计算、传感器和精准控制等领域多年的技术沉淀。华为的目标非常明确:将机器人应用于工业制造等复杂场景,解决实际生产中的难题。通过将强大的AI“大脑”与稳健的机器人“身体”相结合,“夸父”有望在自动化生产线上扮演重要角色。

2. 阿里巴巴:来自电商巨头的“场景驱动者”

阿里巴巴旗下的科研机构达摩院,很早就开始了对机器人的探索。与其它公司不同,阿里做机器人有着天然的场景优势——庞大的电商物流和新制造体系。达摩院研发的机器人,搭载了其自研的多模态大模型,能够精准地理解指令并执行复杂的抓取、分拣任务。它们的目标是在繁忙的仓库和工厂里,成为人类员工的得力助手,提升整体运行效率。

3. 海尔:面向未来的“家庭管家”

作为家电行业的巨头,海尔对未来智慧家庭的形态有着深刻的理解。因此,海尔布局具身智能的切入点非常贴近生活——家庭服务机器人。通过将机器人技术与智能家电生态相结合,海尔希望打造出真正的“智慧家庭管家”。在其展示的场景中,机器人已经可以完成开关冰箱门、拿取饮料等一系列家居任务,展现了未来机器人在家庭服务领域的广阔前景。

4. 宇树科技 (Unitree):机器人领域的“新生代力量”

除了科技巨头,中国还涌现出一批极具创新力的创业公司,宇树科技就是其中的佼佼者。它以高性能的四足机器人(机器狗)闻名,并在此基础上推出了自己的人形机器人。宇树科技的产品以其出色的运动性能、灵活性以及相对较高的性价比,在全球范围内都获得了广泛关注,证明了中国在机器人硬件和控制系统领域同样具备世界级的竞争力。

从华为、阿里的宏大布局,到海尔的场景深耕,再到宇树科技的创新突破,中国的具身智能领域呈现出“AI技术公司”与“场景应用公司”双轮驱动、协同发展的良好态M势。这股“中国力量”,正在让具身智能的未来变得更加触手可及。

为什么我们需要具身智能?——不止是酷炫

看到机器人在视频里跑酷、叠衣服,我们或许会觉得很新奇。但具身智能的意义远不止于此,它旨在解决我们社会面临的一些真实而紧迫的问题。

首先,它可以成为新型劳动力,应对人口结构变化带来的挑战。

在制造业、建筑业和物流等行业,许多重复、繁重或危险的岗位正面临招工难的问题。具身智能机器人有望填补这些空缺,将人类从枯燥和高风险的工作中解放出来,去从事更有创造性的任务。

其次,它将在养老、康复等领域扮演重要角色。

随着社会老龄化加剧,专业的护理人员需求巨大。一个足够智能的机器人,可以为行动不便的老人提供日常陪伴、辅助起身、递送物品,极大地提升他们的生活质量。

更重要的是,具身智能被认为是通往通用人工智能(AGI)的关键路径。

只有让AI在复杂的现实世界中不断学习和适应,它才可能真正理解物理规律和人类社会的常识,最终发展出接近人类的通用智能。

迎接一个“虚实融合”的新时代

从实验室里的前沿探索,到工厂、家庭中的初步应用,具身智能正将人工智能从虚拟世界带入我们生活的物理空间。它不仅仅是制造更聪明的机器人,更是一次深刻的生产力变革。无论是国外的科技巨头,还是崛起的“中国力量”,都在加速奔向这个“虚实融合”的新时代。

未来,机器人或许会成为我们的同事、管家和生活助手。一个由人类与智能机器人协作共存的社会正向我们走来。对此,你准备好了吗?

原文标题 : 华为、阿里巴巴都已经下场,未来AI的关键「具身智能」到底是啥?

这三位“明星选手”从不同侧面展示了具身智能的未来图景:Atlas定义了“身体”的潜能,Optimus探索了大规模应用的可能,而Figure01则展示了“大脑”与“身体”结合的魅力。

你是否注意到,人工智能领域正出现一个重要的新方向?过去我们熟悉的AI,大多像个聪明的“虚拟大脑”,在电脑和云端处理数据。而现在,科学家和工程师们正努力为AI装上“身体”,让它能像我们一样,在物理世界中感知、学习和完成任务。这就是“具身智能”。

它不仅仅是让机器人动起来,更是一种让AI通过与环境的真实互动来获得智能的新思路。

作者:Debbie

排版:燕子

什么是具身智能?——给AI一个“身体”

要理解“具身智能”,我们可以先从我们熟悉的人工智能(AI)说起。

一直以来,大部分我们接触到的AI,比如手机上的语音助手、能和我们对话的聊天机器人(如ChatGPT),或是那些下棋高手(如AlphaGo),都可以被称为“离身智能”(Disembodied AI)。

它们更像一个个运行在服务器里的“超级大脑”,非常擅长处理数字化的信息。你给它们文字、数据或图片,它们能快速学习、分析并给出结果。但它们本身没有实体,无法直接与我们身处的物理世界进行互动。

而“具身智能”(Embodied AI)则提出了一个核心观点:真正的智能,离不开身体以及与环境的真实互动。

简单来说,具身智能研究的就是如何让AI拥有一个“身体”(比如机器人),并通过这个身体去感知周围的世界,然后做出行动,最后从行动的结果中学习和进步。

这个过程可以用一个简单的循环来概括:“感知-思考-行动-反馈”

这很像婴儿学习新技能的方式。一个婴儿不是靠阅读“如何走路”的说明书来学会走路的,而是通过一次次地尝试站立、迈步、摔倒,再根据摔倒的“反馈”不断调整身体的平衡和肌肉的力度,最终才掌握这项复杂的技能。

具身智能希望机器也能以这种“身体力行”的方式来学习。它不再仅仅是被动地“喂”给它海量数据,而是要主动地去探索、去试错、去感受。比如,一个具身智能机器人要学会“开门”,它需要通过摄像头“看到”门把手的位置和形状(感知),规划出手臂的运动轨迹(思考),伸出手去抓住并转动(行动),并根据门是否被打开(反馈)来判断自己的动作是否成功,如果不成功下次该如何调整。

所以,我们可以这样简单区分:

• 传统AI(离身智能):一个在虚拟世界里博览群书、精于计算的“大脑”。• 具身智能:一个既有“大脑”又有“身体”,必须在现实世界中摸爬滚打、积累经验的“行动派”。

正是这种与物理世界直接互动的能力,让具身智能被看作是通往更通用、更强大的人工智能的关键一步。

全球明星选手大盘点——谁是具身智能的“头号玩家”?

如果说具身智能是一个竞技场,那么以下几位“选手”无疑是目前最受瞩目的焦点。它们不仅技术领先,也代表了行业发展的不同路径。

1. 波士顿动力Atlas:机器人界的“运动健将”

• 开发者: 波士顿动力 (Boston Dynamics)• 标签: 动态平衡、高难度动作

你很可能在网上刷到过它的视频:一个外形酷似人类的机器人,轻松地在复杂地形上跑酷、跳跃,甚至完成后空翻等高难度体操动作。它就是Atlas。

Atlas是机器人硬件和运动控制领域的标杆。它通过先进的液压系统(老版本)或全新的全电动系统(新版本),实现了无与伦比的平衡性和敏捷性。它主要被用作一个尖端研究平台,不断探索机器人在物理世界中运动能力的极限。虽然离商业化应用还有距离,但Atlas每一次的技术展示,都在告诉我们未来机器人的身体可以有多么灵活和强大。

2. 特斯拉Optimus:为规模化生产而生的“打工人”• 开发者: 特斯拉 (Tesla)• 标签: 工业应用、大规模量产

由埃隆·马斯克力推的Optimus(擎天柱)机器人,从诞生之初就有着明确的目标:进入工厂和家庭,代替人类从事重复、乏味或危险的劳动。

与追求极限运动能力的Atlas不同,Optimus更注重于在真实场景下完成具体任务。特斯拉利用其在自动驾驶领域积累的AI、视觉识别和计算硬件技术,让Optimus能够学习并执行诸如在工厂流水线上搬运零件、分拣物品,甚至叠衣服等精细操作。马斯克的目标是实现Optimus的大规模量产,使其成本足够低,从而像汽车一样改变社会生产力。

3. Figure 01 (与OpenAI合作):拥有“大模型大脑”的对话能手开发者:Figure AI OpenAI标签: 语言交互、多模态AI

Figure 01的惊艳之处在于它将一个灵活的“身体”与一个顶级的“大脑”完美结合。通过与OpenAI合作,Figure 01接入了强大的多模态大模型,这让它不仅能“看懂”世界,还能用流畅的语言与人交流。

在演示视频中,Figure 01能够一边与人对话,一边准确理解人的意图,并执行相应操作,比如根据口头指令递上苹果、将垃圾收拾进篮筐。它展示了“视觉-语言-行动”一体化的巨大潜力,证明了让大模型来指挥机器人身体,是实现通用人机交互的一条有效路径。

这三位“明星选手”从不同侧面展示了具身智能的未来图景:Atlas定义了“身体”的潜能,Optimus探索了大规模应用的可能,而Figure 01则展示了“大脑”与“身体”结合的魅力。正是这些先行者的努力,让具身智能的未来充满了想象空间。

中国力量的崛起——我们的“机器人军团”正在集结!

如果说全球科技巨头为具身智能的发展开辟了道路,那么中国的入局者则在加速将这项技术推向广阔的产业和生活应用。它们不仅紧跟世界前沿,更展现出结合本土市场需求的独特优势。

1. 华为:技术深厚的“全能型选手”

作为通信和ICT领域的领导者,华为入局具身智能可谓“厚积薄发”。其推出的“夸父”人形机器人,背后是华为在AI大模型、高性能计算、传感器和精准控制等领域多年的技术沉淀。华为的目标非常明确:将机器人应用于工业制造等复杂场景,解决实际生产中的难题。通过将强大的AI“大脑”与稳健的机器人“身体”相结合,“夸父”有望在自动化生产线上扮演重要角色。

2. 阿里巴巴:来自电商巨头的“场景驱动者”

阿里巴巴旗下的科研机构达摩院,很早就开始了对机器人的探索。与其它公司不同,阿里做机器人有着天然的场景优势——庞大的电商物流和新制造体系。达摩院研发的机器人,搭载了其自研的多模态大模型,能够精准地理解指令并执行复杂的抓取、分拣任务。它们的目标是在繁忙的仓库和工厂里,成为人类员工的得力助手,提升整体运行效率。

3. 海尔:面向未来的“家庭管家”

作为家电行业的巨头,海尔对未来智慧家庭的形态有着深刻的理解。因此,海尔布局具身智能的切入点非常贴近生活——家庭服务机器人。通过将机器人技术与智能家电生态相结合,海尔希望打造出真正的“智慧家庭管家”。在其展示的场景中,机器人已经可以完成开关冰箱门、拿取饮料等一系列家居任务,展现了未来机器人在家庭服务领域的广阔前景。

4. 宇树科技 (Unitree):机器人领域的“新生代力量”

除了科技巨头,中国还涌现出一批极具创新力的创业公司,宇树科技就是其中的佼佼者。它以高性能的四足机器人(机器狗)闻名,并在此基础上推出了自己的人形机器人。宇树科技的产品以其出色的运动性能、灵活性以及相对较高的性价比,在全球范围内都获得了广泛关注,证明了中国在机器人硬件和控制系统领域同样具备世界级的竞争力。

从华为、阿里的宏大布局,到海尔的场景深耕,再到宇树科技的创新突破,中国的具身智能领域呈现出“AI技术公司”与“场景应用公司”双轮驱动、协同发展的良好态M势。这股“中国力量”,正在让具身智能的未来变得更加触手可及。

为什么我们需要具身智能?——不止是酷炫

看到机器人在视频里跑酷、叠衣服,我们或许会觉得很新奇。但具身智能的意义远不止于此,它旨在解决我们社会面临的一些真实而紧迫的问题。

首先,它可以成为新型劳动力,应对人口结构变化带来的挑战。

在制造业、建筑业和物流等行业,许多重复、繁重或危险的岗位正面临招工难的问题。具身智能机器人有望填补这些空缺,将人类从枯燥和高风险的工作中解放出来,去从事更有创造性的任务。

其次,它将在养老、康复等领域扮演重要角色。

随着社会老龄化加剧,专业的护理人员需求巨大。一个足够智能的机器人,可以为行动不便的老人提供日常陪伴、辅助起身、递送物品,极大地提升他们的生活质量。

更重要的是,具身智能被认为是通往通用人工智能(AGI)的关键路径。

只有让AI在复杂的现实世界中不断学习和适应,它才可能真正理解物理规律和人类社会的常识,最终发展出接近人类的通用智能。

迎接一个“虚实融合”的新时代

从实验室里的前沿探索,到工厂、家庭中的初步应用,具身智能正将人工智能从虚拟世界带入我们生活的物理空间。它不仅仅是制造更聪明的机器人,更是一次深刻的生产力变革。无论是国外的科技巨头,还是崛起的“中国力量”,都在加速奔向这个“虚实融合”的新时代。

未来,机器人或许会成为我们的同事、管家和生活助手。一个由人类与智能机器人协作共存的社会正向我们走来。对此,你准备好了吗?

原文标题 : 华为、阿里巴巴都已经下场,未来AI的关键「具身智能」到底是啥?

展开
打开“财经头条”阅读更多精彩资讯
APP内打开