华为、阿里巴巴都已经下场，未来AI的关键「具身智能」到底是啥？

财经头条

提升一亿中产阶级阅读效率

打开

智车科技

1周前

这三位“明星选手”从不同侧面展示了具身智能的未来图景：Atlas定义了“身体”的潜能，Optimus探索了大规模应用的可能，而Figure01则展示了“大脑”与“身体”结合的魅力。

你是否注意到，人工智能领域正出现一个重要的新方向？过去我们熟悉的AI，大多像个聪明的“虚拟大脑”，在电脑和云端处理数据。而现在，科学家和工程师们正努力为AI装上“身体”，让它能像我们一样，在物理世界中感知、学习和完成任务。这就是“具身智能”。

它不仅仅是让机器人动起来，更是一种让AI通过与环境的真实互动来获得智能的新思路。

作者：Debbie

排版：燕子

什么是具身智能？——给AI一个“身体”

要理解“具身智能”，我们可以先从我们熟悉的人工智能（AI）说起。

一直以来，大部分我们接触到的AI，比如手机上的语音助手、能和我们对话的聊天机器人（如ChatGPT），或是那些下棋高手（如AlphaGo），都可以被称为“离身智能”（Disembodied AI）。

它们更像一个个运行在服务器里的“超级大脑”，非常擅长处理数字化的信息。你给它们文字、数据或图片，它们能快速学习、分析并给出结果。但它们本身没有实体，无法直接与我们身处的物理世界进行互动。

而“具身智能”（Embodied AI）则提出了一个核心观点：真正的智能，离不开身体以及与环境的真实互动。

简单来说，具身智能研究的就是如何让AI拥有一个“身体”（比如机器人），并通过这个身体去感知周围的世界，然后做出行动，最后从行动的结果中学习和进步。

这个过程可以用一个简单的循环来概括：“感知-思考-行动-反馈”。

这很像婴儿学习新技能的方式。一个婴儿不是靠阅读“如何走路”的说明书来学会走路的，而是通过一次次地尝试站立、迈步、摔倒，再根据摔倒的“反馈”不断调整身体的平衡和肌肉的力度，最终才掌握这项复杂的技能。

具身智能希望机器也能以这种“身体力行”的方式来学习。它不再仅仅是被动地“喂”给它海量数据，而是要主动地去探索、去试错、去感受。比如，一个具身智能机器人要学会“开门”，它需要通过摄像头“看到”门把手的位置和形状（感知），规划出手臂的运动轨迹（思考），伸出手去抓住并转动（行动），并根据门是否被打开（反馈）来判断自己的动作是否成功，如果不成功下次该如何调整。

所以，我们可以这样简单区分：

• 传统AI（离身智能）：一个在虚拟世界里博览群书、精于计算的“大脑”。• 具身智能：一个既有“大脑”又有“身体”，必须在现实世界中摸爬滚打、积累经验的“行动派”。

正是这种与物理世界直接互动的能力，让具身智能被看作是通往更通用、更强大的人工智能的关键一步。

全球明星选手大盘点——谁是具身智能的“头号玩家”？

如果说具身智能是一个竞技场，那么以下几位“选手”无疑是目前最受瞩目的焦点。它们不仅技术领先，也代表了行业发展的不同路径。

1. 波士顿动力Atlas：机器人界的“运动健将”

• 开发者：波士顿动力 (Boston Dynamics)• 标签： 动态平衡、高难度动作

你很可能在网上刷到过它的视频：一个外形酷似人类的机器人，轻松地在复杂地形上跑酷、跳跃，甚至完成后空翻等高难度体操动作。它就是Atlas。

Atlas是机器人硬件和运动控制领域的标杆。它通过先进的液压系统（老版本）或全新的全电动系统（新版本），实现了无与伦比的平衡性和敏捷性。它主要被用作一个尖端研究平台，不断探索机器人在物理世界中运动能力的极限。虽然离商业化应用还有距离，但Atlas每一次的技术展示，都在告诉我们未来机器人的身体可以有多么灵活和强大。

2. 特斯拉Optimus：为规模化生产而生的“打工人”• 开发者：特斯拉 (Tesla)• 标签：工业应用、大规模量产

由埃隆·马斯克力推的Optimus（擎天柱）机器人，从诞生之初就有着明确的目标：进入工厂和家庭，代替人类从事重复、乏味或危险的劳动。

与追求极限运动能力的Atlas不同，Optimus更注重于在真实场景下完成具体任务。特斯拉利用其在自动驾驶领域积累的AI、视觉识别和计算硬件技术，让Optimus能够学习并执行诸如在工厂流水线上搬运零件、分拣物品，甚至叠衣服等精细操作。马斯克的目标是实现Optimus的大规模量产，使其成本足够低，从而像汽车一样改变社会生产力。

3. Figure 01 (与OpenAI合作)：拥有“大模型大脑”的对话能手开发者：Figure AI OpenAI标签：语言交互、多模态AI

Figure 01的惊艳之处在于它将一个灵活的“身体”与一个顶级的“大脑”完美结合。通过与OpenAI合作，Figure 01接入了强大的多模态大模型，这让它不仅能“看懂”世界，还能用流畅的语言与人交流。

在演示视频中，Figure 01能够一边与人对话，一边准确理解人的意图，并执行相应操作，比如根据口头指令递上苹果、将垃圾收拾进篮筐。它展示了“视觉-语言-行动”一体化的巨大潜力，证明了让大模型来指挥机器人身体，是实现通用人机交互的一条有效路径。

这三位“明星选手”从不同侧面展示了具身智能的未来图景：Atlas定义了“身体”的潜能，Optimus探索了大规模应用的可能，而Figure 01则展示了“大脑”与“身体”结合的魅力。正是这些先行者的努力，让具身智能的未来充满了想象空间。

中国力量的崛起——我们的“机器人军团”正在集结！

如果说全球科技巨头为具身智能的发展开辟了道路，那么中国的入局者则在加速将这项技术推向广阔的产业和生活应用。它们不仅紧跟世界前沿，更展现出结合本土市场需求的独特优势。

1. 华为：技术深厚的“全能型选手”

作为通信和ICT领域的领导者，华为入局具身智能可谓“厚积薄发”。其推出的“夸父”人形机器人，背后是华为在AI大模型、高性能计算、传感器和精准控制等领域多年的技术沉淀。华为的目标非常明确：将机器人应用于工业制造等复杂场景，解决实际生产中的难题。通过将强大的AI“大脑”与稳健的机器人“身体”相结合，“夸父”有望在自动化生产线上扮演重要角色。

2. 阿里巴巴：来自电商巨头的“场景驱动者”

阿里巴巴旗下的科研机构达摩院，很早就开始了对机器人的探索。与其它公司不同，阿里做机器人有着天然的场景优势——庞大的电商物流和新制造体系。达摩院研发的机器人，搭载了其自研的多模态大模型，能够精准地理解指令并执行复杂的抓取、分拣任务。它们的目标是在繁忙的仓库和工厂里，成为人类员工的得力助手，提升整体运行效率。

3. 海尔：面向未来的“家庭管家”

作为家电行业的巨头，海尔对未来智慧家庭的形态有着深刻的理解。因此，海尔布局具身智能的切入点非常贴近生活——家庭服务机器人。通过将机器人技术与智能家电生态相结合，海尔希望打造出真正的“智慧家庭管家”。在其展示的场景中，机器人已经可以完成开关冰箱门、拿取饮料等一系列家居任务，展现了未来机器人在家庭服务领域的广阔前景。

4. 宇树科技 (Unitree)：机器人领域的“新生代力量”

除了科技巨头，中国还涌现出一批极具创新力的创业公司，宇树科技就是其中的佼佼者。它以高性能的四足机器人（机器狗）闻名，并在此基础上推出了自己的人形机器人。宇树科技的产品以其出色的运动性能、灵活性以及相对较高的性价比，在全球范围内都获得了广泛关注，证明了中国在机器人硬件和控制系统领域同样具备世界级的竞争力。

从华为、阿里的宏大布局，到海尔的场景深耕，再到宇树科技的创新突破，中国的具身智能领域呈现出“AI技术公司”与“场景应用公司”双轮驱动、协同发展的良好态M势。这股“中国力量”，正在让具身智能的未来变得更加触手可及。

为什么我们需要具身智能？——不止是酷炫

看到机器人在视频里跑酷、叠衣服，我们或许会觉得很新奇。但具身智能的意义远不止于此，它旨在解决我们社会面临的一些真实而紧迫的问题。

首先，它可以成为新型劳动力，应对人口结构变化带来的挑战。

在制造业、建筑业和物流等行业，许多重复、繁重或危险的岗位正面临招工难的问题。具身智能机器人有望填补这些空缺，将人类从枯燥和高风险的工作中解放出来，去从事更有创造性的任务。

其次，它将在养老、康复等领域扮演重要角色。

随着社会老龄化加剧，专业的护理人员需求巨大。一个足够智能的机器人，可以为行动不便的老人提供日常陪伴、辅助起身、递送物品，极大地提升他们的生活质量。

更重要的是，具身智能被认为是通往通用人工智能（AGI）的关键路径。

只有让AI在复杂的现实世界中不断学习和适应，它才可能真正理解物理规律和人类社会的常识，最终发展出接近人类的通用智能。

迎接一个“虚实融合”的新时代

从实验室里的前沿探索，到工厂、家庭中的初步应用，具身智能正将人工智能从虚拟世界带入我们生活的物理空间。它不仅仅是制造更聪明的机器人，更是一次深刻的生产力变革。无论是国外的科技巨头，还是崛起的“中国力量”，都在加速奔向这个“虚实融合”的新时代。

未来，机器人或许会成为我们的同事、管家和生活助手。一个由人类与智能机器人协作共存的社会正向我们走来。对此，你准备好了吗？

原文标题 : 华为、阿里巴巴都已经下场，未来AI的关键「具身智能」到底是啥？