人形机器人如何做到:手眼协同+大小脑协同?

智车科技

6小时前

标准工业品如伺服电机、谐波减速器已被纳入大规模供应逻辑,在满足人形机器人对轻量化、高精度、高频率响应要求上不断优化。...人形机器人产业热度高涨,真正让机器人“动起来、看得清、抓得准”的技术挑战依旧棘手。

芝能科技出品

人形机器人正逐渐从前沿实验室迈向产业化落地阶段,成为人工智能和智能制造融合的关键技术代表。

特斯拉 Optimus 的硬件方案提出后,激发全球人形机器人行业快速发展,中国本土企业在本体制造、核心零部件、自主算法等多个层面积极参与,产业生态日益丰富。政策助推、产学研联动与供应链的多元演进共同推动这一技术群体步入规模化阶段。

但在实现类人运动控制、视觉感知、手眼协同等方面仍面临众多技术难点,人形机器人从“能用”走向“好用”依然任重道远。我们从硬件演进、功能实现、现实应用展开分析,梳理当前阶段的关键矛盾与发展趋势。

01

技术演进

与产业生态的迅速成型

人形机器人的产业化起点在特斯拉提出 Optimus 硬件设计方案之后变得清晰可见。其采用的 14 个旋转执行器和 14 个直线执行器,为行业标准化设计提供了参考框架,也拉高了公众和行业对大规模量产可能性的期待。

在这个标杆的带动下,全球各地开始加速推进人形机器人的开发,中国尤其表现出迅猛发展态势。

国产厂商在形态设计上展现出高度差异化。从典型的双足+直线+旋转关节,到双足+纯旋转关节结构,再到双足结合轮式底盘或完全轮式平台,产业呈现出多路径演化趋势。

这种技术和结构多样性背后,是国内完整产业链的承载力在支撑着不同技术方向的快速试错与演化。

围绕重点产品、关键技术和典型应用场景,规划至2027年综合实力达到世界先进水平,并辅以产业基金、创新中心建设等方式推动资源配置优化,国家级创新中心已在多地设立,成为产业链、科研院校和政策体系之间的有效桥梁。

本体厂商构成也不再局限于传统机器人企业。科技公司、汽车制造商、AI 创业公司等纷纷入局。

从宇树科技的 G1、H1 系列,到小鹏计划于 2026 年量产的工业级人形机器人,以及智元机器人的远征系列量产进展,人形机器人正由“秀肌肉”的研发样机转向“谋落地”的功能场景适配。

支撑整个生态的零部件供应体系正在同步演进。以往如行星滚柱丝杠、空心杯电机等技术门槛较高的零件,在工艺持续优化后也逐步具备量产能力。

标准工业品如伺服电机、谐波减速器已被纳入大规模供应逻辑,在满足人形机器人对轻量化、高精度、高频率响应要求上不断优化。资本持续涌入核心零部件制造环节,为后续产业放量奠定坚实基础。

02

核心功能的

技术挑战与局部突破

人形机器人产业热度高涨,真正让机器人“动起来、看得清、抓得准”的技术挑战依旧棘手。

以“大小脑”功能协同为例,当前运动控制与泛化能力尚未成熟。人形机器人天生结构复杂、质心高、支撑面积小,在动态平衡控制中远较四足结构更加不稳定。

控制方法上,无论是 MPC 还是 WBC,都面临建模复杂度高与算力消耗巨大的问题。

学习方法虽然展示出惊艳的实验成果,例如强化学习可实现跳舞、踢球等复杂运动,但受限于环境泛化能力低、奖励函数设计难、容错性差等因素,在真实场景中的可靠性和稳定性远未达标。

模仿学习虽对泛化控制有所帮助,但数据来源质量仍未理想。遥操作数据复用性差,动捕受限于设备布置和数据量,视频数据则存在解析难题。

大模型方向正在成为机器人智能的另一个探索维度。视觉语言模型(VLM)以通用模型能力对抗任务复杂性,VLA 架构也试图将知识迁移至运动指令生成。

但由于大模型对硬件资源需求极高,响应延迟长,目前仍停留在任务拆解、路径规划等认知层面,真正的运动控制仍依赖小脑的高速反馈机制。

视觉系统作为人形机器人的“眼睛”,其在复杂环境下的稳定性和多样性处理能力成为关键短板。

3D视觉路线虽然丰富,如多目立体视觉、dToF、结构光、激光雷达等,但各有利弊。成本、精度、环境适应性、安全性之间难以兼得。

比如,结构光适用于室内近距离成像,但室外表现差且体积大;激光雷达精度高但价格昂贵;单目视觉+深度学习成本低却受制于遮挡和纹理缺失等问题。

服务机器人领域已出现相对成熟的解决方案。奥比中光在3D视觉传感器市场的高占有率即是一例,其产品面向多种机器人类型,并针对不同场景进行了针对性优化。

抓取和操作是机器人能否胜任任务的核心能力,灵巧手因此成为另一个技术高地。当前各厂商在手部结构、控制策略、感知能力等方面进行深入差异化探索。灵心巧手、雷赛智能等厂商推出多个自由度和不同任务类型适配的产品,但仍面临泛化抓取动作稳定性不足的问题。

手眼协同是解决这一困境的关键。仅依赖视觉或触觉完成精准操作成功率有限,结合视觉识别与触觉反馈实现动态调整,已成为提升上肢操作能力的主流路径。雷赛智能的遥操作训练与帕西尼的模仿策略均在尝试将人类操作经验转移至机器人身上,为提升泛化能力探索出更多可能性。

小结

走向实用的人形机器人,

需要更多耐心与积累

人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展,技术与产业生态同步演进,激发出前所未有的行业活力。

人形机器人真正实现类人的智能行为、运动能力与操作能力仍非一日之功。从大小脑系统的分布式控制,到多模态感知与手眼协同策略,每一个技术模块的突破都需耗费大量资源与时间。

如何在商业化进程与技术打磨之间找到平衡,是当前每一个从业者都必须面对的问题。

原文标题 : 人形机器人如何做到:手眼协同+大小脑协同?

标准工业品如伺服电机、谐波减速器已被纳入大规模供应逻辑,在满足人形机器人对轻量化、高精度、高频率响应要求上不断优化。...人形机器人产业热度高涨,真正让机器人“动起来、看得清、抓得准”的技术挑战依旧棘手。

芝能科技出品

人形机器人正逐渐从前沿实验室迈向产业化落地阶段,成为人工智能和智能制造融合的关键技术代表。

特斯拉 Optimus 的硬件方案提出后,激发全球人形机器人行业快速发展,中国本土企业在本体制造、核心零部件、自主算法等多个层面积极参与,产业生态日益丰富。政策助推、产学研联动与供应链的多元演进共同推动这一技术群体步入规模化阶段。

但在实现类人运动控制、视觉感知、手眼协同等方面仍面临众多技术难点,人形机器人从“能用”走向“好用”依然任重道远。我们从硬件演进、功能实现、现实应用展开分析,梳理当前阶段的关键矛盾与发展趋势。

01

技术演进

与产业生态的迅速成型

人形机器人的产业化起点在特斯拉提出 Optimus 硬件设计方案之后变得清晰可见。其采用的 14 个旋转执行器和 14 个直线执行器,为行业标准化设计提供了参考框架,也拉高了公众和行业对大规模量产可能性的期待。

在这个标杆的带动下,全球各地开始加速推进人形机器人的开发,中国尤其表现出迅猛发展态势。

国产厂商在形态设计上展现出高度差异化。从典型的双足+直线+旋转关节,到双足+纯旋转关节结构,再到双足结合轮式底盘或完全轮式平台,产业呈现出多路径演化趋势。

这种技术和结构多样性背后,是国内完整产业链的承载力在支撑着不同技术方向的快速试错与演化。

围绕重点产品、关键技术和典型应用场景,规划至2027年综合实力达到世界先进水平,并辅以产业基金、创新中心建设等方式推动资源配置优化,国家级创新中心已在多地设立,成为产业链、科研院校和政策体系之间的有效桥梁。

本体厂商构成也不再局限于传统机器人企业。科技公司、汽车制造商、AI 创业公司等纷纷入局。

从宇树科技的 G1、H1 系列,到小鹏计划于 2026 年量产的工业级人形机器人,以及智元机器人的远征系列量产进展,人形机器人正由“秀肌肉”的研发样机转向“谋落地”的功能场景适配。

支撑整个生态的零部件供应体系正在同步演进。以往如行星滚柱丝杠、空心杯电机等技术门槛较高的零件,在工艺持续优化后也逐步具备量产能力。

标准工业品如伺服电机、谐波减速器已被纳入大规模供应逻辑,在满足人形机器人对轻量化、高精度、高频率响应要求上不断优化。资本持续涌入核心零部件制造环节,为后续产业放量奠定坚实基础。

02

核心功能的

技术挑战与局部突破

人形机器人产业热度高涨,真正让机器人“动起来、看得清、抓得准”的技术挑战依旧棘手。

以“大小脑”功能协同为例,当前运动控制与泛化能力尚未成熟。人形机器人天生结构复杂、质心高、支撑面积小,在动态平衡控制中远较四足结构更加不稳定。

控制方法上,无论是 MPC 还是 WBC,都面临建模复杂度高与算力消耗巨大的问题。

学习方法虽然展示出惊艳的实验成果,例如强化学习可实现跳舞、踢球等复杂运动,但受限于环境泛化能力低、奖励函数设计难、容错性差等因素,在真实场景中的可靠性和稳定性远未达标。

模仿学习虽对泛化控制有所帮助,但数据来源质量仍未理想。遥操作数据复用性差,动捕受限于设备布置和数据量,视频数据则存在解析难题。

大模型方向正在成为机器人智能的另一个探索维度。视觉语言模型(VLM)以通用模型能力对抗任务复杂性,VLA 架构也试图将知识迁移至运动指令生成。

但由于大模型对硬件资源需求极高,响应延迟长,目前仍停留在任务拆解、路径规划等认知层面,真正的运动控制仍依赖小脑的高速反馈机制。

视觉系统作为人形机器人的“眼睛”,其在复杂环境下的稳定性和多样性处理能力成为关键短板。

3D视觉路线虽然丰富,如多目立体视觉、dToF、结构光、激光雷达等,但各有利弊。成本、精度、环境适应性、安全性之间难以兼得。

比如,结构光适用于室内近距离成像,但室外表现差且体积大;激光雷达精度高但价格昂贵;单目视觉+深度学习成本低却受制于遮挡和纹理缺失等问题。

服务机器人领域已出现相对成熟的解决方案。奥比中光在3D视觉传感器市场的高占有率即是一例,其产品面向多种机器人类型,并针对不同场景进行了针对性优化。

抓取和操作是机器人能否胜任任务的核心能力,灵巧手因此成为另一个技术高地。当前各厂商在手部结构、控制策略、感知能力等方面进行深入差异化探索。灵心巧手、雷赛智能等厂商推出多个自由度和不同任务类型适配的产品,但仍面临泛化抓取动作稳定性不足的问题。

手眼协同是解决这一困境的关键。仅依赖视觉或触觉完成精准操作成功率有限,结合视觉识别与触觉反馈实现动态调整,已成为提升上肢操作能力的主流路径。雷赛智能的遥操作训练与帕西尼的模仿策略均在尝试将人类操作经验转移至机器人身上,为提升泛化能力探索出更多可能性。

小结

走向实用的人形机器人,

需要更多耐心与积累

人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展,技术与产业生态同步演进,激发出前所未有的行业活力。

人形机器人真正实现类人的智能行为、运动能力与操作能力仍非一日之功。从大小脑系统的分布式控制,到多模态感知与手眼协同策略,每一个技术模块的突破都需耗费大量资源与时间。

如何在商业化进程与技术打磨之间找到平衡,是当前每一个从业者都必须面对的问题。

原文标题 : 人形机器人如何做到:手眼协同+大小脑协同?

展开
打开“财经头条”阅读更多精彩资讯
APP内打开