近日,上海智元机器人推出了全球首款全栈开源机器人灵犀X1的整装组件。记者在现场看到,仅需10万元左右,即可实现人人DIY机器人。此外,有了百度视觉多模态大模型等AI技术的加持,灵犀X1机器人不再只是一台玩具,而是“可看可听可理解”世界的具身智能。
如今,DeepSeek带领的全球大模型开源趋势,加速了人形机器人的智能涌现。业内人士预计两三年后,人形机器人将出现“ChatGPT时刻”,基础款价格也将来到5万元区间,具身智能将走进更多家庭。
两天组装一台机器人
浦东新区一栋办公楼内,柳州职业技术大学副教授关来德带着一群学生,比照着图纸,正在搭建一台人形机器人。记者在现场看到,机器人的零件铺满了整张桌子,各种不同尺寸的螺丝都有几十包,更不用提各类关节部件和控制器。
他们搭建的是智元的灵犀X1机器人,个头不大,只有1.3米,裸机重量仅33公斤,但却能完成多种工作。受益于其模块化设计使拆装简便,能适应多种应用场景。全身由两款自研的关节电机组装而成,还配备的自适应夹爪能实现高效精准夹持和定位。
智元灵犀X1机器人。
智元机器人工程师告诉记者,每个人依照说明书都能搭建出灵犀X1,不过耗时较长,两个人需要两天时间才能完成组装、适配、测试等步骤。有意思的是,灵犀X1可以通过游戏手柄来操作控制,也支持编程让机器人解锁更多技能。“我所在的专业就是机器人专业,上海有良好的具身智能的产业链,学生能在这里与最新产品和研究成果接触,加强动手实践能力的同时,也在实操中掌握基础原理,这些都是课本上难以学会的。”关来德表示,学生一旦掌握机器人的工作原理,未来将在巡检、维修等高风险高强度的领域抢占职业先机。
柳州职业技术大学副教授关来德带领学生组装机器人
“我们将具身智能的AGI(通用人工智能)能力分为G1到G5五个阶段,目前正在同步进行G2和G3阶段的工作,也在探索G4阶段。”上海智元机器人渠道销售总监刘强告诉记者,人形机器人目前的能力还非常有限,要想走进家庭,替代保姆、管家甚至护工,需要AGI能力步入G5阶段,可能需要十年之久。
机器人“学徒”需要一对一教学
相隔三公里外的智元数采中心同样是一片繁忙景象,但不同的是,繁忙的不只是人,还有一群机器人。
刚进门,记者就看到五个六机器人同时在学习打包礼物,每个技术员手拿两个操作手柄,任何动作都与机器人双臂连动,远程操作用一根红色丝带给礼盒打上蝴蝶结。看似常人两三秒就能做完的简单动作,机器人却要迟钝不少,至少需要两三分钟才能完成。失误的操作也不少,任何动作出现问题就要重新来过。如果是复合性动作,失误就更多了。在“后厨出餐”场景下,机器人需要端起装有面包和酱料的餐盘,并向前送至橱窗。据现场观察,这一套动作成功率仅50%。
“这里机器人‘认识’世界的地方,技术员操控机器人模拟真实生活中各种动作,这样机器人就能学会怎么叠被子、拉窗帘等生活技能。”刘强介绍,4000平方米的智元数据采集中心,搭建了家居、餐厅、工业、商超、办公五大类场景,包含超过两百个细分场景的任务,平时有1000个左右的机器人在“培训”。每个机器人“学徒”的背后都是技术员的一对一教学,哪怕是一个简单动作都要上百次训练。现场技术员告诉记者,以“后厨出餐”场景为例,一个取餐任务量需要600次,耗时两天时间,而机器人通常需要完成超过1万多个任务。
机器人正在学习后厨出餐。
这些任务最终都会成为训练数据,成为机器人是否聪明的关键所在。据介绍,智元机器人的数采中心每天可以产出数万条训练数据,被称为真机数据。真机数据模拟真实世界环境,可靠性强但成本过高,仅凭真机数据远远不够机器人的训练量,因此仿真环境数据也愈发重要。
“真机数据与仿真环境数据的比例要恰当,不然会导致机器人的交互失真,无法实现预期任务。”刘强介绍,业内通常认为真机与仿真的数据比例控制在1:10以内比较可行,但即便如此,训练数据的积累依然是几乎一笔巨大的投资。目前,智元数采中心的规模和质量在全球范围内都属于第一梯队。
大模型给机器人安装“大脑”
机器人有了躯体和数据,如何蜕变成具身智能,AI大模型的智能涌现,给机器人安装上了“大脑”。
具身智能的关键在于机器人可以感知物理世界并实时交互。大语言模型、多模态模型以及推理模型等AI能力,赋予了机器人听、说、看的功能,并能理解世界,以及拆分任何和逻辑推理等决策能力。如今,大模型的开源趋势,可能加速人形机器人的落地应用。
两个机器人正在学习合作铺床单。
“随着人形机器人从概念验证向规模化应用落地,大模型与智能体技术正在成为产业突破临界点的关键驱动。”百度智能云一见产品部解决方案负责人呼啸表示,百度与智元正围绕具身智能生态解决方案建设、关键技术和产品研发等展开合作,加速推进智能机器人在教育科研、智能制造等场景的落地应用,“相当于百度的视觉多模态大模型给智元旗下的灵犀系列机器人安装了‘眼睛’和‘大脑’。”
更重要的是,智元将灵犀X1定义为全栈开源机器人,使得任何人可以自由地修改、定制和优化灵犀X1的硬件和软件,具身智能可进入“人人造”的时代,每个人都能打造属于自己的机器人。因此,关来德才能在AI实训实验室中自主训练机器人完成物品分拣、环境巡检等高精度任务模型,加速产学研生态构建与成果转化。
据了解,百度智能云与智元机器人将结合远征系列专业数采和交互服务机器人、灵犀全栈开源机器人、全栈数采方案等产品方案的研发布局,共同打造可二次开发的人形机器人平台。
“ChatGPT时刻”就在不远将来
2024年被业内认为是“人形机器人的觉醒之年”,今年国际消费电子展(CES)上,英伟达CEO黄仁勋也表示,人形机器人和通用机器人技术,即将迎来“ChatGPT时刻”。
过去一年,AI大模型与人形机器人的深度耦合,推动具身智能迈向了全球科技竞争的新高地,展现出巨大的市场潜力和发展空间。目前,我国已成为全球领先的人形机器人生产国。中国信息通信研究院发布的《人形机器人产业研究报告》显示,2024年中国人形机器人市场规模达到约27.6亿元,并有望在2030年成长为千亿元市场。高工产业研究院(GGII)也预测,2030年全球人形机器人市场规模将突破200亿美元,其中中国市场占比达四分之一。摩根士丹利发布的全球人形机器人领域上市公司的百强名单,37家中国企业上榜。
虽然人形机器人距离实际应用还有一段距离,但离日常生活已不再是“远在天边”。智元机器人、宇树科技等国内一线机器人厂商均已推出入门级机器人,价格门槛降至10万元左右。比如,智元的灵犀X1机器人官方套件售价为10.8万元,而宇树科技G1人形机器人售价9.9万元,但需要45天后交货。
记者观察到,10万元人形机器人更像是一个大型玩具,通过遥控器操控简单的任务,二次开发后的价格将翻倍,而具备一定功能性的机器人通常价格超过50万元,如宇树科技H1人形机器人售价高达65万元。
刘强表示:“如今机器人价格偏高,主要是市场规模有限,成本没有优势。当具身智能突破‘ChatGPT时刻’,大规模向市场推广的时候,人形机器人的价格门槛会降至5万元左右,预计未来两三年内可实现。”宇树科技创始人王兴兴也有类似观点,具身智能的技术突破预计仍需3—4年。
目前,上海正以人形机器人开源为突破口,抢抓产业新赛道。软硬件方面,国地中心开源全国首个全尺寸人形机器人公版机“青龙”,智元开源灵犀X1机器人也开源了全套软硬件图纸和代码。同时,智元会同国地中心、库帕思等企业开源全球首个百万真机实采数据集,数据质量从实验室级上升到工业级标准。
近日,上海智元机器人推出了全球首款全栈开源机器人灵犀X1的整装组件。记者在现场看到,仅需10万元左右,即可实现人人DIY机器人。此外,有了百度视觉多模态大模型等AI技术的加持,灵犀X1机器人不再只是一台玩具,而是“可看可听可理解”世界的具身智能。
如今,DeepSeek带领的全球大模型开源趋势,加速了人形机器人的智能涌现。业内人士预计两三年后,人形机器人将出现“ChatGPT时刻”,基础款价格也将来到5万元区间,具身智能将走进更多家庭。
两天组装一台机器人
浦东新区一栋办公楼内,柳州职业技术大学副教授关来德带着一群学生,比照着图纸,正在搭建一台人形机器人。记者在现场看到,机器人的零件铺满了整张桌子,各种不同尺寸的螺丝都有几十包,更不用提各类关节部件和控制器。
他们搭建的是智元的灵犀X1机器人,个头不大,只有1.3米,裸机重量仅33公斤,但却能完成多种工作。受益于其模块化设计使拆装简便,能适应多种应用场景。全身由两款自研的关节电机组装而成,还配备的自适应夹爪能实现高效精准夹持和定位。
智元灵犀X1机器人。
智元机器人工程师告诉记者,每个人依照说明书都能搭建出灵犀X1,不过耗时较长,两个人需要两天时间才能完成组装、适配、测试等步骤。有意思的是,灵犀X1可以通过游戏手柄来操作控制,也支持编程让机器人解锁更多技能。“我所在的专业就是机器人专业,上海有良好的具身智能的产业链,学生能在这里与最新产品和研究成果接触,加强动手实践能力的同时,也在实操中掌握基础原理,这些都是课本上难以学会的。”关来德表示,学生一旦掌握机器人的工作原理,未来将在巡检、维修等高风险高强度的领域抢占职业先机。
柳州职业技术大学副教授关来德带领学生组装机器人
“我们将具身智能的AGI(通用人工智能)能力分为G1到G5五个阶段,目前正在同步进行G2和G3阶段的工作,也在探索G4阶段。”上海智元机器人渠道销售总监刘强告诉记者,人形机器人目前的能力还非常有限,要想走进家庭,替代保姆、管家甚至护工,需要AGI能力步入G5阶段,可能需要十年之久。
机器人“学徒”需要一对一教学
相隔三公里外的智元数采中心同样是一片繁忙景象,但不同的是,繁忙的不只是人,还有一群机器人。
刚进门,记者就看到五个六机器人同时在学习打包礼物,每个技术员手拿两个操作手柄,任何动作都与机器人双臂连动,远程操作用一根红色丝带给礼盒打上蝴蝶结。看似常人两三秒就能做完的简单动作,机器人却要迟钝不少,至少需要两三分钟才能完成。失误的操作也不少,任何动作出现问题就要重新来过。如果是复合性动作,失误就更多了。在“后厨出餐”场景下,机器人需要端起装有面包和酱料的餐盘,并向前送至橱窗。据现场观察,这一套动作成功率仅50%。
“这里机器人‘认识’世界的地方,技术员操控机器人模拟真实生活中各种动作,这样机器人就能学会怎么叠被子、拉窗帘等生活技能。”刘强介绍,4000平方米的智元数据采集中心,搭建了家居、餐厅、工业、商超、办公五大类场景,包含超过两百个细分场景的任务,平时有1000个左右的机器人在“培训”。每个机器人“学徒”的背后都是技术员的一对一教学,哪怕是一个简单动作都要上百次训练。现场技术员告诉记者,以“后厨出餐”场景为例,一个取餐任务量需要600次,耗时两天时间,而机器人通常需要完成超过1万多个任务。
机器人正在学习后厨出餐。
这些任务最终都会成为训练数据,成为机器人是否聪明的关键所在。据介绍,智元机器人的数采中心每天可以产出数万条训练数据,被称为真机数据。真机数据模拟真实世界环境,可靠性强但成本过高,仅凭真机数据远远不够机器人的训练量,因此仿真环境数据也愈发重要。
“真机数据与仿真环境数据的比例要恰当,不然会导致机器人的交互失真,无法实现预期任务。”刘强介绍,业内通常认为真机与仿真的数据比例控制在1:10以内比较可行,但即便如此,训练数据的积累依然是几乎一笔巨大的投资。目前,智元数采中心的规模和质量在全球范围内都属于第一梯队。
大模型给机器人安装“大脑”
机器人有了躯体和数据,如何蜕变成具身智能,AI大模型的智能涌现,给机器人安装上了“大脑”。
具身智能的关键在于机器人可以感知物理世界并实时交互。大语言模型、多模态模型以及推理模型等AI能力,赋予了机器人听、说、看的功能,并能理解世界,以及拆分任何和逻辑推理等决策能力。如今,大模型的开源趋势,可能加速人形机器人的落地应用。
两个机器人正在学习合作铺床单。
“随着人形机器人从概念验证向规模化应用落地,大模型与智能体技术正在成为产业突破临界点的关键驱动。”百度智能云一见产品部解决方案负责人呼啸表示,百度与智元正围绕具身智能生态解决方案建设、关键技术和产品研发等展开合作,加速推进智能机器人在教育科研、智能制造等场景的落地应用,“相当于百度的视觉多模态大模型给智元旗下的灵犀系列机器人安装了‘眼睛’和‘大脑’。”
更重要的是,智元将灵犀X1定义为全栈开源机器人,使得任何人可以自由地修改、定制和优化灵犀X1的硬件和软件,具身智能可进入“人人造”的时代,每个人都能打造属于自己的机器人。因此,关来德才能在AI实训实验室中自主训练机器人完成物品分拣、环境巡检等高精度任务模型,加速产学研生态构建与成果转化。
据了解,百度智能云与智元机器人将结合远征系列专业数采和交互服务机器人、灵犀全栈开源机器人、全栈数采方案等产品方案的研发布局,共同打造可二次开发的人形机器人平台。
“ChatGPT时刻”就在不远将来
2024年被业内认为是“人形机器人的觉醒之年”,今年国际消费电子展(CES)上,英伟达CEO黄仁勋也表示,人形机器人和通用机器人技术,即将迎来“ChatGPT时刻”。
过去一年,AI大模型与人形机器人的深度耦合,推动具身智能迈向了全球科技竞争的新高地,展现出巨大的市场潜力和发展空间。目前,我国已成为全球领先的人形机器人生产国。中国信息通信研究院发布的《人形机器人产业研究报告》显示,2024年中国人形机器人市场规模达到约27.6亿元,并有望在2030年成长为千亿元市场。高工产业研究院(GGII)也预测,2030年全球人形机器人市场规模将突破200亿美元,其中中国市场占比达四分之一。摩根士丹利发布的全球人形机器人领域上市公司的百强名单,37家中国企业上榜。
虽然人形机器人距离实际应用还有一段距离,但离日常生活已不再是“远在天边”。智元机器人、宇树科技等国内一线机器人厂商均已推出入门级机器人,价格门槛降至10万元左右。比如,智元的灵犀X1机器人官方套件售价为10.8万元,而宇树科技G1人形机器人售价9.9万元,但需要45天后交货。
记者观察到,10万元人形机器人更像是一个大型玩具,通过遥控器操控简单的任务,二次开发后的价格将翻倍,而具备一定功能性的机器人通常价格超过50万元,如宇树科技H1人形机器人售价高达65万元。
刘强表示:“如今机器人价格偏高,主要是市场规模有限,成本没有优势。当具身智能突破‘ChatGPT时刻’,大规模向市场推广的时候,人形机器人的价格门槛会降至5万元左右,预计未来两三年内可实现。”宇树科技创始人王兴兴也有类似观点,具身智能的技术突破预计仍需3—4年。
目前,上海正以人形机器人开源为突破口,抢抓产业新赛道。软硬件方面,国地中心开源全国首个全尺寸人形机器人公版机“青龙”,智元开源灵犀X1机器人也开源了全套软硬件图纸和代码。同时,智元会同国地中心、库帕思等企业开源全球首个百万真机实采数据集,数据质量从实验室级上升到工业级标准。