光大证券:英伟达(NVDA.US)Cosmos模型或将开启机器人物理AI时代

智通财经

8小时前

智通财经APP获悉,光大证券发表研报称,目前人形机器人的平衡、运动能力普遍达到较为成熟的水平,制约行业进一步放量的核心因素在于训练,特别是实现进一步能力泛化的训练。

智通财经APP获悉,光大证券发表研报称,目前人形机器人的平衡、运动能力普遍达到较为成熟的水平,制约行业进一步放量的核心因素在于训练,特别是实现进一步能力泛化的训练。泛化能力的训练依赖于大量的真实世界数据,直接通过人类演示获取这些数据成本高昂,且高质量的机器人运动素材较为稀缺。英伟达(NVDA.US)Cosmos模型可帮助开发者生成指数级规模的合成运动数据,或将开启机器人物理AI时代。

事件:

北京时间2025年1月7-10日,CES 2025于美国拉斯维加斯举办,英伟达CEO黄仁勋进行开幕主题演讲,机器人方面的要点主要包括:

1)推出名为Cosmos的生成式世界基础模型开发平台(World Foundation Model),推出“物理人工智能”(Pysical AI)概念,可生成高质量合成数据,用于训练机器人和自动驾驶系统;

2)率领14款人形机器人亮相,包括银河通用G1、星动纪元Star1、智元机器人远征A2、傅里叶通用机器人GR-2、小鹏的Iron机器人等。

点评:

通常物理AI模型的开发成本很高,需要大量的真实世界数据和测试。英伟达推出Cosmos模型,可以根据文本、图像和视频等输入组合以及机器人传感器或运动数据生成基于物理学的视频。这些模型可实现基于物理学的交互、物体恒存性以及生成高质量的仿真工业环境(例如仓库或工厂)和驾驶环境(包括各种路况),使得机器人在模拟环境中能够更加真实地模拟物体的运动和相互作用,且Cosmos模型能与Omniverse协作,开发人员能更便捷地生成大量可控且逼真的合成数据,生成符合物理规律的虚拟世界,构建Pysical AI机器人系统,可训练机器人和自动驾驶,比传统数据收集方法更具性价比。

Cosmos有三款:1)Nano(约15B,超低延迟的实时模型,适合边缘端设备部署)、2)Super(34B,高性能基线模型,支持开箱即用的微调与部署)、Ultra(约70B,准确度和质量最高,适合大规模数据中心场景),这些模型接受了18000万亿次tokens的训练,包括2000万小时的真实世界自动驾驶、机器人、无人机镜头和合成数据,通过训练让AI理解物理世界。目前,已有银河通用、1X、Agility Robotics、FigureAI、小鹏、Uber等公司率先开始了试用。

风险分析:技术落地缓慢的风险、需求不及预期的风险、人形机器人产业化进度不及预期的风险。

智通财经APP获悉,光大证券发表研报称,目前人形机器人的平衡、运动能力普遍达到较为成熟的水平,制约行业进一步放量的核心因素在于训练,特别是实现进一步能力泛化的训练。

智通财经APP获悉,光大证券发表研报称,目前人形机器人的平衡、运动能力普遍达到较为成熟的水平,制约行业进一步放量的核心因素在于训练,特别是实现进一步能力泛化的训练。泛化能力的训练依赖于大量的真实世界数据,直接通过人类演示获取这些数据成本高昂,且高质量的机器人运动素材较为稀缺。英伟达(NVDA.US)Cosmos模型可帮助开发者生成指数级规模的合成运动数据,或将开启机器人物理AI时代。

事件:

北京时间2025年1月7-10日,CES 2025于美国拉斯维加斯举办,英伟达CEO黄仁勋进行开幕主题演讲,机器人方面的要点主要包括:

1)推出名为Cosmos的生成式世界基础模型开发平台(World Foundation Model),推出“物理人工智能”(Pysical AI)概念,可生成高质量合成数据,用于训练机器人和自动驾驶系统;

2)率领14款人形机器人亮相,包括银河通用G1、星动纪元Star1、智元机器人远征A2、傅里叶通用机器人GR-2、小鹏的Iron机器人等。

点评:

通常物理AI模型的开发成本很高,需要大量的真实世界数据和测试。英伟达推出Cosmos模型,可以根据文本、图像和视频等输入组合以及机器人传感器或运动数据生成基于物理学的视频。这些模型可实现基于物理学的交互、物体恒存性以及生成高质量的仿真工业环境(例如仓库或工厂)和驾驶环境(包括各种路况),使得机器人在模拟环境中能够更加真实地模拟物体的运动和相互作用,且Cosmos模型能与Omniverse协作,开发人员能更便捷地生成大量可控且逼真的合成数据,生成符合物理规律的虚拟世界,构建Pysical AI机器人系统,可训练机器人和自动驾驶,比传统数据收集方法更具性价比。

Cosmos有三款:1)Nano(约15B,超低延迟的实时模型,适合边缘端设备部署)、2)Super(34B,高性能基线模型,支持开箱即用的微调与部署)、Ultra(约70B,准确度和质量最高,适合大规模数据中心场景),这些模型接受了18000万亿次tokens的训练,包括2000万小时的真实世界自动驾驶、机器人、无人机镜头和合成数据,通过训练让AI理解物理世界。目前,已有银河通用、1X、Agility Robotics、FigureAI、小鹏、Uber等公司率先开始了试用。

风险分析:技术落地缓慢的风险、需求不及预期的风险、人形机器人产业化进度不及预期的风险。

展开
打开“财经头条”阅读更多精彩资讯
APP内打开