结合阿里云大数据 AI 平台能力,双方将为企业用户提供从数据预处理、仿真数据生成、模型训练评估、机器人强化学习到仿真测试的全链路平台服务,助力具身智能、辅助驾驶等应用的开发效率提升与周期缩短。
阿里巴巴集团董事兼首席执行官吴泳铭描绘了未来的AI图景。他指出,大模型是下一代操作系统,AI云则是下一代计算机,未来全球可能仅存 5-6 个超级云计算平台。
为抢占先机,阿里巴巴正积极推进 3800 亿的 AI 基础设施建设,并计划持续追加投入。吴泳铭预测,Agent 和机器人的数量将超越全球人口,与人类协同工作并深刻影响真实世界。2032年,阿里云全球数据中心的能耗规模预计将比 2022 年提升10倍。
什么是物理 AI?
通过物理 AI,自主机器能够感知、理解并在现实的物理世界中执行复杂的操作。物理 AI 是指使用运动技能理解现实世界并与之进行交互的模型,它们通常运用在机器人或自动驾驶汽车等自主机器中。
研究员从互联网上收集的大量文本和图像数据来训练生成式 AI 模型,例如 GPT 和 Llama 等大语言模型。物理 AI 通过在 AI 训练过程中提供其他数据来理解三维世界的空间关系和物理行为,这些数据包含与现实世界的空间关系和物理规则有关的信息。
在训练物理 AI 的过程中,强化学习有助于 AI 模型在模拟过程中成功完成所需操作,便于模型不断适应和改进。
借助物理 AI,可以构建和训练机器人与现实世界中的周围环境进行无缝交互并适应各种环境。
物理 AI 或将成为下一个浪潮
英伟达创始人黄仁勋在今年访京时曾提到过,下一波浪潮就是物理AI。“所有的能力都能够融入到我们的物理世界,比如机器人。”
他表示,物理 AI 正在解锁每个行业的新功能,包括:
机器人:借助物理 AI,利用来自机载传感器的直接反馈,仓库中的自主移动机器人 (AMR) 可以在复杂环境中导航,并避开包括人类在内的障碍物。通过学习复杂的任务 (如穿针和执行缝合),手术机器人也可从这种技术中受益,凸显了物理 AI 在训练机器人执行专业任务时的精确性和适应能力。
自动驾驶汽车:自动驾驶可使用传感器感知并理解周围环境,以便在各种环境中做出决策。通过基于物理 AI 对自动驾驶汽车进行训练,能够更准确地检测行人,对交通或天气条件做出响应并自动变换车道,从而有效适应各种意外情况。
智能空间:物理 AI 将增强大型室内空间(如工厂和仓库)的功能性和安全性,这些空间的日常活动涉及稳定的人流、车辆和机器人。
但是,物理 AI 也面临很多新的挑战和难题。评估系统的短板就是一个。
上个月,阿里巴巴就联合多所顶尖研究机构推出 DeepPHY 平台,首次系统性地揭示了当前最先进 AI 视觉模型在物理推理能力上的严重短板。
当前的AI评估体系大多继承了传统的监督学习范式,“输入-输出”的匹配导致了一种“理论陷阱”。使体系在静态问答、交互环境中有很大局限性。
参考资料:
https://www.nvidia.cn/glossary/generative-physical-ai/
https://shengxinai.com/archives/a-li-ba-ba-tui-chu-deepphy-tiao-zhan-aiwu-li-shi-jie-de-zhi-neng-bian-jie