英伟达和黄仁勋的下一个目标:机器人

阿尔法工场研究院

3周前

英伟达的机器人技术栈也需要实现类似的目标,但由于在物理空间中应用AI更具挑战性,因此要让普通人也能使用这一技术,难度也随之增加。

导语:如果英伟达想要在科技界的顶尖地位得以长久保持,黄仁勋就需要让机器人市场足够庞大。


穿着他标志性的黑色皮夹克,黄仁勋(Jensen Huang)伸开双臂,示意站在他身旁的类人机器人,台下的观众报以热烈的掌声。“差不多是我的身高,”他在2024年6月的台北国际电脑展(Computex 2024)舞台上开玩笑道。

“机器人时代来了,物理AI时代来了,这不是科幻电影。”他说道。然而,尽管黄仁勋如此宣告,站在舞台上的机器人却并非真正的类人机器人,而是一些类似送货机器人的轮式设备,它们仅仅在大屏幕上呈现出类人机器人的形态。

机器人是黄仁勋(Jensen Huang)未来愿景的重要组成部分,这一愿景也得到了包括埃隆·马斯克(Elon Musk)在内的其他科技巨头的认同。除了在台北国际电脑展(Computex)上的展示外,类人机器人还在英伟达最近的两次财报电话会议中被提及。

大多数分析师认为,英伟达未来几年的命运几乎已经注定。图形处理单元(GPU)的需求推动了英伟达市值飙升,最高曾一度突破3万亿美元。然而,半导体行业的竞争异常激烈。英伟达87%的收入来源于数据中心,而数据中心的投资往往是周期性的,既有高潮也有低谷。因此,英伟达亟需开辟另一个大市场。

在台北国际电脑展上,黄仁勋表示,未来将有两款“高产量”的机器人产品。第一个是自动驾驶汽车,第二个很可能就是类人机器人。随着机器学习技术的进步,这些技术正在不断融合。

这两种机器都需要具有人类般的感知能力,能够应对快速变化的环境,并在几乎没有容错的情况下做出即时反应。它们还都需要巨量的计算能力,而这正是黄仁勋(Jensen Huang)所提供的:AI计算力。然而,目前机器人技术在英伟达的收入中只占很小一部分,而且要让这一市场快速增长,绝非单纯依靠时间的推移。

如果英伟达想要在科技界的顶尖地位得以长久保持,黄仁勋就需要让机器人市场足够庞大。虽然英伟达过去几年的成功故事充满了卓越的工程技术、前瞻性眼光和精准的时机把握,但要将机器人从概念推向现实,面临的挑战可能比以往任何时候都要艰巨。

那么,英伟达如何才能实现机器人愿景呢?

人工智能无疑为机器人技术开辟了巨大的发展空间,但要让机器人技术大规模应用,必须让这一领域的工程技术和构建过程变得更加易于获取和实现。这意味着英伟达不仅要提供强大的计算平台,还需要推动机器人技术的普及和简化,使其能够进入更多的行业并应用到实际场景中。

“机器人AI是最复杂的,因为大语言模型只是软件,而机器人既是机械工程问题,又是软件问题,还是物理学问题。这要复杂得多,”数据中心运营商DataBank的CEO Raul Martynek说道。

目前从事机器人技术的多数人都是机器人领域的专家,他们通常拥有博士学位,因为这项工作要求如此。十年前,语言基础AI领域的情况也类似。然而,随着基础模型和支持它们的计算资源变得广泛可用,今天,构建AI应用不再需要博士学位。

如今,层层的软件和庞大的语言与图像库被设计用来提升用户粘性,降低入门门槛,让几乎任何人都能开发和使用AI技术。这种趋势大大推动了AI应用的普及,并使得更多的开发者能够参与到这一领域中,推动技术的不断创新和应用场景的拓展。

英伟达的机器人技术栈也需要实现类似的目标,但由于在物理空间中应用AI更具挑战性,因此要让普通人也能使用这一技术,难度也随之增加。

英伟达的机器人技术栈相对复杂,需要一定的学习和适应。它由众多平台、库和工具组成,名称繁多,让人有些眼花缭乱。

其中,Omniverse 是一个仿真平台,提供了一个虚拟世界,开发者可以在其中定制并测试机器人的仿真效果。而 Isaac 则是英伟达在Omniverse基础上构建的“训练场”。

通过Isaac,开发者可以将机器人放入一个虚拟环境中,并让其练习各种任务。这一套系统旨在帮助开发者为机器人创建和优化操作情境,进而提高机器人的工作效率和适应能力。

尽管这些平台为开发者提供了强大的工具,但要让这些技术变得更易用、便于非专业人士使用,依然面临许多挑战。

Jetson Thor 是英伟达为机器人提供动力的芯片,而 Project Groot 则是公司称之为“月球计划”的一项雄心勃勃的项目,旨在打造类人机器人所需的基础模型。今年7月,英伟达还推出了一项合成数据生成服务,并推出了 Osmo,这一软件层将所有技术整合在一起。

黄仁勋常说,类人机器人更容易构建,因为世界已经为人类打造好了。

他在台北国际电脑展(Computex)上表示:“世界上最容易适应的机器人就是类人机器人,因为我们已经为人类建造了这个世界。”他还补充道:“我们拥有相同的身体结构,所以有更多的数据来训练这些机器人。”

黄仁勋的观点反映了类人机器人设计中的一个关键优势——人类世界的设计本身就为类人机器人提供了更自然的适应性。例如,现有的建筑、家具、交通工具等都是基于人类的需求和身形设计的,这使得类人机器人在这些环境中的应用变得相对简单。

收集有关我们如何移动的数据仍然需要时间、努力和资金。例如,特斯拉正在支付每小时48美元的报酬,让人们穿上特殊的套装执行任务,以训练其类人机器人——Optimus。

“这一直是机器人技术中最大的难题——需要多少数据才能让这些基础模型理解世界并进行调整,”曾在苹果、谷歌和微软工作的AI专家Sophia Velastegui说道。

尽管如此,分析师们看到了其中的潜力。研究公司William Blair的分析师最近表示:“英伟达在机器人技术和数字双胞胎(通过Omniverse)方面的能力,具有扩展为庞大商业的潜力。”分析师们还表示,他们预计英伟达的汽车业务将在2027年前实现年均20%的增长。

英伟达宣布,宝马(BMW)正在使用 Isaac 和 Omniverse 来训练工厂机器人。

波士顿动力(Boston Dynamics)、比亚迪电子(BYD Electronics)、Figure、Intrinsic、西门子(Siemens)和特拉达因机器人(Teradyne Robotics)等公司也在使用英伟达的技术栈,来构建机器人手臂、类人机器人以及其他类型的机器人。

然而,三位机器人领域的专家在接受BI采访时表示,迄今为止,英伟达在降低普通开发者进入机器人领域的门槛方面,未能像在语言和图像AI领域那样取得类似的成功。竞争对手正试图在英伟达主导机器人技术之前,抢先打造出理想的机器人技术栈。

英伟达的一位发言人通过电子邮件对BI表示:“我们认识到,开发能够与物理世界互动的AI是极具挑战性的,这也是我们开发一个完整平台,帮助企业训练和部署机器人。”

今年7月,英伟达推出了一个类人机器人开发者计划。成功提交申请的开发者将可以访问该公司提供的所有工具。

英伟达无法单打独斗

Ashish Kapoor 深知机器人领域仍然面临巨大的发展空间。Kapoor曾在微软(Microsoft)机器人研究部门工作17年,并在此期间帮助开发了 AirSim,一个计算机视觉仿真平台,该平台于2017年推出,并于去年停用。

随着AirSim的关闭,Kapoor决定创建自己的平台。去年,他成立了 Scaled Foundations,并推出了 Grid,一个为有志成为机器人开发者的人设计的机器人开发平台。

通过Grid,Kapoor希望为更多的开发者提供一个更易接入、更具灵活性的工具和资源,助力机器人技术的创新和应用普及。

Kapoor表示,没有任何一家公司能够单独解决机器人技术中的那些棘手问题。

“在我看来,AI领域的实际解决方案是由社区共同努力实现的,”Kapoor说道。“那时候,真正的突破发生了,现在机器人领域也需要这种合作。”

Kapoor指出,目前看起来,所有致力于类人机器人开发的公司似乎各自为战。然而,机器人初创公司倒闭的现象并非没有原因。“机器人进入真实世界场景后,常常表现得不够好。客户在它们还没有改进之前就放弃了它们。”

这种情况让Kapoor深感忧虑,他认为,只有通过开放合作,汇聚各方力量,才能真正推动机器人技术的发展,并解决当前技术面临的种种挑战。

“常开的玩笑是,每个机器人背后都有一支由10人组成的团队在试图让它运行,”Kapoor说道。

Grid 提供了免费版本和一个托管服务版本,后者提供更多的帮助。Scaled Foundations 正在构建自己的机器人基础模型,但同时也鼓励用户自己开发基础模型。

英伟达的部分机器人技术栈是开源的。黄仁勋常常表示,英伟达正在与全球所有的机器人和AI公司合作,但一些开发者担心,英伟达这个庞然大物可能会先保护自己的成功,而把对整个生态系统的支持放在第二位。

这种担忧反映了英伟达在推动技术创新的同时,可能面临的一种“控制力”问题。虽然开源和合作看似是推动整个行业发展的关键,但开发者仍担心英伟达可能优先确保自身利益,影响到生态系统中其他参与者的平等竞争。

“他们在做苹果效应。对我来说,他们是在尽可能把你锁进自己的生态系统,”计算机视觉公司 EveryPoint 的首席开发者倡导者 Jonathan Stephens 说道。

对此,英伟达的一位发言人向BI表示,这种看法并不准确。公司表示:“我们与机器人和类人开发者生态系统中的大多数领先企业进行合作,帮助他们更快地部署机器人。我们的成功来源于这个生态系统。”

然而,Scaled Foundations 和英伟达并不是唯一致力于构建机器人基础模型的公司。Skild AI 在7月筹集了3亿美元,用于打造自己的机器人基础模型版本。

什么造就了类人机器人?

仿真器是通向类人机器人之路的一个重要环节,但它们并不一定能够实现人类般的感知能力。

在台北国际电脑展(Computex)上,黄仁勋描述了一款机器人手臂时表示,英伟达提供了“计算机、加速层以及预训练的AI模型”,这些都是将AI机器人投入AI工厂所必需的。

大规模使用机器人手臂在工厂中的目标已经存在了几十年。自1961年起,机器人手臂就开始参与汽车生产。但黄仁勋谈论的却是AI机器人——一种智能机器人。

与此不同的是,用于制造汽车的机器人手臂大多并不具备智能。它们通常是被编程来执行重复的任务,并且依赖传感器而非摄像头来进行“视觉”感知。

这些手臂虽然高效,但缺乏自主决策和复杂任务的能力。而类人机器人则需要具备更复杂的感知、理解和决策能力,这才是它们区别于传统工业机器人的关键所在。

一款支持AI的机器人手臂将能够处理多样化的任务——拾取不同的物品,并将它们放置到不同的地方,确保物品不被损坏,甚至可能在移动中完成这些操作。

它们需要具备感知物体和护栏的能力,并能够按合理的顺序进行操作。然而,类人机器人与即使是最有用的非类人机器人相比,依然有着巨大的差距。一些机器人专家怀疑,类人机器人是否真的是一个值得追求的目标。

“一点也不乐观,”一位曾在英伟达从事机器人领域工作的专家表示,他在该领域已有超过15年的经验,并因保护行业关系要求匿名。“制造一个类人机器人并让它具备多功能的成本,肯定会比制造一个外形不像人类且只会做单一任务但能够快速高效完成任务的机器人要高。”

然而,黄仁勋对此却全力投入。他坚信,类人机器人代表着未来的方向,不仅是技术的挑战,更是英伟达在AI领域全面布局的关键一步。

“我认为黄仁勋对机器人有一种执着,最终,他想做的是创造未来,”Martynek说道。

自动驾驶汽车和机器人技术是英伟达未来战略的重要组成部分。公司向BI表示,他们预计,未来一切都将实现自主化,从机器人手臂和车辆开始,最终扩展到建筑乃至整个城市。

“我在苹果(Apple)工作时,我们开发了iPad,它的灵感来自《星际迷航》和其他电影中的未来世界,”Velastegui说道,并补充道,“机器人技术激发了我们的想象力。”

这番话反映了机器人技术不仅仅是工程问题,更是一次技术与科幻梦想的结合。它触动了人类对未来的无限憧憬和探索,成为当今科技行业中的一大前沿。(BI)

英伟达的机器人技术栈也需要实现类似的目标,但由于在物理空间中应用AI更具挑战性,因此要让普通人也能使用这一技术,难度也随之增加。

导语:如果英伟达想要在科技界的顶尖地位得以长久保持,黄仁勋就需要让机器人市场足够庞大。


穿着他标志性的黑色皮夹克,黄仁勋(Jensen Huang)伸开双臂,示意站在他身旁的类人机器人,台下的观众报以热烈的掌声。“差不多是我的身高,”他在2024年6月的台北国际电脑展(Computex 2024)舞台上开玩笑道。

“机器人时代来了,物理AI时代来了,这不是科幻电影。”他说道。然而,尽管黄仁勋如此宣告,站在舞台上的机器人却并非真正的类人机器人,而是一些类似送货机器人的轮式设备,它们仅仅在大屏幕上呈现出类人机器人的形态。

机器人是黄仁勋(Jensen Huang)未来愿景的重要组成部分,这一愿景也得到了包括埃隆·马斯克(Elon Musk)在内的其他科技巨头的认同。除了在台北国际电脑展(Computex)上的展示外,类人机器人还在英伟达最近的两次财报电话会议中被提及。

大多数分析师认为,英伟达未来几年的命运几乎已经注定。图形处理单元(GPU)的需求推动了英伟达市值飙升,最高曾一度突破3万亿美元。然而,半导体行业的竞争异常激烈。英伟达87%的收入来源于数据中心,而数据中心的投资往往是周期性的,既有高潮也有低谷。因此,英伟达亟需开辟另一个大市场。

在台北国际电脑展上,黄仁勋表示,未来将有两款“高产量”的机器人产品。第一个是自动驾驶汽车,第二个很可能就是类人机器人。随着机器学习技术的进步,这些技术正在不断融合。

这两种机器都需要具有人类般的感知能力,能够应对快速变化的环境,并在几乎没有容错的情况下做出即时反应。它们还都需要巨量的计算能力,而这正是黄仁勋(Jensen Huang)所提供的:AI计算力。然而,目前机器人技术在英伟达的收入中只占很小一部分,而且要让这一市场快速增长,绝非单纯依靠时间的推移。

如果英伟达想要在科技界的顶尖地位得以长久保持,黄仁勋就需要让机器人市场足够庞大。虽然英伟达过去几年的成功故事充满了卓越的工程技术、前瞻性眼光和精准的时机把握,但要将机器人从概念推向现实,面临的挑战可能比以往任何时候都要艰巨。

那么,英伟达如何才能实现机器人愿景呢?

人工智能无疑为机器人技术开辟了巨大的发展空间,但要让机器人技术大规模应用,必须让这一领域的工程技术和构建过程变得更加易于获取和实现。这意味着英伟达不仅要提供强大的计算平台,还需要推动机器人技术的普及和简化,使其能够进入更多的行业并应用到实际场景中。

“机器人AI是最复杂的,因为大语言模型只是软件,而机器人既是机械工程问题,又是软件问题,还是物理学问题。这要复杂得多,”数据中心运营商DataBank的CEO Raul Martynek说道。

目前从事机器人技术的多数人都是机器人领域的专家,他们通常拥有博士学位,因为这项工作要求如此。十年前,语言基础AI领域的情况也类似。然而,随着基础模型和支持它们的计算资源变得广泛可用,今天,构建AI应用不再需要博士学位。

如今,层层的软件和庞大的语言与图像库被设计用来提升用户粘性,降低入门门槛,让几乎任何人都能开发和使用AI技术。这种趋势大大推动了AI应用的普及,并使得更多的开发者能够参与到这一领域中,推动技术的不断创新和应用场景的拓展。

英伟达的机器人技术栈也需要实现类似的目标,但由于在物理空间中应用AI更具挑战性,因此要让普通人也能使用这一技术,难度也随之增加。

英伟达的机器人技术栈相对复杂,需要一定的学习和适应。它由众多平台、库和工具组成,名称繁多,让人有些眼花缭乱。

其中,Omniverse 是一个仿真平台,提供了一个虚拟世界,开发者可以在其中定制并测试机器人的仿真效果。而 Isaac 则是英伟达在Omniverse基础上构建的“训练场”。

通过Isaac,开发者可以将机器人放入一个虚拟环境中,并让其练习各种任务。这一套系统旨在帮助开发者为机器人创建和优化操作情境,进而提高机器人的工作效率和适应能力。

尽管这些平台为开发者提供了强大的工具,但要让这些技术变得更易用、便于非专业人士使用,依然面临许多挑战。

Jetson Thor 是英伟达为机器人提供动力的芯片,而 Project Groot 则是公司称之为“月球计划”的一项雄心勃勃的项目,旨在打造类人机器人所需的基础模型。今年7月,英伟达还推出了一项合成数据生成服务,并推出了 Osmo,这一软件层将所有技术整合在一起。

黄仁勋常说,类人机器人更容易构建,因为世界已经为人类打造好了。

他在台北国际电脑展(Computex)上表示:“世界上最容易适应的机器人就是类人机器人,因为我们已经为人类建造了这个世界。”他还补充道:“我们拥有相同的身体结构,所以有更多的数据来训练这些机器人。”

黄仁勋的观点反映了类人机器人设计中的一个关键优势——人类世界的设计本身就为类人机器人提供了更自然的适应性。例如,现有的建筑、家具、交通工具等都是基于人类的需求和身形设计的,这使得类人机器人在这些环境中的应用变得相对简单。

收集有关我们如何移动的数据仍然需要时间、努力和资金。例如,特斯拉正在支付每小时48美元的报酬,让人们穿上特殊的套装执行任务,以训练其类人机器人——Optimus。

“这一直是机器人技术中最大的难题——需要多少数据才能让这些基础模型理解世界并进行调整,”曾在苹果、谷歌和微软工作的AI专家Sophia Velastegui说道。

尽管如此,分析师们看到了其中的潜力。研究公司William Blair的分析师最近表示:“英伟达在机器人技术和数字双胞胎(通过Omniverse)方面的能力,具有扩展为庞大商业的潜力。”分析师们还表示,他们预计英伟达的汽车业务将在2027年前实现年均20%的增长。

英伟达宣布,宝马(BMW)正在使用 Isaac 和 Omniverse 来训练工厂机器人。

波士顿动力(Boston Dynamics)、比亚迪电子(BYD Electronics)、Figure、Intrinsic、西门子(Siemens)和特拉达因机器人(Teradyne Robotics)等公司也在使用英伟达的技术栈,来构建机器人手臂、类人机器人以及其他类型的机器人。

然而,三位机器人领域的专家在接受BI采访时表示,迄今为止,英伟达在降低普通开发者进入机器人领域的门槛方面,未能像在语言和图像AI领域那样取得类似的成功。竞争对手正试图在英伟达主导机器人技术之前,抢先打造出理想的机器人技术栈。

英伟达的一位发言人通过电子邮件对BI表示:“我们认识到,开发能够与物理世界互动的AI是极具挑战性的,这也是我们开发一个完整平台,帮助企业训练和部署机器人。”

今年7月,英伟达推出了一个类人机器人开发者计划。成功提交申请的开发者将可以访问该公司提供的所有工具。

英伟达无法单打独斗

Ashish Kapoor 深知机器人领域仍然面临巨大的发展空间。Kapoor曾在微软(Microsoft)机器人研究部门工作17年,并在此期间帮助开发了 AirSim,一个计算机视觉仿真平台,该平台于2017年推出,并于去年停用。

随着AirSim的关闭,Kapoor决定创建自己的平台。去年,他成立了 Scaled Foundations,并推出了 Grid,一个为有志成为机器人开发者的人设计的机器人开发平台。

通过Grid,Kapoor希望为更多的开发者提供一个更易接入、更具灵活性的工具和资源,助力机器人技术的创新和应用普及。

Kapoor表示,没有任何一家公司能够单独解决机器人技术中的那些棘手问题。

“在我看来,AI领域的实际解决方案是由社区共同努力实现的,”Kapoor说道。“那时候,真正的突破发生了,现在机器人领域也需要这种合作。”

Kapoor指出,目前看起来,所有致力于类人机器人开发的公司似乎各自为战。然而,机器人初创公司倒闭的现象并非没有原因。“机器人进入真实世界场景后,常常表现得不够好。客户在它们还没有改进之前就放弃了它们。”

这种情况让Kapoor深感忧虑,他认为,只有通过开放合作,汇聚各方力量,才能真正推动机器人技术的发展,并解决当前技术面临的种种挑战。

“常开的玩笑是,每个机器人背后都有一支由10人组成的团队在试图让它运行,”Kapoor说道。

Grid 提供了免费版本和一个托管服务版本,后者提供更多的帮助。Scaled Foundations 正在构建自己的机器人基础模型,但同时也鼓励用户自己开发基础模型。

英伟达的部分机器人技术栈是开源的。黄仁勋常常表示,英伟达正在与全球所有的机器人和AI公司合作,但一些开发者担心,英伟达这个庞然大物可能会先保护自己的成功,而把对整个生态系统的支持放在第二位。

这种担忧反映了英伟达在推动技术创新的同时,可能面临的一种“控制力”问题。虽然开源和合作看似是推动整个行业发展的关键,但开发者仍担心英伟达可能优先确保自身利益,影响到生态系统中其他参与者的平等竞争。

“他们在做苹果效应。对我来说,他们是在尽可能把你锁进自己的生态系统,”计算机视觉公司 EveryPoint 的首席开发者倡导者 Jonathan Stephens 说道。

对此,英伟达的一位发言人向BI表示,这种看法并不准确。公司表示:“我们与机器人和类人开发者生态系统中的大多数领先企业进行合作,帮助他们更快地部署机器人。我们的成功来源于这个生态系统。”

然而,Scaled Foundations 和英伟达并不是唯一致力于构建机器人基础模型的公司。Skild AI 在7月筹集了3亿美元,用于打造自己的机器人基础模型版本。

什么造就了类人机器人?

仿真器是通向类人机器人之路的一个重要环节,但它们并不一定能够实现人类般的感知能力。

在台北国际电脑展(Computex)上,黄仁勋描述了一款机器人手臂时表示,英伟达提供了“计算机、加速层以及预训练的AI模型”,这些都是将AI机器人投入AI工厂所必需的。

大规模使用机器人手臂在工厂中的目标已经存在了几十年。自1961年起,机器人手臂就开始参与汽车生产。但黄仁勋谈论的却是AI机器人——一种智能机器人。

与此不同的是,用于制造汽车的机器人手臂大多并不具备智能。它们通常是被编程来执行重复的任务,并且依赖传感器而非摄像头来进行“视觉”感知。

这些手臂虽然高效,但缺乏自主决策和复杂任务的能力。而类人机器人则需要具备更复杂的感知、理解和决策能力,这才是它们区别于传统工业机器人的关键所在。

一款支持AI的机器人手臂将能够处理多样化的任务——拾取不同的物品,并将它们放置到不同的地方,确保物品不被损坏,甚至可能在移动中完成这些操作。

它们需要具备感知物体和护栏的能力,并能够按合理的顺序进行操作。然而,类人机器人与即使是最有用的非类人机器人相比,依然有着巨大的差距。一些机器人专家怀疑,类人机器人是否真的是一个值得追求的目标。

“一点也不乐观,”一位曾在英伟达从事机器人领域工作的专家表示,他在该领域已有超过15年的经验,并因保护行业关系要求匿名。“制造一个类人机器人并让它具备多功能的成本,肯定会比制造一个外形不像人类且只会做单一任务但能够快速高效完成任务的机器人要高。”

然而,黄仁勋对此却全力投入。他坚信,类人机器人代表着未来的方向,不仅是技术的挑战,更是英伟达在AI领域全面布局的关键一步。

“我认为黄仁勋对机器人有一种执着,最终,他想做的是创造未来,”Martynek说道。

自动驾驶汽车和机器人技术是英伟达未来战略的重要组成部分。公司向BI表示,他们预计,未来一切都将实现自主化,从机器人手臂和车辆开始,最终扩展到建筑乃至整个城市。

“我在苹果(Apple)工作时,我们开发了iPad,它的灵感来自《星际迷航》和其他电影中的未来世界,”Velastegui说道,并补充道,“机器人技术激发了我们的想象力。”

这番话反映了机器人技术不仅仅是工程问题,更是一次技术与科幻梦想的结合。它触动了人类对未来的无限憧憬和探索,成为当今科技行业中的一大前沿。(BI)

展开
打开“财经头条”阅读更多精彩资讯
APP内打开