下一个10年，黄仁勋押宝什么

财经头条

提升一亿中产阶级阅读效率

打开

下一个10年，黄仁勋押宝什么

中国企业家杂志

14小时前

“未来我们肯定会被机器人包围。”英伟达CEO黄仁勋近日在访谈中回答道。作为《星球大战》的粉丝，黄仁勋很期待拥有一个像电影中R2-D2那样的机器人陪伴自己。

未来我们肯定会被机器人包围。

编译｜吴莹

来源｜Cleo Abram（YouTube）

头图来源｜视觉中国

近日，黄仁勋在参加完CES（国际消费类电子产品展览会）后，接受了记者Cleo Abram的播客采访，在访谈中，两人着重探讨了英伟达技术层面的布局和发展。从GPU到CUDA、从视频游戏到生成式人工智能，黄仁勋被视为最敢“赌”的人，如今，黄仁勋将新的“赌注”下在了物理AI上，在他看来，未来所有移动的东西都会变成机器人，人机交互机器人领域会变得非常有趣。

黄仁勋表示，GPU就像一台时间机器，能让我们更快地看到未来，英伟达在人机交互机器人领域所做的工作才刚刚开始，在时间机器的加速下，他预想的未来很快就能实现。最后，黄仁勋还建议大家尽快找到自己的人工智能导师，未来在超级人工智能的帮助下，每个人都有可能成为“超人”。

以下是对话的精彩观点：

1.GPU就像一台时间机器，它能让你更快地看到未来。

2.在我们追求的所有事物中，首先必须有核心信念，从第一性原理出发进行推理，如果这些原理不变，假设不变，那么你也没有理由改变你的核心信念。

3.过去10年是关于人工智能基础科学的发展，而未来10年主要发展的是人工智能应用科学。

4.有一天，所有移动的东西都会变成机器人，而且很快就会实现。

5.我们相信创新和发明的丰富性，我们希望创造一种架构，让发明者、创新者、软件程序员和人工智能研究人员都能在其中畅游，并提出一些令人惊叹的想法。

6.下一个10年，人工智能在某些事情上可以帮助我们成为“超人”。

以下是访谈全文（有删改）：

为什么GPU是一台时光机器

主持人：要谈论人工智能的这个重要时刻，我们首先需要回到20世纪90年代的视频游戏发展历程。当时的游戏开发者想要创建更逼真的图形，但硬件无法满足计算需求，这时英伟达提出的解决方案不仅能解决这个难题，还能改变计算本身。能带我们回顾一下当时的场景吗？是什么让你和英伟达团队创造出了第一个现代GPU？

黄仁勋：在我创办英伟达时就观察到，在软件程序中，可能10%的代码就能完成99%的计算处理工作，而且这99%的计算处理可以同步完成，剩余90%的代码运行必须按顺序完成。事实证明，完美的计算机是能够执行顺序处理和并行处理的计算机，而不仅仅是其中的一种。基于这个观察结果，我们计划创建一家公司，去解决普通计算机无法解决的问题，这就是英伟达的由来。

主持人：英伟达为视频游戏解锁了新功能，为什么会选择先为游戏行业服务呢？

黄仁勋：首先，我们很喜欢当时那个游戏程序，它构建了一个虚拟世界，令人向往。其次，我们观察到视频游戏很有发展前景，将来会成为最大的娱乐市场，事实证明我们的判断是对的。广阔的市场非常重要，因为这项技术非常复杂，只有足够大的市场才能让我们有信心投入足够多的研发预算，有机会去创造这项新技术。正是技术和市场之间的相互满足，使得英伟达能成为世界上最重要的技术公司之一，这一切都归功于视频游戏。

主持人：我听你说过GPU是一台时光机器？这是什么意思？

黄仁勋：GPU就像一台时间机器，它能让你更快地看到未来。曾经有一位量子化学科学家对我说：“Jensen，因为有英伟达的技术，我可以在有生之年完成自己的事业。”这就是时间旅行。因为我们能让应用程序运行得更快，让他在有限的时间里做更多工作，缩短了看到未来的时间。例如，当你进行天气预报时，你会看到未来，当你模拟自动驾驶汽车穿过虚拟城市时，我们实际上就是在进行时间旅行。

主持人：所以并行处理在游戏中开始流行，它让我们能够在计算机中创造一个新世界，我们看到了英伟达技术在游戏行业释放出的能量，今天，这种能量席卷了各行各业。你们也很早就意识到了这一点，在21世纪初期就推出了CUDA平台，允许程序员使用编程语言来指挥GPU怎么做，让更多人都能用上新技术。你能解释一下是什么促使你们创建了CUDA吗？

黄仁勋：有部分原因是研究人员发现了它，还有部分是工作过程中产生的灵感。使用我们的GPU进行并行处理的第一个外部想法源自医学成像领域的一些有趣工作，麻省总医院的几位研究人员用它来做CT重建。他们出于这个原因使用我们的图形处理器，这给了我们启发。与此同时，我们公司内部试图解决的问题是，当你尝试为游戏创建虚拟世界时，你希望它既美丽又充满活力，水要有流动感，爆炸要有爆炸的样子，所以你想要做的是粒子物理学，是流体动力学，如果你的芯片只能处理计算机图形，那么就达不到你想要的这些效果。因此研究人员也在尝试用我们的GPU进行通用加速。当时机成熟时，我们就决定创办CUDA。从根本上讲，我确信CUDA会成功，我们的GPU将成为世界上产量最高的并行处理器。因为视频游戏市场非常大，所以这种架构能惠及更多人。

主持人：2012年，由三名研究人员组成的团队在比赛中提交了一份特别的参赛作品，其目标是创建能够识别图像并对其进行分类的计算机系统，这份作品完全碾压了竞争对手。它就是AlexNet，是一种称为神经网络的人工智能。我的理解是，它如此出色的原因之一是使用了大量数据来训练该系统，并且他们借助了英伟达的GPU来实现这个目标。自此，GPU不再只是让计算机运行更快的一种助力，它们正在成为一种全新计算方式的引擎。2012年的这一刻真正开启了我们现在所见的人工智能的重大转变时刻，能从你的角度描述一下那一刻的感受吗？这对我们所有人的未来意味着什么？

黄仁勋：悲观者的观点是就算你创造一些新的东西时，比如CUDA，也不会带来什么，但乐观者想的却是如果不去创造新的东西，变革就来不了，这也是我看待世界的视角。事实上，2012年，那3位研究人员在实验室里接触到了GeForce GTX 580，他们了解到CUDA可以用作训练AlexNet。我们也受到启发，认为GeForce可以成为将这种并行架构推向世界的工具，这是一种基于希望的策略，当然也是合理的希望。

我们当时正试图在公司内部解决计算机视觉问题，并尝试让CUDA成为一款优秀的计算机视觉处理器，但我们在计算机视觉方面的早期开发并没有让我们看到希望，后来我们看到了AlexNet，这种新算法与之前的计算机视觉算法完全不同，让计算机视觉能力有了巨大的飞跃。所以我们之所以能发现GPU的新用法，一方面是出于兴趣，另一方面也是我们早就在这个问题上苦苦挣扎，现在新的机会出现了，我们很乐意看到它发挥作用。

不过当我们看到AlexNet时，我们问过自己，AlexNet能走多远？如果能用计算机视觉来实现这一点，它能走多远？如果它能达到我们认为的极限，能够解决各种问题，这对计算机行业意味着什么？这对计算机架构意味着什么？我们推断，如果机器学习、深度学习架构可以扩展，那么绝大多数机器学习问题都可以用深度神经网络来标识。我们可以用机器学习解决的问题类型如此之多，它有可能重塑整个计算机行业，这个发现促使我们重新设计整个计算堆栈。

主持人：并行处理重塑了现代游戏，彻底改变了整个行业，然后并行处理的计算方式开始被不同的行业使用。你通过构建CUDA来进行投资，然后CUDA和GPU的使用可以实现神经网络和机器学习的重大改变，并开启一场越来越重要的革命。

黄仁勋：突然间，计算机视觉问题解决了、语音识别问题解决了，语言理解问题也解决了。这些与智能相关的问题一个接一个被解决，而我们过去一直没有找到解决方案，真是令人难以置信。

主持人：所以在2012年你展望未来时，意味着你是在下赌注，在我这个外行人看来，你下的赌注不小，或许需要10年才能实现目标，那在这10年里你是什么感受？

黄仁勋：大概和如今的感受一样。对我来说，总会出现一些问题，总会有一些理由让我们感到不耐烦，也总会有一些理由支撑着我们继续前进。所以在我们追求的所有事物中，首先必须有核心信念，从第一性原理出发进行推理，如果这些原理不变，假设不变，那么你也没有理由改变你的核心信念。一路上总会有一些证据在告诉你正在朝着正确的方向前进。如果你走了很长时间都没有遇到成功的证据，那可能就需要微调一下线路。

为什么我们能长期如此坚定地走下去，答案其实恰恰相反：没有理由不坚定，30多年来我一直相信英伟达，每天都在这里工作，我没有理由改变我的信仰体系，我从根本上相信我们在计算机革命方面所做的工作，我们会坚持下去。

当然，一路上会遇到很多非常艰难的时刻，当你疯狂投资某样东西时往往得不到外界的认可，投资人或许更想你只保留利润，用以提高股价或其他用途，但我们自己必须有坚定的信念，相信未来，坚定投资。在CUDA真正成功之前，我们已经投资了数百亿美元，这真是漫长的10年，但一路上很有趣。

未来我们会被机器人包围

主持人：您如何总结这些核心信念？您对于计算机应该如何工作以及它能为我们做什么有着怎样的看法？

黄仁勋：第一个核心信念是关于加速计算。我们将CPU与GPU结合起来用就是加速计算，我至今仍然相信这一点。第二个是认识到这些深度学习网络，它们能够从大量不同类型的数据中学习模式和关系。如果网络规模更大，它就能越学越深，因此该架构的可扩展性在经验上是正确的。如果是这样的话，那限制在哪里？除非有物理极限、架构极限或数学极限，否则理论上讲可以不断扩展。那么问题来了：你能从数据中学到什么？你能从经验中学到什么？数据基本上是人类经验的数字化版本，那么你能学到什么呢？显然可以从图像中学习物体识别，只要听声音就是在学习说话，可以通过文字学习语言、词汇、句法、语法等。所以我们现在已经证明了人工智能或深度学习有能力学习任何形式的数据，并且可以转化为任何形式的数据。这意味着机器学习可以完成文本生成、文本翻译、图像生成，甚至将来可以把蛋白质结构转化为文字。从计算机的角度来看，深度学习网络打开了这个充满机遇的世界，有很多新问题等着我们去解决，这让我们非常兴奋。

主持人：感觉我们正处于这一真正巨大变革的边缘地带。当我思考未来10年时，我无法预测将如何使用目前正在开发的技术。

黄仁勋：你之所以有这种感觉，是因为过去10年是关于人工智能基础科学的发展，而未来10年主要发展的是人工智能应用科学。人工智能的应用方面现在变成：如何将人工智能应用于数字生物学？如何将人工智能应用于气候技术？如何将人工智能应用于农业、渔业、机器人技术、交通运输等。

主持人：刚才我们谈论了很多，我对机器人特别感兴趣，包括人形机器人、自动驾驶汽车、智能建筑、自动割草机器人等，据我所知，我们可能会看到所有这些机器人的能力产生质的飞跃，因为我们正在改变训练它们的方式。我们现在可能正处于机器人大爆炸的时刻，英伟达正在构建工具来实现这一目标——Omniverse（英伟达开发的虚拟现实与仿真平台）和Cosmos（世界基础模型）。你作为一个从小就喜欢《星际迷航》和艾萨克·阿西莫夫作品的人，可以谈谈我们如何从现在的机器人走向您所看到的机器人未来世界？

黄仁勋：我用ChatGPT来类比Omniverse和Cosmos，帮助大家理解我们在做什么。首先，当ChatGPT首次推出时，它是非凡的，它能够从你的提示中生成文本。但随着使用频率上升，它开始应付不过来，有时甚至会编造内容，也就是它会产生幻觉。不久之后，新一代技术就能够根据上下文进行调节，你可以上传PDF，作为它的事实基础，让它可以查找搜索并推理产生你需要的答案。

第一部分就是生成式人工智能，第二部分是为了优化人工智能而补充的基本事实。我们再回来看Omniverse和Cosmos。我们需要一个基础模型，就像ChatGPT本身有一个核心基础模型，这是让机器人能够智能地了解物理世界的关键。机器人必须理解重力、摩擦力、惯性等物理事实，这些物理常识必须被编码到世界基础模型中，以便机器人和人工智能拥有世界常识，这就是我们在Cosmos上做的事情，它是一个世界基础模型。我们要做的第二件事是必须将其与事实联系起来。因此我们在Omniverse中去模拟物理世界中的各种行为动作，以此来增强机器人解决现实问题的能力。Omniverse是一个模拟器，用来模拟或调节机器人的行为，它们都是基于物理事实进行的训练，就像给ChatGPT上传的PDF文件一样。我们可以产生无限多的有趣的东西，回答一大堆有趣的问题，将Omniverse和Cosmos结合起来，我们就能够高效地训练机器人，帮助它们更快掌握解决问题的能力。

主持人：如果你把这个设想延展至10年，你认为在不久的将来人们如何与这项技术进行实际互动？

黄仁勋：有一天，所有移动的东西都会变成机器人，而且很快就会实现。推着割草机走的想法已经很过时了，尽管有人是因为好玩才这么做，但真没必要。未来所有移动的东西都将是机器人，它们会在Omniverse中学习如何成为最智能的机器人。未来我们肯定会被机器人包围，我对拥有自己的R2-D2（《星球大战》电影中的机器人）十分期待。当然，R2-D2不会像罐子一样到处滚动，它可能有不同的物理形态，有时它在我的智能眼镜里，有时在我的手机里，有时在我的电脑里，不管怎么说它会一直陪着我。

主持人：当前我们处于一个令人难以置信的时代，我们不再受到CPU和顺序处理的技术限制，不仅开辟了一种新的计算方法，还开辟了一条持续改进的道路。我很好奇，你有没有思考过当前我们面对的技术限制是什么？

黄仁勋：一切都取决于你在有限的精力内能完成多少工作，这是物理极限，做这些事所需的能量限制了我们能做的事情。不过，我们并没有遇到阻碍我们前进的根本限制。与此同时，我们也在寻求制造更好、更节能的计算机。2016年，我们给OpenAI交付了一台人工智能超级计算机，大概25万美元，今年我们推出一款新的计算机，计算能效提高了1万倍。短短8年时间，我们就把计算机的能效提高了1万倍，想象一下，如果其他东西的能源效率也能大幅提高，比如汽车、电灯等等，那我们的日常生活将发生多么翻天覆地的变化。因此，要想突破这一阶段的限制，提高能源使用效率是我们优先要考虑和解决的问题。

英伟达下一个赌注

主持人：你已经展示了通过CUDA提高可访问性和抽象性的价值，并允许更多人以各种其他方式使用更多计算能力。随着技术的应用越来越具体，我正在考虑人工智能中的Transformer模型，这是一个非常流行的人工智能结构，如今应用也很广泛。我比较好奇，你如何看待通用大模型和专用大模型，你会愿意制造一款专门针对一种AI模型的芯片吗？你倾向于创造一辆可以去任何地方的汽车，还是优化一列从A到B的火车呢？

黄仁勋：现在又回到了之前的那个问题，你的核心信念是什么？Transformer是任何研究人员都会再次发现的一种人工智能架构。在我看来，或许几年后，人们就不再提起Transformer这个概念了。因为你回顾历史，在计算机算法的世界、在软件的世界、在工程和创新的世界，有哪个想法和概念能一直活跃在台前？答案是否定的。这就是计算机的本质之美，它今天能做到10年前没人能想象的事情。我们相信创新和发明的丰富性，我们希望创造一种架构，让发明者、创新者、软件程序员和人工智能研究人员都能在其中畅游，并提出一些令人惊叹的想法。

自Transformer概念提出以来，已发明的不同类型的注意力机制数量非常多，所以我认为这种趋势还会继续下去，计算机科学还没有结束，人工智能研究还没有停止，拥有一台能够灵活地研究、创新和实践新想法的计算机才是最重要的。

主持人：你是一个对未来下大赌注的人，而且你一次又一次赌对了，你现在下的赌注是什么？

黄仁勋：我在CES（国际消费类电子产品展览会）上阐述了我的最新赌注，我很兴奋，Omniverse和Cosmos的融合让我们有了新型的生成世界系统。我认为这对于机器人和物理系统的未来至关重要。当然，我们在人机交互机器人方面所做的工作，包括开发工具系统、培训系统和人类演示系统等都还只是刚刚开始。未来5年人机交互机器人领域会非常有趣。我们在数字生物学领域所做的工作是为了让我们能够理解分子和细胞的语言，就像我们理解物理的语言和物理世界一样，我们希望了解人体的语言和生物的语言，这样我们就有机会拥有人类的数字孪生了。

我们正在研究的这些事情真的很酷，很幸运创造了这种时间机器，我们刚才谈到的所有这些领域都需要时间机器，这样我们才能更快地看到未来。如果我们能够看到未来，能够预测未来，就有机会让未来成为最好的版本。我们尝试设计的一切，就是为了能够优化出最好的版本。

主持人：可能有观众知道英伟达这家公司，但不太了解英伟达如何影响他们的生活，如果他们想展望一下未来，你会建议他们如何准备或思考当前所处的时刻，这些工具实际上会如何影响他们的生活？

黄仁勋：有几种方法可以去推理我们将要面对的变化。比如，假设你所做的工作仍然很重要，但你需要付出的时间由一开始的一周变成瞬间就可完成，那你就有了更多时间可以做其他事。这和国家突然有了高速公路所发生的变化非常相似。

在上一次工业革命中，我们突然有了州际公路，带来的变化是郊区快速发展起来了，商品分配的时间和距离不再是问题，高速公路上突然冒出了很多加油站、快餐店和汽车旅馆，突然之间就出现了新经济和新工作。

再比如视频会议让我们无需见面就能工作，我们的生活发生了什么变化？出差变少了，工作地和居住地更远些也没关系。未来如果我们每个人身边都有一个“程序员”，无论我想到什么，它们都能为我写出代码，我的想法可以很轻松变为现实展现在我眼前，这对我们的生活和职业发展有多么大的助力。

下一个10年，人工智能在某些事情上可以帮助我们成为“超人”。我可以告诉你那是什么感觉，我的身边围绕着世界上最优秀的一群人，他们非常聪明，很多事情做得比我好得多，我每天都感受到了满满的信心和力量，有他们的支持，我有信心和精力去解决更多问题。假设未来每个人身边都被超级人工智能包围，那么他们将更有信心学习新东西，几乎任何特定领域的知识，学习障碍都减少了。

我想鼓励大家立即为自己寻找一位人工智能导师，这位导师可以教你喜欢的东西，帮助你学习编程、写作，帮助你分析、思考、推理和进步，未来我们会成为“超人”，不是因为我们有超能力，而是因为我们有超级人工智能。