听完了AMD的AI开发者大会,我算清了两笔账! 原创

至顶网

1周前

大会一开场,AMD董事会主席及首席执行官苏姿丰博士(Dr.LisaSu)和零一万物创始人兼CEO李开复博士坐在台上对谈。

上周,我和一个做企业级AI Agent(智能体)的创业者喝咖啡。他最近愁得直挠头,因为好几个大客户的单子都卡在了采购流程上。

他的公司做了一套能自动处理繁杂工单、生成深度分析报告的AI系统。客户业务部门看演示时双眼放光,但一到结账环节,死活推不动。

企业的财务部门拿着放大镜看采购单,扔回两个灵魂拷问。第一,按Token计费的云端API,是个无底洞,明年的预算怎么做?第二,看不见摸不着的纯软件系统,要花大几十万,怎么按“固定资产”入账?

另外,公司的IT部门还在一旁反复强调“核心业务数据绝不能上云”的红线。

“B端客户既要AI的脑子,又不接受昂贵的云端的账单。”他端起咖啡猛灌了一口说,“这简直无解。”

跟他分别后的第二天,也就是5月19号,我来到了 AMD AI开发者大会(AMD AI DevDay 2026)上海站,现场挤满了两千多人。本来我是想去看看在这个大模型狂飙的节点,芯片巨头又要在云端算力上怎么“卷”参数。但几场看下来,我突然反应过来,AI的风向已经悄悄变了。

01  别光盯着GPU硬磕了,AI是个“系统工程”

大会一开场,AMD董事会主席及首席执行官苏姿丰博士(Dr. Lisa Su)和零一万物创始人兼CEO李开复博士坐在台上对谈。让我意外的是,他们聊的重头戏不是算力怎么进一步突破,而是“AI智能体新范式”。

听完了AMD的AI开发者大会,我算清了两笔账!

(AMD董事会主席及首席执行官苏姿丰博士(Dr. Lisa Su)和零一万物创始人兼CEO李开复博士)

过去这两年,整个科技圈都被潜移默化地洗脑,大家都认同一个观点,搞AI嘛,就是拼命堆积GPU。

但是,如今的企业Agent业务流里,AI早就不是过去那种“画个图、写首诗”的简单交互了。现在的智能体需要多步推理、逻辑调度、长文本串行处理。在这个漫长的“思考”过程里,单纯的矩阵乘法(GPU的强项)其实只占了一小部分,剩下高达80%的环节,比如复杂的内存管理、庞大的KV Cache(键值缓存),完全是CPU的舒适区。

也就是说,在真实的企业落地场景里,单靠GPU“单腿蹦”已经行不通了。

顺着这个逻辑,我又去听了AMD高级副总裁、计算与图形总经理Jack Huynh的演讲,他在台上抛出了一个“智能体主机(Agentic AI Engine)”概念,这会儿,我的思路就彻底通透了。

AMD这次其实是在用系统级的“CPU+GPU”双引擎来重构底层骨架。

比如,你要在本地搭建一个极其复杂的AI微调和开发底座,就可以用AMD锐龙Threadripper PRO 9000系列处理器的工作站。我查了一下它的性能,最多支持128条PCIe 5.0通道。这意味着在多并发任务下,它能极其宽裕地给多块GPU和高速NVMe存储喂数据,绝不让系统I/O成为短板。

而如果遇到极其吃内存的本地AI推理任务,用AMD Radeon AI PRO R9700 就能顶上,借助RDNA 4架构和32GB的大显存,原本在普通机器上会直接爆显存的复杂模型,在这里跑得稳稳当当。

02  100 tokens/秒的“端侧黑盒子”,专治IT内耗

不过,机房里的高端工作站解决的是研发问题,真正要发到每个员工手里、部署进企业业务线的,得是更轻量、更集成的设备。

这也是整场大会最让我兴奋的环节,阶跃星辰联合创始人兼CTO朱亦博博士在台上分享了一组实测数据,主角是搭载了 AMD 锐龙 AI Max+系列处理器的智能体主机。

其实,我也见过不少贴着AI标签的高端工作站,但这款智能体主机却把参数推到了一个离谱的地步——至高支持96GB GPU专属显存。

在这台设备上,高达200B参数的大模型(比如Qwen 3.5 122B)不仅能实现原生本地运行,而且解码速度逼近100 tokens/秒。

我在脑子里迅速换算了一下:100 tokens/秒,大概意味着一篇长达千字的业务分析报告,在你端起杯子喝口水的功夫,就能在本地离线生成。

这不就是开篇那个创业朋友的“解药”吗?

不再需要去解释什么是API调用费,不再需要跟IT主管争论数据上云的风险。只需要把复杂的Agent应用全部封装进这台搭载着锐龙 AI Max+ 的黑盒子里,连同硬件一起卖给客户。

对于传统企业来说,这不再是一项难以获批的“软件服务”,而是一台实打实的“智能算力设备”,直接走固定资产采购流程,插上电、连上内网就能干活。

用硬件的形态,蹚过国内软件商业化的深水区。

03  连点成线,生态要做全套

当然,再强悍的硬件,如果没有顺手的软件生态把底层逻辑串起来,充其量也就是个昂贵的“电暖器”。

所以,我也专门去留意了AMD在软件栈上的动作。

AMD的底牌是全面升级的 AMD ROCm软件栈。现在的ROCm早就脱离了只在Linux数据中心里转悠的局限,它真正打通了从本地笔记本、工作站到云端的全路径。

比如,最新的ROCm 7.2版本,就已经能够跨平台支持Windows,不仅可以通过新版PyTorch实现高效部署,还能对最新的 AMD锐龙 AI 400系列处理器提供深度支持。开发者甚至可以直接在ComfyUI里下载调用,对HIPCC编译器和OpenClaw等智能体框架的兼容也做得相当丝滑。

“一次编写,全路径运行。”站在展区,看着一行行代码顺畅跑通时,我意识到这句话的分量。正如AMD高级副总裁、大中华区总裁潘晓明提到的,今年是AMD上海研发中心成立二十周年。二十年的本土研发深耕,加上这次宣布的基于Radeon GPU的免费开发者云,AMD是在用真金白银给中国的AI生态做基建。

听完了AMD的AI开发者大会,我算清了两笔账!

(AMD高级副总裁、大中华区总裁潘晓明)

听完了AMD的AI开发者大会,我算清了两笔账!

(现场展区)

04 写在最后

随着散场的人流走出场馆,外面的天色已经暗了下来,但我心里的那笔账却越算越明白。

过去我们总以为,AI的终局一定在云端,一切终端不过是连向云服务器的屏幕。但真实的商业世界是不按剧本出牌的。数据主权的红线、高昂的按次计费、国内独有的IT采购习惯,正在强力扭转这个趋势。

企业需要的,并非一个改变世界的AI概念,而是一件握在自己手里、成本可控、能立刻落地的干活工具。把部分云端能力回落到边缘侧,把“软能力”封装进“硬盒子”,这条路已经成为当下B端AI商业化的新路径。

而今天,AMD这套从锐龙 AI Max+ 到 ROCm 的全栈端侧底座,无疑已经把铺路最硬的那几块砖,稳稳地递到了开发者手里。

大会一开场,AMD董事会主席及首席执行官苏姿丰博士(Dr.LisaSu)和零一万物创始人兼CEO李开复博士坐在台上对谈。

上周,我和一个做企业级AI Agent(智能体)的创业者喝咖啡。他最近愁得直挠头,因为好几个大客户的单子都卡在了采购流程上。

他的公司做了一套能自动处理繁杂工单、生成深度分析报告的AI系统。客户业务部门看演示时双眼放光,但一到结账环节,死活推不动。

企业的财务部门拿着放大镜看采购单,扔回两个灵魂拷问。第一,按Token计费的云端API,是个无底洞,明年的预算怎么做?第二,看不见摸不着的纯软件系统,要花大几十万,怎么按“固定资产”入账?

另外,公司的IT部门还在一旁反复强调“核心业务数据绝不能上云”的红线。

“B端客户既要AI的脑子,又不接受昂贵的云端的账单。”他端起咖啡猛灌了一口说,“这简直无解。”

跟他分别后的第二天,也就是5月19号,我来到了 AMD AI开发者大会(AMD AI DevDay 2026)上海站,现场挤满了两千多人。本来我是想去看看在这个大模型狂飙的节点,芯片巨头又要在云端算力上怎么“卷”参数。但几场看下来,我突然反应过来,AI的风向已经悄悄变了。

01  别光盯着GPU硬磕了,AI是个“系统工程”

大会一开场,AMD董事会主席及首席执行官苏姿丰博士(Dr. Lisa Su)和零一万物创始人兼CEO李开复博士坐在台上对谈。让我意外的是,他们聊的重头戏不是算力怎么进一步突破,而是“AI智能体新范式”。

听完了AMD的AI开发者大会,我算清了两笔账!

(AMD董事会主席及首席执行官苏姿丰博士(Dr. Lisa Su)和零一万物创始人兼CEO李开复博士)

过去这两年,整个科技圈都被潜移默化地洗脑,大家都认同一个观点,搞AI嘛,就是拼命堆积GPU。

但是,如今的企业Agent业务流里,AI早就不是过去那种“画个图、写首诗”的简单交互了。现在的智能体需要多步推理、逻辑调度、长文本串行处理。在这个漫长的“思考”过程里,单纯的矩阵乘法(GPU的强项)其实只占了一小部分,剩下高达80%的环节,比如复杂的内存管理、庞大的KV Cache(键值缓存),完全是CPU的舒适区。

也就是说,在真实的企业落地场景里,单靠GPU“单腿蹦”已经行不通了。

顺着这个逻辑,我又去听了AMD高级副总裁、计算与图形总经理Jack Huynh的演讲,他在台上抛出了一个“智能体主机(Agentic AI Engine)”概念,这会儿,我的思路就彻底通透了。

AMD这次其实是在用系统级的“CPU+GPU”双引擎来重构底层骨架。

比如,你要在本地搭建一个极其复杂的AI微调和开发底座,就可以用AMD锐龙Threadripper PRO 9000系列处理器的工作站。我查了一下它的性能,最多支持128条PCIe 5.0通道。这意味着在多并发任务下,它能极其宽裕地给多块GPU和高速NVMe存储喂数据,绝不让系统I/O成为短板。

而如果遇到极其吃内存的本地AI推理任务,用AMD Radeon AI PRO R9700 就能顶上,借助RDNA 4架构和32GB的大显存,原本在普通机器上会直接爆显存的复杂模型,在这里跑得稳稳当当。

02  100 tokens/秒的“端侧黑盒子”,专治IT内耗

不过,机房里的高端工作站解决的是研发问题,真正要发到每个员工手里、部署进企业业务线的,得是更轻量、更集成的设备。

这也是整场大会最让我兴奋的环节,阶跃星辰联合创始人兼CTO朱亦博博士在台上分享了一组实测数据,主角是搭载了 AMD 锐龙 AI Max+系列处理器的智能体主机。

其实,我也见过不少贴着AI标签的高端工作站,但这款智能体主机却把参数推到了一个离谱的地步——至高支持96GB GPU专属显存。

在这台设备上,高达200B参数的大模型(比如Qwen 3.5 122B)不仅能实现原生本地运行,而且解码速度逼近100 tokens/秒。

我在脑子里迅速换算了一下:100 tokens/秒,大概意味着一篇长达千字的业务分析报告,在你端起杯子喝口水的功夫,就能在本地离线生成。

这不就是开篇那个创业朋友的“解药”吗?

不再需要去解释什么是API调用费,不再需要跟IT主管争论数据上云的风险。只需要把复杂的Agent应用全部封装进这台搭载着锐龙 AI Max+ 的黑盒子里,连同硬件一起卖给客户。

对于传统企业来说,这不再是一项难以获批的“软件服务”,而是一台实打实的“智能算力设备”,直接走固定资产采购流程,插上电、连上内网就能干活。

用硬件的形态,蹚过国内软件商业化的深水区。

03  连点成线,生态要做全套

当然,再强悍的硬件,如果没有顺手的软件生态把底层逻辑串起来,充其量也就是个昂贵的“电暖器”。

所以,我也专门去留意了AMD在软件栈上的动作。

AMD的底牌是全面升级的 AMD ROCm软件栈。现在的ROCm早就脱离了只在Linux数据中心里转悠的局限,它真正打通了从本地笔记本、工作站到云端的全路径。

比如,最新的ROCm 7.2版本,就已经能够跨平台支持Windows,不仅可以通过新版PyTorch实现高效部署,还能对最新的 AMD锐龙 AI 400系列处理器提供深度支持。开发者甚至可以直接在ComfyUI里下载调用,对HIPCC编译器和OpenClaw等智能体框架的兼容也做得相当丝滑。

“一次编写,全路径运行。”站在展区,看着一行行代码顺畅跑通时,我意识到这句话的分量。正如AMD高级副总裁、大中华区总裁潘晓明提到的,今年是AMD上海研发中心成立二十周年。二十年的本土研发深耕,加上这次宣布的基于Radeon GPU的免费开发者云,AMD是在用真金白银给中国的AI生态做基建。

听完了AMD的AI开发者大会,我算清了两笔账!

(AMD高级副总裁、大中华区总裁潘晓明)

听完了AMD的AI开发者大会,我算清了两笔账!

(现场展区)

04 写在最后

随着散场的人流走出场馆,外面的天色已经暗了下来,但我心里的那笔账却越算越明白。

过去我们总以为,AI的终局一定在云端,一切终端不过是连向云服务器的屏幕。但真实的商业世界是不按剧本出牌的。数据主权的红线、高昂的按次计费、国内独有的IT采购习惯,正在强力扭转这个趋势。

企业需要的,并非一个改变世界的AI概念,而是一件握在自己手里、成本可控、能立刻落地的干活工具。把部分云端能力回落到边缘侧,把“软能力”封装进“硬盒子”,这条路已经成为当下B端AI商业化的新路径。

而今天,AMD这套从锐龙 AI Max+ 到 ROCm 的全栈端侧底座,无疑已经把铺路最硬的那几块砖,稳稳地递到了开发者手里。

展开
打开“财经头条”阅读更多精彩资讯
最新评论

参与讨论

脑控 1周前 脑控,电磁波武器控制大脑,天天光一直头疼难受
APP内打开