听完了AMD的AI开发者大会，我算清了两笔账！原创

财经头条

提升一亿中产阶级阅读效率

打开

至顶网

1周前

大会一开场，AMD董事会主席及首席执行官苏姿丰博士（Dr.LisaSu）和零一万物创始人兼CEO李开复博士坐在台上对谈。

上周，我和一个做企业级AI Agent（智能体）的创业者喝咖啡。他最近愁得直挠头，因为好几个大客户的单子都卡在了采购流程上。

他的公司做了一套能自动处理繁杂工单、生成深度分析报告的AI系统。客户业务部门看演示时双眼放光，但一到结账环节，死活推不动。

企业的财务部门拿着放大镜看采购单，扔回两个灵魂拷问。第一，按Token计费的云端API，是个无底洞，明年的预算怎么做？第二，看不见摸不着的纯软件系统，要花大几十万，怎么按“固定资产”入账？

另外，公司的IT部门还在一旁反复强调“核心业务数据绝不能上云”的红线。

“B端客户既要AI的脑子，又不接受昂贵的云端的账单。”他端起咖啡猛灌了一口说，“这简直无解。”

跟他分别后的第二天，也就是5月19号，我来到了 AMD AI开发者大会（AMD AI DevDay 2026）上海站，现场挤满了两千多人。本来我是想去看看在这个大模型狂飙的节点，芯片巨头又要在云端算力上怎么“卷”参数。但几场看下来，我突然反应过来，AI的风向已经悄悄变了。

01 别光盯着GPU硬磕了，AI是个“系统工程”

大会一开场，AMD董事会主席及首席执行官苏姿丰博士（Dr. Lisa Su）和零一万物创始人兼CEO李开复博士坐在台上对谈。让我意外的是，他们聊的重头戏不是算力怎么进一步突破，而是“AI智能体新范式”。

听完了AMD的AI开发者大会，我算清了两笔账！

（AMD董事会主席及首席执行官苏姿丰博士（Dr. Lisa Su）和零一万物创始人兼CEO李开复博士）

过去这两年，整个科技圈都被潜移默化地洗脑，大家都认同一个观点，搞AI嘛，就是拼命堆积GPU。

但是，如今的企业Agent业务流里，AI早就不是过去那种“画个图、写首诗”的简单交互了。现在的智能体需要多步推理、逻辑调度、长文本串行处理。在这个漫长的“思考”过程里，单纯的矩阵乘法（GPU的强项）其实只占了一小部分，剩下高达80%的环节，比如复杂的内存管理、庞大的KV Cache（键值缓存），完全是CPU的舒适区。

也就是说，在真实的企业落地场景里，单靠GPU“单腿蹦”已经行不通了。

顺着这个逻辑，我又去听了AMD高级副总裁、计算与图形总经理Jack Huynh的演讲，他在台上抛出了一个“智能体主机（Agentic AI Engine）”概念，这会儿，我的思路就彻底通透了。

AMD这次其实是在用系统级的“CPU+GPU”双引擎来重构底层骨架。

比如，你要在本地搭建一个极其复杂的AI微调和开发底座，就可以用AMD锐龙Threadripper PRO 9000系列处理器的工作站。我查了一下它的性能，最多支持128条PCIe 5.0通道。这意味着在多并发任务下，它能极其宽裕地给多块GPU和高速NVMe存储喂数据，绝不让系统I/O成为短板。

而如果遇到极其吃内存的本地AI推理任务，用AMD Radeon AI PRO R9700 就能顶上，借助RDNA 4架构和32GB的大显存，原本在普通机器上会直接爆显存的复杂模型，在这里跑得稳稳当当。

02 100 tokens/秒的“端侧黑盒子”，专治IT内耗

不过，机房里的高端工作站解决的是研发问题，真正要发到每个员工手里、部署进企业业务线的，得是更轻量、更集成的设备。

这也是整场大会最让我兴奋的环节，阶跃星辰联合创始人兼CTO朱亦博博士在台上分享了一组实测数据，主角是搭载了 AMD 锐龙 AI Max+系列处理器的智能体主机。

其实，我也见过不少贴着AI标签的高端工作站，但这款智能体主机却把参数推到了一个离谱的地步——至高支持96GB GPU专属显存。

在这台设备上，高达200B参数的大模型（比如Qwen 3.5 122B）不仅能实现原生本地运行，而且解码速度逼近100 tokens/秒。

我在脑子里迅速换算了一下：100 tokens/秒，大概意味着一篇长达千字的业务分析报告，在你端起杯子喝口水的功夫，就能在本地离线生成。

这不就是开篇那个创业朋友的“解药”吗？

不再需要去解释什么是API调用费，不再需要跟IT主管争论数据上云的风险。只需要把复杂的Agent应用全部封装进这台搭载着锐龙 AI Max+ 的黑盒子里，连同硬件一起卖给客户。

对于传统企业来说，这不再是一项难以获批的“软件服务”，而是一台实打实的“智能算力设备”，直接走固定资产采购流程，插上电、连上内网就能干活。

用硬件的形态，蹚过国内软件商业化的深水区。

03 连点成线，生态要做全套

当然，再强悍的硬件，如果没有顺手的软件生态把底层逻辑串起来，充其量也就是个昂贵的“电暖器”。

所以，我也专门去留意了AMD在软件栈上的动作。

AMD的底牌是全面升级的 AMD ROCm软件栈。现在的ROCm早就脱离了只在Linux数据中心里转悠的局限，它真正打通了从本地笔记本、工作站到云端的全路径。

比如，最新的ROCm 7.2版本，就已经能够跨平台支持Windows，不仅可以通过新版PyTorch实现高效部署，还能对最新的 AMD锐龙 AI 400系列处理器提供深度支持。开发者甚至可以直接在ComfyUI里下载调用，对HIPCC编译器和OpenClaw等智能体框架的兼容也做得相当丝滑。

“一次编写，全路径运行。”站在展区，看着一行行代码顺畅跑通时，我意识到这句话的分量。正如AMD高级副总裁、大中华区总裁潘晓明提到的，今年是AMD上海研发中心成立二十周年。二十年的本土研发深耕，加上这次宣布的基于Radeon GPU的免费开发者云，AMD是在用真金白银给中国的AI生态做基建。

听完了AMD的AI开发者大会，我算清了两笔账！

（AMD高级副总裁、大中华区总裁潘晓明）

听完了AMD的AI开发者大会，我算清了两笔账！

（现场展区）

04 写在最后

随着散场的人流走出场馆，外面的天色已经暗了下来，但我心里的那笔账却越算越明白。

过去我们总以为，AI的终局一定在云端，一切终端不过是连向云服务器的屏幕。但真实的商业世界是不按剧本出牌的。数据主权的红线、高昂的按次计费、国内独有的IT采购习惯，正在强力扭转这个趋势。

企业需要的，并非一个改变世界的AI概念，而是一件握在自己手里、成本可控、能立刻落地的干活工具。把部分云端能力回落到边缘侧，把“软能力”封装进“硬盒子”，这条路已经成为当下B端AI商业化的新路径。

而今天，AMD这套从锐龙 AI Max+ 到 ROCm 的全栈端侧底座，无疑已经把铺路最硬的那几块砖，稳稳地递到了开发者手里。

大会一开场，AMD董事会主席及首席执行官苏姿丰博士（Dr.LisaSu）和零一万物创始人兼CEO李开复博士坐在台上对谈。

上周，我和一个做企业级AI Agent（智能体）的创业者喝咖啡。他最近愁得直挠头，因为好几个大客户的单子都卡在了采购流程上。

他的公司做了一套能自动处理繁杂工单、生成深度分析报告的AI系统。客户业务部门看演示时双眼放光，但一到结账环节，死活推不动。

另外，公司的IT部门还在一旁反复强调“核心业务数据绝不能上云”的红线。

“B端客户既要AI的脑子，又不接受昂贵的云端的账单。”他端起咖啡猛灌了一口说，“这简直无解。”

01 别光盯着GPU硬磕了，AI是个“系统工程”

听完了AMD的AI开发者大会，我算清了两笔账！

（AMD董事会主席及首席执行官苏姿丰博士（Dr. Lisa Su）和零一万物创始人兼CEO李开复博士）

过去这两年，整个科技圈都被潜移默化地洗脑，大家都认同一个观点，搞AI嘛，就是拼命堆积GPU。

也就是说，在真实的企业落地场景里，单靠GPU“单腿蹦”已经行不通了。

AMD这次其实是在用系统级的“CPU+GPU”双引擎来重构底层骨架。

02 100 tokens/秒的“端侧黑盒子”，专治IT内耗

不过，机房里的高端工作站解决的是研发问题，真正要发到每个员工手里、部署进企业业务线的，得是更轻量、更集成的设备。

其实，我也见过不少贴着AI标签的高端工作站，但这款智能体主机却把参数推到了一个离谱的地步——至高支持96GB GPU专属显存。

在这台设备上，高达200B参数的大模型（比如Qwen 3.5 122B）不仅能实现原生本地运行，而且解码速度逼近100 tokens/秒。

我在脑子里迅速换算了一下：100 tokens/秒，大概意味着一篇长达千字的业务分析报告，在你端起杯子喝口水的功夫，就能在本地离线生成。

这不就是开篇那个创业朋友的“解药”吗？

用硬件的形态，蹚过国内软件商业化的深水区。

03 连点成线，生态要做全套

当然，再强悍的硬件，如果没有顺手的软件生态把底层逻辑串起来，充其量也就是个昂贵的“电暖器”。

所以，我也专门去留意了AMD在软件栈上的动作。

AMD的底牌是全面升级的 AMD ROCm软件栈。现在的ROCm早就脱离了只在Linux数据中心里转悠的局限，它真正打通了从本地笔记本、工作站到云端的全路径。

听完了AMD的AI开发者大会，我算清了两笔账！

（AMD高级副总裁、大中华区总裁潘晓明）

听完了AMD的AI开发者大会，我算清了两笔账！

（现场展区）

04 写在最后

随着散场的人流走出场馆，外面的天色已经暗了下来，但我心里的那笔账却越算越明白。

而今天，AMD这套从锐龙 AI Max+ 到 ROCm 的全栈端侧底座，无疑已经把铺路最硬的那几块砖，稳稳地递到了开发者手里。

展开

打开“财经头条”阅读更多精彩资讯