吴恩达给出三点建议:
参加人工智能课程
实践构建人工智能系统
(可选)阅读研究论文
他举出几个例子来说明这三点的重要性。例如,开发人员要么重新发明了标准的 RAG 文档分块策略,要么复制了现有的智能体 AI 评估技术,要么最终写出了混乱的 LLM 上下文管理代码。
“如果他们参加过一些相关的课程,就能更好地理解现有的构建模块。他们当然可以从头开始重建这些模块,甚至可能创造出比现有解决方案更优的方案,但他们可以避免数周不必要的工作,” 吴恩达表示。
技术基石跃迁
2025 年 AI 工业化的首要特征,是核心技术获得了可靠且强大的工业级属性。其中最具代表性的突破,是推理模型从一项需要提示(Prompt)的技巧,进化为大型语言模型(LLM)内生的基础能力。
早期,研究者通过指令模型“一步一步思考”(Think step by step)来激发其推理潜能。而到了 2025 年,如 OpenAI 的 o1、DeepSeek 的 R1 等新一代模型,已将复杂的推理流程内化为标准操作。这种转变主要得益于基于强化学习(RL)的精细微调,即通过奖励模型产生正确输出的过程,训练它先“思考”再“回答”。
其带来的性能飞跃是现象级的。例如,OpenAI 的 o1-preview 在竞赛级数学问题(AIME 2024)上的表现,较之前非推理的 GPT-4o 高出 43%;在博士级科学问题(GPQA Diamond)上高出 22%。在编程能力上,它甚至能在 Codeforces 平台上击败 38% 的人类竞技程序员,而 GPT-4o 仅能超越 11%。
推理能力的提升,直接催化了更高级别的 AI 应用形态——智能体(Agents)和机器人——的成熟。当模型学会调用计算器、搜索引擎等外部工具时,其解决问题的能力再上台阶。例如,配备工具的 OpenAI o4-mini 在一项涵盖 100 个领域的多模态理解测试中,准确率提升了 3%以上。
推理模型正在成为自主进化系统和科学研究的核心。例如,AlphaEvolve 项目利用谷歌 Gemini 模型反复生成、评估和修改代码,最终为现实世界问题创造了更高效的算法。
人才与算力决定未来格局
2025 年,AI 顶尖人才的薪酬达到了令人瞠目的水平。这场风波的标志性事件是 Meta 为组建超级智能实验室(Meta Superintelligence Labs)而发起的大规模挖角。
据《华尔街日报》等媒体报道,Meta 为从 OpenAI、谷歌、Anthropic 等公司吸引顶尖研究员,开出了为期四年、总额高达数亿美元的薪酬包,其中包括巨额现金奖金以及为补偿其离开原公司所放弃股权的额外支付。
Meta CEO 马克·扎克伯格甚至亲自上门游说,并成功招揽了 OpenAI 推理模型研究的核心人员 Jason Wei 和 Hyung Won Chung。这场争夺战迅速推高了整个行业的人才价格。
为应对挖角,OpenAI 等公司被迫采取加速股权授予、发放高达 150万美元的留任奖金等反击措施。吴恩达在回顾这一现象时指出,对于计划投资数千亿美元建设数据中心的公司而言,将其中一小部分用于确保最顶尖的人才,是完全理性的商业决策。
工业时代离不开庞大的基础设施。2025 年,AI 算力需求的爆炸式增长,仅一年时间整个 AI 行业的资本支出就超过了 3000亿美元。咨询公司麦肯锡预测,到 2030 年,为满足 AI 训练和推理的算力需求,相关投资总额可能达到 5.2万亿美元。
OpenAI 启动了与甲骨文、软银等合作的“星门”(Stargate)项目,计划投资 5000亿美元,并最终在全球建设高达 20 吉瓦(GW)的数据中心容量;Meta 则在美国路易斯安那州规划了一个耗资 270亿美元、容量 5 吉瓦的超大型数据中心。
这些设施的能源需求堪比中型城市,其建设已不仅是商业行为,更成为影响地区经济发展和全球能源格局的战略性投资。这场基建竞赛表明,AI 的竞争已从算法和模型的软实力层面,全面延伸至资本、能源和土地等硬实力层面。
参考资料:
https://www.deeplearning.ai/the-batch/issue-333/
https://x.com/AndrewYNg
·