12天12场，OpenAI又放超级大招！

财经头条

提升一亿中产阶级阅读效率

打开

财经早餐

龙龙

2周前

OpenAI又搞大事儿了！

周四，OpenAI官宣，从北京时间周五凌晨2点开始，将在未来的12天进行12场直播，你没看错，每个工作日都会进行一次直播，称将发布一些“大大小小的新东西”。

一下子就把市场的【期待值】拉满了，受此影响，AI相关多只个股再次持续大涨！

OpenAI满血版o1，究竟多强？

北京时间12月6日凌晨，第一场直播来了，首批王炸震撼来袭：OpenAI发布了“满血版”推理模型o1。

此前9月份，OpenAI发布o1-preview版本时，就曾对o1的技术思路进行过介绍：o1是使用大规模“强化学习”训练并使用“思维链”进行推理的系列模型。

据研究人员NoamBrown当时发布的社交内容，即使是当时已经公开的o1版本（非满血版o1），不但具有了奥数金牌潜在能力，在物理、生物、化学问题的基准测试中，更是直接超过了人类博士水平！

在美国数学邀请赛（AIME2024，国际数学奥林匹克竞赛（IMO）的资格考试，旨在测试美国最聪明高中数学学生的考试）中，GPT-4o只解决13%的问题，而o1推理模型得分高达83%，在Codeforces编程竞赛中，它的表现更进入了前89%的队列！

从2022年11月底，OpenAI发布ChatGPT3.5正式展现出“涌现”效果，到2023年3月15日推出GPT-4，9月24日推出具备多模态能力的GPT-4V，再到2024年5月14日推出GPT-4o，9月13日公开具备更强的推理能力的OpenAI o1-preview、o1-mini。

OpenAI大模型迭代至今，市场其实一直对o1满血版抱有高期待。

之前非满血版都那么强，现在“满血版”推理模型o1终于来了，能强到啥地步？

据介绍，o1“满血版”是世界上最智能的模型，比o1-preview更智能、更快速、功能更多（例如多模态），现已在ChatGPT中上线，即将在API中推出。

OpenAI著名研究科学家Noam Brown发帖表示，o1完全体不仅能数出【strawberry】里有几个【r】（此前的模型经常在这一问题上栽跟头），还能更进一步，写出“一篇不使用字母e的关于草莓的三段短文”（GPT-4o也尝试了这个任务，但第一个词就失败了）。

整体而言，o1满血版是一款更擅长编程、数学和写作的更快且更强大的推理模型。

OpenAI表示，OpenAI o1的思维更加简洁，因此响应时间比o1-preview更快。测试表明，o1的性能也优于o1-preview，将困难的现实问题的重大错误减少了34%。

此外，如果你升级到ChatGPT Pro，还可以体验到o1 pro模式，这是o1的一个更高级版本，与o1和o1-preview相比，o1 pro模式在数学、科学和编码等ML基准测试中表现更佳。特别是，更容易反映日常编程查询的编码竞赛题中，错误率降低了75%。

OpenAI推出世界最贵大模型，

持续烧钱困境的“解药”？

除发布“满血版”o1外，OpenAI还推出了新的订阅套餐——ChatGPT Pro，可无限制地访问OpenAI的所有模型，包括其o1推理模型的完整版本，但价格可不算便宜——每月200美元（约1440元人民币/月）。

OpenAI技术人员表示：ChatGPT Pro的受众将是ChatGPT的高级用户，他们已经在数学、编程和写作等任务上将模型的能力推向极限。与大多数AI不同，o1和其他推理模型可以有效地进行自我事实检查，这有助于它们避免一些通常会使模型出错的陷阱。

为啥OpenAI要推出这么贵的订阅服务？或与其持续的“烧钱困境”有关。

众所周知，AI大模型创业，一直是一场“烧钱”的游戏，因为前期需要非常高昂的大模型训练成本，需要购买GPU&算力，服务器，数据等、以及巨额的运营成本、人工成本等。

据The information报道，OpenAI目前的年收入大约为34亿美元，而在人工智能训练和人员配备上预计消耗85亿美元，今年可能会血亏50亿美元。

具体来看，大模型的训练耗资巨大，需要巨额的算力与人力成本投入，OpenAI的成本主要分成推理成本、训练成本和人工成本三个部分。

推理成本，主要是租用微软服务器的支出，据悉日常仅仅为了维持ChatGPT的使用就需要70万美元/天，一年的推理成本总计接近40亿美元。

除此以外，训练成本主要用于支付数据费用，预计为30亿美元。人力成本方面，据OpenAI官网上的招聘岗位测算，每年公司要花费约15亿美元在这些高级AI人才身上。

OpenAI预计未来几年模型训练的计算成本可能还会大幅上升，对此，据The Information报道，OpenAI2026年的亏损将达到140亿美元，是今年预期亏损的三倍，OpenAI要到2029年才能盈利。

后面期待啥？

12天12场，目前只进行了第一场，后面还能期待啥。

据国泰君安研报，用户对OpenAI的视频生成、视频对话等功能期待较高。

OpenAI的文生视频模型Sora于今年2月16日首次公开，体现出高一致性、长达分钟级的视频时长等优势，但一直未见正式发布，OpenAI前首席技术官Mira在3月份的访谈中称Sora最快今年内开放公测。

此外，OpenAI还于5月14日对外公开其开发的高级语音功能和视频对话功能，7月31日开始向一小部分ChatGPTPlus用户推出高级语音模式，9月开始推广给所有付费用户，但视频通话功能一直未见实装。

此外，据网友猜测，GPT-4o模型被锁定的图像生成功能受关注，其早期演示效果出色且有视频分析能力；ChatGPT高级语音模式有望接入互联网实时搜索及连接摄像头分析现实世界；甚至有网友幻想看到o2模型或GPT-5o的预览，还有文本转语音工具和“操作员”AI代理框架虽预期明年发布，但也可能在未来两周亮相。

再一个，OpenAI还可能给ChatGPT语音模式增加“圣诞老人”语音，有用户发现语音模式按钮可变为雪花形状。

总体上来说，国泰君安表示，市场对OpenAI此次持续12天的活动有较高预期，或将突破AI领域上限，之前透露而未上线的功能如文生视频、视频通话，以及大模型的迭代完善都将成为关注重点。

2025年将是Agent元年

AI智能体进入“群体协作”时代

近段时间，AI Agent（AI助手）备受热捧。

前有国内智谱AI智能体AutoGLM刷屏出圈，此外微软、苹果、华为、小米等国内外头部厂商也正争先推出AI助手相关产品，OpenAI首个AI助手（Agent）产品也或将于明年1月发布。

最新消息，红杉合伙人Konstantine Buhler在近期接受了Bloomberg独家采访时强调：AI的当前热点是“智能体”，预计2025年及以后，AI智能体将从单一智能体发展到“群体协作”的模式，即多个代理组成网络，彼此协作甚至对抗，完成更复杂的任务。

此外他还指出，医疗和教育等关键领域将成为AI技术的下一个重要战场，有潜力降低成本、提高效率，从而推动社会进步。

一会儿问答大模型，一会儿01推理大模型，一会儿AI Agent，是不是经常搞得人很迷糊？它们之间到底啥关系？

最近看到一个智谱对AI的分级，分享给大家，供大家参考：

一级LLM模型，主要具有语言能力，开启了chatbot、AI搜索等应用涌现。

二级AI具有人类水准的问题求解能力，比如openAI的o1模型，可求解复杂的逻辑推理问题。

三级AI可以使用工具，系统可以执行动作，完成多数人类物理世界问题。目前的AI Agent已初步具备三级AI能力。

大家对OpenAI12天12场“新品发布会”怎么看？对200美元/月的高级会员怎么看？对AI助手怎么看，欢迎评论区讨论交流呀~

免责声明（上下滑动查看全部）

任何在本文出现的信息（包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等）均只作为参考，投资人须对任何自主决定的投资行为负责。另，本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议，亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险，过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正，但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。