大模型,全面爆发的前夜?

财经早餐

3周前

1月9日,伴随着A股2026年第一个交易周收官,沪指站稳4100点,全A成交额再度放大,突破3万亿元大关,为2025年10月以来首次突破3万亿元关口。而人工智能应用板块,更是迎来了一波爆发!
一家新股,带动一个版块?
就在当日,AI应用方向反复活跃,引力传媒5天4板,易点天下、科德教育涨超10%,博瑞传播、蓝色光标、省广集团涨幅居前。整个人工智能概念板块一度有60只股票涨停或涨幅超过10%。
分析人士认为,MiniMax今日在港股上市并翻倍,可能是引爆人工智能应用的主要原因。有券商表示,日益丰富的AI Infra工具、逐步成熟的数据治理,以及应用厂商不断试错迭代,2026年将看到AI渗透到产业的多个环节,并形成收入。
成立仅4年的MiniMax(稀宇科技)以每股165港元的定价上限正式挂牌上市。午后,该股股价突破300港元/股,最终涨幅超过109%,市值也随之突破千亿港元。
受此带动,A股AI应用板块亦于今日大爆发。整个板块有8只股票20%涨停。整个人工智能概念股共有60只股票涨停或涨幅超10%。科创AI ETF一度大涨超3%。
分析人士认为,MiniMax上市是AI应用爆发的主要原因。有券商指出,大模型技术路径在2024年下半年后有所收敛,竞争或从“寻找正确路径”转向“在主流路径上卷效率”。OpenAI、谷歌Gemini、Anthropic已有可观收入,聊天机器人+AI编程已跑通,AI视频、B端企业软件以及垂类场景逐渐成熟;国内模型开始主导开源生态,能力相较海外模型有差距但不远。
而MiniMax是全球领先的、国内少数在多模态及C端应用上同时跑通的大模型公司。作为成立于2021年的创业公司,其优势来自组织效率、人才优势及数据闭环。
MiniMax证明了其有全球领先的技术创新和领先的能力。MiniMax M2模型MoE+Full Attention(在Linear Attention基础上调优)+强制交错思考,技术能力及模型能力突出。MiniMax M2创新采用强制交错思考,可以避免一次性长思考造成无效Token消耗,强制交错思考后被谷歌等模型借鉴。
百舸争流的大模型
和MiniMax深耕上海相对应的,是智谱在北京的大放异彩!
继此前发布全球首个会操作手机的AI智能体模型AutoGLM后,近日,总部位于清华科技园的智谱公司宣布将AutoGLM开源。这意味着,全球硬件厂商、手机厂商和开发者今后都能基于AutoGLM,在手机等设备或系统中复现一个能看懂屏幕,还能模拟真人进行点击、输入等操作,从而替人类办事的AI助手。
1月8日,在MiniMax上市的前一天,智谱公司在港股上市,成为全球首家以通用人工智能基座模型为核心业务的上市公司。
2019年,智谱由清华大学孵化成立。彼时,大模型在国内还乏人问津,这个初创团队却在寸土寸金的中关村五道口获得了几个月免租金的办公场地,迈出发展第一步。“
北京在人工智能领域的发展全国领先,智谱的快速成长正是得益于北京在人才、科研资源与政策支持等方面的综合优势。”智谱董事长刘德兵表示。几年来,该团队原创提出了基于自回归填空的通用预训练范式GLM,并率先发布了中国首个百亿模型、首个开源千亿模型、首个对话模型、首个多模态模型等。
近期大模型的“万物竞发”,不但体现在新品的争相上市,也有老牌厂商的版本更新!
1月8日,据通义大模型官微消息,Qwen正式发布并开源Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列,这两个模型基于Qwen3-VL构建,专为多模态信息检索与跨模态理解设计,为图文、视频等混合内容的理解与检索提供统一、高效的解决方案。
在刚刚过去的元旦假期,DeepSeek发布了一篇新论文,提出了一种名为mHC(流形约束超连接)的新架构。该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。
有券商研究员表示,大模型开年即决战。字节豆包强势赞助马年春晚,流量预定;DeepSeek新论文/新模型蓄势待发,硬核秀肌肉;阿里系千问与蚂蚁阿福等APP全面铺开;海外Meta数十亿美金收购Manus,AI手机更是未来两年的制高点。科技界不论中美,2026年都在齐齐发力,AI应用已成为ROI验证的必经之路。
从基本面来看,去年下半年,计算机板块收入利润已现触底回升态势;机构持仓处于多年低位。业绩向上+筹码干净,当前具备极佳的反弹条件。
此外,最新公布的“十五五”规划明确要加快人工智能等数智技术创新,强化算力、算法、数据等高效供给,全面实施“人工智能+”行动,全方位赋能千行百业。当下AI大模型的用户渗透率仍较低,大模型发展仍处于中初期阶段,产业化周期才开始。
独角兽,也是吞金兽
然而,大模型属于技术与资金密集型产业,尤其高度依赖于AI基础设施。其中,智谱的研发投入,有七成是购买算力服务,这是AI模型训练和推理的基础。2022年至2024年的算力累计投入超18亿元。
MiniMax同样投入了大量的计算资源进行模型训练,每年研发投入中有70%以上购买算力服务。在2022年至2025年9月30日期间,仅向阿里云所购买云计算服务费累计高达7100万美元(约合人民币5.3亿元)。
与其说比拼AI大模型技术能力,其实背后比拼的是AI基础设施的算力能力。包括科技巨头们为提升大模型竞争力,纷纷扩大资本支出。仅微软、谷歌等巨头2025年人工智能方面的投入预计将达4000亿美元。国内如腾讯、阿里、字节在AI基础设施上的投入同样惊人。
随着大模型持续发展,模型参数的增长,对算力需求不断上升,这是导致AI大模型公司很难在短期内实现盈利的因素之一。
2022年至2025年上半年,智谱累计亏损总额62.38亿元;2022年至2025年前三季度,MiniMax累计亏损总额约13.2亿美元(约合人民币92亿元)。巨额亏损核心因素在于大模型研究及AI基础设施方面的投资以及公允价值亏损。
整体来说,发展AI大模型离不开强大的AI基础设施。对于大模型公司而言,多数采取从阿里、腾讯、百度等云服务商处购买所需要的算力服务。根据MiniMax披露的关联交易显示,2026年、2027年及2028年与阿里云计算年度服务金额上限分别为1.15亿美元、1.25亿美元、1.35亿美元。
尾声
大模型竞赛已进入白热化,技术突破与资本狂热交织。尽管面临巨额投入与盈利挑战,但政策支持、技术迭代与市场渗透共同指向一个确定的未来:AI正从概念走向产业深度融合,全面爆发的黎明或许就在眼前。
综合自券商中国、中国经营报、福布斯杂志


1月9日,伴随着A股2026年第一个交易周收官,沪指站稳4100点,全A成交额再度放大,突破3万亿元大关,为2025年10月以来首次突破3万亿元关口。而人工智能应用板块,更是迎来了一波爆发!
一家新股,带动一个版块?
就在当日,AI应用方向反复活跃,引力传媒5天4板,易点天下、科德教育涨超10%,博瑞传播、蓝色光标、省广集团涨幅居前。整个人工智能概念板块一度有60只股票涨停或涨幅超过10%。
分析人士认为,MiniMax今日在港股上市并翻倍,可能是引爆人工智能应用的主要原因。有券商表示,日益丰富的AI Infra工具、逐步成熟的数据治理,以及应用厂商不断试错迭代,2026年将看到AI渗透到产业的多个环节,并形成收入。
成立仅4年的MiniMax(稀宇科技)以每股165港元的定价上限正式挂牌上市。午后,该股股价突破300港元/股,最终涨幅超过109%,市值也随之突破千亿港元。
受此带动,A股AI应用板块亦于今日大爆发。整个板块有8只股票20%涨停。整个人工智能概念股共有60只股票涨停或涨幅超10%。科创AI ETF一度大涨超3%。
分析人士认为,MiniMax上市是AI应用爆发的主要原因。有券商指出,大模型技术路径在2024年下半年后有所收敛,竞争或从“寻找正确路径”转向“在主流路径上卷效率”。OpenAI、谷歌Gemini、Anthropic已有可观收入,聊天机器人+AI编程已跑通,AI视频、B端企业软件以及垂类场景逐渐成熟;国内模型开始主导开源生态,能力相较海外模型有差距但不远。
而MiniMax是全球领先的、国内少数在多模态及C端应用上同时跑通的大模型公司。作为成立于2021年的创业公司,其优势来自组织效率、人才优势及数据闭环。
MiniMax证明了其有全球领先的技术创新和领先的能力。MiniMax M2模型MoE+Full Attention(在Linear Attention基础上调优)+强制交错思考,技术能力及模型能力突出。MiniMax M2创新采用强制交错思考,可以避免一次性长思考造成无效Token消耗,强制交错思考后被谷歌等模型借鉴。
百舸争流的大模型
和MiniMax深耕上海相对应的,是智谱在北京的大放异彩!
继此前发布全球首个会操作手机的AI智能体模型AutoGLM后,近日,总部位于清华科技园的智谱公司宣布将AutoGLM开源。这意味着,全球硬件厂商、手机厂商和开发者今后都能基于AutoGLM,在手机等设备或系统中复现一个能看懂屏幕,还能模拟真人进行点击、输入等操作,从而替人类办事的AI助手。
1月8日,在MiniMax上市的前一天,智谱公司在港股上市,成为全球首家以通用人工智能基座模型为核心业务的上市公司。
2019年,智谱由清华大学孵化成立。彼时,大模型在国内还乏人问津,这个初创团队却在寸土寸金的中关村五道口获得了几个月免租金的办公场地,迈出发展第一步。“
北京在人工智能领域的发展全国领先,智谱的快速成长正是得益于北京在人才、科研资源与政策支持等方面的综合优势。”智谱董事长刘德兵表示。几年来,该团队原创提出了基于自回归填空的通用预训练范式GLM,并率先发布了中国首个百亿模型、首个开源千亿模型、首个对话模型、首个多模态模型等。
近期大模型的“万物竞发”,不但体现在新品的争相上市,也有老牌厂商的版本更新!
1月8日,据通义大模型官微消息,Qwen正式发布并开源Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列,这两个模型基于Qwen3-VL构建,专为多模态信息检索与跨模态理解设计,为图文、视频等混合内容的理解与检索提供统一、高效的解决方案。
在刚刚过去的元旦假期,DeepSeek发布了一篇新论文,提出了一种名为mHC(流形约束超连接)的新架构。该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。
有券商研究员表示,大模型开年即决战。字节豆包强势赞助马年春晚,流量预定;DeepSeek新论文/新模型蓄势待发,硬核秀肌肉;阿里系千问与蚂蚁阿福等APP全面铺开;海外Meta数十亿美金收购Manus,AI手机更是未来两年的制高点。科技界不论中美,2026年都在齐齐发力,AI应用已成为ROI验证的必经之路。
从基本面来看,去年下半年,计算机板块收入利润已现触底回升态势;机构持仓处于多年低位。业绩向上+筹码干净,当前具备极佳的反弹条件。
此外,最新公布的“十五五”规划明确要加快人工智能等数智技术创新,强化算力、算法、数据等高效供给,全面实施“人工智能+”行动,全方位赋能千行百业。当下AI大模型的用户渗透率仍较低,大模型发展仍处于中初期阶段,产业化周期才开始。
独角兽,也是吞金兽
然而,大模型属于技术与资金密集型产业,尤其高度依赖于AI基础设施。其中,智谱的研发投入,有七成是购买算力服务,这是AI模型训练和推理的基础。2022年至2024年的算力累计投入超18亿元。
MiniMax同样投入了大量的计算资源进行模型训练,每年研发投入中有70%以上购买算力服务。在2022年至2025年9月30日期间,仅向阿里云所购买云计算服务费累计高达7100万美元(约合人民币5.3亿元)。
与其说比拼AI大模型技术能力,其实背后比拼的是AI基础设施的算力能力。包括科技巨头们为提升大模型竞争力,纷纷扩大资本支出。仅微软、谷歌等巨头2025年人工智能方面的投入预计将达4000亿美元。国内如腾讯、阿里、字节在AI基础设施上的投入同样惊人。
随着大模型持续发展,模型参数的增长,对算力需求不断上升,这是导致AI大模型公司很难在短期内实现盈利的因素之一。
2022年至2025年上半年,智谱累计亏损总额62.38亿元;2022年至2025年前三季度,MiniMax累计亏损总额约13.2亿美元(约合人民币92亿元)。巨额亏损核心因素在于大模型研究及AI基础设施方面的投资以及公允价值亏损。
整体来说,发展AI大模型离不开强大的AI基础设施。对于大模型公司而言,多数采取从阿里、腾讯、百度等云服务商处购买所需要的算力服务。根据MiniMax披露的关联交易显示,2026年、2027年及2028年与阿里云计算年度服务金额上限分别为1.15亿美元、1.25亿美元、1.35亿美元。
尾声
大模型竞赛已进入白热化,技术突破与资本狂热交织。尽管面临巨额投入与盈利挑战,但政策支持、技术迭代与市场渗透共同指向一个确定的未来:AI正从概念走向产业深度融合,全面爆发的黎明或许就在眼前。
综合自券商中国、中国经营报、福布斯杂志


展开
打开“财经头条”阅读更多精彩资讯
APP内打开