DeepSeek,突传大消息!高盛发声!

券商中国

14小时前

最新进展!



3月25日晚,DeepSeek又有大消息传来。该公司在官方账号上正式宣布V3模型完成小版本升级的消息,并介绍了新版本DeepSeek-V3-0324模型的提升细节,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。另据海外专业AI模型评测机构最新排名,新版V3模型现在是得分最高的非推理模型,超过xAI的Grok3和OpenAI的GPT-4.5(preview)。


值得注意的是,北京时间昨天晚上,人工智能大模型“暗战”不断。当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,“将迄今最先进的图像生成器集成至GPT-4o”。谷歌也发布Gemini 2.5系列人工智能推理模型,其首个版本Pro Experimental一登场就抢下大模型竞技场第一名,并且整整比GPT-4.5高出40分。


再度引爆:又变强了!


3月25日晚间消息,DeepSeek宣布V3模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。


据悉,DeepSeek-V3-0324 API接口和使用方式保持不变。如非复杂推理任务,建议使用新版本V3模型,即刻享受速度更加流畅、效果全面提升的对话体验。


模型推理任务表现提高,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。


DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法。私有化部署时只需要更新checkpoint和tokenizer_config.json(tool calls相关变动)。模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。


不过,外界对于DeepSeek-V3-0324的关注并不仅仅因为该版本的能力提升,而是猜测它的发布是否意味着DeepSeek更新一代的V4与R2大模型的发布不远了。


DeepSeek方面表示,一是新版本代码能力显著提升,接近Claude 3.7水平。例如,有用户在实测中发现,V3-0324能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。二是数学与逻辑推理能力增强。例如经典的“4升水壶问题”和数学竞赛题(如AIME 2025题目),部分表现接近专业推理模型。三是模型架构与开源生态。V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。


暗战不断


就在DeepSeek宣布V3模型已完成小版本升级的同时,当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,“将迄今最先进的图像生成器集成至GPT-4o”。即日起,所有Plus、Pro、Team及免费用户将陆续在ChatGPT和Sora中体验该功能,企业版与教育版即将接入,Sora平台同步启用。开发者即将通过API调用GPT-4o图像生成功能,接口权限将于未来数周内开放。据介绍,GPT-4o图像生成功能可精准文本渲染、严格遵循指令提示、深度调用4o知识库及对话上下文——包括对上传图像进行二次创作或将其转化为视觉灵感。


谷歌也发布了Gemini 2.5系列人工智能推理模型。该系列模型在回答问题前会“思考”片刻。作为这一系列模型的首发产品,Gemini 2.5 Pro Experimental已经率先亮相。这款多模态推理人工智能模型被谷歌称为“目前最智能的模型”,支持高达100万Token的超大上下文窗口,单次可以处理约75万英文单词,远超《指环王》三部曲的总字数。


谷歌透露,未来Gemini 2.5 Pro将支持200万Token的双倍输入长度。这一模型将于周二登陆谷歌开发者平台Google AI Studio,同时向每月支付20美元订阅“Gemini Advanced”的用户开放。谷歌表示,未来所有新推出的人工智能模型都将集成推理能力。


值得注意的是,Gemini 2.5系列首个版本Pro Experimental一登场就抢下大模型竞技场第一名,并且整整比GPT-4.5高出40分!谷歌介绍称,相较于Gemini 2.0 Flash Thinking这个谷歌首个推理模型,Gemini 2.5在基础模型和后训练技术上都有改进。不仅是在大模型竞技场上一举拿下高分,在各种推理、数学、科学、编程基准上,Gemini 2.5 Pro都表现出色,属于是编程能跟Claude 3.7 Sonnet掰手腕,数学能跟Grok 3相媲美。


人工智能光环仍在


就在DeepSeek的最新动作之后,腾讯也快速行动。3月26日凌晨,腾讯元宝迎来重大升级,同时接入两大模型:深度思考模型“腾讯混元T1”正式版,和DeepSeek V3-0324最新版。


机构认为,当前人工智能对于中国资产的加持光环可能依然存在。高盛发布最新研究报告称,在今年中国股票上涨约20%之后,预计还会有更多基本面驱动的上涨,不过重申牛市可能因事件风险和获利回吐压力而放缓。


分析师Kinger Lau等在报告中指出,根据对投资者的调研,基于宏观、政策等方面的原因,股票投资者似乎对美国关税担忧感到轻松,原因可能是一些投资者相信相比贸易战1.0,中国当前似乎更有能力应对外部需求逆风,因对美国直接出口的减少和产品竞争力的提高。


尽管对于人工智能潜在获益的问题和争论已经浮出水面,但是大多数投资者认可中国人工智能叙事是游戏规则改变者。预计人工智能的广泛应用将会在未来十年每年提升中国每股收益预测2.5%,并带来潜在的超过2000亿美元的投资组合资金流入。

最新进展!



3月25日晚,DeepSeek又有大消息传来。该公司在官方账号上正式宣布V3模型完成小版本升级的消息,并介绍了新版本DeepSeek-V3-0324模型的提升细节,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。另据海外专业AI模型评测机构最新排名,新版V3模型现在是得分最高的非推理模型,超过xAI的Grok3和OpenAI的GPT-4.5(preview)。


值得注意的是,北京时间昨天晚上,人工智能大模型“暗战”不断。当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,“将迄今最先进的图像生成器集成至GPT-4o”。谷歌也发布Gemini 2.5系列人工智能推理模型,其首个版本Pro Experimental一登场就抢下大模型竞技场第一名,并且整整比GPT-4.5高出40分。


再度引爆:又变强了!


3月25日晚间消息,DeepSeek宣布V3模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。


据悉,DeepSeek-V3-0324 API接口和使用方式保持不变。如非复杂推理任务,建议使用新版本V3模型,即刻享受速度更加流畅、效果全面提升的对话体验。


模型推理任务表现提高,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。


DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法。私有化部署时只需要更新checkpoint和tokenizer_config.json(tool calls相关变动)。模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。


不过,外界对于DeepSeek-V3-0324的关注并不仅仅因为该版本的能力提升,而是猜测它的发布是否意味着DeepSeek更新一代的V4与R2大模型的发布不远了。


DeepSeek方面表示,一是新版本代码能力显著提升,接近Claude 3.7水平。例如,有用户在实测中发现,V3-0324能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。二是数学与逻辑推理能力增强。例如经典的“4升水壶问题”和数学竞赛题(如AIME 2025题目),部分表现接近专业推理模型。三是模型架构与开源生态。V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。


暗战不断


就在DeepSeek宣布V3模型已完成小版本升级的同时,当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,“将迄今最先进的图像生成器集成至GPT-4o”。即日起,所有Plus、Pro、Team及免费用户将陆续在ChatGPT和Sora中体验该功能,企业版与教育版即将接入,Sora平台同步启用。开发者即将通过API调用GPT-4o图像生成功能,接口权限将于未来数周内开放。据介绍,GPT-4o图像生成功能可精准文本渲染、严格遵循指令提示、深度调用4o知识库及对话上下文——包括对上传图像进行二次创作或将其转化为视觉灵感。


谷歌也发布了Gemini 2.5系列人工智能推理模型。该系列模型在回答问题前会“思考”片刻。作为这一系列模型的首发产品,Gemini 2.5 Pro Experimental已经率先亮相。这款多模态推理人工智能模型被谷歌称为“目前最智能的模型”,支持高达100万Token的超大上下文窗口,单次可以处理约75万英文单词,远超《指环王》三部曲的总字数。


谷歌透露,未来Gemini 2.5 Pro将支持200万Token的双倍输入长度。这一模型将于周二登陆谷歌开发者平台Google AI Studio,同时向每月支付20美元订阅“Gemini Advanced”的用户开放。谷歌表示,未来所有新推出的人工智能模型都将集成推理能力。


值得注意的是,Gemini 2.5系列首个版本Pro Experimental一登场就抢下大模型竞技场第一名,并且整整比GPT-4.5高出40分!谷歌介绍称,相较于Gemini 2.0 Flash Thinking这个谷歌首个推理模型,Gemini 2.5在基础模型和后训练技术上都有改进。不仅是在大模型竞技场上一举拿下高分,在各种推理、数学、科学、编程基准上,Gemini 2.5 Pro都表现出色,属于是编程能跟Claude 3.7 Sonnet掰手腕,数学能跟Grok 3相媲美。


人工智能光环仍在


就在DeepSeek的最新动作之后,腾讯也快速行动。3月26日凌晨,腾讯元宝迎来重大升级,同时接入两大模型:深度思考模型“腾讯混元T1”正式版,和DeepSeek V3-0324最新版。


机构认为,当前人工智能对于中国资产的加持光环可能依然存在。高盛发布最新研究报告称,在今年中国股票上涨约20%之后,预计还会有更多基本面驱动的上涨,不过重申牛市可能因事件风险和获利回吐压力而放缓。


分析师Kinger Lau等在报告中指出,根据对投资者的调研,基于宏观、政策等方面的原因,股票投资者似乎对美国关税担忧感到轻松,原因可能是一些投资者相信相比贸易战1.0,中国当前似乎更有能力应对外部需求逆风,因对美国直接出口的减少和产品竞争力的提高。


尽管对于人工智能潜在获益的问题和争论已经浮出水面,但是大多数投资者认可中国人工智能叙事是游戏规则改变者。预计人工智能的广泛应用将会在未来十年每年提升中国每股收益预测2.5%,并带来潜在的超过2000亿美元的投资组合资金流入。

展开
打开“财经头条”阅读更多精彩资讯
APP内打开