阿里通义千问与DeepSeek开源两款新模型

100ec.cn

4天前

阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B,DeepSeek则将此前热门的“基座模型”V3更新到0324版本,并官宣在魔搭社区上架开源。

(网经社讯)3月27日消息,阿里通义千问与DeepSeek均于25日低调开源了两款新模型。阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B,DeepSeek则将此前热门的“基座模型”V3更新到0324版本,并官宣在魔搭社区上架开源。截至目前,魔搭社区模型总数已超4万个,已成为中国最大的AI开源社区。

技术亮点:从多模态到基座模型优化

据网经社云计算台(CC.100EC.CN)查询DeepSeek后获悉,阿里此次开源的Qwen2.5-VL-32B是通义千问系列的多模态版本,突出“高性能”和“本地部署”特性。其32B参数量在视觉-语言联合任务(如图文理解、生成)中可能具备更强的泛化能力,而优化后的推理效率则降低了企业私有化部署的门槛。这延续了阿里从Qwen-72B到1.8B小模型的梯度化开源策略,覆盖从云端到边缘计算的全场景需求。  

DeepSeek的升级版V3-0324则是对此前基座模型的针对性优化。作为一款纯文本大模型,DeepSeek-V3凭借长上下文支持(128K)和强代码能力已在开发者中积累口碑,此次更新可能进一步提升了逻辑推理或垂直领域适配性。其选择魔搭社区作为首发平台,也凸显了开源社区在模型分发中的核心地位。 

开源生态:魔搭社区成关键基础设施  

两家团队均将魔搭社区作为重要发布渠道,反映出该平台已是中国AI开源的核心枢纽。据官方数据,魔搭模型总量超4万个,涵盖NLP、CV、语音等多领域,其意义不仅在于资源聚合,更在于提供了标准化的工具链(如ModelScope)、算力支持和协作机制,极大降低了开发者的试错成本。  

这种“厂商开源+社区运营”的模式,正在形成与美国Hugging Face分庭抗礼的中国特色路径。厂商通过开源获取生态影响力,社区则推动技术落地反哺创新,形成正向循环。  

行业影响:开源竞争进入深水区 

此次更新传递出两个信号:  

1. 技术差异化:阿里侧重多模态与部署友好性,DeepSeek深耕文本基座模型,反映开源策略从“通用模型”向“垂直场景”细化。  

2. 生态协同:头部团队与开源社区的深度绑定,加速了技术下沉。中小厂商可基于这些模型二次开发,避免重复造轮子。  

未来,中国开源生态的竞争将不仅限于模型性能,更在于工具链完善度、商业化案例落地以及社区活跃度。随着更多玩家加入,开源或将成为AI技术民主化的关键推手。

阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B,DeepSeek则将此前热门的“基座模型”V3更新到0324版本,并官宣在魔搭社区上架开源。

(网经社讯)3月27日消息,阿里通义千问与DeepSeek均于25日低调开源了两款新模型。阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B,DeepSeek则将此前热门的“基座模型”V3更新到0324版本,并官宣在魔搭社区上架开源。截至目前,魔搭社区模型总数已超4万个,已成为中国最大的AI开源社区。

技术亮点:从多模态到基座模型优化

据网经社云计算台(CC.100EC.CN)查询DeepSeek后获悉,阿里此次开源的Qwen2.5-VL-32B是通义千问系列的多模态版本,突出“高性能”和“本地部署”特性。其32B参数量在视觉-语言联合任务(如图文理解、生成)中可能具备更强的泛化能力,而优化后的推理效率则降低了企业私有化部署的门槛。这延续了阿里从Qwen-72B到1.8B小模型的梯度化开源策略,覆盖从云端到边缘计算的全场景需求。  

DeepSeek的升级版V3-0324则是对此前基座模型的针对性优化。作为一款纯文本大模型,DeepSeek-V3凭借长上下文支持(128K)和强代码能力已在开发者中积累口碑,此次更新可能进一步提升了逻辑推理或垂直领域适配性。其选择魔搭社区作为首发平台,也凸显了开源社区在模型分发中的核心地位。 

开源生态:魔搭社区成关键基础设施  

两家团队均将魔搭社区作为重要发布渠道,反映出该平台已是中国AI开源的核心枢纽。据官方数据,魔搭模型总量超4万个,涵盖NLP、CV、语音等多领域,其意义不仅在于资源聚合,更在于提供了标准化的工具链(如ModelScope)、算力支持和协作机制,极大降低了开发者的试错成本。  

这种“厂商开源+社区运营”的模式,正在形成与美国Hugging Face分庭抗礼的中国特色路径。厂商通过开源获取生态影响力,社区则推动技术落地反哺创新,形成正向循环。  

行业影响:开源竞争进入深水区 

此次更新传递出两个信号:  

1. 技术差异化:阿里侧重多模态与部署友好性,DeepSeek深耕文本基座模型,反映开源策略从“通用模型”向“垂直场景”细化。  

2. 生态协同:头部团队与开源社区的深度绑定,加速了技术下沉。中小厂商可基于这些模型二次开发,避免重复造轮子。  

未来,中国开源生态的竞争将不仅限于模型性能,更在于工具链完善度、商业化案例落地以及社区活跃度。随着更多玩家加入,开源或将成为AI技术民主化的关键推手。

展开
打开“财经头条”阅读更多精彩资讯
APP内打开