阿里开源全新推理模型大幅降低部署使用成本

财经头条

提升一亿中产阶级阅读效率

打开

新华财经

3天前

相较于 6710亿参数的DeepSeek-R1“满血版”，此次阿里开源发布了新推理模型QwQ-32B参数量只有为320亿。

新华财经上海3月6日电（记者杜康）6日凌晨，阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。据悉，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现飞跃，整体性能可比肩DeepSeek-R1。保持性能的同时，千问QwQ-32B还大幅降低了部署使用成本，可在消费级显卡上也能实现本地部署。

千问QwQ-32B是阿里探索推理模型的最新成果。据介绍，在冷启动基础上，阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习，在32B的模型尺寸上获得了的推理能力提升，应证了大规模强化学习可显著提高模型性能。在一系列权威基准测试中，千问QwQ-32B 模型表现出色。

千问QwQ-32B既能提供极强的推理能力，又能满足更低的资源消耗需求。相较于 6710 亿参数的 DeepSeek-R1“满血版”，此次阿里开源发布了新推理模型 QwQ-32B参数量只有为 320 亿。阿里云团队介绍，千问QwQ-32B非常适合快速响应或对数据安全要求高的应用场景，开发者和企业可以在消费级硬件上轻松将其部署到本地设备中，比如个人电脑等。

此外，千问QwQ-32B模型中还集成了与智能体 Agent 相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。阿里通义团队表示，未来将继续探索将智能体与强化学习的集成，以实现长时推理，探索更高智能进而最终实现AGI的目标。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义App免费体验最新的千问QwQ-32B模型。

从2023年至今，阿里通义团队已开源200多款模型，包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列，覆盖从0.5B到110B等参数“全尺寸”。截至目前，海内外AI开源社区中千问Qwen的衍生模型数量突破10万，成为全球最大的开源模型族群。

编辑：李一帆

声明：新华财经为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。如有问题，请联系客服：400-6123115

相较于 6710亿参数的DeepSeek-R1“满血版”，此次阿里开源发布了新推理模型QwQ-32B参数量只有为320亿。

编辑：李一帆

声明：新华财经为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。如有问题，请联系客服：400-6123115

展开

打开“财经头条”阅读更多精彩资讯