阿里开源全新推理模型 大幅降低部署使用成本

新华财经

3天前

相较于 6710亿参数的DeepSeek-R1“满血版”,此次阿里开源发布了新推理模型QwQ-32B参数量只有为320亿。

新华财经上海3月6日电(记者 杜康)6日凌晨,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。据悉,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现飞跃,整体性能可比肩DeepSeek-R1。保持性能的同时,千问QwQ-32B还大幅降低了部署使用成本,可在消费级显卡上也能实现本地部署。

千问QwQ-32B是阿里探索推理模型的最新成果。据介绍,在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了的推理能力提升,应证了大规模强化学习可显著提高模型性能。在一系列权威基准测试中,千问QwQ-32B 模型表现出色。

千问QwQ-32B既能提供极强的推理能力,又能满足更低的资源消耗需求。相较于 6710 亿参数的 DeepSeek-R1“满血版”,此次阿里开源发布了新推理模型 QwQ-32B参数量只有为 320 亿。阿里云团队介绍,千问QwQ-32B非常适合快速响应或对数据安全要求高的应用场景,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中,比如个人电脑等。

此外,千问QwQ-32B模型中还集成了与智能体 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义App免费体验最新的千问QwQ-32B模型。

从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,覆盖从0.5B到110B等参数“全尺寸”。截至目前,海内外AI开源社区中千问Qwen的衍生模型数量突破10万,成为全球最大的开源模型族群。

编辑:李一帆

声明:新华财经为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115

相较于 6710亿参数的DeepSeek-R1“满血版”,此次阿里开源发布了新推理模型QwQ-32B参数量只有为320亿。

新华财经上海3月6日电(记者 杜康)6日凌晨,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。据悉,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现飞跃,整体性能可比肩DeepSeek-R1。保持性能的同时,千问QwQ-32B还大幅降低了部署使用成本,可在消费级显卡上也能实现本地部署。

千问QwQ-32B是阿里探索推理模型的最新成果。据介绍,在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了的推理能力提升,应证了大规模强化学习可显著提高模型性能。在一系列权威基准测试中,千问QwQ-32B 模型表现出色。

千问QwQ-32B既能提供极强的推理能力,又能满足更低的资源消耗需求。相较于 6710 亿参数的 DeepSeek-R1“满血版”,此次阿里开源发布了新推理模型 QwQ-32B参数量只有为 320 亿。阿里云团队介绍,千问QwQ-32B非常适合快速响应或对数据安全要求高的应用场景,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中,比如个人电脑等。

此外,千问QwQ-32B模型中还集成了与智能体 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义App免费体验最新的千问QwQ-32B模型。

从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,覆盖从0.5B到110B等参数“全尺寸”。截至目前,海内外AI开源社区中千问Qwen的衍生模型数量突破10万,成为全球最大的开源模型族群。

编辑:李一帆

声明:新华财经为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115

展开
打开“财经头条”阅读更多精彩资讯
APP内打开