字节发布深度思考模型 具备“看图思考”能力

新华财经

2天前

新华财经杭州4月17日电(记者张璇)17日,记者从字节跳动公司旗下火山引擎举办的“AI创新巡展·杭州站”活动上获悉,火山引擎面向企业市场发布深度思考模型,同步升级文生图模型3.0、视觉理解模型,帮助企业更快、更省地构建和部署Agent应用。

新华财经杭州4月17日电(记者张璇)17日,记者从字节跳动公司旗下火山引擎举办的“AI创新巡展·杭州站”活动上获悉,火山引擎面向企业市场发布深度思考模型,同步升级文生图模型3.0、视觉理解模型,帮助企业更快、更省地构建和部署Agent应用。

字节提供的技术报告显示,豆包深度思考模型采用MoE架构,总参数为200B,激活参数仅20B,以较小参数实现媲美顶尖模型的效果。基于高效算法和高性能推理系统,豆包模型API服务在保障高并发的同时,延迟低至20毫秒。

据悉,豆包深度思考模型专门打造了视觉版,具备视觉推理能力,能像人类一样对看到的事物进行联想和思考,极大拓展了智能推理的应用边界。

火山引擎总裁谭待进一步解释:“模型可以看懂复杂的企业项目管理流程图表,快速定位到关键信息,并以强大的指令遵循能力,严格按照流程图,回答客户的问题;分析航拍图时,能结合地貌特征判断区域开发可行性。”

数据显示,截至2025年3月底,豆包大模型日均调用量已达到12.7万亿次。

编辑:胡晨曦

声明:新华财经为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115

新华财经杭州4月17日电(记者张璇)17日,记者从字节跳动公司旗下火山引擎举办的“AI创新巡展·杭州站”活动上获悉,火山引擎面向企业市场发布深度思考模型,同步升级文生图模型3.0、视觉理解模型,帮助企业更快、更省地构建和部署Agent应用。

新华财经杭州4月17日电(记者张璇)17日,记者从字节跳动公司旗下火山引擎举办的“AI创新巡展·杭州站”活动上获悉,火山引擎面向企业市场发布深度思考模型,同步升级文生图模型3.0、视觉理解模型,帮助企业更快、更省地构建和部署Agent应用。

字节提供的技术报告显示,豆包深度思考模型采用MoE架构,总参数为200B,激活参数仅20B,以较小参数实现媲美顶尖模型的效果。基于高效算法和高性能推理系统,豆包模型API服务在保障高并发的同时,延迟低至20毫秒。

据悉,豆包深度思考模型专门打造了视觉版,具备视觉推理能力,能像人类一样对看到的事物进行联想和思考,极大拓展了智能推理的应用边界。

火山引擎总裁谭待进一步解释:“模型可以看懂复杂的企业项目管理流程图表,快速定位到关键信息,并以强大的指令遵循能力,严格按照流程图,回答客户的问题;分析航拍图时,能结合地貌特征判断区域开发可行性。”

数据显示,截至2025年3月底,豆包大模型日均调用量已达到12.7万亿次。

编辑:胡晨曦

声明:新华财经为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115

展开
打开“财经头条”阅读更多精彩资讯
APP内打开