豆包视觉理解模型发布:千Tokens输入价3厘,3D生成模型首次亮相

财经涂鸦

5天前

该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持AIGC创作的物理世界仿真模拟器。

豆包大模型已覆盖终端设备约3亿台。


作者:苏打
编辑:tuya
出品:财经涂鸦(ID:caijingtuya)
“今年是大模型高速发展的一年。当你看到一列高速行驶的列车,最重要的事就是确保自己要登上这趟列车。”
公司情报专家《财经涂鸦》获悉,12月18日,字节跳动在火山引擎 Force 大会中正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。火山引擎总裁谭待表示,该模型理解和推理能力出色,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务,并具备细腻的视觉描述和创作能力
值得一提的是,豆包视觉理解模型千tokens输入价格仅为3厘,一元钱可处理284张720P的图片,比行业价格便宜85%至此,视觉理解模型继大语言模型之后也进入“厘时代”
豆包战略研究负责人周昊透露,此前,豆包视觉理解模型已经接入豆包App和PC端产品,且多模态语音和视觉等模型都已通过火山引擎开放给企业客户。
现场,豆包3D生成模型也首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。
“豆包大模型虽然发布较晚,但一直在快速迭代进化。”谭待表示,目前豆包已成为国内最全面、技术最领先的大模型之一。大会还宣告,2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力
数据显示,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。大模型应用正在向各行各业加速渗透。
据悉,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。企业客户方面,近3个月豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长
相关资料显示,截至目前豆包国内下载排名已处于领先位置,今年10月份日活已达1000万,不考虑终端预置应用,C端应用中目前豆包的用户数量居首位,领先于其他国内AI应用。
字节的AI算力基础设施主要是火山引擎。谭待认为,豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念,让AI成为每一家企业都能用得起、用得好的普惠科技。
据此次公布的最新信息,豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。
其海外市场表现同样强劲。日前,字节旗下海外版小红书M8在美国应用下载榜登顶第一名。尽管豆包在美国排名不高,但在东南亚如菲律宾等地区很受欢迎。AI应用方面,字节在美国主打AI教育、AI小红书等应用,增长强劲。
即梦Dreamina张楠认为,生成式AI技术可以把每个人脑子里的奇思妙想快速视觉化,“像做梦一样”。即梦希望成为“想象力世界”的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。
此前还有资料显示,豆包计划将AI玩偶作为2025年Q1-Q2重要战略级产品,目前渠道商代理商已基本构建完毕。预计出货量在800-1000万个,最晚Q3之前推出。采用的IP包括但不限于遮天、三体、任天堂、南梦宫、米哈游、名侦探柯南等,未来日韩市场将成为出海的主要目标市场。

本文由公众号财经涂鸦(ID:caijingtuya)原创撰写,如需转载请联系涂鸦君。

添加涂鸦君个人微信(ID:tuyaclub)加入【公司情报社群】参与资本市场讨论获取一手情报

该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持AIGC创作的物理世界仿真模拟器。

豆包大模型已覆盖终端设备约3亿台。


作者:苏打
编辑:tuya
出品:财经涂鸦(ID:caijingtuya)
“今年是大模型高速发展的一年。当你看到一列高速行驶的列车,最重要的事就是确保自己要登上这趟列车。”
公司情报专家《财经涂鸦》获悉,12月18日,字节跳动在火山引擎 Force 大会中正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。火山引擎总裁谭待表示,该模型理解和推理能力出色,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务,并具备细腻的视觉描述和创作能力
值得一提的是,豆包视觉理解模型千tokens输入价格仅为3厘,一元钱可处理284张720P的图片,比行业价格便宜85%至此,视觉理解模型继大语言模型之后也进入“厘时代”
豆包战略研究负责人周昊透露,此前,豆包视觉理解模型已经接入豆包App和PC端产品,且多模态语音和视觉等模型都已通过火山引擎开放给企业客户。
现场,豆包3D生成模型也首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。
“豆包大模型虽然发布较晚,但一直在快速迭代进化。”谭待表示,目前豆包已成为国内最全面、技术最领先的大模型之一。大会还宣告,2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力
数据显示,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。大模型应用正在向各行各业加速渗透。
据悉,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。企业客户方面,近3个月豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长
相关资料显示,截至目前豆包国内下载排名已处于领先位置,今年10月份日活已达1000万,不考虑终端预置应用,C端应用中目前豆包的用户数量居首位,领先于其他国内AI应用。
字节的AI算力基础设施主要是火山引擎。谭待认为,豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念,让AI成为每一家企业都能用得起、用得好的普惠科技。
据此次公布的最新信息,豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。
其海外市场表现同样强劲。日前,字节旗下海外版小红书M8在美国应用下载榜登顶第一名。尽管豆包在美国排名不高,但在东南亚如菲律宾等地区很受欢迎。AI应用方面,字节在美国主打AI教育、AI小红书等应用,增长强劲。
即梦Dreamina张楠认为,生成式AI技术可以把每个人脑子里的奇思妙想快速视觉化,“像做梦一样”。即梦希望成为“想象力世界”的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。
此前还有资料显示,豆包计划将AI玩偶作为2025年Q1-Q2重要战略级产品,目前渠道商代理商已基本构建完毕。预计出货量在800-1000万个,最晚Q3之前推出。采用的IP包括但不限于遮天、三体、任天堂、南梦宫、米哈游、名侦探柯南等,未来日韩市场将成为出海的主要目标市场。

本文由公众号财经涂鸦(ID:caijingtuya)原创撰写,如需转载请联系涂鸦君。

添加涂鸦君个人微信(ID:tuyaclub)加入【公司情报社群】参与资本市场讨论获取一手情报

展开
打开“财经头条”阅读更多精彩资讯
APP内打开