马斯克宣布旗下xAI开源的大模型Grok已支持解析PDF文件;Mistral AI更新Le Chat聊天机器人丨AIGC日报

创业邦

2天前

4.马斯克宣布旗下xAI开源的大模型Grok已支持解析PDF文件,并且表示Grok近期进行了许多升级(包括长上下文、图像理解、网页搜索结果、内联引用来源、Grok分析),未来还将进行更多升级。

1.【胖东来发声明警告“AI生成于东来声音行为”,要求相关账号立即停止侵权行为】胖东来商贸集团11月24日发布声明称,近日,公司在第三方网络平台发现多个账号,未经授权擅自利用AI技术手段生成于东来先生的声音,并对于东来先生或公司享有著作权的视频内容进行非法剪辑和篡改,加入AI生成声音及误导性文案后发布,对公众造成误导和混淆。前述行为已侵犯了于东来先生的人格权及著作权,对公司品牌形象造成消极影响。

2.【Mistral AI更新Le Chat聊天机器人,引入“登顶复杂数学推理榜”Pixtral Large多模态模型】11月24日消息,Mistral AI为旗下聊天机器人Le Chat进行更新,引入了其于11月18日发布的全新多模态模型Pixtral Large,进一步强化了数学推理能力,不过目前Le Chat仍处于测试阶段,用户可以申请免费试用。据介绍,Pixtral Large模型整体基于Mistral Large 2打造,拥有1240亿参数,其除了拥有强大的文本理解能力外,还能理解文档、图表和自然图像。

在各项基准测试中,Pixtral Large表现出色:在复杂数学推理的MathVista测试中取得 69.4% 的准确率;在图表理解的ChartQA测试中达到 88.1%;在文档问答的DocVQA测试中取得93.3%的成绩,均超越了Llama-3.2 90B、GPT-4o和Gemini-1.5 Pro 等模型。

3.【深度使用ChatGPT六个月后,OpenAI最大的金融客户评估:有效果,但扩展性存疑】11月21日,西班牙第二大银行BBVA的用户报告显示,ChatGPT显著提高了银行内部的生产力,引发了“创造力的爆发”,但是,他们对ChatGPT的扩展性与整合能力仍存在疑问。据初期用户报告,银行各部门的生产力的确有所提高,80%的用户表示ChatGPT Enterprise每周可以帮助他们节省超过两个小时的工作时间。然而,ChatGPT Enterprise在扩大工具应用方面仍存在问题。BBVA全球人工智能应用负责人埃琳娜·阿尔法罗(Elena Alfaro)指出,将ChatGPT整合到银行复杂的内部系统和数据库中可能会面临困难。

4.【马斯克宣布旗下xAI开源的大模型Grok已支持解析PDF文件】马斯克宣布旗下xAI开源的大模型Grok已支持解析PDF文件,并且表示Grok近期进行了许多升级(包括长上下文、图像理解、网页搜索结果、内联引用来源、Grok分析),未来还将进行更多升级。

5.【视频生成平台Runway获得新技能:更改视频比例,图片拥有“电影级”运镜】视频生成AI创企RunwayML11月23日推出了“Expand Video”新功能。用户可通过输入文本提示,在原始画面基础上生成额外内容,灵活调整视频比例,该系统能够在扩展画面时保持视觉效果的统一性。RunwayML表示,借助多次扩展,用户可以实现如“crash zoom(快速变焦)”和“pull-back shot(拉远镜头)”等动态摄像效果,将静态画面打造为具有电影感的动态序列。据了解,“Expand Video”功能将率先逐步开放给Gen-3 Alpha Turbo用户。

更多AIGC资讯……

扫码订阅AIGC产业日报,

精选行业新闻,帮你省时间!?

此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)??

4.马斯克宣布旗下xAI开源的大模型Grok已支持解析PDF文件,并且表示Grok近期进行了许多升级(包括长上下文、图像理解、网页搜索结果、内联引用来源、Grok分析),未来还将进行更多升级。

1.【胖东来发声明警告“AI生成于东来声音行为”,要求相关账号立即停止侵权行为】胖东来商贸集团11月24日发布声明称,近日,公司在第三方网络平台发现多个账号,未经授权擅自利用AI技术手段生成于东来先生的声音,并对于东来先生或公司享有著作权的视频内容进行非法剪辑和篡改,加入AI生成声音及误导性文案后发布,对公众造成误导和混淆。前述行为已侵犯了于东来先生的人格权及著作权,对公司品牌形象造成消极影响。

2.【Mistral AI更新Le Chat聊天机器人,引入“登顶复杂数学推理榜”Pixtral Large多模态模型】11月24日消息,Mistral AI为旗下聊天机器人Le Chat进行更新,引入了其于11月18日发布的全新多模态模型Pixtral Large,进一步强化了数学推理能力,不过目前Le Chat仍处于测试阶段,用户可以申请免费试用。据介绍,Pixtral Large模型整体基于Mistral Large 2打造,拥有1240亿参数,其除了拥有强大的文本理解能力外,还能理解文档、图表和自然图像。

在各项基准测试中,Pixtral Large表现出色:在复杂数学推理的MathVista测试中取得 69.4% 的准确率;在图表理解的ChartQA测试中达到 88.1%;在文档问答的DocVQA测试中取得93.3%的成绩,均超越了Llama-3.2 90B、GPT-4o和Gemini-1.5 Pro 等模型。

3.【深度使用ChatGPT六个月后,OpenAI最大的金融客户评估:有效果,但扩展性存疑】11月21日,西班牙第二大银行BBVA的用户报告显示,ChatGPT显著提高了银行内部的生产力,引发了“创造力的爆发”,但是,他们对ChatGPT的扩展性与整合能力仍存在疑问。据初期用户报告,银行各部门的生产力的确有所提高,80%的用户表示ChatGPT Enterprise每周可以帮助他们节省超过两个小时的工作时间。然而,ChatGPT Enterprise在扩大工具应用方面仍存在问题。BBVA全球人工智能应用负责人埃琳娜·阿尔法罗(Elena Alfaro)指出,将ChatGPT整合到银行复杂的内部系统和数据库中可能会面临困难。

4.【马斯克宣布旗下xAI开源的大模型Grok已支持解析PDF文件】马斯克宣布旗下xAI开源的大模型Grok已支持解析PDF文件,并且表示Grok近期进行了许多升级(包括长上下文、图像理解、网页搜索结果、内联引用来源、Grok分析),未来还将进行更多升级。

5.【视频生成平台Runway获得新技能:更改视频比例,图片拥有“电影级”运镜】视频生成AI创企RunwayML11月23日推出了“Expand Video”新功能。用户可通过输入文本提示,在原始画面基础上生成额外内容,灵活调整视频比例,该系统能够在扩展画面时保持视觉效果的统一性。RunwayML表示,借助多次扩展,用户可以实现如“crash zoom(快速变焦)”和“pull-back shot(拉远镜头)”等动态摄像效果,将静态画面打造为具有电影感的动态序列。据了解,“Expand Video”功能将率先逐步开放给Gen-3 Alpha Turbo用户。

更多AIGC资讯……

扫码订阅AIGC产业日报,

精选行业新闻,帮你省时间!?

此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)??

展开
打开“财经头条”阅读更多精彩资讯
APP内打开