海通证券:Gemini 2.0发布 带动谷歌进入“智能体时代”

智通财经

1周前

智通财经APP获悉,海通证券发布研报称,Gemini2.0在原生用户界面操作能力、多模态推理、长文本理解、复杂指令跟随和规划能力、组合函数的调用,原生工具使用以及延迟优化等一系列领域进行了优化改进,这更使得Gemini2.0在增强应用能力和构建AI智能体方面拥有了更突出的优势,未来AI应用落地和AI智能体发展也有望持续加速。

智通财经APP获悉,海通证券发布研报称,Gemini 2.0在原生用户界面操作能力、多模态推理、长文本理解、复杂指令跟随和规划能力、组合函数的调用,原生工具使用以及延迟优化等一系列领域进行了优化改进,这更使得Gemini 2.0在增强应用能力和构建AI智能体方面拥有了更突出的优势,未来AI应用落地和AI智能体发展也有望持续加速。

海通证券主要观点如下:

Gemini 2.0发布,在低延迟、多模态等方面进步明显。

12月12日,谷歌发布 Gemini 2.0系列模型中的第一个模型:Gemini 2.0 Flash的体验版。这是谷歌的主力模型,具有低延迟特性,而且在谷歌大规模技术前沿中展现了卓越的性能。与1.5 Flash相比,Gemini 2.0 Flash在同样快速的响应时间下性能进一步增强。值得一提的是,2.0 Flash在关键基准测试中甚至超越了1.5 Pro,其速度是1.5 Pro的两倍。

同时2.0 Flash还具有新功能,除了能够支持图片、视频和音频等多模态输入,2.0 Flash现在还可以支持多模态输出,例如可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。它还可以原生调用Google Search、代码执行以及第三方用户定义的函数等工具。2025年初,谷歌还会将Gemini 2.0扩展到更多Google产品中。

谷歌高度关注AI智能体领域,Gemini 2.0成为重要助力。

AI智能体在现实中的应用是一个令人振奋且充满可能性的研究领域。Gemini 2.0使谷歌能够构建新的AI智能体,从而让谷歌离构建通用助手的愿景更进一步。

Project Astra:使用多模态理解现实世界的智能体。

Project Astra是谷歌于5月发布的高级视觉和对话响应智能体,其用于构建构建未来的AI助理。基于Gemini 2.0,Project Astra产生了多项改进:

更流畅的对话:Project Astra现在可以在多种语言和混合语言之间进行对话,并且能够更好地理解不同口音和生僻单词。

新工具的使用:借助Gemini 2.0,Project Astra可以使用Google Search、Google Lens和 Google Maps,从而在日常生活中更好地发挥助手作用。

更强的记忆力:谷歌增强了Project Astra的记忆能力,同时确保用户可以掌控对话。现在,它最多可以记住长达10分钟的会话内容,并且可以回忆起过去与它进行的更多对话,以便为用户提供更好的个性化服务。

更低的延迟:借助新的流式处理技术和原生音频理解能力,该智能体能够以近于人类对话的延迟来理解语言。

Project Mariner:帮用户完成复杂任务的智能体。

Project Mariner是使用Gemini 2.0构建的早期研究原型,旨在从用户的浏览器开始,探索人机交互的未来。作为研究原型,它能够理解和推理浏览器页面中的信息,包括像素和文本、代码、图像和表单等网页元素,然后通过实验性的Chrome扩展程序使用这些信息为用户完成任务。在 WebVoyager 基准测试(该测试针对智能体在端到端的真实世界网页任务的性能)中,Project Mariner作为单个智能体设置实现了83.5%的工作效率,达到了最先进的水平。

Jules:面向开发者的智能体。

接下来,谷歌会探索人工智能智能体如何通过Jules(一种实验性的AI代码智能体,它可以直接集成到GitHub工作流程中)来协助开发者。它可以解决问题、制定并执行计划,所有这些都在开发者指导和监督下进行。这项工作是谷歌长期目标的一部分,即构建可在所有领域(包括编码)中提供帮助的AI智能体。

游戏和其他领域的智能体。

谷歌使用Gemini 2.0构建了智能体,它们可以帮助用户在电子游戏中做出更明智的决策,可以根据屏幕上的实时画面,分析游戏情况,并为用户提供下一步行动建议。谷歌正与Supercell等顶尖游戏开发团队合作,探索智能体在游戏领域的应用。谷歌通过测试它们在各种游戏中的表现,来评估它们理解游戏规则、应对挑战的能力。这些智能体还可以通过Google Search让用户接触到丰富的游戏相关的知识。谷歌还将Gemini 2.0的空间推理能力应用于机器人领域,尝试让智能体在现实世界中提供帮助。

风险提示:AI技术发展不及预期,AI应用落地不及预期。

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com   

智通财经APP获悉,海通证券发布研报称,Gemini2.0在原生用户界面操作能力、多模态推理、长文本理解、复杂指令跟随和规划能力、组合函数的调用,原生工具使用以及延迟优化等一系列领域进行了优化改进,这更使得Gemini2.0在增强应用能力和构建AI智能体方面拥有了更突出的优势,未来AI应用落地和AI智能体发展也有望持续加速。

智通财经APP获悉,海通证券发布研报称,Gemini 2.0在原生用户界面操作能力、多模态推理、长文本理解、复杂指令跟随和规划能力、组合函数的调用,原生工具使用以及延迟优化等一系列领域进行了优化改进,这更使得Gemini 2.0在增强应用能力和构建AI智能体方面拥有了更突出的优势,未来AI应用落地和AI智能体发展也有望持续加速。

海通证券主要观点如下:

Gemini 2.0发布,在低延迟、多模态等方面进步明显。

12月12日,谷歌发布 Gemini 2.0系列模型中的第一个模型:Gemini 2.0 Flash的体验版。这是谷歌的主力模型,具有低延迟特性,而且在谷歌大规模技术前沿中展现了卓越的性能。与1.5 Flash相比,Gemini 2.0 Flash在同样快速的响应时间下性能进一步增强。值得一提的是,2.0 Flash在关键基准测试中甚至超越了1.5 Pro,其速度是1.5 Pro的两倍。

同时2.0 Flash还具有新功能,除了能够支持图片、视频和音频等多模态输入,2.0 Flash现在还可以支持多模态输出,例如可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。它还可以原生调用Google Search、代码执行以及第三方用户定义的函数等工具。2025年初,谷歌还会将Gemini 2.0扩展到更多Google产品中。

谷歌高度关注AI智能体领域,Gemini 2.0成为重要助力。

AI智能体在现实中的应用是一个令人振奋且充满可能性的研究领域。Gemini 2.0使谷歌能够构建新的AI智能体,从而让谷歌离构建通用助手的愿景更进一步。

Project Astra:使用多模态理解现实世界的智能体。

Project Astra是谷歌于5月发布的高级视觉和对话响应智能体,其用于构建构建未来的AI助理。基于Gemini 2.0,Project Astra产生了多项改进:

更流畅的对话:Project Astra现在可以在多种语言和混合语言之间进行对话,并且能够更好地理解不同口音和生僻单词。

新工具的使用:借助Gemini 2.0,Project Astra可以使用Google Search、Google Lens和 Google Maps,从而在日常生活中更好地发挥助手作用。

更强的记忆力:谷歌增强了Project Astra的记忆能力,同时确保用户可以掌控对话。现在,它最多可以记住长达10分钟的会话内容,并且可以回忆起过去与它进行的更多对话,以便为用户提供更好的个性化服务。

更低的延迟:借助新的流式处理技术和原生音频理解能力,该智能体能够以近于人类对话的延迟来理解语言。

Project Mariner:帮用户完成复杂任务的智能体。

Project Mariner是使用Gemini 2.0构建的早期研究原型,旨在从用户的浏览器开始,探索人机交互的未来。作为研究原型,它能够理解和推理浏览器页面中的信息,包括像素和文本、代码、图像和表单等网页元素,然后通过实验性的Chrome扩展程序使用这些信息为用户完成任务。在 WebVoyager 基准测试(该测试针对智能体在端到端的真实世界网页任务的性能)中,Project Mariner作为单个智能体设置实现了83.5%的工作效率,达到了最先进的水平。

Jules:面向开发者的智能体。

接下来,谷歌会探索人工智能智能体如何通过Jules(一种实验性的AI代码智能体,它可以直接集成到GitHub工作流程中)来协助开发者。它可以解决问题、制定并执行计划,所有这些都在开发者指导和监督下进行。这项工作是谷歌长期目标的一部分,即构建可在所有领域(包括编码)中提供帮助的AI智能体。

游戏和其他领域的智能体。

谷歌使用Gemini 2.0构建了智能体,它们可以帮助用户在电子游戏中做出更明智的决策,可以根据屏幕上的实时画面,分析游戏情况,并为用户提供下一步行动建议。谷歌正与Supercell等顶尖游戏开发团队合作,探索智能体在游戏领域的应用。谷歌通过测试它们在各种游戏中的表现,来评估它们理解游戏规则、应对挑战的能力。这些智能体还可以通过Google Search让用户接触到丰富的游戏相关的知识。谷歌还将Gemini 2.0的空间推理能力应用于机器人领域,尝试让智能体在现实世界中提供帮助。

风险提示:AI技术发展不及预期,AI应用落地不及预期。

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com   

展开
打开“财经头条”阅读更多精彩资讯
APP内打开