核心观点: 尽管尚未有明确的产品定义,但Agent类别与应用场景已迅速丰富。其中,中美大厂Agent发展思路存在差异,北美云厂商主要关注帮助客户高效部署模型和Agent,国内互联网大厂Agent布局仍延续互联网时代用户流量逻辑;而中美B端企业则均关注Agent创建和管理平台。考虑到Agent类产品对算力消耗大,Agent发展有望继续带动AI产业链向上,建议关注后续技术突破→商业化落地拐点。 尽管尚未有明确的产品定义,但Agent类别与应用场景已迅速丰富。工程师流程调优与否对应Agent发展的两条不同路线。学界普遍认为Agent需要具备规划能力;而业界如OpenAI仅强调Agent能够独立完成任务; Anthropic则将Workflow和Agent进行了明确划分。当前随着大模型、 NLP与多模态等技术不断发展, Agent类别与应用场景迅速丰富,有望迎来价值落地。 中美大厂Agent发展思路存在差异,B端厂商则均关注平台化布局。对比当前海内外AI Agent布局现状:北美云厂商主要关注帮助客户高效部署模型和Agent,而B端厂商更聚焦打造Agent创建和管理平台;国内互联网大厂Agent布局仍延续互联网时代用户流量逻辑,通过类“Manus”的通用Agent产品抢占用户,B端企业则类似北美,基于AI/Agent平台选取有价值的产品进行落地。 Agent类产品对算力消耗大,关注后续技术突破->商业化落地拐点。从Manus定价及表现推断,Agent对话交互Token消耗或达十万以上,远超chatbot类AI产品,我们认为原因主要如下:1)长上下文窗口对token的消耗量大;2)多Agent/工具通信造成token量增长;3)验证模块对token的大量消耗;4)多模态场景token消耗量更大;因此AI底层算力需求仍然是产业不可或缺的一环。此外,当前Agent落地仍面临意图混淆、多Agent合作、幻觉等多种问题,学界及业界均积极探索,技术迭代下商业化规模落地可期。 (1)AI产业商业化落地不及预期:目前各环节AI 产品的商业化模式尚处于探索阶段,如果各环节产品的推进节奏不及预期,或对相关企业业绩造成不利影响; (2)市场竞争风险:海外 AI 厂商凭借先发优势,以及较强的技术积累,在竞争中处于优势地位,如果国内 AI 厂商技术迭代不及预期,经营状况或将受到影响;同时,目前国内已有众多企业投入AI产品研发,后续可能存在同质化竞争风险,进而影响相关企业的收入; (3)政策风险:AI技术的发展直接受各国政策和监管影响。随着AI在各个领域的渗透,政府可能会进一步出台相应的监管政策以规范其发展。如果企业未能及时适应和遵守相关政策,可能面临相应处罚,甚至被迫调整业务策略。此外,政策的不确定性也可能导致企业战略规划和投资决策的错误,增加运营的不确定性; (4)地缘政治风险:在全球地缘政治环境的波动下,尤其美国对中国的出口限制或将直接影响国内企业算力芯片的获取,进而影响其产品研发和市场竞争力。同时,地缘政治风险也可能导致 AI 产品开拓海外市场面临障碍,影响相关企业的营收情况。 证券研究报告名称:《AI系列报告5:当前Agent的发展进行到了什么阶段?》 对外发布时间:2025年5月16日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 应瑛 SAC 编号:S1440521100010 SFC 编号:BWB917 研究助理:李楚涵 核心观点: 要点1:用户层面,大厂再次争夺Agent时代流量入口,其中微信最具潜力 此前元宝已经嵌入微信聊天,未来有望成为用户Agent指令最直接的入口,元宝、ima分别提供了基本的AI搜索、个人工作台功能。此外,微信小程序不亚于一个移动应用市场,超过90%的主流APP均已推出微信小程序版本,再叠加公众号、视频号、朋友圈、支付和生活服务,以及聊天记录等用户个人数据(如得到授权),那么微信基本一站式满足了用户几乎所有的线上需求。此外,我们也关注阿里巴巴(夸克)、字节跳动(扣子/豆包)在Agent入口方面的布局和进展。 要点2:技术层面,MCP等标准化协议为行业奠定标准 国产模型性能逐渐满足Agent对任务规划、海量信息检索、数据分析等复杂任务的需求。另一方面,MCP、A2A等Agent标准化协议可以促进不同Agent,以及Agent与外部工具的互联互通,类似互联网的HTTP协议和数码产品的USB/Type-C接口。 要点3:产品层面,Manus、字节扣子等爆款接连涌现 今年涌现的Agent产品,主要包括通用Agent(Manus、扣子空间)和垂类Agent(阿里飞猪的问一问功能)两大类。产品架构已基本成型,后续期待模型性能提升和更多工具接入。 本篇报告分为两个部分,第一部分我们梳理C端Agent的发展现状,包括技术路线、现有的重点产品拆解;第二部分我们以微信Agent为例,展望C端Agent的发展潜力。 今年以来Manus、智谱AutoGLM、字节扣子空间、阿里飞猪“问一问”等现象级产品接连涌现,C端Agent赛道迎拐点。 技术提升:DeepSeek引领新一轮国产模型性能跃迁,更长的上下文窗口、更低的推理成本以及更高的推理效率,逐渐满足Agent对任务规划、海量信息检索、数据分析、定制化作品产出的需求。 生态赋能:Agent标准化协议可以促进不同Agent,以及Agent与外部工具的互联互通,加速形成分工合作的Agent生态。该功能类似互联网的HTTP协议和数码产品的USB/Type-C接口,开发者无需再逐一为接入的外部工具定制接入函数。目前主流的Agent协议包括MCP与A2A两种。 产品体验:主要包括通用Agent(Manus、扣子空间)和垂类Agent(飞猪问一问)两大类。产品架构已基本成型,后续期待模型性能提升和更多工具接入。 Agent产品前端是面向用户的流量入口,后端则是大量需要被调用的工具。互联网大厂积极争夺Agent时代的C端流量入口,微信作为国内用户黏性最高、用户规模最大、功能生态最完善的App,我们认为最具竞争优势。 微信Agent案例拆解一:元宝是国内Chatbot赛道Top3产品,多模型+稀缺内容,用户天花板高。中长期看,元宝有望为微信Agent输出AI搜索和创作能力。 多模型策略,能力互补,体验更全面:虽然初期元宝流量的快速增长得益于接入DeepSeek R1模型,但后续依靠自研混元模型的快速迭代,元宝有了更多差异化的功能,比如混元T1的快思考模式、文生图以及视觉理解等。 拥有稀缺的公众号优质内容,未来有望覆盖视频号。公众号是一个相对封闭的稀缺内容池,也是元宝独家的搜索来源。24年公众号产出超4亿篇文章,阅读量10万+的文章超30万篇。展望后续,随视频理解能力提升,元宝也有望覆盖视频号的内容(截至24年6月超3.6亿个原创视频,超1300万创作者) 功能还在迭代,兼具生产力与娱乐消费:目前元宝的主界面是一个简洁的搜索框,与微信相近的绿色调,产品直观感受更加偏向生产力工具,但我们也注意到,元宝正在灰测实时语音通话、智能体广场等更易用和轻松娱乐的功能。 微信Agent案例拆解二:ima是高度创新的智能工作台,同样有望承接微信Agent的个人知识存储和管理功能。如果简单粗暴地来类比,ima≈网盘+在线云笔记+AI搜索+知识星球。 核心功能1:个人知识库,满足“本地部署”需求。目前每个用户可以在ima上传的文件上限是30G,微信公众号和全网链接也可以一键上传至ima中,来形成个人知识库。用户可以限定在某一个知识库范围内进行AI搜索,针对性地检索所需内容。 核心功能2:共享知识库,有望形成类“知识星球”的社区 。用户可以将自己创建的个人知识库调整为共享知识库,允许其他用户查看。可以采取类似知识星球的运营模式,是新的知识付费入口。目前ima内已上线数百个共享知识库,数量增速快,其中加入人数超7000人的知识库有5个,以金融法律、AI应用科普知识库为主,创建人主要为科普类自媒体。 微信Agent案例拆解三:完整状态下,微信Agent“入口轻”,但具备“调用一切”的基础,可避免硬件方、模型方调用权限。小程序生态之完整性不亚于一个移动应用市场,超过90%的主流APP均已推出微信小程序版本,再叠加公众号、视频号、朋友圈、支付和生活服务,再叠加聊天记录等用户个人数据(如能得到授权),那么微信基本一站式满足了用户几乎所有的线上需求。 风险提示:版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 对外发布时间:2025年5月12日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨艾莉 SAC 编号:S1440519060002 SFC 编号:BQI330 杨晓玮 SAC 编号:S1440523110001 核心观点 当前预训练大模型边际收益受制于Scaling Law已经逐渐达到瓶颈,更强大的Agent(智能体)成为大模型厂商未来发力的重要方向。我们认为,根据agent的技术框架,其发展基本经历了三个阶段,即工作流框架+预训练模型、工作流框架+推理模型、端到端智能体框架+推理模型。随着以OpenAI Deep Research为代表的第三代智能体的推出,智能体的强大潜力与Scaling Law加速阶段正逐渐显现。我们认为,受益于国产推理模型的强大能力基座,未来国产第三代智能体将展现出巨大的竞争力。 AI Agent成为大模型公司发力方向。当前,大模型成本投入过大,预训练边际收益在放缓,数据面临边界,以及以DeepSeek为代表的开源模型崛起,单纯的API模式无法支撑模型厂商盈利。因此,更聪明,能推理,能调用不同工具,能满足个性化需求,在应用层可实现更高价值链的AI Agent成为大模型公司急需发力的方向。 端到端强化学习的智能体框架Agent上限更高。围绕架构可以将智能体划分为Workflow(工作流)和端到端的Agent(智能体)两类框架,后者上限更高。其核心突破在于主动决策与动态规划,实现了内化思维链(CoT)与行动链(CoA)生成能力、动态选择最优工具优化API调用、跨会话行为优化等效果。相较于传统工作流,端到端Agent框架标志着AI系统从“流程执行者”向“目标驱动型决策主体”的范式跃迁。而工作流驱动的Agent核心依赖人工设计的规则与提示词通过结构化步骤完成任务,这类工作流的典型特征表现为被动响应机制。 我们认为,智能体可以主要分为三类:一是纯基于工作流框架的智能体。二是基于工作流框架,依靠推理模型进而具备长思维链能力的智能体。三是基于端到端智能体框架,实现CoT+CoA双轮驱动任务推进的智能体,这一代智能体最大限度地拓展了自身能力边界。根据大模型Scaling Law,第三代智能体的能力目前还处于加速扩展的阶段,主要受益于推理模型的升级和强化学习技术的快速突破。 随着OpenAl Deep Research和Claude 3.7 Sonnet的推出,我们看到针对任务的强化学习在推理过程发挥强大作用,更在工具调用,任务执行方面体现了强大潜力。我们认为,国产模型在强化学习的出色表现,将为下一步Agent的发展打下坚实基础,相信4月开始将陆续有国产优秀的Agent涌现出来,成为AI落地的重要场景。 大模型技术发展不及预期:大模型属于先进AI算法,若后续大模型算法更新迭代效果不及预期,则会影响大模型演进及拓展,进而会影响其商业化落地等; 商业化落地不及预期:大模型的商业落地模式在业界中普遍处于探索阶段,用户对于大模型的接受程度和商业化变现能力可能不及预期; 算力基础设施支持不及预期:美国制裁中国高科技企业,对中国形成芯片、算力的封锁,大语言模型训练过程中需要大量算力资源,需要关注中美关系带来的算力的压力; 政策监管力度不及预期:大语言模型带来新的网络生态商业,尚属于前期成长阶段,政策监管难度加大,相关法律法规尚不完善,政策监管力度可能不及预期。 数据数量与数据质量不及预期:大型语言模型需要大量的高质量数据进行训练,若数据数量和质量存在短板,则会影响大语言模型效果。 对外发布时间:2025年3月30日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 于芳博 SAC 编号:S1440522030001 庞佳军 SAC 编号:S1440524110001 核心观点:OpenAI 3月27日官宣Agents SDK加入MCP服务协议,后续ChatGPT桌面应用和Responses API也将快速支持。在AI Agent中,MCP相较于传统Function Calling外部工具的调用方式,通过主机、服务器和客户端的解耦,能够大幅降低重复开发成本,同时提升了各类AI工具的互联互通能力,亦为全球复现Manus的关键技术。随着头部公司的加速支持,MCP生态边界有望进一步拓展,加速AI产业发展。 OpenAI官宣加入MCP,Agent数据标准化更进一步。2025年3月27日凌晨,OpenAI CEO山姆·奥特曼宣布对Agents SDK进行了重大更新,支持了由Anthropic于2024 年底推出的MCP(Model Context Protocol,模型上下文协议)服务协议,同时ChatGPT桌面应用和Responses API也将很快支持MCP服务协议。 正如Anthropic介绍,随着模型推理能力逐步提升,AI Agent已经成为各机构广泛应用的产品之一。而不同的模型和Agent往往存在数据隔离,使得系统难以规模化拓展。此时,MCP作为通用的开放协议,旨在通过标准化接口实现大语言模型(LLM)与外部数据源及工具的无缝集成,使AI模型能够从业务工具、软件、数据库以及应用开发环境等来源中获取数据完成任务,大幅提升了各类AI工具的互联互通能力。 从Function Calling到MCP,工作流解耦价值凸显。在MCP协议之前,传统AI系统架构主要通过Function Calling模式进行外部工具的调用,此时开发者通常需要完成以下步骤:1)编写详细的prompt,包含工具名称、描述和使用说明;2)定义工具函数(tools);3)针对不同LLM API适配不同的function calling格式;4)编写工具调用逻辑代码;5)编写工具响应处理逻辑代码。此时,由于模型调用、工具定义、执行逻辑和结果处理都在同一个应用程序中完成,因此每当工具定义发生变化,通常需要重新启动整个服务。此外,不同LLM供应商的Function calling格式存在显著差异,进一步增加了开发和维护成本。 而使用MCP之后,Host(主机)、Server(服务器)和Client(客户端)被解耦为三个独立的组件,各类工具函数可以在服务运行时被动态的添加、修改或删除,解决了传统Function calling重新启动整个服务的难题。同时,尽管此时开发人员仍然需要进行工具函数的开发和描述定义,但工具的调用、响应等均由MCP标准化处理,使得工具库可以被集中管理和维护,不同的应用程序复用下大幅降低重复开发成本。 MCP成为全球复现Manus的关键技术。3月6日凌晨,通用Agent Manus引发新一轮AI应用落地的想象空间,而后全球团队接连复现,MCP服务在其中起到了关键的作用。以字节3月18日发布的AI Agent TARS为例,其通过支持MCP协议,内置搜索、文件编辑、命令行等多种工具,实现对复杂工作流程的高效处理,同样实现深度研究(Deep Research)、电脑操作(Operator)等多项能力。不过,Manus的开发实际早于MCP,因此并未使用该方式实现Agent调用,而是利用了另一个开源研究成果CodeAct,通过可执行代码操作将Agent调用动作合并统一。 头部公司加速支持,MCP服务有望加速AI产业发展。MCP服务协议于24年11月开源以来,Block、Apollo、Replit等公司加速支持,直至25年2月,MCP生态进一步爆炸增长,已有超过1000个由社区构建的MCP服务器可供使用。目前MCP市场主要由客户端、服务器、市场和服务器托管解决方案构成。其中,客户端和服务器对应MCP架构中的顶层组件,由市场和托管解决方案将服务向更多开发人员推广。随着MCP生态边界进一步拓展,更多实用工具的适配将促进用户进一步增长,正反馈机制有望加速AI产品落地。 总结:OpenAI 3月27日官宣Agents SDK加入MCP,后续ChatGPT桌面应用和Responses API也将快速支持。在AI Agent中,MCP相较于传统Function Calling外部工具的调用方式,通过主机、服务器和客户端的解耦,大幅降低重复开发成本,同时提升了各类AI工具的互联互通能力,亦为全球复现Manus的关键技术。随着头部公司的加速支持,MCP生态边界有望进一步拓展,加速AI产业发展。 风险提示:(1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响。 DeepSeek-R1作为开源模型跻身全球第一梯队,加速AI厂商内卷。其中OpenAI 已统一模型路线,在GPT-5中将为免费用户提供可无限使用的“标准智能”;而百度则宣布文心模型将于4月1日开始全面免费,并将在6月30日开源下一代文心4.5系列模型。在用户量激增下DeepSeek频繁出现“服务器繁忙”提示的背景下,以及腾讯宣布接入DeepSeek模型刺激下,均有望带动API调用量增加和本地化部署需求,1)利好有数据、有客户、有场景的软件企业,AI产品有望带动公司ARPU提升和项目单价上升;2)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。 风险提示:(1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响。 证券研究报告名称:《腾讯接入DS,DS带动私有化部署需求增加和Agent加速发展》 对外发布时间:2025年2月16日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 应瑛 SAC 编号:S1440521100010 核心观点: 软件估值处于底部,7月以来涨幅主要定价降息+IT预算修复,此外10月底以来Agent叙事不断强化,市场寻找此前估值处于低位的软件股交易Agent催化修复估值,后续继续等待Agent商业化逻辑。我们认为,过去1-2年的AI商业化尝试让行业形成普遍共识,Chatbot形式交互成本较高,融入企业工作流/用户交互流较困难,需要进一步调整架构以融入流程。Agentforce等产品初步反馈积极,Snowflake看到AI/ML的初步收入,行业展望IT需求边际向好&AI商业化逐步落地,趋势乐观。 对外发布时间:2025年1月10日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 武超则 SAC 编号:S1440513090003 崔世峰 SAC 编号:S1440521100004 SFC 编号:BUI663 应瑛 SAC 编号:S1440521100010 许悦 SAC 编号:S1440523030001 向锐 SAC 编号:S1440524070008 核心观点: OA和ERP构成了企业数据交汇的核心数字化基座,赋能企业经营全流程。在本轮生成式AI浪潮中,自然语言交互+学习能力提升为核心发展方向,Agent则进一步推动了AI应用落地。其中,OA/ERP通过与Agent结合,能够自动化执行完成复杂任务,预计将成为新的企业入口级平台。当前,国内外OA/ERP厂商均积极布局Agent发展,相关领域有望迎来商业化快速落地。 风险提示:(1)AI产业商业化落地不及预期:目前各环节AI 产品的商业化模式尚处于探索阶段,如果各环节产品的推进节奏不及预期,或对相关企业业绩造成不利影响;(2)市场竞争风险:海外 AI 厂商凭借先发优势,以及较强的技术积累,在竞争中处于优势地位,如果国内 AI 厂商技术迭代不及预期,经营状况或将受到影响;同时,目前国内已有众多企业投入AI产品研发,后续可能存在同质化竞争风险,进而影响相关企业的收入;(3)政策风险:AI技术的发展直接受各国政策和监管影响。随着AI在各个领域的渗透,政府可能会进一步出台相应的监管政策以规范其发展。如果企业未能及时适应和遵守相关政策,可能面临相应处罚,甚至被迫调整业务策略。此外,政策的不确定性也可能导致企业战略规划和投资决策的错误,增加运营的不确定性;(4)地缘政治风险:在全球地缘政治环境的波动下,尤其美国对中国的出口限制或将直接影响国内企业算力芯片的获取,进而影响其产品研发和市场竞争力。同时,地缘政治风险也可能导致 AI 产品开拓海外市场面临障碍,影响相关企业的营收情况。 核心观点 在Salesforce的FY3Q25业绩会上,管理层着重Agentforce的亮眼表现,仅1周完成200笔订单,此外四季度将全球招聘1400位销售人员,加大推广该AI Agent产品。Agentforce连通公司的销售、服务、营销、分析、数据云、Slack等全产品线,为客户实现提升工作效率、优化服务体验、降低人员成本等目的。 Agentforce有望大幅减少客户的员工成本。以附加服务的方式推广,并按使用量付费,每次对话1美元,据公司表示定价大幅低于8-10美元每次的人工销售成本。 重点关注12月17日Agentforce 2.0发布会。 简评 1、美股软件公司如何在业务中融入AI Agent? Salesforce发布2025财年三季报,业绩会上,CEO和COO都将未来重点放于Agentforce。CEO表示公司已成为全球数字劳动力市场的最大供应商。Agentforce自10月24日上线,并在月末达成200笔订单。截至电话会当日,包括FedEx、Adecco、埃森哲、ACEHardware、IBM、加拿大皇家银行财富管理等众多公司,都正在Salesforce平台上借助Agentforce打造它们的数字劳动力队伍。公司展望现有的13.5万客户未来都有望通过Agentforce来整理数据、完善工作流程。 Agentforce是Salesforce推出的AI助手服务。Agentforce将销售、服务、营销、分析、数据云、Slack等多种功能集成在一个平台上,打破了各业务之间的孤立状态,实现了数据和工作流程的无缝衔接。其能为客户实现1)提升工作效率:帮助客户处理大量重复性的工作,使员工能够将更多时间和精力投入到更具战略性和价值的工作中;2)优化客户体验:零售商的客户可以在需要时随时获得帮助,并且能够得到更贴合自身需求的解决方案;3)降低成本:减少了对人工的依赖,降低了企业的人力成本。 Agentforce在使用效果方面的具体案例包括: 1)速度:约翰威立国际出版集团表示Agentforce解决问题的速度比之前的聊天机器人快了40%以上。 2)即时:伦敦希思罗机场作为全球最繁忙的机场之一,通过Agentforce能够即时、准确且同时回复数千名旅客的问询。 3)跨区域:SharkNinja是2025财年三季度的新客户。其选择了Agentforce和商务云,以便为28个国际市场的客户提供全天候个性化支持,并统一其服务运营。 公司表示Agentforce在使用效果方面表现出众。Agentforce出现“幻觉”的情况都极少,因为其不仅是基于17种语言、74万份文档的Salesforce数据和元数据,它还基于每个客户的数据,比如采购、退货等数据。公司的200-300PB数据让Agentforce拥有行业领先的优势,因此Agentforce将会更加准确,相比其他产品出现“幻觉”的情况最少。各行业头部公司的使用效果案例包括: 1)全球领先的招聘网站Indeed每秒有3个人在其平台上实现招聘。该招聘网站将公司的Data Cloud服务作为其数据架构,借助Agentforce将5.8亿求职者档案与300多万雇主进行匹配,其目标是到2030年缩短招聘时间,帮助300万人克服就业障碍。 2)全球领先的人才解决方案供应商Adecco每年要处理3亿份求职申请,但以往他们根本无法及时处理或回复绝大多数申请。但现在,Agentforce能够以惊人的规模对海量简历进行筛选,全天候地将求职者与岗位机会进行匹配。此外,Agentforce还能协助求职者完善简历,增加他们获得岗位的机会。 3)智能家居安防供应商Vivint一直饱受电话客服高流失率的问题,现在借助Agentforce,Vivint正在打造一支数字支持团队,通过他们的应用程序、网站自主提供支持,对各类问题进行故障排查。此外,Vivint还计划利用Agentforce进一步实现技术人员排班、付款请求、主动解决问题、设备遥测数据使用等环节的自动化,因为Agentforce覆盖了包括Slack在内的整个Salesforce产品线。 Agentforce以附加服务的方式推广,并按使用量付费。据业绩会,Agentforce是基于使用量的收费结构,每次对话收费 2 美元,并且在作为Service Cloud的附加服务进行推广时,客户的选择意愿更高。2美元每次对话的收费标准对比销售人员的员工成本具有高性价比。对比一个销售专员一年的工资与KPI实现度,人工成本是8-10美元/次对话,因此Agentforce具有更高性价比。 公司看好Agentforce增收潜力,全球招聘销售人员。尽管在业绩指引中,公司预计四季度与Agentforce相关的预订业务不会对cRPO(未来12个月内递延收入/订单的总和)产生重大贡献。但公司表示,为了抓住Agentforce日益增长的需求,公司在2025财年四季度在全球招聘1400名客户经理,而且使用最新的SDR Agent和Sales Coach Agent来助力每一位销售人员。Agentforce SDR和Sales Coach是公司于年中推出的通过AI自动化辅助销售的服务,其中SDR Agent以自然语言自主与入站线索(潜在客户)进行互动,解答疑问、处理异议,并为人工销售人员预约会议;Sales Coach Agent在探索、推销或谈判通话期间,自主与销售人员进行角色扮演,模拟买家角色。 建议关注12月17日Agentforce 2.0发布会。尽管10月24日才推出Agentforce,但公司将于12月17日在旧金山举办Agentforce 2.0发布活动。 AI Agent产品的付费客户增长不及预期的风险、Agentforce 2.0功能或效果更新不及预期的风险、焦点科技的AI Agent产品的ARPPU提升不及预期的风险、AI Agent功能满意度不及预期的风险、谷歌等买量成本上升的风险、研发费用上升的风险、OpenAI等美国公司限制焦点科技等中国公司使用其服务和技术的风险、焦点科技面对阿里国际站竞争的风险、SMB客户需求不及预期的风险、战争导致宏观环境恶化的风险、全球经济增长不及预期的风险、国内外贸支持政策不及预期的风险、国内外贸补贴发放不及预期的风险。 对外发布时间:2024年12月7日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨艾莉 SAC 编号:S1440519060002 SFC 编号:BQI330 蔡佳成 SAC 编号:S1440524080008 AI:AI Agent加速落地。 风险提示:版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 对外发布时间:2024年12月1日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨晓玮 SAC 编号:S1440523110001 蔡佳成 SAC 编号:S1440524080008 Agent目前已经成为全球科技巨头重点发力方向,C端、B端均开始产品的快速迭代,C端更重视综合能力,B端更强调对业务流的理解、群体智能和专业Agent的打造,预计各类Agent将在2025年进入快速落地阶段。 Agent:Agent目前已经成为全球科技巨头重点发力方向,包括PC端的Claude 3.5 Sonnet、手机端的Auto GLM以及企业业务流中的Salesforce和微软的Agent产品,同时多Agent协作的群体智能也已开始逐步商用化,如百度的秒哒,过去复杂、多步骤的任务均可通过Agent实现。我们认为,C端和B端的Agent会有所区别,C端的个人助理更强调综合能力以及生活场景的解决能力,B端的Agent更强调术业有专攻,既要有核心Agent具有总览能力,根据任务准确生成业务执行流,也要有大量的Agent具有独立的技能和专长,能够处理特定的任务,并且Agent之间可以彼此沟通。随着Agent的普及,推理算力消耗将会大增,多个Agent之间通信、协作时,消耗的token、算力指数级增长。 智谱华章类:独立第三方AI手机助手 手机端Agent——AutoGLM: 个人生活助理时代来临。2024年10月25日,智谱带来了自己全新的AI Agent产品AutoGLM,其适配于当下中国人的使用习惯,为手机端Agent。在性能对比上,AutoGLM在Phone Use 和 Web Browser Use 上均表现出了更强的性能。在官方的演示视频中,AutoGLM可以根据用户指令,自动完成:朋友圈评论&点赞、微信抢红包/回复、外卖软件下单、订车票等个性化操作,智能化程度很高。 目前该功能仅针对安卓手机用户开放内测,博主测试其可实现限定条件下的酒店预定。在博主“数字生命卡兹克”的测评视频中可以看到,在“帮我订今天罗湖地铁站附近600元以内的酒店”的任务中,AutoGLM可实现:1)自动打开携程APP,在地点中输入了深圳和罗湖地铁站;2)并选定了目标日期的大床房,并按照价格进行筛选;3)询问客户在列表酒店中选择;4)进入下单和付款界面。 尚不能完全满足用户的个性化需求,Agent仍有进步空间。在演示demo中,我们可以看到AutoGLM已经非常熟练的掌握使用微信、淘宝、美团、携程等APP,但也仍有进步的空间。如在官方演示视频中,AutoGLM在下单瑞幸咖啡时支付了18元以上,有着明显的溢价,似乎还没有掌握这些品牌复杂的“抢优惠卷”玩法。随着互联网软件的种类、功能越来越丰富,智能体能否熟练的掌握每个软件的使用方法,满足不同用户的个性化需求,真正成为个人助手值得期待。令人欣喜的是,在从以聊天为主的大模型1.0时代迈入个人智能助理的大模型2.0时代,以智谱为代表的国产AI公司完成了从追赶者,到探索者的身份转换。 PC端Agent——Claude:个人工作助理新阶段。10月23日,Anthropic推出全新的Claude 3.5 Haiku和升级版Sonnet。Sonnet的能力不仅全面超过GPT- 4o,更带来全新的AI体验——计算机使用能力,可以像人类一样操作电脑。它的功能包括移动光标、点击、通过虚拟键盘输入等,标志着AI真正从聊天机器迈入使用工具解决问题的新阶段。 Claude3.5 Sonnet性能领先。从下图可以看到,根据Anthropic的测试数据,其升级后的Sonnet在逻辑、知识、代码、数学、视觉、工具使用等领先GPT-4o和Gemini 1.5。因为o1模型与传统的预训练模型的技术路线差异较大,因此并未放入比较,但是也有其他研究者在推特上发布了自己的测评结果,Sonnet的性能优于o1-mini。 除了性能以外,Claude展现了使用计算机的全新能力。与过去AI Agent直接通过代码/程序,后台联网搜索/操作应用不同的是,Claude可以像人类一样去使用电脑。其方式是先看屏幕,再使用鼠标操作,再通过思考,重复以上步骤直到完成目的。在演示中,Claude 3.5 Sonnet 不仅可以理解多种人类的复杂任务,包括行程规划、分析数据、编写代码。还可以根据任务内容,直接浏览电脑桌面上的文件,理解文件内容,操作浏览器查询,下载安装包,编写程序,制作表格等。Claude会直接展示在电脑上操作的每一步,并给出对应的理由,当出现bug时,Claude还会尝试不同的解决办法,真正熟练的使用电脑上的不同工具。 升级版的 Claude 3.5 Sonnet 现在对所有用户开放。开发者可以在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用「计算机使用」的测试版进行构建。新的 Claude 3.5 Haiku 将晚些时候开放,Haiku作为模型参数最小、速度最快的模型,已经在性能上超过了Claude 3.0的最强、最大的Opus模型。 下图是Anthropic的开发者关系负责人Alex Albert展示的一个演示的demo。开始时,Alex给Claude指示:1)去美国政府数据网,下载一个最近有趣的数据。2)安装sklearn(一个机器学习工具包)和bash相关工具(执行程序的工具包)。3)写一个python文件,把数据分为训练集和验证集,然后创建一个分类器并训练。同时还给出提示,需要Claude检查数据,以免出现模型不收敛的情况。4)最后使用浏览器可视化的展示分类的结果。 在上述过程中,最能体现Claude表现出了像人一样操作电脑的智能是三点:1)Claude理解了人类的意图:比如下载最近有趣的数据是一个很模糊的指令,但是它在数据网上找到了2024年4月的纽约空气质量数据,并给出找这个数据的解释:该数据适合分类器训练,并且数据时间很新,同时还有适合解读的CSV格式可供下载。2)体现了思维链的过程:Claude将任务拆解成了若干步骤,并对每一步给出了详细的解释,并使用合适的工具去完成规划。3)自我调整的过程:在任务过程中,多次碰到失败,比如文件无法打开,该Agent想到了绝对路径可能是错误的,于是使用相对路径来打开文件。遇到浏览器闪崩可以再次打开浏览器并展示结果。虽然目前Claude还有许多不足,比如任务的成功率有待提高(很多任务无法一次完成,或经常失败),比如目前的操作仍主要在浏览器,还无法对更多的应用进行操作,比如Office软件、微信、Wind等。但这仍是一个重大的进步,过去AI大模型主要作为一个聊天机器人、多模态机器人,进入了可以自如使用工具的阶段。这背后反应的是Claude在AI Agent、多模态理解、思维链上的研究成果。 其他科技巨头也将陆续推出类似的AI智能体产品。OpenAI透露正在组建一支多智能体的研发队伍,据传已经可以操控计算机完成在线订餐、自动查询解决编程难题等任务。苹果在今年5月发布了可以让AI理解手机屏幕的Ferret-UI模型,预计在2025年发布跨多个APP屏幕识别能力。微软也开源了屏幕解析工具OmniParser,可以完成自动订票等功能。谷歌的Geimini 2.0也有望在12月推出,同时正在开发同类新项目「Project Jarvis」,能将Chrome网页任务自动化。在这样的大背景下,预计在不久的将来,我们将进入大模型时代的2.0时代:AI Agent。 风险提示:版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 证券研究报告名称:《人工智能2025年投资策略报告:算力为基,自主可控大势所趋,Agent及B端应用崛起》 对外发布时间:2024年11月25日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 于芳博 SAC 编号:S1440522030001 方子箫 SAC 编号:S1440524070009 辛侠平 SAC 编号:S1440524070006 AI Agent元年开启。 智谱AutoGLM成为国内首个公开可用、完成复杂任务的AI Agent。AutoGLM支持自动操控App,集成语音交互、屏幕识别、任务规划等一系列AI功能,是国内首个公开可用、完成复杂任务的AI Agent,目前可以在安卓端申请使用。AutoGLM支持调用微信、淘宝、美团等8个常用APP,自动实现订酒店、总结攻略、转发聊天等一系列操作。我们认为端侧AI Agent,未来手机硬件厂商、应用APP、大模型公司三方均有发展空间。 AI应用的发展将经历聊天机器、AI Agent、数字员工/机器人三大阶段,2025年有望成为AI Agent元年。苹果已发布Apple Intelligence,演示了如何使用Siri控制代理手机。iOS18.1已正式融入AI功能,包括写作工具、相册管理;24年12月苹果siri还将集成ChatGPT,进一步提高siri的智能化程度。另据彭博、新浪财经,OpenAI正在开发一款名为“Operator”的AI Agent,计划于25年1月发布。这款工具能够自动执行复杂任务,包括编写代码、预订旅行等。 风险提示: 版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 证券研究报告名称:《传媒互联网2025年投资策略报告:AI应用落地可期,IP消费持续景气》 对外发布时间:2024年11月26日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨艾莉 SAC 编号:S1440519060002 SFC 编号:BQI330 杨晓玮 SAC 编号:S1440523110001 蔡佳成 SAC 编号:S1440524080008 AI Agent密集发布,“Her”现实化更进一步。除端侧AI及AI工具软件外,近期AI Agent为C端和B端落地的重要方向。2024年10月10日,字节跳动豆包发布AI 智能体耳机 Ola Friend,可接入豆包大模型,并与豆包 APP 深度结合,通过语音交互实现信息查询、旅游出行、英语学习及情感交流等功能。10月25日,智谱AI推出自主智能体AutoGLM,其作为AI助手,能帮助用户在手机和网页上完成各种操作,包括点外卖、发微信、写点评、给朋友圈评论等,用户只需要通过语音即可发布指令。10月26日,金蝶也正式发布AI 管理助手苍穹APP,面向员工提供制度问询等功能;面向HR提供智能招聘、智能调配等能力;面向管理者提供人力分析,提升决策的科学性。10月28日苹果发布IOS 18.1系统更新,向iPhone15 Pro版本及iPhone 16全部机型引入Apple Intelligence,提供写作辅助、照片清理和通知摘要等功能。此外,360智脑亦能对职能部门提供“人力资源助手”、“法务助手”等智能体,提高工作效率。 我们认为,当前AI落地进一步加速,尤其Agent已成为各类厂商主流尝试方向,有望改变多流量入口形式。就C端场景而言,端侧AI作为新一代计算平台形态多样,产品落地确定性较强,软件则待高频应用爆发;B端场景中AI生产力工具商业化已呈现加速趋势,有望为企业带来业绩增长拐点。 风险提示: (1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求; (2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失; (3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化; (4)国际环境变化影响:目前国际形势动荡,对于海外收入占比较高公司可能形成影响,此外美国不断对中国科技施压,导致供应链安全风险。 证券研究报告名称:《2025年计算机年度策略:百炼成金(更新)》 对外发布时间:2024年11月26日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 应瑛 SAC 编号:S1440521100010 王嘉昊 SAC 编号:S1440524030002 核心观点: 1.10月23日,Anthropic推出全新Claude 3.5 Haiku和升级版Sonnet。Sonnet能力不仅全面超过GPT- 4o,更带来全新AI体验:计算机使用,可以像人类一样操作电脑:查看屏幕、移动光标、点击、通过虚拟键盘输入等,标志着AI真正从聊天机器迈入使用工具解决问题的新阶段。 2.在演示中,Claude可以理解复杂任务,包括行程规划、分析数据、编写代码。还可以根据任务,直接浏览电脑桌面上的文件,操作浏览器查询,编写程序等。Claude会直接展示在电脑上的操作,并给出对应理由,Claude还会尝试不同方法解决出现的bug。 3.10月25日,智谱推出全新AI智能体:AutoGLM 。与Claude操作电脑不同,其主要应用在手机,可以根据用户指令,自动完成:朋友圈评论&点赞、微信抢红包/回复、外卖下单、订车票等个性化操作。 行业变化 1.1 Claude 3.5推出,性能最优,像人类一样操作电脑 10月23日,Anthropic推出全新的Claude 3.5 Haiku和升级版Sonnet。Sonnet的能力不仅全面超过GPT- 4o,更带来全新的AI体验:计算机使用能力,可以像人类一样操作电脑:移动光标、点击、通过虚拟键盘输入等,标志着AI真正从聊天机器迈入使用工具解决问题的新阶段。 从图表1中可以看到,升级后的Sonnet在逻辑、知识、代码、数学、视觉、工具使用等几乎全方面都超过了目前的最优模型GPT-4o和Gemini 1.5。因为o1模型与传统的预训练模型的技术路线差异较大,因此并未放入比较,但是也有其他研究者在推特上发布了自己的测评结果,Sonnet的性能优于o1-mini。 除了性能以外,这次最让人惊喜的是Claude展现的全新能力:计算机使用。与过去AI Agent直接通过代码/程序,后台联网搜索/操作应用不同的是,这一次Claude真正像人类一样去使用电脑:先看屏幕,再使用鼠标操作,再通过思考,重复以上步骤直到完成目的。在这个过程中,我们可以很明显的看到,Claude每一次截图查看屏幕,移动光标/点选,并给出思考的全过程。 升级版的 Claude 3.5 Sonnet 现在对所有用户开放。开发者可以在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用「计算机使用」的测试版进行构建。新的 Claude 3.5 Haiku 将晚些时候开放,Haiku作为模型参数最小、速度最快的模型,已经在性能上超过了Claude 3.0的最强、最大的Opus模型。 在演示中,Claude 3.5 Sonnet 不仅可以理解多种人类的复杂任务,包括行程规划、分析数据、编写代码。还可以根据任务内容,直接浏览电脑桌面上的文件,理解文件内容,操作浏览器查询,下载安装包,编写程序,制作表格等。Claude会直接展示在电脑上操作的每一步,并给出对应的理由,当出现bug时,Claude还会尝试不同的解决办法,真正熟练的使用电脑上的不同工具。 图表2是Anthropic的开发者关系负责人Alex Albert展示的一个演示的demo。开始时,Alex给Claude指示:1)去美国政府数据网,下载一个最近有趣的数据。2)安装sklearn(一个机器学习工具包)和bash相关工具(执行程序的工具包)。3)写一个python文件,把数据分为训练集和验证集,然后创建一个分类器并训练。同时还给出提示,需要Claude检查数据,以免出现模型不收敛的情况。4)最后使用浏览器可视化的展示分类的结果。 随之,Claude开始操作电脑:1)使用工具:截图,以查看当前的电脑桌面并找到浏览器。(每一次查看都需要使用这个工具)2) 使用工具:鼠标移动&使用工具:左键单击打开浏览器。3)使用工具:键盘输入网址。接下来就重复以上三步,查看页面,并移动鼠标点选,并输入想要的数据。4)下载完成后,Claude自动打开数据进行分析。其中遇到了几步bug,包括路径错误、数据类型错误等,Claude都通过几次尝试解决了。5)通过编写的python代码,完成了分类器的训练并展示结果。 在上述过程中,最能体现Claude表现出了像人一样操作电脑的智能是三点:1)Claude理解了人类的意图:比如下载最近有趣的数据是一个很模糊的指令,但是它在数据网上找到了2024年4月的纽约空气质量数据,并给出解释,这是一个很适合分类器训练的数据,而且数据的时间很新,同时还有适合解读的CSV格式可供下载。2)体现了思维链的过程:Claude将任务拆解成了若干步骤,并对每一步给出了详细的解释,并使用合适的工具去完成规划。3)自我调整的过程:在任务过程中,多次碰到失败,比如文件无法打开,它想到了绝对路径可能是错误的,于是使用相对路径来打开文件。遇到浏览器闪崩可以再次打开浏览器并展示结果。 图表3展示了另一个例子,是让Claude打开桌面上的简历,并在Anthropic官网投递合适的职位。Claude同样通过查看桌面、移动鼠标&点击、键盘输入等工具完成了这个任务。Claude首先查看了简历,明白了用户是一名代码背景的求职者,随后在Anthropic官网中找到相关招聘信息,并选中“高级软件工程师”这个职位进行投递,同时完成了页面上所有的求职信息的填写。求职过程中繁琐的搜索、填表,被Claude轻松完成了。 Claude 3.5 Sonnet已经展示出了全新的AI交互方式:操作电脑。虽然目前Claude还有许多不足,比如任务的成功率有待提高(很多任务无法一次完成,或经常失败),比如目前的操作仍主要在浏览器,还无法对更多的应用进行操作,比如Office软件、微信、Wind等。但这仍是一个重大的进步,过去AI大模型主要作为一个聊天机器人、多模态机器人,进入了可以自如使用工具的阶段。这背后反应的是Claude在AI Agent、多模态理解、思维链上的研究成果。 在这样的背景下,其他科技巨头也将陆续推出类似的AI智能体产品进行应对。OpenAI透露正在组建一支多智能体的研发队伍,据传已经可以操控计算机完成在线订餐、自动查询解决编程难题等任务。苹果在今年5月发布了可以让AI理解手机屏幕的Ferret-UI模型,预计在2025年发布跨多个APP屏幕识别能力。微软也开源了屏幕解析工具OmniParser,可以完成自动订票等功能。谷歌的Geimini 2.0也有望在12月推出,同时正在开发同类新项目「Project Jarvis」,能将Chrome网页任务自动化。在这样的大背景下,预计在不久的将来,我们将进入大模型时代的2.0时代:AI Agent。 1.2 智谱推出AI智能体AutoGLM,专注手机端使用 在Claude 3.5发布两天后,智谱也带来了自己全新的AI Agent产品AutoGLM。相比Claude 3.5专注于电脑端不同,AutoGLM则是真正适配于当下中国人的使用习惯,推出了手机端的AI 智能体,效果的惊艳程度有过之而无不及。同时在性能对比上,AutoGLM在Phone Use 和 Web Browser Use 上均表现出了更强的性能。 在官方的演示视频中,AutoGLM可以根据用户指令,自动完成:朋友圈评论&点赞、微信抢红包/回复、外卖软件下单、订车票等个性化操作,智能化程度很高,效果很惊艳。 然而目前该功能仅针对安卓手机用户开放内测,因此实际的测评效果还比较少。在博主“数字生命卡兹克”的测评视频中可以看到,在“帮我订今天罗湖地铁站附近600元以内的酒店”的任务中,AutoGLM1)自动打开携程APP,在地点中输入了深圳和罗湖地铁站,2)并选定了目标日期的大床房,并按照价格进行筛选,3)询问客户在列表酒店中选择,4)进入下单和付款界面。 在演示demo中,我们可以看到AutoGLM已经非常熟练的掌握使用微信、淘宝、美团、携程等APP。但也仍有进步的空间,例如在官方演示视频中,AutoGLM在下单瑞幸咖啡时支付了18元以上,有着明显的溢价,似乎还没有掌握这些品牌复杂的“抢优惠卷”玩法。随着互联网软件的种类、功能越来越丰富,智能体能否熟练的掌握每个软件的使用方法,满足不同用户的个性化需求,真正成为个人助手值得期待。令人欣喜的是,在从以聊天为主的大模型1.0时代迈入个人智能助理的大模型2.0时代,以智谱为代表的国产AI公司完成了从追赶者,到领路人的身份转换。 风险提示:北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期;下游需求不及预期影响公司正常生产和交付,导致收入及增速不及预期;信息化和数字化方面的需求和资本开支不及预期;市场竞争加剧,导致毛利率快速下滑;主要原材料价格上涨,导致毛利率不及预期;汇率波动影响外向型企业的汇兑收益与毛利率;人工智能技术进步不及预期;汽车与工业智能化进展不及预期。 对外发布时间:2024年10月28日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 于芳博 SAC 编号:S1440522030001 核心观点:24Q3基金对计算机重仓持股比例为2.95%,较2024Q2环比提升0.45pct,虽略有增加,但仍处近三年历史较低水平。近期AI Agent密集发布,字节跳动豆包AI 智能体耳机 Ola Friend、智谱AI自主智能体AutoGLM、金蝶AI 管理助手苍穹APP均带来了更自然的AI交互体验,有望推动AI应用加速发展。投资建议:1)估值修复+顺周期白马标的;2)互金和券商IT;3)预期反转类IT公司(政府类IT、消费类IT、财税IT与政府采购IT、网络安全等方向);4)国产化方向,党政与行业信创加速,以及财税IT与政府采购IT方向;5)华为及特斯拉近期事件催化下相关产业链企业;6)数据要素政策催化。 摘要 24Q3计算机机构持仓整体环比略有增加,但仍属于低配,处近三年历史较低水平(以申万计算机为基准)。针对各基金机构发布的2024年三季度报告,我们对其前十大持仓股中计算机板块(申万2021一级行业分类)的数据进行了整理。2024Q3期末,基金持股总市值中计算机的占比为2.95%,较2024Q2环比提高0.45pct,低于历史3年平均水平3.74%,低于计算机板块市值占申万一级行业分类总市值的比重3.74%。尽管基金对计算机的重仓持股比例有所回升,但仍连续三个季度低配,主因产业层面信心开支略有压力,经济环境缓慢复苏,政府及企业支出放缓,以G端和B端业务为主的计算机企业经营承压。市场在9月24日之前较多担心计算机行业未来业绩增长问题,因而Q3整体持仓比例变化不大。 就个股情况而言,持有基金数最多的计算机公司前十名分别为阿里巴巴-W、金山办公、海康威视、同花顺、科大讯飞、德赛西威、中科曙光、纳思达、恒生电子、中国软件。基金持股总市值最高的计算机公司前十名分别为阿里巴巴-W、金山办公、海康威视、纳思达、科大讯飞、德赛西威、金蝶国际、深信服、华大九天、中科曙光。 从基金持仓变动情况来看,基金加仓股数增加最多的计算机公司前十名为商汤-W、阿里巴巴-W、金蝶国际、四维图新、创业慧康、广联达、远光软件、润和软件、金山云、中国软件。基金持值增加最多的计算机公司前十名为阿里巴巴-W、金山办公、同花顺、德赛西威、金蝶国际、华大九天、润和软件、广联达、商汤-W、四维图新。 AI Agent密集发布,“Her”现实化更进一步。随着AI技术持续迭代, 近期AI Agent同样迎来密集发布。2024年10月10日,字节跳动豆包发布AI 智能体耳机 Ola Friend,可接入豆包大模型,并与豆包 APP 深度结合,通过语音交互实现信息查询、旅游出行、英语学习及情感交流等功能。据雷科技实测,Ola Friend可以通过喊出关键词“豆包豆包”唤起对话,或者按住耳机触控区域发出语音,随时随地开聊。10月25日,智谱AI推出自主智能体AutoGLM,其作为AI助手,能帮助用户在手机和网页上完成各种操作,包括点外卖、发微信、写点评、给朋友圈评论等,用户只需要通过语音即可发布指令。同时,智谱AI还推出了端到端情感语音模型GLM-4-Voice,能够模拟真实的情感表达,进一步提高了语音交互体验。10月26日,金蝶也正式发布AI 管理助手苍穹APP,面向员工提供制度问询等功能;面向HR提供智能招聘、智能调配等能力;面向管理者提供人力分析,提升决策的科学性。此外,苹果也将于10月28日发布IOS 18.1系统更新,届时将向iPhone15 Pro版本及iPhone 16全部机型引入Apple Intelligence,提供写作辅助、照片清理和通知摘要等功能。我们认为,Agent已成为各类厂商主流尝试方向,有望以更自然的形式为用户提供AI功能,随着技术不断迭代,“Her”或将走进现实,带来更生动的AI体验。 总结:24Q3基金对计算机重仓持股比例为2.95%,较2024Q2环比提升0.45pct,低于历史3年平均水平3.74%,低于计算机板块市值占申万一级行业分类总市值的比重3.74%,虽略有增加,但仍处近三年历史较低水平。近期AI Agent密集发布,字节跳动豆包AI 智能体耳机 Ola Friend、智谱AI自主智能体AutoGLM、金蝶AI 管理助手苍穹APP均带来了更自然的AI交互体验,有望推动AI应用加速发展。 对外发布时间:2024年10月27日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 应瑛 SAC 编号:S1440521100010 AI Agent加速落地 Claude模型升级电脑操作功能。Claude 3.5 Sonnet全新升级,可以按照用户的命令在计算机屏幕上移动光标,点击相关位置,并通过虚拟键盘输入信息,模拟用户与自己计算机的互动方式。 微软发布10个B端办公Agent。微软在B端办公产品Dynamics 365中集成10个自主AI Agent,可以自动执行客服、销售、财务、仓储等。集成OpenAI的o1模型,可以从业务系统中调用和分析数据,自动执行业务流程。 智谱推出自主智能体AutoGLM。它是一个可模拟用户访问网页、点击网页的浏览器助手,与微信、淘宝、美团、小红书等8款知名应用软件合作,覆盖日常生活常用的线上聊天、网购、社交、地图、酒店火车订票等功能。用户与AutoGLM进行语音交互,例如要求AutoGLM在大众点评给出指定的店家好评,并自动编辑评论。 风险分析: 版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 对外发布时间:2024年10月27日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨艾莉 SAC 编号:S1440519060002 SFC 编号:BQI330 杨晓玮 SAC 编号:S1440523110001 蔡佳成 SAC 编号:S1440524080008
SFC 编号:BEM208
SFC 编号:BEM208
SFC 编号:BQI330
核心观点: 尽管尚未有明确的产品定义,但Agent类别与应用场景已迅速丰富。其中,中美大厂Agent发展思路存在差异,北美云厂商主要关注帮助客户高效部署模型和Agent,国内互联网大厂Agent布局仍延续互联网时代用户流量逻辑;而中美B端企业则均关注Agent创建和管理平台。考虑到Agent类产品对算力消耗大,Agent发展有望继续带动AI产业链向上,建议关注后续技术突破→商业化落地拐点。 尽管尚未有明确的产品定义,但Agent类别与应用场景已迅速丰富。工程师流程调优与否对应Agent发展的两条不同路线。学界普遍认为Agent需要具备规划能力;而业界如OpenAI仅强调Agent能够独立完成任务; Anthropic则将Workflow和Agent进行了明确划分。当前随着大模型、 NLP与多模态等技术不断发展, Agent类别与应用场景迅速丰富,有望迎来价值落地。 中美大厂Agent发展思路存在差异,B端厂商则均关注平台化布局。对比当前海内外AI Agent布局现状:北美云厂商主要关注帮助客户高效部署模型和Agent,而B端厂商更聚焦打造Agent创建和管理平台;国内互联网大厂Agent布局仍延续互联网时代用户流量逻辑,通过类“Manus”的通用Agent产品抢占用户,B端企业则类似北美,基于AI/Agent平台选取有价值的产品进行落地。 Agent类产品对算力消耗大,关注后续技术突破->商业化落地拐点。从Manus定价及表现推断,Agent对话交互Token消耗或达十万以上,远超chatbot类AI产品,我们认为原因主要如下:1)长上下文窗口对token的消耗量大;2)多Agent/工具通信造成token量增长;3)验证模块对token的大量消耗;4)多模态场景token消耗量更大;因此AI底层算力需求仍然是产业不可或缺的一环。此外,当前Agent落地仍面临意图混淆、多Agent合作、幻觉等多种问题,学界及业界均积极探索,技术迭代下商业化规模落地可期。 (1)AI产业商业化落地不及预期:目前各环节AI 产品的商业化模式尚处于探索阶段,如果各环节产品的推进节奏不及预期,或对相关企业业绩造成不利影响; (2)市场竞争风险:海外 AI 厂商凭借先发优势,以及较强的技术积累,在竞争中处于优势地位,如果国内 AI 厂商技术迭代不及预期,经营状况或将受到影响;同时,目前国内已有众多企业投入AI产品研发,后续可能存在同质化竞争风险,进而影响相关企业的收入; (3)政策风险:AI技术的发展直接受各国政策和监管影响。随着AI在各个领域的渗透,政府可能会进一步出台相应的监管政策以规范其发展。如果企业未能及时适应和遵守相关政策,可能面临相应处罚,甚至被迫调整业务策略。此外,政策的不确定性也可能导致企业战略规划和投资决策的错误,增加运营的不确定性; (4)地缘政治风险:在全球地缘政治环境的波动下,尤其美国对中国的出口限制或将直接影响国内企业算力芯片的获取,进而影响其产品研发和市场竞争力。同时,地缘政治风险也可能导致 AI 产品开拓海外市场面临障碍,影响相关企业的营收情况。 证券研究报告名称:《AI系列报告5:当前Agent的发展进行到了什么阶段?》 对外发布时间:2025年5月16日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 应瑛 SAC 编号:S1440521100010 SFC 编号:BWB917 研究助理:李楚涵 核心观点: 要点1:用户层面,大厂再次争夺Agent时代流量入口,其中微信最具潜力 此前元宝已经嵌入微信聊天,未来有望成为用户Agent指令最直接的入口,元宝、ima分别提供了基本的AI搜索、个人工作台功能。此外,微信小程序不亚于一个移动应用市场,超过90%的主流APP均已推出微信小程序版本,再叠加公众号、视频号、朋友圈、支付和生活服务,以及聊天记录等用户个人数据(如得到授权),那么微信基本一站式满足了用户几乎所有的线上需求。此外,我们也关注阿里巴巴(夸克)、字节跳动(扣子/豆包)在Agent入口方面的布局和进展。 要点2:技术层面,MCP等标准化协议为行业奠定标准 国产模型性能逐渐满足Agent对任务规划、海量信息检索、数据分析等复杂任务的需求。另一方面,MCP、A2A等Agent标准化协议可以促进不同Agent,以及Agent与外部工具的互联互通,类似互联网的HTTP协议和数码产品的USB/Type-C接口。 要点3:产品层面,Manus、字节扣子等爆款接连涌现 今年涌现的Agent产品,主要包括通用Agent(Manus、扣子空间)和垂类Agent(阿里飞猪的问一问功能)两大类。产品架构已基本成型,后续期待模型性能提升和更多工具接入。 本篇报告分为两个部分,第一部分我们梳理C端Agent的发展现状,包括技术路线、现有的重点产品拆解;第二部分我们以微信Agent为例,展望C端Agent的发展潜力。 今年以来Manus、智谱AutoGLM、字节扣子空间、阿里飞猪“问一问”等现象级产品接连涌现,C端Agent赛道迎拐点。 技术提升:DeepSeek引领新一轮国产模型性能跃迁,更长的上下文窗口、更低的推理成本以及更高的推理效率,逐渐满足Agent对任务规划、海量信息检索、数据分析、定制化作品产出的需求。 生态赋能:Agent标准化协议可以促进不同Agent,以及Agent与外部工具的互联互通,加速形成分工合作的Agent生态。该功能类似互联网的HTTP协议和数码产品的USB/Type-C接口,开发者无需再逐一为接入的外部工具定制接入函数。目前主流的Agent协议包括MCP与A2A两种。 产品体验:主要包括通用Agent(Manus、扣子空间)和垂类Agent(飞猪问一问)两大类。产品架构已基本成型,后续期待模型性能提升和更多工具接入。 Agent产品前端是面向用户的流量入口,后端则是大量需要被调用的工具。互联网大厂积极争夺Agent时代的C端流量入口,微信作为国内用户黏性最高、用户规模最大、功能生态最完善的App,我们认为最具竞争优势。 微信Agent案例拆解一:元宝是国内Chatbot赛道Top3产品,多模型+稀缺内容,用户天花板高。中长期看,元宝有望为微信Agent输出AI搜索和创作能力。 多模型策略,能力互补,体验更全面:虽然初期元宝流量的快速增长得益于接入DeepSeek R1模型,但后续依靠自研混元模型的快速迭代,元宝有了更多差异化的功能,比如混元T1的快思考模式、文生图以及视觉理解等。 拥有稀缺的公众号优质内容,未来有望覆盖视频号。公众号是一个相对封闭的稀缺内容池,也是元宝独家的搜索来源。24年公众号产出超4亿篇文章,阅读量10万+的文章超30万篇。展望后续,随视频理解能力提升,元宝也有望覆盖视频号的内容(截至24年6月超3.6亿个原创视频,超1300万创作者) 功能还在迭代,兼具生产力与娱乐消费:目前元宝的主界面是一个简洁的搜索框,与微信相近的绿色调,产品直观感受更加偏向生产力工具,但我们也注意到,元宝正在灰测实时语音通话、智能体广场等更易用和轻松娱乐的功能。 微信Agent案例拆解二:ima是高度创新的智能工作台,同样有望承接微信Agent的个人知识存储和管理功能。如果简单粗暴地来类比,ima≈网盘+在线云笔记+AI搜索+知识星球。 核心功能1:个人知识库,满足“本地部署”需求。目前每个用户可以在ima上传的文件上限是30G,微信公众号和全网链接也可以一键上传至ima中,来形成个人知识库。用户可以限定在某一个知识库范围内进行AI搜索,针对性地检索所需内容。 核心功能2:共享知识库,有望形成类“知识星球”的社区 。用户可以将自己创建的个人知识库调整为共享知识库,允许其他用户查看。可以采取类似知识星球的运营模式,是新的知识付费入口。目前ima内已上线数百个共享知识库,数量增速快,其中加入人数超7000人的知识库有5个,以金融法律、AI应用科普知识库为主,创建人主要为科普类自媒体。 微信Agent案例拆解三:完整状态下,微信Agent“入口轻”,但具备“调用一切”的基础,可避免硬件方、模型方调用权限。小程序生态之完整性不亚于一个移动应用市场,超过90%的主流APP均已推出微信小程序版本,再叠加公众号、视频号、朋友圈、支付和生活服务,再叠加聊天记录等用户个人数据(如能得到授权),那么微信基本一站式满足了用户几乎所有的线上需求。 风险提示:版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 对外发布时间:2025年5月12日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨艾莉 SAC 编号:S1440519060002 SFC 编号:BQI330 杨晓玮 SAC 编号:S1440523110001 核心观点 当前预训练大模型边际收益受制于Scaling Law已经逐渐达到瓶颈,更强大的Agent(智能体)成为大模型厂商未来发力的重要方向。我们认为,根据agent的技术框架,其发展基本经历了三个阶段,即工作流框架+预训练模型、工作流框架+推理模型、端到端智能体框架+推理模型。随着以OpenAI Deep Research为代表的第三代智能体的推出,智能体的强大潜力与Scaling Law加速阶段正逐渐显现。我们认为,受益于国产推理模型的强大能力基座,未来国产第三代智能体将展现出巨大的竞争力。 AI Agent成为大模型公司发力方向。当前,大模型成本投入过大,预训练边际收益在放缓,数据面临边界,以及以DeepSeek为代表的开源模型崛起,单纯的API模式无法支撑模型厂商盈利。因此,更聪明,能推理,能调用不同工具,能满足个性化需求,在应用层可实现更高价值链的AI Agent成为大模型公司急需发力的方向。 端到端强化学习的智能体框架Agent上限更高。围绕架构可以将智能体划分为Workflow(工作流)和端到端的Agent(智能体)两类框架,后者上限更高。其核心突破在于主动决策与动态规划,实现了内化思维链(CoT)与行动链(CoA)生成能力、动态选择最优工具优化API调用、跨会话行为优化等效果。相较于传统工作流,端到端Agent框架标志着AI系统从“流程执行者”向“目标驱动型决策主体”的范式跃迁。而工作流驱动的Agent核心依赖人工设计的规则与提示词通过结构化步骤完成任务,这类工作流的典型特征表现为被动响应机制。 我们认为,智能体可以主要分为三类:一是纯基于工作流框架的智能体。二是基于工作流框架,依靠推理模型进而具备长思维链能力的智能体。三是基于端到端智能体框架,实现CoT+CoA双轮驱动任务推进的智能体,这一代智能体最大限度地拓展了自身能力边界。根据大模型Scaling Law,第三代智能体的能力目前还处于加速扩展的阶段,主要受益于推理模型的升级和强化学习技术的快速突破。 随着OpenAl Deep Research和Claude 3.7 Sonnet的推出,我们看到针对任务的强化学习在推理过程发挥强大作用,更在工具调用,任务执行方面体现了强大潜力。我们认为,国产模型在强化学习的出色表现,将为下一步Agent的发展打下坚实基础,相信4月开始将陆续有国产优秀的Agent涌现出来,成为AI落地的重要场景。 大模型技术发展不及预期:大模型属于先进AI算法,若后续大模型算法更新迭代效果不及预期,则会影响大模型演进及拓展,进而会影响其商业化落地等; 商业化落地不及预期:大模型的商业落地模式在业界中普遍处于探索阶段,用户对于大模型的接受程度和商业化变现能力可能不及预期; 算力基础设施支持不及预期:美国制裁中国高科技企业,对中国形成芯片、算力的封锁,大语言模型训练过程中需要大量算力资源,需要关注中美关系带来的算力的压力; 政策监管力度不及预期:大语言模型带来新的网络生态商业,尚属于前期成长阶段,政策监管难度加大,相关法律法规尚不完善,政策监管力度可能不及预期。 数据数量与数据质量不及预期:大型语言模型需要大量的高质量数据进行训练,若数据数量和质量存在短板,则会影响大语言模型效果。 对外发布时间:2025年3月30日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 于芳博 SAC 编号:S1440522030001 庞佳军 SAC 编号:S1440524110001 核心观点:OpenAI 3月27日官宣Agents SDK加入MCP服务协议,后续ChatGPT桌面应用和Responses API也将快速支持。在AI Agent中,MCP相较于传统Function Calling外部工具的调用方式,通过主机、服务器和客户端的解耦,能够大幅降低重复开发成本,同时提升了各类AI工具的互联互通能力,亦为全球复现Manus的关键技术。随着头部公司的加速支持,MCP生态边界有望进一步拓展,加速AI产业发展。 OpenAI官宣加入MCP,Agent数据标准化更进一步。2025年3月27日凌晨,OpenAI CEO山姆·奥特曼宣布对Agents SDK进行了重大更新,支持了由Anthropic于2024 年底推出的MCP(Model Context Protocol,模型上下文协议)服务协议,同时ChatGPT桌面应用和Responses API也将很快支持MCP服务协议。 正如Anthropic介绍,随着模型推理能力逐步提升,AI Agent已经成为各机构广泛应用的产品之一。而不同的模型和Agent往往存在数据隔离,使得系统难以规模化拓展。此时,MCP作为通用的开放协议,旨在通过标准化接口实现大语言模型(LLM)与外部数据源及工具的无缝集成,使AI模型能够从业务工具、软件、数据库以及应用开发环境等来源中获取数据完成任务,大幅提升了各类AI工具的互联互通能力。 从Function Calling到MCP,工作流解耦价值凸显。在MCP协议之前,传统AI系统架构主要通过Function Calling模式进行外部工具的调用,此时开发者通常需要完成以下步骤:1)编写详细的prompt,包含工具名称、描述和使用说明;2)定义工具函数(tools);3)针对不同LLM API适配不同的function calling格式;4)编写工具调用逻辑代码;5)编写工具响应处理逻辑代码。此时,由于模型调用、工具定义、执行逻辑和结果处理都在同一个应用程序中完成,因此每当工具定义发生变化,通常需要重新启动整个服务。此外,不同LLM供应商的Function calling格式存在显著差异,进一步增加了开发和维护成本。 而使用MCP之后,Host(主机)、Server(服务器)和Client(客户端)被解耦为三个独立的组件,各类工具函数可以在服务运行时被动态的添加、修改或删除,解决了传统Function calling重新启动整个服务的难题。同时,尽管此时开发人员仍然需要进行工具函数的开发和描述定义,但工具的调用、响应等均由MCP标准化处理,使得工具库可以被集中管理和维护,不同的应用程序复用下大幅降低重复开发成本。 MCP成为全球复现Manus的关键技术。3月6日凌晨,通用Agent Manus引发新一轮AI应用落地的想象空间,而后全球团队接连复现,MCP服务在其中起到了关键的作用。以字节3月18日发布的AI Agent TARS为例,其通过支持MCP协议,内置搜索、文件编辑、命令行等多种工具,实现对复杂工作流程的高效处理,同样实现深度研究(Deep Research)、电脑操作(Operator)等多项能力。不过,Manus的开发实际早于MCP,因此并未使用该方式实现Agent调用,而是利用了另一个开源研究成果CodeAct,通过可执行代码操作将Agent调用动作合并统一。 头部公司加速支持,MCP服务有望加速AI产业发展。MCP服务协议于24年11月开源以来,Block、Apollo、Replit等公司加速支持,直至25年2月,MCP生态进一步爆炸增长,已有超过1000个由社区构建的MCP服务器可供使用。目前MCP市场主要由客户端、服务器、市场和服务器托管解决方案构成。其中,客户端和服务器对应MCP架构中的顶层组件,由市场和托管解决方案将服务向更多开发人员推广。随着MCP生态边界进一步拓展,更多实用工具的适配将促进用户进一步增长,正反馈机制有望加速AI产品落地。 总结:OpenAI 3月27日官宣Agents SDK加入MCP,后续ChatGPT桌面应用和Responses API也将快速支持。在AI Agent中,MCP相较于传统Function Calling外部工具的调用方式,通过主机、服务器和客户端的解耦,大幅降低重复开发成本,同时提升了各类AI工具的互联互通能力,亦为全球复现Manus的关键技术。随着头部公司的加速支持,MCP生态边界有望进一步拓展,加速AI产业发展。 风险提示:(1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响。 DeepSeek-R1作为开源模型跻身全球第一梯队,加速AI厂商内卷。其中OpenAI 已统一模型路线,在GPT-5中将为免费用户提供可无限使用的“标准智能”;而百度则宣布文心模型将于4月1日开始全面免费,并将在6月30日开源下一代文心4.5系列模型。在用户量激增下DeepSeek频繁出现“服务器繁忙”提示的背景下,以及腾讯宣布接入DeepSeek模型刺激下,均有望带动API调用量增加和本地化部署需求,1)利好有数据、有客户、有场景的软件企业,AI产品有望带动公司ARPU提升和项目单价上升;2)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。 风险提示:(1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响。 证券研究报告名称:《腾讯接入DS,DS带动私有化部署需求增加和Agent加速发展》 对外发布时间:2025年2月16日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 应瑛 SAC 编号:S1440521100010 核心观点: 软件估值处于底部,7月以来涨幅主要定价降息+IT预算修复,此外10月底以来Agent叙事不断强化,市场寻找此前估值处于低位的软件股交易Agent催化修复估值,后续继续等待Agent商业化逻辑。我们认为,过去1-2年的AI商业化尝试让行业形成普遍共识,Chatbot形式交互成本较高,融入企业工作流/用户交互流较困难,需要进一步调整架构以融入流程。Agentforce等产品初步反馈积极,Snowflake看到AI/ML的初步收入,行业展望IT需求边际向好&AI商业化逐步落地,趋势乐观。 对外发布时间:2025年1月10日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 武超则 SAC 编号:S1440513090003 崔世峰 SAC 编号:S1440521100004 SFC 编号:BUI663 应瑛 SAC 编号:S1440521100010 许悦 SAC 编号:S1440523030001 向锐 SAC 编号:S1440524070008 核心观点: OA和ERP构成了企业数据交汇的核心数字化基座,赋能企业经营全流程。在本轮生成式AI浪潮中,自然语言交互+学习能力提升为核心发展方向,Agent则进一步推动了AI应用落地。其中,OA/ERP通过与Agent结合,能够自动化执行完成复杂任务,预计将成为新的企业入口级平台。当前,国内外OA/ERP厂商均积极布局Agent发展,相关领域有望迎来商业化快速落地。 风险提示:(1)AI产业商业化落地不及预期:目前各环节AI 产品的商业化模式尚处于探索阶段,如果各环节产品的推进节奏不及预期,或对相关企业业绩造成不利影响;(2)市场竞争风险:海外 AI 厂商凭借先发优势,以及较强的技术积累,在竞争中处于优势地位,如果国内 AI 厂商技术迭代不及预期,经营状况或将受到影响;同时,目前国内已有众多企业投入AI产品研发,后续可能存在同质化竞争风险,进而影响相关企业的收入;(3)政策风险:AI技术的发展直接受各国政策和监管影响。随着AI在各个领域的渗透,政府可能会进一步出台相应的监管政策以规范其发展。如果企业未能及时适应和遵守相关政策,可能面临相应处罚,甚至被迫调整业务策略。此外,政策的不确定性也可能导致企业战略规划和投资决策的错误,增加运营的不确定性;(4)地缘政治风险:在全球地缘政治环境的波动下,尤其美国对中国的出口限制或将直接影响国内企业算力芯片的获取,进而影响其产品研发和市场竞争力。同时,地缘政治风险也可能导致 AI 产品开拓海外市场面临障碍,影响相关企业的营收情况。 核心观点 在Salesforce的FY3Q25业绩会上,管理层着重Agentforce的亮眼表现,仅1周完成200笔订单,此外四季度将全球招聘1400位销售人员,加大推广该AI Agent产品。Agentforce连通公司的销售、服务、营销、分析、数据云、Slack等全产品线,为客户实现提升工作效率、优化服务体验、降低人员成本等目的。 Agentforce有望大幅减少客户的员工成本。以附加服务的方式推广,并按使用量付费,每次对话1美元,据公司表示定价大幅低于8-10美元每次的人工销售成本。 重点关注12月17日Agentforce 2.0发布会。 简评 1、美股软件公司如何在业务中融入AI Agent? Salesforce发布2025财年三季报,业绩会上,CEO和COO都将未来重点放于Agentforce。CEO表示公司已成为全球数字劳动力市场的最大供应商。Agentforce自10月24日上线,并在月末达成200笔订单。截至电话会当日,包括FedEx、Adecco、埃森哲、ACEHardware、IBM、加拿大皇家银行财富管理等众多公司,都正在Salesforce平台上借助Agentforce打造它们的数字劳动力队伍。公司展望现有的13.5万客户未来都有望通过Agentforce来整理数据、完善工作流程。 Agentforce是Salesforce推出的AI助手服务。Agentforce将销售、服务、营销、分析、数据云、Slack等多种功能集成在一个平台上,打破了各业务之间的孤立状态,实现了数据和工作流程的无缝衔接。其能为客户实现1)提升工作效率:帮助客户处理大量重复性的工作,使员工能够将更多时间和精力投入到更具战略性和价值的工作中;2)优化客户体验:零售商的客户可以在需要时随时获得帮助,并且能够得到更贴合自身需求的解决方案;3)降低成本:减少了对人工的依赖,降低了企业的人力成本。 Agentforce在使用效果方面的具体案例包括: 1)速度:约翰威立国际出版集团表示Agentforce解决问题的速度比之前的聊天机器人快了40%以上。 2)即时:伦敦希思罗机场作为全球最繁忙的机场之一,通过Agentforce能够即时、准确且同时回复数千名旅客的问询。 3)跨区域:SharkNinja是2025财年三季度的新客户。其选择了Agentforce和商务云,以便为28个国际市场的客户提供全天候个性化支持,并统一其服务运营。 公司表示Agentforce在使用效果方面表现出众。Agentforce出现“幻觉”的情况都极少,因为其不仅是基于17种语言、74万份文档的Salesforce数据和元数据,它还基于每个客户的数据,比如采购、退货等数据。公司的200-300PB数据让Agentforce拥有行业领先的优势,因此Agentforce将会更加准确,相比其他产品出现“幻觉”的情况最少。各行业头部公司的使用效果案例包括: 1)全球领先的招聘网站Indeed每秒有3个人在其平台上实现招聘。该招聘网站将公司的Data Cloud服务作为其数据架构,借助Agentforce将5.8亿求职者档案与300多万雇主进行匹配,其目标是到2030年缩短招聘时间,帮助300万人克服就业障碍。 2)全球领先的人才解决方案供应商Adecco每年要处理3亿份求职申请,但以往他们根本无法及时处理或回复绝大多数申请。但现在,Agentforce能够以惊人的规模对海量简历进行筛选,全天候地将求职者与岗位机会进行匹配。此外,Agentforce还能协助求职者完善简历,增加他们获得岗位的机会。 3)智能家居安防供应商Vivint一直饱受电话客服高流失率的问题,现在借助Agentforce,Vivint正在打造一支数字支持团队,通过他们的应用程序、网站自主提供支持,对各类问题进行故障排查。此外,Vivint还计划利用Agentforce进一步实现技术人员排班、付款请求、主动解决问题、设备遥测数据使用等环节的自动化,因为Agentforce覆盖了包括Slack在内的整个Salesforce产品线。 Agentforce以附加服务的方式推广,并按使用量付费。据业绩会,Agentforce是基于使用量的收费结构,每次对话收费 2 美元,并且在作为Service Cloud的附加服务进行推广时,客户的选择意愿更高。2美元每次对话的收费标准对比销售人员的员工成本具有高性价比。对比一个销售专员一年的工资与KPI实现度,人工成本是8-10美元/次对话,因此Agentforce具有更高性价比。 公司看好Agentforce增收潜力,全球招聘销售人员。尽管在业绩指引中,公司预计四季度与Agentforce相关的预订业务不会对cRPO(未来12个月内递延收入/订单的总和)产生重大贡献。但公司表示,为了抓住Agentforce日益增长的需求,公司在2025财年四季度在全球招聘1400名客户经理,而且使用最新的SDR Agent和Sales Coach Agent来助力每一位销售人员。Agentforce SDR和Sales Coach是公司于年中推出的通过AI自动化辅助销售的服务,其中SDR Agent以自然语言自主与入站线索(潜在客户)进行互动,解答疑问、处理异议,并为人工销售人员预约会议;Sales Coach Agent在探索、推销或谈判通话期间,自主与销售人员进行角色扮演,模拟买家角色。 建议关注12月17日Agentforce 2.0发布会。尽管10月24日才推出Agentforce,但公司将于12月17日在旧金山举办Agentforce 2.0发布活动。 AI Agent产品的付费客户增长不及预期的风险、Agentforce 2.0功能或效果更新不及预期的风险、焦点科技的AI Agent产品的ARPPU提升不及预期的风险、AI Agent功能满意度不及预期的风险、谷歌等买量成本上升的风险、研发费用上升的风险、OpenAI等美国公司限制焦点科技等中国公司使用其服务和技术的风险、焦点科技面对阿里国际站竞争的风险、SMB客户需求不及预期的风险、战争导致宏观环境恶化的风险、全球经济增长不及预期的风险、国内外贸支持政策不及预期的风险、国内外贸补贴发放不及预期的风险。 对外发布时间:2024年12月7日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨艾莉 SAC 编号:S1440519060002 SFC 编号:BQI330 蔡佳成 SAC 编号:S1440524080008 AI:AI Agent加速落地。 风险提示:版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 对外发布时间:2024年12月1日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨晓玮 SAC 编号:S1440523110001 蔡佳成 SAC 编号:S1440524080008 Agent目前已经成为全球科技巨头重点发力方向,C端、B端均开始产品的快速迭代,C端更重视综合能力,B端更强调对业务流的理解、群体智能和专业Agent的打造,预计各类Agent将在2025年进入快速落地阶段。 Agent:Agent目前已经成为全球科技巨头重点发力方向,包括PC端的Claude 3.5 Sonnet、手机端的Auto GLM以及企业业务流中的Salesforce和微软的Agent产品,同时多Agent协作的群体智能也已开始逐步商用化,如百度的秒哒,过去复杂、多步骤的任务均可通过Agent实现。我们认为,C端和B端的Agent会有所区别,C端的个人助理更强调综合能力以及生活场景的解决能力,B端的Agent更强调术业有专攻,既要有核心Agent具有总览能力,根据任务准确生成业务执行流,也要有大量的Agent具有独立的技能和专长,能够处理特定的任务,并且Agent之间可以彼此沟通。随着Agent的普及,推理算力消耗将会大增,多个Agent之间通信、协作时,消耗的token、算力指数级增长。 智谱华章类:独立第三方AI手机助手 手机端Agent——AutoGLM: 个人生活助理时代来临。2024年10月25日,智谱带来了自己全新的AI Agent产品AutoGLM,其适配于当下中国人的使用习惯,为手机端Agent。在性能对比上,AutoGLM在Phone Use 和 Web Browser Use 上均表现出了更强的性能。在官方的演示视频中,AutoGLM可以根据用户指令,自动完成:朋友圈评论&点赞、微信抢红包/回复、外卖软件下单、订车票等个性化操作,智能化程度很高。 目前该功能仅针对安卓手机用户开放内测,博主测试其可实现限定条件下的酒店预定。在博主“数字生命卡兹克”的测评视频中可以看到,在“帮我订今天罗湖地铁站附近600元以内的酒店”的任务中,AutoGLM可实现:1)自动打开携程APP,在地点中输入了深圳和罗湖地铁站;2)并选定了目标日期的大床房,并按照价格进行筛选;3)询问客户在列表酒店中选择;4)进入下单和付款界面。 尚不能完全满足用户的个性化需求,Agent仍有进步空间。在演示demo中,我们可以看到AutoGLM已经非常熟练的掌握使用微信、淘宝、美团、携程等APP,但也仍有进步的空间。如在官方演示视频中,AutoGLM在下单瑞幸咖啡时支付了18元以上,有着明显的溢价,似乎还没有掌握这些品牌复杂的“抢优惠卷”玩法。随着互联网软件的种类、功能越来越丰富,智能体能否熟练的掌握每个软件的使用方法,满足不同用户的个性化需求,真正成为个人助手值得期待。令人欣喜的是,在从以聊天为主的大模型1.0时代迈入个人智能助理的大模型2.0时代,以智谱为代表的国产AI公司完成了从追赶者,到探索者的身份转换。 PC端Agent——Claude:个人工作助理新阶段。10月23日,Anthropic推出全新的Claude 3.5 Haiku和升级版Sonnet。Sonnet的能力不仅全面超过GPT- 4o,更带来全新的AI体验——计算机使用能力,可以像人类一样操作电脑。它的功能包括移动光标、点击、通过虚拟键盘输入等,标志着AI真正从聊天机器迈入使用工具解决问题的新阶段。 Claude3.5 Sonnet性能领先。从下图可以看到,根据Anthropic的测试数据,其升级后的Sonnet在逻辑、知识、代码、数学、视觉、工具使用等领先GPT-4o和Gemini 1.5。因为o1模型与传统的预训练模型的技术路线差异较大,因此并未放入比较,但是也有其他研究者在推特上发布了自己的测评结果,Sonnet的性能优于o1-mini。 除了性能以外,Claude展现了使用计算机的全新能力。与过去AI Agent直接通过代码/程序,后台联网搜索/操作应用不同的是,Claude可以像人类一样去使用电脑。其方式是先看屏幕,再使用鼠标操作,再通过思考,重复以上步骤直到完成目的。在演示中,Claude 3.5 Sonnet 不仅可以理解多种人类的复杂任务,包括行程规划、分析数据、编写代码。还可以根据任务内容,直接浏览电脑桌面上的文件,理解文件内容,操作浏览器查询,下载安装包,编写程序,制作表格等。Claude会直接展示在电脑上操作的每一步,并给出对应的理由,当出现bug时,Claude还会尝试不同的解决办法,真正熟练的使用电脑上的不同工具。 升级版的 Claude 3.5 Sonnet 现在对所有用户开放。开发者可以在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用「计算机使用」的测试版进行构建。新的 Claude 3.5 Haiku 将晚些时候开放,Haiku作为模型参数最小、速度最快的模型,已经在性能上超过了Claude 3.0的最强、最大的Opus模型。 下图是Anthropic的开发者关系负责人Alex Albert展示的一个演示的demo。开始时,Alex给Claude指示:1)去美国政府数据网,下载一个最近有趣的数据。2)安装sklearn(一个机器学习工具包)和bash相关工具(执行程序的工具包)。3)写一个python文件,把数据分为训练集和验证集,然后创建一个分类器并训练。同时还给出提示,需要Claude检查数据,以免出现模型不收敛的情况。4)最后使用浏览器可视化的展示分类的结果。 在上述过程中,最能体现Claude表现出了像人一样操作电脑的智能是三点:1)Claude理解了人类的意图:比如下载最近有趣的数据是一个很模糊的指令,但是它在数据网上找到了2024年4月的纽约空气质量数据,并给出找这个数据的解释:该数据适合分类器训练,并且数据时间很新,同时还有适合解读的CSV格式可供下载。2)体现了思维链的过程:Claude将任务拆解成了若干步骤,并对每一步给出了详细的解释,并使用合适的工具去完成规划。3)自我调整的过程:在任务过程中,多次碰到失败,比如文件无法打开,该Agent想到了绝对路径可能是错误的,于是使用相对路径来打开文件。遇到浏览器闪崩可以再次打开浏览器并展示结果。虽然目前Claude还有许多不足,比如任务的成功率有待提高(很多任务无法一次完成,或经常失败),比如目前的操作仍主要在浏览器,还无法对更多的应用进行操作,比如Office软件、微信、Wind等。但这仍是一个重大的进步,过去AI大模型主要作为一个聊天机器人、多模态机器人,进入了可以自如使用工具的阶段。这背后反应的是Claude在AI Agent、多模态理解、思维链上的研究成果。 其他科技巨头也将陆续推出类似的AI智能体产品。OpenAI透露正在组建一支多智能体的研发队伍,据传已经可以操控计算机完成在线订餐、自动查询解决编程难题等任务。苹果在今年5月发布了可以让AI理解手机屏幕的Ferret-UI模型,预计在2025年发布跨多个APP屏幕识别能力。微软也开源了屏幕解析工具OmniParser,可以完成自动订票等功能。谷歌的Geimini 2.0也有望在12月推出,同时正在开发同类新项目「Project Jarvis」,能将Chrome网页任务自动化。在这样的大背景下,预计在不久的将来,我们将进入大模型时代的2.0时代:AI Agent。 风险提示:版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 证券研究报告名称:《人工智能2025年投资策略报告:算力为基,自主可控大势所趋,Agent及B端应用崛起》 对外发布时间:2024年11月25日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 于芳博 SAC 编号:S1440522030001 方子箫 SAC 编号:S1440524070009 辛侠平 SAC 编号:S1440524070006 AI Agent元年开启。 智谱AutoGLM成为国内首个公开可用、完成复杂任务的AI Agent。AutoGLM支持自动操控App,集成语音交互、屏幕识别、任务规划等一系列AI功能,是国内首个公开可用、完成复杂任务的AI Agent,目前可以在安卓端申请使用。AutoGLM支持调用微信、淘宝、美团等8个常用APP,自动实现订酒店、总结攻略、转发聊天等一系列操作。我们认为端侧AI Agent,未来手机硬件厂商、应用APP、大模型公司三方均有发展空间。 AI应用的发展将经历聊天机器、AI Agent、数字员工/机器人三大阶段,2025年有望成为AI Agent元年。苹果已发布Apple Intelligence,演示了如何使用Siri控制代理手机。iOS18.1已正式融入AI功能,包括写作工具、相册管理;24年12月苹果siri还将集成ChatGPT,进一步提高siri的智能化程度。另据彭博、新浪财经,OpenAI正在开发一款名为“Operator”的AI Agent,计划于25年1月发布。这款工具能够自动执行复杂任务,包括编写代码、预订旅行等。 风险提示: 版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 证券研究报告名称:《传媒互联网2025年投资策略报告:AI应用落地可期,IP消费持续景气》 对外发布时间:2024年11月26日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨艾莉 SAC 编号:S1440519060002 SFC 编号:BQI330 杨晓玮 SAC 编号:S1440523110001 蔡佳成 SAC 编号:S1440524080008 AI Agent密集发布,“Her”现实化更进一步。除端侧AI及AI工具软件外,近期AI Agent为C端和B端落地的重要方向。2024年10月10日,字节跳动豆包发布AI 智能体耳机 Ola Friend,可接入豆包大模型,并与豆包 APP 深度结合,通过语音交互实现信息查询、旅游出行、英语学习及情感交流等功能。10月25日,智谱AI推出自主智能体AutoGLM,其作为AI助手,能帮助用户在手机和网页上完成各种操作,包括点外卖、发微信、写点评、给朋友圈评论等,用户只需要通过语音即可发布指令。10月26日,金蝶也正式发布AI 管理助手苍穹APP,面向员工提供制度问询等功能;面向HR提供智能招聘、智能调配等能力;面向管理者提供人力分析,提升决策的科学性。10月28日苹果发布IOS 18.1系统更新,向iPhone15 Pro版本及iPhone 16全部机型引入Apple Intelligence,提供写作辅助、照片清理和通知摘要等功能。此外,360智脑亦能对职能部门提供“人力资源助手”、“法务助手”等智能体,提高工作效率。 我们认为,当前AI落地进一步加速,尤其Agent已成为各类厂商主流尝试方向,有望改变多流量入口形式。就C端场景而言,端侧AI作为新一代计算平台形态多样,产品落地确定性较强,软件则待高频应用爆发;B端场景中AI生产力工具商业化已呈现加速趋势,有望为企业带来业绩增长拐点。 风险提示: (1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求; (2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失; (3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化; (4)国际环境变化影响:目前国际形势动荡,对于海外收入占比较高公司可能形成影响,此外美国不断对中国科技施压,导致供应链安全风险。 证券研究报告名称:《2025年计算机年度策略:百炼成金(更新)》 对外发布时间:2024年11月26日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 应瑛 SAC 编号:S1440521100010 王嘉昊 SAC 编号:S1440524030002 核心观点: 1.10月23日,Anthropic推出全新Claude 3.5 Haiku和升级版Sonnet。Sonnet能力不仅全面超过GPT- 4o,更带来全新AI体验:计算机使用,可以像人类一样操作电脑:查看屏幕、移动光标、点击、通过虚拟键盘输入等,标志着AI真正从聊天机器迈入使用工具解决问题的新阶段。 2.在演示中,Claude可以理解复杂任务,包括行程规划、分析数据、编写代码。还可以根据任务,直接浏览电脑桌面上的文件,操作浏览器查询,编写程序等。Claude会直接展示在电脑上的操作,并给出对应理由,Claude还会尝试不同方法解决出现的bug。 3.10月25日,智谱推出全新AI智能体:AutoGLM 。与Claude操作电脑不同,其主要应用在手机,可以根据用户指令,自动完成:朋友圈评论&点赞、微信抢红包/回复、外卖下单、订车票等个性化操作。 行业变化 1.1 Claude 3.5推出,性能最优,像人类一样操作电脑 10月23日,Anthropic推出全新的Claude 3.5 Haiku和升级版Sonnet。Sonnet的能力不仅全面超过GPT- 4o,更带来全新的AI体验:计算机使用能力,可以像人类一样操作电脑:移动光标、点击、通过虚拟键盘输入等,标志着AI真正从聊天机器迈入使用工具解决问题的新阶段。 从图表1中可以看到,升级后的Sonnet在逻辑、知识、代码、数学、视觉、工具使用等几乎全方面都超过了目前的最优模型GPT-4o和Gemini 1.5。因为o1模型与传统的预训练模型的技术路线差异较大,因此并未放入比较,但是也有其他研究者在推特上发布了自己的测评结果,Sonnet的性能优于o1-mini。 除了性能以外,这次最让人惊喜的是Claude展现的全新能力:计算机使用。与过去AI Agent直接通过代码/程序,后台联网搜索/操作应用不同的是,这一次Claude真正像人类一样去使用电脑:先看屏幕,再使用鼠标操作,再通过思考,重复以上步骤直到完成目的。在这个过程中,我们可以很明显的看到,Claude每一次截图查看屏幕,移动光标/点选,并给出思考的全过程。 升级版的 Claude 3.5 Sonnet 现在对所有用户开放。开发者可以在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用「计算机使用」的测试版进行构建。新的 Claude 3.5 Haiku 将晚些时候开放,Haiku作为模型参数最小、速度最快的模型,已经在性能上超过了Claude 3.0的最强、最大的Opus模型。 在演示中,Claude 3.5 Sonnet 不仅可以理解多种人类的复杂任务,包括行程规划、分析数据、编写代码。还可以根据任务内容,直接浏览电脑桌面上的文件,理解文件内容,操作浏览器查询,下载安装包,编写程序,制作表格等。Claude会直接展示在电脑上操作的每一步,并给出对应的理由,当出现bug时,Claude还会尝试不同的解决办法,真正熟练的使用电脑上的不同工具。 图表2是Anthropic的开发者关系负责人Alex Albert展示的一个演示的demo。开始时,Alex给Claude指示:1)去美国政府数据网,下载一个最近有趣的数据。2)安装sklearn(一个机器学习工具包)和bash相关工具(执行程序的工具包)。3)写一个python文件,把数据分为训练集和验证集,然后创建一个分类器并训练。同时还给出提示,需要Claude检查数据,以免出现模型不收敛的情况。4)最后使用浏览器可视化的展示分类的结果。 随之,Claude开始操作电脑:1)使用工具:截图,以查看当前的电脑桌面并找到浏览器。(每一次查看都需要使用这个工具)2) 使用工具:鼠标移动&使用工具:左键单击打开浏览器。3)使用工具:键盘输入网址。接下来就重复以上三步,查看页面,并移动鼠标点选,并输入想要的数据。4)下载完成后,Claude自动打开数据进行分析。其中遇到了几步bug,包括路径错误、数据类型错误等,Claude都通过几次尝试解决了。5)通过编写的python代码,完成了分类器的训练并展示结果。 在上述过程中,最能体现Claude表现出了像人一样操作电脑的智能是三点:1)Claude理解了人类的意图:比如下载最近有趣的数据是一个很模糊的指令,但是它在数据网上找到了2024年4月的纽约空气质量数据,并给出解释,这是一个很适合分类器训练的数据,而且数据的时间很新,同时还有适合解读的CSV格式可供下载。2)体现了思维链的过程:Claude将任务拆解成了若干步骤,并对每一步给出了详细的解释,并使用合适的工具去完成规划。3)自我调整的过程:在任务过程中,多次碰到失败,比如文件无法打开,它想到了绝对路径可能是错误的,于是使用相对路径来打开文件。遇到浏览器闪崩可以再次打开浏览器并展示结果。 图表3展示了另一个例子,是让Claude打开桌面上的简历,并在Anthropic官网投递合适的职位。Claude同样通过查看桌面、移动鼠标&点击、键盘输入等工具完成了这个任务。Claude首先查看了简历,明白了用户是一名代码背景的求职者,随后在Anthropic官网中找到相关招聘信息,并选中“高级软件工程师”这个职位进行投递,同时完成了页面上所有的求职信息的填写。求职过程中繁琐的搜索、填表,被Claude轻松完成了。 Claude 3.5 Sonnet已经展示出了全新的AI交互方式:操作电脑。虽然目前Claude还有许多不足,比如任务的成功率有待提高(很多任务无法一次完成,或经常失败),比如目前的操作仍主要在浏览器,还无法对更多的应用进行操作,比如Office软件、微信、Wind等。但这仍是一个重大的进步,过去AI大模型主要作为一个聊天机器人、多模态机器人,进入了可以自如使用工具的阶段。这背后反应的是Claude在AI Agent、多模态理解、思维链上的研究成果。 在这样的背景下,其他科技巨头也将陆续推出类似的AI智能体产品进行应对。OpenAI透露正在组建一支多智能体的研发队伍,据传已经可以操控计算机完成在线订餐、自动查询解决编程难题等任务。苹果在今年5月发布了可以让AI理解手机屏幕的Ferret-UI模型,预计在2025年发布跨多个APP屏幕识别能力。微软也开源了屏幕解析工具OmniParser,可以完成自动订票等功能。谷歌的Geimini 2.0也有望在12月推出,同时正在开发同类新项目「Project Jarvis」,能将Chrome网页任务自动化。在这样的大背景下,预计在不久的将来,我们将进入大模型时代的2.0时代:AI Agent。 1.2 智谱推出AI智能体AutoGLM,专注手机端使用 在Claude 3.5发布两天后,智谱也带来了自己全新的AI Agent产品AutoGLM。相比Claude 3.5专注于电脑端不同,AutoGLM则是真正适配于当下中国人的使用习惯,推出了手机端的AI 智能体,效果的惊艳程度有过之而无不及。同时在性能对比上,AutoGLM在Phone Use 和 Web Browser Use 上均表现出了更强的性能。 在官方的演示视频中,AutoGLM可以根据用户指令,自动完成:朋友圈评论&点赞、微信抢红包/回复、外卖软件下单、订车票等个性化操作,智能化程度很高,效果很惊艳。 然而目前该功能仅针对安卓手机用户开放内测,因此实际的测评效果还比较少。在博主“数字生命卡兹克”的测评视频中可以看到,在“帮我订今天罗湖地铁站附近600元以内的酒店”的任务中,AutoGLM1)自动打开携程APP,在地点中输入了深圳和罗湖地铁站,2)并选定了目标日期的大床房,并按照价格进行筛选,3)询问客户在列表酒店中选择,4)进入下单和付款界面。 在演示demo中,我们可以看到AutoGLM已经非常熟练的掌握使用微信、淘宝、美团、携程等APP。但也仍有进步的空间,例如在官方演示视频中,AutoGLM在下单瑞幸咖啡时支付了18元以上,有着明显的溢价,似乎还没有掌握这些品牌复杂的“抢优惠卷”玩法。随着互联网软件的种类、功能越来越丰富,智能体能否熟练的掌握每个软件的使用方法,满足不同用户的个性化需求,真正成为个人助手值得期待。令人欣喜的是,在从以聊天为主的大模型1.0时代迈入个人智能助理的大模型2.0时代,以智谱为代表的国产AI公司完成了从追赶者,到领路人的身份转换。 风险提示:北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期;下游需求不及预期影响公司正常生产和交付,导致收入及增速不及预期;信息化和数字化方面的需求和资本开支不及预期;市场竞争加剧,导致毛利率快速下滑;主要原材料价格上涨,导致毛利率不及预期;汇率波动影响外向型企业的汇兑收益与毛利率;人工智能技术进步不及预期;汽车与工业智能化进展不及预期。 对外发布时间:2024年10月28日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 于芳博 SAC 编号:S1440522030001 核心观点:24Q3基金对计算机重仓持股比例为2.95%,较2024Q2环比提升0.45pct,虽略有增加,但仍处近三年历史较低水平。近期AI Agent密集发布,字节跳动豆包AI 智能体耳机 Ola Friend、智谱AI自主智能体AutoGLM、金蝶AI 管理助手苍穹APP均带来了更自然的AI交互体验,有望推动AI应用加速发展。投资建议:1)估值修复+顺周期白马标的;2)互金和券商IT;3)预期反转类IT公司(政府类IT、消费类IT、财税IT与政府采购IT、网络安全等方向);4)国产化方向,党政与行业信创加速,以及财税IT与政府采购IT方向;5)华为及特斯拉近期事件催化下相关产业链企业;6)数据要素政策催化。 摘要 24Q3计算机机构持仓整体环比略有增加,但仍属于低配,处近三年历史较低水平(以申万计算机为基准)。针对各基金机构发布的2024年三季度报告,我们对其前十大持仓股中计算机板块(申万2021一级行业分类)的数据进行了整理。2024Q3期末,基金持股总市值中计算机的占比为2.95%,较2024Q2环比提高0.45pct,低于历史3年平均水平3.74%,低于计算机板块市值占申万一级行业分类总市值的比重3.74%。尽管基金对计算机的重仓持股比例有所回升,但仍连续三个季度低配,主因产业层面信心开支略有压力,经济环境缓慢复苏,政府及企业支出放缓,以G端和B端业务为主的计算机企业经营承压。市场在9月24日之前较多担心计算机行业未来业绩增长问题,因而Q3整体持仓比例变化不大。 就个股情况而言,持有基金数最多的计算机公司前十名分别为阿里巴巴-W、金山办公、海康威视、同花顺、科大讯飞、德赛西威、中科曙光、纳思达、恒生电子、中国软件。基金持股总市值最高的计算机公司前十名分别为阿里巴巴-W、金山办公、海康威视、纳思达、科大讯飞、德赛西威、金蝶国际、深信服、华大九天、中科曙光。 从基金持仓变动情况来看,基金加仓股数增加最多的计算机公司前十名为商汤-W、阿里巴巴-W、金蝶国际、四维图新、创业慧康、广联达、远光软件、润和软件、金山云、中国软件。基金持值增加最多的计算机公司前十名为阿里巴巴-W、金山办公、同花顺、德赛西威、金蝶国际、华大九天、润和软件、广联达、商汤-W、四维图新。 AI Agent密集发布,“Her”现实化更进一步。随着AI技术持续迭代, 近期AI Agent同样迎来密集发布。2024年10月10日,字节跳动豆包发布AI 智能体耳机 Ola Friend,可接入豆包大模型,并与豆包 APP 深度结合,通过语音交互实现信息查询、旅游出行、英语学习及情感交流等功能。据雷科技实测,Ola Friend可以通过喊出关键词“豆包豆包”唤起对话,或者按住耳机触控区域发出语音,随时随地开聊。10月25日,智谱AI推出自主智能体AutoGLM,其作为AI助手,能帮助用户在手机和网页上完成各种操作,包括点外卖、发微信、写点评、给朋友圈评论等,用户只需要通过语音即可发布指令。同时,智谱AI还推出了端到端情感语音模型GLM-4-Voice,能够模拟真实的情感表达,进一步提高了语音交互体验。10月26日,金蝶也正式发布AI 管理助手苍穹APP,面向员工提供制度问询等功能;面向HR提供智能招聘、智能调配等能力;面向管理者提供人力分析,提升决策的科学性。此外,苹果也将于10月28日发布IOS 18.1系统更新,届时将向iPhone15 Pro版本及iPhone 16全部机型引入Apple Intelligence,提供写作辅助、照片清理和通知摘要等功能。我们认为,Agent已成为各类厂商主流尝试方向,有望以更自然的形式为用户提供AI功能,随着技术不断迭代,“Her”或将走进现实,带来更生动的AI体验。 总结:24Q3基金对计算机重仓持股比例为2.95%,较2024Q2环比提升0.45pct,低于历史3年平均水平3.74%,低于计算机板块市值占申万一级行业分类总市值的比重3.74%,虽略有增加,但仍处近三年历史较低水平。近期AI Agent密集发布,字节跳动豆包AI 智能体耳机 Ola Friend、智谱AI自主智能体AutoGLM、金蝶AI 管理助手苍穹APP均带来了更自然的AI交互体验,有望推动AI应用加速发展。 对外发布时间:2024年10月27日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 应瑛 SAC 编号:S1440521100010 AI Agent加速落地 Claude模型升级电脑操作功能。Claude 3.5 Sonnet全新升级,可以按照用户的命令在计算机屏幕上移动光标,点击相关位置,并通过虚拟键盘输入信息,模拟用户与自己计算机的互动方式。 微软发布10个B端办公Agent。微软在B端办公产品Dynamics 365中集成10个自主AI Agent,可以自动执行客服、销售、财务、仓储等。集成OpenAI的o1模型,可以从业务系统中调用和分析数据,自动执行业务流程。 智谱推出自主智能体AutoGLM。它是一个可模拟用户访问网页、点击网页的浏览器助手,与微信、淘宝、美团、小红书等8款知名应用软件合作,覆盖日常生活常用的线上聊天、网购、社交、地图、酒店火车订票等功能。用户与AutoGLM进行语音交互,例如要求AutoGLM在大众点评给出指定的店家好评,并自动编辑评论。 风险分析: 版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。 对外发布时间:2024年10月27日 报告发布机构:中信建投证券股份有限公司 本报告分析师: 杨艾莉 SAC 编号:S1440519060002 SFC 编号:BQI330 杨晓玮 SAC 编号:S1440523110001 蔡佳成 SAC 编号:S1440524080008
SFC 编号:BEM208
SFC 编号:BEM208
SFC 编号:BQI330