从百度的两季创业大赛，看大模型应用风向变化

财经头条

提升一亿中产阶级阅读效率

打开

晚点LatePost

1个月前

这些变化扩展了大模型应用的边界，决定了开发者能做出什么样的智能体应用。...比如师者AI是一个基于全科教育大模型的引导式的AITutor应用，在这季创业大赛中获得二等奖。

李彦宏认为，智能体相当于 PC 时代的网站和自媒体时代的账号。

ChatGPT 催生大模型热潮将近两年，大模型的能力持续提升，调用价格持续下降，基于大模型开发应用的探索也进入新阶段。

9 月 25 日，第二季百度 “文心杯” 创业大赛结束，8 个团队被选为优胜者，他们将得到百度的数千万元和资源投资。百度称，未来还会在技术、产品、发展战略、资本合作等方面长期支持优胜团队。

百度 CEO 李彦宏在颁奖致辞中说，现在大模型最初那种兴奋劲儿逐渐过了，许多创业者可能会失落、迷茫、甚至怀疑未来。“因为人们总是高估技术的短期价值，却低估技术的长期价值。”

李彦宏认为大模型是一次颠覆式的技术革命，长期前景非常乐观，“悲观者永远正确，而未来却是由乐观者创造的”。他说，百度欢迎更多的创业者和开发者加入，一起投身到这场 AI 革命中。

在决出优胜者之外，这场举办两年的创业大赛，还提供了一个少见的窗口，可以观察国内大模型应用探索的风向变化：

基于大模型开发应用的门槛降低。参赛团队从去年近 1000 支增长到 1600 支，30% 的团队没有专业程序员。
应用场景更多元，但开发模式开始聚焦。去年约 30% 的项目在通用办公及营销领域。今年领域越发分散，包括文娱、电商、营销、医疗、办公、硬件、企业服务等众多领域，超过 60% 的团队聚焦智能体应用。

在李彦宏看来，大模型应用发展经历多个阶段：刚开始是 Copilot 阶段，大模型辅助人工作，最后产出成果，需要人把最后一道关，确定达到了效果再交付。再往下走，就是 Agent 智能体阶段，大模型能自主使用工具解决任务，有自我反思、自我进化的能力。最后会到 Al Worker 阶段，能够像人一样，做各种各样的脑力和体力劳动，可以独立完成各种工作。

他认为当前正处于 Agent 智能体阶段，智能体是大模型最重要的发展方向。“智能体相当于 PC 时代的网站和自媒体时代的账号。它最明显的特点是门槛足够低，谁都能上手，天花板又足够高，可以做出非常复杂，非常强大的应用。”

李彦宏说，将来会有数以百万量级的智能体出现，形成庞大的智能体生态。他希望创业者和开发们用百度的基础模型、开发工具以及分发平台，做出 AI 时代的超级应用。百度 “文心杯” 创业大赛·第二季告一段落，但其建设大模型创业生态的动作还会继续。

8 个优胜团队如何开发大模型应用

过去一年多，大语言模型能力迅速提升，参数规模普遍从千亿增长到万亿，融合语音、图像、文本的多模态模型成为热门趋势，生成图像、视频的模型不断迭代。这些变化扩展了大模型应用的边界，决定了开发者能做出什么样的智能体应用。

这一季优胜者团队开发大模型的首要特征是，融合大模型多种模态能力提供服务。获得一等奖的极睿科技，主要业务是面向电商场景，利用大模型生成图片、文字等多模态内容，为消费品牌提供覆盖图文及短视频的 AI 素材制作、管理工具及转化服务。

获得二等奖的虚拟角色社交互动平台 Kotoko、AI 漫画平台水母智能，以及获得三等奖的 “AI+ 设计” 应用软件亦心科技和 AI-Native 金融投研工具问智科技等，虽然聚焦的场景不同，但都深度融合大模型技术，部分应用融合了视觉理解、文字生成、图像生成、语音交互等多模态能力。

多模态融合也是全球大模型应用开发的趋势之一。今年 9 月，风投机构 a16z 公布上半年最受欢迎的 100 个大模型应用，基本没有只提供文本生成和交互能力的聊天机器人式应用，融合图像、视觉能力的应用正在成为主流。OpenAI 开发的 ChatGPT，在过去一年多也在产品中融合了语音交互、图像理解、图像生成等能力。

优胜者团队开发大模型应用的第二个特征是，面对目标场景，提供相对完整的解决方案。

比如师者 AI 是一个基于全科教育大模型的引导式的 AI Tutor 应用，在这季创业大赛中获得二等奖。他们调用多个模型，给用户提供服务时，不是直接给答案，而是会调用大模型的能力，引导和鼓励用户答题，帮学生从答题过程中掌握知识点。

类似的还有镜象科技，它是一个心理诊疗 AI 智能体，不仅能多模态识别算法对用户心理健康进行评估（AI 测评师），还能用自然语言处理和情感识别技术为心理亚健康人群提供倾诉陪伴和情绪疏导（AI 倾诉师），以及为轻中度患者提供心理干预治疗（AI 心理师）。获奖项目 LightAI 开发了私域社媒流量运营 AI Agent 产品矩阵，目标是用大模型提高企业的获客及运营效率。

优胜大模型应用的第三个典型特征是，调用大模型的能力主动提供服务，引导用户发掘大模型的能力，而不是等待用户有了迫切需求再解决问题。

比如在虚拟角色社交互动平台 Kotoko 中，用户不知道如何开始互动时，平台中基于大模型开发的智能体，会主动发起交流对话，引导用户。在问智科技开发的金融投研工具中，大模型每天会主动推荐 5 个股票，然后给出相应的分析。极睿科技开发的剪辑工具，可以自动把带货主播的直播内容，剪辑成方便投放的素材等。

“我们认为，未来在各行各业，在各个领域都会依据自己具体的场景，根据自己特有的经验、规则、数据等等，去做出来这些智能体。” 李彦宏此前在一场活动上说。百度文心杯大赛的优胜者们，只是这个庞大生态的一部分。

“智能体是大模型最重要的发展方向”

“我们去年说要卷应用、大家都去做应用，其实很多人还是说不知道该怎么做。” 李彦宏今年 9 月在内部演讲中说。“智能体提供了一个非常直接、非常高效、非常简单的方式。”

广义来说，智能体（Agent）是指能在动态世界中独立交互的数字系统。它并不是一个新事物，在互联网时代就已经存在。比如可以自动识别垃圾邮件或重要邮件，给它们分类的电子邮件过滤器，就是一种简单的 Agent。但是这种模式下，它们只能在特定场景下，按照开发者提前设定好的规则完成任务。如果开发复杂的智能体，需要投入大量人手，基于规则编程，或者针对性训练机器学习模型等。

能够理解自然语言、语音、图像等数据的大模型，给智能体带来了新的可能。理想状态下，大模型驱动的智能体，可以根据用户随时发起的指令，甚至是用户没有意识到的需求，灵活地规划行动，然后调度各类在线工具完成任务。在这个过程中，智能体还可以与其他智能体或人合作，学习完成任务的办法，改进表现。

比如这次获得一等奖的极睿科技开发的电商素材生成工具，就是朝着智能体方向开发的应用。根据极睿科技 CEO 武彬介绍，他们的工具会调用一批大模型完成任务：客户上传产品素材后，会用自研的传统模型识别，是模特图片还是产品图片，是拍摄视频还是直播视频，里面是什么样的商品，如果是衣服，会识别衣领形状、花纹等细节。这些模型识别出来的信息，会提供给大模型，让它综合用户的指令，生成图片、视频、文案等。

“之前还需要不少人修改大模型生成的内容，现在只需要两三个人，就可以制作出能够投入使用的素材。” 武彬说。

在李彦宏来看，随着基础模型的日益强大，开发智能体会越来越简单，只要用 “人话” 把工作流说清楚，再配以专有知识库，就可以做出一个很有价值的智能体，“比互联网时代制作一个网页还简单”。

但简单只是相对概念。如果从基础模型开始研发，做一个智能体要比开发一款传统互联网应用难得多。但现在越来越多开发基础模型的公司，比如 Google、微软、OpenAI 等，都在投资开发一系列工具，让开发者更简单地调用它们的大模型，开发各类智能体，想要搭建新时代的基础设施。

百度更是把智能体视为大模型时代最重要的战略、最重要的发展方向，希望能够主导建立 AI 原生应用和智能体生态。在昨天的颁奖词中，李彦宏介绍了百度采取的一系列举措：

提供基础大模型系列，包括文心大模型旗舰版 ERNIE 3.5、4.0、4.0 Turbo，以及可以免费调用的轻量版 ERNIE Speed、Lite、Tiny；
提供应用开发工具，包括智能体开发工具 AgentBuilder，AI 原生应用开发工具 AppBuilder，以及模型定制工具 ModelBuilder；
开放搜索渠道，将其作为智能体分发渠道，让智能体易分发，让创业者有钱赚。

目前来看，百度的智能体生态建设已经有了初步成果。根据百度方面介绍，在百度开发智能体的商户已超 1.6 万家，覆盖教育、法律和 B2B 等行业。目前百度搜索每天分发超过 1000 万次智能体，还在快速增长。

今年 8 月的财报会上，李彦宏把智能体视为搜索行业的变革力量，它将使百度抓住实质性的长期增长机会，改变搜索的使用方式，巩固百度在 AI 搜索领域的领导地位。他认为，智能体将成为 AI 时代的 “新型网站生态系统”。

· FIN ·