让大模型超级有用，李彦宏放了个大招

财经头条

提升一亿中产阶级阅读效率

打开

让大模型超级有用，李彦宏放了个大招

财经无忌

1天前

李彦宏在接受媒体专访时也提到：“多模态要想进入真正实用阶段，也得有准确性，或者说可控性。

“过去这24个月，这种全球性的大模型狂热，究竟是一场新的技术革命，还是新一轮泡沫？”

11月12日的百度世界大会上，以标志性白衬衫现身的百度集团创始人兼CEO李彦宏在他的演讲开头，就向外界抛出了这一重磅的“大模型之问”。

AI究竟是不是泡沫？

李彦宏和百度对这一“大模型之问”的回答显然很坚定——AI不是泡沫，文心大模型调用量的高速增长印证了这一点。

截至目前，百度文心大模型的日均调用量已超15亿次，相较一年前首次披露的5000万次，增长约30倍，这说明AI是真需求，大模型应用正处于爆发前夜。

李彦宏和百度没有满足于此。在刚刚结束的百度世界大会上，百度发布了最新的检索增强的文生图技术（iRAG）和无代码工具“秒哒”。

未来已来，人们与“AI应用创造世界的距离”，又近了一步。

“我们不是要推出一个‘超级应用’，而是要不断地帮助更多人、更多企业打造出数以百万‘超级有用’的应用。”

在此次百度世界大会上，李彦宏率先在行业里喊话——“要打造超级有用的应用”的原因所在。

iRAG技术和无代码工具“秒哒”，其实是百度为“加速应用渗透”送上的锤子。

想让大模型落地直接应用、产生实用价值，国内外大模型厂商其中的一个主线任务，就是各出奇招解决大模型的“幻觉问题”。

李彦宏认为，过去24个月，大模型的最大变化是基本消除了“幻觉”，这主要得益于RAG（检索增强生成）等技术对模型性能等提升。

RAG技术结合了信息检索和生成的能力，有效提高了大模型文本内容生成的质量，但随着图像等多模态AI的飞速发展，大模型的“幻觉”问题变得越来越复杂，各类文生图模型尽管反复宣称在生成效果上“超越人类设计师”，但在实际使用过程中，用户的翻车体验并不在少数。

在AI生图领域，怎么杀死“幻觉”？关键时刻，还是百度带来了好消息。

据百度CTO王海峰介绍，在今年年初，百度就决定下场通过自研iRAG技术，结合不同应用场景下用户具体的生图需求，解决图像生成的幻觉问题。

王海峰具体介绍了iRAG实现可控生图的技术链路，和此前百度的检索增强技术类似，这依旧是一个“理解-检索-生成”协同优化的过程。

首先，大模型会用户的具体需求进行分析理解，自动规划精确或者泛化的方案，比如对哪些实体进行增强；

其次，在增强阶段，对需要增强的实体进行检索，并选择对应的参考图；

最后，在生成阶段，百度自研了多模态可控生图大模型，一方面，通过局部注意力计算，大模型能在保持实体特征不变的情况下，实现图像的高泛化生成；另一方面，通过整体注意力计算，可实现图像的高精确生成，保持生成图和原图相关物体等元素的一致性。

「财经无忌」以“锤子手机”、“虎皮鸡蛋”等prompt，实测文心一言AI生图功能发现，对比国内其他模型厂商，在iRAG技术加持下，所生成的图片对prompt的理解更准确，图片的生成质量也不错。

左图为其他厂商，右图为文心一言

以人物动作和环境的一致性，我们以“生成一张在玩手机的华妃的图”为需求，也“考了考”文心一言的表现，不到20s文心一言就完成了任务，所生成的图片也与真实世界高度相似，没有什么“AI味儿”。

对prompt的理解、人物一致性、

生成速度都超出我们预期

iRAG技术无幻觉、超真实、低成本、立等可取等一系列优势，这也意味着，小到普通自媒体工作者的图文编辑，大到上市公司宣传海报制作，都有望直接从中受益，AI应用的空间也得以打开。

李彦宏在接受媒体专访时也提到：“多模态要想进入真正实用阶段，也得有准确性，或者说可控性。让你不变就不能变。有了这种能力后，应用空间才能打开”。

除了消除大模型的幻觉，是AI应用爆发的技术前置条件，更关键的是还有找到大模型时代应用落地的载体。

百度瞄准的方向就是就是智能体。

今天，智能体几乎已成为头部大模型厂商探索的“标配”。

麦肯锡报告显示，过去的一年里，Google、OpenAI都将智能体作为大模型最重要的应用场景，OpenAI创始人奥特曼近期采访中提及「5级AGI」蓝图里也反复强调“智能体”的作用：“第三级是智能体，能够执行长期任务，比如与环境多次互动，并与人类协同工作”。

李彦宏认为，智能体相当于 PC 时代的网站和自媒体时代的账号，其特点是门槛低、天花板又足够高。

本质上，智能体是一个更轻量化、更具主动性和更强交互性的AI应用，但对一个毫无编程经验的普通人来说，想要创造一个专属智能体或实现多智能体的协作，依旧有很高的门槛。

而百度的无代码工具“秒哒”的诞生，解决了这一问题，用户只需要向大模型表达出自己所需要的智能体工作流等信息，仅依靠自然语言交互，就可以完成一整套系统的设计、开发、测试。

区别于其他的低代码或无代码开发平台，“秒哒”的特色有两点：一是不局限在程序员等开发者，门槛更低。二是整个应用的开发过程，可实现多智能体的协作。

据王海峰透露，这主要是因为“秒哒”所采用的是智能体的“中心化模式”。

举例来说，如果用户想针对某新技术发布会开发一个嘉宾邀请和管理系统，“秒哒”在受到需求后，“小组长智能体（0号智能体）”进行规划调度，将任务拆解并召唤各智能体来完成任务，策划设计方案会交给“策划智能体”，文字编辑内容会交给“编辑智能体”，网页的代码编写、系统制作和部署由“程序员智能体”完成，最后还有负责质检的智能体，检查和测试代码，并能和其他智能体配合一起改bug。

总结来看， iRAG技术进一步解决大模型的“幻觉”，“秒哒”则是以低门槛的方式让小白轻松上手应用开发，为「超级有用」铺路造桥的百度，其实也为应用爆发打好了基础。

“国外有一种说法叫‘软件吞噬世界’。但我认为，这个世界不应该被吞噬，而应该被创造。AI时代，应用创造世界。”

在漫长的科技史上，对新技术的质疑，从来都不是什么新鲜话题。

那些“AI泡沫论”的拥趸者，所给出的理由是：“至今未出现一个大模型时代的超级应用”。

这实际陷入了一个“应用误区”——对“超级应用的过度迷恋”。过去两年里，市场涌现出诸多号称“大模型时代的超级应用”，但又迅速衰落，根本原因在于“好看但不有用”，难以与个人、企业的实际场景和需求结合，形成产品迭代的增长飞轮，自然也难以长红。

“如果说2023年大家还在卷模型，让模型能力逐步地达到可用地步的话，那未来所谓的‘可用’，就是真的有东西用。”李彦宏说。

“超级应用”到“超级有用”，一字之差，所对应的是两种完全不同的认知和实践逻辑。

一方面，在认知上强调“有用”更偏向谈生成式AI的落地价值，而不是“为了创新而创新”；另一方面，在实践上强调“有用”是关注用户和企业的实际需求，避免“拿着锤子找钉子”。

在“超级有用”的思路下，再看百度推出iRAG技术和无代码工具“秒哒”，其实有更深远的两重含义：

一是将真技术创新与真需求场景融合，降低普通人实践AI的门槛，打开AI应用落地的规模化空间。

无论是关注幻觉问题的iRAG技术，抑或是让零编程经验的普通人也能手搓智能体的“秒哒”，都是百度结合现有模型能力，将复杂的技术场景留给自己，将最简单的体验留给用户，缩短人们与AI间的距离。

二是在瞬息万变的技术发展中为更多人找到可确定的方法论。在GPT-5迟迟未至，Scaling law放缓的诸多质疑中，李彦宏认为，这对应用层来说是反而是新机遇。

“从应用端来看，技术进步的速度不仅没有放慢，甚至有变快趋势。从另外一个角度来讲，反而是基础模型不能够特别快的迭代，如果老在变，那做应用的人就无所适从了。”

当然，长期来看，在复杂的应用场景里，模型能力的提升依旧还会遵循大力出奇迹的Scaling law或依赖模型精调、数据标注等工程化手段，但在一些相对没有那么复杂的应用场景里，比如代码领域，人们可以借助大模型能力，提升认知、创造价值，这是确定性的趋势。

“我今天能够写两百行代码，一年以后可能能写两千行代码，再过三年可以写两万行代码，这个能力会逐步发展出来，那它会让更多人的创造性给激发出来。”李彦宏说。

而当更多人看见AI产生的实际价值，大模型或许也能从“智能涌现”、“能力涌现”再到最终实现“价值涌现”。

伴随AI成果的涌现，人们也在关注中国大模型的“未来之问”：

中国大模型产业爆发能否复刻移动互联网时期的辉煌？中国AI公司与硅谷企业相比，又有哪些比较优势？

回到“第一性”原理，李彦宏认为百度就是“应用驱动”。

”美国很多公司一直都是梦想说我要做颠覆性的技术，我更多希望尽早接触场景及接触应用，看在这个过程当中，到底遇到了什么问题，把这些问题带回来，我们综合看一下，大家遇到的最多的问题，就是我们优先解决的问题。“李彦宏解释。

“应用驱动”既是百度的底层战略思考，也是中国大模型弯道超车的优势。

毕竟，从移动互联网时代开始，中国就诞生出诸多超级应用，在技术落地的终端入口上，中国同样也是全球最大的消费电子生产国、出口国和消费国。在迭代的技术革命主题背后，将技术创新与市场需求结合，落地用户端的应用，这一直都是中国厂商的优势和机遇所在。

近期，由弗若斯特沙利文发布的《2024年全球AI生态全景概览》中，百度也和 OpenAI、谷歌一起，成为了全球唯三被该机构承认的“AI 原生巨头”。

作为中国唯一一个榜上有名的公司，这份榜单恰好给出了我们答案：中国大模型弯道超车，机会就在应用驱动。

关于应用的故事，李彦宏和百度显然瞄准的是AI的长期主义，十二年前，投身AI浪潮的百度选择成为彼时AI火种的传播者时，没人能想到这场“应用来了”的浪潮或许将改变每个参与者的命运。

现在，他们继续沿着这条路行走，李彦宏将人工智能比喻成“一次新的工业革命”：“这意味着它不是三五年就结束，不是一两年就出现‘超级应用’的过程，它更像是三五十年对于整个社会的方方面面一个非常彻底的重构。”

拉长科技史，无论是微软谷歌，抑或是如今的英伟达，那些将经历放在专“技术是否真的有用”的科技巨头也都收获了时间的玫瑰，或许如李彦宏所言“我们即将迎来AI应用的群星闪耀时刻”，而中国大模型，也有望借助应用驱动，讲述更多的新故事。