李彦宏发布文心大模型4.0工具版：称开源模型会越来越落后

雷递

6个月前

文心大模型已成为中国最领先、应用最广泛的AI基础模型。...“今天我想跟大家分享的是一些基于大模型开发AI原生应用的具体思路和工具。

雷递网乐天 4月16日

Create 2024百度AI开发者大会今日在深圳举办。百度创始人、董事长兼首席执行官李彦宏发表了题为《人人都是开发者》的主旨演讲。他认为，大模型和生成式AI将彻底改变开发者这个群体。

“AI正在掀起一场创造力革命，未来开发应用就像拍个短视频一样简单，人人都是开发者，人人都是创造者。”

“未来，自然语言将成为新的通用编程语言，你只要会说话，就可以成为一名开发者，用自己的创造力改变世界。”

在这场活动上，百度为开发者们准备好了三大“开箱即用”的工具，包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。“这三个工具，都代表了先进生产力。”

李彦宏现场分享了百度在开发AI原生应用上的具体思路，并表示：“这是我们百度根据过去一年的实践，踩了无数的坑，交了高昂的学费换来的。”这三个开发AI原生应用的思路分别是，MoE、小模型和智能体。

会上，李彦宏正式发布了文心大模型4.0的工具版。他还透露，截至目前文心一言用户数已经突破2亿。“文心大模型已成为中国最领先、应用最广泛的AI基础模型。”

得益于文心大模型的强大，开发者通过文心4.0降维裁剪出来的更小尺寸模型，要比直接拿开源模型调出来的模型，同等尺寸下效果明显更好；同等效果下，成本明显更低。

李彦宏称，“大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的。所以开源模型会越来越落后。”

以下为李彦宏的主要观点：

自然语言将成为新的通用编程语言，只要会说话就可以成为一名开发者

“大模型和生成式AI，将彻底改变开发者这个群体。过去，开发者用代码改变世界；未来，自然语言将成为新的通用编程语言，你只要会说话，就可以成为一名开发者，用自己的创造力改变世界。”

“上岗一年多，Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业，生成的代码采纳率达到了46%，百度每天新增的代码中，已经有27%是由Comate生成的。”

“今天，你不会写代码，也可以做出一个AI应用；不用编程，也可以做出一个智能体。AI正在掀起一场创造力革命，未来开发应用就像拍个短视频一样简单，人人都是开发者，人人都是创造者。”

AgentBuilder、AppBuilder、ModelBuilder，都代表了先进生产力

“作为一家技术公司，百度的角色定位，就是尽可能地为大家提供所需的开发工具，不断提升整个社会的创造力。”

“具体来说，我们提供1个强大的基础模型系列，就是文心大模型系列，这包括旗舰版的ERNIE3.5， ERNIE4.0，也包括轻量版的ERNIE Speed、Lite、Tiny等等。”

“我们还提供基于大模型来开发各种应用的工具，包括智能体开发工具AgentBuilder，AI原生应用开发工具AppBuilder，以及各种尺寸的模型定制工具ModelBuilder。这三个工具，都代表了先进生产力。”

文心一言用户数突破2亿，文心大模型4.0工具版正式发布

“文心一言从去年3月16日发布，到今天是一年零一个月的时间。我们的用户数突破了2亿，API日均调用量也突破了2亿，服务客户数达到了8.5万，利用千帆平台开发的AI原生应用数超过了19万。”

“近几个月来，文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升，达到国际领先水平。今天，我们正式发布文心大模型4.0的工具版。”

“文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。”

“相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。也就是说，客户原来一天调用1万次，同样成本现在一天可以调用100万次。”

开发AI原生应用的具体思路，是过去一年踩了无数坑、交了高昂学费换来的

“大模型本身并不直接创造价值，基于大模型开发出来的AI应用才能满足真实的市场需求。”

“今天我想跟大家分享的是一些基于大模型开发AI原生应用的具体思路和工具。这是我们百度根据过去一年的实践，踩了无数的坑，交了高昂的学费换来的。”

“第一是MoE。未来大型的AI原生应用基本都是MoE架构，这里所说的MoE不是一般的学术概念，而是大小模型的混用，不依赖一个模型来解决所有问题。”

“第二是小模型。小模型推理成本低，响应速度快，在一些特定场景中，经过SFT精调后的小模型，它的使用效果可以媲美大模型。这就是我们发布Speed，Lite、Tiny三个轻量模型的原因。我们通过大模型，压缩蒸馏出来一个基础模型，然后再用数据去训练，这比从头开始训小模型，效果要好很多，比基于开源模型训出来的模型，效果更好，速度更快，成本更低。”

“第三是智能体。智能体是当下很热的一个话题，随着智能体能力的提升，会不断催生出大量新的应用。智能体机制，包括理解、规划、反思和进化，它让机器像人一样思考和行动，可以自主完成复杂任务，在环境中持续学习、实现自我迭代和进化。在一些复杂系统中，我们还可以让不同的智能体互动，相互协作，更高质量地完成任务。”

智能体是未来离每个人最近、最主流的大模型使用方式

“智能体可能是未来离每个人最近、最主流的大模型使用方式，基于强大的基础模型，智能体可以批量生成，应用在各种各样的场景。”

“百度刚刚升级了文心智能体平台。截至目前，已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。我们的目标是，让每个人、每个组织都成为智能体的开发者，打造国内最完整的智能体生态。那如何实现这个目标呢？就是给大家提供零门槛的智能体开发工具AgentBuilder。”

“今天，每一个商家、每一个客户，都能在百度拥有专属的智能体。整个过程完全不需要编程，通过类似提示词的信息输入，和简单的几步操作调优，就能迅速生成一个智能体，成为7X24小时在线的金牌业务员。”

现场，李彦宏演示了新加坡旅游局、启德教育和索菲亚三个智能体案例，手把手教开发者用自然语言，5分钟、零门槛创建一个智能体。

“启德教育智能体非常的受欢迎，上线第一周，就成功分发了155万次，与用户交互了5.8万次，线索转化量直线增长、有效线索的转化成本明显降低，经营效率大幅提升。”

“索菲亚商家智能体上线以来，有效线索成本下降了30%。也就是说，它获得一个有效客户，如果过去的成本是100块，现在只需要70块了。

AppBuilder：最好用的AI原生应用开发工具，用自然语言三步就能开发一个应用

“AppBuilder，它是目前最好用的AI原生应用开发工具。在AppBuilder上面，我们提前封装和预置了开发AI原生应用所需的各种组件和框架，大幅降低开发门槛。”

“最快只需三步，开发者就可以用自然语言开发出一个AI原生应用，并且能够便捷地发布、集成到各种各样的业务环境中。”

现场，通过“游乐场排队助手”、华北电力大学“华电AI助理”和百度文库智能漫画生成三个案例，李彦宏展示了一个AI原生应用的创建过程。只需名称设定、填写角色指令、插入组件简单三步，即可创建一个AI原生应用。

他还指出，AppBuilder拥有两大优势：

“一是功能强大。依托文心4.0对指令的理解和遵循能力，我们的AppBuilder，能保证冷启动就能达到一个不错的水平，不会因为效果差，再花很长时间去调优，大大降低了开发门槛。依托检索增强技术RAG，在知识问答等典型场景，我们的问答准确率和友好回复程度都达到了95%以上，大幅超越其他同类产品。”

“AppBuilder还提供丰富完整的组件工具，包括百度搜索等基于百度多年技术积累的AI能力组件、大模型能力组件，还有百度独家开放的业务组件等55个组件。以及一些主流场景的第三方API，比如航班查询、论文查询等。我们还刚刚支持了自定义组件，客户可以直接对接自己专有的任何工具和数据。这些丰富的组件，共同支撑起了AI原生应用的高效开发。”

“二是简单易用。使用AppBuilder，只需三步即可快速创建应用、一键分发。我们也支持开源的SDK，方便大家进行二次开发。”

各种尺寸的模型定制工具ModelBuilder：高效低价生产模型

“更适合专业开发者使用的工具，那就是ModelBuilder，它可以根据开发者的需求定制任意尺寸的模型，并根据细分场景对模型进一步精调SFT，这样就能达到更好的效果。”

现场，李彦宏展示了教育行业作文批改的案例，经过数据处理、模型精调后的“作文批改助手”，不仅可以拥有更专业的老师点评思维、做到格式遵循，而且相比未精调模型，精调后的模型打分与真实的老师点评分数更为接近。

他还在现场与小度实时互动，展示小度用MoE多个模型组合的方式来执行不同任务，例如使用小模型ERNIE Tiny执行模型路由工作，而性能最好的文心4.0则用来执行日程安排等复杂需求。据介绍，相比全部使用文心大模型的旗舰版，小度可以实现响应速度提升2倍，成本下降99%。

李彦宏表示，“这几个关于ModelBuilder的例子，展示的是百度高效低价生产模型的能力”。

“为了方便大家快速上手，ModelBuilder预置了最全面最丰富的大模型。包括了ERNIE3.5和ERNIE4.0，这是旗舰版的大模型，它适合通用的复杂场景，能力强大；还有三个轻量级的大模型，ERNIE Speed、Lite、Tiny；另外还有两个垂直场景的模型，ERNIE Character适合角色扮演；ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。当然ModelBuilder也支持国内外第三方主流模型，总数量达到77个，是国内拥有大模型数量最多的开发平台。”

开源模型会越来越落后

“因为有了最强大的基础模型文心4.0，我们可以根据需要，兼顾效果、响应速度，推理成本等各种考虑，裁剪出适合各种场景的更小尺寸模型，并且支持精调和post pretrain。”

“这样通过降维裁剪出来的模型，比直接拿开源模型调出来的模型，同等尺寸下效果明显更好，同等效果下，成本明显更低。”

“大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的。所以开源模型会越来越落后。”

多模态大模型是通往AGI必经之路，视觉大模型最大的应用场景是自动驾驶

“面向未来，我认为多模态大模型，或者说文字、图片、语音、视频等多模态的融合，是基础模型非常重要的长期发展方向，是通往AGI的必经之路。百度在这些领域有着长期投入，并将及时更新大模型的最新进展。”

“我有一个非常不一样的判断：视觉大模型最大的应用场景是自动驾驶。百度在这个方向上是最好的，是自动驾驶的全球领导者，我们不只训练AI如何生成视频，更训练AI理解真实世界发生的事情并预测未来。”

“基于超过1亿公里的、中国复杂城市道路测试里程数据，百度训练出来了Apollo视觉感知大模型。它具备检测、跟踪、理解、建图四大基础能力。这让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。”

人人都可以成为开发者，未来，必将是一个由开发者一起创造出来的未来

“今天的中国，有10亿互联网用户，有强大的基础大模型，有足够多的AI应用场景，有全球最完备的产业体系，国家也在大力鼓励和支持‘人工智能+’行动，每一个人，每一家企业，只需要充分利用这些工具，就可以释放无限的创造力和生产力。”

“人人都可以成为开发者，而未来，也必将是一个由开发者一起创造出来的未来！”

———————————————

雷递由媒体人雷建平创办，若转载请写明来源。