9月11日,中国基金报记者获悉,百度创始人、董事长兼CEO李彦宏在近日和员工交流中,详谈了三个大模型认知误区,涵盖大模型竞争、开源模型效率、智能体趋势等热点话题。
李彦宏认为,目前外界对大模型有相当多的误解。未来大模型之间的差距可能会越来越大。大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级,不断满足用户需求,以及降本增效。
未来大模型之间的差距会越来越大
领先对手6个月就赢了
近年来,行业大模型持续涌现,业内也开始出现一种观点,认为大模型之间的能力已经没有壁垒。
李彦宏并不认同这种说法,他认为外界对大模型有相当多的误解,“每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了。但这并不能证明这些新发的模型跟OpenAl最先进的模型相比,已经没有那么大的差距了”。
李彦宏表示,模型之间的差距是多维度的,一是能力方面,即理解能力、生成能力、逻辑推理能力、记忆能力等基本能力上的差距;二是成本方面,有些模型虽能达到同样效果,但成本高、推理速度慢,还是不如先进模型。
此外就是对于测试集的over-fitting(过拟合),他指出很多模型为了证明自己,会在发布之后去打榜,会去猜测试题目、答题技巧。从榜单上看,或许模型的能力已经很接近了,“但到实际应用中,实力还是有明显差距的”。
李彦宏认为,部分自媒体的炒作,加上每个新模型发布时的宣传,使得大家认为模型之间的能力差距已经比较小了,其实不是这样。
“我们需要看到,一方面,模型之间的能力还有比较明显的差距;另一方面,天花板很高,你今天做到的跟你实际想要做到的,以及跟理想状态比还差得非常远。所以模型还需要不断快速地去迭代、去更新、去升级。”李彦宏表示,不同模型之间的差距不是越来越小,而是会越来越大。
李彦宏还认为,每个公司都处在完全竞争的市场环境中,不管做什么都会有很多竞争对手,如果能永远保证领先对手12~18个月,那是天下无敌的。“不要觉得12~18个月是很短的时间,哪怕能保证永远领先竞争对手6个月,那就赢了。”
开源模型效率不高
无法在商业领域与闭源模型竞争
针对业内关注的开源模型与闭源模型差距缩小,是否会影响闭源大模型公司商业模式的问题。李彦宏直言,一个模型除了能力、效果之外,还要看效率,在效率上开源模型是不行的。
“闭源模型准确地讲应该叫商业模型,商业化的模型是无数个用户或者说客户共享同样的资源,分摊研发成本,分摊推理用的机器资源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都超过90%。”李彦宏称。
他表示,在大模型时代之前,大家习惯了开源,这意味着免费、成本低。比如开源的Linux,因为已经有了电脑,所以使用Linux是免费的。但这些在大模型时代都不成立,大模型推理是很贵的,开源模型不会送算力,无法实现算力的高效利用。
“文心大模型每天调用量超过6亿次,每天生成的token数超过万亿个,哪个开源模型可以说自己一天调用量是多少、生成了多少token?没有人用的话,成本怎么分担?推理成本怎么能够跟商业化模型相比呢?”李彦宏问道。
因此,李彦宏认为,在教学科研等领域,开源模型是有价值的;但在商业领域,当大家追求的是效率、效果和最低成本时,开源模型是没有优势的。
智能体是最重要的发展方向
但还不是业界共识
谈及大模型应用的发展阶段,李彦宏认为首先出现的是Copilot,对人进行辅助;接下来是Agent智能体,有一定的自主性,能自主使用工具、反思、自我进化;这种自动化程度再发展,就会变成AI Worker,能独立完成各方面的工作。
不过,李彦宏坦言,“智能体是大模型最重要的发展方向”这个判断其实是一个非共识。此前百度Create大会发布了AgentBuilder、AppBuilder、ModelBuilder三个产品,其中AgentBuilder和AppBuilder都是讲智能体的,但目前像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。
为什么百度这么强调智能体?李彦宏也给出了答案,即智能体的门槛低。“我们去年说要卷应用,大家都去做应用,其实很多人还是不知道该怎么做,大家不知道怎么从模型变成应用”。
对此,李彦宏认为智能体提供了一个非常直接、非常高效、非常简单的方式,在模型之上构建智能体是相当方便的,“这也是为什么如今每周都有上万个新的智能体在文心平台上被创造出来。智能体的日均分发次数已快速增长至800万次”。
李彦宏还表示,在智能体方面,公司已经看到了趋势,也有比较好的先决条件,即除了模型本身的能力比较强大之外,还有很好的分发通路。因此他们也是最能帮助这些开发者分发智能体的公司。
(文章来源:中国基金报)
9月11日,中国基金报记者获悉,百度创始人、董事长兼CEO李彦宏在近日和员工交流中,详谈了三个大模型认知误区,涵盖大模型竞争、开源模型效率、智能体趋势等热点话题。
李彦宏认为,目前外界对大模型有相当多的误解。未来大模型之间的差距可能会越来越大。大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级,不断满足用户需求,以及降本增效。
未来大模型之间的差距会越来越大
领先对手6个月就赢了
近年来,行业大模型持续涌现,业内也开始出现一种观点,认为大模型之间的能力已经没有壁垒。
李彦宏并不认同这种说法,他认为外界对大模型有相当多的误解,“每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了。但这并不能证明这些新发的模型跟OpenAl最先进的模型相比,已经没有那么大的差距了”。
李彦宏表示,模型之间的差距是多维度的,一是能力方面,即理解能力、生成能力、逻辑推理能力、记忆能力等基本能力上的差距;二是成本方面,有些模型虽能达到同样效果,但成本高、推理速度慢,还是不如先进模型。
此外就是对于测试集的over-fitting(过拟合),他指出很多模型为了证明自己,会在发布之后去打榜,会去猜测试题目、答题技巧。从榜单上看,或许模型的能力已经很接近了,“但到实际应用中,实力还是有明显差距的”。
李彦宏认为,部分自媒体的炒作,加上每个新模型发布时的宣传,使得大家认为模型之间的能力差距已经比较小了,其实不是这样。
“我们需要看到,一方面,模型之间的能力还有比较明显的差距;另一方面,天花板很高,你今天做到的跟你实际想要做到的,以及跟理想状态比还差得非常远。所以模型还需要不断快速地去迭代、去更新、去升级。”李彦宏表示,不同模型之间的差距不是越来越小,而是会越来越大。
李彦宏还认为,每个公司都处在完全竞争的市场环境中,不管做什么都会有很多竞争对手,如果能永远保证领先对手12~18个月,那是天下无敌的。“不要觉得12~18个月是很短的时间,哪怕能保证永远领先竞争对手6个月,那就赢了。”
开源模型效率不高
无法在商业领域与闭源模型竞争
针对业内关注的开源模型与闭源模型差距缩小,是否会影响闭源大模型公司商业模式的问题。李彦宏直言,一个模型除了能力、效果之外,还要看效率,在效率上开源模型是不行的。
“闭源模型准确地讲应该叫商业模型,商业化的模型是无数个用户或者说客户共享同样的资源,分摊研发成本,分摊推理用的机器资源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都超过90%。”李彦宏称。
他表示,在大模型时代之前,大家习惯了开源,这意味着免费、成本低。比如开源的Linux,因为已经有了电脑,所以使用Linux是免费的。但这些在大模型时代都不成立,大模型推理是很贵的,开源模型不会送算力,无法实现算力的高效利用。
“文心大模型每天调用量超过6亿次,每天生成的token数超过万亿个,哪个开源模型可以说自己一天调用量是多少、生成了多少token?没有人用的话,成本怎么分担?推理成本怎么能够跟商业化模型相比呢?”李彦宏问道。
因此,李彦宏认为,在教学科研等领域,开源模型是有价值的;但在商业领域,当大家追求的是效率、效果和最低成本时,开源模型是没有优势的。
智能体是最重要的发展方向
但还不是业界共识
谈及大模型应用的发展阶段,李彦宏认为首先出现的是Copilot,对人进行辅助;接下来是Agent智能体,有一定的自主性,能自主使用工具、反思、自我进化;这种自动化程度再发展,就会变成AI Worker,能独立完成各方面的工作。
不过,李彦宏坦言,“智能体是大模型最重要的发展方向”这个判断其实是一个非共识。此前百度Create大会发布了AgentBuilder、AppBuilder、ModelBuilder三个产品,其中AgentBuilder和AppBuilder都是讲智能体的,但目前像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。
为什么百度这么强调智能体?李彦宏也给出了答案,即智能体的门槛低。“我们去年说要卷应用,大家都去做应用,其实很多人还是不知道该怎么做,大家不知道怎么从模型变成应用”。
对此,李彦宏认为智能体提供了一个非常直接、非常高效、非常简单的方式,在模型之上构建智能体是相当方便的,“这也是为什么如今每周都有上万个新的智能体在文心平台上被创造出来。智能体的日均分发次数已快速增长至800万次”。
李彦宏还表示,在智能体方面,公司已经看到了趋势,也有比较好的先决条件,即除了模型本身的能力比较强大之外,还有很好的分发通路。因此他们也是最能帮助这些开发者分发智能体的公司。
(文章来源:中国基金报)