大模型之战:以开放对开放,以开源对开源

智车科技

3天前

从较深的层次来讲,这宣告了大力出奇迹的大模型1.0时代的结束,而2.0时代即将到来。...纯从技术生态角度讲,开源与闭源有竞争,但从根本上不冲突,它可能是出于覆盖不同场景、不同终端和用户的需要所致,也可能是未来的打法和现在已有不同。

DeepSeek不仅仅是鲶鱼,而是彻底的改变了大模型世界的玩法。无论是大厂还是新秀,面对技术更迭最好的办法不是用钱砸,而是用魔法打败魔法。

——导语

01

——全面开放

最近我身边的朋友都在讨论同一个问题,那就是——当DeepSeek已经不再是前浪的时候,谁会把它拍在沙滩上?

是大厂的后发先至?还是新的竞争业态?

图片

都有可能,而且战争已经打响了。

2月14日情人节当天,百度宣布文心大模型开源——将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。

情人节前一天,还有一件大事情:那就是大洋彼岸的Open AI宣布免费开放。

而且,这次免费的动作非常大,可不是仅仅开放一两个模型,例如文心一言,将于4月1日0时起全面免费,所有PC端和App 端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能 ;文心一言即日起还将上线深度搜索功能,具备更强大的思考规划和工具。

图片

几乎同时,OpenAI首席执行官Sam Altman公布了GPT-4.5和GPT-5的最新消息。免费版ChatGPT能在标准智能设置下无限制地使用GPT - 5进行对话。

图片

值得一提的是,就在OpenAI公布ChatGPT Search全面开放的前几个小时,谷歌也刚刚宣布向所有人开放最新Gemini 2.0模型,包括Flash、Pro Experimental和Flash-Lite三个版本。

如果说这三家是约好的,我可真不敢相信。所以,显然,这个决策代表了AI大厂的主流选择。

在DeepSeek全球疯狂吸粉的当下,免费开放这种做法,显然是为了加大对C端用户的吸引力,避免用户流失。

从目前来看,用户规模带来的最大价值,还不是商业营收,而是用户基数带来的数据价值。

而从较深的层次来讲,这宣告了大力出奇迹的大模型1.0时代的结束,而2.0时代即将到来。

为什么这么说,因为某种意义上说,DeepSeek最有吸引力的地方和优势,不是它的模型能力最强,而是成本足够低。

成本低就有提供高性价比产品的空间,低价就会成为用户的一个重要的决策要素。

但是当其他强大的大模型也把成本打下来的时候,DeepSeek感受到压力就在所难免了。

大模型的C端市场,本身就是一个没有粘性、没有壁垒的市场。

我记得,李彦宏以前说过一个名言,他说——搜索引擎是世界上用户转化成本最低的应用,因为只要在你这里搜不到结果,3秒钟后用户就直奔下一个搜索引擎而去。

这个论断同样适应于大模型赛道,在价格优势(甚至是免费)的加成下,大厂的开放策略和沉淀在其平台上的AI应用丰富度,就成为了反制的绝佳武器。

但是,反制不等于压制,从业务侧来说,百度很好的支持了DeepSeek在百度云的部署,甚至收费比DeepSeek还要便宜,表层原因是因为用户需要,深层原因是未来所有的智能云厂商都要面临这种竞争中有合作的新型关系。

但这也决定了,百度不会用封闭去对抗开放,而要在真实的市场竞争中和DeepSeek以及其它顶级对手一较高低。

02

——时移势易 因时而动

说到这一点,更值得注意的是百度今早官宣的大模型开源。

要知道,百度一直是大模型闭源的倡导者,那句“闭源模型比开源的更有效率”更是广为人知。

但是,百度没有胶柱鼓瑟,它们不但能够随时调整战略,更能够用一种变化的、发展的眼光来审时度势,这样反而让百度显得很务实。

纯从技术生态角度讲,开源与闭源有竞争,但从根本上不冲突,它可能是出于覆盖不同场景、不同终端和用户的需要所致,也可能是未来的打法和现在已有不同。

像是早期营销开源的Llama,其实是只开源了部分参数和配置文件,这种“半开源”一定程度上反而影响模型的可验证性和可信度;而当下,大模型已经走过了初级阶段,开源则有助于技术更快传播,提高采用率,为好奇的、有能力的人去做AI应用创新带来更多机会。

而未来,开闭源的界限说不定又将进一步模糊——一种“开放核心+增值闭源服务”的新商业模式,正在浮出水面。

但我希望读者们了解的是,价格从来不是大模型竞争的唯一要素,更重要的还是模型的性能、成本能否支持更庞大和广泛的应用需求。

百度表面是降价,但降价的底气是降本。目前,大模型正在进入一个降本时代,每12个月降本90%。如果这个速度能保持很长一段时间,那么可想而知,随着成本迅速下降,大模型也将迎来应用爆发时刻。

而要在这种爆发中领先,模型的能力、其智能水准是AI的第一性原理和第一主题,但这种水平的发挥作用则是提供落子应用来实现的,正如李彦宏所说,“归根结底,最重要的是应用,而不是使用哪种大模型。不管它是开源还是闭源,更重要的是可以在应用层创造什么样的价值。”

03

——比数据价值更大的是心智价值

大厂的竞相免费,看上去是攻,实际上是在守。守的目的,是要保证用户不流失。从目前看,C侧市场还是得用户者得天下,所以接下来只会有更激烈的竞争和更多的免费。百度此时免费开放,是为了在未来竞争加剧到来之前“热身”而已。

但是,除了百度自己要把自家帐算明白以外,仅仅靠开放和免费还是不够的。

任何成功的模式,都必须有一个“客观上的利他因素”,才能吸引千千万万的用户和开发者进来。

而百度的客观利他则体现在,它用全免费、全开放的策略,让中国乃至世界的开发者零门槛、低成本的使用到其自家大模型的所有深度、成熟的功能。

以前这些功能或要收费,或应用门槛较高,所以相当来说是小众的。但百度全免费以后,就好比宣布你以后可以用经济舱的价格坐商务舱的座位一样,这对普及、普惠文心大模型的高阶能力,有极大助益。也会对百度心心念念的“大模型主要是卷应用”提供了炮火支持。

更重要的一点是,免费虽然有吸引力,但对用户粘性来说远远不够。

这里,我要引入两个营销学上的概念——品类代言和深层心智绑定。

比如,很长一段时间,我们认为飘柔就是最好的洗发水,那飘柔就是品类代言,是所有用户在想到“洗发水”时候的第一个直观商品。

同样,Alpha go战胜了人类棋手,让AI进入公众心智,那时候它就是AI的品类代言;Open AI,让生成式大模型大模型进入心智;文心,让国产的、世界级水准的大模型进入用户心智……它们的努力的目的,就是深度和用户的心智绑定。

而要实现这次绑定,是一场持久战。而要打赢持久战,心智建设必然,这时候充分开放、免费,吸引用户,就是占据心智的为数不多的好办法。

04

——降本不止一条路

DeepSeek用降低成本的方式实现了跨越式赶超,但大模型的降本之道,远非自古华山一条路。

仍以百度为例,它的昆仑芯在性能上表现卓越,能够在更少的计算资源下运行大规模模型(如DeepSeek-V3/R1)。这使得大模型的推理和训练所需的计算量减少,从而直接降低算力成本。

又比如,万卡集群的能耗极高,常规的散热方案能耗可达十兆瓦或更高,这将极大提升企业进行模型训练的电力成本,为此,百度的百舸采用了创新性散热方案,可以有效降低能耗,进一步降低模型训练成本。

再比如,通过不断优化并完善模型的分布式训练策略,通过高效并行化任务切分策略,可以做到将训练主流开源模型的集群MFU(可以理解为GPU的使用效率)提升至58%。

而在大家关注的推理侧,尤其是在百度飞桨深度学习框架的支持下,并行推理、量化推理等都是飞桨在大模型推理上的自研技术,飞桨和文心的联合优化可以实现推理性能提升,推理成本一年降低99%。

这就有点像华为为啥能用在性能上落后的芯片,还能开发出旗舰级体验的产品,归根结底还是掌握了尽可能多的技术栈,可以更充分的进行真正意义上的端到端优化。

结语

如果说DeepSeek的的出现,改变了只有大厂才能在大模型之战中取胜的刻板印象,但这也宣告了,随时会有新的DeepSeek把前浪拍在沙滩上,大模型之战是持久战、国运战。大厂能够用主动、开放、接受的姿态去迎接未来无尽无边的挑战,是战略上最大的清醒。

事实上,今天我们看到的只是一场大乱斗的序章。在这场竞争中,优势并不一定属于资源更丰富的大厂,也完全可能是赌对方向的新创企业;在产品上,彼此的大模型是竞品关系,但竞品也会出现在自家的智能云货架上;企业间的人员将加速流动,技术开源速度越来越快,新技术会很快就开源并传播……这是一场没有绝对阵营、绝对盟友、绝对核心阵地的运动战。但也只有这样的战争模式,才能从根本上促进和倒逼中国加速成为全球AI创新的策源地。

从这个角度上来说,选择免费、开放、开源,受益的远非一家一姓,而是推动了整个中国AI产业进入一个烈度更高,优胜劣汰更残酷,技术迭代更迅速的时代。

原文标题 : 大模型之战:以开放对开放,以开源对开源

从较深的层次来讲,这宣告了大力出奇迹的大模型1.0时代的结束,而2.0时代即将到来。...纯从技术生态角度讲,开源与闭源有竞争,但从根本上不冲突,它可能是出于覆盖不同场景、不同终端和用户的需要所致,也可能是未来的打法和现在已有不同。

DeepSeek不仅仅是鲶鱼,而是彻底的改变了大模型世界的玩法。无论是大厂还是新秀,面对技术更迭最好的办法不是用钱砸,而是用魔法打败魔法。

——导语

01

——全面开放

最近我身边的朋友都在讨论同一个问题,那就是——当DeepSeek已经不再是前浪的时候,谁会把它拍在沙滩上?

是大厂的后发先至?还是新的竞争业态?

图片

都有可能,而且战争已经打响了。

2月14日情人节当天,百度宣布文心大模型开源——将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。

情人节前一天,还有一件大事情:那就是大洋彼岸的Open AI宣布免费开放。

而且,这次免费的动作非常大,可不是仅仅开放一两个模型,例如文心一言,将于4月1日0时起全面免费,所有PC端和App 端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能 ;文心一言即日起还将上线深度搜索功能,具备更强大的思考规划和工具。

图片

几乎同时,OpenAI首席执行官Sam Altman公布了GPT-4.5和GPT-5的最新消息。免费版ChatGPT能在标准智能设置下无限制地使用GPT - 5进行对话。

图片

值得一提的是,就在OpenAI公布ChatGPT Search全面开放的前几个小时,谷歌也刚刚宣布向所有人开放最新Gemini 2.0模型,包括Flash、Pro Experimental和Flash-Lite三个版本。

如果说这三家是约好的,我可真不敢相信。所以,显然,这个决策代表了AI大厂的主流选择。

在DeepSeek全球疯狂吸粉的当下,免费开放这种做法,显然是为了加大对C端用户的吸引力,避免用户流失。

从目前来看,用户规模带来的最大价值,还不是商业营收,而是用户基数带来的数据价值。

而从较深的层次来讲,这宣告了大力出奇迹的大模型1.0时代的结束,而2.0时代即将到来。

为什么这么说,因为某种意义上说,DeepSeek最有吸引力的地方和优势,不是它的模型能力最强,而是成本足够低。

成本低就有提供高性价比产品的空间,低价就会成为用户的一个重要的决策要素。

但是当其他强大的大模型也把成本打下来的时候,DeepSeek感受到压力就在所难免了。

大模型的C端市场,本身就是一个没有粘性、没有壁垒的市场。

我记得,李彦宏以前说过一个名言,他说——搜索引擎是世界上用户转化成本最低的应用,因为只要在你这里搜不到结果,3秒钟后用户就直奔下一个搜索引擎而去。

这个论断同样适应于大模型赛道,在价格优势(甚至是免费)的加成下,大厂的开放策略和沉淀在其平台上的AI应用丰富度,就成为了反制的绝佳武器。

但是,反制不等于压制,从业务侧来说,百度很好的支持了DeepSeek在百度云的部署,甚至收费比DeepSeek还要便宜,表层原因是因为用户需要,深层原因是未来所有的智能云厂商都要面临这种竞争中有合作的新型关系。

但这也决定了,百度不会用封闭去对抗开放,而要在真实的市场竞争中和DeepSeek以及其它顶级对手一较高低。

02

——时移势易 因时而动

说到这一点,更值得注意的是百度今早官宣的大模型开源。

要知道,百度一直是大模型闭源的倡导者,那句“闭源模型比开源的更有效率”更是广为人知。

但是,百度没有胶柱鼓瑟,它们不但能够随时调整战略,更能够用一种变化的、发展的眼光来审时度势,这样反而让百度显得很务实。

纯从技术生态角度讲,开源与闭源有竞争,但从根本上不冲突,它可能是出于覆盖不同场景、不同终端和用户的需要所致,也可能是未来的打法和现在已有不同。

像是早期营销开源的Llama,其实是只开源了部分参数和配置文件,这种“半开源”一定程度上反而影响模型的可验证性和可信度;而当下,大模型已经走过了初级阶段,开源则有助于技术更快传播,提高采用率,为好奇的、有能力的人去做AI应用创新带来更多机会。

而未来,开闭源的界限说不定又将进一步模糊——一种“开放核心+增值闭源服务”的新商业模式,正在浮出水面。

但我希望读者们了解的是,价格从来不是大模型竞争的唯一要素,更重要的还是模型的性能、成本能否支持更庞大和广泛的应用需求。

百度表面是降价,但降价的底气是降本。目前,大模型正在进入一个降本时代,每12个月降本90%。如果这个速度能保持很长一段时间,那么可想而知,随着成本迅速下降,大模型也将迎来应用爆发时刻。

而要在这种爆发中领先,模型的能力、其智能水准是AI的第一性原理和第一主题,但这种水平的发挥作用则是提供落子应用来实现的,正如李彦宏所说,“归根结底,最重要的是应用,而不是使用哪种大模型。不管它是开源还是闭源,更重要的是可以在应用层创造什么样的价值。”

03

——比数据价值更大的是心智价值

大厂的竞相免费,看上去是攻,实际上是在守。守的目的,是要保证用户不流失。从目前看,C侧市场还是得用户者得天下,所以接下来只会有更激烈的竞争和更多的免费。百度此时免费开放,是为了在未来竞争加剧到来之前“热身”而已。

但是,除了百度自己要把自家帐算明白以外,仅仅靠开放和免费还是不够的。

任何成功的模式,都必须有一个“客观上的利他因素”,才能吸引千千万万的用户和开发者进来。

而百度的客观利他则体现在,它用全免费、全开放的策略,让中国乃至世界的开发者零门槛、低成本的使用到其自家大模型的所有深度、成熟的功能。

以前这些功能或要收费,或应用门槛较高,所以相当来说是小众的。但百度全免费以后,就好比宣布你以后可以用经济舱的价格坐商务舱的座位一样,这对普及、普惠文心大模型的高阶能力,有极大助益。也会对百度心心念念的“大模型主要是卷应用”提供了炮火支持。

更重要的一点是,免费虽然有吸引力,但对用户粘性来说远远不够。

这里,我要引入两个营销学上的概念——品类代言和深层心智绑定。

比如,很长一段时间,我们认为飘柔就是最好的洗发水,那飘柔就是品类代言,是所有用户在想到“洗发水”时候的第一个直观商品。

同样,Alpha go战胜了人类棋手,让AI进入公众心智,那时候它就是AI的品类代言;Open AI,让生成式大模型大模型进入心智;文心,让国产的、世界级水准的大模型进入用户心智……它们的努力的目的,就是深度和用户的心智绑定。

而要实现这次绑定,是一场持久战。而要打赢持久战,心智建设必然,这时候充分开放、免费,吸引用户,就是占据心智的为数不多的好办法。

04

——降本不止一条路

DeepSeek用降低成本的方式实现了跨越式赶超,但大模型的降本之道,远非自古华山一条路。

仍以百度为例,它的昆仑芯在性能上表现卓越,能够在更少的计算资源下运行大规模模型(如DeepSeek-V3/R1)。这使得大模型的推理和训练所需的计算量减少,从而直接降低算力成本。

又比如,万卡集群的能耗极高,常规的散热方案能耗可达十兆瓦或更高,这将极大提升企业进行模型训练的电力成本,为此,百度的百舸采用了创新性散热方案,可以有效降低能耗,进一步降低模型训练成本。

再比如,通过不断优化并完善模型的分布式训练策略,通过高效并行化任务切分策略,可以做到将训练主流开源模型的集群MFU(可以理解为GPU的使用效率)提升至58%。

而在大家关注的推理侧,尤其是在百度飞桨深度学习框架的支持下,并行推理、量化推理等都是飞桨在大模型推理上的自研技术,飞桨和文心的联合优化可以实现推理性能提升,推理成本一年降低99%。

这就有点像华为为啥能用在性能上落后的芯片,还能开发出旗舰级体验的产品,归根结底还是掌握了尽可能多的技术栈,可以更充分的进行真正意义上的端到端优化。

结语

如果说DeepSeek的的出现,改变了只有大厂才能在大模型之战中取胜的刻板印象,但这也宣告了,随时会有新的DeepSeek把前浪拍在沙滩上,大模型之战是持久战、国运战。大厂能够用主动、开放、接受的姿态去迎接未来无尽无边的挑战,是战略上最大的清醒。

事实上,今天我们看到的只是一场大乱斗的序章。在这场竞争中,优势并不一定属于资源更丰富的大厂,也完全可能是赌对方向的新创企业;在产品上,彼此的大模型是竞品关系,但竞品也会出现在自家的智能云货架上;企业间的人员将加速流动,技术开源速度越来越快,新技术会很快就开源并传播……这是一场没有绝对阵营、绝对盟友、绝对核心阵地的运动战。但也只有这样的战争模式,才能从根本上促进和倒逼中国加速成为全球AI创新的策源地。

从这个角度上来说,选择免费、开放、开源,受益的远非一家一姓,而是推动了整个中国AI产业进入一个烈度更高,优胜劣汰更残酷,技术迭代更迅速的时代。

原文标题 : 大模型之战:以开放对开放,以开源对开源

展开
打开“财经头条”阅读更多精彩资讯
APP内打开