昆仑万维方汉:头部AI大模型的算法优势正被拉平,中国企业的机会在于产品与商业创新

创业邦

2周前

图片大模型所需要的数据是万亿量级,这个领域已经严重放缓。...数据量最少的是3D大模型,只有1300万的3D模型数据。...中国企业能够获取的算力资源比起美国少很多,但是中国AI企业擅长以软补硬和商业模式创新。

12月13日,2024 ADD数据应用场景大会在北京市通州区台湖镇隆重举办,数十位数据要素创业者、投资人,一起走进通州台湖,共话北京副中心产业发展新机遇,探寻数据要素创新的无限可能。

会上,昆仑万维董事长兼CEO方汉在题为“推动AI应用创新,构建企业核心竞争力”的演讲中,精彩观点如下:

1、大模型的训练进度已经严重放缓,可用的高质量数据不足是主要制约因素。

2、头部AI大模型的技术红利期呈现缩短的趋势,后期竞争主要看产品创新和商业模式。

3、AI技术的出现降低了内容出海门槛,中国企业将有能力推动文化平权。

以下为现场演讲/对话内容,经创业邦整理后发布:

昆仑万维在模型层

与应用层的布局

昆仑万维2008年成立,2015年在创业板上市,在2015年之后开始从网游公司转向海外互联网平台的转型,在海外收购了大量的互联网厂牌。2020年之后,我们又开始AI方面的应用和模型的研发,并在2022年大规模采购计算资源,同时也控股了北京的算力芯片企业艾捷科芯。

目前,我们已经完成了AI全产业链布局,模型层有5大自研模型,包括文本、多模态图文、3D、视频、音乐,同时在应用层有AI助手、AI游戏、AI社交、AI短剧和AI音乐等产品和服务。其中,音乐大模型是目前全世界音乐生成模型里面最好的产品之一。

截止到今天,昆仑的月活跃用户是4亿左右,海外收入占比接近90%,在100多个国家和地区拥有业务,20多个国家有我们的办公室和海外团队。

近期的进展是,我们推出了天工大模型4.0的o1版本,是中国第一款具有中文逻辑推理能力的o1模型,国内做推理方向探索的企业目前还没有特别多,我们是第一批之一。

另外一个重要产品,是我们的AI短剧平台,这是全球首个集成了视频模型与3D大模型的平台。现在市场上的视频生成大模型都浪费了大量的计算资源,让用户生成自己视频的过程中也花费了大量时间。而我们的Skyreels是先用3D大模型进行场景跟动作的演绎,再直接生成视频片段,生成速度和效率应该是AI短视频业内最高的。

大模型技术红利期大幅缩短

产品创新和商业模式竞争加剧

大家都注意到,大模型训练的进度放缓,这跟不同模型所需的数据规模有很大关系。

文本大模型需要的文本数据大概是1亿token量级,这块放缓的速度还没有那么慢。再往上看,业界最关注的视频生成模型,数据量在千亿左右,其中Youtube和抖音基本上都在百亿个视频左右,目前的训练量已经有不足的趋势。而图片大模型所需要的数据是万亿量级,这个领域已经严重放缓。说到我们做的音乐大模型,这个赛道数据量就更少了,人类诞生起至今生产的歌曲数量有4000万首,在音乐大模型领域的玩家很快就可以做到比较高的水平,同时对计算资源的需求也比较少。数据量最少的是3D大模型,只有1300万的3D模型数据。

所以,我们认为大模型的规模化预训练已经放缓,但是在o1这个推理模型出来之后,用慢思考的方法,让推理消耗的时间更长,思考更谨慎,也会大幅提高模型的能力。

我们还可以看到,GPT-3.5的技术领先将近1年左右,在早期任何一个大模型的技术红利时间都会比较长。随着参与的厂商越来越多,红利越来越短。Sora是OpenAI一年前发布的,但是根本没有吃到红利。到目前这个阶段,很难有一家企业通过技术水平在全球能长期领先。这时候,产品和商业模式的创新就更为重要。

中国企业能够获取的算力资源比起美国少很多,但是中国AI企业擅长以软补硬和商业模式创新。

举一个例子,Sora训练大概用了8000张GPU,型号应该是A100和H100。但是中国企业训练的时候,只花了不到1000张卡。我们通过算法上不断改进,让训练成本和推理成本大幅度降低,从而取得一定的竞争优势。

商业模式倒逼就是另外一个问题。美国的AI创业公司能获取的投资非常多,没有盈利上的压力,而中国同行在盈利上的压力非常大。这样也倒逼了中国AI企业在商业模式和产品模式上的创新非常有紧迫感。我们拥有世界最庞大的AI算法工程师团队,硬件不够,软件来凑,最近在软件优化方面取得了很多进展。

AI技术帮助中国企业做内容出海

推动文化平权

先解释一下什么是文化平权。

我们公司在非洲做的业务比较多,我在尼日利亚的时候,发现尼日利亚拍一部电影的成本大概是不到一百万人民币,这样拍出来的影片没有竞争力。很多小语种是没有自己的本土文化的,制作文化产品的成本和门槛高,这样导致尼日利亚本地人主要看的还是美国和印度大片。

我们计算过,当一个语言的使用人数在5000万人以下的时候,就没有能力生产文化产品。自己的诗歌、电影、小说漫画都会被西方强势文化所垄断。

但是在AI出现之后,这个情况我们认为会有极大的转变。AIGC这一波升级会带来创作内容成本和门槛的极大降低,导致全世界弱势文化和小语种文化都会用AI来创作自己的本土内容。

我们中国企业以及“一带一路”国家其实都是AI文化平权的极大受益者。但这些国家的问题在于他们自己的技术能力非常弱,市场具有非常大的蓝海,而中国企业有了强大的AIGC能力,也就有了出海耕耘的机会。

我们做AIGC的时候,用户不太关心内容是不是AI生成的,只关心内容是否新颖或者优质。大家都知道最近有一款网络游戏叫《黑神话》,非常成功,整体投入3-4亿人民币左右。这是一个非常高的投入,但其实它是一个非常常见的动作类游戏品类,光是依靠在这类产品中做到了极致,就获得了大量的红利。与此同时,我见过一个重庆的小游戏企业,5个员工投入不到100万人民币,做出来一个单机游戏的销售额是8亿人民币。

还有一个现象值得一提。AI初创企业目前做的都是工具,我们注意到从2023-2024年AI企业员工薪资最高的是算法工程师,但是我觉得这个局面会改变,慢慢会下降到平均水准,而产品人员和运营人员的薪资会迅速提高。

这是因为,赛道成长出来的巨头企业一定是在C端用产品模式不断创新。我们可以观察一下,在互联网和移动互联网时代的百度、阿里、腾讯、字节、美团和滴滴,这六家企业全部是面向终端用户,而且全是在模式创新上有进展。我们认为,所有的AI企业也一样,都是以做工具来切入,最后通过产品和商业模式的创新才能取得成功。

图片大模型所需要的数据是万亿量级,这个领域已经严重放缓。...数据量最少的是3D大模型,只有1300万的3D模型数据。...中国企业能够获取的算力资源比起美国少很多,但是中国AI企业擅长以软补硬和商业模式创新。

12月13日,2024 ADD数据应用场景大会在北京市通州区台湖镇隆重举办,数十位数据要素创业者、投资人,一起走进通州台湖,共话北京副中心产业发展新机遇,探寻数据要素创新的无限可能。

会上,昆仑万维董事长兼CEO方汉在题为“推动AI应用创新,构建企业核心竞争力”的演讲中,精彩观点如下:

1、大模型的训练进度已经严重放缓,可用的高质量数据不足是主要制约因素。

2、头部AI大模型的技术红利期呈现缩短的趋势,后期竞争主要看产品创新和商业模式。

3、AI技术的出现降低了内容出海门槛,中国企业将有能力推动文化平权。

以下为现场演讲/对话内容,经创业邦整理后发布:

昆仑万维在模型层

与应用层的布局

昆仑万维2008年成立,2015年在创业板上市,在2015年之后开始从网游公司转向海外互联网平台的转型,在海外收购了大量的互联网厂牌。2020年之后,我们又开始AI方面的应用和模型的研发,并在2022年大规模采购计算资源,同时也控股了北京的算力芯片企业艾捷科芯。

目前,我们已经完成了AI全产业链布局,模型层有5大自研模型,包括文本、多模态图文、3D、视频、音乐,同时在应用层有AI助手、AI游戏、AI社交、AI短剧和AI音乐等产品和服务。其中,音乐大模型是目前全世界音乐生成模型里面最好的产品之一。

截止到今天,昆仑的月活跃用户是4亿左右,海外收入占比接近90%,在100多个国家和地区拥有业务,20多个国家有我们的办公室和海外团队。

近期的进展是,我们推出了天工大模型4.0的o1版本,是中国第一款具有中文逻辑推理能力的o1模型,国内做推理方向探索的企业目前还没有特别多,我们是第一批之一。

另外一个重要产品,是我们的AI短剧平台,这是全球首个集成了视频模型与3D大模型的平台。现在市场上的视频生成大模型都浪费了大量的计算资源,让用户生成自己视频的过程中也花费了大量时间。而我们的Skyreels是先用3D大模型进行场景跟动作的演绎,再直接生成视频片段,生成速度和效率应该是AI短视频业内最高的。

大模型技术红利期大幅缩短

产品创新和商业模式竞争加剧

大家都注意到,大模型训练的进度放缓,这跟不同模型所需的数据规模有很大关系。

文本大模型需要的文本数据大概是1亿token量级,这块放缓的速度还没有那么慢。再往上看,业界最关注的视频生成模型,数据量在千亿左右,其中Youtube和抖音基本上都在百亿个视频左右,目前的训练量已经有不足的趋势。而图片大模型所需要的数据是万亿量级,这个领域已经严重放缓。说到我们做的音乐大模型,这个赛道数据量就更少了,人类诞生起至今生产的歌曲数量有4000万首,在音乐大模型领域的玩家很快就可以做到比较高的水平,同时对计算资源的需求也比较少。数据量最少的是3D大模型,只有1300万的3D模型数据。

所以,我们认为大模型的规模化预训练已经放缓,但是在o1这个推理模型出来之后,用慢思考的方法,让推理消耗的时间更长,思考更谨慎,也会大幅提高模型的能力。

我们还可以看到,GPT-3.5的技术领先将近1年左右,在早期任何一个大模型的技术红利时间都会比较长。随着参与的厂商越来越多,红利越来越短。Sora是OpenAI一年前发布的,但是根本没有吃到红利。到目前这个阶段,很难有一家企业通过技术水平在全球能长期领先。这时候,产品和商业模式的创新就更为重要。

中国企业能够获取的算力资源比起美国少很多,但是中国AI企业擅长以软补硬和商业模式创新。

举一个例子,Sora训练大概用了8000张GPU,型号应该是A100和H100。但是中国企业训练的时候,只花了不到1000张卡。我们通过算法上不断改进,让训练成本和推理成本大幅度降低,从而取得一定的竞争优势。

商业模式倒逼就是另外一个问题。美国的AI创业公司能获取的投资非常多,没有盈利上的压力,而中国同行在盈利上的压力非常大。这样也倒逼了中国AI企业在商业模式和产品模式上的创新非常有紧迫感。我们拥有世界最庞大的AI算法工程师团队,硬件不够,软件来凑,最近在软件优化方面取得了很多进展。

AI技术帮助中国企业做内容出海

推动文化平权

先解释一下什么是文化平权。

我们公司在非洲做的业务比较多,我在尼日利亚的时候,发现尼日利亚拍一部电影的成本大概是不到一百万人民币,这样拍出来的影片没有竞争力。很多小语种是没有自己的本土文化的,制作文化产品的成本和门槛高,这样导致尼日利亚本地人主要看的还是美国和印度大片。

我们计算过,当一个语言的使用人数在5000万人以下的时候,就没有能力生产文化产品。自己的诗歌、电影、小说漫画都会被西方强势文化所垄断。

但是在AI出现之后,这个情况我们认为会有极大的转变。AIGC这一波升级会带来创作内容成本和门槛的极大降低,导致全世界弱势文化和小语种文化都会用AI来创作自己的本土内容。

我们中国企业以及“一带一路”国家其实都是AI文化平权的极大受益者。但这些国家的问题在于他们自己的技术能力非常弱,市场具有非常大的蓝海,而中国企业有了强大的AIGC能力,也就有了出海耕耘的机会。

我们做AIGC的时候,用户不太关心内容是不是AI生成的,只关心内容是否新颖或者优质。大家都知道最近有一款网络游戏叫《黑神话》,非常成功,整体投入3-4亿人民币左右。这是一个非常高的投入,但其实它是一个非常常见的动作类游戏品类,光是依靠在这类产品中做到了极致,就获得了大量的红利。与此同时,我见过一个重庆的小游戏企业,5个员工投入不到100万人民币,做出来一个单机游戏的销售额是8亿人民币。

还有一个现象值得一提。AI初创企业目前做的都是工具,我们注意到从2023-2024年AI企业员工薪资最高的是算法工程师,但是我觉得这个局面会改变,慢慢会下降到平均水准,而产品人员和运营人员的薪资会迅速提高。

这是因为,赛道成长出来的巨头企业一定是在C端用产品模式不断创新。我们可以观察一下,在互联网和移动互联网时代的百度、阿里、腾讯、字节、美团和滴滴,这六家企业全部是面向终端用户,而且全是在模式创新上有进展。我们认为,所有的AI企业也一样,都是以做工具来切入,最后通过产品和商业模式的创新才能取得成功。

展开
打开“财经头条”阅读更多精彩资讯
APP内打开