DeepSeek爆火,但AI开源还是“强者游戏”

创业邦

1周前

天际资本创始人张倩:两年前我和开源中国董事长马越在世界开源峰会上就讨论过“AIX开源”,AI是先进生产力,开源是先进生产关系,两者结合带来百倍商业价值提升和爆发。...开源之后带来的挑战,反而会形成正反馈机制,成为团队前进的动力。

整理丨黎晓梅

编辑丨刘恒涛

上线2个月,DeepSeek已经打破了多项记录:上线仅25天,狂揽4000万次下载,超越了ChatGPT的首月下载量。在1月最后一周,DeepSeek新增了1亿用户,1月份的累计用户达1.25亿。

天际创始合伙人张倩认为,TikTok用9个月获取上亿用户,OpenAI用了两个月,DeepSeek不到20天。DeepSeek的爆火,开源功不可没。“尽管硅谷早就注意到DeepSeek,但真正让它成为世界级现象的还是开源。”

2025年2月9日,在FutureX天际资本成立7周年之际,创业邦视频直播了FutureX天际资本创始人张倩及联合创始人黄凯、硅谷开源专家一峰、开源中国董事长马越的精彩对话,四人围绕DeepSeek的开源模式、开源如何助力AI创新、AI带来的行业巨变等话题,进行了深入的线上讨论。本次直播对话也得到了深圳上市公司协会、CVC创新服务中心、香蜜湖加速器的大力支持。

在两个多小时的直播对话中,他们试图回答以下关键问题:

1.DeepSeek爆火的主要因素?DeepSeek为何会在此时出现?

2.中文/英文数据对大模型训练效果是否有影响?

3.持续关注前沿科技的投资人,是否错过了DeepSeek?

4.DeepSeek为AI开源生态树立了榜样,开源能否成为AI企业全球扩张的捷径?

5.如何挖掘下一个DeepSeek?谁将是下一代模型架构的赢家?

6.AI应用何时爆发?AI浪潮将会颠覆哪些行业?

7.当前的AI发展是否会改变ToB的生态与商业模式?

以下为对话节选内容,由创业邦整理发布:

DeepSeek为AI开源生态“打样”

天际资本创始人张倩:两年前我和开源中国董事长马越在世界开源峰会上就讨论过“AI X 开源”,AI是先进生产力,开源是先进生产关系,两者结合带来百倍商业价值提升和爆发。可以说,开源社区对全球AI的贡献才刚刚开始。

硅谷开源专家一峰:我们一开始关注国内的AI公司时,发现了一个很年轻、精英、不同寻常的团队,这就是DeepSeek团队。开源这件事总有人要去做,只是没想到出自一个这么年轻的团队。

开源对AI学术生态和工业生态来说都是好事。2024年诺贝尔经济学奖也表明,生产关系可以决定市场的发展速度和方向。在我看来,开源和AI是绝配,可以互相促进、共同发展。DeepSeek可以说为我们树立了很好的榜样。

天际资本联合创始人黄凯 :DeepSeek的成功首先是开源了参数达6000多亿V3大模型。V3规模大且表现出色,当时已经引起了硅谷大佬的注意。其次,DeepSeek一个月后开源了R1,这是经过强化学习的版本,推理能力能达到GPT-o1水平。

DeepSeek开源R1后,还发了论文详细记录了训练方法,相当于手把手教大家如何提升模型推理能力。此外,DeepSeek还帮助其他开源小模型提升推理能力,为开源界做出了更大贡献。这些举措打破了传统开源范式,以前开源只是提供源代码,现在DeepSeek不仅分享方法论,还提升其他模型的能力,这种做法在GitHub开源社区中也较为罕见。

天际资本创始人张倩 :开源社区这两年在 Hugging Face 的这个引领之下出现了很多创新,但是 DeepSeek这类来自于中国创新的力量还是非常罕见,何况它还带来了基础模型层面的创新。

一直以来,我们都认为中国的开源社区落后于美国,缺少优秀的开源项目。但 DeepSeek这次震撼了全世界,对中国的开源社区也有很大的引领效应。为什么DeepSeek会在这时出现?

开源中国董事长马越:可以说是天时地利人和。开源是一种普惠精神,我从业20多年,半辈子都在做开源,是开源最大的受益者。当年我作为程序员在美国写程序,条件很苦,但开源本质上是一种不怕吃亏的贵族精神,需要绝对的技术自信和利他主义。

那时在美国,我的师父说写代码争取别写注释,代码写得越让人看不懂,工作就越稳。这种模式本质是传统的小作坊,靠着一个秘方传到子孙后代。但我们开源人认为,代码能力强到让人频繁使用,用户不断进行反馈,我们就开心了。

这种自信和气吞山河的气势在 DeepSeek 身上体现得淋漓尽致。他们不怕别人抄,反而感谢别人抄,因为这会成为他们发展的动力。如今,开源已经成为大模型时代的核心竞争力,因为信息对称的时代,封闭无法形成商业护城河,开源才是必然选择。

开源之后带来的挑战,反而会形成正反馈机制,成为团队前进的动力。这种包容性和利他性,形成了年轻一代的优秀文化和组织关系。

有人说DeepSeek是国运级的,但我认为真正的国运是以DeepSeek团队为代表的年轻人,他们能颠覆时代。我们这代人有自己的时代使命,也有历史局限性。DeepSeek在如今特殊的国际政治经济背景下,为科技创新注入了一股清流,这是对人类向善的科技。

天际资本创始人张倩:现在有一种说法,大家都在追求最前沿,但似乎错过了DeepSeek。

我来回答一下,其实这里面有几层意思。首先,大家并没有真正错过DeepSeek。DeepSeek在2023年确实进行过融资,但梁文锋最终没有接受任何投资人的资金。所以DeepSeek并不是大家错过,大家甚至很早就关注过它,只是梁文锋选择了团队100%持股。

另外,DeepSeek在中文模型的效率上有很多说法,比如它融入了很多中文数据,所以它的推理能力可能比西方模型更强。一峰你认为呢?

硅谷开源专家一峰:OpenAI的o3模型的推理能力实际上比DeepSeek更强,但它并没有使用太多中文数据。数据这东西,只要有意义、用得足够多,无论是中文还是英文,模型的表现都会更强。当数据量达到整个互联网级别时,语言本身已经不那么重要了。只要数据有价值,对模型训练都有帮助,而不是说加入某种语言就会立刻出现魔法般的提升。

开源是AI企业全球扩张的捷径?

天际资本创始人张倩:两年前AI刚兴起时,开源和闭源引发很大争议。因为训练数据和模型成本很高,即使是OpenAI,最初创立时希望是非营利开源组织对抗谷歌,但后来也转为闭源了。

起初开源模型的能力比闭源的OpenAI差距很大,因为大家没拿出最强模型开源。大家用开源获客,但真正有商业价值的项目不会开源。

但DeepSeek打破了这些传统,他们不缺钱,有深厚积累,且有硅谷式的技术理想主义。DeepSeek迅速拉平了开源与闭源两个阵营间的技术差距。DeepSeek还分享了方法论,让各行业能基于它开发更高效的小模型,也加速了开源生态的繁荣。

“开源×AI”成为了一个重要的发展方向。那么,在地缘政治因素的限制下,开源是否能成为中国AI企业全球扩张的捷径?

硅谷开源专家一峰:开源从几个角度可以考虑。首先,从科技发展角度看,计算机科学之所以成为人类历史上最重要的学科之一,关键在于开源。开源让学科快速试错和校正方向,避免重复造轮子,人们就能专注于探索和增强生产力。

其次,从大企业角度看,Meta和谷歌是开源的代表。Meta之前的定位是个元宇宙公司,但发展AI后,扎克伯格面临几个问题,Meta偏离了原来的发展方向,投资人和人才都离开公司,股价也大跌。同时,在AI领域,Meta的地位也被OpenAI挑战。

扎克伯格最终决定开源Llama。恰好在此时,OpenAI放弃开源转向闭源,Meta及时扛起了开源的大旗。最终,Meta通过开源Llama扭转了公司形象,从元宇宙公司变成AI公司,股价大涨,对人才和投资的吸引力也不断增加。

Llama不直接卖模型挣钱,但开源撬动了其他收益。DeepSeek也一样,通过开源迅速出圈,品牌价值和估值大幅提升,尽管服务免费,但通过开源提升了品牌竞争力。

开源中国董事长马越:我想给大家简单科普一下,开源软件和开源模型有很大差异。真正的模型开源不仅要提供代码和参数,还要公开权重和预训练过程,否则开源人工智能没有意义。国际开源组织OSI已经推出了开源人工智能模型的标准,要求除了代码和参数外,还要提供权重和数据集。

国内AI六小龙曾试图做通用人工智能模型,但如今在开源模型强大的情况下,大家更倾向于做增量,站在巨人肩膀上。

开源有两个关键问题:一是你的产品不开源是否能卖得好?如果能,那就不必开源。二是你选择开源后,是否有人关注?我们平台上3000万个代码仓库中,除了鸿蒙等少数项目,其他鲜为人知。

开源是强者游戏,只有技术强大,开源才能加速出圈。如果技术不行,开源也无人问津。

天际资本联合创始人黄凯:开源商业模式可以看作是“AI×开源”,是一种“阳谋”。美国的商业模式是构建阳谋,通过开源建立难以超越的生态,如Windows和英伟达。

中国软件企业因为在海外没有信任基础、地缘政治限制等因素,出海很困难。现在,中国软件公司结合AI和开源,可以解决安全信任问题。开源后,全球用户更愿意使用,公司也可以从其他地方盈利,如IBM和Linux、谷歌和安卓的盈利模式。

AI与开源结合为中国软件公司提供了新思路,通过这套打法有可能建立全球生态。过去,中国软件公司不知道如何建立生态,因为生态一直由美国引领,从X86 生态、 Windows 生态、 Linux 生态到安卓生态。但在AI时代,越来越多的软件公司在做生态,对中国软件行业来说是个很大的契机。

如何挖掘下一个DeepSeek?

天际资本创始人张倩 :问一个千亿美金的问题:随着开源越来越火,我们该如何挖掘下一个DeepSeek?你觉得下一代架构中,哪些有潜力的项目能够引领AI的下一波浪潮?

硅谷开源专家一峰:我觉得这个问题的价值可能是万亿美金。开源是一个强者游戏,是赢家通吃的领域。在开源的世界里,只有站在王座上的那一位才能真正生存下来,其他都只是陪衬。

比如,当Llama 3.1出来后,其他模型就很少有人用了;当Qwen2.5出现后,Llama也逐渐被取代;DeepSeek出现后,基本没人再用其他东西了。开源领域就是这么残酷,真正能在开源界取得大成就的公司其实并不多,比如Meta、DeepSeek、Mistral、Stability等,这些公司都算是赢家。

这些成功的团队有一个共同特点:他们的项目一开源就立刻引起巨大轰动,比上一代强很多,无论是在技术上还是数据上,都有革命性突破。这些公司的创始人,从扎克伯格到DeepSeek的创始人,他们都是技术极客,而且他们的团队都能做出爆炸性的成果。

那么下一个DeepSeek应该从哪里找?目前Transformer架构的潜力已经差不多被挖掘殆尽了,很难再有大的突破。下一个开源的巨大爆点,很可能是一个非Transformer的模型,效果远远超过Transformer。从硅谷的角度来看,目前Transformer架构领域的竞争非常激烈,微软的Retention、谷歌的Titans等都是强有力的竞争对手。但我个人认为,最终的胜利者可能是RWKV模型。如果RWKV能做到以DeepSeek 1/10000的成本,实现比DeepSeek强10倍的效果,那它将是一个全新的爆点,像DeepSeek一样瞬间爆发。

所以,下一波机会需要你在开源界站稳脚跟,你的项目必须比上一代的所有东西都强很多,全方位的强,无论是在能耗还是性能上。而且要在开源社区里瞬间引发爆炸性的关注,才能真正站稳脚跟。另一种可能性是,如果你的模型能耗和别人差不多,但能整合所有模态,并且在所有模态中与目前最强的模型持平,那也有可能成为一个成功的项目。不过目前还没有人做到这一点,很难预测。

总之,寻找下一个DeepSeek是所有投资人的梦想,我觉得应该从做新架构的公司中去寻找。

天际资本创始人张倩:AI技术架构的迭代速度一直很快,过去平均每三年就会有一次大的技术更新。这次Transformer模型从2017年到现在已经发展了八年,最近在硅谷,大家都在频繁讨论下一代架构。一些注重研发的团队已经开始测试和使用下一代架构,包括世界模型等。我觉得下一代架构肯定会带来更大的变革,类似于DeepSeek这样的百倍跃迁。现在从Hugging Face的角度来看,RWKV和Mamba等已经形成了自己的小生态,看起来非常有潜力引领下一代架构的发展。

关于下一代架构带来的效率提升,我认为这可能意味着AI行业才刚刚开始,就像打开了潘多拉的盒子。底层基础设施的效率提升会很快,应用层面的爆发也会加速。

AI将颠覆哪些行业?

天际资本创始人张倩:这两年大家都在讨论为什么AI没有爆款,但其实像OpenAI的ChatGPT和DeepSeek等已经是爆款了。大家说没有爆款,可能更多是指应用层面。大家期待的是下一代的短视频、谷歌、字节这样的爆款应用。

从我的角度来看,现在AI行业可能已经来到了类似十年前移动互联网时代苹果应用商店那样的时刻,应用会快速爆发,出现很多爆款。现在的问题是:第一,时机是否已经成熟?第二,哪些赛道的AI应用会先爆发,哪些会后爆发?第三,什么样的团队能在这一波应用爆发中更快地脱颖而出并受益?

硅谷开源专家一峰:首先,互联网技术有着悠久的历史,从传统互联网到移动互联网已经发展了一段时间。互联网是上一波大爆发的前提,底层基础设施需要发展到能够在终端设备上传输大量数据的水平。其次,以iPhone 4为例,只有当设备性能达到一定水平时,才能承载像美团、今日头条这样的应用。应用的爆发是底层基础设施全面成熟后的厚积薄发,模型只是其中重要的一环,但并非绝对性因素。

要让模型驱动的应用爆发,首先需要模型在有限算力的终端上轻松运行,这是大前提。其次,目前还不确定下一代AI应用将在哪个终端运行。上一代移动互联网应用主要在手机上运行,但下一代AI应用的运行终端尚未确定。比如,Meta可能押注在眼镜上,谷歌可能还是押注手机,而苹果的计划还不明确,因为他们刚刚裁掉了AR团队的很多人。目前整个底层基础设施仍处于不确定状态。

因此,我认为AI应用的爆发可能还需要至少8到12个月的时间,不会是一个很快的过程。

什么样的应用会最先爆发?肯定是那些找到了最好产品市场契合的应用。我们需要关注两个方面:第一是产品市场契合,第二是技术与产品的适配性。很多所谓的AI应用其实可以用传统软件工程解决,有些人强行用AI,结果头破血流。所以,关键是要找到真正需要AI技术的应用场景。

从技术革命的角度来看,一个技术的商业价值取决于它能颠覆什么。互联网颠覆了数据传输,所以一切与数据传输相关的行业都被互联网颠覆了。现在,大模型能颠覆什么?从意识层面来说,它可以颠覆创作,比如绘画等。整个内容产业链正在被AI颠覆和重塑。

我们预计,好莱坞的电影制作模式在未来五年内可能会被彻底颠覆。未来拍电影可能不再需要几百人、几亿美金和几年时间,而是通过GPT生成剧本,再用多模态模型生成电影,一个人在地下室捣鼓一下午就能完成。电影行业是可能会被颠覆,但短视频行业肯定会被颠覆,而且现在已经有这种势头了。

大语言模型还能颠覆交流、推理和决策。几乎所有以交流、推理和决策为主要价值的行业,都会被AI至少重做一遍。比如教育、心理咨询、新闻写作等行业可能会被彻底颠覆。会计行业虽然部分会被颠覆,但有些工作还是需要人类完成。

这些行业背后都有巨大的市场,比如美国的心理咨询市场可能有几千亿规模,国内的财会市场也是千亿级别。如果AI技术能够真正落地,这些行业都会被彻底颠覆。每一个行业都有可能成为下一个爆款应用的领域。

我们看好什么样的团队呢?

首先,数据是真正的壁垒。比如我们都有最先进的大模型,但如果我有大量高质量的财会数据,我就能训练出一个强大的财会模型,而你没有这些数据就很难做到。有开源中国和Hugging Face这样的公司存在,模型本身不会是壁垒,真正的壁垒是你们自己拥有的数据。所以,如果你打算做应用,关注模型和专注数据是非常重要的。

其次,以产品为导向的公司比以技术为导向的公司更容易成功。在Hugging Face平台上,即使没有很优秀的技术,也可以通过无代码完成很多事情。但你需要真正理解你的用户、市场和产品。像字节、小红书这样以产品经理为导向的团队,比技术导向的团队更容易在应用级别竞争中存活下来。

第三,你必须和投资人保持良好的关系。在中国,一旦发现某个方向有机会,大家都会一拥而上,不管有没有数据。最后竞争会变得非常激烈,谁兜里的钱多,谁就能卷死别人。

所以,团队需要具备三点:第一,拥有不可替代的数据;第二,拥有优秀的产品经理,他们对市场、用户和产品有深刻的理解;第三,和投资人关系好,能够拿到足够的资金。同时满足这三个条件的团队,在下一个大应用时代会非常吃香。当然,他们也需要对现金流有深刻的理解,否则再多的钱也不够用。

天际资本创始人张倩:为什么心理咨询会被颠覆?每个案例都不一样,复杂性很高,个性化和解决方案也没有标准答案。

硅谷开源专家一峰:心理咨询会被颠覆,其实很容易理解。首先,心理咨询本质上是一种交流,而大模型是目前人类最强大的交流工具,因此大模型颠覆心理咨询只是时间问题。

其次,大模型对人的感知能力比普通人强得多。大模型依靠的是prompt(提示词)和probability channel(概率通道),它能将你说话的语气、语调等信息编码进去。比如,如果你说“我今天失恋了,很难受”,大模型会捕捉到你话语中的所有信息,甚至包括你的表情。人类很难同时关注这么多细节,但机器可以,它可以通过摄像头捕捉你的肢体语言和表情,结合语音信息,综合判断你的情绪状态,然后生成相应的开导建议。即使是经验丰富的心理咨询师也做不到这一点。

此外,还有一个重要问题是利益冲突。心理咨询师通常按次收费,比如在旧金山,一次收费可能高达500美元。他们的利益最大化方式不是真正解决你的问题,而是让你频繁去找他们。

开源中国董事长马越:我觉得现在是一个AI的大航海时代,波澜壮阔。一峰认为未来8到12个月就会有大的突破,但我认为可能需要更长时间。就像互联网时代才刚刚开始,距离应用爆发还早得很。不过,我们已经看到了模型的能力以及快速地迭代,虽然不知道具体会发展到什么程度,但这是一个充满机遇的时代。

AI的发展是一条颠覆式的道路,过去的认知和几千年的知识储备可能都会被重新洗牌。现在最大的瓶颈是数据,尤其是行业数据。我们服务了中国很多企业,发现中国企业最大的问题是数据没有准备好。我们需要帮助他们整理历史上大量的异构数据,并导入到数据库中。这是一项很“脏”的工作,但没有这些数据,企业就无法真正拥抱AI。

从投资角度来看,数据服务是非常重要的。AI的爆发本质上还是需要解决数据问题。具身机器人未来可能只是模型的一个端,一个更强大的端,本质上还是一个终端设备。模型服务的本质是带智慧的云计算服务,它会成为一种基础设施,就像用电、用水一样,按需使用。

最终,团队需要明确自己的方向,是要做To B的生意还是To C的生意,是面向全球市场还是国内市场。如果这些方向不明确,就很难真正满足市场需求。团队需要对两件事保持敬畏:一是对钱的敬畏,投资人不是来烧钱的,烧钱是为了挣更多的钱,要对市场和竞争保持敬畏;二是对年轻人的敬畏,年轻人的想象力和创新力是我们需要敬畏的,他们不受传统认知的束缚,能够带来新的突破。

天际资本创始人张倩 :马越曾提到,这一波AI本质上可以提供低成本的定制化服务。过去中国很难出现SaaS模式,因为需要大量的个性化工程化服务。那么,这一波AI是否能在这一方面带来提升,改善中国ToB商业生态和商业模式呢?

开源中国董事长马越:我暂时不乐观,因为掏钱的这些人,对技术的价值认知还比较陈旧。目前,这些决策者的认知水平是市场化的一大阻力。我们还是要等年轻决策者成长起来,需要他们真正敬畏市场、敬畏知识、尊重工具和知识产权。

天际资本创始人张倩 :这确实需要时间。DeepSeek本质上并不是在中国率先出圈的。在中国,决策者对DeepSeek技术先进性的认知可能相对落后。即使技术团队和CTO认可DeepSeek,但到CEO层面,这种认知可能更滞后。因此,DeepSeek是在硅谷率先崭露头角,并在全球ToC市场迅速流行起来。现在,中国各个ToB领域都在关注它。

这说明硅谷仍在引领科技创新的应用,即应用式科技。结合你之前说的,对于中国一线的AI创业者来说,首选可能是全球市场,甚至是美国主战场。如果在硅谷取得成功,可能会更容易。

开源中国董事长马越:是的,国内和国外的商业模式肯定不同。ToC和ToB的市场逻辑也完全不一样。虽然C端的DeepSeek能够出圈,但别忘了Hugging Face和Gitee都是ToB公司。Hugging Face本质上是ToB赛道的SaaS公司,Gitee虽然有互联网属性,但主要靠国产替代赚大B的钱,商业模式有区别,毕竟是ToB,且在国内。但如果年轻人能在C端发现自己的专长,并借助AI能力,潜力是无限的。

天际资本创始人张倩:两年前我和开源中国董事长马越在世界开源峰会上就讨论过“AIX开源”,AI是先进生产力,开源是先进生产关系,两者结合带来百倍商业价值提升和爆发。...开源之后带来的挑战,反而会形成正反馈机制,成为团队前进的动力。

整理丨黎晓梅

编辑丨刘恒涛

上线2个月,DeepSeek已经打破了多项记录:上线仅25天,狂揽4000万次下载,超越了ChatGPT的首月下载量。在1月最后一周,DeepSeek新增了1亿用户,1月份的累计用户达1.25亿。

天际创始合伙人张倩认为,TikTok用9个月获取上亿用户,OpenAI用了两个月,DeepSeek不到20天。DeepSeek的爆火,开源功不可没。“尽管硅谷早就注意到DeepSeek,但真正让它成为世界级现象的还是开源。”

2025年2月9日,在FutureX天际资本成立7周年之际,创业邦视频直播了FutureX天际资本创始人张倩及联合创始人黄凯、硅谷开源专家一峰、开源中国董事长马越的精彩对话,四人围绕DeepSeek的开源模式、开源如何助力AI创新、AI带来的行业巨变等话题,进行了深入的线上讨论。本次直播对话也得到了深圳上市公司协会、CVC创新服务中心、香蜜湖加速器的大力支持。

在两个多小时的直播对话中,他们试图回答以下关键问题:

1.DeepSeek爆火的主要因素?DeepSeek为何会在此时出现?

2.中文/英文数据对大模型训练效果是否有影响?

3.持续关注前沿科技的投资人,是否错过了DeepSeek?

4.DeepSeek为AI开源生态树立了榜样,开源能否成为AI企业全球扩张的捷径?

5.如何挖掘下一个DeepSeek?谁将是下一代模型架构的赢家?

6.AI应用何时爆发?AI浪潮将会颠覆哪些行业?

7.当前的AI发展是否会改变ToB的生态与商业模式?

以下为对话节选内容,由创业邦整理发布:

DeepSeek为AI开源生态“打样”

天际资本创始人张倩:两年前我和开源中国董事长马越在世界开源峰会上就讨论过“AI X 开源”,AI是先进生产力,开源是先进生产关系,两者结合带来百倍商业价值提升和爆发。可以说,开源社区对全球AI的贡献才刚刚开始。

硅谷开源专家一峰:我们一开始关注国内的AI公司时,发现了一个很年轻、精英、不同寻常的团队,这就是DeepSeek团队。开源这件事总有人要去做,只是没想到出自一个这么年轻的团队。

开源对AI学术生态和工业生态来说都是好事。2024年诺贝尔经济学奖也表明,生产关系可以决定市场的发展速度和方向。在我看来,开源和AI是绝配,可以互相促进、共同发展。DeepSeek可以说为我们树立了很好的榜样。

天际资本联合创始人黄凯 :DeepSeek的成功首先是开源了参数达6000多亿V3大模型。V3规模大且表现出色,当时已经引起了硅谷大佬的注意。其次,DeepSeek一个月后开源了R1,这是经过强化学习的版本,推理能力能达到GPT-o1水平。

DeepSeek开源R1后,还发了论文详细记录了训练方法,相当于手把手教大家如何提升模型推理能力。此外,DeepSeek还帮助其他开源小模型提升推理能力,为开源界做出了更大贡献。这些举措打破了传统开源范式,以前开源只是提供源代码,现在DeepSeek不仅分享方法论,还提升其他模型的能力,这种做法在GitHub开源社区中也较为罕见。

天际资本创始人张倩 :开源社区这两年在 Hugging Face 的这个引领之下出现了很多创新,但是 DeepSeek这类来自于中国创新的力量还是非常罕见,何况它还带来了基础模型层面的创新。

一直以来,我们都认为中国的开源社区落后于美国,缺少优秀的开源项目。但 DeepSeek这次震撼了全世界,对中国的开源社区也有很大的引领效应。为什么DeepSeek会在这时出现?

开源中国董事长马越:可以说是天时地利人和。开源是一种普惠精神,我从业20多年,半辈子都在做开源,是开源最大的受益者。当年我作为程序员在美国写程序,条件很苦,但开源本质上是一种不怕吃亏的贵族精神,需要绝对的技术自信和利他主义。

那时在美国,我的师父说写代码争取别写注释,代码写得越让人看不懂,工作就越稳。这种模式本质是传统的小作坊,靠着一个秘方传到子孙后代。但我们开源人认为,代码能力强到让人频繁使用,用户不断进行反馈,我们就开心了。

这种自信和气吞山河的气势在 DeepSeek 身上体现得淋漓尽致。他们不怕别人抄,反而感谢别人抄,因为这会成为他们发展的动力。如今,开源已经成为大模型时代的核心竞争力,因为信息对称的时代,封闭无法形成商业护城河,开源才是必然选择。

开源之后带来的挑战,反而会形成正反馈机制,成为团队前进的动力。这种包容性和利他性,形成了年轻一代的优秀文化和组织关系。

有人说DeepSeek是国运级的,但我认为真正的国运是以DeepSeek团队为代表的年轻人,他们能颠覆时代。我们这代人有自己的时代使命,也有历史局限性。DeepSeek在如今特殊的国际政治经济背景下,为科技创新注入了一股清流,这是对人类向善的科技。

天际资本创始人张倩:现在有一种说法,大家都在追求最前沿,但似乎错过了DeepSeek。

我来回答一下,其实这里面有几层意思。首先,大家并没有真正错过DeepSeek。DeepSeek在2023年确实进行过融资,但梁文锋最终没有接受任何投资人的资金。所以DeepSeek并不是大家错过,大家甚至很早就关注过它,只是梁文锋选择了团队100%持股。

另外,DeepSeek在中文模型的效率上有很多说法,比如它融入了很多中文数据,所以它的推理能力可能比西方模型更强。一峰你认为呢?

硅谷开源专家一峰:OpenAI的o3模型的推理能力实际上比DeepSeek更强,但它并没有使用太多中文数据。数据这东西,只要有意义、用得足够多,无论是中文还是英文,模型的表现都会更强。当数据量达到整个互联网级别时,语言本身已经不那么重要了。只要数据有价值,对模型训练都有帮助,而不是说加入某种语言就会立刻出现魔法般的提升。

开源是AI企业全球扩张的捷径?

天际资本创始人张倩:两年前AI刚兴起时,开源和闭源引发很大争议。因为训练数据和模型成本很高,即使是OpenAI,最初创立时希望是非营利开源组织对抗谷歌,但后来也转为闭源了。

起初开源模型的能力比闭源的OpenAI差距很大,因为大家没拿出最强模型开源。大家用开源获客,但真正有商业价值的项目不会开源。

但DeepSeek打破了这些传统,他们不缺钱,有深厚积累,且有硅谷式的技术理想主义。DeepSeek迅速拉平了开源与闭源两个阵营间的技术差距。DeepSeek还分享了方法论,让各行业能基于它开发更高效的小模型,也加速了开源生态的繁荣。

“开源×AI”成为了一个重要的发展方向。那么,在地缘政治因素的限制下,开源是否能成为中国AI企业全球扩张的捷径?

硅谷开源专家一峰:开源从几个角度可以考虑。首先,从科技发展角度看,计算机科学之所以成为人类历史上最重要的学科之一,关键在于开源。开源让学科快速试错和校正方向,避免重复造轮子,人们就能专注于探索和增强生产力。

其次,从大企业角度看,Meta和谷歌是开源的代表。Meta之前的定位是个元宇宙公司,但发展AI后,扎克伯格面临几个问题,Meta偏离了原来的发展方向,投资人和人才都离开公司,股价也大跌。同时,在AI领域,Meta的地位也被OpenAI挑战。

扎克伯格最终决定开源Llama。恰好在此时,OpenAI放弃开源转向闭源,Meta及时扛起了开源的大旗。最终,Meta通过开源Llama扭转了公司形象,从元宇宙公司变成AI公司,股价大涨,对人才和投资的吸引力也不断增加。

Llama不直接卖模型挣钱,但开源撬动了其他收益。DeepSeek也一样,通过开源迅速出圈,品牌价值和估值大幅提升,尽管服务免费,但通过开源提升了品牌竞争力。

开源中国董事长马越:我想给大家简单科普一下,开源软件和开源模型有很大差异。真正的模型开源不仅要提供代码和参数,还要公开权重和预训练过程,否则开源人工智能没有意义。国际开源组织OSI已经推出了开源人工智能模型的标准,要求除了代码和参数外,还要提供权重和数据集。

国内AI六小龙曾试图做通用人工智能模型,但如今在开源模型强大的情况下,大家更倾向于做增量,站在巨人肩膀上。

开源有两个关键问题:一是你的产品不开源是否能卖得好?如果能,那就不必开源。二是你选择开源后,是否有人关注?我们平台上3000万个代码仓库中,除了鸿蒙等少数项目,其他鲜为人知。

开源是强者游戏,只有技术强大,开源才能加速出圈。如果技术不行,开源也无人问津。

天际资本联合创始人黄凯:开源商业模式可以看作是“AI×开源”,是一种“阳谋”。美国的商业模式是构建阳谋,通过开源建立难以超越的生态,如Windows和英伟达。

中国软件企业因为在海外没有信任基础、地缘政治限制等因素,出海很困难。现在,中国软件公司结合AI和开源,可以解决安全信任问题。开源后,全球用户更愿意使用,公司也可以从其他地方盈利,如IBM和Linux、谷歌和安卓的盈利模式。

AI与开源结合为中国软件公司提供了新思路,通过这套打法有可能建立全球生态。过去,中国软件公司不知道如何建立生态,因为生态一直由美国引领,从X86 生态、 Windows 生态、 Linux 生态到安卓生态。但在AI时代,越来越多的软件公司在做生态,对中国软件行业来说是个很大的契机。

如何挖掘下一个DeepSeek?

天际资本创始人张倩 :问一个千亿美金的问题:随着开源越来越火,我们该如何挖掘下一个DeepSeek?你觉得下一代架构中,哪些有潜力的项目能够引领AI的下一波浪潮?

硅谷开源专家一峰:我觉得这个问题的价值可能是万亿美金。开源是一个强者游戏,是赢家通吃的领域。在开源的世界里,只有站在王座上的那一位才能真正生存下来,其他都只是陪衬。

比如,当Llama 3.1出来后,其他模型就很少有人用了;当Qwen2.5出现后,Llama也逐渐被取代;DeepSeek出现后,基本没人再用其他东西了。开源领域就是这么残酷,真正能在开源界取得大成就的公司其实并不多,比如Meta、DeepSeek、Mistral、Stability等,这些公司都算是赢家。

这些成功的团队有一个共同特点:他们的项目一开源就立刻引起巨大轰动,比上一代强很多,无论是在技术上还是数据上,都有革命性突破。这些公司的创始人,从扎克伯格到DeepSeek的创始人,他们都是技术极客,而且他们的团队都能做出爆炸性的成果。

那么下一个DeepSeek应该从哪里找?目前Transformer架构的潜力已经差不多被挖掘殆尽了,很难再有大的突破。下一个开源的巨大爆点,很可能是一个非Transformer的模型,效果远远超过Transformer。从硅谷的角度来看,目前Transformer架构领域的竞争非常激烈,微软的Retention、谷歌的Titans等都是强有力的竞争对手。但我个人认为,最终的胜利者可能是RWKV模型。如果RWKV能做到以DeepSeek 1/10000的成本,实现比DeepSeek强10倍的效果,那它将是一个全新的爆点,像DeepSeek一样瞬间爆发。

所以,下一波机会需要你在开源界站稳脚跟,你的项目必须比上一代的所有东西都强很多,全方位的强,无论是在能耗还是性能上。而且要在开源社区里瞬间引发爆炸性的关注,才能真正站稳脚跟。另一种可能性是,如果你的模型能耗和别人差不多,但能整合所有模态,并且在所有模态中与目前最强的模型持平,那也有可能成为一个成功的项目。不过目前还没有人做到这一点,很难预测。

总之,寻找下一个DeepSeek是所有投资人的梦想,我觉得应该从做新架构的公司中去寻找。

天际资本创始人张倩:AI技术架构的迭代速度一直很快,过去平均每三年就会有一次大的技术更新。这次Transformer模型从2017年到现在已经发展了八年,最近在硅谷,大家都在频繁讨论下一代架构。一些注重研发的团队已经开始测试和使用下一代架构,包括世界模型等。我觉得下一代架构肯定会带来更大的变革,类似于DeepSeek这样的百倍跃迁。现在从Hugging Face的角度来看,RWKV和Mamba等已经形成了自己的小生态,看起来非常有潜力引领下一代架构的发展。

关于下一代架构带来的效率提升,我认为这可能意味着AI行业才刚刚开始,就像打开了潘多拉的盒子。底层基础设施的效率提升会很快,应用层面的爆发也会加速。

AI将颠覆哪些行业?

天际资本创始人张倩:这两年大家都在讨论为什么AI没有爆款,但其实像OpenAI的ChatGPT和DeepSeek等已经是爆款了。大家说没有爆款,可能更多是指应用层面。大家期待的是下一代的短视频、谷歌、字节这样的爆款应用。

从我的角度来看,现在AI行业可能已经来到了类似十年前移动互联网时代苹果应用商店那样的时刻,应用会快速爆发,出现很多爆款。现在的问题是:第一,时机是否已经成熟?第二,哪些赛道的AI应用会先爆发,哪些会后爆发?第三,什么样的团队能在这一波应用爆发中更快地脱颖而出并受益?

硅谷开源专家一峰:首先,互联网技术有着悠久的历史,从传统互联网到移动互联网已经发展了一段时间。互联网是上一波大爆发的前提,底层基础设施需要发展到能够在终端设备上传输大量数据的水平。其次,以iPhone 4为例,只有当设备性能达到一定水平时,才能承载像美团、今日头条这样的应用。应用的爆发是底层基础设施全面成熟后的厚积薄发,模型只是其中重要的一环,但并非绝对性因素。

要让模型驱动的应用爆发,首先需要模型在有限算力的终端上轻松运行,这是大前提。其次,目前还不确定下一代AI应用将在哪个终端运行。上一代移动互联网应用主要在手机上运行,但下一代AI应用的运行终端尚未确定。比如,Meta可能押注在眼镜上,谷歌可能还是押注手机,而苹果的计划还不明确,因为他们刚刚裁掉了AR团队的很多人。目前整个底层基础设施仍处于不确定状态。

因此,我认为AI应用的爆发可能还需要至少8到12个月的时间,不会是一个很快的过程。

什么样的应用会最先爆发?肯定是那些找到了最好产品市场契合的应用。我们需要关注两个方面:第一是产品市场契合,第二是技术与产品的适配性。很多所谓的AI应用其实可以用传统软件工程解决,有些人强行用AI,结果头破血流。所以,关键是要找到真正需要AI技术的应用场景。

从技术革命的角度来看,一个技术的商业价值取决于它能颠覆什么。互联网颠覆了数据传输,所以一切与数据传输相关的行业都被互联网颠覆了。现在,大模型能颠覆什么?从意识层面来说,它可以颠覆创作,比如绘画等。整个内容产业链正在被AI颠覆和重塑。

我们预计,好莱坞的电影制作模式在未来五年内可能会被彻底颠覆。未来拍电影可能不再需要几百人、几亿美金和几年时间,而是通过GPT生成剧本,再用多模态模型生成电影,一个人在地下室捣鼓一下午就能完成。电影行业是可能会被颠覆,但短视频行业肯定会被颠覆,而且现在已经有这种势头了。

大语言模型还能颠覆交流、推理和决策。几乎所有以交流、推理和决策为主要价值的行业,都会被AI至少重做一遍。比如教育、心理咨询、新闻写作等行业可能会被彻底颠覆。会计行业虽然部分会被颠覆,但有些工作还是需要人类完成。

这些行业背后都有巨大的市场,比如美国的心理咨询市场可能有几千亿规模,国内的财会市场也是千亿级别。如果AI技术能够真正落地,这些行业都会被彻底颠覆。每一个行业都有可能成为下一个爆款应用的领域。

我们看好什么样的团队呢?

首先,数据是真正的壁垒。比如我们都有最先进的大模型,但如果我有大量高质量的财会数据,我就能训练出一个强大的财会模型,而你没有这些数据就很难做到。有开源中国和Hugging Face这样的公司存在,模型本身不会是壁垒,真正的壁垒是你们自己拥有的数据。所以,如果你打算做应用,关注模型和专注数据是非常重要的。

其次,以产品为导向的公司比以技术为导向的公司更容易成功。在Hugging Face平台上,即使没有很优秀的技术,也可以通过无代码完成很多事情。但你需要真正理解你的用户、市场和产品。像字节、小红书这样以产品经理为导向的团队,比技术导向的团队更容易在应用级别竞争中存活下来。

第三,你必须和投资人保持良好的关系。在中国,一旦发现某个方向有机会,大家都会一拥而上,不管有没有数据。最后竞争会变得非常激烈,谁兜里的钱多,谁就能卷死别人。

所以,团队需要具备三点:第一,拥有不可替代的数据;第二,拥有优秀的产品经理,他们对市场、用户和产品有深刻的理解;第三,和投资人关系好,能够拿到足够的资金。同时满足这三个条件的团队,在下一个大应用时代会非常吃香。当然,他们也需要对现金流有深刻的理解,否则再多的钱也不够用。

天际资本创始人张倩:为什么心理咨询会被颠覆?每个案例都不一样,复杂性很高,个性化和解决方案也没有标准答案。

硅谷开源专家一峰:心理咨询会被颠覆,其实很容易理解。首先,心理咨询本质上是一种交流,而大模型是目前人类最强大的交流工具,因此大模型颠覆心理咨询只是时间问题。

其次,大模型对人的感知能力比普通人强得多。大模型依靠的是prompt(提示词)和probability channel(概率通道),它能将你说话的语气、语调等信息编码进去。比如,如果你说“我今天失恋了,很难受”,大模型会捕捉到你话语中的所有信息,甚至包括你的表情。人类很难同时关注这么多细节,但机器可以,它可以通过摄像头捕捉你的肢体语言和表情,结合语音信息,综合判断你的情绪状态,然后生成相应的开导建议。即使是经验丰富的心理咨询师也做不到这一点。

此外,还有一个重要问题是利益冲突。心理咨询师通常按次收费,比如在旧金山,一次收费可能高达500美元。他们的利益最大化方式不是真正解决你的问题,而是让你频繁去找他们。

开源中国董事长马越:我觉得现在是一个AI的大航海时代,波澜壮阔。一峰认为未来8到12个月就会有大的突破,但我认为可能需要更长时间。就像互联网时代才刚刚开始,距离应用爆发还早得很。不过,我们已经看到了模型的能力以及快速地迭代,虽然不知道具体会发展到什么程度,但这是一个充满机遇的时代。

AI的发展是一条颠覆式的道路,过去的认知和几千年的知识储备可能都会被重新洗牌。现在最大的瓶颈是数据,尤其是行业数据。我们服务了中国很多企业,发现中国企业最大的问题是数据没有准备好。我们需要帮助他们整理历史上大量的异构数据,并导入到数据库中。这是一项很“脏”的工作,但没有这些数据,企业就无法真正拥抱AI。

从投资角度来看,数据服务是非常重要的。AI的爆发本质上还是需要解决数据问题。具身机器人未来可能只是模型的一个端,一个更强大的端,本质上还是一个终端设备。模型服务的本质是带智慧的云计算服务,它会成为一种基础设施,就像用电、用水一样,按需使用。

最终,团队需要明确自己的方向,是要做To B的生意还是To C的生意,是面向全球市场还是国内市场。如果这些方向不明确,就很难真正满足市场需求。团队需要对两件事保持敬畏:一是对钱的敬畏,投资人不是来烧钱的,烧钱是为了挣更多的钱,要对市场和竞争保持敬畏;二是对年轻人的敬畏,年轻人的想象力和创新力是我们需要敬畏的,他们不受传统认知的束缚,能够带来新的突破。

天际资本创始人张倩 :马越曾提到,这一波AI本质上可以提供低成本的定制化服务。过去中国很难出现SaaS模式,因为需要大量的个性化工程化服务。那么,这一波AI是否能在这一方面带来提升,改善中国ToB商业生态和商业模式呢?

开源中国董事长马越:我暂时不乐观,因为掏钱的这些人,对技术的价值认知还比较陈旧。目前,这些决策者的认知水平是市场化的一大阻力。我们还是要等年轻决策者成长起来,需要他们真正敬畏市场、敬畏知识、尊重工具和知识产权。

天际资本创始人张倩 :这确实需要时间。DeepSeek本质上并不是在中国率先出圈的。在中国,决策者对DeepSeek技术先进性的认知可能相对落后。即使技术团队和CTO认可DeepSeek,但到CEO层面,这种认知可能更滞后。因此,DeepSeek是在硅谷率先崭露头角,并在全球ToC市场迅速流行起来。现在,中国各个ToB领域都在关注它。

这说明硅谷仍在引领科技创新的应用,即应用式科技。结合你之前说的,对于中国一线的AI创业者来说,首选可能是全球市场,甚至是美国主战场。如果在硅谷取得成功,可能会更容易。

开源中国董事长马越:是的,国内和国外的商业模式肯定不同。ToC和ToB的市场逻辑也完全不一样。虽然C端的DeepSeek能够出圈,但别忘了Hugging Face和Gitee都是ToB公司。Hugging Face本质上是ToB赛道的SaaS公司,Gitee虽然有互联网属性,但主要靠国产替代赚大B的钱,商业模式有区别,毕竟是ToB,且在国内。但如果年轻人能在C端发现自己的专长,并借助AI能力,潜力是无限的。

展开
打开“财经头条”阅读更多精彩资讯
APP内打开