DeepSeek的热,还在持续ing。
就在刚刚过去的周末,DeepSeek反超ChatGPT,一举登顶美区苹果应用商店免费App排行第一!
其热度之高,有网友甚至这样描述:
至于原因,正是DeepSeek在前几天开源的推理模型R1,引发了一阵又一阵的舆论热潮。
仅仅花费560万美元训练的R1,在很多AI基准测试中已经达到甚至超越OpenAI o1模型。
而且DeepSeek是真的免费,而ChatGPT虽然在免费榜上,但要是想解锁它的完全体,还是要掏上200美元……
现在要是在X上搜“DeepSeek”,目之所及,处处都是“使用DeepSeek构建一切”、“Goodbye ChatGPT”这样的话题:
并且不止是科技圈的人在关注,例如风险投资家Marc Andreessen就高度称赞道:
就连回应“DeepSeek将如何盈利”这个问题中的一句话——“DeepSeek是一个小项目”,也是被网友们转疯了……
嗯,火,着实是有点火
。
作为本身就是开源模型的DeepSeek R1,就在昨天还引发了一股复现热潮。
这个项目就是由HuggingFace在GitHub上发起的Open R1。
项目仅仅发布2天,已经斩获4.2K个Star。
联合创始人兼CEO Clem Delangue表示:
而在Open R1的项目文档中,官方进一步表示:
HuggingFace表示,将以DeepSeek-R1的技术报告为指导,分3个步骤完成这个项目:
第1步:用DeepSeek-R1蒸馏高质量语料库,来复制R1-Distill模型。
第2步:复制DeepSeek用来构建R1-Zero的纯强化学习(RL)pipeline。这可能涉及为数学、推理和代码整理新的大规模数据集。
第3步:通过多阶段训练,从基础模型过渡到RL版本。
除了复现潮之外,网友们分享的玩法也是层出不穷。
例如一个小哥分享的《用DeepSeek R1构建一切》,手把手教你怎么做游戏、开发编程等等。
而从DeepSeek的热度延伸出来,国货之光的含金量还在上升:
对于DeepSeek引爆的热点话题,LeCun则站出来表示:
DeepSeek接下来还会引发怎样的热潮,是值得继续关注一波。
参考链接:
https://techcrunch.com/2025/01/26/deepseek-gets-silicon-valley-talking/
(举报)
DeepSeek的热,还在持续ing。
就在刚刚过去的周末,DeepSeek反超ChatGPT,一举登顶美区苹果应用商店免费App排行第一!
其热度之高,有网友甚至这样描述:
至于原因,正是DeepSeek在前几天开源的推理模型R1,引发了一阵又一阵的舆论热潮。
仅仅花费560万美元训练的R1,在很多AI基准测试中已经达到甚至超越OpenAI o1模型。
而且DeepSeek是真的免费,而ChatGPT虽然在免费榜上,但要是想解锁它的完全体,还是要掏上200美元……
现在要是在X上搜“DeepSeek”,目之所及,处处都是“使用DeepSeek构建一切”、“Goodbye ChatGPT”这样的话题:
并且不止是科技圈的人在关注,例如风险投资家Marc Andreessen就高度称赞道:
就连回应“DeepSeek将如何盈利”这个问题中的一句话——“DeepSeek是一个小项目”,也是被网友们转疯了……
嗯,火,着实是有点火
。
作为本身就是开源模型的DeepSeek R1,就在昨天还引发了一股复现热潮。
这个项目就是由HuggingFace在GitHub上发起的Open R1。
项目仅仅发布2天,已经斩获4.2K个Star。
联合创始人兼CEO Clem Delangue表示:
而在Open R1的项目文档中,官方进一步表示:
HuggingFace表示,将以DeepSeek-R1的技术报告为指导,分3个步骤完成这个项目:
第1步:用DeepSeek-R1蒸馏高质量语料库,来复制R1-Distill模型。
第2步:复制DeepSeek用来构建R1-Zero的纯强化学习(RL)pipeline。这可能涉及为数学、推理和代码整理新的大规模数据集。
第3步:通过多阶段训练,从基础模型过渡到RL版本。
除了复现潮之外,网友们分享的玩法也是层出不穷。
例如一个小哥分享的《用DeepSeek R1构建一切》,手把手教你怎么做游戏、开发编程等等。
而从DeepSeek的热度延伸出来,国货之光的含金量还在上升:
对于DeepSeek引爆的热点话题,LeCun则站出来表示:
DeepSeek接下来还会引发怎样的热潮,是值得继续关注一波。
参考链接:
https://techcrunch.com/2025/01/26/deepseek-gets-silicon-valley-talking/
(举报)