黄仁勋终于出来谈DeepSeek了!
就在英伟达即将发布业绩之际,英伟达创始人兼首席执行官黄仁勋出来说话了。黄仁勋在接受《DDN》采访时,谈到了市场关注的焦点——DeepSeek。黄仁勋表示,DeepSeek及其开源推理模型所带来的能量“令人无比兴奋”,但投资人“判断错误”,误以为这对英伟达及人工智能(AI)产业是不利的。它不仅不会终结AI计算需求,反而会扩大并加速市场对更高效AI模型的追求,从而推动整个行业的发展。
黄仁勋解释道,投资人所考虑的框架与现实不同。他表示,从投资人的角度而言,心智模型(mental model)认为AI世界是“预训练”然后是“推理”,但事实并非如此。“我不知道这是谁的错,但显然这种思维方式是错的”。
黄仁勋发声
黄仁勋表示,市场对DeepSeek的技术进步及其可能对芯片制造商的业务产生负面影响的判断是错误的。相反,黄仁勋称DeepSeek的R1开源推理模型“令人兴奋不已” 。
黄仁勋表示,R1的发布本质上对人工智能市场有利,并将加速人工智能的采用,而这次发布意味着市场不再需要计算资源——比如英伟达生产的资源。“这让每个人都注意到,模型的效率远超我们的想象,”黄仁勋说道,“因此,它正在不断扩大,并加速人工智能的普及。”
他还指出,尽管DeepSeek在预训练AI模型方面取得了进步,但后期训练仍然很重要,并且需要大量资源。
他进一步说明了正确的思维方式,指出“预训练是因为我们想要奠定基础,以便进行第二部分,即后训练”。他强调,后续训练将持续发挥重要作用,因为这个阶段是“学习解决问题”的过程。此外,黄仁勋提到第三扩展定律,即在回答问题之前,推理得越多,效果就越好。他强调,“推理本身是一个运算密集的过程”。
将近一个月之前,DeepSeek发布了其R1模型的开源版本,此举震动了整个人工智能市场,由于其低成本,似乎对英伟达构成了重大的负面冲击。DeepSeek发布消息后,该公司股价在一个交易日内暴跌17%。1月24日,英伟达股价收于每股142.62美元。随后的一个交易日该股迅速下跌,收于每股118.52美元。这一事件导致英伟达市值在短短三天内蒸发6000亿美元。
不过,自那以后,这家人工智能芯片公司的股价几乎完全恢复。周五,该股开盘价为每股140美元,这意味着该公司在大约一个月内几乎完全恢复了失去的价值。截至当日收盘,英伟达跌超4%。
英伟达将于2月26日公布其第四季度业绩。与此同时,DeepSeek昨天已经宣布,计划在下周的“开源周”活动期间开放五个代码库。
算力爆发期将至?
DeepSeek可能并不是压制算力,反而是引爆了算力。近期,各地方政府、各公司纷纷接入该模型。
此外,国务院国资委近日召开的中央企业“AI+”专项行动深化部署会强调,国资央企要抓住人工智能产业发展的战略窗口期,强化科技创新,聚焦关键领域加快掌握“根技术”,坚定攻关大模型,积极参与开放生态建设,推动产生更多“从0到1”的原始创新,加速推进成果转化和产业化发展。要强化深度赋能,瞄准战略意义强、经济收益高、民生关联紧的高价值场景,强化行业协同、扩大开放合作,加大布局突破力度。要夯实算力基座,为技术突破、应用落地提供有力支撑。要突破数据难题,分批构建重点行业数据集,建设好通用基础数据集,做强做优数据产业。
另一方面,阿里巴巴的资本开支大幅上修。根据阿里巴巴第四财季财报,其资本开支环比增长80%至318亿元,并表示未来三年内在云和AI基础设施方面投入的资金预计超过过去10年总和。目前,全市场都在等腾讯三月份即将发布的年报。
数据显示,2023—2025年,海外四大云厂商资本开支CAGR达50.6%,预计2025年资本开支合计突破3000亿美元。国泰君安认为,DeepSeek R1的发布彰显国产大模型在算力紧缺情况下亦可取得与海外顶尖大模型相当性能,预计将加速DeepSeek、通义千问、豆包等国产大模型性能发展,国内AI领域资本开支有望保持高速增长,带动AI产业链加速成长。
值得注意的是,DeepSeek R1驱动推理需求爆发,海外算力供应不确定性高,国产算力迎来发展机遇。DeepSeek R1发布以来基于高质量推理能力推动推理需求高速增长。目前以华为云为代表的公有云积极适配,金融、医疗等企业加速本地化部署R1模型,未来推理侧场景预计将持续拓展。推理侧场景爆发需要底层算力芯片作为运算支撑,将带动AI算力芯片需求高速增长。
国泰君安认为,由于中美在AI领域竞争日趋激烈,未来以英伟达为代表的海外算力卡供应存在较大不确定性。同时以昇腾910C为代表的国产算力芯片在推理场景中已取得较好结果。根据芯智讯,华为昇腾910C单卡推理性能可达到H100的60%。推理需求爆发驱动国产算力加速适配,国产算力芯片迎来发展机遇。
黄仁勋终于出来谈DeepSeek了!
就在英伟达即将发布业绩之际,英伟达创始人兼首席执行官黄仁勋出来说话了。黄仁勋在接受《DDN》采访时,谈到了市场关注的焦点——DeepSeek。黄仁勋表示,DeepSeek及其开源推理模型所带来的能量“令人无比兴奋”,但投资人“判断错误”,误以为这对英伟达及人工智能(AI)产业是不利的。它不仅不会终结AI计算需求,反而会扩大并加速市场对更高效AI模型的追求,从而推动整个行业的发展。
黄仁勋解释道,投资人所考虑的框架与现实不同。他表示,从投资人的角度而言,心智模型(mental model)认为AI世界是“预训练”然后是“推理”,但事实并非如此。“我不知道这是谁的错,但显然这种思维方式是错的”。
黄仁勋发声
黄仁勋表示,市场对DeepSeek的技术进步及其可能对芯片制造商的业务产生负面影响的判断是错误的。相反,黄仁勋称DeepSeek的R1开源推理模型“令人兴奋不已” 。
黄仁勋表示,R1的发布本质上对人工智能市场有利,并将加速人工智能的采用,而这次发布意味着市场不再需要计算资源——比如英伟达生产的资源。“这让每个人都注意到,模型的效率远超我们的想象,”黄仁勋说道,“因此,它正在不断扩大,并加速人工智能的普及。”
他还指出,尽管DeepSeek在预训练AI模型方面取得了进步,但后期训练仍然很重要,并且需要大量资源。
他进一步说明了正确的思维方式,指出“预训练是因为我们想要奠定基础,以便进行第二部分,即后训练”。他强调,后续训练将持续发挥重要作用,因为这个阶段是“学习解决问题”的过程。此外,黄仁勋提到第三扩展定律,即在回答问题之前,推理得越多,效果就越好。他强调,“推理本身是一个运算密集的过程”。
将近一个月之前,DeepSeek发布了其R1模型的开源版本,此举震动了整个人工智能市场,由于其低成本,似乎对英伟达构成了重大的负面冲击。DeepSeek发布消息后,该公司股价在一个交易日内暴跌17%。1月24日,英伟达股价收于每股142.62美元。随后的一个交易日该股迅速下跌,收于每股118.52美元。这一事件导致英伟达市值在短短三天内蒸发6000亿美元。
不过,自那以后,这家人工智能芯片公司的股价几乎完全恢复。周五,该股开盘价为每股140美元,这意味着该公司在大约一个月内几乎完全恢复了失去的价值。截至当日收盘,英伟达跌超4%。
英伟达将于2月26日公布其第四季度业绩。与此同时,DeepSeek昨天已经宣布,计划在下周的“开源周”活动期间开放五个代码库。
算力爆发期将至?
DeepSeek可能并不是压制算力,反而是引爆了算力。近期,各地方政府、各公司纷纷接入该模型。
此外,国务院国资委近日召开的中央企业“AI+”专项行动深化部署会强调,国资央企要抓住人工智能产业发展的战略窗口期,强化科技创新,聚焦关键领域加快掌握“根技术”,坚定攻关大模型,积极参与开放生态建设,推动产生更多“从0到1”的原始创新,加速推进成果转化和产业化发展。要强化深度赋能,瞄准战略意义强、经济收益高、民生关联紧的高价值场景,强化行业协同、扩大开放合作,加大布局突破力度。要夯实算力基座,为技术突破、应用落地提供有力支撑。要突破数据难题,分批构建重点行业数据集,建设好通用基础数据集,做强做优数据产业。
另一方面,阿里巴巴的资本开支大幅上修。根据阿里巴巴第四财季财报,其资本开支环比增长80%至318亿元,并表示未来三年内在云和AI基础设施方面投入的资金预计超过过去10年总和。目前,全市场都在等腾讯三月份即将发布的年报。
数据显示,2023—2025年,海外四大云厂商资本开支CAGR达50.6%,预计2025年资本开支合计突破3000亿美元。国泰君安认为,DeepSeek R1的发布彰显国产大模型在算力紧缺情况下亦可取得与海外顶尖大模型相当性能,预计将加速DeepSeek、通义千问、豆包等国产大模型性能发展,国内AI领域资本开支有望保持高速增长,带动AI产业链加速成长。
值得注意的是,DeepSeek R1驱动推理需求爆发,海外算力供应不确定性高,国产算力迎来发展机遇。DeepSeek R1发布以来基于高质量推理能力推动推理需求高速增长。目前以华为云为代表的公有云积极适配,金融、医疗等企业加速本地化部署R1模型,未来推理侧场景预计将持续拓展。推理侧场景爆发需要底层算力芯片作为运算支撑,将带动AI算力芯片需求高速增长。
国泰君安认为,由于中美在AI领域竞争日趋激烈,未来以英伟达为代表的海外算力卡供应存在较大不确定性。同时以昇腾910C为代表的国产算力芯片在推理场景中已取得较好结果。根据芯智讯,华为昇腾910C单卡推理性能可达到H100的60%。推理需求爆发驱动国产算力加速适配,国产算力芯片迎来发展机遇。