沐曦也联合中国开源大模型平台GiteeAI发布了全套DeepSeek-R1千问蒸馏模型,2月2日首批上线的四个较小规模的模型(1.5B、7B、14B、32B),均部署在国产沐曦曦云GPU上。
饶毅:DeepSeek是鸦片战争以来,中国对人类最大的科技震撼。芯东西2月5日报道,今年国产AI大模型DeepSeek犹如春雷炸响,以前所未有的影响力轰动全球科技圈。当前沐曦、天数智芯、摩尔线程、海光信息4家国产GPU企业,华为云、腾讯云、天翼云、阿里云、百度智能云、火山引擎6家国内云计算巨头,无问芯穹、硅基流动等AI基础设施企业,以及PPIO派欧云、云轴科技等独立云厂商,均已宣布适配及上架DeepSeek模型服务。还有更多企业正在跟上。DeepSeek也成为本季度科技财报电话会议的必问话题,在今日刚刚举行的财报电话会议上,AMD董事长兼CEO苏姿丰、谷歌CEO桑达尔·皮查伊都对DeepSeek大加夸赞。昨日,天数智芯、摩尔线程、海光信息接连宣布完成与DeepSeek模型的国产化适配。加上周日率先宣布的沐曦,已有4家国产GPU企业公开拥抱DeepSeek。上周英伟达、AMD、英特尔等海外芯片巨头更是早早完成支持。▲近期官宣支持DeepSeek模型的芯片企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)
在今日财报电话会议上,AMD董事长兼CEO苏姿丰称赞DeepSeek展现了“AI世界创新的速度和步伐”、“模型和算法创新有利于AI普及”。她认为有新方法可以用更少的基础设施实现训练和推理能力,是好事,有助于在更广泛的应用领域部署AI计算,并夸开源模型的采用速度和步伐是相当惊人的。谷歌CEO桑达尔·皮查伊今日也在财报会议中夸DeepSeek是一支“了不起的团队”、“做得非常非常好”。他透露说,谷歌的Gemini 2.0 Flash模型和2.0 Flash Thinking模型在效率方面与DeepSeek R1相当。随着AI推理成本不断下降,AI将有更多用途,皮查伊认为这是谷歌的“机会空间”。继两大海外云巨头AWS和微软Azure后,这两天更多国内云计算巨头加入到支持行列中。阿里云、百度智能云、火山引擎先后官宣对DeepSeek V3、R1模型的支持。加之此前的华为云、天翼云、腾讯云,目前国内六大云巨头都已正式支持DeepSeek。▲近期官宣支持DeepSeek模型的云服务及AI基础设施企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)
DeepSeek卷起的全球AI风暴,正在深度卷入产业中的每一位玩家,而中国芯片圈和云服务领域的巨头和创企们,已然集体出动。
国内外芯片厂商纷纷快速响应,宣布对于DeepSeek模型的支持。海外芯片三巨头中,AMD响应最积极,早在1月25日新年前就官宣将DeepSeek-V3模型集成到了Instinct MI300X GPU上。在X平台发文中,AMD特别感谢了DeepSeek和SGLang团队的密切配合。1月31日,AI计算“扛把子”英伟达也官宣其NVIDIA NIM微服务预览版对于DeepSeek-R1模型的支持。NIM微服务基于HGX H200系统,每秒能够处理3872个tokens。开发者们可以调用API进行测试和试验,该API后续会作为英伟达AI企业软件平台的一部分提供。同样在1月31日,英特尔也宣布DeepSeek能够在搭载酷睿处理器的AI PC上离线使用。在酷睿Ultra 200H(Arrow Lake H)平台上,DeepSeek-R1-1.5B模型能够本地离线运行,做翻译、做会议纪要、进行文档撰写等任务。国内芯片厂商这边,华为的昇腾系列AI芯片自然不必多说。沐曦也联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,2月2日首批上线的四个较小规模的模型(1.5B、7B、14B、32B),均部署在国产沐曦曦云GPU上。▲沐曦模型资源包发布
DeepSeek-R1模型+沐曦曦云GPU+Gitee AI平台,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。官方称之为“100%国产AI的力量”。昨日,天数智芯、摩尔线程、海光信息接连宣布对DeepSeek模型的支持。天数智芯宣布与Gitee AI合作,仅用时一天,就完成了与DeepSeek-R1模型的适配工作,并已上线多个大模型服务,包括1.5B、7B、14B等版本。▲天数智芯完成DeepSeek-R1模型适配,上线多个大模型服务
天数智芯写道,国内GPU与DeepSeek的适配可实现深度学习框架与国内自主硬件的深度融合,能促进国内AI产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本,有助于国内GPU拓展市场,完善产业链生态。摩尔线程已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。▲摩尔线程官宣信息
摩尔线程称DeepSeek的开源模型与摩尔线程的硬件形成闭环,验证了国产全功能GPU对复杂AI任务的支持能力,为AGI技术普惠化提供了可行路径。海光信息也在昨日宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线。DCU是海光信息推出的高性能GPGPU架构AI加速卡,已在多个领域规模化应用。用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,即可基于DCU平台快速部署和使用相关模型。2月1日大年初四,华为云正式官宣,经过和硅基流动团队连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。▲硅基流动联合华为云上线的DeepSeek-R1/V3推理服务
华为云提到得益于自研推理加速引擎加持,双方支持部署的DeepSeek模型可以获得持平全球高端GPU部署模型的效果。同日,天翼云宣布上架DeepSeek-R1模型。天翼云智算产品体系(息壤-科研助手、天翼AI云电脑、魔乐社区、“息壤”智算平台、GPU云主机/裸金属)均接入DeepSeek R1模型并上线相应服务。▲息壤一体化智算服务平台
2月2日,腾讯云官宣了对DeepSeek-R1模型的支持,在腾讯云的HAI平台上,开发者大约花3分钟就可以接入并调用模型。▲腾讯云HAI平台
2月3日下午16点58分,阿里云官宣其PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。▲PAI Model Gallery
44分钟后,百度智能云也宣布了其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,公布输入和输出价格,并从上线到2月18日24点模型限时免费。▲百度智能云公布模型的输入和输出价格
昨日下午,字节跳动旗下火山引擎宣布将支持V3/R1等不同尺寸的DeepSeek开源模型,可以通过两种方式使用模型:一是在火山引擎机器学习平台veMLP中部署,二是在火山方舟中调用模型,将提供有竞争力的价格、全网最高限流、两周限时5折优惠,助力企业畅享满血版DeepSeek-R1。▲PAI Model Gallery
同日,腾讯云TI平台宣布上架DeepSeek系列模型,包括“满血”的V3、R1原版模型和基于DeepSeek-R1蒸馏得到的系列模型,全面支持DeepSeek系列模型的一键部署,并限时开放了R1模型的免费在线体验。除了六大云巨头外,国内AI基础设施企业无问芯穹更是早在1月28日除夕一大早就宣布了其Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持。PPIO派欧、云轴科技则同在2月2日官宣对于DeepSeek模型的支持。PPIO派欧算力云支持了DeepSeek-V3、DeepSeek-R1、蒸馏模型DeepSeek-R1-Distill-Llama-70B,模型价格与官方价格保持一致。▲PPIO派欧算力云
云轴科技ZStack宣布AI Infra平台ZStack智塔支持企业私有化部署 DeepSeek V3/R1/Janus Pro三种模型,可基于海光、昇腾、英伟达、英特尔等国内外CPU/GPU适配。▲云轴科技ZStack智塔
海外市场,全球第一大云巨头AWS也在1月31日官宣DeepSeek-R1模型的全面上线。用户可在AmazonBedrock Marketplace和Amazon SageMaker JumpStart上部署DeepSeek-R1模型;在Amazon Bedrock上自定义导入DeepSeek-R1-Distill模型并在Amazon EC2 Trn1实例上部署DeepSeek-R1-Distill模型。▲Amazon Bedrock
微软Azure云服务则是在1月30日宣布DeepSeek-R1正式上线微软的Azure AI Foundry以及GitHub。微软还贴心地给出了使用教程视频。虽然DeepSeek的模型是开源的,但全球云服务厂商们对模型的支持仍然十分关键。通过支持DeepSeek模型的云平台,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等一系列繁琐步骤,直接在云服务厂商的平台上去调用DeepSeek模型。客观来说,像DeepSeek-V3这样的MoE模型总参数量有671B,部署门槛并不低。同时开发者还能在平台上以更少甚至零代码去实现从训练到部署再到推理的全过程,AI开发和应用的流程更简单、更高效。结语:DeepSeek朋友圈阵容豪华
合作共赢才是未来AI发展必由之路
DeepSeek给整个AI产业带来的影响是全方位、多层次的,除了自身模型的优秀,DeepSeek对于产业的带动效应更值得关注,从芯片产业到上层云服务产业,几乎所有头部玩家和创企都在积极涌入DeepSeek“生态圈”。有业内人士称,DeepSeek如此之快的爆发速度,一方面刺激着各路厂商加速适配模型,另一方面也刺激着算力产业的整合,随着模型同质化趋势凸显、开源模型的加速成长,AI应用生态层的商业价值会越来越高,应用层竞争也将成为后续行业聚焦的重点。DeepSeek无疑正在重塑全球AI产业的竞争版图,中美之间的AI竞争格局也在改变。算力神话被打破、更多玩家有机会在AI新时代更轻松地拿到“入场券”,AI应用生态的发展也愈发重要。正如DeepSeek创始人梁文锋近日在接受《暗涌》采访时提到的,在这波AI浪潮中,DeepSeek的出发点是走到技术前沿,去推动整个生态发展。正如英伟达的领先不只是一个公司到努力,也是整个西方技术社区和产业共同努力的结果,中国AI的发展,同样需要这样的生态。梁文锋说,DeepSeek希望形成一种生态,他们只负责基础模型和前沿的创新,其它公司在DeepSeek的基础上构建toB、toC的业务。中国知名生物学家、北京大学终身讲席教授饶毅近日发布了题为“鸦片战争以来,中国对人类最大的科技震撼:DeepSeek”的文章,激起广泛热议。毫无疑问,DeepSeek给海外诸多产业和领域都带来了巨大震撼,中美之间的AI竞争仍然事态焦灼、充满不确定性。中国AI或许正走在一个历史最关键时刻。正如傅聪所说:“我们不需要更多的禁令,中美作为在当今人工智能领域最领先的两个国家,不能不合作。只有共同合作发展,才能弥合数字和智能鸿沟,特别是帮助全球南方在人工智能发展进程中平等受益。”
沐曦也联合中国开源大模型平台GiteeAI发布了全套DeepSeek-R1千问蒸馏模型,2月2日首批上线的四个较小规模的模型(1.5B、7B、14B、32B),均部署在国产沐曦曦云GPU上。
饶毅:DeepSeek是鸦片战争以来,中国对人类最大的科技震撼。芯东西2月5日报道,今年国产AI大模型DeepSeek犹如春雷炸响,以前所未有的影响力轰动全球科技圈。当前沐曦、天数智芯、摩尔线程、海光信息4家国产GPU企业,华为云、腾讯云、天翼云、阿里云、百度智能云、火山引擎6家国内云计算巨头,无问芯穹、硅基流动等AI基础设施企业,以及PPIO派欧云、云轴科技等独立云厂商,均已宣布适配及上架DeepSeek模型服务。还有更多企业正在跟上。DeepSeek也成为本季度科技财报电话会议的必问话题,在今日刚刚举行的财报电话会议上,AMD董事长兼CEO苏姿丰、谷歌CEO桑达尔·皮查伊都对DeepSeek大加夸赞。昨日,天数智芯、摩尔线程、海光信息接连宣布完成与DeepSeek模型的国产化适配。加上周日率先宣布的沐曦,已有4家国产GPU企业公开拥抱DeepSeek。上周英伟达、AMD、英特尔等海外芯片巨头更是早早完成支持。▲近期官宣支持DeepSeek模型的芯片企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)
在今日财报电话会议上,AMD董事长兼CEO苏姿丰称赞DeepSeek展现了“AI世界创新的速度和步伐”、“模型和算法创新有利于AI普及”。她认为有新方法可以用更少的基础设施实现训练和推理能力,是好事,有助于在更广泛的应用领域部署AI计算,并夸开源模型的采用速度和步伐是相当惊人的。谷歌CEO桑达尔·皮查伊今日也在财报会议中夸DeepSeek是一支“了不起的团队”、“做得非常非常好”。他透露说,谷歌的Gemini 2.0 Flash模型和2.0 Flash Thinking模型在效率方面与DeepSeek R1相当。随着AI推理成本不断下降,AI将有更多用途,皮查伊认为这是谷歌的“机会空间”。继两大海外云巨头AWS和微软Azure后,这两天更多国内云计算巨头加入到支持行列中。阿里云、百度智能云、火山引擎先后官宣对DeepSeek V3、R1模型的支持。加之此前的华为云、天翼云、腾讯云,目前国内六大云巨头都已正式支持DeepSeek。▲近期官宣支持DeepSeek模型的云服务及AI基础设施企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)
DeepSeek卷起的全球AI风暴,正在深度卷入产业中的每一位玩家,而中国芯片圈和云服务领域的巨头和创企们,已然集体出动。
国内外芯片厂商纷纷快速响应,宣布对于DeepSeek模型的支持。海外芯片三巨头中,AMD响应最积极,早在1月25日新年前就官宣将DeepSeek-V3模型集成到了Instinct MI300X GPU上。在X平台发文中,AMD特别感谢了DeepSeek和SGLang团队的密切配合。1月31日,AI计算“扛把子”英伟达也官宣其NVIDIA NIM微服务预览版对于DeepSeek-R1模型的支持。NIM微服务基于HGX H200系统,每秒能够处理3872个tokens。开发者们可以调用API进行测试和试验,该API后续会作为英伟达AI企业软件平台的一部分提供。同样在1月31日,英特尔也宣布DeepSeek能够在搭载酷睿处理器的AI PC上离线使用。在酷睿Ultra 200H(Arrow Lake H)平台上,DeepSeek-R1-1.5B模型能够本地离线运行,做翻译、做会议纪要、进行文档撰写等任务。国内芯片厂商这边,华为的昇腾系列AI芯片自然不必多说。沐曦也联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,2月2日首批上线的四个较小规模的模型(1.5B、7B、14B、32B),均部署在国产沐曦曦云GPU上。▲沐曦模型资源包发布
DeepSeek-R1模型+沐曦曦云GPU+Gitee AI平台,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。官方称之为“100%国产AI的力量”。昨日,天数智芯、摩尔线程、海光信息接连宣布对DeepSeek模型的支持。天数智芯宣布与Gitee AI合作,仅用时一天,就完成了与DeepSeek-R1模型的适配工作,并已上线多个大模型服务,包括1.5B、7B、14B等版本。▲天数智芯完成DeepSeek-R1模型适配,上线多个大模型服务
天数智芯写道,国内GPU与DeepSeek的适配可实现深度学习框架与国内自主硬件的深度融合,能促进国内AI产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本,有助于国内GPU拓展市场,完善产业链生态。摩尔线程已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。▲摩尔线程官宣信息
摩尔线程称DeepSeek的开源模型与摩尔线程的硬件形成闭环,验证了国产全功能GPU对复杂AI任务的支持能力,为AGI技术普惠化提供了可行路径。海光信息也在昨日宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线。DCU是海光信息推出的高性能GPGPU架构AI加速卡,已在多个领域规模化应用。用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,即可基于DCU平台快速部署和使用相关模型。2月1日大年初四,华为云正式官宣,经过和硅基流动团队连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。▲硅基流动联合华为云上线的DeepSeek-R1/V3推理服务
华为云提到得益于自研推理加速引擎加持,双方支持部署的DeepSeek模型可以获得持平全球高端GPU部署模型的效果。同日,天翼云宣布上架DeepSeek-R1模型。天翼云智算产品体系(息壤-科研助手、天翼AI云电脑、魔乐社区、“息壤”智算平台、GPU云主机/裸金属)均接入DeepSeek R1模型并上线相应服务。▲息壤一体化智算服务平台
2月2日,腾讯云官宣了对DeepSeek-R1模型的支持,在腾讯云的HAI平台上,开发者大约花3分钟就可以接入并调用模型。▲腾讯云HAI平台
2月3日下午16点58分,阿里云官宣其PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。▲PAI Model Gallery
44分钟后,百度智能云也宣布了其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,公布输入和输出价格,并从上线到2月18日24点模型限时免费。▲百度智能云公布模型的输入和输出价格
昨日下午,字节跳动旗下火山引擎宣布将支持V3/R1等不同尺寸的DeepSeek开源模型,可以通过两种方式使用模型:一是在火山引擎机器学习平台veMLP中部署,二是在火山方舟中调用模型,将提供有竞争力的价格、全网最高限流、两周限时5折优惠,助力企业畅享满血版DeepSeek-R1。▲PAI Model Gallery
同日,腾讯云TI平台宣布上架DeepSeek系列模型,包括“满血”的V3、R1原版模型和基于DeepSeek-R1蒸馏得到的系列模型,全面支持DeepSeek系列模型的一键部署,并限时开放了R1模型的免费在线体验。除了六大云巨头外,国内AI基础设施企业无问芯穹更是早在1月28日除夕一大早就宣布了其Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持。PPIO派欧、云轴科技则同在2月2日官宣对于DeepSeek模型的支持。PPIO派欧算力云支持了DeepSeek-V3、DeepSeek-R1、蒸馏模型DeepSeek-R1-Distill-Llama-70B,模型价格与官方价格保持一致。▲PPIO派欧算力云
云轴科技ZStack宣布AI Infra平台ZStack智塔支持企业私有化部署 DeepSeek V3/R1/Janus Pro三种模型,可基于海光、昇腾、英伟达、英特尔等国内外CPU/GPU适配。▲云轴科技ZStack智塔
海外市场,全球第一大云巨头AWS也在1月31日官宣DeepSeek-R1模型的全面上线。用户可在AmazonBedrock Marketplace和Amazon SageMaker JumpStart上部署DeepSeek-R1模型;在Amazon Bedrock上自定义导入DeepSeek-R1-Distill模型并在Amazon EC2 Trn1实例上部署DeepSeek-R1-Distill模型。▲Amazon Bedrock
微软Azure云服务则是在1月30日宣布DeepSeek-R1正式上线微软的Azure AI Foundry以及GitHub。微软还贴心地给出了使用教程视频。虽然DeepSeek的模型是开源的,但全球云服务厂商们对模型的支持仍然十分关键。通过支持DeepSeek模型的云平台,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等一系列繁琐步骤,直接在云服务厂商的平台上去调用DeepSeek模型。客观来说,像DeepSeek-V3这样的MoE模型总参数量有671B,部署门槛并不低。同时开发者还能在平台上以更少甚至零代码去实现从训练到部署再到推理的全过程,AI开发和应用的流程更简单、更高效。结语:DeepSeek朋友圈阵容豪华
合作共赢才是未来AI发展必由之路
DeepSeek给整个AI产业带来的影响是全方位、多层次的,除了自身模型的优秀,DeepSeek对于产业的带动效应更值得关注,从芯片产业到上层云服务产业,几乎所有头部玩家和创企都在积极涌入DeepSeek“生态圈”。有业内人士称,DeepSeek如此之快的爆发速度,一方面刺激着各路厂商加速适配模型,另一方面也刺激着算力产业的整合,随着模型同质化趋势凸显、开源模型的加速成长,AI应用生态层的商业价值会越来越高,应用层竞争也将成为后续行业聚焦的重点。DeepSeek无疑正在重塑全球AI产业的竞争版图,中美之间的AI竞争格局也在改变。算力神话被打破、更多玩家有机会在AI新时代更轻松地拿到“入场券”,AI应用生态的发展也愈发重要。正如DeepSeek创始人梁文锋近日在接受《暗涌》采访时提到的,在这波AI浪潮中,DeepSeek的出发点是走到技术前沿,去推动整个生态发展。正如英伟达的领先不只是一个公司到努力,也是整个西方技术社区和产业共同努力的结果,中国AI的发展,同样需要这样的生态。梁文锋说,DeepSeek希望形成一种生态,他们只负责基础模型和前沿的创新,其它公司在DeepSeek的基础上构建toB、toC的业务。中国知名生物学家、北京大学终身讲席教授饶毅近日发布了题为“鸦片战争以来,中国对人类最大的科技震撼:DeepSeek”的文章,激起广泛热议。毫无疑问,DeepSeek给海外诸多产业和领域都带来了巨大震撼,中美之间的AI竞争仍然事态焦灼、充满不确定性。中国AI或许正走在一个历史最关键时刻。正如傅聪所说:“我们不需要更多的禁令,中美作为在当今人工智能领域最领先的两个国家,不能不合作。只有共同合作发展,才能弥合数字和智能鸿沟,特别是帮助全球南方在人工智能发展进程中平等受益。”