苹果M3 Ultra支持满血版DeepSeek-R1,功耗仅200W

芯智讯

2周前

3月13日,据外媒wccftech报道,苹果公司在本周早些时候苹果推出了新款MacStudio,搭载其最强大的M3Ultra芯片,刷新了该公司自己的PC处理器性能巅峰,可以运行满血版DeepSeekR1模型。

3月13日,据外媒wccftech报道,苹果公司在本周早些时候苹果推出了新款Mac Studio,搭载其最强大的M3 Ultra芯片,刷新了该公司自己的PC处理器性能巅峰,可以运行满血版DeepSeek R1模型。

据介绍,M3 Ultra芯片通过UltraFusion封装架构,将两枚M3 Max晶粒整合在一起,集成了1840亿个晶体管,配备最多32核心的CPU(包括24个性能核心和8个能效核心)、最多80核心的GPU和32核神经网络引擎,最高可配置512GB的统一内存(起步内存为96GB),配合超过800GB/s的内存带宽,可在搭载M3 Ultra芯片的Mac Studio上运行包含超6000亿参数的大语言模型 (LLM)。与M2 Ultra芯片相比,可以提供更强的计算和图形性能。M3 Ultra芯片还能运行满血版DeepSeek R1模型(拥有6710亿个参数的庞大模型),足以证明自己的性能强劲。

苹果最强PC处理器!M3 Ultra发布:性能最高提升2.6倍 支持512GB内存

需要指出的,满血版的DeepSeek R1大模型拥有6710亿个参数,需要大容量的高带宽内存才能运行。据了解,DeepSeek R1满血版(671B)模型在FP16精度下,显存需求高达1.34TB,4-bit量化显存也需要约350GB,至少需要16张英伟达(NVIDIA)H100 80GB + NVLink/InfiniBand互联才能满足本地化部署要求,但是这也带来了功耗、成本的大幅提升。

而M3 Ultra采用了苹果的统一存内存架构,最高可以支持高达512GB的统一内存,使得M3 Ultra芯片在运行满血版的DeepSeek R1大模型方面有独特的优势,并以较低的功耗展现出令人印象深刻的效果。

YouTube频道博主@Dave2D 也分享了详细讯息,比较了M3 Ultra芯片和之前的苹果芯片在DeepSeek R1大模型上的性能差异。

通过@Dave2D 分享的对比信息来看,M3 Ultra运行较小的AI模型无需使用全部资源即可持续流畅地运行,对于满血版的DeepSeek R1大模型来说,需要苹果最高配置的M3 Ultra芯片——高达512GB。然而,苹果macOS默认对VRAM分配进行了限制,@Dave2D 必须通过终端手动增加限制,将其增加到448GB。

Apple 的 M3 Ultra 芯片在 Mac Studio 上具有 671 个参数的 DeepSeek R1 模型的性能

Apple 的 M3 Ultra 芯片在 Mac Studio 上具有 671 个参数的 DeepSeek R1 模型的性能

DeepSeek R1模型在M3 Ultra Mac Studio上成功流畅运行,而且尽管是牺牲精度的4bit量化版本,模型仍然保留了6710亿个参数,表现得出奇的好。虽然竞争对手可以通过多个GPU实现相同的性能,但M3 Ultra芯片在能耗和成本方面更占上风。运行强大的DeepSeek R1模型时,整个系统的功耗不到200W。其功耗只是有同等性能的PC实现类似结果所需功耗的一小部分。@Dave2D 还指出,传统的多GPU配置所需的功率比M3 Ultra芯片将高10倍。

编辑:芯智讯-浪客剑

往期精彩文章

官宣!陈立武出任英特尔CEO!
估值超155亿!壁仞科技IPO前再融资,上海国投先导AI母基金领投
制裁之下,破局之光:熹贾精密半导体密封技术引领国产突围
美国下周召开听证会,或将对中国成熟制程芯片加征关税!
两位前BIS局长同台探讨:中美“芯片战争”现状与未来走向
Sandisk发涨价函:4月1日起所有产品涨价超10%!
苹果iPhone 16e拆解:自研5G基带芯片细节曝光
特朗普拟废除“芯片法案”,台积电先进制程将涨价至少15%
RISC-V芯片有何魅力,为何值得鼓励全国范围内使用?
台积电对美投资增至1650亿美元:将再建3座晶圆厂,2座先进封装厂!
国产EDA大厂CEO/CTO/COO全部换人!官方回应来了
玄铁C930旗舰处理器3月交付:性能达服务器级,搭载Matrix AI引擎
单机部署满血版DeepSeek,谁才是最具性价比的一体机方案?

行业交流、合作请加微信:icsmart01
芯智讯官方交流群:221807116

3月13日,据外媒wccftech报道,苹果公司在本周早些时候苹果推出了新款MacStudio,搭载其最强大的M3Ultra芯片,刷新了该公司自己的PC处理器性能巅峰,可以运行满血版DeepSeekR1模型。

3月13日,据外媒wccftech报道,苹果公司在本周早些时候苹果推出了新款Mac Studio,搭载其最强大的M3 Ultra芯片,刷新了该公司自己的PC处理器性能巅峰,可以运行满血版DeepSeek R1模型。

据介绍,M3 Ultra芯片通过UltraFusion封装架构,将两枚M3 Max晶粒整合在一起,集成了1840亿个晶体管,配备最多32核心的CPU(包括24个性能核心和8个能效核心)、最多80核心的GPU和32核神经网络引擎,最高可配置512GB的统一内存(起步内存为96GB),配合超过800GB/s的内存带宽,可在搭载M3 Ultra芯片的Mac Studio上运行包含超6000亿参数的大语言模型 (LLM)。与M2 Ultra芯片相比,可以提供更强的计算和图形性能。M3 Ultra芯片还能运行满血版DeepSeek R1模型(拥有6710亿个参数的庞大模型),足以证明自己的性能强劲。

苹果最强PC处理器!M3 Ultra发布:性能最高提升2.6倍 支持512GB内存

需要指出的,满血版的DeepSeek R1大模型拥有6710亿个参数,需要大容量的高带宽内存才能运行。据了解,DeepSeek R1满血版(671B)模型在FP16精度下,显存需求高达1.34TB,4-bit量化显存也需要约350GB,至少需要16张英伟达(NVIDIA)H100 80GB + NVLink/InfiniBand互联才能满足本地化部署要求,但是这也带来了功耗、成本的大幅提升。

而M3 Ultra采用了苹果的统一存内存架构,最高可以支持高达512GB的统一内存,使得M3 Ultra芯片在运行满血版的DeepSeek R1大模型方面有独特的优势,并以较低的功耗展现出令人印象深刻的效果。

YouTube频道博主@Dave2D 也分享了详细讯息,比较了M3 Ultra芯片和之前的苹果芯片在DeepSeek R1大模型上的性能差异。

通过@Dave2D 分享的对比信息来看,M3 Ultra运行较小的AI模型无需使用全部资源即可持续流畅地运行,对于满血版的DeepSeek R1大模型来说,需要苹果最高配置的M3 Ultra芯片——高达512GB。然而,苹果macOS默认对VRAM分配进行了限制,@Dave2D 必须通过终端手动增加限制,将其增加到448GB。

Apple 的 M3 Ultra 芯片在 Mac Studio 上具有 671 个参数的 DeepSeek R1 模型的性能

Apple 的 M3 Ultra 芯片在 Mac Studio 上具有 671 个参数的 DeepSeek R1 模型的性能

DeepSeek R1模型在M3 Ultra Mac Studio上成功流畅运行,而且尽管是牺牲精度的4bit量化版本,模型仍然保留了6710亿个参数,表现得出奇的好。虽然竞争对手可以通过多个GPU实现相同的性能,但M3 Ultra芯片在能耗和成本方面更占上风。运行强大的DeepSeek R1模型时,整个系统的功耗不到200W。其功耗只是有同等性能的PC实现类似结果所需功耗的一小部分。@Dave2D 还指出,传统的多GPU配置所需的功率比M3 Ultra芯片将高10倍。

编辑:芯智讯-浪客剑

往期精彩文章

官宣!陈立武出任英特尔CEO!
估值超155亿!壁仞科技IPO前再融资,上海国投先导AI母基金领投
制裁之下,破局之光:熹贾精密半导体密封技术引领国产突围
美国下周召开听证会,或将对中国成熟制程芯片加征关税!
两位前BIS局长同台探讨:中美“芯片战争”现状与未来走向
Sandisk发涨价函:4月1日起所有产品涨价超10%!
苹果iPhone 16e拆解:自研5G基带芯片细节曝光
特朗普拟废除“芯片法案”,台积电先进制程将涨价至少15%
RISC-V芯片有何魅力,为何值得鼓励全国范围内使用?
台积电对美投资增至1650亿美元:将再建3座晶圆厂,2座先进封装厂!
国产EDA大厂CEO/CTO/COO全部换人!官方回应来了
玄铁C930旗舰处理器3月交付:性能达服务器级,搭载Matrix AI引擎
单机部署满血版DeepSeek,谁才是最具性价比的一体机方案?

行业交流、合作请加微信:icsmart01
芯智讯官方交流群:221807116

展开
打开“财经头条”阅读更多精彩资讯
APP内打开