智通财经APP获悉,Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如DeepSeek-V3中所提出。它支持普通和混合专家(MoE)分组的GEMM。该库采用CUDA编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。
DeepSeek开源周第二日(2月25日),DeepSeek官宣开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。特点有:高效、优化的全员沟通;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。
2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。2月21日,DeepSeek在社交平台发文称,构建了一支探索AGI(通用人工智能)的小团队,将开源5个代码库,以完全透明的方式分享研究进展。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
智通财经APP获悉,Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如DeepSeek-V3中所提出。它支持普通和混合专家(MoE)分组的GEMM。该库采用CUDA编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。
DeepSeek开源周第二日(2月25日),DeepSeek官宣开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。特点有:高效、优化的全员沟通;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。
2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。2月21日,DeepSeek在社交平台发文称,构建了一支探索AGI(通用人工智能)的小团队,将开源5个代码库,以完全透明的方式分享研究进展。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com