【通信产业网讯】(记者 高超)日前 ,在2024中国信息通信大会期间,中国移动多款智算新成果重磅发布。
据了解,此次发布的新成果主要有智算“芯合”算力原生基础软件栈2.0、“芯合”异构混合并行训练系统1.0、无线智算网络样机等。2024中国信息通信大会由中国通信学会主办。大会期间,中国移动研究院承办了算力网络算网一体创新发展论坛和第三届无线通算智融合共生技术专题研讨会,携手合作伙伴发布了上述新成果。
算力原生基础软件栈实现三大升级
芯片是智算生态的基石,基础软件栈是智算生态的核心。随着近年来多样化异构智算芯片的不断涌现,产业界形成了多套“AI框架+工具链+硬件”的软硬一体竖井生态,上层应用与底层芯片深度绑定,无法灵活迁移,整个智算产业面临着基础软件栈多而不优,生态互不兼容的巨大挑战,制约异构智能算力整体效能的释放。为屏蔽异构硬件差异、融通智算竖井生态,中国移动充分发挥移动信息现代产业链“链长”职责,以智算基础软件栈为攻关要点,于2022年创新提出算力原生CAMA原创技术,发布业内首个《面向智算的算力原生白皮书》,并于2023年研发并发布“芯合”算力原生基础软件栈1.0,在全球首次实现智算应用一键式跨芯迁移的目标,已在山东、广西等多省市的路桥检测、智能安防等场景试点应用,大幅降低智算应用向国产化芯片迁移的复杂度,有力促进了我国智算产业的繁荣发展。
聚产业之愿,合众“芯”之力,2024年中国移动持续攻关算力原生技术,以研究院和齐鲁创新院为主体,深入推进“芯合”基础软件栈2.0研发,相较于之前实现了三大升级。一是能力升级,全面重构算力抽象模型,插件化灵活接入英伟达、华为、海光等6家AI芯片,拓展ONNX、SYCL等更多编程范式,支持泛AI应用的跨芯迁移。二是性能升级,新增对标CUDA的DNN、BLAS等高性能计算库,提供图算融合编译优化能力,实现性能大幅提升,当前应用跨架构迁移损耗已降低至10%以内;三是效率升级,构建面向智算应用的“跨架构软件工厂”,提供统一开发、调试、优化、部署、迁移全生命周期服务能力,缩短应用开发、上线时间,提升整体研发效率。当前,“芯合”算力原生基础软件栈2.0已实现泛AI应用在英伟达、intel、华为、瀚博、天数智芯、海光6家智算芯片间的一键式跨芯流转迁移,源源转换效率>95%,迁移性能损耗<10%,迁移时间<20s,已具备规模商用条件,未来将在提升智能算力网络自主可控水平方面发挥重要作用。
未来,中国移动将继续秉持开放合作的态度,与产业各界合作伙伴一起攻关,进一步完善“芯合”算力原生平台功能,支撑更多业务场景、融通更多异构芯片,推动商用落地,真正打造以基础软件栈引领智算生态建设的全“芯”发展范式,全面支撑我国算力强国战略落地。
业内首个异构混合并行训练系统发布
智算为核,生态筑基。人工智能已成为人类社会数智化转型的关键驱动力,智能算力作为人工智能发展的基石,不断推动人工智能从单点突破迈向泛在智能。当前我国智算产业繁荣发展,多厂商、多代际、多架构智算芯片共存,然而这些芯片在计算架构、软件栈、互联方式等方面存在着较大差异,形成智算芯片间的“资源墙”,难以形成“合力”,限制多样性智能算力的灵活运用和整体效能释放。
为推动我国智算产业繁荣发展,融通异构智算芯片间的生态竖井,中国移动充分发挥移动信息现代产业链“链长”职责,持续攻关异构混训技术,以研究院和齐鲁创新院为主体,着力打造业内首个“芯合”异构混合并行训练系统,支撑大模型在多厂商、多代际、多架构的异构混合集群上的规模训练。
“芯合”异构混合并行训练系统具备基于非均匀计算任务切分ITD(Inhomogeneous Task Distribution)算法的3D并行策略和基于GDR(GPU Direct RDMA)的异构芯片高速通信两大核心能力。其中,基于ITD算法的3D并行技术可通过通用混合训练框架实现异构数据并行、异构流水线并行,实现数据微批次大小、数量、流水线并行度等参数在异构算力上的自适应调整;基于GDR的异构芯片高速通信技术可在不改变芯片原有通信接口基础上,通过定义数据传输架构、流程及接口标准,屏蔽底层硬件差异,实现顶层训练任务在异构算力集群上分布式通信的无感拆解。当前,系统已实现百亿参数大模型在英伟达、天数智芯、壁仞科技、海光等4家智算芯片上的交叉混合训练,规模可支持万卡集群,训练加速比达95%以上,达到业界领先水平,未来将在提升智能算力资源利用率及促进国产算力发展等方面发挥重要作用。
未来,中国移动将继续秉持开放合作的态度,与产业合作伙伴进一步攻关完善“芯合”异构混训系统能力,共建开放智算算力生态体系,助力万亿级参数大模型训练孵化,推动全行业“AI+”转型升级和我国算力强国战略落地。
无线智算网络样机亮相
无线智算网络将极大提升网络基础设施技术能力,高效使能泛在AI发展。中国移动无线智算网络样机基于新一代通算智融合架构,扎根自主可控平台设计,实现云化计算资源灵活共享;利用功能解耦和接口开放支持集成云基站、九天望岳视觉大模型等能力。目前无线智算网络样机正在AR增强现实、实时图像AI分析、智慧物联网等领域开展实验室和试点验证,已取得显著成效。
中国移动始终致力于推动网络技术的革新与发展:2018年,提出智能无线云网络技术发展路线,并在3GPP牵头了无线智能网络相关研究和标准化项目;2020年,携手业界伙伴共同发起6GANA组织(6G Alliance of Network AI),提出6G内生AI网络架构,发布《6G网络内生AI网络架构十问》《QoAIS指标体系研究》等白皮书;2021年,提出“算力网络”理念,旨在实现“网络无所不达,算力无所不在,智能无所不及”,使能泛在AI以提供普惠化社会服务;2022年,在中国通信标准化协会主导无线算力网络场景需求及关键技术研究项目,引领产业界挖掘无线算力资源价值;2023年,在IEEE JSAC、WCM等核心期刊发表通算智无线接入网创新架构及技术体系,推进业界通算智融合技术共识达成。
中国移动无线智算网络样机的正式发布,标志着无线通信网络在通算智融合方向上已迈出坚实步伐,我们正迎来前所未有的开放、智能、高效的无线智算网络新纪元。
【通信产业网讯】(记者 高超)日前 ,在2024中国信息通信大会期间,中国移动多款智算新成果重磅发布。
据了解,此次发布的新成果主要有智算“芯合”算力原生基础软件栈2.0、“芯合”异构混合并行训练系统1.0、无线智算网络样机等。2024中国信息通信大会由中国通信学会主办。大会期间,中国移动研究院承办了算力网络算网一体创新发展论坛和第三届无线通算智融合共生技术专题研讨会,携手合作伙伴发布了上述新成果。
算力原生基础软件栈实现三大升级
芯片是智算生态的基石,基础软件栈是智算生态的核心。随着近年来多样化异构智算芯片的不断涌现,产业界形成了多套“AI框架+工具链+硬件”的软硬一体竖井生态,上层应用与底层芯片深度绑定,无法灵活迁移,整个智算产业面临着基础软件栈多而不优,生态互不兼容的巨大挑战,制约异构智能算力整体效能的释放。为屏蔽异构硬件差异、融通智算竖井生态,中国移动充分发挥移动信息现代产业链“链长”职责,以智算基础软件栈为攻关要点,于2022年创新提出算力原生CAMA原创技术,发布业内首个《面向智算的算力原生白皮书》,并于2023年研发并发布“芯合”算力原生基础软件栈1.0,在全球首次实现智算应用一键式跨芯迁移的目标,已在山东、广西等多省市的路桥检测、智能安防等场景试点应用,大幅降低智算应用向国产化芯片迁移的复杂度,有力促进了我国智算产业的繁荣发展。
聚产业之愿,合众“芯”之力,2024年中国移动持续攻关算力原生技术,以研究院和齐鲁创新院为主体,深入推进“芯合”基础软件栈2.0研发,相较于之前实现了三大升级。一是能力升级,全面重构算力抽象模型,插件化灵活接入英伟达、华为、海光等6家AI芯片,拓展ONNX、SYCL等更多编程范式,支持泛AI应用的跨芯迁移。二是性能升级,新增对标CUDA的DNN、BLAS等高性能计算库,提供图算融合编译优化能力,实现性能大幅提升,当前应用跨架构迁移损耗已降低至10%以内;三是效率升级,构建面向智算应用的“跨架构软件工厂”,提供统一开发、调试、优化、部署、迁移全生命周期服务能力,缩短应用开发、上线时间,提升整体研发效率。当前,“芯合”算力原生基础软件栈2.0已实现泛AI应用在英伟达、intel、华为、瀚博、天数智芯、海光6家智算芯片间的一键式跨芯流转迁移,源源转换效率>95%,迁移性能损耗<10%,迁移时间<20s,已具备规模商用条件,未来将在提升智能算力网络自主可控水平方面发挥重要作用。
未来,中国移动将继续秉持开放合作的态度,与产业各界合作伙伴一起攻关,进一步完善“芯合”算力原生平台功能,支撑更多业务场景、融通更多异构芯片,推动商用落地,真正打造以基础软件栈引领智算生态建设的全“芯”发展范式,全面支撑我国算力强国战略落地。
业内首个异构混合并行训练系统发布
智算为核,生态筑基。人工智能已成为人类社会数智化转型的关键驱动力,智能算力作为人工智能发展的基石,不断推动人工智能从单点突破迈向泛在智能。当前我国智算产业繁荣发展,多厂商、多代际、多架构智算芯片共存,然而这些芯片在计算架构、软件栈、互联方式等方面存在着较大差异,形成智算芯片间的“资源墙”,难以形成“合力”,限制多样性智能算力的灵活运用和整体效能释放。
为推动我国智算产业繁荣发展,融通异构智算芯片间的生态竖井,中国移动充分发挥移动信息现代产业链“链长”职责,持续攻关异构混训技术,以研究院和齐鲁创新院为主体,着力打造业内首个“芯合”异构混合并行训练系统,支撑大模型在多厂商、多代际、多架构的异构混合集群上的规模训练。
“芯合”异构混合并行训练系统具备基于非均匀计算任务切分ITD(Inhomogeneous Task Distribution)算法的3D并行策略和基于GDR(GPU Direct RDMA)的异构芯片高速通信两大核心能力。其中,基于ITD算法的3D并行技术可通过通用混合训练框架实现异构数据并行、异构流水线并行,实现数据微批次大小、数量、流水线并行度等参数在异构算力上的自适应调整;基于GDR的异构芯片高速通信技术可在不改变芯片原有通信接口基础上,通过定义数据传输架构、流程及接口标准,屏蔽底层硬件差异,实现顶层训练任务在异构算力集群上分布式通信的无感拆解。当前,系统已实现百亿参数大模型在英伟达、天数智芯、壁仞科技、海光等4家智算芯片上的交叉混合训练,规模可支持万卡集群,训练加速比达95%以上,达到业界领先水平,未来将在提升智能算力资源利用率及促进国产算力发展等方面发挥重要作用。
未来,中国移动将继续秉持开放合作的态度,与产业合作伙伴进一步攻关完善“芯合”异构混训系统能力,共建开放智算算力生态体系,助力万亿级参数大模型训练孵化,推动全行业“AI+”转型升级和我国算力强国战略落地。
无线智算网络样机亮相
无线智算网络将极大提升网络基础设施技术能力,高效使能泛在AI发展。中国移动无线智算网络样机基于新一代通算智融合架构,扎根自主可控平台设计,实现云化计算资源灵活共享;利用功能解耦和接口开放支持集成云基站、九天望岳视觉大模型等能力。目前无线智算网络样机正在AR增强现实、实时图像AI分析、智慧物联网等领域开展实验室和试点验证,已取得显著成效。
中国移动始终致力于推动网络技术的革新与发展:2018年,提出智能无线云网络技术发展路线,并在3GPP牵头了无线智能网络相关研究和标准化项目;2020年,携手业界伙伴共同发起6GANA组织(6G Alliance of Network AI),提出6G内生AI网络架构,发布《6G网络内生AI网络架构十问》《QoAIS指标体系研究》等白皮书;2021年,提出“算力网络”理念,旨在实现“网络无所不达,算力无所不在,智能无所不及”,使能泛在AI以提供普惠化社会服务;2022年,在中国通信标准化协会主导无线算力网络场景需求及关键技术研究项目,引领产业界挖掘无线算力资源价值;2023年,在IEEE JSAC、WCM等核心期刊发表通算智无线接入网创新架构及技术体系,推进业界通算智融合技术共识达成。
中国移动无线智算网络样机的正式发布,标志着无线通信网络在通算智融合方向上已迈出坚实步伐,我们正迎来前所未有的开放、智能、高效的无线智算网络新纪元。