存算一体化与边缘计算:重新定义智能计算的未来

Imagination Tech

3天前

根据计算单元与存储单元的距离,存算一体化主要分为三类:近存计算(PNM)、存内处理(PIM)和存内计算(CIM)。
来源:边缘计算社区

随着数据量爆炸式增长和智能化应用的普及,计算与存储的高效整合逐渐成为科技行业关注的重点。数据存储和处理需求的快速增长推动了对计算架构的重新设计,“存算一体化”技术应运而生。同时,随着物联网、5G网络、人工智能(AI)等技术的发展,数据量的分布性、实时性需求增加,边缘计算也逐渐从概念走向落地。本文将介绍存算一体化与边缘计算的核心思想及其发展趋势,探讨两者在智能计算模式中的应用前景。


从“冯·诺依曼架构”说起:传统计算模式的困境

冯·诺依曼

上世纪40年代,著名数学家冯·诺依曼提出了一个开创性的计算架构,被称为“冯·诺依曼架构”。它提出了计算机系统的五大基本组成部分:输入单元、输出单元、存储单元、控制单元和运算单元,并定义了它们之间的交互方式。冯·诺依曼架构的核心思想是将计算和存储分离,数据和指令通过统一的总线在中央处理单元(CPU)和内存之间传输。该架构的经典特征为存储程序概念,即程序和数据同样存储在内存中,由CPU读取并执行。

尽管结构简单、通用性强,适用于多种计算任务,但在今天,它的局限性越来越明显。
1. 数据传输瓶颈:在冯·诺依曼架构中,数据频繁在内存和CPU之间搬运。这一过程带来显著的延迟,系统难以高效处理数据,尤其在大数据和AI模型的应用场景中表现尤为突出。

2. 高能耗:频繁的数据传输不仅增加了电力消耗,还带来了硬件的发热和散热成本,在能源要求越来越高的计算任务中成为一大限制。

3. 资源利用率低:CPU和内存之间常常互相等待,尤其在密集计算任务中,导致系统资源的利用效率低下。

这种“冯·诺依曼瓶颈”直接制约了当今的人工智能、大数据分析等计算任务的发展。
存算一体化和边缘计算被视为解决这一瓶颈的有力方案。

存算一体化:突破冯·诺依曼瓶颈的创新

存算一体化(Processing-In-Memory,PIM)打破了“存储-计算分离”的模式,直接在存储单元内部集成计算单元,实现了数据的“就地处理”。这一创新从根本上优化了计算结构,带来了巨大的性能提升。
存算一体化的三大优势:

显著降低延迟:数据在存储器内直接处理,无需频繁搬运,大大减少了延迟。

降低能耗:减少数据搬运所需的电力消耗,延长设备续航,提高系统能效。

提升并行计算效率:特别适用于大规模并发计算任务,如深度学习和大数据分析。

根据计算单元与存储单元的距离,存算一体化主要分为三类:近存计算(PNM)、存内处理(PIM)和存内计算(CIM)。

1. 近存计算(PNM):近存计算是一种较为成熟的技术路径,采用先进的封装技术,将计算逻辑芯片和存储器封装在一起,缩短内存和处理单元之间的路径,以实现更高的I/O密度,带来高带宽和低访问开销。该方案主要依托2.5D、3D堆叠等技术,广泛应用于CPU和GPU等高性能处理器中,是实现存算一体化的首选方案之一。

2. 存内处理(PIM):存内处理旨在尽可能多地将计算过程嵌入到存储器内部,减少处理器对存储器的访问频率。通过在存储器中直接完成大部分计算任务,这一技术有效降低了数据搬运需求,有助于缓解冯·诺依曼瓶颈带来的限制。这种方案在内存密集型任务上具有显著的性能优势,被认为是未来智能计算的重要实现路径。

3. 存内计算(CIM):存内计算也称为国内一些公司推崇的“存算一体”。它通过对存储器结构进行改进,使其直接具备计算能力。存内计算有两种实现思路:

  • 电路革新:通过改动SRAM或MRAM等存储器,使其具备计算功能,这种方法能效比高,但计算精度可能受限。
  • 集成计算单元:在存储器(如DRAM)中集成额外计算单元,以支持高精度计算。然而,由于DRAM工艺对计算逻辑电路的适应性差,这一方式面临较大的工艺挑战。
不同公司在存算一体化领域有各自的技术策略。部分企业聚焦于优化存储与计算的协同效率,提升大数据处理的性能;另一些公司则注重架构的灵活性和可扩展性,以应对动态的市场需求。此外,存算一体化的存储介质也日趋多元,包括以SRAM、DRAM为代表的易失性存储器和以Flash为代表的非易失性存储器等。

边缘计算:让数据在源头处理的高效模式

边缘计算(Edge Computing)则是一种将数据处理资源部署在网络边缘的计算模式,使得数据可以直接在靠近源头的位置处理。与云计算相比,边缘计算能满足低延迟和实时响应的需求,尤其适用于自动驾驶、智能制造等场景。
边缘计算的三大优势:

低延迟:数据在靠近源头的位置处理,无需传输至云端,响应时间显著降低。

减轻网络负担:边缘计算设备完成初步数据处理,仅上传关键信息至云端,减少了网络流量压力。

提升数据隐私保护:在本地处理敏感数据,无需频繁上传至云端,有助于保护用户隐私。
边缘计算在智能家居、智能交通、工业自动化等领域已经取得了显著成果。随着物联网设备的普及,边缘计算需求将不断增加,并与云计算形成相辅相成的架构。

存算一体化与边缘计算的结合:智能计算的加速器

存算一体化和边缘计算的结合,正逐步催生出一套更加高效的智能计算模式。由于边缘设备往往体积小、功耗低、算力有限,难以承担复杂的计算任务,而存算一体化能显著增强边缘设备的处理能力,使其更加高效、低能耗。以下是存算一体化与边缘计算的结合应用:

· 物联网设备的数据处理

物联网设备大多部署在网络边缘位置,用于实时监测环境数据。采用存算一体化技术的边缘设备能够在本地完成数据处理,减少不必要的上传。例如,搭载存算一体化芯片的智能摄像头可以直接分析视频数据,仅传输关键事件至云端,大大降低网络流量。

· 边缘AI推理

边缘计算在AI推理中的应用越来越广泛,如自动驾驶、智能医疗等场景。边缘AI推理通常需要处理大量实时数据,而存算一体化技术能够提高推理速度。比如,自动驾驶车辆可以在摄像头数据中直接完成识别和决策,确保快速响应。

· 工业实时控制

在工业场景中,设备需实时监控和控制。例如机械臂的控制、工厂设备的状态监测等。存算一体化使边缘设备具备实时数据处理能力,保障系统的快速响应,提升了工厂的自动化和智能化水平。

· 数据隐私保护

边缘设备常处理敏感数据,直接上传至云端会带来隐私风险。存算一体化在本地完成数据处理,减少上传需求,有助于提升数据隐私性和安全性。


技术趋势与挑战

虽然存算一体化和边缘计算结合前景广阔,但在技术落地过程中仍面临挑战:
  1. 硬件研发复杂:存算一体化技术涉及复杂的芯片设计和制造,如何在存储芯片内部高效集成计算单元仍是关键难题。芯片的工艺和计算精度也需要进一步提升。

  2. 设备多样性与适配难题:边缘设备种类繁多、资源配置差异较大,如何提供通用的存算一体化解决方案是技术难点。未来需设计低成本、高通用性的存算一体化边缘芯片。

  3. 软件生态支持:存算一体化架构需要完整的软件支持,例如优化的编译器、计算框架和编程工具链,开发者需针对硬件架构优化算法和模型。

  4. 隐私和安全保障:边缘计算设备处理大量数据,如何保障数据加密和隐私安全也是技术发展的重点。

展望:智能计算的未来

随着存算一体化和边缘计算技术的成熟,智能计算将迎来低延迟、低能耗、高效率的新阶段。我们可以预见以下趋势:
  • 边缘AI应用普及:存算一体化和边缘计算的结合使得边缘AI计算变得高效,更多智能应用将在边缘设备上实现。

  • 智能终端设备的自主化:存算一体化提升了边缘设备的计算能力,减少对云端依赖,使设备更具自主性。

  • 低能耗的分布式计算模式:存算一体化减少数据传输能耗,边缘计算的分布式架构能降低云端负荷,使得网络资源更高效。

未来,存算一体化与边缘计算的融合将推动智能计算从集中化向分布式发展、从高能耗走向低能耗。它们将成为构建智能社会的重要基石,使我们身边的智能设备更高效、更安全,朝着真正的“万物互联”时代迈进。

END


欢迎加入Imagination GPU与人工智能交流2群

入群请加小编微信:eetrend77

(添加请备注公司名和职称)

推荐阅读

对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数
Imagination产品总监解读最新汽车DXS GPU IP

Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!

根据计算单元与存储单元的距离,存算一体化主要分为三类:近存计算(PNM)、存内处理(PIM)和存内计算(CIM)。
来源:边缘计算社区

随着数据量爆炸式增长和智能化应用的普及,计算与存储的高效整合逐渐成为科技行业关注的重点。数据存储和处理需求的快速增长推动了对计算架构的重新设计,“存算一体化”技术应运而生。同时,随着物联网、5G网络、人工智能(AI)等技术的发展,数据量的分布性、实时性需求增加,边缘计算也逐渐从概念走向落地。本文将介绍存算一体化与边缘计算的核心思想及其发展趋势,探讨两者在智能计算模式中的应用前景。


从“冯·诺依曼架构”说起:传统计算模式的困境

冯·诺依曼

上世纪40年代,著名数学家冯·诺依曼提出了一个开创性的计算架构,被称为“冯·诺依曼架构”。它提出了计算机系统的五大基本组成部分:输入单元、输出单元、存储单元、控制单元和运算单元,并定义了它们之间的交互方式。冯·诺依曼架构的核心思想是将计算和存储分离,数据和指令通过统一的总线在中央处理单元(CPU)和内存之间传输。该架构的经典特征为存储程序概念,即程序和数据同样存储在内存中,由CPU读取并执行。

尽管结构简单、通用性强,适用于多种计算任务,但在今天,它的局限性越来越明显。
1. 数据传输瓶颈:在冯·诺依曼架构中,数据频繁在内存和CPU之间搬运。这一过程带来显著的延迟,系统难以高效处理数据,尤其在大数据和AI模型的应用场景中表现尤为突出。

2. 高能耗:频繁的数据传输不仅增加了电力消耗,还带来了硬件的发热和散热成本,在能源要求越来越高的计算任务中成为一大限制。

3. 资源利用率低:CPU和内存之间常常互相等待,尤其在密集计算任务中,导致系统资源的利用效率低下。

这种“冯·诺依曼瓶颈”直接制约了当今的人工智能、大数据分析等计算任务的发展。
存算一体化和边缘计算被视为解决这一瓶颈的有力方案。

存算一体化:突破冯·诺依曼瓶颈的创新

存算一体化(Processing-In-Memory,PIM)打破了“存储-计算分离”的模式,直接在存储单元内部集成计算单元,实现了数据的“就地处理”。这一创新从根本上优化了计算结构,带来了巨大的性能提升。
存算一体化的三大优势:

显著降低延迟:数据在存储器内直接处理,无需频繁搬运,大大减少了延迟。

降低能耗:减少数据搬运所需的电力消耗,延长设备续航,提高系统能效。

提升并行计算效率:特别适用于大规模并发计算任务,如深度学习和大数据分析。

根据计算单元与存储单元的距离,存算一体化主要分为三类:近存计算(PNM)、存内处理(PIM)和存内计算(CIM)。

1. 近存计算(PNM):近存计算是一种较为成熟的技术路径,采用先进的封装技术,将计算逻辑芯片和存储器封装在一起,缩短内存和处理单元之间的路径,以实现更高的I/O密度,带来高带宽和低访问开销。该方案主要依托2.5D、3D堆叠等技术,广泛应用于CPU和GPU等高性能处理器中,是实现存算一体化的首选方案之一。

2. 存内处理(PIM):存内处理旨在尽可能多地将计算过程嵌入到存储器内部,减少处理器对存储器的访问频率。通过在存储器中直接完成大部分计算任务,这一技术有效降低了数据搬运需求,有助于缓解冯·诺依曼瓶颈带来的限制。这种方案在内存密集型任务上具有显著的性能优势,被认为是未来智能计算的重要实现路径。

3. 存内计算(CIM):存内计算也称为国内一些公司推崇的“存算一体”。它通过对存储器结构进行改进,使其直接具备计算能力。存内计算有两种实现思路:

  • 电路革新:通过改动SRAM或MRAM等存储器,使其具备计算功能,这种方法能效比高,但计算精度可能受限。
  • 集成计算单元:在存储器(如DRAM)中集成额外计算单元,以支持高精度计算。然而,由于DRAM工艺对计算逻辑电路的适应性差,这一方式面临较大的工艺挑战。
不同公司在存算一体化领域有各自的技术策略。部分企业聚焦于优化存储与计算的协同效率,提升大数据处理的性能;另一些公司则注重架构的灵活性和可扩展性,以应对动态的市场需求。此外,存算一体化的存储介质也日趋多元,包括以SRAM、DRAM为代表的易失性存储器和以Flash为代表的非易失性存储器等。

边缘计算:让数据在源头处理的高效模式

边缘计算(Edge Computing)则是一种将数据处理资源部署在网络边缘的计算模式,使得数据可以直接在靠近源头的位置处理。与云计算相比,边缘计算能满足低延迟和实时响应的需求,尤其适用于自动驾驶、智能制造等场景。
边缘计算的三大优势:

低延迟:数据在靠近源头的位置处理,无需传输至云端,响应时间显著降低。

减轻网络负担:边缘计算设备完成初步数据处理,仅上传关键信息至云端,减少了网络流量压力。

提升数据隐私保护:在本地处理敏感数据,无需频繁上传至云端,有助于保护用户隐私。
边缘计算在智能家居、智能交通、工业自动化等领域已经取得了显著成果。随着物联网设备的普及,边缘计算需求将不断增加,并与云计算形成相辅相成的架构。

存算一体化与边缘计算的结合:智能计算的加速器

存算一体化和边缘计算的结合,正逐步催生出一套更加高效的智能计算模式。由于边缘设备往往体积小、功耗低、算力有限,难以承担复杂的计算任务,而存算一体化能显著增强边缘设备的处理能力,使其更加高效、低能耗。以下是存算一体化与边缘计算的结合应用:

· 物联网设备的数据处理

物联网设备大多部署在网络边缘位置,用于实时监测环境数据。采用存算一体化技术的边缘设备能够在本地完成数据处理,减少不必要的上传。例如,搭载存算一体化芯片的智能摄像头可以直接分析视频数据,仅传输关键事件至云端,大大降低网络流量。

· 边缘AI推理

边缘计算在AI推理中的应用越来越广泛,如自动驾驶、智能医疗等场景。边缘AI推理通常需要处理大量实时数据,而存算一体化技术能够提高推理速度。比如,自动驾驶车辆可以在摄像头数据中直接完成识别和决策,确保快速响应。

· 工业实时控制

在工业场景中,设备需实时监控和控制。例如机械臂的控制、工厂设备的状态监测等。存算一体化使边缘设备具备实时数据处理能力,保障系统的快速响应,提升了工厂的自动化和智能化水平。

· 数据隐私保护

边缘设备常处理敏感数据,直接上传至云端会带来隐私风险。存算一体化在本地完成数据处理,减少上传需求,有助于提升数据隐私性和安全性。


技术趋势与挑战

虽然存算一体化和边缘计算结合前景广阔,但在技术落地过程中仍面临挑战:
  1. 硬件研发复杂:存算一体化技术涉及复杂的芯片设计和制造,如何在存储芯片内部高效集成计算单元仍是关键难题。芯片的工艺和计算精度也需要进一步提升。

  2. 设备多样性与适配难题:边缘设备种类繁多、资源配置差异较大,如何提供通用的存算一体化解决方案是技术难点。未来需设计低成本、高通用性的存算一体化边缘芯片。

  3. 软件生态支持:存算一体化架构需要完整的软件支持,例如优化的编译器、计算框架和编程工具链,开发者需针对硬件架构优化算法和模型。

  4. 隐私和安全保障:边缘计算设备处理大量数据,如何保障数据加密和隐私安全也是技术发展的重点。

展望:智能计算的未来

随着存算一体化和边缘计算技术的成熟,智能计算将迎来低延迟、低能耗、高效率的新阶段。我们可以预见以下趋势:
  • 边缘AI应用普及:存算一体化和边缘计算的结合使得边缘AI计算变得高效,更多智能应用将在边缘设备上实现。

  • 智能终端设备的自主化:存算一体化提升了边缘设备的计算能力,减少对云端依赖,使设备更具自主性。

  • 低能耗的分布式计算模式:存算一体化减少数据传输能耗,边缘计算的分布式架构能降低云端负荷,使得网络资源更高效。

未来,存算一体化与边缘计算的融合将推动智能计算从集中化向分布式发展、从高能耗走向低能耗。它们将成为构建智能社会的重要基石,使我们身边的智能设备更高效、更安全,朝着真正的“万物互联”时代迈进。

END


欢迎加入Imagination GPU与人工智能交流2群

入群请加小编微信:eetrend77

(添加请备注公司名和职称)

推荐阅读

对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数
Imagination产品总监解读最新汽车DXS GPU IP

Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!

展开
打开“财经头条”阅读更多精彩资讯
APP内打开