今年11月初,炬芯科技正式发布了第一代基于模数混合电路实现的SRAM based CIM(Mixed-mode SRAM based CIM,简称MMSCIM)端侧AI音频芯片,引发了市场的关注。
近日,炬芯科技在珠海总部召开媒体沟通会,炬芯科技董事长兼CEO周正宇介绍了公司发展现状及产品布局的同时,也详细解析了最新的MMSCIM端侧AI音频芯片。
到国际市场上去替代:拿下三大顶级音响品牌
炬芯源于2001年成立的炬力集成电路设计有限公司(以下简称“炬力”),期间经历了炬力登陆纳斯达克,随后又从纳斯达克私有化退市,再到成立炬芯,2021年成功登陆科创板,发展至今已有了20多年的时间。
炬芯成立以来一直聚焦于低功耗无线音频芯片领域(相关产品在其营收当中占比约70%,此外也有便携式音视频SoC芯片和端侧AI处理器),凭借超过350人的团队,200多的研发人员,20多年的技术沉淀和积累,多元化的产品布局,成功覆盖了蓝牙音箱、TWS/OWS耳机、智能手表、录音笔、语音遥控器、无线麦克风、无线电竞耳机、无线家庭影院、AR眼镜等众多市场。
截至目前,炬芯已经拥有了超过300项全球专利,以及超过100家品牌客户,其中除了华为、OPPO、小米、荣耀、传音、realme、TCL、海信等国产智能手机/智能硬件/家电品牌客户,还有罗德、猛玛、DJI等专业的麦克风品牌厂商,更为关键的是,炬芯还拿下了国际一线音响品牌哈曼、索尼、BOSE。
“近年来,国内国产替代比较热,炬芯也确实受益于国产替代,我们在国内也成为了很多国产品牌替代高通、NXP、AKM的选择。但是,我想要强调的是,炬芯是一家具备全球视野的专业音频芯片品牌厂商。”周正宇面带微笑地指出:“我们是以国际的芯片品牌(例如高通、联发科)为主要目标,在国际市场上去进行替代,并且近两年也成功拿到了哈曼、索尼、BOSE这三大国际一线品牌客户的订单。”
对于炬芯为何能够拿下这些顶级品牌和头部品牌,周正宇给出的三大关键要素是:高品质、供应链安全和专利合规。
第一,一线品牌厂商对于产品的品质的要求非常高,所以需要提供的高品质的音频芯片,核心就是高音质、低延时、低功耗、低故障率。而炬芯在低功耗无线音频芯片方面有着20多年的技术沉淀和经验积累。
第二,一线品牌厂商对于供应链安全非常注重,需要有稳妥的供应保障,比如多个供应来源,产品长生命周期。
第三,一线品牌厂商在技术专利合规方面也很看重,芯片供应商需要在技术和专利上干净、没有漏洞,各方面都要合规,让品牌客户用的放心。
凭借20多年在音频领域的技术积累以及海内外上市的经验,炬芯在产品品质、供应链和专利合规方面早已经具备了与一线品牌客户匹配的能力。
比如在音质方面,一方面是需要把信号链做得足够好,另一方面则是要基于对声学心理学的理解,开发出各种优秀的音效算法。
周正宇告诉芯智讯:“我们内置的在SoC里的ADC/DAC的信噪比和底噪,已经可以做到跟外置的ADC/DAC的信噪比和底噪差不多,可以对标高通和德州仪器的同类产品。可以说,我们把整个的信号链全都整合进了SoC,并且达到分立器件才能实现的信号链的干净程度、线性度、底噪以及SNR,这个是必要条件。同时,我们基于过去多年的对于主观声学的理解,也开发出了一系列音效算法,简单来说就是把声音以符合用户喜好的效果呈现出来。当然,我们也支持客户的自有音效算法,帮助他们更好的呈现出来。这就是前一个必要条件(得到干净的电信号)基础上需要继续达成的充分条件。”
值得一提的是,在会议期间,周正宇还提及了一则趣事:国外知名的运动相机品牌厂商GoPro在通过拆解竞争对手大疆的产品后,发现其采用的是炬芯的无线音频芯片,然后通过炬芯官方渠道才找到了炬芯,随后双方才达成了合作。
“GoPro的高管曾提过,他们在这之前从来没有考虑过用中国芯片。但是当大疆提供的产品表现比他们更好的时候,他们才发现大疆原来用的中国芯片是这么高品质,采用的炬芯的芯片。这个例子就很好的全世界证明了我们中国芯片的品质和能力,也是可以到国际上去替代的,并不是只能在国内以价格来替代。”周正宇非常自豪的说道。
当然这个例子也反应了炬芯在品牌营销上的欠缺。对此,为了进一步提升国际影响力,近两年炬芯还在上海、韩国组建了专门面对国际市场的营销团队,助力炬芯对于海外市场以及海外品牌客户的开拓。周正宇向芯智讯透露,炬芯今年业绩的快速增长与此也有非常大的关系。
根据财报显示,今年前三季度炬芯业绩创历史新高,实现营收4.67亿元,同比增长24.05%;归母净利润7091.3万元,同比增长51.12%。其中,第三季度实现营收1.86亿元,同比增长18.66%;归母净利润达到2997.26万元,同比增长34.87%。
开拓低延迟私有协议音频市场
对于炬芯传统聚焦的便携式无线音频设备来说,因为主要是电池供电设备,所以低功耗非常重要,对于音质的要求近年来也有持续提高,但对于低延迟却并不严苛。
虽然相对于智能手机、蓝牙音箱、TWS耳机等产品的庞大出货量来说,对于低延迟要求更高的音频设备市场看似规模不大,但是依然是一个不容忽视的高价值市场。
比如在插电的电视周边、家庭影院市场,随着对于音响的要求从杜比升级到杜比全景声(Dolby Atmos),对于音频传输的时延要求非常高。如果时延高,可能就会出现声音与画面不同步的问题(本来应该是听到来自后方的声音,但是因为延迟过大,画面进入到出现另一个方位的音源,后方声音才被听到)。
在周正宇看来,电视周边、家庭影院市场将是炬芯未来增长的一个重要方向。“假设智能手表/手环一年出货2亿只,每个里面也只有一颗音频芯片,所以一年就是2亿颗音频芯片;假设TWS耳机一年出货也是2亿副,一副耳机需要两颗芯片,所以一年就是4亿颗音频芯片。而电视周边、家庭影院市场的音响系统假设一年出货2000万套,但是它并不是只需要一颗音频芯片,因为它是一个声道需要一颗芯片,如果是杜比全景声就是五个声道,就是需要五颗音频芯片,这里可能就是1亿颗音频芯片的需求,所以这个市场看似很小,其实并不小,而且价值量更高。”
据了解,目前国内的海信、TCL等电视品牌厂商都在用炬芯的无线音频芯片在做无线环绕音响的无线传输。
再比如像无线麦克风、无线电竞耳机、无线话务耳机、多链接高清会议系统等需要音视频同步或有互动需求的音频产品,对于低延迟要求都是非常的高,需要声音能够做到几乎实时的同步。
那么对于音频传输来说,怎么才能做到极低的延迟呢?最好是采用大带宽的传输技术,比如用WiFi、5G等技术,这样无需对音频进行压缩,可以直接进行传输,时延就会非常低。目前炬芯也在研究基于私有协议的UWB(超带宽)无线音频传输技术。
而对于应用最广的蓝牙音频技术来说,其带宽是比较有限的,在标准的蓝牙传输协议下,通常延迟最低也有50-100ms,想要把延时做低,就需要采用私有协议,降低压缩和解压缩的延时,这就需要缩短“包长”。比如一个数据封包是10ms,一发一收就是要20ms。同时,还需要低延迟的音频编解码技术,比如采用最新的LC3和其增强版本LC3 Plus技术等。
对于炬芯来说,主要是从三个方面去解决:一是优化硬件通路,降低ADC-DAC信号链路的延迟,直接封到SoC当中;二是优化传输协议,缩短信号的包长,目前炬芯已经做到了1.25ms的包长;三是在支持LC3/LC3 Plus等低延迟的音频编解码技术的同时,炬芯也有自己私有编解码技术,可以将延时做得更低。
周正宇坦言:“现在传统的便携式无线音频市场竞争已经是非常的激烈,可以说是一片红海。炬芯也不太愿意去毛利过低的市场去厮杀,所以凭借自身的技术优势,近几年一直有持续在对于低时延要求更高的私有协议音频设备市场进行开拓,并且取得了不错的成绩。”
据了解,目前炬芯在领夹式麦克风市场已经拿到了很大的市场份额,比如罗德、猛犸、大疆等市占率较高的品牌都是炬芯的客户。
存算一体,发力AI音频市场
随着生成式AI技术的快速发展,以及终端设备性能的持续提升,AI计算也开始由云端进入终端侧。相对于依赖于云的AI来说,边缘侧AI有着不依赖于网络(离线也能工作)、反馈更实时(延时更低)、隐私安全(不需要将数据传输到云端)等方面的优势。虽然,云端的AI也有着模型更大,算力更强,更智能的优势。不过,现在也涌现出了很多符合边缘侧需求的更专业化的AI小模型。
炬芯认为,未来AI的发展趋势将会走向混合AI架构,即在云端和边缘端之间分配并协调AI工作负责。比如现在很多的AI PC、AI手机、AI眼镜等也是基于这种混合AI架构。
由于炬芯过去一直专注于低功耗无线音频市场,因此炬芯主要关注的是对于AI算力要求并不高的由电池供电的中小型模型端侧AI市场。具体来说,主要覆盖算力要求在0.01-3TOPS之间,存储空间小于10MB,模型参数大小在0.01-10MB之间,功耗小于10mW的目标市场。
但是现有的端侧AI解决方案存在着很多的挑战。比如CPU+DSP的解决方案,算力低、性能弱,能效比也比较差;而基于CPU+NPU的解决方案,难以适应新模型的涌现,也没有升级的弹性。
对此,炬芯选择了全新一代基于模数混合SRAM存内计算解决方案,由于无需再像传统的冯诺依曼架构那样,需要不停在CPU和外部DRAM/FLASH之间不停地搬运数据。根据英特尔的一份数据显示,处理器的功耗,大约67%都是消耗在了数据搬运过程中,只有30%多是实际消耗在了计算上。
因此,SRAM存内计算解决方案可以实现在更低的功耗下发挥出更高的端侧AI性能,即大幅提升端侧AI的能效表现。据介绍,目前炬芯的SRAM存内计算方案已经能够实现10TOPS/W的高能效表现,即在1TOPS是算力下,功耗仅100mW。未来炬芯希望继续朝着100TOPS/W的能效表现迈进。此外,由于无需进行数据搬运,SRAM存内计算也可以带来更低的延时表现。
周正宇坦言,虽然SARM成本更高,面积更大,但是技术却是目前最为成熟的,性能表现也非常不错。相比之下,虽然ReRAM、FRAM等技术很美好,但还都不够成熟。
炬芯最新发布三款基于MMSCIM的端侧AI音频芯片:包括主要面向低延迟私有无线音频领域的ATS323X系列;面向蓝牙AI音频领域的ATS286X系列;面向AI DSP领域的ATS362X。
三个系列芯片均基于22nm制程,采用了Arm CPU+ HiFi5 DSP + NPU(MMSCIM)三核异构的设计架构。炬芯的研发人员将MMSCIM和先进的HiFi5 DSP融合设计形成了炬芯科技“Actions Intelligence NPU(AI-NPU)”架构,并通过协同计算,形成一个既高弹性又高能效比的NPU架构。在这种AI-NPU架构中MMSCIM支持基础性通用AI算子,提供低功耗大算力。同时,由于AI新模型新算子的不断涌现,MMSCIM没覆盖的新兴特殊算子则由HiFi5 DSP来予以补充。
据介绍,单个MMSCIM核心算力为100GOPS@500MHz,能效高达6.4TOS/W@INT8,具备低功耗大算力、极致的能效比的特性。在同等条件下,相较于DSP HiFi5,实际应用算力和能效比分别可提升约16倍和60倍,功耗可降低90%以上。
而通过MMSCIM和HiFi5 DSP的协同设计,NPU支持基础性通用AI算子,DSP予以特殊算子的补充,形成一个既高弹性又高能效比的AI NPU融合架构,使得芯片在算力和能效方面实现显著突破。
同时,芯片支持TensorFlow、Caffe、TFLite、PyTorch和ONNX等主流深度学习框架,并支持目前所有主流的AI模型,可为各类终端产品提供强大的算力支撑,便于品牌客户进行个性化AI算法开发及AI应用的植入。
此外,炬芯还推出了自己的开发工具链,客户只要按照标准的Tensorflow、 Tensorlight 这类模型来设计自己算法,然后导入炬芯的开发工具,它就能够自动选择最适合的DSP或者NPU来进行处理,不需要人为的去分配,极大了简化了开发的效率。
ATS323X系列作为炬芯科技第一代搭载AI-NPU的三核异构SoC芯片,同时也是炬芯科技第三代高音质低延迟无线收发音频芯片,该芯片系列可广泛应用于无线麦克风、无线电竞耳机、无线话务耳机、多链接高清会议系统以及无线收发一体器等多种产品中,将为此类产品实现AI赋能,助力终端品牌产品迈进AI新时代。
据介绍,目前该芯片方案正与品牌客户协同开发中,明年上半年将在终端品牌产品中落地应用,可以为用户带来特别的AI产品体验。
根据炬芯公布的路线图显示,其将于2025年推出的第二代基于MMSCIM的端侧AI音频芯片,虽然还是22nm制程,算力会提升到单核300GOPS,但是会加入对于Transformer模型的支持,AI能效将提升至7.8TOPS/W@INT8;2026年推出的第三代基于MMSCIM的端侧AI音频芯片将升级至12nm制程,单核算力提升至1TOPS,同样支持Transformer模型,AI能效将进一步提升至15.6TOPS/W@INT8。
小结:
从上面的介绍我们可以看到,炬芯目前业绩的增长主要来源于三个方面:第一个是与国际一线品牌的合作;第二个是来自低延迟、高音质需求的私有协议音频设备市场;第三是来自端侧AI音频设备。
“国际一线品牌突破、私有协议音频市场的增长和端侧AI音频市场增长是驱动炬芯业绩增长的三个主要动力。其中,端侧AI音频领域将是炬芯发力的重点。从去年开始,我们来自AI芯片的收入基本呈现每年一倍的增长速度,我相信2025年还将继续保持较高的增长。”周正宇总结说道。
编辑:芯智讯-浪客剑
行业交流、合作请加微信:icsmart01
芯智讯官方交流群:221807116
今年11月初,炬芯科技正式发布了第一代基于模数混合电路实现的SRAM based CIM(Mixed-mode SRAM based CIM,简称MMSCIM)端侧AI音频芯片,引发了市场的关注。
近日,炬芯科技在珠海总部召开媒体沟通会,炬芯科技董事长兼CEO周正宇介绍了公司发展现状及产品布局的同时,也详细解析了最新的MMSCIM端侧AI音频芯片。
到国际市场上去替代:拿下三大顶级音响品牌
炬芯源于2001年成立的炬力集成电路设计有限公司(以下简称“炬力”),期间经历了炬力登陆纳斯达克,随后又从纳斯达克私有化退市,再到成立炬芯,2021年成功登陆科创板,发展至今已有了20多年的时间。
炬芯成立以来一直聚焦于低功耗无线音频芯片领域(相关产品在其营收当中占比约70%,此外也有便携式音视频SoC芯片和端侧AI处理器),凭借超过350人的团队,200多的研发人员,20多年的技术沉淀和积累,多元化的产品布局,成功覆盖了蓝牙音箱、TWS/OWS耳机、智能手表、录音笔、语音遥控器、无线麦克风、无线电竞耳机、无线家庭影院、AR眼镜等众多市场。
截至目前,炬芯已经拥有了超过300项全球专利,以及超过100家品牌客户,其中除了华为、OPPO、小米、荣耀、传音、realme、TCL、海信等国产智能手机/智能硬件/家电品牌客户,还有罗德、猛玛、DJI等专业的麦克风品牌厂商,更为关键的是,炬芯还拿下了国际一线音响品牌哈曼、索尼、BOSE。
“近年来,国内国产替代比较热,炬芯也确实受益于国产替代,我们在国内也成为了很多国产品牌替代高通、NXP、AKM的选择。但是,我想要强调的是,炬芯是一家具备全球视野的专业音频芯片品牌厂商。”周正宇面带微笑地指出:“我们是以国际的芯片品牌(例如高通、联发科)为主要目标,在国际市场上去进行替代,并且近两年也成功拿到了哈曼、索尼、BOSE这三大国际一线品牌客户的订单。”
对于炬芯为何能够拿下这些顶级品牌和头部品牌,周正宇给出的三大关键要素是:高品质、供应链安全和专利合规。
第一,一线品牌厂商对于产品的品质的要求非常高,所以需要提供的高品质的音频芯片,核心就是高音质、低延时、低功耗、低故障率。而炬芯在低功耗无线音频芯片方面有着20多年的技术沉淀和经验积累。
第二,一线品牌厂商对于供应链安全非常注重,需要有稳妥的供应保障,比如多个供应来源,产品长生命周期。
第三,一线品牌厂商在技术专利合规方面也很看重,芯片供应商需要在技术和专利上干净、没有漏洞,各方面都要合规,让品牌客户用的放心。
凭借20多年在音频领域的技术积累以及海内外上市的经验,炬芯在产品品质、供应链和专利合规方面早已经具备了与一线品牌客户匹配的能力。
比如在音质方面,一方面是需要把信号链做得足够好,另一方面则是要基于对声学心理学的理解,开发出各种优秀的音效算法。
周正宇告诉芯智讯:“我们内置的在SoC里的ADC/DAC的信噪比和底噪,已经可以做到跟外置的ADC/DAC的信噪比和底噪差不多,可以对标高通和德州仪器的同类产品。可以说,我们把整个的信号链全都整合进了SoC,并且达到分立器件才能实现的信号链的干净程度、线性度、底噪以及SNR,这个是必要条件。同时,我们基于过去多年的对于主观声学的理解,也开发出了一系列音效算法,简单来说就是把声音以符合用户喜好的效果呈现出来。当然,我们也支持客户的自有音效算法,帮助他们更好的呈现出来。这就是前一个必要条件(得到干净的电信号)基础上需要继续达成的充分条件。”
值得一提的是,在会议期间,周正宇还提及了一则趣事:国外知名的运动相机品牌厂商GoPro在通过拆解竞争对手大疆的产品后,发现其采用的是炬芯的无线音频芯片,然后通过炬芯官方渠道才找到了炬芯,随后双方才达成了合作。
“GoPro的高管曾提过,他们在这之前从来没有考虑过用中国芯片。但是当大疆提供的产品表现比他们更好的时候,他们才发现大疆原来用的中国芯片是这么高品质,采用的炬芯的芯片。这个例子就很好的全世界证明了我们中国芯片的品质和能力,也是可以到国际上去替代的,并不是只能在国内以价格来替代。”周正宇非常自豪的说道。
当然这个例子也反应了炬芯在品牌营销上的欠缺。对此,为了进一步提升国际影响力,近两年炬芯还在上海、韩国组建了专门面对国际市场的营销团队,助力炬芯对于海外市场以及海外品牌客户的开拓。周正宇向芯智讯透露,炬芯今年业绩的快速增长与此也有非常大的关系。
根据财报显示,今年前三季度炬芯业绩创历史新高,实现营收4.67亿元,同比增长24.05%;归母净利润7091.3万元,同比增长51.12%。其中,第三季度实现营收1.86亿元,同比增长18.66%;归母净利润达到2997.26万元,同比增长34.87%。
开拓低延迟私有协议音频市场
对于炬芯传统聚焦的便携式无线音频设备来说,因为主要是电池供电设备,所以低功耗非常重要,对于音质的要求近年来也有持续提高,但对于低延迟却并不严苛。
虽然相对于智能手机、蓝牙音箱、TWS耳机等产品的庞大出货量来说,对于低延迟要求更高的音频设备市场看似规模不大,但是依然是一个不容忽视的高价值市场。
比如在插电的电视周边、家庭影院市场,随着对于音响的要求从杜比升级到杜比全景声(Dolby Atmos),对于音频传输的时延要求非常高。如果时延高,可能就会出现声音与画面不同步的问题(本来应该是听到来自后方的声音,但是因为延迟过大,画面进入到出现另一个方位的音源,后方声音才被听到)。
在周正宇看来,电视周边、家庭影院市场将是炬芯未来增长的一个重要方向。“假设智能手表/手环一年出货2亿只,每个里面也只有一颗音频芯片,所以一年就是2亿颗音频芯片;假设TWS耳机一年出货也是2亿副,一副耳机需要两颗芯片,所以一年就是4亿颗音频芯片。而电视周边、家庭影院市场的音响系统假设一年出货2000万套,但是它并不是只需要一颗音频芯片,因为它是一个声道需要一颗芯片,如果是杜比全景声就是五个声道,就是需要五颗音频芯片,这里可能就是1亿颗音频芯片的需求,所以这个市场看似很小,其实并不小,而且价值量更高。”
据了解,目前国内的海信、TCL等电视品牌厂商都在用炬芯的无线音频芯片在做无线环绕音响的无线传输。
再比如像无线麦克风、无线电竞耳机、无线话务耳机、多链接高清会议系统等需要音视频同步或有互动需求的音频产品,对于低延迟要求都是非常的高,需要声音能够做到几乎实时的同步。
那么对于音频传输来说,怎么才能做到极低的延迟呢?最好是采用大带宽的传输技术,比如用WiFi、5G等技术,这样无需对音频进行压缩,可以直接进行传输,时延就会非常低。目前炬芯也在研究基于私有协议的UWB(超带宽)无线音频传输技术。
而对于应用最广的蓝牙音频技术来说,其带宽是比较有限的,在标准的蓝牙传输协议下,通常延迟最低也有50-100ms,想要把延时做低,就需要采用私有协议,降低压缩和解压缩的延时,这就需要缩短“包长”。比如一个数据封包是10ms,一发一收就是要20ms。同时,还需要低延迟的音频编解码技术,比如采用最新的LC3和其增强版本LC3 Plus技术等。
对于炬芯来说,主要是从三个方面去解决:一是优化硬件通路,降低ADC-DAC信号链路的延迟,直接封到SoC当中;二是优化传输协议,缩短信号的包长,目前炬芯已经做到了1.25ms的包长;三是在支持LC3/LC3 Plus等低延迟的音频编解码技术的同时,炬芯也有自己私有编解码技术,可以将延时做得更低。
周正宇坦言:“现在传统的便携式无线音频市场竞争已经是非常的激烈,可以说是一片红海。炬芯也不太愿意去毛利过低的市场去厮杀,所以凭借自身的技术优势,近几年一直有持续在对于低时延要求更高的私有协议音频设备市场进行开拓,并且取得了不错的成绩。”
据了解,目前炬芯在领夹式麦克风市场已经拿到了很大的市场份额,比如罗德、猛犸、大疆等市占率较高的品牌都是炬芯的客户。
存算一体,发力AI音频市场
随着生成式AI技术的快速发展,以及终端设备性能的持续提升,AI计算也开始由云端进入终端侧。相对于依赖于云的AI来说,边缘侧AI有着不依赖于网络(离线也能工作)、反馈更实时(延时更低)、隐私安全(不需要将数据传输到云端)等方面的优势。虽然,云端的AI也有着模型更大,算力更强,更智能的优势。不过,现在也涌现出了很多符合边缘侧需求的更专业化的AI小模型。
炬芯认为,未来AI的发展趋势将会走向混合AI架构,即在云端和边缘端之间分配并协调AI工作负责。比如现在很多的AI PC、AI手机、AI眼镜等也是基于这种混合AI架构。
由于炬芯过去一直专注于低功耗无线音频市场,因此炬芯主要关注的是对于AI算力要求并不高的由电池供电的中小型模型端侧AI市场。具体来说,主要覆盖算力要求在0.01-3TOPS之间,存储空间小于10MB,模型参数大小在0.01-10MB之间,功耗小于10mW的目标市场。
但是现有的端侧AI解决方案存在着很多的挑战。比如CPU+DSP的解决方案,算力低、性能弱,能效比也比较差;而基于CPU+NPU的解决方案,难以适应新模型的涌现,也没有升级的弹性。
对此,炬芯选择了全新一代基于模数混合SRAM存内计算解决方案,由于无需再像传统的冯诺依曼架构那样,需要不停在CPU和外部DRAM/FLASH之间不停地搬运数据。根据英特尔的一份数据显示,处理器的功耗,大约67%都是消耗在了数据搬运过程中,只有30%多是实际消耗在了计算上。
因此,SRAM存内计算解决方案可以实现在更低的功耗下发挥出更高的端侧AI性能,即大幅提升端侧AI的能效表现。据介绍,目前炬芯的SRAM存内计算方案已经能够实现10TOPS/W的高能效表现,即在1TOPS是算力下,功耗仅100mW。未来炬芯希望继续朝着100TOPS/W的能效表现迈进。此外,由于无需进行数据搬运,SRAM存内计算也可以带来更低的延时表现。
周正宇坦言,虽然SARM成本更高,面积更大,但是技术却是目前最为成熟的,性能表现也非常不错。相比之下,虽然ReRAM、FRAM等技术很美好,但还都不够成熟。
炬芯最新发布三款基于MMSCIM的端侧AI音频芯片:包括主要面向低延迟私有无线音频领域的ATS323X系列;面向蓝牙AI音频领域的ATS286X系列;面向AI DSP领域的ATS362X。
三个系列芯片均基于22nm制程,采用了Arm CPU+ HiFi5 DSP + NPU(MMSCIM)三核异构的设计架构。炬芯的研发人员将MMSCIM和先进的HiFi5 DSP融合设计形成了炬芯科技“Actions Intelligence NPU(AI-NPU)”架构,并通过协同计算,形成一个既高弹性又高能效比的NPU架构。在这种AI-NPU架构中MMSCIM支持基础性通用AI算子,提供低功耗大算力。同时,由于AI新模型新算子的不断涌现,MMSCIM没覆盖的新兴特殊算子则由HiFi5 DSP来予以补充。
据介绍,单个MMSCIM核心算力为100GOPS@500MHz,能效高达6.4TOS/W@INT8,具备低功耗大算力、极致的能效比的特性。在同等条件下,相较于DSP HiFi5,实际应用算力和能效比分别可提升约16倍和60倍,功耗可降低90%以上。
而通过MMSCIM和HiFi5 DSP的协同设计,NPU支持基础性通用AI算子,DSP予以特殊算子的补充,形成一个既高弹性又高能效比的AI NPU融合架构,使得芯片在算力和能效方面实现显著突破。
同时,芯片支持TensorFlow、Caffe、TFLite、PyTorch和ONNX等主流深度学习框架,并支持目前所有主流的AI模型,可为各类终端产品提供强大的算力支撑,便于品牌客户进行个性化AI算法开发及AI应用的植入。
此外,炬芯还推出了自己的开发工具链,客户只要按照标准的Tensorflow、 Tensorlight 这类模型来设计自己算法,然后导入炬芯的开发工具,它就能够自动选择最适合的DSP或者NPU来进行处理,不需要人为的去分配,极大了简化了开发的效率。
ATS323X系列作为炬芯科技第一代搭载AI-NPU的三核异构SoC芯片,同时也是炬芯科技第三代高音质低延迟无线收发音频芯片,该芯片系列可广泛应用于无线麦克风、无线电竞耳机、无线话务耳机、多链接高清会议系统以及无线收发一体器等多种产品中,将为此类产品实现AI赋能,助力终端品牌产品迈进AI新时代。
据介绍,目前该芯片方案正与品牌客户协同开发中,明年上半年将在终端品牌产品中落地应用,可以为用户带来特别的AI产品体验。
根据炬芯公布的路线图显示,其将于2025年推出的第二代基于MMSCIM的端侧AI音频芯片,虽然还是22nm制程,算力会提升到单核300GOPS,但是会加入对于Transformer模型的支持,AI能效将提升至7.8TOPS/W@INT8;2026年推出的第三代基于MMSCIM的端侧AI音频芯片将升级至12nm制程,单核算力提升至1TOPS,同样支持Transformer模型,AI能效将进一步提升至15.6TOPS/W@INT8。
小结:
从上面的介绍我们可以看到,炬芯目前业绩的增长主要来源于三个方面:第一个是与国际一线品牌的合作;第二个是来自低延迟、高音质需求的私有协议音频设备市场;第三是来自端侧AI音频设备。
“国际一线品牌突破、私有协议音频市场的增长和端侧AI音频市场增长是驱动炬芯业绩增长的三个主要动力。其中,端侧AI音频领域将是炬芯发力的重点。从去年开始,我们来自AI芯片的收入基本呈现每年一倍的增长速度,我相信2025年还将继续保持较高的增长。”周正宇总结说道。
编辑:芯智讯-浪客剑
行业交流、合作请加微信:icsmart01
芯智讯官方交流群:221807116