下一代Armv8.1-M架构:为最小型嵌入式设备提供强化的机器学习和信号处理能力

新闻摘要:
·Arm Helium技术作为一种全新的M-Profile VectorExtension矢量扩充方案,能为Armv8.1-M架构带来经过强化的计算能力
·新架构能够将最小型边缘设备的机器学习能力提升15倍,以及将信号处理性能提升5倍
·新架构针对下一代Cortex-M处理器而设计,适用于需在本地进行决策的小型嵌入式设备
Arm宣布针对其下一代Armv8.1-M架构推出基于M-Profile Vector Extension(MVE)矢量扩充方案的ArmHelium技术 。这一全新技术能够帮助开发者简化软件开发流程,并显著提升未来Cortex-M系列处理器的机器学习能力与信号处理性能 。
业界正在加速推动创建一个拥有万亿互联设备的世界,而要实现这一愿景,我们必须找到行之有效的方法来扩展网络边缘众多受限设备的计算能力 。通过提升这些设备的计算能力,开发人员能够直接为设备编写机器学习(ML)应用程序,并在设备本地实现自主决策,从而在提高数据安全性的同时,降低网络能耗、延迟和带宽使用量 。
为达成这一目标,Arm推出Arm Helium技术,该技术针对Arm Cortex-M系列处理器设计,在ArmTrustZone的安全基础上,通过M-Profile VectorExtension矢量扩展加强Armv8.1-M架构的计算性能 。Helium将为未来的ArmCortex-M系列处理器提供高达15倍的机器学习性能提升和高达5倍的信号处理性能提升,消除因性能挑战造成的对低成本、高能效设备的使用限制,从而为我们的合作伙伴带来全新的市场机遇 。
下一级计算性能
先进的数字信号处理(DSP)可通过 Arm Neon技术扩展至更多Cortex-A架构组件中 。针对功能受限的应用,Arm还在其较高性能的Cortex-M处理器系列(包括Cortex-M4、Cortex-M7、Cortex-M33以及Cortex-M35P)中加入DSP扩展方案 。这两种技术都可用来加速特定应用的机器学习计算 。
针对功能最为受限的嵌入式系统,功耗效率是优先考虑的因素,以往的解决方案将Cortex处理器搭配SoC芯片内的DSP处理器,但是这种作法也增加了硬件与软件设计的复杂性 。当我们希望在这些设备上集成更多机器学习功能时,现有的SoC开发挑战将变得更加突出,因此在运用不同的工具链、编程、调试以及使用各种复杂的专有安全解决方案时,需要开发人员拥有更高水平的专业知识 。
搭载Helium技术的Armv8.1-M架构能克服上述难题,不仅能够提供实时控制程序代码、机器学习与DSP执行能力,而且效率丝毫不减 。由此,数百万软件开发人员将能够运行各种DSP功能,安全无虞地扩展各种智能程序到种类更广泛的设备,强化对三种关键类别新兴应用的信号处理支持:震动和运动、语音和声音、以及视觉和图像 。新一代搭载了Helium技术的Cortex-M架构SoC将改进未来各种设备的用户体验,包括传感器中枢设备(sensorhub)、可穿戴设备、音频设备、工业应用等 。
除提升性能、降低开发成本之外,SoC设计和开发团队还将立即获得以下优势,包括:
•通过功能整合,优化成本、功耗以及设计投入
•利用 Armv8.1-M的设计遵循平台安全架构(PSA)规范的特点,实现简化的TrustZone部署
•单一工具链涵盖控制与信号处理软件的开发
•简化的软件开发,得益于成熟的 Helium生态系统所提供的完善的工具、模型和库,其中许多资源已被Cortex-M开发者广为使用
简化软件开发流程
由于Helium拥有统一的工具链、库和模型,软件开发将变得更加简单 。Helium工具链包括Arm Development Studio,涵盖ArmKeilMDK、Arm模型(开发人员可立即使用,用于代码建模)和各种软件库,包括CMSIS-DSP和CMSIS-NN,允许开发人员根据他们的需求选择最合适的资源 。对于信号处理应用,我们通过消除对专用DSP或功能加速器的需求以及免去了一层设计复杂性,使之更加简化 。
驱动下一代嵌入式和物联网设备
Helium将Arm ProjectTrillium计划的价值带到各种机器学习应用中,让框架与库的支持能力向下延伸到硬件层面 。由于SoC开发者必须在不同的性能、芯片面积、功耗以及成本等限制下开发适合的方案,因此没有单一的产品能满足所有应用的需求 。
【下一代Armv8.1-M架构:为最小型嵌入式设备提供强化的机器学习和信号处理能力】我们现已推出Helium专属的工具链与模型,预计在未来2年各伙伴厂商将陆续推出采用Helium技术的芯片 。

    推荐阅读