ARM发布“全面计算”AR/VR SoC解决方案

2020-04-14
关注
摘要 为了满足相互冲突的高性能和效率要求,SoC设计方法需要全面转变。ARM计划通过所谓的“Total Compute(全面计算)”来实现这一目标。不再局限于优化单个IP,而是从系统级解决方案角度来看待整个SoC。

  今天的移动设备是无数用例和应用的枢纽中心。例如,现代智能手机不仅可以打电话、发信息、发邮件、玩游戏和录制视频,而且能够充当个人助理,并允许你用声音与其进行交互。它甚至可以与家居、办公室、学校或零售环境周围的其他联网设备进行接口。显然,我们现在正生活在一个通过移动设备实现数字沉浸的世界里。

  未来,设备的新用例和新体验只会进一步扩展。我们正在设计更多的智能设备,提供更丰富、更快速、更沉浸和更便捷的体验,并且完全围绕着终端用户进行定制。然而,这种数字沉浸感的进步将同时带来更复杂和更高要求的多域计算工作负载。尤其是对于全新的的XR、游戏和AI体验而言。这对ARM产生了两个挑战。首先,未来的ARM IP将需要为所述的计算密集型工作负载提供高性能;其次,团队需要将这种高性能打包在低功耗封装之中。

  为了满足相互冲突的高性能和效率要求,SoC设计方法需要全面转变。ARM计划通过所谓的“Total Compute(全面计算)”来实现这一目标。不再局限于优化单个IP,而是从系统级解决方案角度来看待整个SoC。团队将专注于下一代设备的用例和体验,确保整个系统无缝地协同工作,从而提供最大的性能和效率,并实现数字化沉浸感。

  1. 性能,但不是你所熟悉的性能

  ARM表示,不断提高计算性能是其最擅长的事情之一。每年公司都会发布能够在尊重移动设备所需的电源效率封套前提下突破性能极限的新品。Total Compute(全面计算)同样不例外,只是这次团队采取了基于解决方案的方法来加速性能提升。这意味着要通过对工作负载的深度分析来考察整个系统的性能,亦即分析如何在不同的IP块和计算域之间最好地部署数据和计算的互联互通。

  最终,更复杂的用例需要更高的性能。将不同IP块集成到SoC中的挑战是,增加有源芯片面积会导致热和功耗预算的增加。这就是为什么需要强调整个系统的重要性,所以每个IP块的开发都要采用共同的底层架构方法。这意味着所有的组件都可以无缝地在一起工作,并且可以通过开发者工具来简单地进行访问。

  这同时为系统构建了超越单个计算块的智能化。它不仅仅是单个IP,而是每个IP块在整个系统中有效地互联互通。这样做的结果是在同类产品中性能最优,效率最高,能够在下一代设备实现未来的用例和体验。

  2. 以AR为例

  诸如多用户AR游戏这样的增强现实体验都是Total Compute(全面计算)赋能的复杂用例。以AR为例,你可以看出我们为什么需要Total Compute(全面计算)方法。

  对于不同的AR用例和体验,我们需要将许多计算元件整合在一起,并令其无缝地进行工作。CPU驱动性能,GPU驱动图形,而AI则用于检测:从用户的位置到特定的对象和地标。然后,我们需要把所述IP整合在一起,令其在系统中无缝地工作。这就是系统IP能够带来巨大价值的地方。我们需要帮助构建更好的系统,专注于低功耗限制和高安全保护。最后,我们需要一个超快速、高带宽、低延迟的网络互联。

  另外,这种计算需要发生在未来的形状参数中。例如,未来AR智能眼镜的SoC面积和功耗预算有限。所以,高性能将需要在一个比现有智能手机更小的功率封装中实现。对于上面地描述,你应该已经可以看出能够在整个系统中进行优化是多么的重要。这将能确保所有的组件都能协同工作。

  3. 将机器学习推向新的水平

  Total Compute(全面计算)能够通过机器学习 (ML)推动性能。Cortex CPU产品的ML性能正逐年提高。但要通过Total Compute(全面计算)实现一系列的数字沉浸式用例和体验,我们需要将ML性能推向更高的水平。在2019年的TechCon上,ARM谈到了团队将如何把Matrix Multiply(MatMul)加入至代号为“Matterhorn”的下一代CPU之中。这能够有效地使ML性能翻一番,并代表着一个重大的飞跃,有助于实现一系列基于AI的新用例和体验。

  然而,这种ML性能提升的不仅仅局限于CPU。ARM正在投资于所有计算领域的ML性能提升。最新的Mali-G77和Mali-G57都提供了显著的ML性能提升。这两种GPU通过60%的性能密度提升来为移动设备提供了更快执行ML任务的能力。最新的Ethos-N77和MEthos-N57同样提供了ML性能和效率方面的优化,可以在整个生态系统中解锁AI。例如,Ethos-N77可提供高达4个TOPS的性能,然后在多处理器部署中扩展到100个TOPS。

  我们同时不能忘记ARM NN。这个通用API可以在所有ARM IP中最大限度地提高ML性能。ARM的性能分析显示,ARM NNN能够在短短六个月内将性能提升9.2倍。这种提升是在Big Cortex-A CPU、Little Cortex-A CPU和Mali GPU中实现。这种在所有计算领域中持续改进ML的承诺非常适合未来的Total Compute(全面计算)解决方案。

  4. 赋能5G

  Total Compute(全面计算)对计算性能提升的驱动将得到5G浪潮的支持。5G有望成为整个移动生态系统的变革性技术。它提供了远高于4G的网络速度和延迟。这在网络方面是巨大的进步,可实现新的用例和体验,并掀起新一轮的数字沉浸式浪潮。同时,现有应用、用例和体验的进步使得用户体验变得更快捷、更沉浸、更方便。但面临的挑战是,5G促使设备捕获更多的数据和信息,这使得已经十分复杂的计算密集型工作负载带来额外的压力。5G的高数据和性能要求使得未来的设计更需要Total Compute(全面计算)解决方案。

  5. 全面的系统视角

  Total Compute(全面计算)是一种系统级别的设计方法,它将带来下一波数字沉浸式设计,加速计算性能,帮助实现未来所有令人兴奋的用例和体验。对于用户来说,这意味着完全围绕着其需求定制出更丰富、更快速、更方便、更沉浸和更智能的体验。

  ARM表示:“我们致力于提高所有计算域的性能,向开发者提供为移动生态系统设计更多沉浸式应用的能力。然而,如何在整个系统中进行编程是一个挑战。Total Compute(全面计算)的第二大支柱将解决这一难题:开发者访问。在下一篇博文中,ARM将介绍如何解决开发者访问,并促进开发者能够在Total Compute(全面计算)系统释放所有性能。

您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

新利18国际娱乐

传感器行业综合服务平台,立志于建设便捷方便的传感器选型器、行业专业媒体

关注

点击进入下一篇

英伟达用LED光传感器开发轻量级VR视线追踪器

提取码
复制提取码
点击跳转至百度网盘