ARM机器学习和ARM对象检测是ARM最近宣布的用于人工智能处理的处理器。
ARM对象检测是针对面部或对象检测而优化的处理器。除了使用全高清60帧的实时检测外,它还具有80倍于传统DSP的DSP性能。该产品预计将用于互联网应用,如无人机和安全摄像头,支持碰撞安全。
ARM Machine Learning是一款专用处理器,可以更快地处理一般人工智能,如自动翻译和人脸识别。在移动设备上使用时,它每秒可执行超过4.6万亿次操作。功率效率至少是传统功率的2到4倍。该产品预计将用于智能手机等移动设备,预计将于今年晚些时候问世。
当然,ARM已经开发了动态队列(DynamiQ),这种技术允许在终端上处理人工智能处理。
动态队列是灵活性和多功能性的结合,而ARM则旨在从边缘到云重新定义跨设备的多核环境。 ARM的重要性.LITTLE这样的高性能低功耗技术已经能够通过在同一设计中添加两个或四个低功耗内核来使用两个ARM处理器。动态队列改进了Big Little技术,允许您进行以前从未有过的配置,例如1 + 7或1 + 3.可以根据环境进行最佳配置。
Cortex-A处理器采用动态排队技术设计,可在未来三到五年内将人工智能性能提升至现有Cortex-A73系统的50倍,并使CPU和加速器的速度提高10倍。计算性能最多可增加10倍。在设计SoC时,它们可以在单个集群中从8个核扩展到8个核,并提供不同的每核性能和功耗特性。您还可以快速响应机器学习和人工智能应用程序。
由于动态队列对ADAS解决方案具有高响应性,因此它们可用于安全的自动操作系统,这可以提高安全性,并在构建ASIL-D兼容系统或发生故障时预期安全操作。
ARM公布的ARM机器学习和第二代ARM对象检测可以解决机器学习的处理问题,这是一种用于终端而非云端的人工智能的技术。它更清楚地显示了动态队列的方向。在未来,我们将加速从终端而不是云解决日益增长的机器学习过程的过程。
如今,通常通过云解决需要高处理能力的机器学习过程。但是,使用云可能会导致诸如响应速度和数据传输和接收期间传输的数据量等问题。除此之外,发送数据时也存在黑客问题。另一方面,如果AI专用处理器用于机器学习处理,则可以在终端自身中执行机器学习,并且在响应性和安全性方面是有利的。
据ARM称,所宣布的处理器都是基于现有CPU或GPU架构的新技术。它不仅可以用作移动设备的SoC,还可以用于Internet设备。
华为推出了麒麟970,这是一款仅支持AI的处理器,可以进行机器学习处理。该产品由华为的海思半导体技术公司(Hisilicon Technologies)创建,采用了四核中的Mali-G72(Mali-G72)GPU,用于Cortex-A73和Cortex-A53。台积电的10nm制造工艺。与现有的Giraffe 960相比,芯片尺寸减少了40%,功率效率提高了20%。
当然,最大的特点是SoC本身配备了一个名为NPU(神经网络处理单元)的AI专用处理器。根据华为的说法,使用NPU可以实现与CPU相关的处理能力是CPU的25倍,功率效率提高50倍。 FP16的NPU计算性能为1.92 TFLOPS。支持深度开发框架是张量插头,张量流灯和咖啡馆(2)。在这方面,华为在2017年公布时强调该产品是世界上第一个移动AI处理器。
Apple同样如此。 Apple已经通过AII Bionic,iPhone X和8上的SoC包含了专用于机器学习的处理器.A11 Bionic是一款具有6核和43亿个晶体管的芯片,比现有的A10 Fusion快30%,但它可以将功耗降低一半。两个高性能内核和四个高效内核,高性能内核的性能比现有内核高出25%,高效内核高达70%。 GPU比以前快30%。最大的特点是它还有一个神经引擎。神经引擎是专门用于人工智能处理的AI专用处理器,例如人脸识别,视觉计算,语音识别和自然语言处理。它每秒可处理多达6000亿个工作岗位。
但是,这些处理器仅限于高端型号。相比之下,ARM宣布的ARM机器学习等产品有望将AI处理器扩展到入门级移动设备。这意味着AI处理可以在低成本终端上完成。
ARM尝试扩展可以处理人工智能技术的设备。如果所有用户每天使用语音搜索大约三分钟,那么Google服务器的数量应该翻倍。 ARM表示,开发能够处理人工智能技术的AI专用处理器是半导体开发的一个趋势。与此同时,专注于简单高性能和省电的移动半导体发展趋势的趋势可以改变。
事实上,除了这些公司之外,英特尔还在开发Loihi,一种可以在芯片上自学的AI处理器,而不依赖于云。英特尔正在开发一种用于神经运动计算的芯片,称为使用人脑结构的神经形态计算(AI)技术。
大脑的神经网络通过电信号传输信息。由网状网状物包围的神经元之间的火花控制重量并存储变化。人类智能是通过与大脑神经回路的相互作用产生的。英特尔还希望在不使用云的情况下开发自学半导体芯片。我希望能够通过各种信息获得反馈,并像人脑那样学习。
英特尔过去六年来一直在开发这项技术,并且正在使用代号创建一个原型芯片。它可以将学习和推理过程结合在芯片上,实现对环境的自动和实时适应,而无需等待数据发送到云。它具有类似神经的异步核心结构,并具有可编程学习引擎,可以控制每个核心网络的参数。它采用14纳米制造工艺制造,包括130,000个神经和1.3亿个突触。它包括可以处理诸如设置路线或学习先前学习或动态模式等问题的算法。英特尔表示,其芯片制造商的学习成绩已经提高了一百万倍。能效高达1000倍。当然Rohawy芯片正在开发中,将从今年上半年开始提供给研究机构,以分享开发信息。
此外,据报道,亚马逊推出了仅限AI的芯片设计,以提高Alexa的质量并缩短响应时间,Alexa是其语音识别扬声器生态系列的音频秘书。虽然预计亚马逊没有自己的产品,因为它没有芯片制造经验,但它的目标是通过在使用云之前瞄准设备进行更多数据处理来提高语音识别和响应速度。
半导体公司表示,开发AI专用处理器以实现高性能人工智能至关重要。这是因为需要掌握自动驾驶汽车或需要优异感知能力的健康状态或作物生长状态的农业无人机,增强现实技术和对象互联网相关设备的应用范围将增加。