Imagination发布最新一代神经网络加速器IP核

imagination technologies发布了最新一代神经网络加速器ip核img series4 nna,并将于12月份正式向厂商提供。
芯东西独家获悉,已有汽车领域厂商率先获得img series4 nna ip授权。
作为nna ip系列第四代产品,img series4 nna具备创新的多核架构、高扩展性&高灵活性、超高性能、超低延迟、节省带宽、车规级安全性等功能及特性,可满足汽车、移动设备、数据中心、pc等多种应用场景的ai加速要求。
在这背后,imagination为img series4 nna融入了怎样的设计巧思?在神经网络加速成为各行各业普遍需求的当下,img series4 nna将为满足这一需求拿出怎样的解决方案?
为回答这些问题,芯东西独家专访imagination人工智能业务高级总监andrew grant,以了解img series4 nna中蕴含的“黑科技”。
01
两年打磨:成就五大核心性能亮点
我们了解到,imagination第二代、第三代神经网络加速器ip核series2nx和series3nx,分别于2017年和2018年推出,两款产品的发布时间相隔一年。
相比之下,最新推出的series4 ip核与前代产品的推出相隔两年。andrew grant向我们透露,2018年以来,imagination研发团队从软硬件两方面出发,对series4 ip进行了细致的产品设计。
在硬件层面,imagination团队在2018年启动对series4 ip核的研发工作,同步开始对多核(multi-core)技术(img 4nx-mc2、mc4、mc6、mc8)进行研发。
同时,imagination推出其专利的imagination tensor tiling(itt)技术,可将工作负载分割以获得最优效率。
实际应用时,昨日最新亮相的series4 nna ip可凭借多核多集群组合,提供600 tops甚至更高算力,同时可为大型神经网络工作负载节省带宽、降低延迟。
其性能优势可概括为五个方面:
1、高度灵活的可扩展方案。
前两代产品均采用单核架构,相比之下,最新推出的series4 nna采用多核架构,允许用户集成2个、4个、6个或8个单核,提供灵活的可扩展方案。
2、超高性能。
基于series4 nna ip,一个8核集群可提供100 tops算力,那么,6个8核集群的解决方案就可以提供600 tops算力。
3、超低延迟。
所有内核可以并行处理一个任务,进而相应地降低延迟、缩短响应时间。举例来说,相比单核独立执行的情况,理想状态下8核集群可以把延迟降低至前者的1/8。
4、节省带宽。
imagination tensor tiling技术(itt),可利用本地数据的依赖性将中间数据保存在片上存储器中,从而将带宽降低多达90%。
5、车规级安全性。
series4包含ip级别的安全功能且设计流程符合iso 26262标准(解决汽车电子产品风险的行业安全标准)。
此外,img series4 nna可运行一系列ai框架,包括caffe、pytorch、tensorflow、paddlepaddle、chainer、cognitive toolkit、mxnet和open neural network exchange (onnx)等。
对神经网络的支持方面,img series4可为cnn、lstm、rnn等多种神经网络加速,同时支持yolo v3、kittiseg等。
02
亮剑四大领域:从pc到汽车都能用
在应用场景上,除了延续前两代产品对移动设备、pc、数据中心等应用场景的支持,series4 nna ip特别针对自动驾驶领域、先进驾驶辅助系统(adas)等汽车领域应用进行了设计。
在与客户沟通的过程中,imagination团队了解到,现有车载神经网络加速器ip解决方案存在功耗高等方面的痛点,这正给imagination提供了“用武之地”。 andrew说:“我们注意到,现有的多数ip厂商提供的是数据中心、桌面级cpu等解决方案,这些方案功耗比较严重,对车载场景不友好。但imagination有做移动应用的基因,我们在控制功耗方面有优势。” 除了降低功耗以外,imagination研发团队还综合考虑了自动驾驶等车载场景对能效、安全性等方面的需求。“(其中)最重要的是‘安全第一’的原则。”andrew grant强调。
imagination研发团队在series4 nna独特的多核架构中加入控制器,以最大限度地提升使用效率。在保证功耗低、带宽低的情况下,把算力扩展到业界最大水平。
安全性方面,series4 nna采用硬件安全机制,可以保护编译后的网络、网络的执行和数据处理管道。
此外,andrew grant补充到,series4 ip还能与imagination的车用bxs gpu互补,以实现一个功能更加完善的异构计算平台。imagination创新的ai协同(ai synergy)技术,可充分利用nna和gpu的资源与优势,使ai计算性能、效率再上新台阶。
03
未来4nx产品有望在更多领域落地
andrew grant向芯东西透露,目前已经有汽车领域的厂商率先获得了img series4 nna ip的授权,并正推动产品落地。
谈到imagination三代nna ip产品之间的关系,imagination方面表示,前两代神经网络加速器ip已经达到了imagination的市场预期,在移动、安防监控、iot等对算力要求相对较低的应用场景中取得了较好成绩。
比如,展锐(unisoc)的虎贲t710芯片搭载了2nx,在诸多ai评测中名列前茅,目前已落地于海信f50 5g智能手机、酷派x10 5g手机等;3nx相比2nx,在架构上有很大改良,其功耗、性能、ppa、灵活性均有提升,目前已应用在展锐的t7520芯片里。
相比之下,series4 nna ip是一款“next level”的产品,适用于更加广阔的场景。
三代产品形成矩阵,可提供不同层次的算力支持。“算力需求大的客户可选择多核心的4nx产品,对算力需求在10t以下的客户可选择3nx解决方案。”andrew说。
同时,andrew grant称:“我们期待能将其(4nx产品)推广到云计算中心、移动边缘计算(mec)、桌面、安防摄像头、工业自动化等应用领域。中国是一个非常大的市场,有许多芯片公司,我们期待能与这些公司一起有所作为,助力车载、数据中心等应用场景实现提升。”
04
结语:自动驾驶应用蓝海下,车载ai芯片ip迎来利好
5g、ai……一波波浪潮奔涌下,自动驾驶、远程医疗等应用逐渐从传说变为现实,这一过程中,imagination等先进技术玩家,承担着助推产业浪潮奔涌的角色。
今年三月份,工信部网站公示《汽车驾驶自动化分级》推荐性国家标准报批稿。若该标准正式实施,将是我国第一份自动驾驶分级标准。这意味着国内自动驾驶发展将迎来政策性引导与保障。业内人士称,新的分级标准给行业带来利好,车联网路网基建有望加速,将带来十万亿级别的投资机会。
这一十万亿市场蓝海中,车载ai芯片ip无疑成为一大重要组成部分。
自动驾驶解决方案中,应对数以百计的复杂场景、处理大量的传感器数据、实现自动代客泊车等各类复杂功能,对车载ai芯片应用提出更高要求。 对此,imagination最新发布的神经网络加速器ip在算力、降低延迟、提升能效等方面具备优势,或能助推自动驾驶应用快速落地。 有关series4 nna的更多信息, 请识别下方二维码观看 imagination的主题会议。
原文标题:600 tops超高算力,2~8核灵活配置!imagination新发布神经网络加速器ip
文章出处:【微信公众号:imagination tech】欢迎添加关注!文章转载请注明出处。


索尼宣布APPLETV应用程序将用于部分智能电视
USB消息通知器制作详解
高科技加持下小爱同学将可以完美适配小米智能手表
SiC MOSFET的短路测试下的引线键合应力分析
新华三H3C Workspace如何以“云+屏”架构畅享“无界”工作
Imagination发布最新一代神经网络加速器IP核
德国停售燃油汽车倒计时 要在2030年前全面停售
永续合约交易平台开发期货合约交易网站搭建
亚稳态理论介绍
传小米10S或将“跟风”取消标配充电器?
开发人员必知的八个优秀的Java开发工具
艾默生发布谷轮™在线信息工具 NVIDIA助力海帆打造深度管控平台
工业互联网应用提速 行业龙头企业纷纷加快布局
荣耀Play3内置一块4000mAh大电池配合智慧节电技术续航能力非常强悍
安全关键应用中异构臂芯的软件注意事项
变频器直流母线电路示意图讲解
工信部编制《汽车产业中长期发展规划》 新能源车补保持稳定
禾多科技以行车和泊车两种场景 实现自动驾驶覆盖所有交通路况
Atmel maXTouch为三星智能电话实现触摸屏提供解决
特发集团与华为签署合作协议 将围绕数字化、智慧化建设开展合作