下一代 adas 和自动驾驶 (ad) 系统部署到市场后,将需要准确、高速的识别、判断和操作。卷积神经网络 (cnn) 需要大量计算来进行模式识别。随着安装的传感器数量的增加,需要更高的 cnn 性能。然而,随着功耗与性能成正比增加,需要一个笨重且昂贵的水冷系统。需要同时实现高深度学习性能和低功耗,以实现轻量级且具有成本效益的空气冷却系统。从实际的角度来看,实现 60tops 的 cnn 性能和 10tops/w 的效率是每个 lsi 设备的最佳目标。
具有高性能和高能效的 cnn 加速器
cnn 加速器 (cnna) 的性能/效率目标是实现 60tops 性能和 10tops/w 效率。从实现的角度来看,它是用三个相同的加速器而不是一个加速器来实现的。一个cnna包含13,824个mac算术单元,工作频率为800mhz。三个cnna的理论最大性能为66tops。此外,每个 cnna 通过一个 512 位互连模块连接 2mb 专用暂存器 (spm)。这提高了cnna的执行效率,将cnna与外部存储器(dram)之间传输的数据量减少了约90%,并节省了dram接口和互连所消耗的功率。从测试芯片的实测来看,vgg16的性能为32tops,效率为6.1tops/w,cnna优化网络(network-a)的性能为60.6tops,效率为13。
asil d 任务的安全机制
下一代 adas 和 ad 系统需要实现 asil d 的功能安全,这是 iso 26262 中最严格的安全级别。双核锁步 (dcls) 是可以满足 asil d 指标的方法之一。可以通过在两个冗余硬件上执行相同的过程并比较它们各自的输出来检测。
cnna 还需要硬件冗余来满足 asil d 指标,但简单地应用 dcls 需要大型 mac 计算单元来实现冗余。这是不实用的,因为面积和功耗显着增加。为了在不添加冗余硬件的情况下实现 asil d 指标,两个 cnna(cnna1 和 cnna2)由软件动态配置,以在需要安全的处理过程中执行锁步操作。
cnna 用于从相机输入的图像识别处理 (asil b) 和从每个传感器输入的结果 (asil d) 对周围环境进行建模。但大部分执行时间是以前的 asil b 图像识别处理。因此,通过仅在周围环境建模处理期间将 cnna1 和 cnna2 切换为锁步操作,可以在不显着影响性能或功率效率的情况下实现 asil d 任务。
下面是cnna使用锁步dmac(ldmac)的锁步操作。
1) ldmac 将相同的数据从 dram 加载到 spm1 和 spm2。
2)cnna1和cnna2执行相同的网络处理。
3) ldmac 从 spm1 和 spm2 读取执行结果并进行比较。如果它们不匹配,则判断为错误。只有cnna1的结果存储在dram中。
实现 asil d 的另一个重要因素是免于干扰 (ffi)。系统中混合了具有不同 asil 的任务。他们不得干扰更高级别的 asil 任务。前面说过,cnna是被不同asil级别的任务访问的,所以每个任务使用的内存空间必须是独立的。
内存空间隔离机制在cnna、ldmac和内存管理单元(mmu)的内存保护表中实现。当前运行任务的上下文索引被赋予来自cnna和ldmac的事务输出。mmu 接收它并在逐个事务的基础上切换上下文。
如何打开车联网安全的大门
如何计算电气设备的有功功率和损耗
区块链将加速物联网生态场景孵化
美团与中国电信携手共建5G生态
CFP – SMx封装的高效替代品
适用于ADAS和自动驾驶系统的高可靠性和高性能深度学习加速器
三星后院失火 华为或将在韩国5G市场脱颖而出
随着安全领域和社会安全的需要,生物识别技术发展的速度日益加快
如何使用热电偶和热电偶放大器
小米5X新品发布会已结束,小米5X与红米note4x该如何选择?小米5X与红米note4x在配置/拍照/续航/价格方面区别对比
苹果屏下指纹识别专利曝光,含光电传感器
光纤光栅结构监测系统
努比亚红魔5G游戏手机上架,配备144Hz刷新率的显示屏
X波段是什么_X波段波长
铝厂数字孪生可视化管理平台建设,推动铝业绿色低碳数字化转型发展
扎克伯格的出彩人生与Facebook的来历
UCC28220/21双通道PWM控制器的作用特点及主要特性分析
物联网技术是数字化转型的关键安全仍为重中之重
中国天眼31日起正式对全球开放 中国天眼有什么用
工业平板电脑在无人巡检设备上的应用优势表现