Arm发布Cortex X4,功耗可降低40%!

今天,arm 发布了新一代的移动处理器内核,包括 cortex-x4、cortex-a720、cortex-a520,预计将很快用于骁龙 8 gen 3 以及天玑 9300 等处理器。值得一提的是,新的核心基于 arm v9.2 架构,并且只支持 64 位指令集,不再支持 32 位移动应用。
arm cortex-x4,这是该公司的下一代旗舰性能核心,也是迄今为止设计的最高性能arm核心。
据了解,新发布的 cortex-x4 超大核相比 cortex-x3 在性能上提升了 15% 左右,但是在能耗方面有比较大的改善,宣称在相同频率下可以降低 40% 的功耗。而 a720 作为 a715 性能核心的升级迭代版本,效率提升了 20%。cortex-a520 相比上代的 cortex-a510 效率提升 22%。
网上此前已经爆出骁龙 8 gen 3 采用的是 1+5+2 的丛集结构,其中 1 指的是 cortex-x4 超大核,而 5 猜测是 cortex-a720 性能核心,而 3 则是 cortex-a520 的能效核心,安兔兔跑分更是达到了 160 万分,相比骁龙 8 gen 2 提升明显。而天玑 9300 处理器预计同样会采用 arm 发布的新移动处理器内核,性能表现令人期待。
arm表示,cortex-x4的前端已经发生了一些重大变化。指令获取传递已经被完全重新设计了。与cortex-a715一样,cortex-x似乎也紧随其后,也完全放弃了宏操作缓冲区。相反,cortex-x4拓宽了流水线,支持多达10条指令。指令缓存也得到了相应的增强。带宽增加到每周期10条指令。
新的分支预测器的准确性也得到了提高,在实际工作负载中观察到的停滞现象明显减少。随着指令高速缓存和宏操作高速缓存的变化,分支预测错误的惩罚被统一起来,并减少到10个周期。
后端部分也得到了增强。在执行单元的整数方面,arm将之前几代的mul单元更新为完整的mac单元。这意味着x4现在有2个整数mac单元。还增加了第三个分支单元。最后,还添加了两个额外的整数alu,总共有8个——其中6个位于专用流水线上。
cortex-x4的乱序缓冲区从cortex-x3的320增加了20%,达到了384个。事实上,arm每一代都会将rob增加10%至30%左右。从一个角度来看,cortex-x4的rob现在比英特尔的sunny cove核心更大,后者只有352个条目,尽管远远不及令人惊叹的golden cove的512个条目rob。
在浮点数方面,arm对除法器/平方根单元进行了完全流水线化。管道和单元本身保持不变。
在内存子系统方面,arm重新平衡了流水线。以前,cortex-x3具有两个通用的地址生成单元(agu)和一个专用的加载agu,而现在的cortex-x4只有一个通用agu,同时配备了两个加载agu和一个存储agu。
cortex-x4上的私有l2缓存也得到了扩大。系统集成商现在可以选择集成高达2 mib的l2缓存,这将使l2缓存与上一代相比翻倍。如果需要的话,在更受限制的环境下,系统设计师可以选择使用较小的缓存大小。arm表示,较大缓存不会增加延迟。这个选项可以在具有大内存占用的应用程序中实现更高的性能,因为它可以更频繁地引用靠近核心的内存。
总的来说,cortex-x4在iso频率和l3(尽管具有较大的l2缓存)方面提供了约13%的ipc改进。


台湾代工厂09年成绩出炉 鸿海3045亿夺冠
5G的概念以及应用场景介绍
新疆理化所在汞基红外非线性光学材料方面获进展
比例遥控控制系统设计及其原理
自然灾害频发,人工智能如何帮助救灾?
Arm发布Cortex X4,功耗可降低40%!
Intel发布了首款消费级QLC固态硬盘——660p
不要以为诺基亚有一部诺基亚6,其实他还有好多你不知道机子!
实操视频加课件,方便您备课机器视觉及其应用技术
给示波器以云空间,泰克发布突破性的数据协同软件TekDrive
同类型屏蔽工字工字电感封装相同为什么不能通用gujing
视音频联接综合解决方案商魅视科技上市登录深市主板
什么是共模噪声?共模噪声的应对措施有哪些?
中国电信将把网络安全作为健康发展的基石
热插拔控制电路的分析和设计过程
玩游戏选什么手机好?vivoxplay6,oppor11,魅蓝e2流畅操作实力脱坑!
最新医疗模拟芯片技术将有望改善人体机能
iPhone8最新曝光:配备微曲面屏幕
智能照明系统概述/应用/优势/特点
智能制造与工业4.0