Kevin K. Chang:解决了DRAM问题 提出新的架构改进DRAM延迟问题

卡内基梅隆大学的kevin k. chang发表了一篇亮眼、出色的博士论文——《理解和改进基于dram的内存系统的延迟》(understanding and improving the latency of dram-based memory systems),解决了dram问题,并提出了一些新的架构改进办法,以在dram延迟方面做出实质性的改进。
三个问题
kevin将dram延迟问题分成四个部分,笔者将在这里总结其中三个:
·低效的批量数据移动。
·dram刷新干扰。当dram正在刷新时,它不能全部被访问。
·单元格(cell)潜伏期的变化——由于制造变异性。
至于第四个问题:延迟所带来的影响,有兴趣的朋友可以一起讨论。
1.低效的批量数据移动
在内存和存储代价高昂的时候,数据移动被限制在一个寄存器大小的块中,或者最多是来自磁盘的512字节块。但如今,在存储容量达千兆字节的存储空间和海量内存的情况下,海量数据移动变得越来越普遍。
但数据移动的架构——从内存到cpu,再到有限的内存总线——都没有改变。chang的建议是一种新型的、高带宽的存储器子阵列之间的数据通路,利用几个隔离晶体管在同一存储器中的子阵列之间创建宽——8192位宽——并行总线。
2.dram刷新干扰
dram内存单元需要刷新以保存数据,这就是为什么它被称为动态ram。dram刷新是成队列,而不是一次性刷新的,因为这样做需要太多的能耗。但是,当一个队列被刷新时,它不能被访问,这会造成延迟。
dram的延迟正在变高,因为随着芯片密度的增加,需要更新更多的队列,32gb的芯片上可能降低将近20%的性能。
chang提出了两种机制,即通过对bank和子阵列的内存访问进行并行刷新来隐藏刷新延迟。一个是使用无序的per-bank刷新,使内存控制器可以指定一个空闲的bank来刷新,而不是常规的严格循环顺序。第二种策略是写-刷新操作并行化,使刷新延迟和写延迟重叠。
在他的测试中,使用8核cpu,这些策略提高了超过27%的加权内存性能。
3.单元格延迟变化
得益于制造工艺的提升,记忆单元格可以有大量性能提升,随着密度的增加而增加。但是dram被指定以最慢的单元的速度可靠运行,这意味着如果使用最快的单元格,就会有显著的性能上升。
chang在论文中提出了两种利用这种变化的机制,获得的速度提升从13%提高到了几乎20%。
探索与优化
在系统架构中,探索瓶颈和修复瓶颈的工作是没有终点的。过去20年内,dram一度被认为难有进步,但我们看到,其延迟水平也会被改变。
随着越来越多的晶体管、专业指令集和诸如此类的性能的提高,降低dram延迟也将成为性能改进的主要目标。

三星被控侵犯FinFET专利权,部分 iPhone 被禁止进口到美国
网络附加存储NAS在安防行业中应用
双金属温度计的工作原理及相关参数
全球已有98个国家的293家运营商正在进行5G测试
忽视中国市场 骁龙865注定要输给天玑1000
Kevin K. Chang:解决了DRAM问题 提出新的架构改进DRAM延迟问题
WT588F02KD-24SS语音芯片(数码管显示驱动ic)在多功能烧水壶的应用设计方案
商汤科技用人工智能改造传统行业挖掘蓝海市场
平价电动牙刷推荐,2020双十一狂欢节选购推荐
新唐科技台式计算机与服务器系列介绍
煤粉转子秤冲刷磨损如何解决
高速PCB设计时应从哪些方面考虑EMC、EMI的规则
博通推出业界首款基于“双核A9 HSPA+与Turnkey”的移动芯片
高性能模拟集成电路和数模混合集成电路设计及管脚图展示如下
华为正着手开发自己的操作系统
笔记本也玩触摸?Thinker:3K屏幕+触摸 或许是你的菜
百度DuerOS引入基于Qualcomm解决方案的耳机和智能音箱中
“国家企业技术中心”缘何落户紫光国微
[图文]三端集成稳压可调电源
你了解Linux下的tmpfs文件系统?