创造高密度的voip处理器
任何高密度voip平台的关键需求之一,是它必须在低功耗和有限使用面积下,尽可能提供最多的通道。对于信道数目超过1,000个的电信等级产品,其核心基本建构方块会为dsp引擎执行pcm或lbr语音编码,这些芯片也是机柜内重复性最高的零件。除此之外,由于每颗组件必须同时处理数百个语音编码信道,使得用于存放数据和程序内存需求就变得极为庞大,平均每颗组件高达24-50mbits,使得内存成为占用硅晶粒面积的主要零件;一个高密度平台拥有高达50-100颗这类组件,对其内存配置方式和架构有所改善,整体解决方案就会获得非常可观的回报。
voip处理器的发展最好是以dsp模块为基础,这样才会得到最高效能。典型的模块包含中央处理器核心、内存系统组件以及dma系统界面,其中内存系统组件可能是内存和快取控制器;由于核心通常会提供多种内存组态供设计人员选择,因此内存架构将对voip系统造成重大影响。传统上,dsp核心的mhz效能改善速度会远超过内存速度,绝大多数的半导体制造商则会利用同样制程技术提供多种类型的记忆位晶胞(memory bitcells),例如厂商会提供高密度记忆位晶胞,它们的泄漏功耗 (leakage power) 较小,但必须在较低速度下工作,高速记忆位晶胞的工作速度则能达到或超过处理器频率频率。此外,内存设计人员也试图发展最佳化的内存架构,让内存速度能跟上中央处理器的工作速度,下图即是harvard架构所实作的单阶层和两阶层内存系统。
单阶层和两阶层内存系统的harvard架构
规划新处理器时,选择单阶层或两阶层内存系统是很重要的技术取舍,对于特定不同的应用,这些架构必须在面积、功耗和效能取得最佳平衡。根据我们前面讨论结果,要支持所需的信道密度,内存架构可采用三种实作方式,其中两种架构属于单阶层内存系统,一种采用快速的记忆位晶胞,另一种则采用速度较慢而密度较高的记忆位晶胞;设计人员可以选择两阶层内存系统,选择第一层快速内存,或是第二层高密度内存来达到与第一层相同的总内存容量。
不同方法会对系统造成不同影响,这并不令人意外。首先是功耗的问题,下图是前述三种方法的功耗特性,包括两种单阶层内存系统和一种两阶层内存系统,图中所示的功耗主要是处理器存取功耗和漏电功耗,dma存取功耗则是数据从第二层内存移到第一层内存 (假设未使用快取) 的功耗需求。若以hd语音系统的假设为基础,下图就证明在这种制程设计条件下,两阶层内存架构通常是较好的解决方案。
内存系统功耗的比较
如前所述,若组件必须内建24-50 mbits内存,那么绝大多数的硅晶粒面积都会被这些内存占用;在这种情形下,未来内存架构的使用面积也会成为另一项重要的芯片层级影响因素,下图即是单阶层和两阶层内存系统对于面积的影响。
内存系统使用面积的比较
若整个内存都是由快速记忆位晶胞组成,面积和功耗都会受到冲击,如果整个内存只包含高密度记忆晶胞,那么受影响的就是速度;因此若能以最佳方式把快速和高密度内存结合至两阶层内存系统,系统架构即可提供最佳的功耗、面积和效能。根据这个范例,我们能得到以下结论:两阶层内存系统为voip处理器提供最佳效能,同时带来以下优点:
• 使用庞大的第二层内存 (l2),并采用高密度而低泄漏功耗的记忆晶胞,即可减少整体的晶粒面积和功耗。
• 使用少量的第一层内存 (l1),并采用高速、但密度较低的记忆晶胞,即可支持更高处理器速度,并做为速度较慢的l2内存的缓冲区。
• 在l1中结合快取和映像内存 (mapped memory),即可将攸关运算效能的关键程序代码储存在l1映像内存,同时透过高速缓存来利用「本地参照」(locality of reference) 特性;另一种方法则是利用本地dma系统,在l1和l2内存之间切换数据页 (page data)。
• 使用适当的第一层程序和数据快取,即可让全系统的泄漏功耗、操作功耗(active power)、面积和效能最佳化。
从以上讨论可发现,只要结合中央处理器、l1程序内存、l1数据存储器和l2内存系统,即可提供最佳设计支持voip应用。我们现在将讨论多核心dsp处理器的系统层面问题,这类组件是目前市场上的主流架构,而且原因非常简单:假设每个pcm语音信道需要同样的mhz效能,那么在乘加器(mac) 数目不变的情形下,若要将信道密度加倍,就需要两倍的mhz效能;虽然oem厂商通常可在12至18个月内将vop系统速度加倍,dsp速度却无法在同样时间内加倍。为了克服这个时间落差,厂商会试图将多颗dsp核心整合至单颗晶粒,这种方法的困难在于:如何在我们前面提到的各种内存架构中,以最佳方式来分割系统功能。
程序代码通常是由多颗dsp共享,因此最好由l2内存系统提供共享程序内存 (shared program memory);虽然程序内存是在l2共享,每个核心仍拥有专属而高速的第一层程序(level 1 program,简称lip) 内存。lip可由快取和sram组成,sram负责储存攸关运算效能的程序代码,留下l1快取很有效率的利用「本地参照」特性,这会让常用程序代码储存在lip高速缓存,不必从共享的l2内存撷取;透过这种方式,lip和共享l2内存之间的总线频宽将只用于程序代码传输,不会受到数据传输或外围传输的中断。
l1p和l1d内存控制器都能存取本地l2内存,但要获得更高效率,最好是将整个本地l2内存都用来储存个别信道的数据、堆栈或其它,确保lid和l2之间的总线频宽都用于数据传输,不会受到程序传输或外围传输的中断。
到目前为止,我们在这些分析中只考虑内部存储器,但对voip处理器而言,选择正确的内部和外部内存组合也是重要的架构考虑因素。内部存储器的某些重要考虑包括:
• 晶粒面积
• 功耗
• 信道密度目标
• sram、dram和数据非挥发型内存 (nv memory)的比较
• mhz和内存间的平衡
在许多voip系统中,内存大小都是由信道密度目标所决定,dsp供货商通常会让每颗dsp支持ds3密度的整数倍,因此只要设计目标高于这个ds3整数倍,就表示内存容量必须增加;但由于制程技术每进步一个世代(process nodes),记忆位晶胞体积的缩小幅度都超过50%,因此面对内存容量的增加,占用的有效面积也会随之增加。能整合至芯片的内存种类并不多,最常见包括sram和dram,我们对此并没有太多选择;如果内存的读取频率远超过写入次数,那么数据非挥发型内存也很受到欢迎,例如闪存、铁电内存 (ferro-electric) 和rom。
相较于内部存储器,外部内存的重要考虑包括:
• 功耗
• 可用频宽 vs. 需求
• 外部内存的种类
• i/o电压
• dma架构的负担 (infrastructure loading)
• 内存成本和面积
绝大多数voip系统都支持外部内存,原因有几个,例如我们虽能利用内部存储器来达成mhz和内存的良好平衡,但外部内存却提供未来扩充性;新功能或是语音编码译码器(voice codec) 能由外部内存来支持芯片已有的内建功能。
对于使用外部内存的voip系统,每个mb频宽的功耗也是重要考虑;由于vop系统的效能指针包括mw/通道,故在选择外部内存时,应确保整体解决方案的通道功耗不会受到太大影响。成本和面积也是高密度voip电路板设计的重要考虑,虽然sdram是很受欢迎的选择,但ddr sdram正获得越来越多支持,未来有可能取代sdram成为这类应用的内存选择。下图是sdram和ddr的功耗比较,频宽利用率增加,内存功耗就会降低;虽然图中是以数据读取为例,但数据写入以及读写混合都会呈现同样的趋势(读写混合会影响可用频宽,因为必须考虑总线的turnaround延迟时间)。从图中可以看出,在所有接受比较的内存当中,每个mb功耗以1.8 v时的ddr-ii最低。
外部内存比较 – 功耗/mb
在这些高密度voip引擎中,内存确实会占用可观的芯片面积,而且在未来数个产品更新周期内,这个趋势还可能继续。我们已经看到数种方法可以加强内存的功能分割和架构,系统设计人员也正在对它们进行评估,他们努力绝不会白费 - 因为如同我们在文中所介绍,正确的架构最佳化终将为整体解决方案带来可观回报。
相较红外,微波雷达为何是雾天行车诱导防撞系统车辆检测的选择?
AMD官方辟谣 CPU总代封仓属不实传言
多功能超声波焊接发生器电源
高效会商!LED显示屏助力多媒体会议室升级
为什么需要高速转换器转FPGA串行接口
创造高密度的VoIP处理器
提高用电驱动电动机效率的电动机控制方案
安防智能巡检机器人,实现24小时巡检
7nm芯片惹争议 嘉楠耘智布局AI实现“弯道超车”
逆变器常见故障的处理方法有哪些
西门子S7-1500 DI模块使用方法分享
为什么特斯拉 Model 3 没有仪表板?
工信部:2021年全国有望新建5G基站超过100万个
一卡通智能控制水表的原理及设计
小米6发布会倒计时4天:小米6携众多黑科技来袭,同步发售的还有小米MAX2和红米Pro2?
基于MIPI I3C规范从I2C无缝连接I3C的关键优点
vivo“聚光计划”上线,全方位助力社交工具行业提效
ABB REF615CC:电源控制清除接收数据的路径
TMS320VC5402在汽车防撞警示雷达中的应用
自动驾驶技术无人配送车你会收到无人配送车送的东西吗!