设计更简单,运行更稳健,UCIe标准如何“拿捏”Multi-Die系统?

如今,从数据中心到边缘层,再到万物智能网络的深处,先进的multi-die系统实现了前所未有的性能水平。multi-die系统不是通用的单体架构芯片,而是由一系列异构芯片(也称“小芯片”)组成,其中小芯片针对每个功能组件进行了优化。虽然multi-die系统具有更高的灵活性并在系统功耗和性能方面表现优异,但也带来了极高的设计复杂性。
通用芯粒互连技术(ucie)标准于2022年3月发布,旨在推动multi-die系统中die-to-die连接的标准化。ucie可以简化不同供应商和不同工艺技术芯片之间的互操作性。即便符合ucie标准的multi-die系统在开发、测试和制造过程中表现良好,但在实际运行时,又如何确保系统的die-to-die连接继续保持稳健安全并经过测试验证呢?本文将探讨如何通过ip、测试、硬件加速等方式满足相关要求,从而确保multi-die系统的可靠性。
采用ucie标准的优势
试想一下这种情形:multi-die系统包含两块芯片,分别来自两家不同的供应商,并采用了不同的工艺技术,比如7nm和3nm;而且,还需要这两块芯片能够无缝地相互通信并支持行业标准协议,比如pci express(pcie)和cxl等。要知道,在设计中每添加一块芯片,系统的延迟就会增加,性能也会随之降低。
要让所有芯片协同工作,并克服延迟难题,需要遵循正确的标准。为multi-die系统采用ucie标准具有以下几个优势:
确保互操作性并降低延迟。选择符合ucie标准的接口ip可以实现芯片之间的无缝连接和互操作性,而又不会影响整个系统。将系统设计为符合ucie标准,可以在保持相同延迟的情况下降低功耗并提高性能。
借助冗余通道实现故障修复。ucie规范在phy的两侧之间提供了冗余通道,可以通过额外的通道实现故障修复。无论是否连接到外部环境,所有芯片都必须通过ucie通道进行访问、测试和修复,同时ucie通道还可以用于监测正在发生的芯片问题。
为确保multi-die系统能够长期正常工作,除了采用ucie标准外,还需要从一开始就保证高质量。鉴于multi-die系统的复杂性,不仅要在soc的开发和制造过程中实现更高的质量,还要在现场运行很长时间后继续保持高质量。为此,需要使用高质量的构建模块(即芯片和ip)、硬件加速和验证工具,并开展持续的测试和现场监测(包括修复),从而主动解决各种潜在问题。
如何确保基于ucie的multi-die系统稳健运行
除了控制器和phy ip外,以下是确保基于ucie的multi-die系统稳健运行的另外三项要求:
1. 使用协议验证ip和硬件辅助验证平台,从一开始就保证质量
在软件仿真器上运行协议验证ip解决方案,有助于从一开始就确保高质量的ucie组件和接口层,包括现场设备集成(fdi)上的协议层、原始die-to-die接口(rdi)上的phy接口、中间适配层,或die-to-die适配器的实现。
随着设计范围扩大至全栈,涉及到多模块芯片组配置和复杂的multi-die系统时,只靠纯软件仿真已经难以满足要求,需要运用更多工具来验证整个系统或各个芯片。在对大型multi-die系统进行实际验证时,硬件辅助验证(hav)平台尤为关键,比如新思科技zebu硬件加速系统和新思科技haps原型系统。为涵盖所有验证用例(从早期的rtl开发,到互操作性和硬件合规性验证),多mhz周期性能、优化的ucie协议解决方案(事务处理器、速度适配器、硬件接口卡)和系统级调试抽象必不可少。
2. 通过测试确保互连性能符合预期
测试是所有芯片设计过程中的重要一环。在multi-die系统中,芯片之间的互连通常基于ucie等接口。为确保按预期运行,这些互连中不得存在任何固定型故障、开路或短路。信号完整性非常重要,因此必须测量该参数以评估是否存在性能降级情况。ucie标准要求具有额外的互连以实现冗余。键合后测试可以解决一些可能触发切换互连通道的互连层面问题。在理解故障模型的基础上开发的算法测试也可以用于评估互连缺陷。
3. 采用芯片生命周期管理策略
ucie接口是multi-die系统中芯片之间进行功能通信的主要接口。由于ucie接口以非常高的速度运行并且是通信的关键路径,因此必须在整个生命周期内对其进行监测和管理。通过监测ucie的运行状况,可以为汽车、医疗等领域的安全关键型应用提供巨大帮助。例如,在自动驾驶汽车应用中,通过对ucie的运行状况进行监测,可以让车主及时进行预防性维修,或者提醒车主到店维修,以防在高速道路上发生故障。
新思科技芯片生命周期管理(slm)系列可在运行期间主动监测ucie接口,发现通道信号质量下降,即在通道发生故障之前予以修复。此外,它还提供内置自测(bist),可检测软错误或硬错误以采取纠正措施。
结语
芯片设计正在发生转变。为multi-die系统采用ucie标准只是实现无缝连接和互操作性的第一步。要想驾驭先进multi-die系统设计中的复杂性,遵守ucie标准中的要求是关键。如果想要进一步探索ucie,或了解新思科技如何助力简化multi-die系统设计流程,欢迎查阅新思科技官网,或点击“阅读原文”,了解multi-die系统解决方案。
原文标题:设计更简单,运行更稳健,ucie标准如何“拿捏”multi-die系统?
文章出处:【微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

教你如何优化与创新交通运输系统的电源解决方案
5G时代数据与资本的远与近
达实FRT365智慧派梯屏支持多种权限认证方式
UFS3.0和UFS2.1性能差距有多大
新增工业控制器|DCSSR Unit上线
设计更简单,运行更稳健,UCIe标准如何“拿捏”Multi-Die系统?
什么是旧私钥攻击和当前私钥攻击
基于MAX8570的OLED升压变压器电源偏置电路设计
飞兆案例分析:高效率充电器电源设计
英伟达黄仁勋:美国国防法案的变动不影响公司供应链
LG将ATBM8859解调芯片应用于TDSN-C201D
从自动驾驶到足式机器人 前文远知行高管张力加入逐际动力
后疫情时代 厨卫家电市场迎来“开门红”
2018年银行新增贷款资金仍然集中在房地产行业,制造业贷款金额不断萎缩
自制太阳能发电站详细过程
USB接口不可或缺,FTDI携新品VNC2亮相
逆变电源控制电机频率能调吗,逆变电源控制办法
学会文件缓存回写的过程
AT&T正式公布了2020年边缘计算发展的三大策略
华为鸿蒙系统公测申请入口