AMD对抗英伟达的王牌,MI Instinct

amd在不久前发布了instinct mi300,一个结合了cdna3和zen4架构的产品系列,比如率先公布的产品为128gb的mi300a。然而在这之后,amd针对大语言模型市场,专门推出了纯cdna 3 gpu架构打造的mi300x,集成192gb的hbm3。
下一代数据中心与超算的选择,instinct mi300
随着英伟达的a100、h100等gpu产品在今年经历大热、缺货和涨价,越来越多的厂商开始做两手准备,开始寻找替代品。在ai与hpc领域,市面上缺乏能与英伟达旗舰产品竞争的高性能成熟方案。
虽然相较其他厂商而言,谷歌已经凭借其tpu和ocs在同类负载中实现了不错的性能/tco表现,但总的来说依然限制在了单个公司的单个云服务上,也很难给到厂商去提前评估的空间,所以并不算一个完善的第三方解决方案。
为此,amd推出了mi300x,一个纯粹的生成式ai加速器方案,内存带宽达到了可怕的5.2tb/s。与英伟达的h100 sxm 80gb相比,mi300x带宽提升了72%,容量根据版本差异有了60%或140%的提升。
基于mi300x,amd打造了一个名为无限架构的平台,将8块instinct mi300x互联在一起,实现1.5tb的hbm3内存。这与英伟达的8路hgx板和英特尔的8路ponte vecchio一样,看来未来高端服务器都会采用这套8路处理器的配置。
目前mi300a早已送样,而mi300x也已经在q3送样,相信明年起,我们就能在hpc和ai服务器上看到两块芯片的身影了。但这也注定了mi300系列更像是一次略显仓促的反击,amd真正的王牌,可能还是未来的instinct mi400。
集3d/2.5d混合计算大成的instinct mi400
在今年amd的q2财报会议上,amd ceo苏姿丰提到:“从这些工作负载和我们投资的技术来看,不只是现有产品,还有下一代mi400系列等,我们打造了一个极具竞争力且性能满足需求的硬件路线图。坦白说,大家讨论到amd往往都会提到软件路线图,我们也都看到了软件侧的一些改变。”
近期举办的darpa eri峰会上,amd cto mark papermaster也对mi400进行了一个小小的预告,它表示instinct mi400将成为3d/2.5d混合计算集大成之作。从收购xilinx以来,amd已经对其整体产品的封装和互联方案进行了大刀阔斧的改革,充分结合两家厂商在这方面的深入研究。
amd chiplet与封装进化路线图 / amd
amd将其称为一个全面化的设计,从芯片堆叠、封装、计算、内存、加速器、互联、软件栈和应用等方面进行系统级的优化,采用特定域的异构架构,深度集成处理器、封装与互联技术,且在所有层面都充分利用ai。
但上文也都反复提及了软件,这是amd不得不去解决的一个问题。虽然amd提供了一个简易的cuda移植路径,但正如联想hpc与ai部门总经理scott tease所说的那样,还达不到一站式解决方案的程度。
写在最后
amd作为与英伟达在消费图形领域竞争多年的对手,如今同样发力服务器与ai领域,势必也会带来新的市场格局。只要mi400在性能表现上达到预期,且发布时和发布后amd能做好软件生态的构建,都可能会对英伟达的主导地位造成一定威胁。不过考虑到发布时间,届时amd的mi400面对的可能是首次用上mcm封装的blackwell gb100 gpu。

红外热成像技术消防救援新应用?
苹果iPad Pro疑似iPhone X全面屏,搭载A11X芯片7nm工艺
观赛S11的正确打开方式,三星玄龙骑士已经为你准备好了
最新QI标准无线充电方案GPMQ8005A
智慧公安涉稳信息综合应用系统开发重点人员管控系统搭建
AMD对抗英伟达的王牌,MI Instinct
在数字化和新基建的浪潮下,建筑智能物联网行业迎来了新的发展机遇
15年前美国能源部要求苹果协助制造一款“绝密iPod”的尘封往事
一封邮件打破了学术界的清净:IEEE禁止华为的同事担任审稿人或编辑!
英国央行将发行数字货币 瞄准区块链技术
地化所等利用电生理信息在线监测植物胞内水分代谢
脑机接口的“校准”新成果,可以帮助残疾人在几秒钟内学会使用
华强北山寨三星note8评测:能看出是山寨机算我输!
pcb板各层画什么?丝印层 机械层 阻焊层 助焊层 信号层 钻孔数据层作用详解
遗传算法-人工神经网络提高数据分析处理效率
CVR-02高清录播机概述及功能
胶囊内镜发展史及六大生产厂家及其代表性产品汇总
智能电网将会成为未来电力行业发展的趋势
任正非:随时都愿意与阿联酋签订“无后门”协议
深度测评哈弗H6 Coupe 1.5T