亚马逊网络服务与英伟达联手打造AI超级计算机

亚马逊网络服务公司(amazon web services)不久将拥有一台由英伟达(nvidia)制造的新型超级计算机,该公司称这是世界上速度最快的人工智能系统之一。
在使用 fp8 数据类型测试时,该系统可提供 65 exaflops 的人工智能性能。nvidia 负责超大规模和 hpc 的副总裁 ian buck 在新闻发布会上说,这也是世界上第一台基于 arm 的云计算 ai 超级计算机。       
新的dgx cloud project ceiba系统围绕nvidia组件构建,但经过调整后可连接到aws的nitro芯片,后者提供底层网络、存储和安全基础设施。         
project ceiba将于2024年安装完毕,届时可供客户使用。该系统与其他nvidia dgx cloud实施系统不同,后者已被克隆到微软的azure、甲骨文云和谷歌云上。         
65 exaflops的性能来自5个grace hopper超级芯片,机架由aws的弹性结构适配器连接,用于超级计算应用程序。         
buck说:这台新的超级计算机将在 aws 基础设施中运行,并由 nvidia 自己的研究和工程团队开发用于开发图形、大型语言模型研究的新人工智能,并用于数字生物学、机器人研究和自动驾驶汽车。         
aws 还发布了搭载英伟达h200、l40s和l4 gpu的新虚拟机。这些产品是在拉斯维加斯举行的 reinvent 大会上发布的。         
aws 还发布了其最新 cpu graviton4,它是 graviton3 的后继产品,将被用于 ec2。不过,亚马逊在一篇博客文章中称,与 graviton3 芯片相比,该 cpu 的内核增加了 50%,速度提高了 30%,内存带宽增加了 75%。         
ccs insight 首席分析师詹姆斯-桑德斯(james sanders)说,考虑到 graviton 处理器与 arm neoverse 内核设计发布节奏之间的关系,graviton4 的发布在意料之中。graviton4 以 neoverse v2 为蓝本,而 graviton 3 则以 neoverse v1 为蓝本。
两者在微架构上的主要变化是升级到了armv9,从而提高了进程隔离和向量扩展。桑德斯说:前者在云环境中非常有用,也是对 spectre 和 meltdown 等侧信道攻击的一种反应,而后者则对人工智能推理非常有用。
最新的cpu是graviton 3e,它是aws用于超级计算的最高性能cpu。桑德斯说,graviton4全面上市后,将有更多不同价位的实例类型可供选择。       
相比之下,微软新推出的 cobalt 100 是基于 arm 的 neoverse n2 css,也是 armv9。neoverse n 系列面向主流数据中心,而 v 系列则面向更高性能的工作负载,这将使 graviton4 更具优势。    
亚马逊也终于发布了名为 trainium2 的下一代训练芯片,其训练速度是近三年前发布的首款 trainium 芯片的四倍。 
亚马逊在一篇博文中说:它将能部署在多达 10 万个芯片的 ec2 ultraclusters 中,使基础模型和大型语言模型(llm)的训练只需极少的时间,同时能效提高达 2 倍。
aws 现在拥有两款 arm cpu,包括 nvidia 的 grace 和自己的 graviton4。nvidia的grace提供对gpu的访问,而graviton4提供对trainium的访问。graviton4 目前还不能与 nvidia gpu 协同工作。         
由于模型开发和定制的增加,这方面的需求是存在的,尽管这需要对针对 nvidia cuda 环境的项目进行一些工具调整。         
桑德斯说:奇怪的是,[aws 首席执行官]亚当-塞利普斯基(adam selipsky)指出,当谷歌正在使用第四代 tpu 时,其他云计算公司才在谈论它们的 ai 芯片。


在汽车中建立安全认证
Molex 发布 USB 智能模块,提升车内连接功能
三星Note20曝光将搭载1亿像素摄像头+支持5X变焦镜头的四摄组合
双通道电流检测放大器简化了H桥负载监视
机器学习程序识别假冒产品
亚马逊网络服务与英伟达联手打造AI超级计算机
MP3的前后盖的模具设计
灵犀微光荣获第八届金陀螺奖“年度优秀VR/AR光学设计奖”
如何通过调控溶质偏析和纳米析实现超高强钢
Zinn Labs 推出基于 PROPHESEE事件视觉传感器的视线跟踪系统,为 AI 智能镜框和 VR/MR 系统赋能
智能型连接式PND专用嵌入式开发工具
AMD寻求CoWoS产能,以拓展AI芯片市场
RISC-V可能真正能成为国产的自主的指令集架构
线性电源、可控硅电源、开关电源电路的区别和特点
机器人被逐步“唤醒” 生产效率和质量不打折
爱思强公布上半年第二季度业绩,MOCVD系统的需求上升
WDZ低烟无卤电缆
Parrot新一代四轴无人机ANAFI现推出Extended全能版套装
锡膏之所以会产生颗粒的情况,是什么问题?
C语言的哪些函数会导致内存溢出?如何改进?