根据英伟达官方的消息,在 aws 运行 nvidia gpu 十周年之际,aws 发布了采用全新 a100 的 amazon ec2 p4d 实例。
it之家了解到,现在已全面上市的全新 aws p4d 实例采用最新 nvidia a100 tensor core gpu。a100 计算卡采用了 7nm 工艺的 ga100 gpu,这款 gpu 拥有 6912 cuda 核心和 432 张量核心。gpu 封装尺寸为 826mm2,集成了 540 亿个晶体管。
英伟达表示,全新的 p4d 实例,为机器学习训练和高性能计算应用提供 aws 上性能与成本效益最高的 gpu 平台。与默认的 fp32 精度相比,全新实例将 fp16 机器学习模型的训练时间减少多达 3 倍,将 tf32 机器学习模型的训练的时间减少多达 6 倍。
这些实例还提供出色的推理性能。nvidia a100 gpu 在最近的 mlperf inference 基准测试中一骑绝尘,实现了比 cpu 快 237 倍的性能。
每个 p4d 实例均内置八个 nvidia a100 gpu,通过 aws ultraclusters,客户可以利用 aws 的 elastic fabric adapter(efa)和 amazon fsx 提供的可扩展高性能存储,按需、可扩展地同时访问多达 4,000 多个 gpu。p4d 提供 400gbps 网络,通过使用 nvlink、nvswitch、nccl 和 gpudirect rdma 等 nvidia 技术,进一步加速深度学习训练的工作负载。efa 上的 nvidia gpudirect rdma 在服务器之间可通过 gpu 传输数据,无需通过 cpu 和系统内存,从而确保网络的低延迟。
华为云对象存储OBS,安全可靠的云存储服务,让企业轻松上云
泰克携旗下品牌吉时利入围EDN 2014最佳测试产品奖
微软与高通联手,Winhec联盟已经到了最紧密的时刻
小米、联想销量跌出前五 低价手机难再成撒手锏?
直流电机调速(simulink)—检测篇
英伟达 A100 GPU 全面上市,推理性能比 CPU 快 237 倍
国产主板中显卡的关键作用与不同类型电脑主板全面解析
PDF Solutions:为半导体行业提供数据和分析解决方案的领先供应商
LinearLT3697输入降压型开关稳压器的特点介绍
中国采用先进移动通信技术的比例还有待进一步提升
2020年厨电行业将会如何发展
冬季电气火灾隐患需重视,“黑科技”带来安全保障
Semtech和Helium宣布在全美部署全新LoRaWAN网络
新能源电瓶修复——细说电池极板硫化的特征与原因2
重庆成功研制液晶面板和触摸屏等光刻装备
运动蓝牙耳机什么牌子的好、最适合跑步用的耳机
苹果AirPods Max开创头戴式耳机的全新标准
功率市场“C位”是它——Transphorm!
PoW算法,可以在ASIC和GPU挖掘设备之间进行竞争
当红齐天完成A轮融资 获得英特尔战略投资