强核问世:NVIDIA发布全球最强GPU——A100 80GB GPU

领先的系统提供商源讯、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想、云达科技、超微为世界各行业提供nvidia a100系统
加利福尼亚州圣克拉拉市 – sc20 - 2020年11月16日 – nvidia于今日发布nvidia a100 80gb gpu,这一创新将支持nvidia hgx ai超级计算平台。该gpu内存比上一代提升一倍,能够为研究人员和工程师们提供空前的速度和性能,助力实现新一轮ai和科学技术突破。
全新a100采用hbm2e技术,可将a100 40gb gpu的高带宽内存增加一倍至80gb,提供每秒超过2tb的内存带宽。这使得数据可以快速传输到全球最快的数据中心gpu a100上,使研究人员能够更快地加速其应用,处理最大规模的模型和数据集。
nvidia应用深度学习研究副总裁bryan catanzaro表示:“若想获得hpc和ai的最新研究成果,则需要构建最大的模型,而这需要比以往更大的内存容量和更高的带宽。a100 80gb gpu所提供的内存是六个月前推出的前代产品的两倍,突破了每秒2tb的限制,使研究人员可以应对全球科学及大数据方面最严峻的挑战。”
用于nvidia dgxtm a100和nvidia dgx stationtm a100系统的nvidia a100 80gb gpu也于今日发布,预计将于本季度发货。
领先的系统提供商源讯、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想、云达科技、超微预计将于2021年上半年,提供基于hgx a100集成底板的系统,该集成底板搭载4-8个a100 80gb gpu。
满足大流量数据工作负载需求
a100 80gb版本基于a100 40gb的多样化功能,成为需要大量数据存储空间的各类应用的理想选择。
dlrm等推荐系统模型为ai训练提供了涵盖数十亿用户和产品信息的海量表单。a100 80gb可实现高达3倍加速,使企业可以重新快速训练这些模型,从而提供更加精确的推荐。
hgx服务器中搭载的a100 80gb还可训练具有更多参数的最大模型,如gpt-2。gpt-2是具有超常生成文本能力的自然语言处理模型。这就消除了对数据或模型并行架构的需求,因为实现并行架构需要花费大量时间,而且跨多个节点运行缓慢。
凭借其多实例gpu(mig)技术,a100可分割为多达7个gpu实例,每个实例具有10gb内存。该技术是一种安全的硬件隔离方法,在处理各类较小的工作负载时,可实现gpu最佳利用率。对于如rnn-t等自动语言识别模型的ai推理,单个a100 80gb mig实例可处理更大规模的批量数据,将生产中的推理吞吐量提高1.25倍。
在tb级零售大数据分析基准上,a100 80gb将其性能提高了2倍,使其成为可对最大规模数据集进行快速分析的理想平台。随着数据的动态更新,企业可以实时做出关键决策。
对于科学应用,a100 80gb可为天气预报和量子化学等领域提供巨大的加速。材料模拟软件quantum espresso采用单节点a100 80gb实现了近2倍的吞吐量提升。
riken计算科学中心负责人satoshi matsuoka表示:“快速、充足的内存带宽和容量对实现高性能超级计算应用来说至关重要。具有80gb hbm2e gpu内存的nvidia a100提供2tb/s的全球最快带宽,可帮助我们大幅提高应用性能。”
a100 80gb的关键特性
a100 80gb具备nvidia ampere架构突破性特性:
●第三代tensor core核心:通过全新tf32,将上一代volta架构的ai吞吐量提高多达20倍。通过fp64,将hpc性能提高多达2.5倍。通过 int8,将ai推理性能提高多达20倍,并且支持bf16数据格式。
●更大、更快的hbm2e gpu内存:使内存容量增加一倍,在业内率先实现2tb/s以上的内存带宽。
●mig技术:将单个独立实例的内存增加一倍,可最多提供七个mig,每个实例具备10gb内存。
●结构化稀疏:将推理稀疏模型的速度提高2倍。
●第三代nvlink和nvswitch,相较于上一代互连技术,可使gpu之间的带宽增加至原来的两倍,将数据密集型工作负载的gpu数据传输速度提高至每秒600 gigabytes。
nvidia hgx ai 超级计算平台
a100 80gb gpu是nvidia hgx ai超级计算平台的关键组件。该平台将nvidia gpu、nvidia nvlink® 、nvidia infiniband网络以及全面优化的nvidia ai和hpc软件堆栈的全部功能整合在一起,以提供最优越的应用性能。该平台使研究人员和科学家能够将hpc、数据分析和深度学习计算技术结合起来,共同推动科学进步。

消除自激振荡的常用方法有
边缘计算网关有哪些应用场景?边缘计算网关应用场景大汇总
华为的鸿蒙系统和HMS是什么?存在怎样的关系
Intel发布全新Sunny Cove架构 新CPU和新GPU全新发布
探讨先进制程冲刺战中的核心技术及玩家格局
强核问世:NVIDIA发布全球最强GPU——A100 80GB GPU
关于物联网浪潮对于智能硬件的影响分析和介绍
多部门酝酿政策组合拳扶持光伏
COB集成封装技术引领LED产业进入新一轮增长周期
雷军:公布小米MIX2的细节,100%的屏占比!对垒iPhone8
为什么要说HTC“又”裁员了
FPGA上可以用一个比较器实现ADC的功能?1
无线收发数传MODEM模块PTR2000的特点、引脚功能与应用介绍
将framebuffer保存为图片来检查内容正确性
电源和电源管理方案总概论
博通收购高通可能吗_高通拒绝博通收购
鸿蒙系统更新机型名单 荣耀升级鸿蒙的机型名单
黑夜里的捕蚊专家,灭蚊灯哪个牌子好
【干货】触摸屏与PLC通讯不上的原因及解决方案经验分享
西门子PLC在工厂中的应用常见问题分析