GPU的巨大压力即将到来

gpu涨的不仅是价格。
今年以来,直线上升的aigc市场带热了gpu。trendforce集邦咨询表示,2023年ai服务器出货量(包含搭载gpu、fpga、asic等)出货量预估近120万台,年增率近38%,ai芯片出货量同步看涨,可望成长突破五成。
然而,供应短时间难以跟上需求的爆发。“一切都在等英伟达”,李平是某ai公司高管,他向记者透露,其公司在4月下单了服务器产品,但是因为服务器公司的gpu尚未到货,至今没有准确交货期,“现在再签服务器合同都是没有违约条款,不签货期的,只能选择等或者直接取消订单”。
对 gpu 硬件或更好的加速器的需求从未如此之大,如果这种趋势持续下去,当前的高需求可能会延续到不久的将来。就hpc领域而言,这一趋势表明 gpu 未来将会变得昂贵且难以找到,除非是购买的数量足以直接向供应商购买。 
gpu非常适合加速矩阵运算,通常这也是许多 hpc 应用程序的核心。它们提供 simd(单指令多数据)处理单元,可以加速复杂的并行数组操作。正如人们经常指出的那样,hpcgpu 市场在一定程度上要归功于规模大得多(约 7 倍)的游戏市场,它帮助支付了硬件成本,让游戏玩家能够飞越星系,同时允许科学家模拟星系。 
加密货币市场改变了这种低端动态。就加密货币而言,游戏 gpu 非常擅长快速查找唯一数字并产生热量。市场需求相当高,但由于加密市场的不断发展,需求似乎正在下降。
在高端市场,情况就完全不同了。根据雅虎财经的一篇文章,reports insights 的一份报告预测:“受图形处理器 (gpu) 科学模拟、数据分析和人工智能需求不断增长的推动,全球图形处理器 (gpu) 市场预计在 2022 年至2030 年期间复合年增长率为 33.5%。”
然而,对于 gpu 市场供应商来说,这是个好消息,对于最终用户来说,llm(大型语言模型,如 chatgpt)的增长创造了对 gpu 的新需求,而严格意义上来说,gpu 并不属于传统 hpc 市场的一部分。
以 inflection ai 为例,该公司正在开发一种名为“pi”的“个人人工智能”聊天机器人。为了实现这一目标,该公司建造了一台配备 22,000 个英伟达 h100 gpu 的超级计算机。为了提供一些背景信息,frontier 是 6 月 23 日 top500 列表中排名第一的系统,拥有37,632 个 gpu。 
inflection ai 的情况并非独一无二。semianalysis报告的另外两个数据点也支持同样的趋势。
“即使 openai 也无法获得足够的 gpu,这严重阻碍了其近期路线图。由于 gpu 短缺,openai 无法部署其多模态模型。“ 
 正在寻找 flops?
幸运的是,gpu 对于 hpc 来说并不是必需的。然而,最新的 top500 系统统计表明,37% 的机器使用 gpu。这个数字正在增加,并且随着系统进入 exaflops 领域,加速器的使用将继续。
如前所述,gpu 不是必需的,但对于许多 hpc 应用程序来说通常是可取的。由于生成式 ai 行业爆炸式增长的巨大需求,许多 hpc 现场采购和/或云场景的担忧是gpu 的全面可用性(短缺)。“任何 gpu”(英伟达、amd 或英特尔)的高市场需求可能会促使 hpc 从业者考虑仅使用 cpu 的解决方案来帮助加速其代码(例如,众核、avx-512、hbm、3d v-cache 等) 。
对“gpu 周期”的搜索也可能会带来一些新颖的方法。回想一下,hpc 中的一些原始 gpu 应用程序始于标准 gpu 卡和一种名为“brook ”的新语言,该语言是 cuda 的前身,并在第一段中提到的一些早期 gpu 卡上运行。一开始,这种方法似乎有点“尴尬”,但速度的提高是不容忽视的,结果重塑了 hpc 领域。 
最近,一个有趣的消息是,最新版本的 amd rocm gpu 库(v5.6) 提供了对移动和桌面级 igpu(集成 gpu)的支持。 在linkedin 上的一篇简短帖子中,hpc 专家 jamescuff 能够使用 ryzen 9 6900hx 桌面处理器在cpu 和 cpu/igpu 上运行 tensorflow 基准测试。同样的基准测试在 cpu 上运行需要 13 秒,在cpu/igpu 组合上运行需要 3 秒。当然,还需要更多的测试,但正如对 flops 的搜索将目光转向了早期基于 gpu 的显卡一样,寻找内部 gpu 可能会为 hpc 组合添加一些未使用和可用的 flops。gpu 的巨大压力已经到来。


WT2003H-A01:支持U盘自主更新语音的MP3芯片,UART通信语音IC
场效应管所有厂家的中英文对照表
DeepMind要在医疗领域放大招,开发眼底AI,用AI预测急性肾损伤
滤波器产值持续增长,全球主要手机品牌的射频供应链
这些让你装比满满的快捷键,可以让你效率提升3倍以上 一定要知道
GPU的巨大压力即将到来
使用51单片机控制红外遥控芯片的资料和解码程序
哪些因素会导致MCU复位
英特尔落后微软 英特尔能否重塑昔日辉煌?
3分钟轻松实现串口连接MCGS触摸屏应用案例
争抢AI人才,OPPO华为们要从大学里攻坚前沿科技
深入介绍晶圆代工巨头台积电的先进封装
今年台湾半导体产业产值规模可达到新台币3.21兆元
高岘案例——广州荣大科技有限公司
韩国研究团队开发出同时提高Micro LED的电学与光学效率的技术
手机拍照哪家强?华为P10、美图T8、OPPOR11优缺点评测分析
ios15息屏显示功能开启
mstp协议原理详解
作为Fab-Liter战略的一部份,安森美剥离晶圆制造厂
IR2117 单通道MOSFET或IGBT栅极驱动器集成电路