使用NVIDIA操作符加速Kubernetes

kubernetes 是一个开源的容器编排系统,用于自动化计算机应用程序部署、扩展和管理。它是一个非常流行的工具,可以用于自动展开和回滚、水平扩展、存储编排等。对于许多组织来说, kubernetes 是其基础架构的关键组件。
安装和扩展 kubernetes 的一个关键步骤是确保它正确利用基础设施的其他组件。 nvidia 运营商优化 kubernetes 上的 gpu 和 nic 的安装和管理,使软件堆栈能够在云中运行最需要资源的工作负载,如 ai 、 ml 、 dl 和 hpc ,数据中心和边缘。 nvidia 运营商由 gpu 运营商和网络运营商组成,是开源的,基于运营商框架。
nvidia gpu 运算符
nvidia gpu 操作符被打包为一个 helm 图表,并安装和管理软件组件的生命周期,以便 gpu 加速的应用程序可以在 kubernetes 上运行。这些组件包括 gpu 功能发现、 nvidia 驱动程序、 kubernetes 设备插件、 nvidia 容器工具包和 dcgm 监控。
gpu 操作符使基础结构团队能够在集群级别与 kubernetes 一起使用时管理 gpu 的生命周期,因此无需单独管理每个节点。以前,基础架构团队必须管理两个操作系统映像,一个用于 gpu 节点,另一个用于 cpu 节点。当使用 gpu 操作符时,基础设施团队也可以将 cpu 映像与 gpu 工作节点一起使用。
nvidia 网络运营商
网络运营商负责自动化 kubernetes 集群中主机网络组件的部署和管理。它包括 kubernetes 设备插件、 nvidia 驱动程序、 nvidia 对等内存驱动程序和 multus 、 macvlan cnis 。这些组件以前是手动安装的,但通过网络运营商实现了自动化,简化了部署过程,并通过增强的客户体验实现了加速计算。
单独或一起使用, nvidia 操作符简化了 kubernetes 上的 gpu 和 smartnic 配置,并与合作伙伴云平台兼容。要了解有关这些组件的更多信息,以及 nvidia 操作员如何解决运行 ai 、 ml 、 dl 和 hpc 工作负载的关键挑战,并简化初始设置和第 2 天操作,请查看按需网络研讨会“ 用 nvidia operators 加速 kubernetes ”。
关于作者
troy estes 是 nvidia edge 和企业计算解决方案的产品营销经理。在加入 edge & enterprise 业务部门之前,特洛伊曾在自主汽车业务部门和 nvidia 电网产品集团从事营销活动和支持产品 gtm 。


替代Windows有望 国产UOS系统30秒内开机办公体验流畅
工程师的奇思妙想!在又一波合宙新品到来之前,先评个奖
耕升G魂RTX2080极客版评测 市售最强非公RTX2080
!租售/收购/维修HP8642M信号源HP8642M 小兵/
5G-A是通向6G的必由之路
使用NVIDIA操作符加速Kubernetes
环氧树脂固体绝缘开关柜常见故障
诺基亚8 华为P10 iPhone8 三星S8大批旗舰机来袭
800V电驱系统电气架构技术分析
ARM STM32中的程序是在RAM里还是在FLASH里运行?
BL304控制器具备开关量输入输出接口
RISC-V声名鹊起,究竟为何?
六点定位原理
ChatGPT:高算力AI应用持续推动内存芯片升级
iQOO 7今天正式发布!详细规格参数信息曝光
有源去磁正激电源变压器的计算
谷歌街景数据建立车祸预测新模型
GlobalFoundries流片20nm测试芯片
可隔空与手机连接的超声波通信协议
FIBBR2022 HDMI2.1光纤线新品品鉴会顺利举行