谷歌 deepmind 与谷歌研究团队所使用的 nvidia 生成式 ai 技术已经过优化,现可供全球谷歌云客户使用
google cloud next — 2023 年 8 月 29 日 — 谷歌云(google cloud)与 nvidia 于今日宣布推出全新 ai 基础设施和软件,帮助客户构建和部署用于生成式 ai 的大规模模型,加快数据科学工作负载的速度。
在 google cloud next 的炉边谈话中,谷歌云首席执行官 thomas kurian 与 nvidia 创始人兼首席执行官黄仁勋讨论了双方合作如何为全球一些最大的 ai 客户提供端到端的机器学习服务,包括通过基于 nvidia 技术构建的谷歌云产品轻松运行 ai 超级计算机。新的软硬件集成将使用谷歌 deepmind 和谷歌研究团队在过去两年中所采用的 nvidia 技术。
黄仁勋表示:“我们正处于一个拐点,加速计算与生成式 ai 的组合将以前所未有的速度推动创新。此次扩大与谷歌云的合作,将帮助开发者通过能源效率提升同时降低成本的基础设施、软件和服务加快工作速度。”
kurian 表示:“谷歌云很久以前就开始通过 ai 领域的创新推动和加速客户创新。谷歌的众多产品都是在 nvidia gpu 上构建和提供的,我们的许多客户都想要通过 nvidia 加速计算提升大语言模型(llm)的开发效率,以推进生成式 ai 的发展。”
加快 ai 和数据科学发展的 nvidia 集成
谷歌用于构建大规模大语言模型(llm)的框架——paxml,现已针对 nvidia 加速计算进行了优化。
paxml 最初是为覆盖多个谷歌 tpu 加速器片而构建的。现在,paxml 助力开发者使用 nvidia h100 和 a100 tensor core gpu 进行高级、完全可配置的实验与扩展。经 gpu 优化的 paxml 容器可在 nvidia ngc 软件目录中即刻获得。另外,paxml 还可在 jax 上运行,jax 使用 openxla 编译器针对 gpu 进行了优化。
谷歌 deepmind 和其他谷歌研究员是首批将 paxml 与 nvidia gpu 一起用于探索性研究的人。
很快,nvidia 针对 paxml 优化的容器就会在 nvidia ngc 容器注册表上向全球正在构建下一代 ai 应用的研究员、初创公司和企业开放。
此外,两家公司还宣布谷歌通过 dataproc 服务将 serverless spark 与 nvidia gpu 进行集成。这将帮助数据科学家加速 apache spark 工作负载,为 ai 开发准备数据。
以下这些新的集成是 nvidia 与谷歌长期广泛合作的最新成果,涵盖了硬件和软件领域,包括:
由 nvidia h100 驱动的谷歌云 a3 虚拟机:谷歌宣布,由 nvidia h100 gpu 驱动的谷歌云 a3 虚拟机将于下月全面上市,这将使 nvidia 的 ai 平台能够更加方便地被用于各种工作负载。与上一代产品相比,a3 虚拟机的训练速度提高了 3 倍,网络带宽也显著提升。
nvidia h100 gpu 将为谷歌云 vertex ai 平台提供动力:h100 gpu 预计将在未来几周内通过 vertex ai 全面上市,帮助客户快速开发生成式 ai 大语言模型(llm)。
谷歌云将获得 nvidia dgx gh200 访问权限:谷歌云将是全球首批获得 nvidia dgx gh200 ai 超级计算机(搭载 nvidia grace hopper 超级芯片)访问权限的公司之一,将率先探索其在生成式 ai 工作负载方面的能力。
nvidia dgx 云将登陆谷歌云:客户可直接通过网络浏览器使用 nvidia dgx 云 ai 超级计算和软件,体验高级训练工作负载所需的速度和规模。
nvidia ai enterprise 将登陆谷歌云市场:nvidia ai enterprise 是一个安全的云原生软件平台,可简化生成式 ai、语音 ai、计算机视觉等企业就绪型应用的开发和部署。
谷歌云将率先提供 nvidia l4 gpu:今年早些时候,谷歌云推出了 g2 虚拟机,成为首家提供 nvidia l4 tensor core gpu 的云供应商。nvidia 客户在将 ai 视频工作负载从 cpu 切换到 l4 gpu 后,可提升高达 120 倍的性能和 99% 的效率。l4 gpu 广泛用于图像和文本生成,以及 vdi 和 ai 加速的音频/视频转码。
gtc 2024 演讲、海报和培训实验室内容征集现已开放。点击 “阅读原文”或扫描下方海报二维码,报名参加 gtc 演讲,分享您近期取得的成就。
原文标题:谷歌云与 nvidia 扩大合作,共同推进 ai 计算、软件和服务的发展
文章出处:【微信公众号:nvidia英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
英特尔酷睿i3版MateBook13怎么样 值不值得买
音圈马达无人机让高速通行效率大大提高
智联安首颗5G LPHAP低功耗高精度定位芯片即将面世
2022锂电铜箔市场三大演变
FPGA编程语言之verilog语法1
谷歌云与 NVIDIA 扩大合作,共同推进 AI 计算、软件和服务的发展
锅炉低负荷运行时注意事项
聚焦两轮,哈啰的长期主义
红米Note5和魅蓝E3哪个好
三星将在本月发布一款新的Chromecast流媒体设备和一款新的智能音箱
浅谈AVR中定时器几种工作模式
SoundHound欲进军中国市场 人工智能时代要来了?
医疗数据/记录的数字化只是实现现代医疗保健的第一步?
省电液晶驱动/液晶IC/LCD驱动芯片VK0384 LQFP64 FAE支持
如何选择一款合适的直流伺服电机和减速机
探讨利用仪表放大器的平衡和CMR特性的方法
受FPGA开发系统控制的MEMS传感器和数据转换器件
外媒细谈Oculus Rift虚拟现实设备
槽式太阳能热发电技术的现状及进展
电源采用STR6708A的TCL彩电的一个通病