NVIDIA Quantum-2 InfiniBand 平台助力杜伦大学创新和改进超算基础设施

nvidia 推出 “ai 改变行业未来” 系列文章,邀你一起见证科技力量。本周带来第七期 “ai 改变行业未来” 之高等教育和研究。
高等教育机构处在重大全球挑战的前沿,负责培养 ai、加速计算和数据科学领域的创新者。同时,各大机构需要满足人们对更灵活,更易获取的教育方案的需求。从本地到云,nvidia 提供的工具可随时随地推动重要学科的探索发现。
扩展基础设施
借助集中式基础设施和优秀的计算能力,处理大型工作负载、提高效率并降低运营成本。
推动创新
使用加速探索、实验和部署的工具,扫清发现道路上的障碍。研究人员可以借助由 gpu 加速的 ai 和高性能计算 (hpc),运用建模、模拟和实验数据来解决艰难挑战。
强化学习
让学生掌握关键的 ai 和高性能计算技能,促进其职业发展。为教育机构提供培训和基础设施解决方案,促进新一代的研究。
虚拟gpu加速印第安纳州课堂
印第安纳大学(iu)正在建造两台 ai 超级计算机,它们共装有 616 个 a100 gpu。由慧与建造的 big red 200 将为印第安纳大学的九个校区提供服务。由戴尔科技建造的 jetstream-2 将为康奈尔大学,及夏威夷大学等多家合作机构的工作提供支持。
a100 能够将处理器的处理性能分成多个部分,使得 jetstream-2 能够承载数百名学生同时参加的课程,每名学生都能使用一部分 gpu 性能来学习流行的图像分类等 ai 技能。印第安纳大学的一名研究人员在去年11月提交了一篇论文,描述了对该虚拟 gpu 功能所进行的基准测试。
目前超过 2500 名学生使用印第安纳大学目前的 gpu 加速系统。去年,该大学创纪录的 10 亿美元研究合同和拨款分布在 178 个学院,其中超过 40%的工作由这些系统运行。
印第安纳大学普适技术研究所首席运营官、ai-for-everyone 计划负责人 winona snapp-childs 表示:“资助机构意识到机器学习在 ai,加速计算等学术领域的重要性有助于推动科学发展。我可以想象,在未来的 5 到 10 年内,可能近一半的研究都将用到这些技术,它们将变得无处不在,并成为学术研究中必不可少的技术。”
密西西比州立大学乘上 400g 网速列车
密西西比州立大学将使用 nvidia quantum-2 infiniband 平台。它是构建 orion 新系统的首选网络,orion 是密西西比州立大学管理的四个集群中最大的一个集群,这四个集群全部使用较早版本的 infiniband 网络所构建。
orion 和新系统均由美国国家海洋和大气管理局 (noaa) 所资助,由戴尔科技建造。orion 和新系统将承担 noaa 的工作任务,以及密西西比州立大学的各项研究课题。orion 在 2019 年 6 月首次登上 top500 榜单,并被列为美国第四大学术超级计算机。
密西西比州立大学高性能计算总监 trey breckenridge 表示:“我们在密西西比州立大学的四代超级计算机中都使用了 infiniband,所以我们知道它既强大又成熟,可以可靠地运行我们需要的大型工作。”
dpu 助力杜伦大学创新和改进超算基础设施
杜伦大学的计算宇宙学院和计算机科学系,他们正在对地震波和引力波的传播进行大规模模拟,该模拟使用动态笛卡尔网格和 exahype 代码将大部分的计算转化为多任务操作。
在过去几年中,他们付出了大量的精力来标记和识别那些需要与其它网格发生变化的节点或任务同步的关键任务。由于存在大量的低优先级任务,保证整个系统的负载平衡的工作量将会很大。即使达到最佳负载平衡后,一旦域内任何参数发生变化,系统立刻就会随之变得不平衡,要想再次达到最佳负载平衡会非常困难并且会耗费大量的时间或成本。
为了提升系统的应变能力,研究人员必须将轻量任务和闲置任务转移到其它资源上,但是,编排就会变得十分困难,同时通过调节 mpi 运行时来确保在正确的时间用正确的步长来进行计算,也会抢占计算资源。
凭借 bluefield dpu 计算核,杜伦大学可以使用 dpu 作为 mpi 处理引擎来节省计算资源,例如观察和引导任务,以及及时缓存/接受任务等。这项工作延伸了 exahype 组织内部的研究合作,尤其是 tum 的 michael bader 小组,对于以 cpu 核心的计算任务提出来一个全新的观点,即开始由智能网络承担起数据处理工作。
原文标题:ai 改变行业未来: 加速高等教育和研究领域新发现
文章出处:【微信公众号:nvidia英伟达】欢迎添加关注!文章转载请注明出处。


【赋能IoT生态系列5之2】羽量级远程智控升级方案
“倒春寒”来临是下马威还是警醒?国产机器人什么时候才能迎来春天?
退耦电容为什么不一定要100nF
选择红外测温仪的重要参数有哪些
关于二维影像扫描器益处分析和应用
NVIDIA Quantum-2 InfiniBand 平台助力杜伦大学创新和改进超算基础设施
谈谈Redis怎样配置实现主从复制?
蒸汽回收机回收冷凝水的优势是什么
蔚来eT7与固态电池包同时发布 是要抢谁的“蛋糕”
面向消费类电子和工业应用的NFC解决方案
比特币核心开发商LukeDash Jr希望将比特币链的块大小缩小到300KB
百威利用人工智能改造啤酒行业的发展场景
黑莓近年转型有成 下一步将聚焦物联网市场
树校企联合典范,第二届TI西电卓越工程师培养计划圆满落幕
英创信息技术ARM9工控板在远程监控领域的应用
一加7T和一加7T Pro的外观曝光区别在于摄像头的设计
如何计算地平面上方走线的电感?
感受一下“无脸”手表无限创意
智能太阳镜:让色盲者的世界重现色彩
使用NTC热敏电阻来检测温度的变化