英伟达放大招发布专业级显卡Quadro系列:人工智能,VR,深度学习都能干

近日(4月12日),英伟达在北京国家会议中心举行媒体发布会。会上英伟达展示了其发布不久的基于pascal架构的quadro系列显卡,包括:gp100、p2000、p4000、p5000、p6000等。
不同于geforce的消费级娱乐定位,quadro立足高端,面向专业级的需求,英伟达的愿景是让它们能够将台式工作站转变为具有突破性能力的超级计算机,并为不同行业的专业任务提供保障。
pascal架构的全新nvidiaquadro产品阵容致力于为企业提供视觉计算平台,简化设计和仿真工作流程。与上一代产品相比,新quadro产品不仅具有超快速内存,而且速度最多可以提升两倍(基于specviewperf12基准的计算结果)。
其中gp100为该系列的旗舰产品,被科技媒体和粉丝们称为超当量核弹。
quadrogp100参数及系列特点
gp100
gp100基于pascal核心,匹配16gbhbm2显存,单精度cuda核心数 3584个,双精度cuda核心数1792个,半精/单精/双精浮点运算性能分别是20tflops、10tflops和5tflops,带宽高达720gb/s,功耗235w。同其他新发布的专业卡一样,它的性能提升也是全方面的(比如同步多重投影、vrworks、irayvr),同时还强化了虚拟化、syncii、双路nvlink等。
这也是nvlink首次在windows系统上获得支持,此前仅仅用于ibmpower8系统和基于linux的dgx-1,带宽最高80gb/s。
这个系列官方给出的特点如下:
统一仿真、hpc、渲染和设计:gp100将前所未有的双精度性能与16gb的高带宽内存(hbm2)相结合,因此用户可以在设计过程中进行仿真,并以前所未有的速度采集逼真的多物理场仿真。客户能够将两个gp100gpu与nvlink技术相结合,并扩展到32gb的hbm2 ,以在单一工作站上创建庞大的可视化计算解决方案。
扩展后的quadrop6000(雷锋网现场拍摄)
探索深度学习:gp100提供超过20tflops的半精度计算,可谓在windows和linux环境中进行深度学习的理想开发平台。
将vr集成到设计和仿真工作流程中:vr认证的quadrogp100和p4000具有创建详细、逼真、沉浸式环境的能力,能够大规模实现更加宏大、更加复杂的设计体验。
尽享照片级真实感设计的优势:基于pascal架构的quadrogpu渲染照片级真实感图像的速度为cpu的18倍。
创建广阔的可视化工作区:可在多达四个5k显示器上以高分辨率和hdr颜色显示数据。
经济高效地构建超高分辨率及多显示屏配置:通过将多达8个p4000gpu和两个quadrosyncii显卡相结合,可通过单一机箱实现多达32个4k显示器的配置。
gpu在cae上的应用
sandeepgupte
ca(computeraidedengineering)指工程设计中的计算机辅助工程。英伟达专业可视化业务高级总监 sandeepgupte 表示:
对于这部分用户,大部分是使用类似ansys、abaqus等分析软件求解复杂工程和产品的结构力学性能。大规模的数据计算往往让设计分析的过程十分漫长,而如果使用cpu+gpu加速的方案将会大大的节省运算时间。
gpu加速计算是指在完成应用任务时,同时利用gpu和cpu。由于gpu出色的并行任务处理能力,将应用程序中计算密集部分的工作负载转移到gpu,同时仍由cpu运行其余程序代码。这样,从用户的角度来看,应用程序
流言终结者中有一段很有意思的视频,为我们直观的展示了相比于cpu,gpu的 的运行速度明显加快。并行计算为什么有如此令人震撼的优势。
视频 :点此观看
sandeep举了个实际的例子,在现场一个集成了一张gp100的工作站里,工作人员使用abaqus对一个模型进行了470万的网格划分和计算,由于时间关系,现场并未将计算完成。正是因为类似这样大规模的计算,往往需要运行数十个小时甚至是数十天才能完成。
不过sandeep告诉雷锋网,相比仅使用cpu计算的方案,gpu加速可以将计算时间将缩短为原来的1/3。
gpu在真实物理渲染(pbr)上的应用
也许你觉得cae的栗子还不够震撼,在图形渲染方面,英伟达中国区销售总监何犹卿表示,目前主流的渲染器都已经在做gpu加速平台,因为一帧4k的电影画面,如果还使用cpu渲染,需要288小时,而用gpu渲染只需要3个多小时。
gpu在深度学习上的应用
在深度学习领域,也是高性能gpu大展拳脚的地方,近年来深度学习的大发展除了科学家们孜孜不倦的学术探索外,和gpu运算能力的突飞猛进也密切相关。英伟达ceo黄仁勋曾表示:
计算机科学家综合yannlecun的卷积神经网络、geoffhinton的反向传播算法,以及stochastic的梯度下降训练法,加上吴恩达(andrewng)对gpu的大规模应用,来加快深度神经网络(dnn)的运算速度,才促进「深度学习」这项现代人工智能技术出现大爆炸般的发展局面。
对于人工智能未来将对设计工作产生的影响,sandeep介绍了一种叫做生成式制造流程的人工智能概念设计方法。比如设计者要设计一把椅子,一般情况下需要通过cad软件设计出两三个方案,然后交由决策者选择。
而有了人工智能参与后,设计者仅需提出边界条件,例如承重多少,自重多少,尺寸如何等等,人工智能就可以自动生成出上百种的设计方案供决策者挑选,这不但有助于遴选出最佳的设计方案,还能大大的缩短设计的周期。
gpu在vr上的应用
在vr的应用方面,为消费级玩家所熟知的geforce系列更多是针对个人娱乐的应用,而quadro系列则是面向专业级的任务。如果仅仅是游戏,即便画面的真实感和准确性有些许偏差,也不会造成太严重的后果。
但是如果是在工作决策中使用,那么就要求画面尽可能的逼真,这时候就需要quadro系列显卡和irayvr了。
据sandeep介绍,iray是nvidia的一款逼真的渲染解决方案,现已许可给dassaultsystèmes和autodesk等软件厂商。
利用iray应用,连接至quadro视觉计算设备(vca)后,就可以享受逼真的渲染体验。把多个quadrovca结合到一起后,基于光场实时计算,操作模型或场景时还能够捕捉到细微的光线和反射。
quest计划
sandeep还提到英伟达首次在国内推出了quest计划(quadroembeddedsystemprogram),即基于quadro的嵌入式系统计划,针对高性能嵌入式系统的开发者,开发企业可以申请加入此计划,英伟达将和他们合作设计适用于他们解决方案的gpu。
除此之外,英伟达还会提供设计包(designkit)、sdk、样本代码、训练等。该项目免费,并且没有设置申请数量的限制,但是由于致力于一同打造品质、可靠性和性能俱佳的高性能嵌入式解决方案,所以英伟达在合作伙伴的遴选上会比较谨慎。

浅谈三星全新折叠屏技术ECO²OLED
基于IDO-SBC3568主板说明PMIC RK809电量计的调试方法
机器人焊接出现的缺陷及应对措施
三星GalaxyS5拆解 做工及用料如何
基于CAN总线技术实现汽车检测线测控系统的设计
英伟达放大招发布专业级显卡Quadro系列:人工智能,VR,深度学习都能干
nfc手环怎么用_荣耀手环3nfc怎么使用
车辆智能无钥匙系统Keyless Entry System
美国 HP/惠普 33120A 函数信号发生器
海康威视称萤石网络将分拆至科创板上市
香港财政司司长陈茂波到访上海商汤AIDC,共话香港和内地科创协同发展
实际工作中的晶体管适用性确认-确认在SOA(安全工作区)范围内
什么是超微印刷锡膏?
前三季净赚200亿元!京东方将为苹果供应9000万部高端显示屏
奥拓电子设立全资子公司 推进“智能+”战略
英飞凌与Fingerprint Cards携手推动生物识别卡的大规模部署
工业用控制计算机为ETC系统带来了极大便利
关于手机屏幕的选择,AMOLED屏好还是LCD屏好
苹果2019年将发布的新机的正面照和介绍
ADI推出业界最小的四通道数字隔离器ADuM744x系列芯片