深度学习框架只为GPU? 答案在这里

目前大多数的机器学习是在处理器上完成的,大多数机器学习软件会针对gpu进行更多的优化,甚至有人认为学习加速必须在gpu上才能完成,但事实上无论是运行机器学习的处理器还是优化的深度学习框架,都不单只针对gpu,代号为“skylake”的英特尔至强sp处理器就证明了这一点。
机器学习软件在英特尔至强sp系列白金版上的一系列基准测试性能表现与在gpu上非常相近,了解了底层架构之后,我们可以看到,在性能如此接近的情况下,使用gpu加速器更像是在购买一种“奢侈品”,用户在gpu以外还有很多其他的选择。毫无疑问,在用户只需要机器学习的情况下,“加速器”在性能和能耗方面更有优势,大多数人需要的不只是一台“智能的用于机器学习的服务器”,那就让我们来重点看一下英特尔至强sp 白金级处理器为什么是最佳的选择:
cpu优化深度学习框架和函数库
英特尔在基于gpu优化的框架中增加了cpu优化深度学习框架, 打破了深度学习框架偏重于gpu而忽视了cpu的行业现状,解决了目前这些框架缺乏cpu优化的实际问题。
- tensorflow由谷歌开发,是一个领先的深度学习和机器学习框架,有面向linux的处理器优化
- caffe是图片识别领域最受欢迎的应用之一,英特尔提供的优化可以在cpu运行时提高caffe的性能
- torch是当下流行的深度学习框架,需要在优化的cpu上应用,可以通过英特尔软件优化(比如英特尔至强可扩展处理器)提高torch在cpu上的性能
- theano是一个开源的python库,很受机器学习程序员的欢迎,它可以帮助程序员高效地定义、优化和评估涉及多维阵列的数学表达式
- neon是一个基于python的深度学习框架,目的是在现代深度神经网络上实现易用性和可扩展性,并致力于在所有硬件上实现性能的最大化
- mxnet是一个开源的深度学习框架
- python及其函数库是机器学习应用里最受欢迎的基础组成,python加速版过去几年里得到了广泛应用,并且可以直接下载或通过conda、yum、apt-get或docker images下载
- bigdl是一个面向apache spark的分布式深度学习函数库。通过bigdl用户可以把自己的深度学习应用当作标准apache spark程序来编写,直接在现有apache spark或hadoop集群上运行。在torch基础上开发的bigdl可以为深度学习提供综合性支持:包括数值计算(通过tensor)和高级神经网络;此外用户还可以利用bigdl把提前训练的caffe或torch模型载入spark程序。英特尔曾声称在一个单节点至强处理器上(例如与gpu相比),bigdl中的处理速度比原始开源caffe、torch或tensorflow要高一个数量级
- 英特尔mkl-dnn是一个开源的、性能强化的函数库,用于加速在cpu上的深度学习框架
- 英特尔数据分析加速库(daal)是一个包含了被优化的算法构建模块的开源函数库,针对大数据问题最相关的数据分析阶段。这个函数库适用于当下流行的数据平台,包括hadoop、spark、r和matlab
结果证明了一切,无论是tensorflow、caffe,还是torch、theano,这些深度学习框架都针对英特尔数学核心函数库(intel mkl)和英特尔高级矢量扩展指令集(intel avx)进行了优化。通过cpu优化,tensorflow和caffe基准测试中的cpu性能分别提高了72倍和82倍。
机器学习加速器
科技与行业的发展都是瞬息万变的,机器学习的加速器也会从gpu转向fpga、asic等等,除非我们永远只需要一台只能用于机器学习的服务器,只要在一台服务器上想实现可以支持各种的工作负载,英特尔至强可扩展处理器无疑是最佳的解决方案。加速器的选择正在变得多元化,这是整个行业的发展趋势,多核cpu(英特尔至强融核处理器,特别是“knights mill”版)和fpga(英特尔至强处理器,包含intel/altera fpga)都可以提供更灵活的选择、卓越的性价比和高能效。基于英特尔至强融核处理器训练或学习一个alexnet图片分类系统的速度,是使用nvidia gpu的类似配置系统的2.3倍;英特尔至强融核处理器的性价比最高可以是gpu解决方案的9倍,每瓦性能高达8倍,英特尔nervana将推出更多专为人工智能开发的产品。英特尔至强sp系列处理器为机器学习提供了卓越的性能,同时相比其他解决方案也为我们带来了更多的功能与选择,让我们在产品与行业的发展中都可以拥有更多可能。

详解数字音频技术和I2S总线协议
2023工业互联网标识解析十大趋势正式发布
索尼展示Xperia Touch 增强现实投影技术快成为现实
华为登上通信技术国际舞台 5G标准之路任重道远
AI硬件大爆发 人工智能全面占领CES
深度学习框架只为GPU? 答案在这里
狂风暴雨!苹果!三星!华为!小米!
5g如何改变我们的生活 5g技术在生活中的应用
什么是压力露点_压力露点简介
为智能网联汽车提供贯穿研发验证到产线测试的智能测试方案
PWM逻辑电路及输出电路
基于多功能混合信号管脚实现的测试解决方案
VR/AR混改员工持股试点企业未来媒体宣布获得千万级A轮融资
三分钟带你了解纱幕全息投影的展示优势
新唐科技重磅推出Cortex®-M4 微控制器NUC472 系列
古石科技18WUSBPD充电器拆解 显著降低方案成本以及成品的体积
基于晶体管TIP41的4W音频放大器电路
耦合电容器和电压互感器的区别
浅谈苹果在自研芯片方面的野心
深圳松岗安监环保部门规范电镀线路板企业自动化升级改造