深度解析华为“很吓人的技术”:GPU Turbo

华为gpu turbo这一项技术首先是在6月6日的荣耀play上搭载,在发布会前余承东对自家gpu turbo技术的宣传语就是”一项很吓人的技术”。
根据官方解释:gpu turbo是一种类似汽车上涡轮增压的技术,是一种软硬协同的图形加速技术,能够提高手机gpu的性能,图形处理效率提高60%。
这项技术公布后,有很多媒体也做了相关的测试,数据显示其确实能提高游戏的帧率和画面流畅感和惊喜度,同时也优化了发热和降低功耗。不过官方对这项技术的实现形式却并没有说仔细,只对外说了这是一个软硬件协同优化的技术。
有媒体提到:gpu turbo并没有官方形容得那么”吓人”,从人工智能角度来看,它其实是基于智能场景识别调度优化的,现在看来其并没有针对某一游戏专门优化,而是全局性的,背后涉及到比较复杂的算法。
可以确认的是,gpu turbo这项图形加速技术确实能增强图像处理游戏的体验,不过他具体的原理是怎样却并不清晰。在今年2018 ifa展会上,荣耀手机总裁赵明便举行了一场面对全球媒体的gpu turbo的沟通会。会后知名科技媒体anandtech通过对荣耀技术人员采访和沟通,总算把这项技术的实现理清了。
gpu turbo的机型升级计划
gpu turbo是一项软件技术,他能够通过升级算法用在旧设备上,令他们的性能得到提高。随着今年emui 9.0的发布,gpu turbo技术也将会升级到2.0的版本。
在今年接下来的几个月里面,华为已经制定了其华为和荣耀机型升级搭载gpu turbo技术的计划,保证其主流的机器都搭载这项最新的技术。华为方面也承诺,所有的设备,不论你的硬件是什么配置,其都会得到一定的gpu性能提升。
从这份升级计划里面可以看到,gpu turbo的升级包含了华为和荣耀近两年来所发布的机型。
anandtech方面谈到:gpu turbo在发布后,网上有大量关于这个技术的宣传和营销文章,不过可惜并没有任何关于gpu turbo技术的解析,同时它如何工作也是不晓得的。
在今年的ifa上,通过这场gpu turbo的媒体沟通会,终于有机会与华为的软硬件工程师沟通,把gpu turbo的不为人知的秘密解开。
gpu turbo实际是ai调度技术?
在gpu turbo技术的一些推广上,华为声称其能够在某些情况下提高60%的gpu性能,同时把功耗降低30%。实际了解莫尔定律和有一定技术常识的读者都了解,在不提升工艺制程的情况下,能把gpu性能提升接近60%,而且功耗降低30%,这是基本不可能的。要想想,麒麟960到970,16nm提升到10nm,其cpu、gpu的性能提升也只是30%左右。
那这项技术为什么有这么神奇的效果?anandtech在ifa上通过与emui软件团队和华为硬件团队交流,终于理清和明白gpu turbo技术下的实现细节。
首先海思芯片团队明确表示,这是一种软件技术。gpu turbo的性能提升机制便是辅助调度整个芯片各部件的协同运行,有一点调度管理员的意味。这一个调度机制完全是依靠软件的方式。
这也能解析为什么华为能把这项技术应用到旧设备上,因为他并不需要最新硬件的支持,也就是说,即使没有npu,它也能应用,只不过这部分运算可能便是cpu方面负责,相比较单独的npu,能效上会有一些差别。
anandtech还提到,在ifa上的麒麟980的发布会上,首次透露了这项运作方式名为” ai loading prediction technology”,翻译过来叫做ai加载预测技术。
从上图可以看到,通过ai加载预测,对比传统的游戏加载机制,前者能够在游戏获得更流畅的游戏体验,同时整体功耗要更加低。
ai模型构建与训练
gpu turbo利用华为所构建的ai模型进行工作,而他们称之为tensorflow 神经网络模型。这个模型是由华为所构建和进行预先的训练,令其具有学习的能力。
ai神经网络可以根据游戏运行时的帧率、功耗等状态进行不断学习,达到提升性能降低功耗的目的。
再说深一层,实际这个ai神经网络优化的内容是每个手机运行某一个游戏时的dvfs控制。
dvfs 即动态电压频率调整,动态技术则是根据芯片所运行的应用程序对计算能力的不同需要,动态调节芯片的运行频率和电压(对于同一芯片,频率越高,需要的电压也越高),从而达到节能的目的。
如果要令芯片有效节能,单纯降低功率是不够的,还需要进行电压的降低和动态调节。因此gpu turbo实际是通过ai神经网络模型对dvfs进行精细化的调节。
在ai模型学习阶段,它会动态分析和调整芯片的dvfs的参数,实现最佳的能耗比。这里说起来比较玄乎,我们可以这样理解,这个ai神经网络模型便是要找到dvfs的甜点,也就是最佳动态平衡。
我们理解的游戏流畅不一定都是每时每刻都要达到60帧以上,ai模型通过学习,在保证游戏的流畅情况下(有可能低于我们常规理解的60帧),调整cpu、gpu、ram等部件的协作最佳dvfs状态。
这样看,ai神经网络模型是具有很强的学习能力,而这个初始模型是一个软件算法存在,可以写入到手机的系统固件当中,这样便可以令旧设备也具有gpu turbo的能力。
ai神经网络模型会因应每部手机的硬件资源的差异,进行每部机器的个性化深度学习,能够根据每部机器的不同而做不同的调度优化。
在经过训练后,其可以输出最适合特定场景的dvfs设置,这个场景可以是日常上网、看视频、拍照、游戏等。gpu turbo的工作机制可以应用到硬件层上,并且动态自动地调整dvfs,保证体验的前提下也能更有效降低整机的功耗。
npu加速ai神经网络模型的工作
前面已经说到,gpu turbo的ai神经网络模型是纯软件的技术,并不需要特定的硬件,可是假如为它配备特定的运算模块npu,这将会大大提高它的效率。
npu可以加速ai神经网络模型的运算,而在没有npu模块的前提下,假如要引入gpu turbo技术,这部分的运算操作可以让cpu代劳,不过这必然效率上是不如专门的npu模块,估计或多或少会造成渲染的延迟,表现起来就是游戏的流畅度差一点。
这里就可以说明,为什么麒麟960即使没有npu模块,华为mate 9等搭载麒麟960的手机同样能够引入gpu turbo。
华为方面已经证实了这些ai神经网络模型采用的是16位的浮点运算,这意味着往后的新手机设备,如麒麟980的机器,可能会通过基于新npu支持的int8模型做进一步的优化。
本质上gpu turbo就是一个dvfs的运行机制,它能够预测gpu渲染图像下一帧的硬件需求而进行芯片各部分的协作调整。
与那些传统的dvfs的调整算法相比,它的精度更高,同时也更稳定准确,因为传统的算法只是通过简单的硬件检测gpu工作负载状态而进行事后的调节,而gpu turbo是进行预先学习预先判断,效率和效果上有很大的差异。
anandtech指出,这项技术能够很好对智能手机的性能、效率和功耗做一个优化平衡,因此他们对这项技术还是表示肯定的。这项技术的思路可以推广到其他领域,例如个人电脑等等。
不过这项技术的一个弱点便是需要ai神经网络模型的训练,不同的设备不同的游戏的训练学习时间都是不一样的。华为方面并没有说明培训学习一款游戏需要花费多少时间,不过华为方面已经着手开始联合游戏开发商进行特定的游戏优化。毕竟进行特定优化后要比全局性gpu turbo后的游戏体验提升更大。
gpu turbo不需要被”神化”
我们已经大致了解了gpu turbo是如何运作,如何提升gpu图形方面的性能,因此我们透过本质来看事实,它确实对性能有一定的提升,也具备市场价值,可是我们不能神化它。
anandtech对比了华为p20和荣耀play的游戏体验,这两个设备都是采用了相同的芯片和内存,只不过在其他元器件有差异。
华为p20(没有gpu turbo)
荣耀play(gpu turbo)
华为p20暂时没有升级引入gpu turbo,而荣耀play是第一款搭载gpu turbo技术的机器。
我们看到两者在游戏中,通过原始帧率数据是很难分别哪一款设备具有gpu turbo,不过荣耀play在游戏中还是有一个明显的优势,那就是游戏渲染场景时候的功率是3.9w,这比华为p20的4.7w要小。
当然这是整机的总功率,我们不能完全排除可能屏幕等其他元器件方面的功率差异,但是这两款设备的功率差只有15%。即使加上其他手机元器件的差值,其还是与官方宣称的30%以上的功耗差异相距甚远。
因此这里要说明的是,gpu turbo确实能提升gpu性能,可是我们要对官方宣称的数据进行理性看待。不一样的设备不一样的游戏都会对提升差异幅度有很大的影响,不要把gpu turbo神化了。
当然gpu turbo是实实在在提升gpu性能的一个创新方案,通过软件算法去弥补麒麟gpu方面的弱项。不过我们也要明白,对比高通骁龙adreno,麒麟的mali gpu的硬件性能还是要落后不少。
即使有gpu turbo技术的加持,荣耀play在游戏性能和体验上还是与骁龙845的手机设备有较大的差距,因为在硬件方面的性能差异要单纯靠软件来消除,这是不太可能的。
总结
在ifa上,麒麟980芯片正式发布,我们从一些演示幻灯片看到gpu turbo对麒麟980芯片组方面的性能助力。实际gpu turbo对于增强其gpu性能的提升并没有很大,只有10%左右。
当中原因可能麒麟980上面改进了工作负载的电压调整机制,gpu方面性能也得到硬件层面上(制做工艺、晶体管、渲染单元数量)的提升,而gpu turbo这个软件方面的性能增强数值在更趋于可信和合理的范围内。
无可否认,gpu turbo技术确实是能够增强gpu方面的性能,提升游戏的体验。我们应该给予开发这个技术的团队赞赏,同时在如今日益竞争激烈的半导体芯片环境里面,应该鼓励更多芯片设计公司开发出类似gpu turbo这类真实提升性能的技术。
对于用户能提升游戏等各方面的体验,对于公司来说是创新差异化的需求,对于市场来说是推动整个芯片行业发展的软动力。

OPPO计划今年下半年将打通首个5G通话,2020年推出面向市场的5G商用手机
应用检测IGBT集电极电压的过流保护原理
介绍floorplan基本规则
随着人工智能的快速发展会给我们带来什么影响
美国对华为的制裁造成了整个欧洲5G投资的延迟
深度解析华为“很吓人的技术”:GPU Turbo
Wi-Fi网络可以成为大学里一个强大的联系追踪工具
智慧酒店有人工智能的加入会有什么效果
数据规模拓展无极限,2023亚马逊云科技re:Invent大会首日精彩内容
油电混合无人机在救灾领域起到的重要作用
得益于Mac和iPad需求,苹果9月季度营收创下纪录
OPPO R11曝光OPPO R11什么时候上市? 下半年还有Find 9
夏普AQUOS S2搭载的骁龙630是什么来头?联发科P25当真没有活路了吗?
传晶电MiniLED打入华为供应链 有望进一步接获手机相关订单
联发科欲拓美国市场,与高通再交锋
物联网和数据的未来会是什么样子的
PLC联姻物联网会给工控带来什么福利
ESR对电容和电路的影响
采用传感器集线器提高应用的性能和功耗
基于NXP的高精度智能手表计步器参考设计