个人电脑
在x86方面,此版本主要改进了dav1d的ssse3性能。jiang xuefeng对亮度和paeth帧内预测函数的色度预测做出了贡献,分别提高了0.8%和0.4%的全局性能。
liwei wang继续他的逆变换工作,针对更大的8x32,32x16和32x32以及高达64x64的块,提供了这个版本的最大速度优化,在一些视频上超过10%。
dav1d0.3.0还新增了第一个sse4.1程序集。在大多数情况下添加的sse4.1指令除了ssse3之外没有太多利用上,但victorien le couviour - tuffet近一个月还在优化sse4。他对cdef约束方向增强滤波器滤波器进行了优化,使模块级别的速度提高了115倍,整体提升了1.5%。
与此同时,henrik gramner编写了一些非常聪明的sse2代码来加速熵解码/码流读取,刚开始会占用大部分解码时间,尤其是在avx2指令上。汇编代码为所有64位x86平台带来了加速,avx2约为4%、ssse3和sse4.1约提升2%。
总的来看,这些测试使得ssse3上的dav1d0.3.0快24%,sse4.1快26%,avx2 cpu快4%。
虽然单线程aomdec仍然非常强大,但是多线程dav1d0.3.0使libaom在下面对比图中的位置更微小。
arm64
martinstorsjö提供了两个非常好的提交,使用neon汇编代码加速了loopfilter(neon环路过滤器)和自导环路恢复。这两项功能都加速了大约3倍,使性能提升了7%到36%。不仅可以实现更高的分辨率、帧率和码率,还可以降低相同画面内容的硬件功耗。
在高通骁龙835上单核解码1080p视频突破25fps,使用多个线程稳定30 fps,某些内容甚至达到60fps。
总结以上结果,我们看到《red》的测试结果提升明显,因为它很大程度上依赖于loopfilter。单线程增益介于11%和36%之间(平均19%),多线程介于7%和16%之间。
应用现状
dav1d的应用进行得非常顺利,重大新闻是chrome浏览器和新的microsoft edge背后的开源项目chromium现在也用了dav1d,默认情况下将在chrome 74中集成。
firefox 67也在最新版本里使用了dav1d,dav1d已更新为0.2.1并使用了多线程。 除了windows之外,默认情况下还在linux和macos上启用dav1d解码。
ffmpeg和 vlc 自然也使用了dav1d,一旦ffmpeg 4.2发布,handbrake,自然也会考虑集成dav1d。
youtube越来越多的使用av1编码,他们甚至编码了一些4k和8k分辨率高达60fps的视频,在这里了解如何让youtube启用av1。(https://www.youtube.com/testtube)
继电保护实操步骤、故障分析要点
爱立信加入中国移动RedCap“1+5+5”创新示范之城计划,推动5G高质量发展再上新台阶
谈芯论道!2018中国芯片发展高峰论坛将在南京举办
RT9011应用电路(300MA双通道输出)
国产绕线电感可以替代国外品牌电感吗
Dav1d移动端解码高清视频达30FPS
2017年中国集成电路产业运行情况
富晶电子计划扩大5G滤波器产能
小米手表推送OTA系统升级更新,解决充电与首次配对问题
Quartus Prime设计软件发布,标志新一代可编程逻辑器件设计效能时代来临
12月全国狭义乘用车销量为228.8万辆,呈现市场稳步回暖的态势
电阻器和颜色代码及阻值识别分析
vivo NEX 3S将于3月10日正式发布该机搭载骁龙865平台支持双模5G
14位高性能宽带模数转换器AD6655的特点性能和应用设计
微软将在本月强制删除Flash
智能手表的功能介绍
数字化办公,就选流畅、清晰的华为云桌面
图像传感器行业分析
水环真空泵支撑侧轴承位磨损如何修复
PogoPin连接器有什么优势?