谷歌 | AI再突破,Efficientnets有望成为计算机视觉任务的新基础!

谷歌人工智能研究部门的科学家认为efficientnets通过宽度、深度、分辨率三个维度的复合扩展,展现出比现行的cnn更高的精度和效率,将成为未来计算机视觉任务的新基础。
卷积神经网络(cnn)作为人工神经网络的一种,是当下语音分析和图像识别领域的研究热点。
它的人工神经元可以响应一部分覆盖范围内的周围单元,所以对于大型图像处理有出色表现,但是如果要某一点上提高准确性,就需要进行较为繁琐的优化调整。
针对这一现象,谷歌人工智能研究部门的科学家正在研究一种“更结构化”的方式,用以“缩放”cnn,期望获得更好的精度和效率。
最近,他们在arxiv.org上发表的一篇论文(efficientnet : rethinking model scaling for convolutional neural networks)并附带了一篇博客文章中对其进行描述。他们声称,这个被称为“efficientnets”的ai系统,超过了最先进的精度,并且提升了10倍的效率。
这篇论文的作者工程师mingxing tan 和谷歌人工智能首席科学家quocv.le都来自谷歌大脑。
他们认为,模型缩放的传统做法是任意增加cnn的深度或宽度,或者使用更大的输入图像分辨率进行训练和评估。区别于传统方法,他们采用了一组固定的缩放系数来均匀缩放每个尺寸。
图中最右侧就是他们的方案,在宽度、深度、分辨率三个维度进行复合扩展。单一调整一个维度能够获得精度提升,但是随着参数调的越大,精度增益越平滑,改进将会不明显。而联合调整就能够获得相对更好的精度增益曲线。
那么,它是如何做到的呢?
首先,在固定的资源约束下,通过进行栅栏搜索,识别基线网络不同维度之间的关系。例如,增加两倍的flops。这决定了每一个维度适当的缩放系数,将应用于基线网络缩放至需要的模型尺寸或者计算预算。为了进一步提高性能,科研人员提出了一种新的基线网络,即mbconv,可以为efficientnets模型体系提供种子。
在测试的过程中,efficientnets展现出比现行的cnn更高的精度和效率,将参数大小和flops减少了一个数量级。
其中,efficientnet-b7比cnngpipe小8.4倍,快6.1倍,分别在imagenet中上达到了top-1(84.4%)和top-5(97.1%)的精度。与resnet-50相比,efficientnet-b4使top-1精度从resnet-50的76.3%提高至82.6%。
efficientnets在其他数据集的表现也很好。在5/8的广泛使用的转移学习数据集中,efficientnets都达到了最先进的精度,并且减少了21个参数。例如,cifar-100(91.7%)和flowers(98.8%),这也表明efficientnets有很好地转移。
两位作者表示,通过对模型效率的显著改进,efficientnets有可能成为未来计算机视觉活动的新基础。他们开源了所有efficientnet模型,希望这些模型可以使机器学习社区受益。

AIRLOOK与商汤科技强强联合,打造“实景三维与AI大模型”结合的全新盛宴
投入式液位计的特点有哪些
一文读懂如何为工商业园区配置储能
英特尔收购电动汽车软件公司Silicon Mobility SAS
java工程师的前景分析
谷歌 | AI再突破,Efficientnets有望成为计算机视觉任务的新基础!
踩上元宇宙的风口后,消费级AR眼镜真的复兴了吗?
马斯克称特斯拉制造了第100万辆车
微波变频器和下变频器可提高微波无线电性能同时减小尺寸
浅谈AT89C2051的四字LED显示屏的设计
微星GS65轻薄游戏本评测 性能强大而又轻薄便携
LG电子采用芯原矢量图形GPU
示波器探头系列 - 电流探头基础
“智能制造”由概念落地到实际应用中成效几何?
明纬电源1.6KW单组输出机壳型交流变直流电源供应器NSP-1600介绍
中东中亚数据中心伙伴大会Partner Connect 2023在迪拜成功举办
直流伺服电机和交流伺服电机的区别
启用高频纯正弦波电力逆变器的优点
iPhone14 Pro系列有望推升两个季度平均售价连创新高
被动无钥门禁和电容式传感门把手详细介绍