Toggle navigation
首页
问答
文章
积分商城
专家
专区
更多专区...
文档中心
返回主站
搜索
提问
会员
中心
登录
注册
AI_人工智能
DeepMind
弃BN
DeepMind丢掉了归一化,训练速度提了8.7倍 开源 | 转载量子位
发布于 2021-02-19 14:53:39 浏览:595
订阅该版
[tocm] 在**大规模图像识别**任务上,DeepMind的新方法火了。 不仅拿到了**SOTA**,训练速度还提升了**8.7倍**之多! ![](https://gitee.com/lebhoryi/PicGoPictureBed/raw/master/img/20210219145356.png) ## 方法关键:去“批处理归一化” 对于大多数图像识别模型来说,批处理归一化(batch normalization)是非常重要的组成部分。 但与此同时,这样的方式也存在一定的局限性,那就是它存在许多并不重要的特征。 虽然近期的一些研究在没有归一化的情况下,成功训练了深度ResNet,但这些模型与最佳批处理归一化网络的测试精度不相匹配。 而这便是DeepMind此次研究所要解决的问题——提出了一种**自适应梯度剪裁** (AGC) 技术。 具体而言,这是一种叫做**Normalizer-Free ResNet** (NFNet)的新网络。 ![image.png](https://oss-club.rt-thread.org/uploads/20210219/f54c25d6b01636c2318d665c9c11455a.png) 整体来看,NFNet的整体结构如上图所示。 以有无“transition块”来划分,可以再细分为2种情况。 ![image.png](https://oss-club.rt-thread.org/uploads/20210219/869d6eb6f69287eca76f47e18d3ec25d.png) 其中,它们的bottleneck ratio均设置为0.5,且在3 x 3的卷积中,无论信道的数量为多少,组宽都固定为128。 二者的区别在于skip path接收信号的方式,左侧的是在用β进行variance downscaling和缩放非线性之后;而右侧则是在用β进行variance downscaling之前完成。 ## 实验结果 在实验部分,DeepMind的研究人员,采用了与NFNet相关的**7个**模型做了对比实验,分别是NFNet-F0至NFNet-F6。 不难看出,在各个模型的对比过程中,在Top-1精度方面均取得了最好结果。 值得一提的是,与EfficientNet-B7相比,训练速度方面提升了**8.7倍**之多。 ![image.png](https://oss-club.rt-thread.org/uploads/20210219/498fe186da83f7efd60f22845eb44e68.png) 此外,在对**3亿**张标记图像进行大规模预训练后,在ImageNet上还取得了89.2%的Top-1精度。 ![image.png](https://oss-club.rt-thread.org/uploads/20210219/ea0f2987b7714d6bde5a7ef28377d2e0.png) 最后,对于这项研究的代码,也已在GitHub上开源。 ## 传送门 论文地址: https://arxiv.org/abs/2102.06171 代码地址: https://github.com/deepmind/
0
条评论
默认排序
按发布时间排序
登录
注册新账号
关于作者
lebhoryi
这家伙很懒,什么也没写!
文章
30
回答
6
被采纳
1
关注TA
发私信
相关文章
1
RT-Thread AI Kit 相关资料和教程在哪里?
2
20号的开发者大会上,人脸识别AI
3
2020 开发者大会演示的 AI 套件什么时候开源?
4
请问RT-AK有没有部署MobileNet的例子呢
5
请问RT-AK会支持paddlepaddle的模型吗
6
嵌入式比赛中要求的 RT-Thread ai toolkit 能介绍一下吗?
7
使用rt_ai_tools转换模型时报错
8
求一个识别人有没有带口罩的模型?
9
RT-AK的人物检测例子下载后编译失败
10
cube ai部署后报错
推荐文章
1
RT-Thread应用项目汇总
2
玩转RT-Thread系列教程
3
国产MCU移植系列教程汇总,欢迎查看!
4
机器人操作系统 (ROS2) 和 RT-Thread 通信
5
五分钟玩转RT-Thread新社区
6
【技术三千问】之《玩转ART-Pi》,看这篇就够了!干货汇总
7
关于STM32H7开发板上使用SDIO接口驱动SD卡挂载文件系统的问题总结
8
STM32的“GPU”——DMA2D实例详解
9
RT-Thread隐藏的宝藏之completion
10
【ART-PI】RT-Thread 开启RTC 与 Alarm组件
热门标签
RT-Thread Studio
串口
Env
LWIP
SPI
AT
Bootloader
Hardfault
CAN总线
FinSH
ART-Pi
USB
DMA
文件系统
RT-Thread
SCons
RT-Thread Nano
线程
MQTT
STM32
RTC
FAL
rt-smart
I2C_IIC
ESP8266
UART
WIZnet_W5500
ota在线升级
cubemx
PWM
flash
freemodbus
BSP
packages_软件包
潘多拉开发板_Pandora
定时器
ADC
flashDB
GD32
socket
编译报错
中断
Debug
rt_mq_消息队列_msg_queue
SFUD
msh
keil_MDK
ulog
C++_cpp
MicroPython
本月问答贡献
xusiwei1236
8
个答案
2
次被采纳
踩姑娘的小蘑菇
1
个答案
2
次被采纳
用户名由3_15位
9
个答案
1
次被采纳
bernard
4
个答案
1
次被采纳
RTT_逍遥
3
个答案
1
次被采纳
本月文章贡献
聚散无由
2
篇文章
15
次点赞
catcatbing
2
篇文章
5
次点赞
Wade
2
篇文章
4
次点赞
Ghost_Girls
1
篇文章
7
次点赞
xiaorui
1
篇文章
2
次点赞
回到
顶部
发布
问题
投诉
建议
回到
底部