谷歌提出移动端AutoML模型MnasNet
极客时间编辑部
讲述:杜力大小:975.38K时长:02:05
目前,开发者可以使用非常多的移动端 CNN 架构,也可以在机器上训练新颖的视觉模型并部署到手机端。但是各种各样的移动端任务,可能并不能借助已有的 CNN 架构达到非常好的效果。因此,最近,谷歌将神经架构搜索方法引入了轻量级的 CNN 网络,并提出基于强化学习的 MnasNet,以自动设计移动端模型。
谷歌探索了一种使用强化学习设计移动端模型的自动化神经架构搜索方法,为了处理移动端速度的限制,他们明确地将速度信息纳入到搜索算法的主要奖励函数中,以便搜索可以识别一个在准确率和速度之间,实现良好平衡的模型。
这样一来,MnasNet 就能够找到运行速度比 MobileNet V2(手工制造的最先进水平)快 1.5 倍、比 NASNet 快 2.4 倍的型号。
不同于以前的架构搜索方法,在这种方法中,模型速度是通过另一个替代品(如 FLOPS)来考虑的。通过在特定平台上执行模型,来直接测量模型速度。
据介绍,他们方法的总体流程主要包括三个部分:
一个是基于 RNN 的学习和采样模型架构控制器;
第二个是建立和训练模型,以获得准确率的训练器;
以及一个使用 TensorFlow Lite 测量真实手机上模型速度的推理引擎。
为了在搜索灵活性与搜索空间大小之间取得适当的平衡,谷歌提出了一种新型因子化的层级搜索空间,它将卷积神经网络分解为一个由模块组成的序列,然后使用层级搜索空间决定每一个模块的层级结构。
通过这种方式,允许不同的层级使用不同的运算与连接。同时,研究人员强制每一个模块共享相同的结构,因此,与逐层搜索相比搜索空间要显著地小几个数量级。
在未来,谷歌计划把更多的运算和优化方法整合到搜索空间中,并将其应用到更多的移动设备视觉任务上,例如语义分割等。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论