谷歌推出“流体标注”AI辅助工具
极客时间编辑部
讲述:杜力大小:1.15M时长:02:31
最近,谷歌在其 AI 博客上介绍了一款基于 AI 和深度学习的图像标注方式“流体标注”,可以作为人工标注者的有力辅助工具,将标记数据集的生成速度提升至现在的 3 倍。
事实上,基于深度学习的现代计算机视觉模型(比如由 TensorFlow 对象检测 API 实现的模型)的性能,主要取决于是否可以使用规模越来越大的标记训练数据集(如公开的图像)进行训练。
然而,如何获得高质量的训练数据,正在迅速成为计算机视觉领域的主要瓶颈。这对于自动驾驶、机器人和图像搜索等应用中使用的语义分段的像素预测任务而言尤其如此。
实际上,传统的手动数据标记工具,需要标记者仔细点击图象边界,来划定图像中的每个对象。在 COCO + Stuff 数据集中,标记一个图像需要 19 分钟,而标记整个数据集需要 53000 个小时。
对此,谷歌的研究人员研究了一种机器学习驱动的界面,可以用于标注分类数据,划定图像中每个目标的轮廓和背景,让标记数据集的生成速度提高至原来的 3 倍。
该工具名为流体标注(Fluid Annotation),从强语义分割模型的输出开始,人工标记者可以使用自然用户界面,通过机器辅助编辑操作进行修改。谷歌此次开发的界面可以让标记者选择需要修改的内容和顺序,使他们能够高效地将精力集中在机器不了解的内容上。
更确切地说,为了对图像进行标记,他们首先通过预训练的语义分割模型(Mask-RCNN)来处理图像。这会生成约 1000 个图像片段及其分类标签和置信度分数。置信度分数最高的片段用于对标签的初始化,呈现给标记者。
然后,标记者就可以做到以下内容:
从机器生成的候选标签中为当前片段选择标签;
对机器没有覆盖到的对象添加分割段,机器会识别出最可能的预生成段,标记者可以从中选择质量最高的一个;
删除现有段;
改变重叠段的深度顺序。
据悉,该工具是让图像标注变得更快、更容易的第一步探索。谷歌未来的目标是改进对目标边界的标记,进一步利用机器智能提升界面的速度,最终实现对界面的扩展,处理以前无法识别的分类,实现最高效、需求最大的数据收集。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 高禹human in the loop.
收起评论