前端工程师的 AI 实战课
柳博文
ABB 高级研发工程师,前阿里前端算法工程师
747 人已学习
新⼈⾸单¥59
前端工程师的 AI 实战课
15
15
1.0x
00:00/00:00
登录|注册

10|标签制作:模型到底理解的是什么

你好,我是柳博文,欢迎和我一起学习前端工程师的 AI 实战课。
在上一节课中,我们讨论了如何寻找并制作初始图像数据,并且学会了使用数据增广的方式来扩充数据的量级,让数据更加多样化。除了丰富的数据,我们还需要给数据制作标签。可以说,标签质量跟后续 AI 组件识别的训练效果紧密相关,这节课,我们就会学习如何完成这一步。

为什么需要创建标签?

对于目标检测来说,大多数时候模型进行的学习都是监督学习。用通俗的方式来理解呢,监督学习就是我们需要在给到模型训练数据的同时,告诉模型这是一个什么样的数据。换成更专业的说法就是,需要为数据集打上标签,这个标签就是告诉模型需要学习理解的目标是什么。
在训练模型,特别是目标检测模型时,模型最终理解的是如何从图像中识别和定位特定类别的物体。为了实现这一目标,数据集的制作和标签的创建至关重要。
高质量的标签对于训练一个准确和鲁棒的模型非常关键要。标签质量直接影响着模型的性能和泛化能力。如果标签不准确或不一致,模型就可能会学习到错误的信息,从而影响它在实际应用中的表现。
其实专业数据集标签的制作,也是有一些流行的数据集和标准可以参考和遵循的,下面我们就来学习一下 PASCAL VOC 数据集及其标准。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. 标签质量对于训练准确和鲁棒的模型非常关键,直接影响模型的性能和泛化能力。 2. PASCAL VOC 数据集是计算机视觉领域中广泛使用的一个基准数据集,主要用于目标检测、图像分割和图像分类任务。 3. PASCAL VOC 数据集包含了人、动物、车辆等20个类别,包含数千张标注图像,标注类型包含了标注目标物体的矩形框、目标物体的像素级别区域和目标母体的类别标签。 4. 数据集标签制作包括收集基础图像数据、使用标注工具进行图像的标签标注、生成标注文件并保存为XML文件,以及整理数据集按照PASCAL VOC 格式。 5. 使用LabelImg这个开源的图像标注工具可以生成图像数据集的标注文件,常用于目标检测任务。 6. 数据集整理包括新建dataSet目录,并在其中新建JPEGImages目录用于存放所有图像数据,新建Annatations目录用于存放所有的标签XML文件,新建ImageSets目录用于存放分割后的数据集,以及编写脚本来实现训练集、测试集和验证集的分割。 7. 最终得到一份符合PASCAL VOC标准的数据集,可以直接放入YOLOv5的模型中训练。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《前端工程师的 AI 实战课》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部