前端工程师的 AI 实战课
柳博文
ABB 高级研发工程师,前阿里前端算法工程师
767 人已学习
新⼈⾸单¥59
前端工程师的 AI 实战课
15
15
1.0x
00:00/00:00
登录|注册

11|模型训练:如何教会模型学习

你好,我是柳博文,欢迎和我一起学习前端工程师的 AI 实战课。
前面两节课中,我们先后准备好了基础的图像数据,并且按照 PASCAL VOC 的标准制作出了一份用于目标检测模型训练的数据集。那么现在万事具备,接下来我们就可以进行模型训练了。

模型选择

在这个实践课程中,我们需要使用 AI 来完成页面的布局,简单来说,就是需要使用目标检测来识别出页面的组件类型和定位组件的位置,再通过工程化的方法来完成页面布局代码的自动生成。所以,在 AI 识别部分这是一个典型的目标检测任务。
那么,通过前面第 5 节课的学习,我们知道目标检测现在的模型方法分为两类,一类是 one-stage,另外一类是 two-stage。
两种方法的不同之处主要在于前者模型对目标的类别判断和位置识别在同一次计算中完成,而后者则是分为两步进行。one-stage 方法速度快但是精度相对较低,代表模型为 YOLO 系列;two-stage 精度高但是速度慢,代表模型是 R-CNN 系列。
结合我们要做的 H5 页面布局助手,我们需要完成的是页面的布局识别,对精度的要求不是很高,所以选择 YOLOv5 作为基础模型来训练。
YOLOv5(You Only Look Once version 5)是一个广泛使用的实时目标检测系统。它能快速、高效地检测图像中的多个物体,具有速度快,精度高的优点,同时也易于使用。对于前端工程师来说,理解并使用 YOLOv5 可以显著增强应用的视觉识别能力。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. YOLOv5被选择作为目标检测任务的基础模型,因为它具有快速、高效地检测图像中的多个物体的优点,同时易于使用。 2. YOLOv5将输入图像划分为网格,每个网格预测边界框和每个边界框的置信度,同时预测类别的概率分布,将目标检测任务转化为一个回归问题。 3. mAP(平均精度均值)是目标检测任务中最常见的评估标准之一,用于衡量模型在不同阈值下的平均精度以及模型在检测多个类别时的整体性能。 4. mAP的计算过程结合了精度和召回率,通过计算每个类别的平均精确率(AP)并求平均值得到mAP,mAP值越高表示模型在检测不同类别的目标时能够更准确地识别和定位目标。 5. YOLOv5的模型训练需要下载源代码,并下载一些预训练模型,然后进行超参数设置,放置制作好的数据集,并执行训练。 6. 训练过程中,可以通过观察mAP值来判断模型是否达到训练要求,也可以通过分析训练和验证损失、精度和召回率等指标来实现。 7. 训练结束后,可以通过观察训练结果图中的mAP值来判断模型的训练效果,也可以通过tensorboard来查看更多的训练结果指标。 8. 在模型训练结果的分析中,除了mAP,还有其他指标可以用来分析,观测方法包括分析训练和验证损失、精度和召回率等指标。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《前端工程师的 AI 实战课》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部