09|数据集:如何为模型寻找制作数据集?
柳博文

你好,我是柳博文,欢迎和我一起学习前端工程师的 AI 实战课。
上一章我们深入了解了 AI 和计算机视觉的基本概念,以及计算机视觉在 AI 领域中的应用。现在,你已经对 AI 有了基本的认知,并且对计算机视觉的运行原理有了深入的理解。
虽然基础理论可能稍显枯燥,但这是我们实战环节绕不开的功课。这一章我们就来学以致用,一起完成一个“AI 布局助手”的工具,它可以帮助前端工程师更高效地进行页面组件识别及布局。
这节课,我们主要一起解决两个核心问题。
1. 在应用实践层面,我们将通过数据增广的方式扩充训练集,解决数据量不足和数据收集困难的问题。
2. 在模型理论层面,我们将通过增强数据的泛化性质,解决训练过程中可能出现的过拟合问题。
学完今天的内容,你将深入理解 AI 组件的划分粒度,掌握如何收集数据集,以及如何进行有效的数据增广处理等关键技能。
为什么要划分组件粒度?
当你接到一个页面需求时,是否对如何划分组件的粒度感到困扰?这对于我们前端开发同学实现页面需求,乃至做好整个项目的后期维护至关重要。
同样的道理,想要训练一个 AI 布局助手,它也需要先“学会”组件划分的逻辑。为了让 AI 能够准确地识别页面布局和组件,我们需要提供足够精确且适合 AI 的组件划分粒度,并基于此进行数据集的收集和制作。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. 为AI模型寻找制作数据集的重要性和方法 2. 组件粒度的重要性 3. 基础数据集收集 4. 数据集增广处理 5. 数据增广实例5:旋转 6. 数据集标准适配 7. 总结
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《前端工程师的 AI 实战课》,新⼈⾸单¥59
《前端工程师的 AI 实战课》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论