05|模型介绍:前端工程师可以玩的AI视觉模型
柳博文
你好,我是柳博文,欢迎和我一起学习前端工程师的 AI 实战课。
前面我们一起梳理了计算机视觉的发展史,学习了计算机视觉核心技术中的深度学习、特征提取和目标检测技术,并对 AI 模型中用到的数学知识应用有了大致的了解。
不过前面我们关注的主要是计算机视觉和 AI 模型的技术细节,并没有实际动手尝试。这节课我们站在巨人的肩膀上看看现在流行的计算机视觉 AI 模型,亲自上手应用一下这些模型。
视觉 AI 模型
计算机视觉是深度学习应用最为广泛和成熟的领域之一,涵盖了从基本的图像分类到复杂的场景理解等多种任务,这些都是成熟的 AI 模型。我们可以直接使用别人训练好的模型,也可以在别人预训练好的模型基础上,再次进行自定义训练。
后面是一些在计算机视觉领域内广泛使用的深度学习模型,我以图表的形式展示出来,为你展示一下现在流行的模型集合全貌。
在这张图表中第一个是卷积神经网络,这类模型是深度学习基础模型类型,其他的视觉模型都会基于卷积神经网络进行优化和改进。
其中 ResNet 又是更加重要的一个基础模型,它通过残差单元在数学层面有效地解决了模型的梯度消失和梯度爆炸问题,使得模型的宽度和深度可以进一步扩大。这样模型能够抓到的特征就会更多,能够识别的范围就会更广。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
1. 计算机视觉是一个发展已久且成熟的领域,涵盖了从基本的图像分类到复杂的场景理解等多种任务,需要重点关注卷积神经网络模型和目标检测模型。 2. 在计算机视觉领域内广泛使用的深度学习模型包括卷积神经网络、ResNet、目标检测模型(如YOLO)等。 3. LeNet模型是最早的卷积神经网络之一,主要用于解决图像识别问题,特别是在识别手写数字方面表现出色。 4. Face-API.js和BodyPix是基于Tensorflow.js实现的前端JavaScript库,分别专注于面部检测和面部识别、人体姿态分割和识别。 5. 通过实例展示了LeNet模型的构建和训练过程,以及Face-API.js和BodyPix在浏览器中的应用。 6. 了解了人脸相关检测和人体姿态的检测,以及模型在实际应用中的表现和优化方法。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《前端工程师的 AI 实战课》,新⼈⾸单¥59
《前端工程师的 AI 实战课》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论