116 | 掌握计算机视觉任务的基础模型和操作
洪亮劼
该思维导图由 AI 生成,仅供参考
今天,我们来聊一聊计算机视觉的一些最基础的操作和任务,包括像素表达、过滤器和边界探测。基于这些内容,我们一起讨论利用计算机来处理视觉问题的核心思路。很多时候,越是基础的内容就越重要,因为只有掌握了基础的思路,我们才能在今后复杂的任务中灵活应用。
像素表达
我们在上一次的分享中谈到了计算机视觉任务中一个非常重要的步骤,那就是把现实世界的信号通过感知仪器(Sensing Device)收集起来,然后在计算机系统中加以表达。那么,在所有的表达中,最基础的就是“像素表达”(Pixel)。我们这里就展开说一说这种表达的思路。
把图像信息利用像素来进行表达是一种非常直观简单的表达方式。
对于黑白图像来说,图像就被转换为了 0 或者 1 的二元矩阵。这个矩阵的每一个元素就是一个像素,0 代表黑,1 则代表白。
对于灰度图像来说,每一个像素,或者说是矩阵的每一个元素,代表灰度的“强度”(Intensity),从 0 到 255,0 代表黑,255 代表白。
对于彩色的图像来说,我们一般要先选择一种模型来表示不同的颜色。一种较为流行的表达方式是 RGB(红、绿、蓝)模型。在这样的模型中,任何一个彩色图像都能够转化成为 RGB 这三种颜色表达的叠加。具体来说,就是 RGB 分别代表三种不同的“通道”(Channel)。每一种通道都是原始图像在这个通道,也就是这个原始颜色下的表达。每一个通道都是一个矩阵像素表达。每一个像素代表着从 0 到 255 的值。换句话说,一个彩色图像在 RGB 模型下,是一个“张量”(Tensor),也就是三个矩阵叠加在一起的结果。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
本文介绍了计算机视觉任务的基础模型和操作,包括像素表达、过滤器和边界探测。首先,像素表达是对现实世界信号的采样,黑白、灰度和彩色图像都有不同的像素表达方式。其次,过滤器是在图像矩阵上进行变换的工具,如移动平均和卷积,用于对图像进行柔化处理和特效处理。最后,边界探测是基于梯度计算来描述图像中物体边界的任务,需要考虑梯度大小和方向,并进行后期处理以准确定位和平滑边界。本文总结了计算机视觉的基本数学模型和操作,为读者提供了对该领域的快速了解和入门指导。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》,新⼈⾸单¥98
《AI 技术内参》,新⼈⾸单¥98
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(5)
- 最新
- 精选
- 小南计算边界检测区域的面积与实际面积对比,应该能回答老师的问题。不过我一般在处理边界问题的时候,都是一边调试处理,一边把边界线重新绘画到原图像中查看。2021-09-14
- 皮特尔图像的边缘处强度函数变化较大,所以可以使用导数来做边缘检测。同时为了避免导数受噪音影响,可以先对图像做平滑处理。可以使用文中介绍的“移动平均”过滤器。2020-05-301
- Alice使边界平滑和边界探测两个概念有点搞不清,平滑之后是不是就不容易探测到边界了,还是两个概念用的是不同的方法相互是不干扰的?2019-11-271
- hongbosherlock老师讲的不错,但感觉课程互动太少了,效果不是很好。2019-10-17
- 医用地狗精灵既然边界可以是横竖斜,那么可以用个过滤器来测试两边的骤然变化。2018-08-27
收起评论