AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
32838 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

115 | 什么是计算机视觉?

在之前的一系列分享中,我们详细讲解了人工智能核心技术中的搜索、推荐系统、计算广告以及自然语言处理和文本处理技术。从今天开始,我们来分享专栏里人工智能核心技术模块的最后一部分内容:计算机视觉技术
可以说,计算机视觉技术是人工智能技术的核心方向,特别是深度学习技术在计算机视觉中的应用,在最近五六年的人工智能浪潮中担当了先锋者的角色。甚至可以说,如果没有深度学习技术在过去几年对计算机视觉一些核心领域的推动和促进,就很可能没有这一波的人工智能技术浪潮。
我们可以这么来看待人工智能技术,它可以说是利用计算机技术来对人的感官,例如视觉、听觉、触觉以及思维进行模拟,从而建立起逻辑推断等智能才具备的能力。其中,计算机视觉技术无疑是至关重要的,也是非常困难的。
今天我会带你先来看看究竟什么是计算机视觉,以及这个方向的研发都需要解决哪些核心问题。

计算机视觉的定义

关于计算机视觉(Computer Vision,CV),有两种人们普遍接受的定义。
第一种定义认为,计算机视觉是从数字图像(Digital Images)中提取信息。这些信息可以是图像中的物品识别(Identification)、导航系统的位置测量(Space Measurement)以及增强现实(Augmented Reality)的应用。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(5)

  • 最新
  • 精选
  • 二极管
    老师,初学者小白有个疑问:当公司需要某些功能时,是直接用现成的开源代码,再根据实际情况稍作修改?还是直接从头设计,独立开发呢? 比如中文分词,市面上有清华的THULAC,还有我个人使用感觉效果最好的HanLP,还有一大堆分词器,效果和速度都不同,如果是使用开源代码,哪有该如何选择呢? 我最不理解的是,为什么jieba分词是最受欢迎的?它的效果很差啊,难道大家选择开源代码时都是跟风,而没有太多思考吗? 因为没工作过,所以有很多疑惑,希望老师能帮我解答。
    3
  • 风的轨迹
    我谈谈我的看法——相对于文本,图像的理解不管采用什么样的数据展现形式,其信息量要比文本大很多。深度学习之所以在图像领域取得很好的效果,主要也是因为深度学习经历了从低级到高级多次提取特征,未来如何多维度从图像挖掘出更多的信息,用于分析是理解图像的难点
    1
  • 皮特尔
    图像数据不同于结构化的表格数据,不同图像之间很难建立起表格数据那种严格、简单、明确的映射关系,导致“根据已知去推断未知”非常困难。 而且即使通过机器学习建立了映射关系,每次推断的计算量也很高,导致成本较高。
  • Alice
    个人感觉图像理解的本质就是图像特征的识别,人和机器都一样。人理解图像就是根据自己的经验和记忆去识别里面的内容,而机器识别理解图像从semantic segemantation的角度来说,就要把图像里的像素作分类,哪种像素是哪一类物体比如是building、car、pedestrian等等,把分类分好分完整分准确计算机不就理解图像里面的内容都是什么了嘛。
  • 周平
    单幅图像的数据量一般很大,数字化成0或1,非常抽象
收起评论
显示
设置
留言
5
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部