阿里巴巴华先胜:如何改进视觉搜索?
极客时间编辑部
讲述:杜力大小:994.15K时长:02:07
视觉识别和视觉搜索是视觉智能中两项最为常见和重要的任务。视觉搜索由于应用前景广阔、能为用户带来更便捷、更优化的体验,而越来越受到研究和应用领域的青睐。然而,在技术和应用层面,虽然视觉搜索在有些领域取得了巨大突破,在更广泛的领域还面临着诸多挑战。
阿里巴巴视觉智能计算团队重点研究的“城市大脑”项目,就在视觉搜索技术上拥有很多落地实践和克服困难的经验。
城市大脑人工智能技术负责人华先胜介绍,从数据汇聚、数据认知、决策优化、搜索挖掘、预测到干预,整个一条流程是整个城市大脑的主要功能的体现。这些功能都是基于一套大规模视觉智能计算开放创新平台而得以实现,
华先胜表示,阿里巴巴曾在三年前克服了很多技术难题,研发出商品拍照搜索应用“拍立淘”,而城市视觉元素的搜索,因其数据的复杂度和数量,则是更为困难的一个问题。
从技术层面来说,首先需要一个更好的特征模型,来学习细粒度的图像特征。除了目前比较火的 local feature、attention 等技术外,一个比较有趣的方向是,在特定的图搜任务下,如何引入一些人类的先验知识。另外,视频数据会比图像数据具有更丰富的表征,如何利用视频数据进行检索也是一个很有潜力的方向。
其次,真实场景下的数据规模很大,在海量的图像库中进行欧式距离的计算,会带来很高的延时,限制了算法在实时场景下的应用,因此高效的向量索引技术也是在实际场景中落地的必备组件。
由此可见,图像搜索技术还有很多有待提升的空间,有望改进搜索精度不够、搜索结果不匹配等在实际应用中经常出现的问题。
华先胜认为,未来,视觉搜索在众多场景中具有非常大的商业化潜力,城市大脑就是一个很大的应用场景。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论