谷歌提出Grasp2Vec模型,自主学习物体表示
极客时间编辑部
讲述:丁婵大小:2.20M时长:02:24
通过与周围世界互动,人们能够进行自监督学习,知道自己采取了什么行动,并能够从结果中学习。在机器人技术领域,人们正在积极研究这类自监督学习,因为它使机器人系统能够在缺少大量训练数据或无人监督的情况下学习。
受客体永久性概念的启发,最近,谷歌提出了 Grasp2Vec,这是用于获取物体表示简单而高效的算法。它的原理是,如果机器人抓住一个物体并将其抬起,那么物体必须在抓取前进入场景。此外,如果机器人知道抓住的物体当前处于抓取器中,就会将其从场景中移除。通过使用自监督,机器人可以利用抓取前后的场景视觉变化来学习识别物体。
在强化学习框架中,任务成功与否都是通过奖励函数衡量的。通过最大化奖励函数,机器人可以从头开始自学各种技能。如果任务成功与否需要通过传感器衡量,设计奖励函数就很容易。然而,当成功标准取决于对当前任务的感性理解时,设计奖励函数就要困难得多。
为了解决这种识别问题,就需要一个感知系统,该系统能够从非结构化图像数据中提取有意义的物体概念,以无监督方式学习物体的视觉感知。无监督学习算法的核心是其对数据做出结构性假设。通常情况下,假设图像可以被压缩到低维空间中,并且可以从之前的帧预测当前帧。
在论文中,谷歌展示了机器人抓取技能如何生成用于学习以物体为中心的表示数据,同时保留了自主抓取系统的自监督学习属性。除此之外,近期的其他论文研究了如何通过抓取、推动和其他方式操纵环境中的物体、获得自监督交互,从中学习物体表示等。
未来,机器学习将继续优化机器人的理解和控制能力,机器人技术将在新自监督范式方面为机器学习注入新鲜血液。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论