Facebook开源强化学习端到端平台Horizon
极客时间编辑部
讲述:杜力大小:1.03M时长:02:15
近日,Facebook 开源了适合大规模产品和服务的强化学习平台 Horizon,这是第一个使用强化学习在大规模生产环境中优化系统的开源端到端平台。Horizon 包含的工作流程和算法建立在开放的框架上(PyTorch 1.0、Caffe2、Spark),任何使用强化学习(RL)的人都可以访问它。
过去一年,Facebook 已经在内部广泛部署了 Horizon,提高了该平台将强化学习基于决策的方法应用于大规模应用的能力。尽管其他人也在做强化学习应用方面的研究,但是 Horizon 是第一个用于生产的开源强化学习平台。
据了解,Horizon 专注于将强化学习应用于大型系统。本次开源包含用于模拟环境的工作流程,以及用于生产预处理、训练及模型导出的分布式平台。
在很多强化学习领域中,开发人员都可以通过尝试衡量模型的性能。Facebook 想在大规模部署模型之前进行全面的模型测试。由于 Horizon 解决了策略优化任务,因此,训练工作流可以自动化运行多个当前最优策略评估技术。
Horizon 允许通过实时优化比特率参数,来改善 Facebook 360 video 的图像质量。它使用可用带宽和已缓冲的视频量,决定是否转化为更高画质的视频,这种方法在播放给定视频的时候就可以奏效,而不是事后分析性能和仔细标注的数据。
此外,Horizon 平台还改进了 Facebook 利用 AI 确定要发送给用户哪些 Facebook 通知,以及发送频率的方式。过去,Facebook 不会发送每一个可能的通知(包括新 post、评论等),而是利用机器学习模型帮助预测哪个通知最有意义、最相关,过滤掉其它的通知。但是这些模型依赖于监督学习,无法解释发送通知的长期价值。
目前,Facebook 已经确定了一些适合强化学习的特定用例和应用,但是这仅仅是一个开始。Facebook 期待人工智能社区能够基于 Horizon 平台,产生更多的想法、功能和产品。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论