开源DAWN:简化AI应用程序构建过程
极客时间编辑部
讲述:丁婵大小:1.22M时长:02:40
随着机器学习(ML)应用程序技术的发展,越来越多的组织开始将这种技术用于生产中以提高效率。然而,事实上,这种“高端”技术只有那些资金充足和有庞大技术团队的组织才能享用。
为了大幅简化 AI 应用程序构建过程,普及 AI 技术,让非机器学习专家也能利用这项技术造福社会,斯坦福大学开启了一个为期五年的项目 DAWN( Data Analytics for What’s Next),意思为“下一代数据分析”。
而 DAWN 的目标,不是为了改进机器学习算法,因为对于许多重要的应用程序来说,算法已经足够完善,它的目标是让机器学习能够为小型团队所用,非机器学习专家也可以应用机器学习解决他们的问题,实现高质量的结果,并部署可以在特定应用中使用的生产系统。
据介绍,DAWN 协议栈中的设计理念主要基于三个原则:
1. 以端到端的机器学习工作流程为目标。
机器学习应用程序开发不仅仅包括模型训练,因此,现在开发新的机器学习应用程序所面临的最大挑战并不在模型训练,而在于数据准备、特征选择 / 提取和生产,如服务、监控、调试等。因此,系统应该定位到整个机器学习端到端的整个工作流程。
2. 赋能领域专家。
最有影响力的机器学习应用应该由领域专家开发,而不是机器学习专家。然而,可供领域专家编码、利用自动化和机器学习模式的系统太少。未来的系统应该赋能非机器学习专家的用户,为他们提供诸如标签、特征工程和数据增强等繁重任务的工具。
3. 优化端到端。
在模型训练中,机器学习的执行速度非常重要,速度快可以更好地建模(例如,通过输入更多数据或更广泛的搜索参数)。同时,速度对于部署的生产服务同样重要。因此,需要优化端到端流程,提高机器学习执行速度。
该团队表示,其过去的研究,如 Spark、Mesos 等已经开始服务硅谷和世界各地,在打击人口贩卖、协助癌症诊断和进行高通量基因组测序等方面,开发了大量人工智能和数据产品开发工具。
而为了让 DAWN 项目目标所带来的机会最大化,并借鉴之前的 Spark、Mesos 等大型分析系统构建的经验,该团队计划用未来五年时间来研究和构建工具,以解决机器学习实践中的端到端问题。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 云学这个项目对于搭建端到端的机器学习应用太重要了,很期待1
收起评论