你是否真的需要机器学习?
极客时间编辑部
讲述:初明明大小:4.16M时长:04:33
你好,欢迎收听极客视点。
不知你有没有留意到机器学习当前的处境,很是微妙。
机器学习的可行性已得到充分证明,几乎所有最受欢迎的移动应用都或多或少使用了该项技术,从中可见一斑。但这一生态系统尚未成熟到任何一位初学者都可以迅速应用自如的程度。
对于团队而言,决定何时引入机器学习技术并非易事,尤其是对于缺少数据科学家的团队。尽管软件工程人员通常对机器学习具有更高层次的理解,但他们一般缺少领域知识,难以判定自己所面对的问题是否适用机器学习解决。
最近,Cortex 的贡献者之一卡莱布·凯泽(Caleb Kaiser)分享了团队是否需要机器学习的判断方法,文中内容并非从理论上去探讨哪些问题可以通过机器学习解决,而是意在帮助那些没有数据科学家的团队理解应用机器学习是否会有效。InfoQ 对该文章进行了翻译,如下。
是否有其他人使用机器学习解决了类似的问题?
如果团队中没有任何经验丰富的机器学习工程师或数据科学家,就很难回答“是否有可能通过机器学习来解决某个问题?”
如果团队中缺少数据科学家,应该怎么办?
自身成为机器学习专家。这样你可以自己分析问题,判定机器学习解决方案的可行性。
聘用机器学习专家,完成上述工作。
调研是否有其他人用机器学习解决了类似的问题。
前两个选项耗精力耗财力,而后者可能只需花一天时间搜索一下。鉴于团队中没有数据科学家,不太可能针对问题设计出适用的模型架构。通过调研了解使用哪些模型和方法解决了类似的问题,有助于团队明确工作的着手点。
是否具有相关的数据来源?
除非你的问题使用原始预训练模型解决了,否则模型都需要使用相关数据进行训练。
例如,构建一个推荐系统引擎,需要用户资料属性以及浏览习惯等数据。而构建一款客户支持代理,则需要文档手册进行训练。为使模型适用于特定领域,需要使用相应领域数据进行训练。训练数据可以不是自己的,可以借助于一些公开可用的数据。
相对于其他解决方案而言,使用机器学习的成效是否显著?
在很多情况下,机器学习只是一种可工作的工具,但并非最优工具。如果机器学习并不能提供比其它解决方案明显的优点,那么就不值得为此付出额外的开销。
对此问题的分析,可借助于下列几个基本问题来考量:
除机器学习外,是否还有其它解决方案?对于语音识别、计算机视觉等许多应用,机器学习目前是最适用的解决方案。
其它解决方案是否能复现机器学习的预测质量?例如,在建立一个推荐系统中,如果收集的用户数据不多,并且只有 100 条博客帖子可供推荐,那么使用基本的标签系统就完全可以。如果用户喜欢 JavaScript,那么就向用户展示所有具有“JavaScript”标签的文章。但是,如果策划构建一个庞大的内容库,并且其中管理了大量的用户数据,那么机器学习对于实现个性化推荐的作用是独一无二的。
其他解决方法是否具有机器学习那样的可扩展性?机器学习的主要承诺之一,就是其灵活性足以消除某些传统流程中的人工参与。在产品数量不多的情况下,人工处理完全可以取代机器学习。但是对于大量的产品,人工做比对是不现实的。
何时何处适用机器学习?
尽管机器学习有着诸多优越性,但它往往被应用在许多毫无意义的场景中。这导致许多人普遍对机器学习持怀疑态度,“不过又是一轮炒作而已”。
现实情况是,正如其它所有被广泛使用的技术一样,机器学习只是某些情况的理想解决方案,而不适用于所有情况。项目上手时,最难的就是判定该项目是否需要使用机器学习,尤其是对于缺乏该领域经验的团队。
以上就是今天的内容,希望能给你带来参考价值。
英文原文:
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论