零基础实战机器学习
黄佳
新加坡科研局首席研究员
19489 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 24 讲
零基础实战机器学习
15
15
1.0x
00:00/00:00
登录|注册

21|持续精进:如何在机器学习领域中找准前进的方向?

你好,我是黄佳。欢迎来到零基础实战机器学习。
我常常说,一旦你踏进了机器学习领域,就等同于踏进了“终身学习”之旅。因为机器学习领域庞大而繁杂,我们这 20 多讲的内容仅仅是一个开始。除了我们讲过的监督学习、无监督学习、半监督学习、强化学习、深度学习和集成学习之外,还有迁移学习、自动化机器学习、联邦学习、图神经网络等多种学习类型和研究方向。
那么,作为机器学习使用者的我们,面对机器学习领域里众多的“新热点”和种类繁多的研究方向,应该怎么去找准关注点和发力点,更高效地赋能自己的个人发展呢?在这一讲中,我将结合机器学习最新发展现状和技术演进趋势,来带你探讨这个问题。

迁移学习

我这里给你的第一个建议就是不要重复造轮子。要知道,人类的知识大厦都是经年累月,逐层搭建起来的,机器学习发展到今天,不仅有非常多的包供我们调用,甚至也已经有越来越多的模型,我们可以直接使用。在上一讲中,我们就预训练了一个模型,然后在 Web 应用中直接把这个训练好的模型拿过来使用。其实,对于别人已经预训练成功的大型模型,我们也可以做个微调,然后应用到自己的业务场景中。这个思路,就是“迁移学习”。
迁移学习(Transfer Learning)是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。在深度学习的计算机视觉任务和自然语言处理任务里,迁移学习特别常见。因为大型神经网络模型的训练、调试、优化的过程会消耗巨大的时间资源和计算资源,为了避免资源浪费,很多公司会找到开源发布出来的模型,通过迁移学习将这些模型已习得的强大技能迁移到相关的的问题上。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

机器学习领域的最新进展和应用潜力是本文的重点。文章首先介绍了迁移学习和自动化机器学习的重要性,指出它们可以提高应用效率、简化开发流程,并且对个人发展具有赋能作用。接着,文章提到了图神经网络的出现,将进一步拓展AI应用的覆盖面,特别是在处理非欧几里得数据方面具有重要意义。此外,文章还探讨了机器学习的三大学派和它们的发展趋势,以及机器学习领域的热点问题和挑战。最后,文章鼓励读者深入探索机器学习领域,并强调了技术需要人来实现,同时提出了对读者的思考题,希望读者能够分享对机器学习的理解和感悟,以及对整个人工智能领域的最新进展的了解。整体而言,本文涵盖了机器学习领域的最新动态和发展趋势,为读者提供了全面的视角和思考方向。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《零基础实战机器学习》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(5)

  • 最新
  • 精选
  • 感谢黄老师的课程,感受最深的的还是“勤动手”。跟着例子敲代码,调试,运行,在实例中体会机器学习。

    作者回复: 知行合一

    2021-10-23
    2
  • 在路上
    佳哥好,短短21讲的内容,让我对机器学习有了初步而全面的认识。最大的收获是工具的强大,很多算法都有现成的类库,API也很简单,上手很容易。

    作者回复: 谢谢你一路上的分享和对课程的认可。“实用主义”——这正是我设计这个课程的出发点。对于工具的使用者而言,了解了工具的强大,是用好它的前提,对吧。🚵🏼‍♀️

    2021-10-15
    2
  • Geek_831e17
    符号主义已经寄了

    作者回复: 嗯

    2023-07-18归属地:广东
    1
  • u
    课程短小精悍,真的是零基础、实战类课程,很适合入门学习,赞个👍🏻。 另外有个问题请教老师,对于数据量比较大或者计算量比较大的机器学习场景,肯定会出现单机搞不定的情况,那么如何实现从单机到分布式机器学习的转变呢?这种问题在实际生产环境中的解决方案一般是什么样子呢?

    作者回复: 谢谢鼓励。 数据量极大的机器学习场景,我个人的理解(不一定十分准确): 1. 首先是GPU,生产环境和实验室环境都是用GPU进行模型的训练。 2. 对大数据的处理,这涉及分布式计算,可能需要学习Hadoop和Spark,这方面我知识和经验有限。 3. 云计算,目前很多企业采用在AWS上面运行机器学习算法,这样,你只需聚焦于机器学习模型本身,可以不必过分关注云服务器中的分布式计算是如何具体实现的。云服务能够自动根据业务数据的量来进行autoscaling。——AWS中也提供专门的机器学习认证支持。

    2021-11-07
    1
  • 明远
    受益匪浅。跟着佳哥走完一个完整的学习路径后,对机器学习有了一个粗浅的认知。另外,我想请教佳哥一个问题。在图像分类或者物体识别方面,有没有通用的、已经训练好的模型,满足日常生活中的图片识别或者分类(我分不清楚识别和分类有什么区别)。 学完您的课程,我突发奇想,想开发一个通用的图形识别程序,或者说是智能相册,用来将平常拍摄的生活照片自动分类归档。但是转念一想,这应该是一种很常见的需求,是否已经有开源的项目呢?我在网上搜索一圈,大部分都是“专用”的教学项目,基于小规模的图像集训练后教学用。 1. [https://www.tensorflow.org/tutorials/images/classification](https://www.tensorflow.org/tutorials/images/classification) 2. [https://github.com/weiaicunzai/awesome-image-classification](https://github.com/weiaicunzai/awesome-image-classification) 3. [https://github.com/OlafenwaMoses/ImageAI](https://github.com/OlafenwaMoses/ImageAI) 我好奇的是,为什么没有一个通用的应用库(或许是我没有找到),是因为解决的问题不够聚焦,所以训练出一个“通用”的模型太复杂吗?

    作者回复: 非常抱歉我回答你的问题太迟了,但是,你的问题非常好,其实在计算机视觉领域,确实有一些通用的、预先训练好的模型,它们可以应用于各种各样的任务,包括图像分类和物体识别。大多数的这类模型基于深度学习,特别是卷积神经网络(CNN)。 你提到的图像分类和物体识别,这两个概念是有一些差异的,但在很多场合下是可以相互交换使用的: 图像分类是指确定一张图片的主要内容是什么,即将图片分配到预定义的类别中的一个。比如一张图片中可能有一只猫,那么这张图片的类别就是“猫”。 物体识别或者说物体检测,更复杂一些。它不仅要识别出图片中有哪些对象,还要确定它们的具体位置。比如一张图片中可能有一只猫和一只狗,物体识别要做到的是既能识别出猫和狗这两个对象,还能告诉你猫和狗各自在图片中的哪个位置。 对于图像分类,许多著名的预训练模型,如VGG16,VGG19,ResNet,Inception等,已经被训练在大型的图像数据集(如ImageNet)上,并在许多深度学习库(如TensorFlow,PyTorch等)中提供。这些模型可以直接用于图像分类,也可以用于迁移学习,即在预训练模型的基础上,微调一部分层以适应特定任务。 对于物体识别,也有许多预训练的模型,如Faster R-CNN,YOLO(You Only Look Once),SSD(Single Shot MultiBox Detector)等。这些模型在识别对象和定位对象方面都很有效。 至于你说的通用图像识别程序或智能相册的需求,确实已经有一些公司或者开源项目在做了。比如谷歌的Photos应用就可以根据图像内容对照片进行分类。对于开源项目,可以查看TensorFlow的图像分类模型库或者物体识别模型库,都有很多现成的模型可以使用。对于你链接中的第三个项目,ImageAI是一个易于使用的库,可以使用预训练的模型进行图像分类和物体识别。 然后,你提到为什么没有一个通用的应用库,这个其实有两个原因: 需求多样性:不同的应用可能有不同的需求。比如在智能相册中,你可能关心的是图像的主题(比如“山水”,“动物”,“建筑”等),而在自动驾驶系统中,你可能更关心的是识别出道路上的其他车辆,行人,交通信号等。所以很难有一个模型可以满足所有的需求。 训练数据的问题:虽然我们有一些大型的图像数据集,如ImageNet,但这些数据集可能不能覆盖所有的情况。比如在一些特定的任务中,可能需要更专门的数据集来训练模型。所以在很多情况下,需要根据特定的任务来训练或微调模型。 希望我的回答能帮助你理解这个问题。如果你有任何其他的问题,也欢迎随时提问。

    2022-03-11
收起评论
显示
设置
留言
5
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部