作者回复: 知行合一
作者回复: 谢谢你一路上的分享和对课程的认可。“实用主义”——这正是我设计这个课程的出发点。对于工具的使用者而言,了解了工具的强大,是用好它的前提,对吧。🚵🏼♀️
作者回复: 嗯
作者回复: 非常抱歉我回答你的问题太迟了,但是,你的问题非常好,其实在计算机视觉领域,确实有一些通用的、预先训练好的模型,它们可以应用于各种各样的任务,包括图像分类和物体识别。大多数的这类模型基于深度学习,特别是卷积神经网络(CNN)。 你提到的图像分类和物体识别,这两个概念是有一些差异的,但在很多场合下是可以相互交换使用的: 图像分类是指确定一张图片的主要内容是什么,即将图片分配到预定义的类别中的一个。比如一张图片中可能有一只猫,那么这张图片的类别就是“猫”。 物体识别或者说物体检测,更复杂一些。它不仅要识别出图片中有哪些对象,还要确定它们的具体位置。比如一张图片中可能有一只猫和一只狗,物体识别要做到的是既能识别出猫和狗这两个对象,还能告诉你猫和狗各自在图片中的哪个位置。 对于图像分类,许多著名的预训练模型,如VGG16,VGG19,ResNet,Inception等,已经被训练在大型的图像数据集(如ImageNet)上,并在许多深度学习库(如TensorFlow,PyTorch等)中提供。这些模型可以直接用于图像分类,也可以用于迁移学习,即在预训练模型的基础上,微调一部分层以适应特定任务。 对于物体识别,也有许多预训练的模型,如Faster R-CNN,YOLO(You Only Look Once),SSD(Single Shot MultiBox Detector)等。这些模型在识别对象和定位对象方面都很有效。 至于你说的通用图像识别程序或智能相册的需求,确实已经有一些公司或者开源项目在做了。比如谷歌的Photos应用就可以根据图像内容对照片进行分类。对于开源项目,可以查看TensorFlow的图像分类模型库或者物体识别模型库,都有很多现成的模型可以使用。对于你链接中的第三个项目,ImageAI是一个易于使用的库,可以使用预训练的模型进行图像分类和物体识别。 然后,你提到为什么没有一个通用的应用库,这个其实有两个原因: 需求多样性:不同的应用可能有不同的需求。比如在智能相册中,你可能关心的是图像的主题(比如“山水”,“动物”,“建筑”等),而在自动驾驶系统中,你可能更关心的是识别出道路上的其他车辆,行人,交通信号等。所以很难有一个模型可以满足所有的需求。 训练数据的问题:虽然我们有一些大型的图像数据集,如ImageNet,但这些数据集可能不能覆盖所有的情况。比如在一些特定的任务中,可能需要更专门的数据集来训练模型。所以在很多情况下,需要根据特定的任务来训练或微调模型。 希望我的回答能帮助你理解这个问题。如果你有任何其他的问题,也欢迎随时提问。
作者回复: 谢谢鼓励。 数据量极大的机器学习场景,我个人的理解(不一定十分准确): 1. 首先是GPU,生产环境和实验室环境都是用GPU进行模型的训练。 2. 对大数据的处理,这涉及分布式计算,可能需要学习Hadoop和Spark,这方面我知识和经验有限。 3. 云计算,目前很多企业采用在AWS上面运行机器学习算法,这样,你只需聚焦于机器学习模型本身,可以不必过分关注云服务器中的分布式计算是如何具体实现的。云服务能够自动根据业务数据的量来进行autoscaling。——AWS中也提供专门的机器学习认证支持。