极客视点
极客时间编辑部
极客时间编辑部
113242 人已学习
免费领取
课程目录
已完结/共 3766 讲
2020年09月 (90讲)
时长 05:33
2020年08月 (93讲)
2020年07月 (93讲)
时长 05:51
2020年06月 (90讲)
2020年05月 (93讲)
2020年04月 (90讲)
2020年03月 (92讲)
时长 04:14
2020年02月 (87讲)
2020年01月 (91讲)
时长 00:00
2019年12月 (93讲)
2019年11月 (89讲)
2019年10月 (92讲)
2019年09月 (90讲)
时长 00:00
2019年08月 (91讲)
2019年07月 (92讲)
时长 03:45
2019年06月 (90讲)
2019年05月 (99讲)
2019年04月 (114讲)
2019年03月 (122讲)
2019年02月 (102讲)
2019年01月 (104讲)
2018年12月 (98讲)
2018年11月 (105讲)
时长 01:23
2018年10月 (123讲)
时长 02:06
2018年09月 (119讲)
2018年08月 (123讲)
2018年07月 (124讲)
2018年06月 (119讲)
时长 02:11
2018年05月 (124讲)
时长 03:16
2018年04月 (120讲)
2018年03月 (124讲)
2018年02月 (112讲)
2018年01月 (124讲)
时长 02:30
时长 02:34
2017年12月 (124讲)
时长 03:09
2017年11月 (120讲)
2017年10月 (86讲)
时长 03:18
时长 03:31
时长 04:25
极客视点
15
15
1.0x
00:00/03:52
登录|注册

应聘机器学习工程师必知的8个基础面试题(下)

讲述:丁婵大小:5.32M时长:03:52
在上一篇文章中,我们分享了公众号“机器之心”编译的 4 个机器学习相关岗位的基础面试题,本文继续分享另外四道题,具体如下。
问题一:当学习率过高或过低时会怎样?
当模型的学习率过低时,模型的训练速度会变得非常慢,因为其每次对权重的更新会变得非常小,模型将需要大量更新才能到达局部最优点。
如果学习率过高,模型很可能无法收敛,因为权重的更新过大。在加权的步骤中,模型有可能无法实现局部优化,然后使模型难以更新到最优点(因为每步更新都跳得过远,导致模型在局部最优点附近摇摆)。
问题二:当输入图像的尺寸加倍时,CNN 参数的数量会增加多少倍?为什么?
对于参加面试的人来说,这个问题很有误导性,因为大部分人思考这个问题的方向都是 CNN 的参数数量会增加多少倍。但是,CNN 模型的参数数量取决于过滤器的数量和大小,而非输入图像。因此,将输入图像的尺寸加倍不会改变模型的参数数量。
问题三:处理数据不平衡问题的方法有哪些?
这个问题检验的是面试者是否知道处理真实数据问题的方法。通常,实际数据和样本数据(无需调整的标准数据集)在性质和数据量上都有很大的不同。使用真实数据集时,数据有可能是不平衡的,也就是说不同类别的数据不平衡。针对这个问题,你可以考虑使用以下方法:
为模型的评估选择适当的指标:当使用的数据集不平衡时,使用准确度来进行评估是不合适的,而应该选择精确度、召回率、F1 分数、AUC 等评估指标。
对训练数据集进行重新采样:除了使用不同的评估指标外,你还可以通过某些技术来获得不同的数据集。基于不平衡的数据集创建平衡的数据集的方法有两种,即欠采样和过采样,具体技术包括重复、自举或合成少数过采样技术。
集成多个不同模型:通过创建更多数据来实现模型的通用性在实践中是不可取的。举个例子,假设你有两个类别:有 1000 个数据样本的罕见类别和有 10000 个数据样本的常见类别。你可以不用为罕见类别寻找 9000 个数据样本来进行模型训练,而是采用一种 10 个模型的训练方案。其中每个模型都使用 1000 个罕见数据样本和 1000 个常见数据样本进行训练。然后使用集成技术得到最佳结果。
重新设计模型——成本函数:在成本函数中使用惩罚技术来严厉惩罚数据丰富的类别,以帮助模型自身更好地学习罕见类别的数据。这能使损失函数的值更全面地覆盖所有类别。
问题四:数据生成器的概念是什么?使用数据生成器需要什么?
生成函数在编程中也非常重要,数据生成函数可以帮助你在每个训练 batch 中生成能直接拟合模型的数据。
使用生成函数在训练大数据时很有帮助。因此数据集并不是需要全部都载入 RAM,这是浪费内存。此外,如果数据集过大,还可能导致内存溢出,输入数据的处理时间也会变得更长。
以上就是今天的内容,希望能给你提供参考价值。了解更多内容请点击原文链接
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

全部留言(2)

  • 最新
  • 精选
  • 小斧
    假如有正序有倒序功能就好了,我想把全部的都听一遍。😄
  • 果珍冰
    很有用
收起评论
显示
设置
留言
2
收藏
57
沉浸
阅读
分享
手机端
快捷键
回顶部