• 宋不肥
    2020-03-11
    老师,这里的随机性可以理解为我们无法保证我们所拥有的训练数据的统计分布和我们实际使用场景的数据的统计分布是完全相同的,甚至可能是大相径庭的嘛?

    作者回复: 不一定啊。随机性可以做很多理解,在这里我指的是因为我们不能知道有影响的全部变量,所以我们只能假设我们观测到的是一个有噪声的系统。

    
    6
  • alissa
    2021-08-25
    “要在训练集上过拟合才能保证测试准确率”,这个有点不明白,之前理解过拟合就是在训练集拟合表现很好,但到了测试集表现很差泛化能力不行,可是如果是这样过拟合怎么会保证测试准确率呢?

    作者回复: 理论上来说,传统讲训练集和测试集应该类似。但是比赛中经常出现训练集非常过拟合才正常的情况~

    
    1
  • import_rcX
    2020-03-17
    老师什么任务必须要在训练集上过拟合才能保证测试准确率

    作者回复: 很多都是这样的。深度学习很多都是这样。

    共 2 条评论
    1
  • 浩
    2022-09-20 来自北京
    身高和体重,不具有相关性吧。
    
    
  • sky
    2021-09-22
    本讲的随机性:‘随机性可以做很多理解,在这里我指的是因为我们不能知道有影响的全部变量,所以我们只能假设我们观测到的是一个有噪声的系统。’ 个人理解,是说的样本数据信息不足,导致模型预测时候随机很大,出现过拟合欠拟合问题。所以,我们的数据样本包含的信息要充足。 另一方面,在机器学习训练时候,还要利用随机性,如在代码中,我们会shuffle训练集,bert分词时候长度选择也是随机的等; 还有,训练集测试集不一致,这个坑很大。。。
    
    
  • 对白
    2020-07-17
    这里的随机性指的是没有获得足够的信息量或数据的特征过少,而那些未知的特征或信息可以定义成随机性,当特征数量很少的时候,模型肯定不足以获得精准的预测。
    
    
  • 皮特尔
    2020-05-31
    可以这样理解吗: 在测试集和训练集随机分布情况一致的时候,过拟合会保证测试准确率最高。 不过,如果换个场景,用户的真实数据分布和测试集、训练集不同的时候,问题就会暴露出来了?
    
    
  • 刘润森
    2020-03-14
    开车
    
    