作者回复: 看到你的答案里面已经用了GridSearchCV。很好,GridSearchCV,默认已经使用了5折交叉验证,就是其中的CV参数。那么我们原来不是说3个集吗,训练集,验证集,测试集。因为GridSearchCV有已经自带交叉验证的存在。就不再需要验证集了。 而测试集,还需要,目的是把GridSearchCV的交叉验证结果拿到测试集做最后测试。 好问题。谢谢。
作者回复: 十分认真!
作者回复: 置顶!
作者回复: 谢谢同学细心的指正,我们会更新这块代码。
作者回复: 👍
作者回复: 明佬群中解决了对吧,用inplace = True让删除语句直接修改原有df对象。
作者回复: 1、fit_intercept=True, bool型,默认为True,对训练数据进行中心化,false的话,说明数据已经进行中心化;------ 总结的很好哦! 2. normalize布尔型,默认为false,说明:是否对数据进行标准化处理;---- 我对文档的理解应该是对数据进行某种归一化缩放,(If True, the regressors X will be normalized before regression by subtracting the mean and dividing by the l2-norm. ),如果需要标准化,实现数据的正态分布,应该使用StandardScaler。 ---- 所以这个normalize和标准化(standardize)还是有区别的,这是我的理解。😁
作者回复: 课代表!
作者回复: 给力!后续内容更精彩,敬请期待。
作者回复: 这里只是一个极简化了的示例,因此并没有明确计算公式。在具体的业务模型中,不同场景的业务指标都会有对应的计算方法,不过这并非这个示例的关注点。