• 谦
    2021-10-06
    之前对集成算法对参数不是很理解,在learning_rate和n_estimators对选择上有过经验教训,惯性思维认为learning_rate只是决定训练的速度,然后就随便选了一个learning_rate对Adaboost,XGBoost,GBDT 和随机森林分别进行训练,得到对结果Adaboost > 随机森林 > GBDT > XGBoost。因为网上都说XGB很厉害,这个的结果看上去不太合理,这时候通过增加n_estimators对数量,XGB的结果终于排到第一名,后面发现如果不增减n_estimators对数量,把learning_rate从0.1改成了1,XGB对结果也说可以排到第一位,也就是learning_rate和n_estimators是配合使用的,小的learning_rate需要更多对estimator来支持。如果老老实实用GridSearchCV的话,应该可以早点找到合适的参数。

    作者回复: 这是宝贵的调参过程之细节,感谢分享!!

    
    5
  • Null
    2022-09-26 来自北京
    纠错实例代码:决策树bagging,dt = BaggingClassifier(DecisionTreeClassifier()) # 只使用一棵决策树dt.fit(X_train, y_train) # 拟合模型。这里应该是dt = DecisionTreeClassifier())吧。

    作者回复: 谢谢同学,你是正确的。应该改为:dt = DecisionTreeClassifier() 我们会修正网页。

    共 3 条评论
    
  • 尼古拉斯德彪
    2022-04-08
    老师,总结的最后一句话,是写错了吗? 推荐两种算法,说了3个???那么最后,如果让我在集成学习家族的算法里,给你推荐两种常用且效果好的算法,基于我个人的经验,我会觉得 XGBoost、GBDT 和随机森林是优于其它几种的。

    作者回复: 谢谢同学的建议,更准确的说法是“一些”或“几个”。😋

    
    
  • FM微言送
    2021-12-06
    问个题外话:SAP这个是不是跟现在智能制造(ERP,MES,WMS,SRM,PLM...等九大系统)类似。小白希望能解答

    作者回复: SAP是一个大型的ERP系统软件,也是最大最全面的。你上面列举的9大系统里面的很多系统应该在SAP中都有具体的实现。公司上马了SAP系统,很多产、供、销、资源调配,财务管理,人类资源管理均可以找到解决方案。但是SAP这个软化很贵。

    
    
  • JL
    2021-11-29
    提出两个裂变方案之后,运营部门收集了转化数据。那么,我们今天的目标就是根据这个数据集,来判断一个特定用户在特定的裂变促销之下,是否会转化。 老师这段话里的转化数据链接好像错了,点进去是18的内容

    作者回复: 谢谢反馈,我们这边调整一下链接。

    
    