qi
2018-04-08
感觉越来越不理解了,只怪自己太浅了,学识不够!
6
上个纪元的赵天师
2018-04-04
跪求老师出版实体书,感觉太有收获了
作者回复: 会有的。
2
mervynlh
2018-04-04
老师,现在项目中用的gbdt还是fm,两者比较呢
2
🐱您的好友William...
2018-10-01
DNN虽然可以自动做一些feature engineering的工作,但是对于大型系统来讲,还是规定一些feature,将这一部分单独拿出来做之后共享给其他组,之后各个组的工作才能对接,对接之后fine-tune的可解释性也强,如果大家都用DNN,那么就是一个黑盒子加一个黑盒子,有可能输入输出还不一样,到时候融合对接都成问题。所以DNN作为一个超级function approximator在工业界还是应该比较适用于小型独立的项目,项目组之前各个组之间feature的统一提取,或者是之后作为项目最后的决策层。
1
帅帅
2018-09-25
目前看起来,模型从简单到强大,一次是LR、GBDT+LR、GBDT+FM、DNN;
那是不是直接上DNN最好呢?
我的理解并不是,如果数据量很小使用DNN会容易过拟合;
因此,简单的就选GBDT+LR、复杂的就选DNN;
1
1
愚公移山
2018-04-05
老师,使用了两两特征组合后,逻辑回归从线性模型变成了非线性模型,因此模型表现的更好,可以这样理解吗?
1
FF
2019-10-25
对于只留下用户 ID 和电影 ID的公式来说,那两个隐因子不是一般的向量?而是两个隐因子矩阵?
1
shangqiu86
2019-04-30
老师,没有扩展开来,现在比较流行的是deepFM和deepFFM,把每个特征做embedding,老师,想问下FM有什么开源的python包吗?
林彦
2018-04-05
感觉现在周围一般的机器学习实践GBDT用的更多一点。没和实践过推荐系统的人直接交流过,不知道因子分解机除了预测点击率外,对什么场景效果优于其他的特征组合方法。现在陈老师的理论讲得通俗易懂,不过自己编程和工程实践训练不够,实践还不知道如何入手。用哪套数据,哪套来源工具包,阅读哪套源码来学习实践还没有认知。
作者回复: 如果找不到实践机会,就去kaggle刷比赛吧。如果你想实习,也可以给我发简历:chenkaijiang001@lianjia.com
Classtag
2018-04-04
后边会说到deepfm fnn 这些模型吗?
作者回复: 会说到相似的模型。
我们在线,来聊聊吧
✕
您好,当前有专业客服人员在线,让我们来帮助您吧。
我们在线,来聊聊吧