• Geek_e642b8
    2020-12-11
    第二个问题是FM部分使用两两点积的缘故吗?

    作者回复: 我猜测是因为交叉层的数据太稀疏了,不能够让交叉层完全收敛。 另外交叉层大量使用id类特征,测试集的id特征和训练集的id特征重叠比较少的话,很可能无法作出合理的预测。这也是所谓模型泛化性和记忆性的矛盾。

    
    20
  • 老庄
    2021-03-04
    请教老师,这个wide&deep的ROC和PR AUC的数值,如果使用不同的epochs,得到的结果差别很大。 为什么这里没有把train_dataset分为train和validate两部分,也没有配置EarlyStopping,感觉会一直跑。 这样的结果对比,会不会不大对?

    作者回复: 代码肯定不是最完善的,我完全赞同使用validate dataset和early stop来终止训练。可以的话可以提交PR来增加这些相关方法。

    
    4