作者回复: 我的天,说的太好了,我本来以为这是一道比较难的思考题。基本就是我想要的答案,给你点赞。
作者回复: 是的,示例代码中是spark的交叉验证代码,并不支持tf模型。 如果确实需要的话,需要根据交叉验证的思想自己实现。
作者回复: 没有绝对,但early stop最好是有验证集,通过验证集来确定训练收敛的轮数,上线之后我一般会确定训练轮数来避免一些不可控的问题。
作者回复: 是这样
作者回复: 可以是可以,但效果会非常糟。你想想效果为什么会非常糟。
作者回复: 1、一般不建议这样做,需要n的规模比较大,进行充分的采样。 2、关注下一节课,选取AUC等合适的评估指标。
作者回复: replay是要仿真你线上的模型更新环境和过程。只要你的模型在生产环境下要更新,就应该使用replay的方法,和RL没有关系。 第二个问题也和你的生产环境相关,采用一样的训练和更新频率就好
作者回复: 训练的输出是预测这个样本的标签,也就是0或者1。 最终模型的输出是预测的概率,也就是预测这个样本标签为1的概率。
作者回复: 书中的对比是原paper中的数据,是别人公司的内部数据。 能不能获得要看别人开不开放数据集和源代码。