作者回复: 关于这个数据点的预测值和真值。这里有几个方面的考量。第一,我们的数据量比较小,只有几百个用户的数据。要得到更健壮的模型,需要很大量的数据。第二,从数据的角度,这个数据点他的前三个月和后12个月消费行为变化比较大。这个用户应该是前面消费很少,后期消费突然增多。那么,从我们这个示例模型的建模方式来说,对这种类型的用户,预测的就会很不准确,可以从特征选择、建模的方法来考虑有没有新的 idea。 其实啊,要预测未来的数值,理论上虽可行,但一定要做好有巨大误差的准备。这和预测股价类似,理论上模型可能预测一个上升趋势,但是实际上可能因为特殊因素突然大幅下跌。
作者回复: "写Demo的时候发现sklearn库非常强大,测试不同算法的效果非常容易。" ---- 太棒了,你发现了这一点,这个课程就没有白学了。用好它!😍
作者回复: 对的。总结的好。RFM主要用于观察老用户,然后促进在老用户身上的营收增长,精细化运营。 在拉新过程中,也就是起到一些估计指导意义,大概估计一批新用户有可能带来的平均回报吧。
作者回复: 有,欢迎加群,方式见课程介绍链接。 https://time.geekbang.org/column/intro/438
作者回复: 谢谢同学的分享和发现!
作者回复: 有啊,所有的jupyter notebook我不是都上载到GitHub里面了么。https://github.com/huangjia2019/geektime
作者回复: 也是一种思路!
作者回复: 在模型移植这方面,我的经验就相对有限一些。因为大的项目组中,负责建模和负责模型部署,或者模型移植复现的是两组人。让我来查阅一下相关方面的资料,然后在后面做一些分享。😁
作者回复: 好
作者回复: 同学的两个建议都很有见地!基于具体的情况,场景,我们的特征工程还可以进一步优化和调整,以做的更完美。