kee2
2018-09-01
“如果性能不足,请升级单机配置。根据经验,一个几千万用户,几十...”
请问你说的几千万用户这种场景单机配置大概是怎样的,谢谢
作者回复: 请看最后一篇。关于团队。那里有回答。
1
明华
2018-07-24
老师您好,想问如果我在离线训练阶段使用了逻辑回归训练出了模型,在在线预测时对单个用户调用api预测,但如果是单个用户怎么做例如归一化之类的数据预处理操作呢?
1
尹士
2018-05-02
果性能不足,请升级单机配置。根据经验,一个几千万用户,几十万到百万的物品的协同过滤或者矩阵分解,如果充分发挥单机的性能,综合效率会远远优于在 Spark 上运行。
你好,刀哥,如何充分发挥单机性能,我能想到的只有算法优化和多进程,按照千万用户和五十万物品算,采用物品的协同过滤,每个物品有十个纬度的特征,每个用户有十个纬度特征,我觉得这个量太大,单机实时推荐物品无法做到,想听一下你的高见
1
hqzhao
2018-05-01
每期都听,自己的研究方向就是RS,听完发现同样的问题站在不同的角度去理解会发现一片新天地。很感谢刑前辈!
1
林彦
2018-05-01
Bandit算法需要根据场景反馈调试模型的参数值,适合还没有任何模型效果数据的冷启动。当候选臂的数量不大时,可以直接应用到在线计算中。也可以作为其他离线模型推荐结果的在线优化模型使用。
1
Geek_00437c
2019-11-18
两个问题:
1、如果一个用户足够活跃,把离线召回的item都用完了,这时候近线层的召回补充就发挥很大作用了?
2、您的github是啥,网上没找到~
Warner
2019-07-23
老师,近线层中的"在线数据"是怎么产生的?在线层输出的吗?
shangqiu86
2019-05-06
bandit算法主要解决EE问题和冷启动问题,我觉得应该放到在线层,作为融合排序的一部分
Better Life
2018-12-23
老师,实时I2I有干货可以分享一下吗?git上面有demo可以学习的吗
作者回复: Itembased的代码见我的github。
帅帅
2018-09-26
Another option is to precompute part of a result with an offline process and leave the less costly or more context-sensitive parts of the algorithms for online computation。
在原文看到了这句话,可以将一部分预计算好放到cache里服务,将少量的有价值或者对环境敏感的算法部分可以在线计算
帅帅
2018-09-24
感觉在线部分调用融合排序模型,也不绝对这样的;
比如一个网站,内容更新比较慢,那每个用户都预计算好预排序好推荐列表就可以,没必要每次排序,毕竟排序还是调用模型性能耗费大
帅帅
2018-09-13
在多篇文章中看到作者对分布式计算的降级,认为会提升成本;
其实spark是支持standalone单机版本的,并且在单机上无缝使用多核计算,即使将来不能满足需求了,把--master从local改成yarn就变成了分布式~~~~
梦露
2018-06-06
结合上下文和协同过滤能降低臂个数的Bandit可以用于在线部分,纯Bandit适合在离线部分,保证长尾物品的曝光
我们在线,来聊聊吧
✕
您好,当前有专业客服人员在线,让我们来帮助您吧。
我们在线,来聊聊吧