微微一笑
2018-05-14
请问老师,您说的道理我都懂,但是一到设计表结构环节就有点拿不定主意。我现在比较关注推荐领域hbase表设计,有什么推荐的资料吗?
4
知行筠
2019-07-15
你好,基与elasticsearch推荐文章什么时候能发布。现在在黑暗中摸索……
2
北邙
2018-06-20
不知道hbase的表结构应该如何设计
2
Da.du.Ma
2019-01-14
基于ElasticSearch实现的第一个版本的内容推荐系统,是否可以写个专题。
作者回复: 会写的。
1
雨幕下的稻田
2020-01-10
老师您好,问下,倒排索引使用redis,是否是key:标签,value:list或者set格式的集合,那如何也做到更新,尤其remove操作,还有倒排使用redis,内存是否会开销很大,因为一些item重复的出现在一些标签中
作者回复: 你这种场景ES挺适合的。
随心而至
2019-08-07
热门排行的接口名称叫Relative是不是不太好
shangqiu86
2019-05-08
目前用的比较多的还是redis,数据量并不大,每天的点击量在5w左右,sku的量在2w左右,通常做的是能离线计算的就先离线计算好,并shell脚本定时去刷新离线数据,与redis的交互是在线上阶段,取到召回,实时排序,然后输出结果,目前接口要求在200ms
Da.du.Ma
2019-01-29
对于api的调用链上的存储体系能深入讲一下么?每一次调用只返回少量top10,但是推荐系统最起码也要处理top100,存在浪费和损耗;而且,每次返回的数据,还需要放入已推荐记录,防止重复推荐。有没有一个整体的平衡思路
作者回复: 我在图书中有详细方案。书已经完稿,请期待。
1
Berton
2019-01-04
正排索引是根据id得到所有的特征值,不是应该用行式数据库吗?
作者回复: 特征是稀疏的。
帅帅
2018-09-13
后两个API的接口重复了
最后一个/hostlist是不是很好
帅帅
2018-09-13
看老师的意思,是需要实时做召回和排序,这样即使再优化时间也会很长吧。
感觉可以分两类:
1、热用户,提前算好所有的recommend,放到redis[userid] = list,每次直接分页返回即可;
2、冷启动用户,再使用上面的流程,比如如果发现有用户画像,就找相邻用户,在做排序返回;
zoong
2018-05-12
外专业的的文科生表示跟不上啦
铁丑-王立丰
2018-05-12
用户和物品的画像数据适合存储在 Cassandra 中。也适合存储模型数据,如相似度矩阵,还可以存储离线计算的推荐结果。
无刀老师,这几个场景完全可以用redis 方案吧。而且cassandra 也是kv的
我们在线,来聊聊吧
✕
您好,当前有专业客服人员在线,让我们来帮助您吧。
我们在线,来聊聊吧