will.i.am
2026-04-01
来自上海
多阶段后训练, 是在上一步的checkpoint基础上进行的吗, 为什么不是把语义对齐阶段的所有样本放在一起训练
will.i.am
2026-04-01
来自上海
感觉论文里面的UID就是用sid求均值的, 不是embedding, 不然为什么有个向上取整的运算