• will.i.am
    2026-04-01 来自上海
    多阶段后训练, 是在上一步的checkpoint基础上进行的吗, 为什么不是把语义对齐阶段的所有样本放在一起训练
    
    
  • will.i.am
    2026-04-01 来自上海
    感觉论文里面的UID就是用sid求均值的, 不是embedding, 不然为什么有个向上取整的运算
    
    