29｜超长用户行为序列建模：字节 Longer-生成式推荐系统算法与实践-极客时间

生成式推荐系统算法与实践

傅聪

搜推广资深算法专家

879 人已学习

新⼈⾸单¥59

课程目录

已更新 31 讲/共 36 讲

课程介绍 (1讲)



课程介绍｜推荐系统已死？生成式推荐技术革命已来临！

时长 10:45

系统性对比：生成式推荐好在哪？ (3讲)



01｜“传统”推荐系统的局限：我的模型为什么优化不动了？

时长 19:06

02｜前车可鉴：对比大语言模型和生成式推荐

时长 28:54

03｜变革前夜：为什么生成式推荐是未来？

时长 22:45

算法原理：生成式算法基础 (8讲)



04｜越大越牛？Transformer和它的scaling law

时长 49:59

05｜推荐系统的GPT3时刻（上）：SasRec

时长 37:10

06｜推荐系统的GPT3时刻（下）：Bert4Rec

时长 20:39

07｜语言体系之争（上）：LLM as Recommender

时长 38:42

08｜语言体系之争（中）：Recforest算法

时长 38:50

09｜语言体系之争（下）：Tiger算法

时长 50:18

10｜另辟蹊径：Diffusion For Rec

时长 31:53

11｜总结：论文里的生成式算法为何难落地？

时长 48:40

工业技术路线（一）：Meta HSTU系列 (4讲)



12｜替换Transformer？HSTU召回算法原理

时长 55:47

13｜替换Transformer？HSTU 排序算法原理

时长 41:40

14｜美团MTGR：HSTU算法落地经验

时长 17:37

15｜小红书RankGPT：HSTU落地实践

时长 37:55

工业技术路线（二）：OneRec (6讲)



16｜OneRec：语义ID与特征工程

时长 43:20

17｜OneRec：强化学习偏好对齐

时长 01:16:34

18｜OneSearch：端到端生成式检索

时长 01:24:25

19｜UniSearch：一体化的SID模型

时长 48:55

20｜OneRecV2：模型压缩和推理优化

时长 44:44

21｜OneRec-think：多模态推理模型

时长 51:55

工业技术路线（三）：OnePiece (4讲)



22｜通用超级基座的起点：LLM推理技术演进

时长 43:59

23｜Latent Reasoning：从LLM到推荐系统

时长 37:10

24｜OnePiece：混合推理在生成式检索的应用（上）

时长 36:09

25｜OnePiece：混合推理在生成式检索的应用（下）

时长 34:14

系统重构：重新理解数据、样本、特征、训练和服务 (3讲)



26｜OneRec模式工业系统架构与评估体系解析

时长 35:43

27｜OnePiece模式工业系统架构与评估体系解析

时长 18:15

28｜技术选型：如何设计自己的生成式技术发展路线？

时长 32:16

更多工业落地案例 (1讲)



29｜超长用户行为序列建模：字节 Longer

时长 26:24

直播回放 (1讲)



直播加餐｜生成式AI重塑推荐系统：是终极进化，还是美丽泡沫？

时长 01:46:51



生成式推荐系统算法与实践



留言





沉浸
阅读





手机端



回顶部

当前播放: 29｜超长用户行为序列建模：字节 Longer

00:00 / 00:00

字幕已开启

高清

高清

1.0x

3.0x
2.5x
2.0x
1.5x
1.25x
1.0x
0.75x
0.5x

网页全屏

全屏

00:00

付费课程，可试看



课程介绍｜推荐系统已死？生成式推荐技术革命已来临！

01｜“传统”推荐系统的局限：我的模型为什么优化不动了？

02｜前车可鉴：对比大语言模型和生成式推荐

03｜变革前夜：为什么生成式推荐是未来？

04｜越大越牛？Transformer和它的scaling law

05｜推荐系统的GPT3时刻（上）：SasRec

06｜推荐系统的GPT3时刻（下）：Bert4Rec

07｜语言体系之争（上）：LLM as Recommender

08｜语言体系之争（中）：Recforest算法

09｜语言体系之争（下）：Tiger算法

10｜另辟蹊径：Diffusion For Rec

11｜总结：论文里的生成式算法为何难落地？

12｜替换Transformer？HSTU召回算法原理

13｜替换Transformer？HSTU 排序算法原理

14｜美团MTGR：HSTU算法落地经验

15｜小红书RankGPT：HSTU落地实践

16｜OneRec：语义ID与特征工程

17｜OneRec：强化学习偏好对齐

18｜OneSearch：端到端生成式检索

19｜UniSearch：一体化的SID模型

20｜OneRecV2：模型压缩和推理优化

21｜OneRec-think：多模态推理模型

22｜通用超级基座的起点：LLM推理技术演进

23｜Latent Reasoning：从LLM到推荐系统

24｜OnePiece：混合推理在生成式检索的应用（上）

25｜OnePiece：混合推理在生成式检索的应用（下）

26｜OneRec模式工业系统架构与评估体系解析

27｜OnePiece模式工业系统架构与评估体系解析

28｜技术选型：如何设计自己的生成式技术发展路线？

29｜超长用户行为序列建模：字节 Longer

直播加餐｜生成式AI重塑推荐系统：是终极进化，还是美丽泡沫？



本节摘要

超长用户行为序列建模面临信息损失、性能开销大等问题。传统方法如人工构建用户画像和预训练用户表征模型存在信息抽取偏差。Longer 通过混合多尺度 Attention 设计解决这些问题，包括 Global Token 模块定义全局信息与上下文特征，以及 Inner Transformer 实现序列压缩。具体而言，Longer 将长序列拆分成多个块，使用 Q-Former 结构进行逐级压缩，结合 Causal Attention 进一步提升推理能力。此外，Longer 采用 Torch All-Reduce 和 KV-Cache 等技术优化算力，减少冗余计算。实验结果显示，Longer 在 AUC 上比 Transformer 有轻微提升，并且随着序列长度和参数量增加，效果持续改善。在线实验表明，Longer 在抖音广告中表现良好。

展开 

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论

AI总结

文稿

全文摘要

超长用户行为序列建模面临信息损失、性能开销大等问题。传统方法如人工构建用户画像和预训练用户表征模型存在信息抽取偏差。Longer通过混合多尺度Attention设计解决这些问题，包括Global To...展开

分段总结

购买后使用