极客视点
极客时间编辑部
极客时间编辑部
113240 人已学习
免费领取
课程目录
已完结/共 3766 讲
2020年09月 (90讲)
时长 05:33
2020年08月 (93讲)
2020年07月 (93讲)
时长 05:51
2020年06月 (90讲)
2020年05月 (93讲)
2020年04月 (90讲)
2020年03月 (92讲)
时长 04:14
2020年02月 (87讲)
2020年01月 (91讲)
时长 00:00
2019年12月 (93讲)
2019年11月 (89讲)
2019年10月 (92讲)
2019年09月 (90讲)
时长 00:00
2019年08月 (91讲)
2019年07月 (92讲)
时长 03:45
2019年06月 (90讲)
2019年05月 (99讲)
2019年04月 (114讲)
2019年03月 (122讲)
2019年02月 (102讲)
2019年01月 (104讲)
2018年12月 (98讲)
2018年11月 (105讲)
时长 01:23
2018年10月 (123讲)
时长 02:06
2018年09月 (119讲)
2018年08月 (123讲)
2018年07月 (124讲)
2018年06月 (119讲)
时长 02:11
2018年05月 (124讲)
时长 03:16
2018年04月 (120讲)
2018年03月 (124讲)
2018年02月 (112讲)
2018年01月 (124讲)
时长 02:30
时长 02:34
2017年12月 (124讲)
时长 03:09
2017年11月 (120讲)
2017年10月 (86讲)
时长 03:18
时长 03:31
时长 04:25
极客视点
15
15
1.0x
00:00/03:38
登录|注册

LinkedIn招聘搜索和推荐系统的实践经验

讲述:丁婵大小:1.66M时长:03:38
日前,LinkedIn 高级工程师齐国等人发文介绍了 LinkedIn 人才搜索和推荐系统相关的一些独特的信息检索、系统和建模中的挑战,以及规划和解决这些挑战的办法。
第一,使用 GBDT(Gradient Boosted Decision Trees)进行非线性建模
LinkedIn 的早期机器学习模式是一种线性模型,它的优点是易于解析、解释和部署,在起步阶段是一个很好的选择。但是线性模型不能很好地捕捉非线性的特征交互,而现在,他们使用 GBDT 来释放数据的力量。
GBDT 模型通过树结构显式地实现了交互。除了更大的假设空间外,GBDT 还具有其他的一些优势,例如处理不同范围的特征以及特征值的缺少等。使用 GBDT 进行招聘人员搜索排序在线实验,使招聘者和候选人的结合度指标统计显著地改进了几个百分点。
第二,基于 Pairwise 排序学习(Pairwise LTR)的情景感知排序(Context-aware Ranking)
为了将对搜索情景的认识添加到 GBDT 模型中,齐国的团队对搜索人员的情景,添加了一些个性化功能。对查询的情景,添加了更多候选人查询的匹配功能,其中一些功能直接来自 LinkedIn 的旗舰搜索产品。
使用具有 Pairwise 排序目标的 GBDT 模型来比较相同搜索请求中的候选者。Pairwise 优化器会比较相同搜索查询中成对的结果,而 Pointwise 优化器会假设所有的结果都是独立的,无论它们是否在相同的搜索查询中。
出于这个原因,Pairwise 排序更能体现情景的信息。情景的特征和 Pairwise GBDT 模型的应用,帮助招聘者和候选人的结合度指标上提升了十几个百分点。
第三,深度学习和表示学习方面的努力
如上所述,因为 GBDT 模型具有优于线性模型的特点, 现有的排序系统采用它为 LinkedIn Recruiter 产品提供支持。虽然 GBDT 提供了相当强大的性能,但它也带来了一些挑战:
使用其他可训练组件来扩充树的集成模型(Tree Ensemble Model)是非常重要的。这种做法通常需要对模型与组件 / 特征进行联合训练,而树的集成模型假定不需要对特征本身进行训练。
树模型不能很好地处理稀疏 ID 的特征,但齐国团队希望将它们用于人才搜索的排序。由于稀疏特征只有相对少部分是非零的,因此在每个提升步骤中选择这种树生成的可能性很小。
树模型在模型工程中缺乏灵活性。可能需要用到新的损失函数,或用其他条件来增强当前的目标函数。使用 GBDT 模型不容易实现这样的修改。
为了克服这些挑战,齐国团队探索了基于神经网络模型的使用,这些模型在设计和规范中提供了足够的灵活性。对最多三层的 Pairwise 深度模型进行的离线实验表明,与基线 GBDT 模型相比,后者有了很大的进步,以结合度为标准,改进了几个百分点。
齐国表示,他们正在探索利用 LinkedIn 的最新模型来改进基础设施,以部署神经网络模型。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
34
沉浸
阅读
分享
手机端
快捷键
回顶部