LinkedIn招聘搜索和推荐系统的实践经验
极客时间编辑部
讲述:丁婵大小:1.66M时长:03:38
日前,LinkedIn 高级工程师齐国等人发文介绍了 LinkedIn 人才搜索和推荐系统相关的一些独特的信息检索、系统和建模中的挑战,以及规划和解决这些挑战的办法。
LinkedIn 的早期机器学习模式是一种线性模型,它的优点是易于解析、解释和部署,在起步阶段是一个很好的选择。但是线性模型不能很好地捕捉非线性的特征交互,而现在,他们使用 GBDT 来释放数据的力量。
GBDT 模型通过树结构显式地实现了交互。除了更大的假设空间外,GBDT 还具有其他的一些优势,例如处理不同范围的特征以及特征值的缺少等。使用 GBDT 进行招聘人员搜索排序在线实验,使招聘者和候选人的结合度指标统计显著地改进了几个百分点。
第二,基于 Pairwise 排序学习(Pairwise LTR)的情景感知排序(Context-aware Ranking)
为了将对搜索情景的认识添加到 GBDT 模型中,齐国的团队对搜索人员的情景,添加了一些个性化功能。对查询的情景,添加了更多候选人查询的匹配功能,其中一些功能直接来自 LinkedIn 的旗舰搜索产品。
使用具有 Pairwise 排序目标的 GBDT 模型来比较相同搜索请求中的候选者。Pairwise 优化器会比较相同搜索查询中成对的结果,而 Pointwise 优化器会假设所有的结果都是独立的,无论它们是否在相同的搜索查询中。
出于这个原因,Pairwise 排序更能体现情景的信息。情景的特征和 Pairwise GBDT 模型的应用,帮助招聘者和候选人的结合度指标上提升了十几个百分点。
第三,深度学习和表示学习方面的努力
如上所述,因为 GBDT 模型具有优于线性模型的特点, 现有的排序系统采用它为 LinkedIn Recruiter 产品提供支持。虽然 GBDT 提供了相当强大的性能,但它也带来了一些挑战:
使用其他可训练组件来扩充树的集成模型(Tree Ensemble Model)是非常重要的。这种做法通常需要对模型与组件 / 特征进行联合训练,而树的集成模型假定不需要对特征本身进行训练。
树模型不能很好地处理稀疏 ID 的特征,但齐国团队希望将它们用于人才搜索的排序。由于稀疏特征只有相对少部分是非零的,因此在每个提升步骤中选择这种树生成的可能性很小。
树模型在模型工程中缺乏灵活性。可能需要用到新的损失函数,或用其他条件来增强当前的目标函数。使用 GBDT 模型不容易实现这样的修改。
为了克服这些挑战,齐国团队探索了基于神经网络模型的使用,这些模型在设计和规范中提供了足够的灵活性。对最多三层的 Pairwise 深度模型进行的离线实验表明,与基线 GBDT 模型相比,后者有了很大的进步,以结合度为标准,改进了几个百分点。
齐国表示,他们正在探索利用 LinkedIn 的最新模型来改进基础设施,以部署神经网络模型。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论