李春生,苏宁易购 IT 总部搜索研发中心技术总监
内容介绍
搜索引擎作为网站的主要流量入口,搜索的用户体验对整个网站起到至关重要的作用,优化搜索、提升用户体验,首先需要大量的数据,用户行为数据、商品专家数据以及海量的用户输入表达数据。其次需要机器学习算法针对既有的数据进行学习与组织数据,建立合理的模型,用数据去理解用户创建用户画像,同时还需要及时识别各种异常情况,对异常行为数据进行相应的惩处措施,在充分了解用户行为与商品模型的前提下为用户提供更优的搜索体验。
本次分享主要基于多年搜索实践经验,讲述搜索如何利用机器学习在商品排序、用户意图识别、商品异常检测、异常流量检测、架构优化等方面的应用。
内容大纲
- 搜索系统总体介绍
(1)苏宁易购搜索系统范围
(2)苏宁易购搜索系统架构演变
- 搜索系统面临哪些难题
(1)用户意图的理解
(2)如何智能纠正与扩展用户 query
(3)商品乱挂现象影响搜索排序
(4)作弊给搜索带来的影响
- 如何利用机器学习技术解决搜索难点
(1)基于 CRF 的中心词识别模型
(2)基于知识图谱的 query 扩展
(3)基于 CNN 与 Naive Bayes 实现图片与文本类别识别
(4)基于常用分类器实现的黑白分类检测作弊行为
- 问答式内容搜索系统试水
(1)搜索的召回更加丰富性
(2)基于 NLP 技术对 query 进行处理
(3)基于知识图谱进行查询推导
(4)问答式搜索适用场景与用户