25|DeepFM:如何使用深度学习技术给数据排序?
黄鸿波
你好,我是黄鸿波。
上节课里我们讲了非常经典的 GBDT+LR 模型,虽说 GBDT+LR 的组合能够解决很大一部分问题,但是对于高阶的特征组合仍然缺乏良好的应对能力。因此就迎来了本节课要学习的内容:DeepFM。我会先从 FM 的概念入手,然后进一步讲解 DeepFM 的模型结构。
FM 算法概述
在讲解 DeepFM 之前,我们先来了解一下 FM。FM(Factorization Machines,因子分解机)是广义线性模型(GLM)的变种,是一种基于矩阵分解的机器学习算法。
当我们面对推荐系统时,数据可能是一个高维的稀疏矩阵。我们希望从这个矩阵中提取出有用的特征,并用这些特征来进行预测和推荐。常见的做法是使用矩阵分解算法(例如 SVD 和 ALS),但这种算法的计算复杂度很高,不太适用于大规模的数据集。为了解决这个问题,可以使用 FM 算法。
在一般的模型下,各个特征之间都是独立的(例如年龄和文章类别、性别和文章长度等),我们并没有考虑到特征与特征之间的相互关联。但是在实际的推荐系统中,大量的特征之间是有关联关系的,放大了来说,就是内容画像之间的各个特征其实相互关联,内容画像与用户画像之间也存在着很大的关联性。如果能够把这些特征与特征之间的关联性找到,然后挖掘其背后的关系,显然对于推荐系统来说非常有意义。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
本文介绍了深度学习技术在数据排序中的应用,重点讲解了FM算法概述和DeepFM模型结构。FM算法通过对每个特征建模,解决了高维稀疏问题,而DeepFM则结合了FM和神经网络算法的优点,能够同时对低阶和高阶组合特征进行提取。文章详细介绍了DeepFM模型结构,包括Sparse Features、Dense Embeddings、FM Layer、Hidden Layer以及Output Units等五个部分的作用和处理过程。通过对特征进行处理和嵌入,DeepFM模型能够更好地提取特征表达能力和预测性能,适用于大规模数据集、高维度特征和数据稀疏性较高的情况。此外,文章还分析了DeepFM模型的优缺点,为读者提供了全面的技术视角。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《手把手带你搭建推荐系统》,新⼈⾸单¥59
《手把手带你搭建推荐系统》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(4)
- 最新
- 精选
- G小调老师,你代码,在github上哪里
作者回复: https://github.com/ipeaking/recommendation https://github.com/ipeaking/scrapy_sina
2023-07-04归属地:云南3 - 曾超希望老师每节课都能给到参考代码,比如这节课,太理论没有代码不好吸收。
作者回复: https://github.com/ipeaking/recommendation https://github.com/ipeaking/scrapy_sina
2023-06-22归属地:北京3 - 曾超老师没有参考的代码么
作者回复: https://github.com/ipeaking/recommendation https://github.com/ipeaking/scrapy_sina
2023-06-16归属地:北京1 - 悟尘这节课没看懂,完全没理解2023-12-18归属地:北京
收起评论