作者回复: 找来一份电商数据集做一套项目的想法很好!🤟
作者回复: 这个案例的设计意图应该是已经收集了人群的“人口统计学信息”,比如说男女,年龄,消费规律等等(这些特征也可以认为是用户画像的雏形吧),然后主要是基于这些人口统计学特征,用机器学习的方法来确定是否适合给他或她推送某种促销。 广义上说,我们就是在把用户画像用各种手法做的更精细。对吧。
作者回复: 是的,LightGBM 和 XGBoost 都属于同一类的集成学习模型,特别是他们都是基于决策树的梯度提升模型。以下是它们的简要概述: XGBoost(Extreme Gradient Boosting): XGBoost 是一个用于优化大规模和稀疏数据的梯度增强框架。 它有正则化,可以帮助减少过拟合。 XGBoost 使用了一种叫做预排序的方法和深度优先搜索来构建树,这是其和 LightGBM 之间的主要区别之一。 LightGBM(Light Gradient Boosting Machine): LightGBM 是微软发布的一个开源的梯度提升框架,它特别适用于大数据和高维数据。 与 XGBoost 不同,LightGBM 使用一种叫做直方图分裂的技术,它对数据进行分箱,从而降低计算复杂性。 另外,LightGBM 提供了一种叫做带深度限制的叶优先的树生长策略。