零基础实战机器学习
黄佳
新加坡科研局首席研究员
19489 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 24 讲
零基础实战机器学习
15
15
1.0x
00:00/00:00
登录|注册

15|二元分类:怎么预测用户是否流失?从逻辑回归到深度学习

你好,我是黄佳。欢迎来到零基础实战机器学习。
在上一讲中,我们用 lifelines 包中的工具,在“易速鲜花”的会员信息中,挖掘出了与用户流失相关比性较大的几个因素。今天,运营部门又来了新需求,我们通过这个需求,一起来看看怎么解决二元分类问题。
之前,我们接触的绝大多数业务场景都是回归场景,但是,后面更多的场景实战中,也需要分类算法大显身手,而今天这一讲将为我们解决后续诸多分类问题打下基础,它的重要性不言而喻。
好,让我们直接开始吧!

定义问题

这回运营部门又提出了什么需求呢?运营部门的同事是这样向你诉苦的:“要留住会员,真的是难上加难。老板要求我们啊,对于每一个流失的客户,都要打电话,给优惠来挽留,还要发一个调查问卷,收集为什么他不再续费的原因,你说这不是事后诸葛亮吗?人都走了,挽留还有什么意思呢?你们数据这块能不能给建立一个模型,预测一下哪些客户流失风险比较高,然后我们可以及时触发留客机制,你看行吗?”
以你现在对机器学习的理解,你觉得这个需求可以做到吗?当然可以。现在,让我们先来回顾一下运营部门给我们的这个数据集
根据运营同事的描述,我们要预测的标签就是“已停付会费”这个字段。从已有的数据中训练出模型,我们自然就可以推知其它具有类似特征的会员,“停付会费”的可能性大小。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文介绍了如何利用神经网络模型解决用户流失预测问题。文章首先讨论了需求背景,即运营部门希望建立一个模型,能够预测哪些客户流失风险较高,以便及时触发留客机制。接着,文章介绍了数据预处理的步骤,包括数据读入、清洗、可视化和特征工程等工作。然后,文章讨论了选择神经网络模型的原因,指出神经网络适合解决特征数量多、数据集样本数量庞大的分类问题。文章详细介绍了DNN(密集连接层)神经网络模型的构建过程,包括激活函数的选择、编译神经网络和训练过程。最后,文章提到了神经网络模型的训练结果,并暗示了接下来会介绍神经网络模型的表现。整体来看,本文涵盖了从问题定义到模型建立的全流程,适合读者快速了解如何利用神经网络模型解决用户流失预测问题。文章还提到了模型在测试集上的预测准确率达到了77%,但损失和准确率曲线出现振荡波动,需要进一步探讨原因。文章还提到了归一化后的神经网络模型测试准确率为78%,并留下了思考题,鼓励读者尝试使用其他分类算法解决问题,或调整神经网络结构和参数。整体而言,本文内容丰富,涵盖了数据预处理、模型构建和优化等多个方面,对于想要深入了解神经网络模型解决用户流失预测问题的读者具有一定的参考价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《零基础实战机器学习》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(7)

  • 最新
  • 精选
  • 包子
    在jupyter中运行keras和tensorflow。python意外退出,jupyter显示kernel崩溃。有解法吗?

    作者回复: 可能要重装一个环境试试。

    2023-11-22归属地:北京
  • Geek_37299d
    dnn.add(Dense(units=12, input_dim=17, activation = 'relu')) # 添加输入层 dnn.add(Dense(units=24, activation = 'relu')) # 添加隐层 请问这里的units=12 、input_dim=17、units=24等参数都是依据什么填写的呢

    作者回复: 这里是根据经验确定的,属于超参数,可以按照同学的硬件和数据集进行调整。

    2023-10-20归属地:上海
  • Geek_9a0aa0
    准确率只能到77%这样了么 如何继续提升呢

    作者回复: 这个和数据本身有关。我们的数据集也是我随便制作的,要进一步提升准确率可以考虑在网上找更标准的数据集,比较一下你训练的准确率和这个数据集的SOTA(也就是别人训练出来的最佳水平)。这才科学。

    2023-08-15归属地:浙江
  • 蔓延
    第一段代码里的df_churn是哪儿来的?

    作者回复: 数据的读入、清洗、可视化和特征工程等工作,我们在上一讲中已经做好了。参考上一讲。

    2023-02-05归属地:北京
  • Null
    越到后面评论越来越少3

    作者回复: 😆

    2022-09-22归属地:北京
  • 她の他
    老师,有完整的代码吗

    作者回复: https://github.com/huangjia2019/geektime

    2022-08-23归属地:中国香港
  • Sarai李
    醍醐灌顶

    作者回复: 谢谢!

    2022-04-22
收起评论
显示
设置
留言
7
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部