数据分析实战45讲
陈旸
清华大学计算机博士
立即订阅
17314 人已学习
课程目录
已完结 48 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词 | 你为什么需要数据分析能力?
免费
第一模块:数据分析基础篇 (16讲)
01丨数据分析全景图及修炼指南
02丨学习数据挖掘的最佳路径是什么?
03丨Python基础语法:开始你的Python之旅
04丨Python科学计算:用NumPy快速处理数据
05丨Python科学计算:Pandas
06 | 学数据分析要掌握哪些基本概念?
07 | 用户画像:标签化就是数据的抽象能力
08 | 数据采集:如何自动化采集数据?
09丨数据采集:如何用八爪鱼采集微博上的“D&G”评论
10丨Python爬虫:如何自动化下载王祖贤海报?
11 | 数据科学家80%时间都花费在了这些清洗任务上?
免费
12 | 数据集成:这些大号一共20亿粉丝?
13 | 数据变换:考试成绩要求正态分布合理么?
14丨数据可视化:掌握数据领域的万金油技能
15丨一次学会Python数据可视化的10种技能
16丨数据分析基础篇答疑
第二模块:数据分析算法篇 (20讲)
17 丨决策树(上):要不要去打篮球?决策树来告诉你
18丨决策树(中):CART,一棵是回归树,另一棵是分类树
19丨决策树(下):泰坦尼克乘客生存预测
20丨朴素贝叶斯分类(上):如何让机器判断男女?
21丨朴素贝叶斯分类(下):如何对文档进行分类?
22丨SVM(上):如何用一根棍子将蓝红两色球分开?
23丨SVM(下):如何进行乳腺癌检测?
24丨KNN(上):如何根据打斗和接吻次数来划分电影类型?
25丨KNN(下):如何对手写数字进行识别?
26丨K-Means(上):如何给20支亚洲球队做聚类?
27丨K-Means(下):如何使用K-Means对图像进行分割?
28丨EM聚类(上):如何将一份菜等分给两个人?
29丨EM聚类(下):用EM算法对王者荣耀英雄进行划分
30丨关联规则挖掘(上):如何用Apriori发现用户购物规则?
31丨关联规则挖掘(下):导演如何选择演员?
32丨PageRank(上):搞懂Google的PageRank算法
33丨PageRank(下):分析希拉里邮件中的人物关系
34丨AdaBoost(上):如何使用AdaBoost提升分类器性能?
35丨AdaBoost(下):如何使用AdaBoost对房价进行预测?
36丨数据分析算法篇答疑
第三模块:数据分析实战篇 (7讲)
37丨数据采集实战:如何自动化运营微博?
38丨数据可视化实战:如何给毛不易的歌曲做词云展示?
39丨数据挖掘实战(1):信用卡违约率分析
40丨数据挖掘实战(2):信用卡诈骗分析
41丨数据挖掘实战(3):如何对比特币走势进行预测?
42丨当我们谈深度学习的时候,我们都在谈什么?
43丨深度学习(下):如何用Keras搭建深度学习网络做手写数字识别?
第四模块:数据分析工作篇 (2讲)
44丨如何培养你的数据分析思维?
45丨求职简历中没有相关项目经验,怎么办?
加餐 (1讲)
加餐丨在社交网络上刷粉刷量,技术上是如何实现的?
结束语 (1讲)
结束语丨当大家都在讲知识和工具的时候,我更希望你重视思维和实战
数据分析实战45讲
登录|注册

07 | 用户画像:标签化就是数据的抽象能力

陈旸 2018-12-28
王兴说过,我们已经进入到互联网的下半场。在上半场,也就是早期的互联网时代,你永远不知道在对面坐的是什么样的人。那个年代大部分人还是 QQ 的早期用户。在下半场,互联网公司已经不新鲜了,大部分公司已经互联网化。他们已经在用网络进行产品宣传,使用电商销售自己的商品。
这两年引领下半场发展的是那些在讲 “大数据”“赋能”的企业,他们有数据,有用户。
通过大数据告诉政府该如何智慧地管理交通,做城市规划。
通过消费数据分析,告诉企业该在什么时间生产什么产品,以最大化地满足用户的需求。
通过生活大数据告诉我们餐饮企业,甚至房地产企业该如何选址。
如果说互联网的上半场是粗狂运营,因为有流量红利不需要考虑细节。那么在下半场,精细化运营将是长久的主题。有数据,有数据分析能力才能让用户得到更好的体验。
所以,用户是根本,也是数据分析的出发点。
假如你进入到一家卖羊肉串的餐饮公司,老板说现在竞争越来越激烈,要想做得好就要明白顾客喜欢什么。于是上班第一天,老板问你:“你能不能分析下用户数据,给咱们公司的业务做个赋能啊?”
听到这,你会怎么想?
你说:“老板啊,咱们是卖羊肉串的,做数据挖掘没用啊。”估计老板听后,晚上就把你给开了。
那该怎么办呢?如果你感觉一头懵,没关系,我们今天就来讲讲怎么一步步分析用户数据。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《数据分析实战45讲》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(73)

  • 跳跳
    羊肉串店的用户画像:
    唯一ID确认:可以根据付款人、付款账号等信息确认
    用户标签:性别、年龄、家乡
    消费标签:餐饮口味、消费均价、预定使用等级、排队使用等级
    行为标签:光顾时间、光顾频率、光顾的地理位置(连锁店)、平均点餐时间、对优惠券的敏感程度
    内容标签:菜品种类、菜品数量、餐饮口味
    朋友圈画像
    标签有:家人、朋友、同学、同事、陌生人
    需要统计的种类有:
    用户标签:性别、年龄、地区、通过何种方式添加
    消费标签:点赞内容、参与的活动等
    行为标签:点赞频率,点赞时间、聊天时间、聊天频率、聊天时长
    内容标签:点赞内容,聊天内容、发布朋友圈内容、点赞的文章,关注的公众号
    2018-12-28
    71
  • 修行者
    对羊肉串店的用户画像进行用户消费行为分析:
    - 用户标签:性别、年龄、区域(如离店的距离,是否在附近上班等)
    - 消费标签:消费习惯,是否喜欢加辣或者不加辣,是否对促销敏感,如满50元减10元等,或者是否使用优惠券等
    - 行为分析:购买羊肉串的时间点、每个星期购买频次、购买数量等
    - 内容分析:基于用户的购买习惯统计,用户餐饮口味,受众人群特点,为开发新口味产品做指导

    PS:给极客时间提一个小需求,留言能否支持 markdown,现在的界面有点乱糟糟

    课堂笔记:

    # 用户画像
    互联网下半场**精细化运营**将是长久的主题
    **用户**是根本,也是数据分析的出发点

    ## 用户画像的准则
    1. 统一化:统一标识用户ID,如使用手机号、微信号、微博等
    2. 标签化:给用户打标签,对用户行为进行理解
    3. 业务化:由用户标签,指导用户关联

    用户唯一标识:用于用户行为的**串联**

    对用户标签化,可以进行**用户消费行为分析**:
    - 用户标签:基础信息如性别、年龄、地域等
    - 消费标签:消费习惯、购买意向、是否对促销敏感等
    - 行为标签:时间段、频次、访问路径等
    - 内容分析:页面停留时长、内容浏览,分析用户感兴趣的内容
    因此用户画像是现实世界中的**用户的数学建模**

    当得到了精准的用户画像,那么就可以为企业更精准的解决问题,业务推荐等

    ## 用户生命周期

    1. 获客:拉新,精准营销获取客户,找到优势的宣传渠道
    2. 粘客:场景运营,个性化推荐,提高用户使用频率,比如说可以通过红包、优惠等方式激励优惠敏感人群
    3. 留客:流失率的预测,降低流失率,顾客流失率降低 5%,公司利润提升 25% ~ 85%

    ## 用户画像建模过程

    按照数据流处理阶段划分用户画像建模的过程,分为三个层,每一层次,都需要打上不同的标签。

    - 数据层:用户消费行为的标签。打上**事实标签**,作为数据客观的记录
    - 算法层:透过行为算出的用户建模。打上**模型标签**,作为用户画像的分类
    - 业务层:指的是获客、粘客、留客的手段。打上**预测标签**,作为业务关联的结果

    ## 标签化的作用

    数据挖掘的最终目的不是处理 EB 级别的大数据,而是**理解、使用这些数据挖掘的结果**。
    对数据的标签化能让我们快速理解一个用户、一个商品,乃至一个视频内容的特征,从而方便我们去理解和使用数据。

    而数据标签化实际上是**考验我们的抽象能力**:如何将繁杂的事物简单化?

    作者回复: 很好的总结

    2019-01-04
    26
  • Cathy
    对于评论区中那位“喜欢部门一个女生,通过······各种途径找到各种信息······”,当真是细思极恐。在这类事情上这样真的不会触及人家隐私吗?对于一个还不熟悉的,要追自己的男生,这样的方式,女孩子怕是要吓坏了~
    2018-12-29
    15
  • 蜘蛛的梦呓
    羊肉串连锁店 (分线上or线下)

    1. 思考如何统一用户标识ID 有哪些方式可以付款

    线下:微信、支付宝、现金、信用卡
    线上:微信、支付宝,一般绑定微信和支付宝后,都会绑定手机号
    综合考虑,餐饮公司数据互通的成本,再选择统一的用户标识ID。

    2. 用户消费行为分析:
     
    线下:
    用户从哪来(消费场景)?
    聚餐 or 自己吃宵夜 or 慕名而来 or 随机选择
     
    都是谁(标签化)?
    1. 用户标签:性别、年龄、职业、收入等基本属性。
    2. 消费标签:餐饮口味、消费均价、预定使用等级、排队使用等级
    3. 行为标签:时间点、消费频次、平均点餐用时
    4. 内容分析:基于用户平时浏览的内容进行统计,包括餐饮口味、优惠敏感度(如:特价菜等)等

    线上(假设只有一个平台):

    用户从哪来?
    从何种方式登录而来,统计后,精准化投放广告

    都是谁(标签化)?
    1. 用户标签:性别、年龄、家乡、居住地、收货地址、婚姻、宝宝信息、通过何种渠道进行的注册
    2. 消费标签:餐饮口味、消费均价、团购等级、预定使用等级、排队使用等级、外卖等级
    3. 行为标签:点外卖的时间点、使用频次、平均点餐用时、访问路径
    4. 内容分析:基于用户平时浏览的内容进行统计,包括餐饮口味、优惠敏感度等

    朋友圈
    标签:家人、同学、同事、从何种渠道加来的朋友、哪些产品的微商

    统计的种类
    用户标签:年龄、性别、地区、从何种渠道加来
    消费标签:会在朋友圈分享哪些消费的物品(如:炫车、炫知识付费等)
    行为标签:点赞频率、点赞时间点、朋友圈留言频率、朋友圈互动频率
    内容标签:用户平时浏览的内容进行统计,包括:平时关注哪些公众号内容,哪些朋友圈会点赞,会分享哪些朋友圈
    2018-12-28
    10
  • chuckles
    1、用户标签:性别,微信号,地区等
    2、行为标签:微信头像喜好(动漫、风景、动物、自拍等等)、朋友圈内容分类(养生类、自拍类、炫娃类、秀恩爱类、鸡汤类、技术爱好类、居家类balabala。。)
    3、关系标签:亲戚、同事、小学/初中/高中/本科/硕士/博士、游戏好友、相亲对象等等
    4、内容分析:可依据聊天的频次、时间段、聊天主题打标签

    相信大多数人都是以关系标签进行归类分组,也可以以聊天频次或者聊天主题进行分组。我是不分组。。。简单粗暴。
    2018-12-28
    9
  • ida
    【给羊肉串连锁店画像】
    (前提:连锁店以微信小程序平台点单)
    统一用户标识:微信账号;用户支付方式包括 支付宝账号、银行卡账号、微信账号。因为以微信小程序点单,大多数用户会选择微信,故利用微信账号作为唯一标识;
    用户标签:性别,年龄,家乡,职业,支付渠道等
    消费标签:餐饮口味,消费均价,优惠券使用记录等
    行为标签:就餐时段,来店频次,来店的地理位置,平均点餐用时,时常就餐人数
    内容分析:基于用户点餐选择,包括餐饮口味,优惠敏感度等
    在获客上:选择微信小程序的平台优势,方法通过嵌入分销、拼团、直播、红包、优惠券等促销功能,让用户主动传播、分享,更加引流获客;
    在粘客上:提升用户就餐次数和消费数额,方法通过就餐后的优惠券分发策略,针对优质用户进行更优力度的优惠策略;针对用户就餐人数,结合数据分析得到就餐人数对利润的影响,从而修正餐厅的最低消费金额,或餐厅超过多少金额即可得优惠(但限制人数)
    在留客上:预测用户是否可能不再来本店消费,方法可以通过餐后对就餐意见填写的用户发送红包,优惠券等奖励,得到反馈。但此处要注意因为有优惠,用户可能只填写有益意见,存在幸存者偏差的问题,故而要得到真是有效的建议要更花费心思。

    【朋友圈画像】
    统一用户标志:微信账号包括(家人,同学,朋友,网友,客服)
    用户标签:姓名,性别,年龄,家乡,添加渠道,微信签名,微信上地址选择
    消费标签:点赞内容,评论内容,聊天内容
    行为标签:点赞次数,评论次数,点赞的文章次数,关注公众号个数,微信朋友圈内容公布设置天数,点赞评论时间,聊天频次,聊天时间段,聊天时长,同属几个聊天群,
    内容标签:点赞内容,评论内容,聊天内容,发布内容,点赞的文章内容,关注的公众号
    获客:微信添加若非必加不可一般是看下对方的朋友圈内容,明显代购或太多没有营养的文章转发等不加
    粘客:根据点赞文章内容和关注的公众号我方选择。若要留住对方,也是通过对方发布的朋友圈内容和点赞文章内容以及关注的公众号上找共同点
    留客:要走的留不住,被拉黑了就洒脱点。
    2018-12-29
    6
  • 舒成
    巧了,刚整理一份《增长黑客--如何低成本实现爆发式成长》,我放在幕布上了https://mubu.com/edit/kKKyflQ43q
    全书再讲aarrr模型:获得用户,激活用户,提高留存,增加收入,分享推荐。
    文中提供各个模块的计算指标,欢迎大家交流
    2018-12-28
    1
    6
  • 桃园悠然在
    这篇关于用户画像的解析和三层应用相当精彩,很多时候大家纠结于标签类型怎么分口径怎么定,缺了顶层框架,这样挖掘的效率就慢了。另外,忍不住再点个赞,本专栏大概是最高产&最科班的数据分析专栏了,期待后续内容!
    2018-12-28
    5
  • 闫东汉
    分析一下自己的朋友圈,看看自己有哪些用户画像。
    1、信息标签:性别,年龄,地域、学历、职业。
    2、关系标签:亲人、同事(不同公司)、同学(小中高大)、朋友、一面之交。
    3、行为标签:是否进行互动、聊天点赞、发朋友圈的时间、频率
    4、内容分析:是否原创、文字、视频、图片
    2019-01-01
    4
  • Bella
    老师,我觉得您讲得很好!思路特别清晰。看完每一篇文章,都有一种意犹未尽的感觉。
    可是,老师,能再多举一些案例不?然后提出来让我们思考的问题,会给我们讲,如果要是您来做,您会怎么做吗?谢谢老师!
    2018-12-28
    3
  • JingZ
    感觉内容标签和消费标签容易重复啊?
    2018-12-28
    3
  • Sunny Snow
    由于微信产品本身的价值导向是面向熟人的社交型app,所以我觉得可以根据人与人之间的不同亲密度来给微信中的不同用户进行标签化。
    我大致分了6个等级从L1到L6逐渐递减:
    L1:父母、伴侣、闺蜜、挚友等
    L2:亲戚长辈等
    L3:同学、同学的朋友等
    L4:工作同事等
    L5:一面之缘的人
    L6:骚扰账号
    分类是我临时根据亲密度来划分的,可能会不那么准确,恳请老师和同学们多多指正
    2018-12-28
    3
  • Alex王伟健
    羊肉串连锁店用户画像标签
    用户 ID 标志 : 会员(手机号),非会员用付款账号(支付宝/微信/银行卡等)

    用户标签
    性别
    居住地
    家乡
    年龄
    付款方式

    消费标签
    口味
    单价
    行为标签
    用餐时间
    消费频率
    用餐时长
    用餐方式

    内容分析
    优惠关注度
    口味关注度
    环境关注度

    朋友圈分类
    家人朋友同学归一类
    工作同事
    通过某个渠道遇到的每个渠道都归一类
    乱七八糟的群加的归一类
    同行归一类
    写公号的归一类
    其实,就是有些想转发的内容,想屏蔽掉哪类,就给哪类分个组。

    笔记:https://mubu.com/doc/oNLdDDklQ0
    2018-12-28
    2
  • Python
    以羊肉串店为例子弄用户画像:

    人是不能简简单单的能用标签来概括的,但打标签的方式能帮助我们更方面的理解客户和分析客户。
    一家能用到数据挖掘的羊肉串店,那肯定是做的比较大的,很可能开了很多家连锁店。

    用户标签:性别,年龄,职业,学历等等。
    消费标签:喜欢的口味,对肉质的敏感程度,以及消费的均价。
    行为标签:来店的频率,消费的时间,等待的耐心程度,以及对价格的敏感度。
    内容分析:统计客户最喜欢浏览的在平台上发布的内容,通过内容最后能提炼出,客户的喜好,对某些问题的关心程度等。

    有了这些标签后我们就可以进行业务层面上的实现:
    在获客上,利用客户对价格的敏感度和对大部分客户的喜好下手宣传。
    在黏客上,对消费频次高的客户提高推荐频率,在消费频次低的客户提高打折力度
    在留存上,分析竞争对手的获客方式,以及客户的需求喜好变化等等。


    2018-12-28
    2
  • Destroy、
    1、羊肉串连锁店进行用户画像分析可以参考老师美团那个例子;
    2、朋友圈可以从关系(家人、同事、朋友等)、亲密度(陌生、低、中、高)、互动指数(点赞频率、留言频率等)几个方面去建立用户画像。
    2018-12-28
    2
  • qinggeouye
    用户画像建模

    1、用户唯一标识 ID
    手机号/微信/QQ/微博/邮箱/用户名

    2、给用户打标签
    「用户/消费/行为/分析」
    用户标签 - 性别/年龄/地域/收入/学历/职业/注册渠道
    消费标签 - 消费习惯/购买意向/消费均价/是否对促销敏感
    行为标签 - 时间段/频次/时长/访问路径
    内容分析 - 对用户浏览内容/停留时长/浏览次数多的内容进行分析统计,得到用户感兴趣的内容

    3、业务价值
    用户生命周期
    获客 - 营销/宣传/拉新/转化
    粘客 - 个性化推荐/搜索排序/场景运营(红包/优惠) 提高用户单价与消费频次
    留客 - 流失率预测 降低用户留存运营成本

    作者回复: 总结的不错

    2019-11-03
    1
  • Clany
    老师,用户画像最重要的是打标签,各种等级,层次划分完了,细分了很多标签,但是以那种方式去把这些标签打到用户身上呢?企业是如何去做的?老师能给说说嘛?谢谢
    2019-03-13
    1
  • 方人其
    消费,行为,内容三类标签,傻傻的分不清,关联太大,怎么区分
    2019-01-25
    1
    1
  • 胖陶
    羊肉串
    唯一id确认:手机号或微信号
    用户标签:性别、年龄、地域、收入、学历、职业
    消费标签:喜欢买什么、喜欢什么口味、是否对促销敏感、一般人均在多少
    行为标签:一般都什么时候来,一星期来几次,每次用餐时间多长,一般都怎么来
    内容分析:看什么菜比较多
    微信朋友圈
    唯一id确认:微信号
    用户标签:性别、年龄、地域、收入、学历、职业、关系
    消费标签:喜欢发什么类型的朋友圈
    行为标签:一般都什么时候发朋友圈,一个星期发几次
    内容分析:会给谁,或者什么内容点赞或者评论
    2019-01-16
    1
  • caidy
    1. 羊肉串连锁店用户画像分析
    唯一标识:手机号
    用户消费行为分析:
    用户标签:性别,年龄,收入,学历,地域
    消费标签:消费均价,爱好的口味,是否对优惠券敏感
    行为标签:关顾时间,关顾频率,通过什么方式预约,还是直接到店消费
    内容标签:爱好口味,菜品类型,菜品数目
    业务价值
    获客:通过传单宣传,微信宣传,吸引潜在客户
    粘客:个性化推荐,微信分享满多少赞可以优惠,打折,送优惠券等
    留客:分析留存率,正对留存率问题进行分析,是口味问题,还是菜品问题等等

    微信通信录画像分析
    唯一标识:微信号
    用户消费行为分析:
    用户标签:姓名,性别,年龄,位置
    消费标签:聊天内容,点赞次数,分享次数,关注公众号类型
    行为分析:什么时间点赞,点赞频率,聊天频率,同属哪些微信群,共同好友有哪些
    内容分析:喜欢分享什么文章,发表的朋友圈主要是什么类型的说说
    2018-12-31
    1
收起评论
73
返回
顶部