数据分析实战 45 讲
陈旸
清华大学计算机博士
123928 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 49 讲
第二模块:数据分析算法篇 (20讲)
第四模块:数据分析工作篇 (2讲)
数据分析实战 45 讲
15
15
1.0x
00:00/00:00
登录|注册

06 | 学数据分析要掌握哪些基本概念?

上帝不会告诉我们规律,而是展示给我们数据
白话数据概念
数据挖掘的流程
元数据 VS 数据元
数据挖掘DM
数据仓库DW
商业智能BI
Apriori算法
数据分析基本概念

该思维导图由 AI 生成,仅供参考

美国明尼苏达州一家 Target 百货被客户投诉,这名客户指控 Target 将婴儿产品优惠券寄给他的女儿,而他女儿还是一名高中生。但没多久这名客户就来电道歉,因为女儿经他逼问后坦承自己真的怀孕了。
Target 百货寄送婴儿产品优惠券绝非偶然之举,他们发现妇女在怀孕的情况下,购买的物品会发生变化,比如护手霜会从有香味的改成无味的,此外还会购买大量维生素等保健品。通过类似的关联分析,Target 构建了一个“怀孕预测指数”,通过这个指数预测到了顾客已经怀孕的情况,并把优惠券寄送给她。
那么顾客怀孕与商品之间的关联关系是如何被发现的呢?
实际上他们都是用的 Apriori 算法该算法是由美国学者 Agrawal 在 1994 年提出的。他通过分析购物篮中的商品集合,找出商品之间的关联关系。利用这种隐性关联关系,商家就可以强化这类购买行为,从而提升销售额。
这就是数据分析的力量,人们总是从数据分析中得到有价值的信息,啤酒和尿布的故事也是个经典的案例。如今在超市中,我们还能看到不少组合的套装打包在一起卖,比如宝洁的产品:飘柔洗发水 + 玉兰油沐浴露、海飞丝洗发水 + 舒肤佳沐浴露等等。
商品的捆绑销售是个很有用的营销方式,背后都是数据分析在发挥作用。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

数据分析的基本概念包括商业智能、数据仓库和数据挖掘。商业智能是基于数据仓库和数据挖掘的过程,通过分析消费行为得到商业价值。数据仓库是数据存储的基础,而数据挖掘则包括分类、聚类、预测和关联分析等任务。数据挖掘的流程包括数据预处理、挖掘和后处理。文章还介绍了元数据和数据元的区别,以及数据挖掘中的关联分析和预测等任务。通过这些基本概念,读者可以了解数据分析的核心内容和流程。数据挖掘的价值在于揭示数据规律,帮助创造更大的商业价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据分析实战 45 讲》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(130)

  • 最新
  • 精选
  • 隰有荷
    分类和聚类有什么区别,感觉不是一个意思吗?

    作者回复: 不一样的: 分类是已知了 类别,然后看样本属于哪个分类 聚类是不知道有哪些类别,按照 样本的属性来进行聚类,实际上是一种降维方式。 比如你追个女生,你知道女生有 御姐,萝莉,两种类别,你可以判断下 追的这个女生属于 御姐还是萝莉,这个属于分类。 比如你追5000个女生,你也不知道女生都有哪些类别,为了方便,你将5000个女生,按照属性的相似度划分成了5个组,这个属于聚类。先聚成了5类,然后再看每个组的特点,给不同的组取名,比如 “大小姐组”,“小家碧玉组”等等,都是先聚类,然后再判断

    2019-08-09
    8
    57
  • Conan
    两题都选A。 追女孩的例子真是一目了然:)

    作者回复: 哈哈 很多人想让我做一个白话数学基础的介绍,所以我先把这些概念用“追女孩”的例子解释了下

    2018-12-26
    29
  • 皮蛋
    没太明白聚类和分类区别

    作者回复: 分类就是已经一些类别,看样本属于什么类别 聚类是不知道类别的情况,把样本划分为几个组(按照样本的特征自动进行划分),然后再观察这些组具有怎样的特征,给这个组取个名字

    2019-02-19
    4
    5
  • 杰之7
    通过这一节的学习,理解了商业智能,数据仓库,数据挖掘的的原理。一句话,通过对仓库中的数据进行数据挖掘,产生有价值的内容就是商业智能。 在数据挖掘的过程中,有分类,聚类,关联分析,预测四种情况。通过对训练集的训练之后,对测试集进行测试,达到自动分类的作用。物以类聚,通过事物的相似度,进行聚类。通过对商品之间的相关性进行统计计算,就是关联分析。对过去产生的数据,对将可能发生的数据进行预测,就是预测分析。 AA。

    作者回复: 笔记做的不错

    2019-01-29
    4
  • FORWARD―MOUNT
    回答问题:如何理解数据挖掘的价值的? 数据挖掘的价值,其实这是个很大的话题。正因为我做的是数据挖掘的行业,深刻理解一个互联网产品是怎样的一个演变流程,数据如何驱动运营,如何影响决策,最终决定产品走向。这些都是数据挖掘在做支撑。对于电商行业,可以通过数据挖掘引导采购,识别爆款等等,数据挖掘不止赋能于业务部门,更是从公司战略层面给与重大决策支持,以及评估业务上的重大策略效果。

    作者回复: 不错的理解

    2019-01-20
    3
  • qinggeouye
    1. A : Knowledge Discovery in DataBase 2. A : Priori Algorithm

    作者回复: 对的

    2019-11-03
    2
    2
  • 羊小看
    AA 类别标签已知,可以分类,生成分类模型,用于判断无分类标签的新数据;类别标签未知,可以聚类,用于将人群分成几组,做用户画像,根据人群的不同特征来做针对性营销。

    作者回复: 正确,加油

    2019-05-18
    2
  • 米可哲
    大三学生一枚,想要考研,以后从事大佬所教的数据分析方向,有学校的专业推荐吗😁😁

    作者回复: 人工智能,具体你要看报考院校的专业设置,比如清华里面计算机系有7个研究所

    2019-01-11
    2
  • 小熊猫
    A A KDD: knowledge discovery in database 数据挖掘的价值: 世界上的数据实在是太庞大了,各种各样的数据都有,数据挖掘的价值就在于从这些数据中找到我想要的东西,所以首先要确定的是我的目标,我想要什么,带着目的去数据中找寻规律,去挖掘我想要的东西

    作者回复: 结果正确

    2019-01-09
    2
  • Runing
    数据挖掘能够从零散的看似无用的信息中提取出有用的价值,这在当今这个数字化时代十分重要。比如分类,能够把一个新的信息归类到已知的不同类型中,比如银行中对客户的信用卡额度评级、企业中对员工奖金评级、医学中对某类病情的诊断等等。聚类能够提取信息中的相似特性,并把具有相似特性的数据归到一类,比如银行中把客户分群,然后对不同类型进行标记,比如重点客户、优质客户、潜力客户等等。预测则是能够根据历史数据来把握未来趋势,抓住机遇,规避风险。关联分析则是能够帮我们把不相干的人、事物等联系到一起,比如商场里的捆绑销售、逛网店的推荐商品等等。这个世界以人为主体构成的,因此我觉着数据挖掘最大的价值就是洞察,洞察人的本质,取之于人然后用之于人。

    作者回复: 非常棒!继续加油哦!

    2021-02-26
    1
收起评论
显示
设置
留言
99+
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部