06 | 学数据分析要掌握哪些基本概念?
陈旸
该思维导图由 AI 生成,仅供参考
美国明尼苏达州一家 Target 百货被客户投诉,这名客户指控 Target 将婴儿产品优惠券寄给他的女儿,而他女儿还是一名高中生。但没多久这名客户就来电道歉,因为女儿经他逼问后坦承自己真的怀孕了。
Target 百货寄送婴儿产品优惠券绝非偶然之举,他们发现妇女在怀孕的情况下,购买的物品会发生变化,比如护手霜会从有香味的改成无味的,此外还会购买大量维生素等保健品。通过类似的关联分析,Target 构建了一个“怀孕预测指数”,通过这个指数预测到了顾客已经怀孕的情况,并把优惠券寄送给她。
那么顾客怀孕与商品之间的关联关系是如何被发现的呢?
实际上他们都是用的 Apriori 算法,该算法是由美国学者 Agrawal 在 1994 年提出的。他通过分析购物篮中的商品集合,找出商品之间的关联关系。利用这种隐性关联关系,商家就可以强化这类购买行为,从而提升销售额。
这就是数据分析的力量,人们总是从数据分析中得到有价值的信息,啤酒和尿布的故事也是个经典的案例。如今在超市中,我们还能看到不少组合的套装打包在一起卖,比如宝洁的产品:飘柔洗发水 + 玉兰油沐浴露、海飞丝洗发水 + 舒肤佳沐浴露等等。
商品的捆绑销售是个很有用的营销方式,背后都是数据分析在发挥作用。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
数据分析的基本概念包括商业智能、数据仓库和数据挖掘。商业智能是基于数据仓库和数据挖掘的过程,通过分析消费行为得到商业价值。数据仓库是数据存储的基础,而数据挖掘则包括分类、聚类、预测和关联分析等任务。数据挖掘的流程包括数据预处理、挖掘和后处理。文章还介绍了元数据和数据元的区别,以及数据挖掘中的关联分析和预测等任务。通过这些基本概念,读者可以了解数据分析的核心内容和流程。数据挖掘的价值在于揭示数据规律,帮助创造更大的商业价值。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据分析实战 45 讲》,新⼈⾸单¥59
《数据分析实战 45 讲》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(130)
- 最新
- 精选
- 隰有荷分类和聚类有什么区别,感觉不是一个意思吗?
作者回复: 不一样的: 分类是已知了 类别,然后看样本属于哪个分类 聚类是不知道有哪些类别,按照 样本的属性来进行聚类,实际上是一种降维方式。 比如你追个女生,你知道女生有 御姐,萝莉,两种类别,你可以判断下 追的这个女生属于 御姐还是萝莉,这个属于分类。 比如你追5000个女生,你也不知道女生都有哪些类别,为了方便,你将5000个女生,按照属性的相似度划分成了5个组,这个属于聚类。先聚成了5类,然后再看每个组的特点,给不同的组取名,比如 “大小姐组”,“小家碧玉组”等等,都是先聚类,然后再判断
2019-08-09857 - Conan两题都选A。 追女孩的例子真是一目了然:)
作者回复: 哈哈 很多人想让我做一个白话数学基础的介绍,所以我先把这些概念用“追女孩”的例子解释了下
2018-12-2629 - 皮蛋没太明白聚类和分类区别
作者回复: 分类就是已经一些类别,看样本属于什么类别 聚类是不知道类别的情况,把样本划分为几个组(按照样本的特征自动进行划分),然后再观察这些组具有怎样的特征,给这个组取个名字
2019-02-1945 - 杰之7通过这一节的学习,理解了商业智能,数据仓库,数据挖掘的的原理。一句话,通过对仓库中的数据进行数据挖掘,产生有价值的内容就是商业智能。 在数据挖掘的过程中,有分类,聚类,关联分析,预测四种情况。通过对训练集的训练之后,对测试集进行测试,达到自动分类的作用。物以类聚,通过事物的相似度,进行聚类。通过对商品之间的相关性进行统计计算,就是关联分析。对过去产生的数据,对将可能发生的数据进行预测,就是预测分析。 AA。
作者回复: 笔记做的不错
2019-01-294 - FORWARD―MOUNT回答问题:如何理解数据挖掘的价值的? 数据挖掘的价值,其实这是个很大的话题。正因为我做的是数据挖掘的行业,深刻理解一个互联网产品是怎样的一个演变流程,数据如何驱动运营,如何影响决策,最终决定产品走向。这些都是数据挖掘在做支撑。对于电商行业,可以通过数据挖掘引导采购,识别爆款等等,数据挖掘不止赋能于业务部门,更是从公司战略层面给与重大决策支持,以及评估业务上的重大策略效果。
作者回复: 不错的理解
2019-01-203 - qinggeouye1. A : Knowledge Discovery in DataBase 2. A : Priori Algorithm
作者回复: 对的
2019-11-0322 - 羊小看AA 类别标签已知,可以分类,生成分类模型,用于判断无分类标签的新数据;类别标签未知,可以聚类,用于将人群分成几组,做用户画像,根据人群的不同特征来做针对性营销。
作者回复: 正确,加油
2019-05-182 - 米可哲大三学生一枚,想要考研,以后从事大佬所教的数据分析方向,有学校的专业推荐吗😁😁
作者回复: 人工智能,具体你要看报考院校的专业设置,比如清华里面计算机系有7个研究所
2019-01-112 - 小熊猫A A KDD: knowledge discovery in database 数据挖掘的价值: 世界上的数据实在是太庞大了,各种各样的数据都有,数据挖掘的价值就在于从这些数据中找到我想要的东西,所以首先要确定的是我的目标,我想要什么,带着目的去数据中找寻规律,去挖掘我想要的东西
作者回复: 结果正确
2019-01-092 - Runing数据挖掘能够从零散的看似无用的信息中提取出有用的价值,这在当今这个数字化时代十分重要。比如分类,能够把一个新的信息归类到已知的不同类型中,比如银行中对客户的信用卡额度评级、企业中对员工奖金评级、医学中对某类病情的诊断等等。聚类能够提取信息中的相似特性,并把具有相似特性的数据归到一类,比如银行中把客户分群,然后对不同类型进行标记,比如重点客户、优质客户、潜力客户等等。预测则是能够根据历史数据来把握未来趋势,抓住机遇,规避风险。关联分析则是能够帮我们把不相干的人、事物等联系到一起,比如商场里的捆绑销售、逛网店的推荐商品等等。这个世界以人为主体构成的,因此我觉着数据挖掘最大的价值就是洞察,洞察人的本质,取之于人然后用之于人。
作者回复: 非常棒!继续加油哦!
2021-02-261
收起评论