数据中台实战课
郭忆
网易大数据专家
立即订阅
2571 人已学习
课程目录
已更新 8 讲 / 共 16 讲
0/2登录后,你可以任选2讲全文学习。
开篇词 (1讲)
开篇词 | 数据中台,是陷阱?还是金钥匙?
免费
原理篇 (4讲)
01 | 前因后果:为什么说数据中台是大数据的下一站?
免费
02 | 关键抉择: 到底什么样的企业应该建数据中台?
03 | 数据中台建设三板斧:方法论、组织和技术
特别放送|史凯:建设数据中台到底有什么用?
实现篇 (3讲)
04 | 元数据中心的关键目标和技术实现方案
05 | 如何统一管理纷繁杂乱的数据指标?
06 | 数据模型无法复用,归根结底还是设计问题
数据中台实战课
登录|注册

05 | 如何统一管理纷繁杂乱的数据指标?

郭忆 2020-04-13
你好,我是郭忆。
上一节课,我讲到了各种类型的元数据,这些元数据有什么用?跟我们的数据中台又有什么关系呢? 其实,元数据在指标管理、模型设计、数据质量和成本治理四个领域都发挥着作用,而这些领域构成了数据中台 OneData 数据体系。从今天开始,我将带你逐一了解元数据在上述领域的应用,首先是指标管理。
指标是一种特定类型的元数据,公司的运营会围绕它进行工作,可以说,它是业务和数据的交汇点。指标数据能不能用,会影响他们的日常工作。来看一件我身边发生的事儿。
在电商业务中,新用户销售额是考核市场活动拉新效果的重要指标。马漂亮(化名)是市场部门的数据分析师,某一天,她要给 CEO 提供一份数据报告,报告中有一项指标是“新用户销售额”。孙美丽(化名)是会员中心的运营,她每天都会给 CEO 提供每日的新用户销售额数据。
结果有一天,CEO 看了这两份报告后发现,同一日的新用户销售额数值相差很大,他判断数据出了问题,责令两个部门的负责人进行排查。排查后发现,市场部门对新用户口径的定义和会员中心不一样:
市场部门认定新用户是首次下单并完成支付的用户;
会员中心认定新用户是当日新注册用户。
也就是说,市场部门认定的新用户中,可能有之前注册但是没有下过单的客户;而会员中心只包括当日注册并完成下单支付的用户。其实,在日常工作中还有很多类似的问题。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《数据中台实战课》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(14)

  • 麻婆豆腐
    请教下郭老师,“指标管理必须跟元数据中心关联起来,从元数据中心自动同步数仓的主题域和业务过程,同时会以特定的类型标签下沉到元数据中心对应的表和字段上,可以应用到数据地图上关联了表和指标“ 这段话看起来应该是跟数仓动态关联的,但是我看后面指标录入的时候又是手动录入的,不是很明白是手动维护呢?还是自动同步的?如果是跟数仓动态关联的话是怎么关联的呢?
    2020-04-14
    2
  • Geek_e1bb7a
    郭老师,我想问一个有关原子指标的问题,基金公司的基金规模 这个算不算原子指标?因为他每天都在变,你不加上限定的日期根本不行
    2020-04-15
  • AT
    指标体系的物理建设落地可否不用落在某个表的列上(通过给该列打标签),为了数据结构的稳定性和解耦而是基于dws层独立出一个物理的指标层,指标层按照实体或者主题规划并类以K/V方式进行存储,这个K指的是统计该指标的基本维度,可能是多列例如时间维+租户,V指的是统计的值。对于具体的消费可以通过安需任意组装拉宽指标表满足数据的消费
    2020-04-15
  • 陈畅
    我注意到文中关于原子指标用的是计算周期,派生指标是统计周期。这两者有何不同吗?

    关于原子指标和派生指标。我的理解是派生指标可以通过原子指标四则运算而来。这样的理解对吗?
    2020-04-14
  • aof
    呆在一个被不懂大数据又装懂而且瞎指挥的公司里,苦不堪言😭
    2020-04-13
  • 穆宇浩
    咨询老师,指标的定义过程中,能否结合维度和度量的定义,实现指标创建的自动化?这在技术上是否具备可行性?
    2020-04-13
  • Geek_ab0a2f
    原子指标是根据业务流程的一些描述,而派生指标是数据需求者根据自己的需要对各种业务和业务流程的一些描述性数据,所以数仓刚建立应该是原子性指标多,随着需求的增多,派生指标就会增多
    2020-04-13
  • rageeeee
    想请问老师,有些XXX率的指标是经过计算得出的,但是感觉在业务里也不太好拆分了,像这种XXX率/XXX比例 可以作为原子指标吗?
    2020-04-13
  • 天行冕下
    建模理论基本上用的都是kimball的多维建模理论。
    事实 --> 粒度 --> 维度 --> 指标。维度、指标都需要一致性。各个业务场景用数据仓库总线可以连接在一起。
    2020-04-13
  • 泡泡鱼大王
    派生的多
    2020-04-13
  • 草裡菌
    自然是派生指标多,各种维度排列组合一下,就能派生出n倍。
    图中还有复合指标,它的定义是什么呢?
    2020-04-13
  • Terry郑💫
    派生指标是术,原子指标就是道。
    老师这期的干活也是满满。。。看一遍基本看不懂,哈哈,还是要好好消化一下。
    顺便问郭老师一个问题,数据产品经理和普通的产品经理有什么异同点吗?
    2020-04-13
  • 饭团
    感觉应该是派生指标多一些,因为原子指标只负责元数据,而派生指标有各种业务需求,而需求是多种多样的!所以感觉派生指标会多一些!
    2020-04-13
  • leslie
    原子指标?这大概源自不可分割性吧,我们在数据系统设计时会去强调的原子性。其实老师在提出源自指标多还是派生指标多的时候可以去反向思考一下另外一个问题,我们在数据系统设计时是复合索引多还是单值索引多?
    哪个多少并不重要重要的是如何合理去定义与规范?定位的规范性和合理性这才是痛点。
    谢谢老师今天的分享,期待后续课程。
    2020-04-13
收起评论
14
返回
顶部