19|BI:基于数据做决策,大数据系统的“默认应用”
曹犟

你好,我是曹犟。
在前面的课程中,我们系统学习了大数据系统的架构设计和数据治理。现在,在花费人力与成本之后,数据已经采集好了,治理好了,存储了下来,到底应该用来做什么?数据的价值如何体现?
从今天开始,我们进入“典型应用场景与大数据产品的设计”。我们将讨论基于大数据系统,可以构建哪些典型的应用产品,这些产品应该如何设计与实现。
而今天这节课,我们从 BI(商业智能,Business Intelligence)开始。
为什么从 BI 开始
BI 是几乎所有大数据系统都会首先构建的“默认应用”。一个企业建设大数据系统,第一个上线的应用,通常就是 BI。
为什么呢?首先,BI 是投资回报最直接、最容易被理解的应用。
当你跟公司汇报,说要投入几百万建设大数据平台,领导第一个问题肯定是:“建好了能干什么?”如果你回答“可以做用户画像、可以做智能推荐”,领导可能会一头雾水。但如果你说“可以让您每天早上打开手机,就看到昨天的销售额、订单量、新增用户数,还能看到同比增长了多少”,领导立刻就能理解价值。
其次,BI 是从“拍脑袋决策”到“数据驱动决策”的第一步。
在没有 BI 之前,很多企业的决策是这样的:运营部门拍脑袋说“我觉得华东区销售不错”,市场部门拍脑袋说“我觉得这个月投放效果还行”。有了 BI 之后,所有判断都有数据支撑。华东区销售额是多少?同比增长多少?哪个类目贡献最大?投放了多少钱?带来了多少新用户?这些问题都能用数据回答。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. BI系统的本质是将数据转化为洞察,支持业务决策,与传统报表相比,BI是交互式的、探索性的,用户可以自主选择维度、筛选条件、时间范围,可以上卷、下钻,可以对比不同时间段、不同地区的数据。 2. BI系统的架构设计需要考虑数据源的分散性、格式的统一性、实时性要求、数据采集的频率和方式、数仓的设计、OLAP查询引擎和应用层的设计。 3. OLAP引擎是BI系统的核心,主流OLAP引擎包括Kylin、Doris和ClickHouse,它们在设计思路上趋同,都采用列式存储、向量化执行、并行计算等技术。 4. BI应用层的设计需要考虑自助分析和查询结果数据的可视化,拖拽式界面是自助分析的核心能力,同时权限控制也是非常重要的。 5. BI系统的发展主线是持续降低数据分析的门槛,将数据的使用权从IT部门逐步下放到业务部门,再下放到每一个普通员工,让数据真正成为人人可用的生产资料。 6. 数据可视化设计需要根据不同的分析场景选择不同的图表类型,并遵循简洁、准确、美观和交互的原则。 7. 在BI系统中,性能优化可以通过结果缓存、增量更新、查询改写和前端优化等方式实现,以提升用户体验。 8. 指标体系设计围绕北极星指标展开,各团队可以将其拆解成与自身业务相关的指标,需要多团队共同协作完成。 9. 数据质量保障对于BI系统至关重要,垃圾数据会导致错误决策,因此全流程的数据质量管控非常重要。 10. BI系统的局限性包括灵活性与性能的矛盾、通用与专业的矛盾以及分析能力的天花板,需要在实际应用中加以注意和解决。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《大数据应用实战》,新⼈⾸单¥59
《大数据应用实战》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(3)
- 最新
- 精选
大寒思考题三:首先呢,我感觉北极星指标应该是一个年度指标,因为经营重点并非一成不变的,在运营上的体现是团队的新建/整合/裁撤,而在指标上就是一年一个关注重点,比如疫情前是为了增长,疫情后是为了保住营收。从我所在的组织来看,实际上目前已基本不在维护(以前有一些),其中一环是认知差异,即不同团队对同一指标的理解不同,比如两个电商团队,有一个对GMV的理解是和店铺后台制表对齐,而另一个则是根据文档总结得来。所以,这个是我挠头的地方,不知道该怎么推进。2025-12-05归属地:北京
大寒思考题一和二回答:目前主要用的是采购的tableau,由于是商用软件所以很多东西都是现成的,比如如何连接各种查询引擎和加载数据。之前用tableau时候都是把所有指标内容算好后放进去,所以有了一个可笑的链路:运营表格需求->分析师在tableau展示出来->运营下载表格放入PowerBI中分析。在我们看来多此一举但有无可奈何,因为基本没有灵活的交互能力。后来在思索+看书学习(喜乐君tableau书看了两遍,也给了同事一本)+实践四年多的时间,才算理解了tableau基本组成单元视图的含义,也就是加载尽量明细化数据在tableau中完成展示内容的计算。从这件事理解了数据量是数据方案解决的主要因素之一。效果也十分明显,看板的交互性强了,搭建效率也提高了。但是呢,可拓展的空间也限制住了。至于其他一些自研OLAP查询模块(比如漏斗分析),整体来说可用性差,可以说是积弊,具体表现是参考其他平台把功能复制过来讲一遍然后自己用吧,运营面对这些一头雾水然后弃置不用,产品收不到反馈也不知道怎么迭代。当我接手的时候可以说是吃灰了。所以我认为好的产品还是要从解决运营某个具体场景问题入手,而不是简单的复制功能,也就是问题驱动设计而非为了看起来有活儿干而设计。2025-12-05归属地:北京- werther老师好,请问BI是基于数据集分析,还是基于预定义好的指标体系分析?还是二者结合应用?谢谢。2025-12-05归属地:北京
收起评论