数据中台需要具备的三大能力
极客时间编辑部
讲述:子阳大小:1.88M时长:04:06
最近,奇点云 CEO 张金银基于阿里巴巴数据中台的演进过程梳理了数据中台演进的四个阶段。同时他也预测,未来的数据中台,一定是“AI 驱动的数据中台”,这个中台包括“计算平台 + 算法模型 + 智能硬件”,不仅要在端上具备视觉数据的收集和分析能力,而且还要能通过 Face ID,帮助企业去打通业务数据,最终建立线上线下触达和服务消费者的能力。
那么,数据中台是怎么赋能业务使用数据的呢?张金银作为阿里巴巴第一个消费者数据平台 TCIF 的创建者,他以 TCIF 为例说明了问题。
几年前,在阿里巴巴,消费者的信息也分散在各个业务中,碎片化、散点化,而业务当时需要把这些分散的人的数据集中起来,进行人群画像。道理很明白,人群画像越清晰,服务就会越精准。
怎么统一消费者数据?
首先,定义埋点规范,同一个人就用同一个标识,ID 打通,也就是所谓的 One ID。
其次,还会碰上一家人使用一个登录帐号的问题,那么就需要建立同人的数据模型,通过一些方式,比如,IP 网段是不是一样,来分辨出具体的那个人,建立 AID(Alibaba ID)。
再次,每个人还有各种网络行为,要如何把这些行为结构化,装到各种框架里面?这个特别难,阿里当时主要是跟人类学家合作,一起把行为的分类树做出来。这个分类树非常细,甚至能够把一个人的发质都结构化。
最后,就需要通过算法模型,把所有的标签都贴回到人上面,当时 TCIF 用上述方式生产出了 3000 多个消费者标签。
这些标签被阿里巴巴的其他产品所使用,比如阿里妈妈的达摩盘就把这些标签提供给广告主,让广告主能够通过标签去建立人群画像,进行人群细分,以及建立投放用的人群包。
从 TCIF 的例子来看,数据中台未来一定需要具备三种能力。
第一是数据模型能力。
在业务层面,业务抽象能够解决 80% 的共性问题,开放的系统架构来解决 20% 的个性问题,但同时又要把平台上的业务逻辑分开,因为不同的业务逻辑之间可能有冲突。
这在数据中台就表现为数据的中心化,也就是数据的高内聚、低耦合,需要对共性问题抽象出业务的规则,建立数据模型,一个好的内聚模块能够解决一个事情,同时又要降低模块和模块之间的耦合度,让模块具有良好的可读性和可维护性。
这里的前提是要有真正懂业务能沉淀经验的人,以及要在企业层面开展数据治理,让数据能够准确、适度共享、安全地被使用。
第二是 AI 算法模型能力。
要实现数据业务化,前提是做到数据的资产化。要能够从数据原油里面,去提炼出可以使用的汽油。
比如说数据的标签化,背后就有投入产出比的考量。通过标签,广告主可以非常方便快捷地去建立自己的人群包,实现精准营销,同时投放的 ROI 也是可见的、透明的,广告主可以自己去评估数据资产的使用情况。
第三是行业的应用能力,也就是我们通常说的数据业务化能力。
和数据中心化类似,数据业务化也需要很强的行业经验来指导,建立合适的业务场景,在场景里面使用数据,从而体现数据的价值,来大大扩展数据在行业中的应用能力。
总而言之,未来的数据中台最重要的不单是数据的存储和计算能力,而是要能从“存、通、用”的角度和业务结合,帮助企业从数据中获取价值,沉淀数据资产,最终用数据赚钱。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论