• 大寒
    2025-11-17 来自北京
    * 思考题二:我的体会是要结合各个业务系统去维护,也就是说行为明细应该能用我自己的语言转化出这个用户这条记录做了什么,维度信息则是他在业务系统中的配置情况,这样才不会让业务元数据的维护过于抽象。这个也是当初做数仓时被领导狠狠教训后的自我反思(😀)。而且这种信息的积累初期可能看不出来效果,随着越来越多业务人员依赖我这边也很有成就感,而与他们业务交流也让我摸索出各业务之间的玩法(有时候也能颠覆自己的认知),做到一个真正懂业务的开发。所以从自驱角度来讲,就是要让自己”不安分“,为自己后续的跨界积累足够多的能量。至于团队来说,我目前就是对分析师会不断去灌输我的建设思路,对同样的数仓开发来讲去旁敲侧击的建议与”多说“(内部交流多说几句)。至于作为团队领导怎样去做,目前还没这个经历,所以也不会去妄谈。 * 思考题三:看实时业务具体多少,因为我公司数据运营的主体还是报表之类的分析场景居多,所以实时业务的开发会判断其业务后续拓展能力,比如有些守成业务不必设计一套完整的分层体系,做到即开发即用即可。对于一些后续还会扩张的业务,暂时会分成同步层跟处理层,后续再根据业务发展情况合并同类项做公共逻辑处理。总之,我认为数据分层应该是触及到我必须要额外加一层的情况,否则保持一到两层我认为是当下最优解(顺其自然),而不是上来就搭架子。这个是我根据自身环境总结出的内容与体会,望老师予以点评与指正。 * 另外,老师能否对元数据自动化采集与统一模型那里做具体案例分享,这块我虽然知道要做但是怎么做还想不到?以及指标平台与指标管理体系是否是一个内容?还有这里我感觉案例有点笼统,能否再详细介绍下(我自己尝试做过但是用不起来特别尴尬)。
    展开
    
    
  • 大寒
    2025-11-17 来自北京
    * 思考题一:准确说没有,复盘来说如果要建设统一元数据管理中心,需要CTO这个非常高级别的角色来推动跨团队合作。但是呢,在早期开发阶段快速迭代开发业务会是重点,等做的时候已经历史债务缠身了。作为基层员工来说(比如大数据团队),能做到的就是本团队内部如何把这些东西处理好来保障自己内部开发。所以这也是我认为当前最大的困境,即如果没有决策层有意愿推动这个事情,这个东西就很难落地。 而另一个挑战我个人感受是元数据管理理论与实践脱节有些严重,因为决策的依据还是ROI模型,所以想要整体来设计开发很困难,反而是什么见效快做什么,所以整体性欠缺。从我个人经历来讲,我也从实习时期领导让我去调研元数据管理(现在回看分享的内容有点学生气了),到现在推动了一些内容的涉及(比如存储空间与血缘追踪)并结合BI能力将其展示到了看板中并辅助决策,也取得了一些成效,比如数据存储的花费至少省了1/3且新增任务及存储规模可控等。所以我的收获就是结合自己的工作环境来推动一些力所能及的事项,做到团队内部数据资产可知可控。
    
    
  • 亚林
    2025-11-17 来自湖南
    现在写标书的时候,连这个分层理论都没有😭
    
    