技术与商业案例解读
徐飞
华为云资深总监,大数据专家
立即订阅
10153 人已学习
课程目录
已完结 163 讲
0/6登录后,你可以任选6讲全文学习。
开篇词 | 突破技术思维,站在商业的角度看问题
免费
001 | 西雅图IT公司之RealNetworks:一个帝国的兴衰(上)
002 | 西雅图IT公司之RealNetworks:一个帝国的兴衰(下)
003 | 以RealNetworks为例,谈谈初创公司如何应对巨头碾压
004 | 可视化分析鼻祖Tableau
005 | 从Tableau上市,看学术界和工业界人士创业
006 | 在线旅游帝国Expedia崛起的背后
007 | 房产经纪的颠覆者Redfin:在“传统”与“现代”间徘徊
008 | 房产经纪的“协作者”Zillow:一个地产数据平台
009 | 颠覆还是协作,房地产市场上Redfin和Zillow的抉择
010 | 应用交付网络大厂F5:“一招鲜”之殇
011 | 在线差旅报销鼻祖Concur:在转型中获得发展
012 | 漫谈企业转型:在市场变迁中寻找生机
013 | 克雷公司沉浮录:行走在超级计算机市场
014 | “单一化”的隐忧:从克雷公司看“一条腿走路”
015 | Halo的开发者Bungie:与微软的聚散
016 | “卖身”须谨慎:创业公司面临的抉择
017 | 亚马逊领导力准则之要有硬骨头
018 | 亚马逊领导力准则之决策正确
019 | 亚马逊领导力准则之客户至尚
020 | 亚马逊领导力准则之勤俭节约
021 | 亚马逊领导力准则之主人翁精神
022 | 亚马逊领导力准则之选贤育能
023 | 亚马逊领导力准则之最高标准
024 | 亚马逊领导力准则之创新简化
025 | 亚马逊领导力准则之崇尚行动
026 | 亚马逊领导力准则之远见卓识
027 | 亚马逊领导力准则之好奇求知与赢得信任
028 | 亚马逊领导力准则之刨根问底与达成业绩
029 | 智能音箱的战斗:亚马逊的硬件路
030 | 智能音箱的战斗:Echo攻城略地
031 | 智能音箱的战斗:语音助手Alexa
032 | 智能音箱的战斗:谷歌的杀入
033 | 智能音箱的战斗:亚马逊的战略布局
034 | 智能音箱的战斗:巨头纷纷入场
035 | 智能音箱的战斗:白马非马
036 | 如何透过一个领域去联合分析多家企业?
037 | 管中窥豹之从面试看企业文化:微软
038 | 管中窥豹之从面试看企业文化:亚马逊
039 | 管中窥豹之从面试看企业文化:谷歌
040 | 管中窥豹之从面试看企业文化:甲骨文
041 | 管中窥豹之从面试看企业文化:Facebook
042 | 透过企业用人之道看企业发展
043 | 办公软件的战斗:开篇
044 | VisiCalc:第一个电子表格软件的诞生
045 | WordStar:第一个字处理软件的故事
046 | 微软:办公软件战场的螳螂
047 | WordPerfect:字处理软件的新秀
048 | Lotus 1-2-3:莲花公司的电子表格帝国
049 | 红狮会战:微软的反击
050 | 大杀器Lotus Notes 和被收购的莲花公司
051 | 无敌寂寞的微软之为创新而创新
052 | 办公软件的新时代:微软和谷歌的战斗
053 | 异军突起的Slack
054 | 办公软件战斗的启示:内忧总是强于外患
055 | 办公软件战斗的启示:敌人的出现常常出其不意
056 | 半条命的Dota帝国Valve:半条命
057 | 半条命的Dota帝国Valve:Steam平台
058 | 半条命的Dota帝国Valve:Dota 2
059 | 半条命的Dota帝国Valve:无领导管理
060 | 半条命的Dota帝国Valve:虚拟现实
061 | Gabe Newell:Valve帝国制度的利弊
062 | 文档数据库的缔造者MongoDB(上)
063 | 文档数据库的缔造者MongoDB(下)
064 | 以MongoDB为例,看基础架构类产品创业
065 | 直面MongoDB,谈微软的NoSQL战略
066 | Hadoop三国之魏国Cloudera
067 | Hadoop三国之吴国MapR
068 | Hadoop三国之蜀国Hortonworks
069 | Hadoop及其发行商的未来
070 | 谷歌的大数据路:从“三驾马车”到一无所有
071 | 谷歌的大数据路:一场影响深远的论战
072 | 谷歌的大数据路:谷歌的“黑科技”
073 | 如何读懂类似谷歌“三驾马车”这样的技术论文?
074 | 雅虎:大数据领域的“活雷锋”
075 | IBM的大数据路之起早贪黑赶了晚集
076 | 社交公司们的大数据贡献
077 | 微软的大数据发展史:微软硅谷研究院
078 | 微软的大数据发展史:必应的Cosmos
079 | 微软的大数据发展史:Azure的大数据发展
080 | 亚马逊的大数据故事:从先驱者到插管吸血开源
081 | 亚马逊的大数据故事:创新和拿来并存的云服务
082 | 阿里巴巴的大数据故事:数据分析平台发展史
083 | 阿里巴巴的大数据故事:流计算引擎发展史
084 | 大公司的大数据战略得失:自建轮子成本高
085 | 大公司的大数据战略得失:抱团取暖难敌插管吸血者
086 | Palantir:神秘的大数据独角兽
087| Splunk:机器大数据的分析帝国
088 | Confluent:在Kafka上飞驰的数据交换者
089 | Powerset:HBase的老东家
090 | Cassandra和DataStax的故事
091 | Databricks之Spark的数据金砖王国
092 | Data Artisans:浴火重生的新一代大数据计算引擎Flink
093 | Dremio:在Drill和Arrow上的大数据公司
094 | Imply:基于Druid的大数据分析公司
095 | Kyligence:阿帕奇麒麟背后的大数据公司
096 | Snowflake:云端的弹性数据仓库
097 | TiDB:一个国产新数据库的创业故事
098 | 大数据创业公司的前景:红海创业多艰辛
099 | 如何通过企业技术积累去分析一家企业?
技术与商业案例解读
登录|注册

095 | Kyligence:阿帕奇麒麟背后的大数据公司

徐飞 2018-05-11
几乎每一个成功的大数据开源项目背后都有一个公司。今天我们故事的主角就是 Kyligence 这家成立于 2016 年的公司。这个公司背后的项目就是阿帕奇麒麟。
先来介绍一下阿帕奇麒麟,它的英文名是 Apache Kylin,一般业内都简称它为麒麟,这是第一个由中国人主导的阿帕奇开源项目。
麒麟项目由 eBay 中国公司开发,开发目的是为了解决在 Hadoop 生态圈里对数据仓库进行实时分析的问题。
和我们提到的其他开源项目解决数据分析的方式不同,阿帕奇麒麟的做法使用的是数据立方(DataCube)模型。
数据立方模型是数据仓库里很成熟的一个模型,它定义了查询可以在哪些维度哪些粒度上进行预计算。这个模型有许多商业化的产品,比如说微软的 SQL Server Analysis Service 就是这个模型的一个商业化实现。
通常我们说起开源项目解决数据分析问题,做法都是直接在原始数据上进行查询。而数据立方模型则允许系统事先做预计算,并存储一部分预计算的结果,查询可以发生在预计算的数据上,这是一种典型用空间换时间的策略。
这个模型最大的挑战在于,系统现实里到底选择了哪些维度与粒度进行预计算。如果系统对所有维度和所有粒度都进行预计算的话,那么所有查询都会加速,但是随之而来的是额外的存储空间将会非常巨大,远远超过原始数据的大小,这肯定是负担不起的。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《技术与商业案例解读》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(3)

  • 小孙
    碰巧前段时间去他家面过试,拿到offer了,最后因为个人原因没去,很遗憾
    2018-07-27
    1
  • 拉欧
    现在的数据产品主打的都是两张牌:响应快,易上手。所以一方面都在拼命优化查询性能,一方面提供很好用的api,或者干脆完全支持SQL
    2019-06-07
  • Silence
    国内产品必须支持一下,后续研究研究
    2018-07-15
收起评论
3
返回
顶部