095 | Kyligence:阿帕奇麒麟背后的大数据公司
徐飞
该思维导图由 AI 生成,仅供参考
几乎每一个成功的大数据开源项目背后都有一个公司。今天我们故事的主角就是 Kyligence 这家成立于 2016 年的公司。这个公司背后的项目就是阿帕奇麒麟。
先来介绍一下阿帕奇麒麟,它的英文名是 Apache Kylin,一般业内都简称它为麒麟,这是第一个由中国人主导的阿帕奇开源项目。
麒麟项目由 eBay 中国公司开发,开发目的是为了解决在 Hadoop 生态圈里对数据仓库进行实时分析的问题。
和我们提到的其他开源项目解决数据分析的方式不同,阿帕奇麒麟的做法使用的是数据立方(DataCube)模型。
数据立方模型是数据仓库里很成熟的一个模型,它定义了查询可以在哪些维度哪些粒度上进行预计算。这个模型有许多商业化的产品,比如说微软的 SQL Server Analysis Service 就是这个模型的一个商业化实现。
通常我们说起开源项目解决数据分析问题,做法都是直接在原始数据上进行查询。而数据立方模型则允许系统事先做预计算,并存储一部分预计算的结果,查询可以发生在预计算的数据上,这是一种典型用空间换时间的策略。
这个模型最大的挑战在于,系统现实里到底选择了哪些维度与粒度进行预计算。如果系统对所有维度和所有粒度都进行预计算的话,那么所有查询都会加速,但是随之而来的是额外的存储空间将会非常巨大,远远超过原始数据的大小,这肯定是负担不起的。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
Kyligence公司是一家背靠阿帕奇麒麟的大数据公司,其产品Kyligence分析平台是阿帕奇麒麟的升级版,采用数据立方模型进行预计算,以提高查询性能。与开源的麒麟相比,Kyligence分析平台重新开发了许多重要模块,其中包括自主开发的非开源存储组件,以应对开源软件在工业级质量上的不足。公司通过销售分析平台并按年收取费用来盈利,认为用户会愿意为更好的版本付费。尽管Kyligence分析平台在某些场景下表现出色,但其适用场景有限,可能只适用于某些客户,限制了公司的发展空间。因此,尽管市场蛋糕有限,Kyligence在特定市场中有望取得成功。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《技术与商业案例解读》,新⼈⾸单¥68
《技术与商业案例解读》,新⼈⾸单¥68
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(3)
- 最新
- 精选
- 小孙碰巧前段时间去他家面过试,拿到offer了,最后因为个人原因没去,很遗憾2018-07-271
- 拉欧现在的数据产品主打的都是两张牌:响应快,易上手。所以一方面都在拼命优化查询性能,一方面提供很好用的api,或者干脆完全支持SQL2019-06-07
- 子悠国内产品必须支持一下,后续研究研究2018-07-15
收起评论