095 | Kyligence：阿帕奇麒麟背后的大数据公司

徐飞



该思维导图由 AI 生成，仅供参考

几乎每一个成功的大数据开源项目背后都有一个公司。今天我们故事的主角就是 Kyligence 这家成立于 2016 年的公司。这个公司背后的项目就是阿帕奇麒麟。
先来介绍一下阿帕奇麒麟，它的英文名是 Apache Kylin，一般业内都简称它为麒麟，这是第一个由中国人主导的阿帕奇开源项目。
麒麟项目由 eBay 中国公司开发，开发目的是为了解决在 Hadoop 生态圈里对数据仓库进行实时分析的问题。
和我们提到的其他开源项目解决数据分析的方式不同，阿帕奇麒麟的做法使用的是数据立方（DataCube）模型。
数据立方模型是数据仓库里很成熟的一个模型，它定义了查询可以在哪些维度哪些粒度上进行预计算。这个模型有许多商业化的产品，比如说微软的 SQL Server Analysis Service 就是这个模型的一个商业化实现。
通常我们说起开源项目解决数据分析问题，做法都是直接在原始数据上进行查询。而数据立方模型则允许系统事先做预计算，并存储一部分预计算的结果，查询可以发生在预计算的数据上，这是一种典型用空间换时间的策略。
这个模型最大的挑战在于，系统现实里到底选择了哪些维度与粒度进行预计算。如果系统对所有维度和所有粒度都进行预计算的话，那么所有查询都会加速，但是随之而来的是额外的存储空间将会非常巨大，远远超过原始数据的大小，这肯定是负担不起的。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

Kyligence公司是一家背靠阿帕奇麒麟的大数据公司，其产品Kyligence分析平台是阿帕奇麒麟的升级版，采用数据立方模型进行预计算，以提高查询性能。与开源的麒麟相比，Kyligence分析平台重新开发了许多重要模块，其中包括自主开发的非开源存储组件，以应对开源软件在工业级质量上的不足。公司通过销售分析平台并按年收取费用来盈利，认为用户会愿意为更好的版本付费。尽管Kyligence分析平台在某些场景下表现出色，但其适用场景有限，可能只适用于某些客户，限制了公司的发展空间。因此，尽管市场蛋糕有限，Kyligence在特定市场中有望取得成功。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《技术与商业案例解读》，新⼈⾸单¥68

立即购买

登录后留言

全部留言(3)

最新
精选

小孙
碰巧前段时间去他家面过试，拿到offer了，最后因为个人原因没去，很遗憾
2018-07-27

1
拉欧
现在的数据产品主打的都是两张牌:响应快，易上手。所以一方面都在拼命优化查询性能，一方面提供很好用的api，或者干脆完全支持SQL
2019-06-07


子悠
国内产品必须支持一下，后续研究研究
2018-07-15



收起评论