技术与商业案例解读
徐飞
前华为云资深总监,大数据专家
36771 人已学习
新⼈⾸单¥68
登录后,你可以任选6讲全文学习
课程目录
已完结/共 164 讲
技术与商业案例解读
15
15
1.0x
00:00/00:00
登录|注册

095 | Kyligence:阿帕奇麒麟背后的大数据公司

通过预计算提高查询性能
基于数据立方模型
2016年成为阿帕奇基金会的顶级项目
2015年加入阿帕奇基金会的孵化器
2014年10月在GitHub上开源
由eBay中国公司开发
韩卿
麒麟用户
按年收取费用
销售分析平台
Kyligence云托管产品
Kyligence机器人
Kyligence分析平台
难以过渡到更通用的系统
市场蛋糕不大
适用场景有限
开源版和非开源版由Kyligence维护
与MapR的Hadoop发行版相似
非开源组件为核心资产
存储组件替换
重要模块重新开发
与麒麟相似
项目特点
项目发展
数据立方模型
中国人主导的阿帕奇开源项目
CEO
目标客户
盈利模式
产品
成立于2016年
限制与发展
盈利模式比较
Kyligence分析平台
阿帕奇麒麟
Kyligence公司
背靠麒麟的Kyligence公司

该思维导图由 AI 生成,仅供参考

几乎每一个成功的大数据开源项目背后都有一个公司。今天我们故事的主角就是 Kyligence 这家成立于 2016 年的公司。这个公司背后的项目就是阿帕奇麒麟。
先来介绍一下阿帕奇麒麟,它的英文名是 Apache Kylin,一般业内都简称它为麒麟,这是第一个由中国人主导的阿帕奇开源项目。
麒麟项目由 eBay 中国公司开发,开发目的是为了解决在 Hadoop 生态圈里对数据仓库进行实时分析的问题。
和我们提到的其他开源项目解决数据分析的方式不同,阿帕奇麒麟的做法使用的是数据立方(DataCube)模型。
数据立方模型是数据仓库里很成熟的一个模型,它定义了查询可以在哪些维度哪些粒度上进行预计算。这个模型有许多商业化的产品,比如说微软的 SQL Server Analysis Service 就是这个模型的一个商业化实现。
通常我们说起开源项目解决数据分析问题,做法都是直接在原始数据上进行查询。而数据立方模型则允许系统事先做预计算,并存储一部分预计算的结果,查询可以发生在预计算的数据上,这是一种典型用空间换时间的策略。
这个模型最大的挑战在于,系统现实里到底选择了哪些维度与粒度进行预计算。如果系统对所有维度和所有粒度都进行预计算的话,那么所有查询都会加速,但是随之而来的是额外的存储空间将会非常巨大,远远超过原始数据的大小,这肯定是负担不起的。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

Kyligence公司是一家背靠阿帕奇麒麟的大数据公司,其产品Kyligence分析平台是阿帕奇麒麟的升级版,采用数据立方模型进行预计算,以提高查询性能。与开源的麒麟相比,Kyligence分析平台重新开发了许多重要模块,其中包括自主开发的非开源存储组件,以应对开源软件在工业级质量上的不足。公司通过销售分析平台并按年收取费用来盈利,认为用户会愿意为更好的版本付费。尽管Kyligence分析平台在某些场景下表现出色,但其适用场景有限,可能只适用于某些客户,限制了公司的发展空间。因此,尽管市场蛋糕有限,Kyligence在特定市场中有望取得成功。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《技术与商业案例解读》
新⼈⾸单¥68
立即购买
登录 后留言

全部留言(3)

  • 最新
  • 精选
  • 小孙
    碰巧前段时间去他家面过试,拿到offer了,最后因为个人原因没去,很遗憾
    2018-07-27
    1
  • 拉欧
    现在的数据产品主打的都是两张牌:响应快,易上手。所以一方面都在拼命优化查询性能,一方面提供很好用的api,或者干脆完全支持SQL
    2019-06-07
  • 子悠
    国内产品必须支持一下,后续研究研究
    2018-07-15
收起评论
显示
设置
留言
3
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部