Kafka快速入门与实战
胡夕
人人贷计算平台部总监,Apache Kafka Contributor
立即订阅
2 人已学习
课程目录
已完结 5 讲
01 | Kafka体系架构:一篇文章带你快速搞懂Kafka术语
02 | Kafka版本:你知道如何挑选Kafka吗?
03 | 部署方案:生产环境中的 Kafka 集群方案该怎么做?
04 | 最最最重要的集群参数(上):如何配置Broker端参数?
05 | 最最最重要的集群参数(下):如何配置Topic、JVM和操作系统参数?
Kafka快速入门与实战
登录|注册

02 | Kafka版本:你知道如何挑选Kafka吗?

胡夕 2020-01-07
在专栏上一期中,我们谈了 Kafka 当前的定位问题,Kafka 不再是一个单纯的消息引擎系统,而是能够实现精确一次(Exactly-once)处理语义的实时流处理平台。
你可能听说过 Apache Storm、Apache Spark Streaming 亦抑或是 Apache Flink,它们在大规模流处理领域可都是响当当的名字。令人高兴的是,Kafka 经过这么长时间不断的迭代,现在已经能够稍稍比肩这些框架了。我在这里使用了“稍稍”这个字眼,一方面想表达 Kafka 社区对于这些框架心存敬意;另一方面也想表达目前国内鲜有大厂将 Kafka 用于流处理的尴尬境地,毕竟 Kafka 是从消息引擎“半路出家”转型成流处理平台的,它在流处理方面的表现还需要经过时间的检验。
如果我们把视角从流处理平台扩展到流处理生态圈,Kafka 更是还有很长的路要走。前面我提到过 Kafka Streams 组件,正是它提供了 Kafka 实时处理流数据的能力。但是其实还有一个重要的组件我没有提及,那就是 Kafka Connect。
我们在评估流处理平台的时候,框架本身的性能、所提供操作算子(Operator)的丰富程度固然是重要的评判指标,但框架与上下游交互的能力也是非常重要的。能够与之进行数据传输的外部系统越多,围绕它打造的生态圈就越牢固,因而也就有更多的人愿意去使用它,从而形成正向反馈,不断地促进该生态圈的发展。就 Kafka 而言,Kafka Connect 通过一个个具体的连接器(Connector),串联起上下游的外部系统。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《Kafka快速入门与实战》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(2)

  • 闫冬
    这样章学习了 kafka的各个版本的区别,类似linux 的各个版本 如centos redhat 等 apache社区版更新比较快 社区维护好 但是做的是最基础版 其他的版本更新没有Apache 版快 但是 组件比较全 具体选择可以根据自己的公司情况进行选择
    2020-01-10
    1
  • 张玉鹏
    2010年,LinkedIn开始开发Kafka。
    2011年,Kafka成为Apache开源项目。
    从那以后,Kafka的使用在各种企业中迅速增长。
    目前,超过30%的世界500强公司已经在使用Kafka。
    2020-01-14
收起评论
2
返回
顶部