Flink 1.5发布:处理模型重构,延迟更低
极客时间编辑部
讲述:丁婵大小:1.06M时长:02:19
近日,Apache Flink 1.5.0 正式发布,在过去的五个月里,Flink 社区努力解决了 780 多个问题。
目前,Flink 正在给流式处理领域带来一次重大飞跃。流式处理不仅意味着更加快速的分析,更是一种构建快速连续数据处理管道的原则性方法。流式处理正在成为构建数据驱动型和数据密集型应用程序的典范,它将数据处理逻辑和应用程序以及业务逻辑汇集在了一起。
据了解,新版本对底层的一些基础组件进行了改进,主要包括:
重新设计并实现了 Flink 的大部分处理模型(FLIP-6)。尽管此项工作还没有全部完工,但是新版本已经可以支持更为顺畅的 Kubernetes 部署,并可以将与外部系统的通信(与外部服务代理的交互)切换到 HTTP。同时,Flink 1.5 简化了在常见集群管理器(如 YARN、Mesos)上进行的部署,并提供动态资源分配功能。
流式广播状态(FLINK-4940)可以将广播流(如上下文数据、机器学习模型、规则 / 模式、触发器等)与可能带有键控状态(keyed state)的流(如特征向量、状态机等)连接在一起。
为了改善对实时应用程序的支持,Flink 团队对 Flink 的网络栈(FLINK-7315)进行了重大改进。Flink 1.5 在保持高吞吐量的同时,实现了更低的延迟。另外,新版本还改进了在回压情况下检查点的稳定性。
流式 SQL 越来越被认为是一种简单而强大的方式,用于执行流式分析、构建数据管道、进行特征工程,或基于变更数据增量更新应用程序状态。新版本添加了用于流式 SQL 查询的 SQL CLI(FLIP-24),让流式 SQL 更易于使用。
此外,新版本主要包含的重大特性更新还包括:
支持 OpenStack 的类 S3 文件系统 Swift;
改进从连接器读取或向连接器写入 JSON 消息;
应用程序可以在无需手动触发保存点的情况下进行伸缩;
改进了 watermark 和延迟的度量标准等。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论