Flink 核心技术与实战
张利兵
第四范式数据中台架构师,Apache Flink 贡献者
16166 人已学习
新⼈⾸单¥68
课程目录
已完结/共 91 讲
第一章:Apache Flink介绍 (5讲)
第七章:Flink监控与性能优化 (5讲)
第九章:项目实战-使用Flink构建推荐系统实时数据流 (2讲)
Flink 核心技术与实战
登录|注册
留言
10
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 03 | 流处理技术概览
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
01 | 课程介绍
02 | 内容综述
03 | 流处理技术概览
04 | Flink发展历史与应用场景
05 | Flink核心特性
06 | Flink集群架构
07 | Flink集群运行模式
08 | Flink集群资源管理器支持
09 | Standalone原理讲解与实操演示
10 | Flink On Yarn部署讲解
11 | Flink On Yarn实操演示
12 | Flink On Kubernetes部署讲解
13 | Flink On Kubernetes实操:Session模式
14 | Flink On Kubernetes实操:Per-job模式
15 | Flink On Kubernetes Native部署讲解
16 | Flink On Kubernetes Native实操演示
17 | Flink高可用配置原理讲解
18 | Flink高可用配置实操演示
19 | 分布式流处理模型
20 | DataStream API实践原理
21 | Flink时间概念
22 | Watermark实践原理
23 | Watermark与Window的关系
24 | Watermark Generator
25 | Windows窗口计算
26 | Window Assigner
27 | Window Trigger
28 | Window Evictors
29 | Window Function
30 | Windows多流合并
31 | Process Function应用
32 | SideOutput旁路输出
33 | Asynchronous I/O异步操作
34 | Pipeline与StreamGraph转换
35 | Flink类型系统
36 | 自定义SourceFunction
37 | 项目实战:基于DataStream API实现PV,UV统计
38 | 有状态计算概念
39 | 状态类型及应用
40 | KeyedState介绍与使用
41 | OperatorState介绍与使用
42 | BroadcastState介绍与使用
43 | Checkpoint实现原理
44 | Savepoint与Checkpoint
45 | StateBackends状态管理器
46 | State Schema Evolution
47 | State序列化与反序列化
48 | Queryable State介绍与使用
49|项目实战:实时交易反欺诈项目介绍
50|项目实战:实时交易反欺诈项目演示
51|Flink Table API/SQL介绍与使用
52|Table API/SQL核心概念
53|DataStream & DataSet 与Table相互转换
54|Table Connector介绍与使用
55|Querying Dynamic Tables
56|TimeStamp与Watermark时间属性定义
57|Query With Temporal Condition
58|Join With Dynamic Table
59|Join With Temporal Function
60|Join With Temporal Tables
61|Catalog原理与使用
62|Apache Hive集成
63|SQL Client介绍与使用
64|Flink SQL Table数据类型
65|自定义Function
66|Table Connector使用
67|自定义Connector
68|new tablesource & tablesink api
69|项目实战:基于Flink SQL实现Top10商品统计
70|Runtime整体架构
71|Flink Client实现原理
72|ResourceManager资源管理
73|Dispatcher任务分发器
74|JobGraph提交与运行(上)
75|JobGraph提交与运行(下)
76|Task执行与调度
77|Task重启和容错策略
78|集群组件RPC通信机制
79|NetworkStatck实现原理
80|Flink内存管理
81|Metric指标分类与采集
82|Flink REST API介绍与使用
83|Checkpoint监控与调优
84|反压监控与原理
85|Flink内存配置与调优
86|PyFlink实践与应用
87|Flink复杂事件处理:Complex event process
88|Alink机器学习框架介绍与使用
89|Stateful Function介绍与使用
90|实时推荐系统项目设计与实现
91|结束语
本节摘要
登录 后留言

全部留言(10)

  • 最新
  • 精选
泊浮目
老师能讲一讲“storm的处理模型和flink的处理模型相比之下的优劣”吗?

作者回复: Storm和Flink的共同之处在于它们旨在通过流水线数据传输实现低延迟流处理,其实说实话Flink的流水线引擎内部看起来还是有点类似于Storm的,比方说Flink的并行任务的接口类似于Storm的bolt,然后Flink中也提供了其他数据输入的算子,类似于Spot。但是,与Storm相比,Flink提供了更高级的API,Flink的DataStream API不仅能够实现Spot,Bolt等全部功能,同时提供Map,GroupBy,Window和Join等高级接口,而这些用户如果使用Storm时都要手动实现许多此功能,程序编写非常费时; 另一个区别是处理语义。Storm能保证至少一次处理,而Flink只提供当且仅当一次处理语义。虽然Storm使用记录级别的确认,但Flink使用了Chandy-Lamport算法的变体,数据源会定期将Barrier注入数据流。每当Operator会接收到这样的Barrier,然后就会检查其内部状态。当下游算子中全部接收到Barrier时,才会触发计算操作,保证了数据一致性。 另外比如内存管理这块,Flink能够脱离JVM进行处理数据的内容管理,内部全部将数据序列化成Bytes类型存储,并提供了一套非常完善的数据序列化和反序列化的机制,这样能保障在大数据量的情况对内存的合理利用; 还有很多地方,比如如何支持带反压数据流模型这块,Flink就能够提出基于Credit的反压模型,能够有效保障系统的稳定运行,而Storm里面还要借助于Zookeeper实现。 总之对比的地方还是很多的,后面的课程我们再遇到具体的细节方面会把这些框架进行横向对比。 谢谢

2020-08-29
8
楚翔style
struct streaming相比于spark streaming有何优势,与flink相比呢

作者回复: Spark在2.x版本后加入了StructedStreaming模块,与流处理引擎Sparkstreaming一样,用于处理流数据。 StructedStreaming主要用于处理结构化流数据,也就是执行在SparkSQL上,对于SparkStreaming主要还是执行在DataStream/RDD上。 另外StructedStreaming可以支持Micro-batch模式和Continuous Processing两种模式,其中Continuous Processing模式实现了通过long-running的task,"不停地"循环从数据源获取数据并处理,从而实现真正的流处理。但是该模式下,当前只能支持简单的projection式(如map,filter,mappartitions等)操作, 和Flink相比还有很多改进的地方; 另外在Job生成方式上也有一定的区别:SparkStreaming主要是通过Timer定时器定时生成job,StructStreaming主要是通过Trigger触发计算的; 希望能对你有帮助,谢谢

2020-08-27
7
大魔王汪汪
脑机接口这种可以用流计算吗

作者回复: 好想法。只要数据能传输到网络,怎么处理都行,Flink也能直接支持Socket套接字数据直接接入,需要做下数据协议上的转换就行,然后就可以在Flink里面处理了。

2020-08-31
5
沧海一粟
老师,有点搞不清流式处理和普通的web接口有什么区别,普通web接口(比如rest api)不也是实时响应请求的吗?

作者回复: 流处理是实时计算,Rest API是实时请求,流处理可以理解为异步的计算操作

2021-09-18
1
Geek_35ec53
请问老师ppt课件有吗

作者回复: Gitee上有课件

2021-04-19
Geek_d7581d
老师,Flink什么时候可以做到批流统一啊?

作者回复: 估计在1.12基本上就完成对Source的重构了,这样数据接入进来就是DataStream,就基本上是批流一体了

2020-09-11
Lee
老师好,flink流批一体,看官方说是批处理也可以用DataStream api,想了解一下,一个批处理的jar包,是怎么被定时调度的呢
2023-07-27
红军
有一个问题咨询一下,从老师讲解的PDF文件中copy内容,会报错。􀀁􀀂􀀃􀀄􀀅 􀀆􀀄 􀀇􀀈􀀉􀀄 􀀊􀀋􀀌􀀍􀀎􀀏 􀀁􀀂􀀃􀀃􀀄􀀅􀀆 􀀇􀀈􀀉􀀊􀀋。 这个能解决吗? 不然手抄里面的内容,得要费时间
2023-01-15
Allan
1、sparkstreaming 延时性高一些,对于数据量比较大,延迟性不那么要求可以选择它; 2、fink 真正的流计算框架 底层采用dataflow model 跟storm一样 低延迟 高吞吐 支持原生流处理就一条一条这样的处理 3、我们在选择流计算框架时候要考虑 低延迟 高吞吐 准确性 易用性 那么flink恰恰做到了 所以这是我们选择它作为我们的流计算
2021-01-29
西南偏北
Dataflow model对应底层是什么?是队列吗?
2020-12-01
收起评论