2. ZooKeeper 集群的 shell 操作命令
3. ZooKeeper 的 JavaAPI 操作
9. HDFS 的安全机制及 JavaAPI 操作
6. HBase 与 MapReduce 的集成实现
9. HBase 的 Flush、Compact、region 预分区
10. HBase 的 rowkey 设计原则及分裂策略
11. 加餐:使用 Phoenix 给 HBase 创建二级索引
1. 消息队列基本介绍及 Kafka 的集群架构设计
6. 消费者 Offset 及 Rebalance 机制
10. Option 类型、偏函数、异常处理、提取器
3. Spark 程序开发和 Spark 的任务提交
2. SparkSQL 的 DataFrame 创建方式
3. sparkSQL 的 DataFrame 操作及 DataSet
10. SparkStreaming 的高级算子操作
11. SparkStreaming 数据输出及整合 Kafka
1. RDD 的血统、缓存与 checkpoint 机制
2. 计数器累加器、分布式缓存和 Task 数据传输策略
4. Flink 的 ValueState、ListState 操作
1. Flink 的 mapState、reduceingState 等操作
2. Flink 的 watermark 机制和顺序数据的 watermark
4. 用 connect 实现两个流数据的 join 操作
2. TableAPI 的 MySQL 及 Hive 数据源输入
6. TableAPI 基于滑动窗口、会话窗口的操作
7. TableAPI 基于 OverWindow 的操作
1. FlinkSQL 基于 GroupWindow 的操作
2. FlinkSQL 基于 OverWindow 的操作
3. FlinkSQL 的自定义 UDF、UDTF 函数
4. Flink、Hive 与 Hudi 的数据湖实战
6. MPP 和 ClickHouse 的基本介绍