Elasticsearch 核心技术与实战
阮一鸣
eBay Pronto 平台技术负责人
66492 人已学习
新⼈⾸单¥68
课程目录
已完结/共 100 讲
第八章:保护你的数据 (3讲)
第十一章:索引生命周期管理 (2讲)
第十二章:用Logstash和Beats构建数据管道 (3讲)
第十三章:用Kibana进行数据可视化分析 (4讲)
实战1:电影搜索服务 (3讲)
实战2:Stackoverflow用户调查问卷分析 (3讲)
备战:Elastic认证 (5讲)
Elasticsearch 核心技术与实战
登录|注册
留言
17
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 38 | 分片与集群的故障转移
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
01 | 课程介绍
02 | 内容综述及学习建议
03 | Elasticsearch简介及其发展历史
04 | Elastic Stack家族成员及其应用场景
05 | Elasticsearch的安装与简单配置
06 | Kibana的安装与界面快速浏览
07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro
08 | Logstash安装与导入数据
09 | 基本概念:索引、文档和REST API
10 | 基本概念:节点、集群、分片及副本
11 | 文档的基本CRUD与批量操作
12 | 倒排索引介绍
13 | 通过Analyzer进行分词
14 | Search API概览
15 | URI Search详解
16 | Request Body与Query DSL简介
17 | Query String&Simple Query String查询
18 | Dynamic Mapping和常见字段类型
19 | 显式Mapping设置与常见参数介绍
20 | 多字段特性及Mapping中配置自定义Analyzer
21 | Index Template和Dynamic Template
22 | Elasticsearch聚合分析简介
23 | 第一部分总结
24 | 基于词项和基于全文的搜索
25 | 结构化搜索
26 | 搜索的相关性算分
27 | Query&Filtering与多字符串多字段查询
28 | 单字符串多字段查询:Dis Max Query
29 | 单字符串多字段查询:Multi Match
30 | 多语言及中文分词与检索
31 | Space Jam,一次全文搜索的实例
32 | 使用Search Template和Index Alias查询
33 | 综合排序:Function Score Query优化算分
34 | Term&Phrase Suggester
35 | 自动补全与基于上下文的提示
36 | 配置跨集群搜索
37 | 集群分布式模型及选主与脑裂问题
38 | 分片与集群的故障转移
39 | 文档分布式存储
40 | 分片及其生命周期
41 | 剖析分布式查询及相关性算分
42 | 排序及Doc Values&Fielddata
43 | 分页与遍历:From, Size, Search After & Scroll API
44 | 处理并发读写操作
45 | Bucket & Metric聚合分析及嵌套聚合
46 | Pipeline聚合分析
47 | 作用范围与排序
48 | 聚合分析的原理及精准度问题
49 | 对象及Nested对象
50 | 文档的父子关系
51 | Update By Query & Reindex API
52 | Ingest Pipeline & Painless Script
53 | Elasticsearch数据建模实例
54 | Elasticsearch数据建模最佳实践
55 | 第二部分总结回顾
56 | 集群身份认证与用户鉴权
57 | 集群内部安全通信
58 | 集群与外部间的安全通信
59 | 常见的集群部署方式
60 | Hot & Warm架构与Shard Filtering
61 | 分片设计及管理
62 | 如何对集群进行容量规划
63 | 在私有云上管理Elasticsearch集群的一些方法
64 | 在公有云上管理与部署Elasticsearch集群
65 | 生产环境常用配置与上线清单
66 | 监控Elasticsearch集群
67 | 诊断集群的潜在问题
68 | 解决集群Yellow与Red的问题
69 | 提升集群写性能
70 | 提升集群读性能
71 | 集群压力测试
72 | 段合并优化及注意事项
73 | 缓存及使用Breaker限制内存使用
74 | 一些运维的相关建议
75 | 使用Shrink与Rollover API有效管理时间序列索引
76 | 索引全生命周期管理及工具介绍
77 | Logstash入门及架构介绍
78 | 利用JDBC插件导入数据到Elasticsearch
79 | Beats介绍
80 | 使用Index Pattern配置数据
81 | 使用Kibana Discover探索数据
82 | 基本可视化组件介绍
83 | 构建Dashboard
84 | 用Monitoring和Alerting监控Elasticsearch集群
85 | 用APM进行程序性能监控
86 | 用机器学习实现时序数据的异常检测(上)
87 | 用机器学习实现时序数据的异常检测(下)
88 | 用ELK进行日志管理
89 | 用Canvas做数据演示
90 | 项目需求分析及架构设计
91 | 将电影数据导入Elasticsearch
92 | 搭建你的电影搜索服务
93 | 需求分析及架构设计
94 | 数据Extract & Enrichment
95 | 构建Insights Dashboard
96 | Elastic认证介绍
97 | 考点梳理
98 | 集群数据备份
99 | 基于Java和Elasticseach构建应用
100 | 结课测试&结束语
本节摘要
登录 后留言

全部留言(17)

  • 最新
  • 精选
Sunqc
假如一个节点不可用,这里的故障转移是把不可用的节点里的数据复制到另外两个节点里吗,内部的机制是什么啊,如果数据量很大的话。。。来来回回复制数据岂不是很消耗

作者回复: 例如一个主分片不可用了。只要设置了副本分片,其中一个副本分片立即会将自己提升为主分片。同时会将自己的数据分配到一个新的replica上,有时候,我们只是重启一台机器,可以让这个reallocation的动作延迟一段时间再做,从而避免无谓的数据拷贝。

2019-08-10
2
9
黑白
老师,想问下es集群出现不同分片检索出的结果不一致,可能是什么原因导致的,有啥解决办法

作者回复: 数据会根据文档id并结合相应的hash算法将数据分发到不同的分片。所以,不同的shard上的数据肯定是不一样的。 如果你说的是primay和replica上数据count不一样,那确实是有这样的可能。如果数据量不大,p和r上的数据应该会很快一致,如果数据量很小,数据从p到r需要很久,你需要检查集群是否存在性能问题

2019-11-11
4
朝伟
问老师两个问题 1、选主的过程会不会阻塞客户端请求? 2、故障转移期间客户端可以进行读写操作吗? 如果以上2点都有影响、有没有什么方法可以平滑些

作者回复: 选主的过程应该很短,这个期间,如果有创建index或者分片reallocation有可能会出错。 故障转移期间,如果只是黄色变绿,应该不影响读写,因为副本会提升为主分片。集群变红,代表有主分片丢失,这个时候会影响读写

2019-08-22
3
未成年
老师您好,对故障转移这一页ppt (图二),我有个疑问:会不会有这种情况,node1 在断开之前新进来了数据,这个时候node2,node3,去ping发现node1没了,p0的数据还没同步到r0,这个是时候r0升级位p0时数据就少了,这时候应该怎么办

作者回复: node如果丢失,如果没有落盘。就有丢失的可能。如果节点重新回来,会从translog中恢复没有写入的数据。

2019-08-05
2
3
文斌
老师你好,对于视频中的例子,如果节点id较小的node1后面又自动恢复了,那master会不会漂移到node1上

作者回复: active master节点在正常的情况下,一般就是固定一台,不会随意切换。其他的master节点主要用来确保系统的高可用

2020-02-16
2
踮脚时光
为什么我关掉 master 节点后直接访问不了集群了呢? 节点 2 和 节点 3 后台有打印重新分配、集群状态变更的信息,但是 http://127.0.0.1:9200/ 访问不了

作者回复: 报什么错?2和3都有相应日志,说明节点之间网络也没有问题啊

2019-10-26
3
1
Anthony
老师,故障转移的过程是不是就可以理解成,「副本分片提升为主分片的过程」

作者回复: 嗯 可以

2020-04-21
超威丶
所以,老师,7之后的分片默认为1,这个能应用到生产环境?

作者回复: 几百万数据量的索引,一个主分片也是够的,需要设置一个副本分片,确保数据的安全。 关于分片数的设定,后面有专门的一节。

2019-08-03
老师你好,这里有个疑问,既然分片是datanode,一台机器出故障,然后两个分片又分配到其他两个节点,那这个数据也会转移吧

作者回复: 会转移的

2019-08-03
4
这节有意思,看评论有些同学已经问了我想问的问题,我整理一下,加深印象: 1:选主的过程中可能存在问题的场景? 选主的过程应该很短,这个期间,如果有创建index或者分片reallocation有可能会出错。 2:故障转移期间可能会出现问题的场景? 故障转移期间,如果只是黄色变绿,应该不影响读写,因为副本会提升为主分片。集群变红,代表有主分片丢失,这个时候会影响读写。 3: 故障转移,数据重新分配,消耗性能的避免方式? 例如一个主分片不可用了。只要设置了副本分片,其中一个副本分片立即会将自己提升为主分片。同时会将自己的数据分配到一个新的replica上,有时候,我们只是重启一台机器,可以让这个reallocation的动作延迟一段时间再做,从而避免无谓的数据拷贝。 老师,主分片挂啦,他的其中一个副本会立刻将自己提升为主。有个疑问,假如有两个副本怎么决定那个副本提升为主?会不会存在误判的情况,副本以为主挂了,其实没挂,但将自己提升为主啦? 4:故障转移可能存在数据丢失的场景嘛? node如果丢失,如果没有落盘。就有丢失的可能。如果节点重新回来,会从translog中恢复没有写入的数据。
2019-09-21
3
收起评论