

下载APP



关闭

讲堂

算法训练营

Python 进阶训练营

企业服务

极客商城

客户端下载

兑换中心

渠道合作

推荐作者

当前播放: 37 | 集群分布式模型及选主与脑裂问题



00:00 / 00:00

标清

标清

1.0x

2.0x
1.5x
1.25x
1.0x
0.5x



网页全屏



全屏

00:00

付费课程，可试看

Elasticsearch核心技术与实战



共100讲 · 约1000分钟

 16516

免费

01 | 课程介绍

免费

02 | 内容综述及学习建议

免费

03 | Elasticsearch简介及其发...

免费

04 | Elastic Stack家族成员及...

免费

05 | Elasticsearch的安装与...

06 | Kibana的安装与界面快速...

07 | 在Docker容器中运行Elas...

08 | Logstash安装与导入数据

09 | 基本概念：索引、文档和...

10 | 基本概念：节点、集群、分...

11 | 文档的基本CRUD与批量操...

12 | 倒排索引介绍

13 | 通过Analyzer进行分词

14 | Search API概览

15 | URI Search详解

16 | Request Body与Query ...

17 | Query String&Simple ...

18 | Dynamic Mapping和常见...

19 | 显式Mapping设置与常见参...

20 | 多字段特性及Mapping中配...

21 | Index Template和Dynami...

22 | Elasticsearch聚合分析简...

23 | 第一部分总结

24 | 基于词项和基于全文的搜索

25 | 结构化搜索

26 | 搜索的相关性算分

27 | Query&Filtering与多字...

28 | 单字符串多字段查询：Dis...

29 | 单字符串多字段查询：Mult...

30 | 多语言及中文分词与检索

31 | Space Jam，一次全文搜索...

32 | 使用Search Template和In...

33 | 综合排序：Function Scor...

34 | Term&Phrase Suggester

35 | 自动补全与基于上下文的提...

36 | 配置跨集群搜索

37 | 集群分布式模型及选主与脑...

38 | 分片与集群的故障转移

39 | 文档分布式存储

40 | 分片及其生命周期

41 | 剖析分布式查询及相关性算...

42 | 排序及Doc Values&Field...

43 | 分页与遍历：From, Siz...

44 | 处理并发读写操作

45 | Bucket & Metric聚合分...

46 | Pipeline聚合分析

47 | 作用范围与排序

48 | 聚合分析的原理及精准度问...

49 | 对象及Nested对象

50 | 文档的父子关系

51 | Update By Query &...

52 | Ingest Pipeline & Pa...

53 | Elasticsearch数据建模实...

54 | Elasticsearch数据建模最...

55 | 第二部分总结回顾

56 | 集群身份认证与用户鉴权

57 | 集群内部安全通信

58 | 集群与外部间的安全通信

59 | 常见的集群部署方式

60 | Hot & Warm架构与Shard...

61 | 分片设计及管理

62 | 如何对集群进行容量规划

63 | 在私有云上管理Elasticsea...

64 | 在公有云上管理与部署Elas...

65 | 生产环境常用配置与上线清...

66 | 监控Elasticsearch集群

67 | 诊断集群的潜在问题

68 | 解决集群Yellow与Red的问...

69 | 提升集群写性能

70 | 提升进群读性能

71 | 集群压力测试

72 | 段合并优化及注意事项

73 | 缓存及使用Breaker限制内...

74 | 一些运维的相关建议

75 | 使用Shrink与Rollover AP...

76 | 索引全生命周期管理及工具...

77 | Logstash入门及架构介绍

78 | 利用JDBC插件导入数据到El...

79 | Beats介绍

80 | 使用Index Pattern配置数...

81 | 使用Kibana Discover探索...

82 | 基本可视化组件介绍

83 | 构建Dashboard

84 | 用Monitoring和Alerting监...

85 | 用APM进行程序性能监控

86 | 用机器学习实现时序数据的...

87 | 用机器学习实现时序数据的...

88 | 用ELK进行日志管理

89 | 用Canvas做数据演示

90 | 项目需求分析及架构设计

91 | 将电影数据导入Elasticsea...

92 | 搭建你的电影搜索服务

93 | 需求分析及架构设计

94 | 数据Extract & Enrichm...

95 | 构建Insights Dashboard

96 | Elastic认证介绍

97 | 考点梳理

98 | 集群数据备份

99 | 基于Java和Elasticseach构...

100 | 结束语

本节摘要

课程 Demo

课件地址

深入了解 Elasticsearch

展开



精选留言(13)

Hwan

2019-08-27

老师，在以前的版本里面，我看到其他的资料是当有三个节点的时候，设置minimum_master_nodes=2是没有问题的呢，在这儿https://www.elastic.co/guide/cn/elasticsearch/guide/cn/important-configuration-changes.html#_%E6%9C%80%E5%B0%8F%E4%B8%BB%E8%8A%82%E7%82%B9%E6%95%B0，然后顺便想问下，为啥minimum_master_nodes设置成大多数之后就可以避免脑裂呢，比如master断开连接了，然后其他节点选举出主节点，原来的master连接上之后为啥就不是脑裂呢，这个是和选举算法有关吗？谢谢老师，有点疑惑

展开

作者回复: 3个节点，不设置成2，万一有一个节点因为网络问题和另外两个节点断开连接，自己成为一个active master节点，这也是就是所谓的脑裂。设置成2，这一个节点就不会成为主节点

 2

 3
李孙科！

2019-12-08

老师，在脑裂问题的PPT的示意图中，不是应该根据Node Id 低的去选举成为新的Master 节点吗？




夏目

2019-12-03

老师，能不能讲一下7.0移除minimum_master_nodes之后是怎样去解决脑裂问题的




白宇

2019-11-01

按照你的命令我在ubuntu上，起不来node，./bin/elasticsearch -E node.name=node1 -E node.host=0.0.0.0 -E node.port=9200 -E cluster.name=geektime -E path.data=node1_data -d，是不是应为配置文件的原因，我是7.4.1版本

作者回复: 报什么错？




Deephug

2019-10-26

不同机器的集群教学没有嘛？

作者回复: 不同机器的集群，不是很明白指的是什么？




godtrue

2019-09-21

嗯，终于到集群相关的内容了，小结一下：
1：一个集群有N（N>1）个节点组成
2：节点的本质就是一个ES的运行实例，也就是一个JAVA进程，一台机器上可以运行多个ES实例，但在生产环境最好一台机器运行一个，防止一台机器挂了N个节点一起都挂了
3：节点分成主节点、数据节点、节点还有其他角色，比如：路由、竞选主等。每个节点都可以知道整个集群的状态信息，默认都具有路由和竞选主的角色。
4：主节点的功能最为关键，创建索引、删除索引、维护集群状态信息、分片分配、路由等。
5：数据节点主要用于数据存储，路由
请问几个问题：
1：一个集群中可以有几个主节点？
2：选主的算法原理是啥？
3：主分片和副本的数据有延迟吧？副本也提供读服务，数据延迟引起的数据不一致性，ES是怎么解决？
4：倒排索引这种数据结构是每个分片都有还是每个节点上有一个？分片上的数据存储是怎么存储的也是倒排索引还是类似B+树的结构？
5：到目前为止我其实还不太清楚我查询一个信息，我只会告诉ES我要查询哪个集群的那个索引，以及想查询什么，他具体是怎么一步步拿到数据给我的，他能知道我查那个集群，然后根据我的查询需求结合倒排索引，知道到那些节点上取那些数据？这个详细的过程老师能一步步拆解一下嘛？

展开




崔礼堂

2019-09-18

请问一下es集群管理底层是用什么实现的？因为不是zk所以很好奇




Geek_8354ec

2019-09-16

老师好，我不太懂, 当前文章中，两个节点都是同一个集群，但是都是在同一个环境下演示，所以能连接到同一个集群中，如果现实环境中，要把每一个节点都放到不同服务器中，那它们是如何对应到同一个集群中的呢？是不是通过Cerebro整合它们？如果是的话，Cerebro是不是得单独放到一台服务器中，然后所有的es节点设置相同的集群名，且都要能连接到Cerebro？




不忘初心

2019-08-20

老师，我在生产环境有两台节点，组成了一个集群，根据服务器监控显示，每天晚上12点到7点，网卡流量超标，找不到原因

作者回复: 看不到具体的数据，这个我很难回答。不知道你是否设置了什么定时的任务？或者同hypervisor上跑了什么任务？

你可以尝试通过安装packetbeat，结合kibana对网络数据做出分析。

packetbeat的安装你可以自行查阅文档，相关的课程最近也会放出。




Eclipse

2019-08-12

老师，请问这样的集群配置会不会有问题
6个节点 master1 master2 data1 data2 client(coordinating only) ingest
master1,2
node.master: true
node.data: false
node.ingest: false
data1,2
node.master: false
node.data: true
node.ingest: false
client
node.master: false
node.data: false
node.ingest: false
ingest
node.master: false
node.data: false
node.ingest: true

问题1：ingest只有一个，当它挂了，其他节点能起到ingest的作用吗（我们配置了其他节点node.ingest: false）?
问题2：master只有一个，当网络不通时或一个master挂了，discovery.zen.minimum_master_nodes = 2/2+1 =2，现在只有一个master，但Quorum要求是2，是不是也不能正常选举？
恳请老师解惑

展开

作者回复: 第一个问题：如果你有用到pipeline，如果你唯一的ingest node 挂了，那pipeline将无法正常工作，会影响数据写入。如果你将写操作发给coordinating node 也可以
第二个问题：当集群中，丢了两个master 节点，只剩下一个节点。因为你之前设置了最小的选举数，因此，一个master 节点无法正常工作。所以，你应该尽量避免 master 节点处于同一台机器，或者是同一个机架上




Hellboy1989

2019-08-11

老师你好，有一个问题请教一下，我们现在的ES版本是6.4而且只有一个节点，数据已经积累到2TB以上，分片是默认的五个，副本是一个，现在准备增加节点和扩容，计划是要增加到三个节点，我想采用ES 7.X
的版本，面临的困惑是原来的6.4版本这么升级到7.x版本，而且节点增加到三个以后，原来的分片会不会重新分配到其他节点上？还有就是这个过程我应该注意哪些问题呢？




Jast

2019-08-10

老师，数据量级在千万，集群需要怎么设置比较合理呢？

作者回复: 你可以看一下后面的分片设定和集群容量规划的章节

 1


党玚

2019-08-05

老师，当把一个集群节点设置为coordinating=false时，如果用户执行请求索引操作，是否会将请求落到这个节点上，这个时候不是就不能做路由转发到master节点了吗？不晓得这样理解是否正确。希望老师解答一下，谢谢。

作者回复: 任何节点都会承担coordinate node 节点。如果你把master ingest 或者data设置成false，那就是一台dedicated 的coordinate 节点。

所以你说的情况不存在：）

 1



去订阅《Elasticsearch核心技术与实战》