当前播放: 37 | 集群分布式模型及选主与脑裂问题
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
课程目录
第一章:概述 (4讲)
01 | 课程介绍
免费
02 | 内容综述及学习建议
免费
03 | Elasticsearch简介及其发展历史
免费
04 | Elastic Stack家族成员及其应用场景
免费
第二章:安装上手 (4讲)
05 | Elasticsearch的安装与简单配置
免费
06 | Kibana的安装与界面快速浏览
07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro
08 | Logstash安装与导入数据
第三章:Elasticsearch入门 (15讲)
09 | 基本概念:索引、文档和REST API
10 | 基本概念:节点、集群、分片及副本
11 | 文档的基本CRUD与批量操作
12 | 倒排索引介绍
13 | 通过Analyzer进行分词
14 | Search API概览
15 | URI Search详解
16 | Request Body与Query DSL简介
17 | Query String&Simple Query String查询
18 | Dynamic Mapping和常见字段类型
19 | 显式Mapping设置与常见参数介绍
20 | 多字段特性及Mapping中配置自定义Analyzer
21 | Index Template和Dynamic Template
22 | Elasticsearch聚合分析简介
23 | 第一部分总结
第四章:深入搜索 (13讲)
24 | 基于词项和基于全文的搜索
25 | 结构化搜索
26 | 搜索的相关性算分
27 | Query&Filtering与多字符串多字段查询
28 | 单字符串多字段查询:Dis Max Query
29 | 单字符串多字段查询:Multi Match
30 | 多语言及中文分词与检索
31 | Space Jam,一次全文搜索的实例
32 | 使用Search Template和Index Alias查询
33 | 综合排序:Function Score Query优化算分
34 | Term&Phrase Suggester
35 | 自动补全与基于上下文的提示
36 | 配置跨集群搜索
第五章:分布式特性及分布式搜索的机制 (8讲)
37 | 集群分布式模型及选主与脑裂问题
38 | 分片与集群的故障转移
39 | 文档分布式存储
40 | 分片及其生命周期
41 | 剖析分布式查询及相关性算分
42 | 排序及Doc Values&Fielddata
43 | 分页与遍历:From, Size, Search After & Scroll API
44 | 处理并发读写操作
第六章:深入聚合分析 (4讲)
45 | Bucket & Metric聚合分析及嵌套聚合
46 | Pipeline聚合分析
47 | 作用范围与排序
48 | 聚合分析的原理及精准度问题
第七章:数据建模 (7讲)
49 | 对象及Nested对象
50 | 文档的父子关系
51 | Update By Query & Reindex API
52 | Ingest Pipeline & Painless Script
53 | Elasticsearch数据建模实例
54 | Elasticsearch数据建模最佳实践
55 | 第二部分总结回顾
第八章:保护你的数据 (3讲)
56 | 集群身份认证与用户鉴权
57 | 集群内部安全通信
58 | 集群与外部间的安全通信
第九章:水平扩展Elasticsearch集群 (6讲)
59 | 常见的集群部署方式
60 | Hot & Warm架构与Shard Filtering
61 | 分片设计及管理
62 | 如何对集群进行容量规划
63 | 在私有云上管理Elasticsearch集群的一些方法
64 | 在公有云上管理与部署Elasticsearch集群
第十章:生产环境中的集群运维 (10讲)
65 | 生产环境常用配置与上线清单
66 | 监控Elasticsearch集群
67 | 诊断集群的潜在问题
68 | 解决集群Yellow与Red的问题
69 | 提升集群写性能
70 | 提升进群读性能
71 | 集群压力测试
72 | 段合并优化及注意事项
73 | 缓存及使用Breaker限制内存使用
74 | 一些运维的相关建议
第十一章:索引生命周期管理 (2讲)
75 | 使用Shrink与Rollover API有效管理时间序列索引
76 | 索引全生命周期管理及工具介绍
第十二章:用Logstash和Beats构建数据管道 (3讲)
77 | Logstash入门及架构介绍
78 | 利用JDBC插件导入数据到Elasticsearch
79 | Beats介绍
第十三章:用Kibana进行数据可视化分析 (4讲)
80 | 使用Index Pattern配置数据
81 | 使用Kibana Discover探索数据
82 | 基本可视化组件介绍
83 | 构建Dashboard
第十四章:探索X-Pack套件 (6讲)
84 | 用Monitoring和Alerting监控Elasticsearch集群
85 | 用APM进行程序性能监控
86 | 用机器学习实现时序数据的异常检测(上)
87 | 用机器学习实现时序数据的异常检测(下)
88 | 用ELK进行日志管理
89 | 用Canvas做数据演示
实战1:电影搜索服务 (3讲)
90 | 项目需求分析及架构设计
91 | 将电影数据导入Elasticsearch
92 | 搭建你的电影搜索服务
实战2:Stackoverflow用户调查问卷分析 (3讲)
93 | 需求分析及架构设计
94 | 数据Extract & Enrichment
95 | 构建Insights Dashboard
备战:Elastic认证 (5讲)
96 | Elastic认证介绍
97 | 考点梳理
98 | 集群数据备份
99 | 基于Java和Elasticseach构建应用
100 | 结束语
37 | 集群分布式模型及选主与脑裂问题

37 | 集群分布式模型及选主与脑裂问题

阮一鸣
eBay Pronto平台技术负责人
100讲 约1000分钟16911
单独订阅¥129
2人成团¥99
3
本节摘要
登录 后留言

精选留言(14)

  • Hwan
    老师,在以前的版本里面,我看到其他的资料是当有三个节点的时候,设置minimum_master_nodes=2是没有问题的呢,在这儿https://www.elastic.co/guide/cn/elasticsearch/guide/cn/important-configuration-changes.html#_%E6%9C%80%E5%B0%8F%E4%B8%BB%E8%8A%82%E7%82%B9%E6%95%B0,然后顺便想问下,为啥minimum_master_nodes设置成大多数之后就可以避免脑裂呢,比如master断开连接了,然后其他节点选举出主节点,原来的master连接上之后为啥就不是脑裂呢,这个是和选举算法有关吗?谢谢老师,有点疑惑

    作者回复: 3个节点,不设置成2,万一有一个节点因为网络问题和另外两个节点断开连接,自己成为一个active master节点,这也是就是所谓的脑裂。设置成2,这一个节点就不会成为主节点

    2019-08-27
    2
    3
  • 桃花岛主
    老师,使用 bin/elasticsearch -E node.name=node1 -E cluster.name=geektime -E path.data=node1_data -E http.port=9200 命令启动时,
    报如下异常:
    [WARN ][o.e.c.c.ClusterFormationFailureHelper] [node1] master not discovered or elected yet, an election requires at least 2 nodes with ids from [Y9C1t9u6StWAzyQFIUWXgg, vaqml17xTEOis9DpnN56qQ, X01o-Qm1TzqWGe0aags5fA], have discovered [{node1}{X01o-Qm1TzqWGe0aags5fA}{28b_Sy3xT9CcZl2m_i8cPw}{192.168.1.224}{192.168.1.224:9300}{dilm}{ml.machine_memory=6068117504, xpack.installed=true, ml.max_open_jobs=20}] which is not a quorum; discovery will continue using [127.0.0.1:9300] from hosts providers and [{node1}{X01o-Qm1TzqWGe0aags5fA}{28b_Sy3xT9CcZl2m_i8cPw}{192.168.1.224}{192.168.1.224:9300}{dilm}{ml.machine_memory=6068117504, xpack.installed=true, ml.max_open_jobs=20}] from last-known cluster state; node term 1, last-accepted version 20 in term 1
    该如何解决这个异常信息呢?
    2019-12-19
  • 李孙科!
    老师 ,在脑裂问题的PPT的示意图中,不是应该根据Node Id 低的去选举成为新的Master 节点吗?
    2019-12-08
  • 夏目
    老师,能不能讲一下7.0移除minimum_master_nodes之后是怎样去解决脑裂问题的
    2019-12-03
  • 白宇
    按照你的命令我在ubuntu上,起不来node,./bin/elasticsearch -E node.name=node1 -E node.host=0.0.0.0 -E node.port=9200 -E cluster.name=geektime -E path.data=node1_data -d,是不是应为配置文件的原因,我是7.4.1版本

    作者回复: 报什么错?

    2019-11-01
  • Deephug
    不同机器的集群教学没有嘛?

    作者回复: 不同机器的集群,不是很明白指的是什么?

    2019-10-26
  • godtrue
    嗯,终于到集群相关的内容了,小结一下:
    1:一个集群有N(N>1)个节点组成
    2:节点的本质就是一个ES的运行实例,也就是一个JAVA进程,一台机器上可以运行多个ES实例,但在生产环境最好一台机器运行一个,防止一台机器挂了N个节点一起都挂了
    3:节点分成主节点、数据节点、节点还有其他角色,比如:路由、竞选主等。每个节点都可以知道整个集群的状态信息,默认都具有路由和竞选主的角色。
    4:主节点的功能最为关键,创建索引、删除索引、维护集群状态信息、分片分配、路由等。
    5:数据节点主要用于数据存储,路由
    请问几个问题:
    1:一个集群中可以有几个主节点?
    2:选主的算法原理是啥?
    3:主分片和副本的数据有延迟吧?副本也提供读服务,数据延迟引起的数据不一致性,ES是怎么解决?
    4:倒排索引这种数据结构是每个分片都有还是每个节点上有一个?分片上的数据存储是怎么存储的也是倒排索引还是类似B+树的结构?
    5:到目前为止我其实还不太清楚我查询一个信息,我只会告诉ES我要查询哪个集群的那个索引,以及想查询什么,他具体是怎么一步步拿到数据给我的,他能知道我查那个集群,然后根据我的查询需求结合倒排索引,知道到那些节点上取那些数据?这个详细的过程老师能一步步拆解一下嘛?
    2019-09-21
  • 崔礼堂
    请问一下es集群管理底层是用什么实现的?因为不是zk所以很好奇
    2019-09-18
  • Geek_8354ec
    老师好,我不太懂, 当前文章中,两个节点都是同一个集群,但是都是在同一个环境下演示,所以能连接到同一个集群中,如果现实环境中,要把每一个节点都放到不同服务器中,那它们是如何对应到同一个集群中的呢? 是不是通过Cerebro整合它们? 如果是的话,Cerebro是不是得单独放到一台服务器中,然后所有的es节点设置相同的集群名,且都要能连接到Cerebro?
    2019-09-16
  • 不忘初心
    老师,我在生产环境有两台节点,组成了一个集群,根据服务器监控显示,每天晚上12点到7点,网卡流量超标,找不到原因

    作者回复: 看不到具体的数据,这个我很难回答。不知道你是否设置了什么定时的任务?或者同hypervisor上跑了什么任务?

    你可以尝试通过安装packetbeat,结合kibana对网络数据做出分析。

    packetbeat的安装你可以自行查阅文档,相关的课程最近也会放出。

    2019-08-20
  • Eclipse
    老师,请问这样的集群配置会不会有问题
    6个节点 master1 master2 data1 data2 client(coordinating only) ingest
    master1,2
    node.master: true
    node.data: false
    node.ingest: false
    data1,2
    node.master: false
    node.data: true
    node.ingest: false
    client
    node.master: false
    node.data: false
    node.ingest: false
    ingest
    node.master: false
    node.data: false
    node.ingest: true

    问题1:ingest只有一个,当它挂了,其他节点能起到ingest的作用吗(我们配置了其他节点node.ingest: false)?
    问题2:master只有一个,当网络不通时或一个master挂了,discovery.zen.minimum_master_nodes = 2/2+1 =2,现在只有一个master,但Quorum要求是2,是不是也不能正常选举?
    恳请老师解惑

    作者回复: 第一个问题:如果你有用到pipeline,如果你唯一的ingest node 挂了,那pipeline将无法正常工作,会影响数据写入。如果你将写操作发给coordinating node 也可以
    第二个问题:当集群中,丢了两个master 节点,只剩下一个节点。因为你之前设置了最小的选举数,因此,一个master 节点无法正常工作。所以,你应该尽量避免 master 节点处于同一台机器,或者是同一个机架上

    2019-08-12
  • Hellboy1989
    老师你好,有一个问题请教一下,我们现在的ES版本是6.4而且只有一个节点,数据已经积累到2TB以上,分片是默认的五个,副本是一个,现在准备增加节点和扩容,计划是要增加到三个节点,我想采用ES 7.X
    的版本,面临的困惑是原来的6.4版本这么升级到7.x版本,而且节点增加到三个以后,原来的分片会不会重新分配到其他节点上?还有就是这个过程我应该注意哪些问题呢?
    2019-08-11
  • Jast
    老师,数据量级在千万,集群需要怎么设置比较合理呢?

    作者回复: 你可以看一下后面的分片设定和集群容量规划的章节

    2019-08-10
    1
  • 党玚
    老师,当把一个集群节点设置为coordinating=false时,如果用户执行请求索引操作,是否会将请求落到这个节点上,这个时候不是就不能做路由转发到master节点了吗?不晓得这样理解是否正确。希望老师解答一下,谢谢。

    作者回复: 任何节点都会承担coordinate node 节点。如果你把master ingest 或者data设置成false,那就是一台dedicated 的coordinate 节点。

    所以你说的情况不存在:)

    2019-08-05
    1
收起评论
看过的人还看
MySQL实战45讲

林晓斌  网名丁奇,前阿里资深技术专家

48讲 | 44076 人已学习

拼团 ¥79 原价 ¥99
Kafka核心技术与实战

胡夕  人人贷计算平台部总监,Apache Kafka Contributor

46讲 | 8569 人已学习

拼团 ¥79 原价 ¥99
从0开始学架构

李运华  资深技术专家

59讲 | 39228 人已学习

¥99
趣谈网络协议

刘超  网易研究院云计算技术部首席架构师

51讲 | 40024 人已学习

拼团 ¥79 原价 ¥99