• ASCE1885
    2019-10-12
    现在提倡使用 leader/follower 来替代 master/slave

    作者回复: 这是两种不同的说法

     2
     3
  • Jackey
    2019-10-13
    可以通过slave向master发送心跳包来监听slave的存活状态。还想到了redis的哨兵模式,主从节点的存活状态都由哨兵来监控

    作者回复: master 和 slave之间其实可以通过TCP链接和心跳结合来进行判断。

     1
     2
  • Eternal
    2019-10-27
    这一章节平时了解得比较少,看起吃力,需要抓紧补习
    
     1
  • xj_zh
    2019-10-23
    老师,可以讲讲master怎么通过tcp和心跳包结合判断slave是否存活的吗?坐等具体实现细节!

    作者回复: master和slave之间可以建立一个TCP链接,如果Slave进程退出,但slave节点未挂掉,master这边会感知到TCP链路断开。针对网络故障,或整个Slave服务器挂掉的情况下,可以通过心跳超时进行判断。

    
     1
  • 小白
    2019-10-11
    以Kubernetes为例:
     * 各个节点的kubelet默认每隔10s向api server地址上报node 节点状态,时间间隔可以通过kubelet config 中nodeStatusUpdateFrequency参数来调节。
     * kube-controller-manager 默认会每隔5s查询每个node的节点状态,时间间隔可以通过--node-monitor-period 参数来调节
     * kube-controller-manager 会发现宕机node没有更新节点状态,直到达到grace period设置的时间之后,controller-manager会标记节点为not ready状态。grace period可以通过 --node-monitor-grace-period参数来设置。

    https://github.com/kubernetes-sigs/kubespray/blob/master/docs/kubernetes-reliability.md
    展开
    
     1
  • _CountingStars
    2019-10-11
    方式有很多 比如可以直接利用定期的资源使用情况报告来判断是否存活 也可以 master 定期发送探活包 还可以 slave 定期更新指定数据

    PS:Twitter 已经放弃 mesos 全面 转向 kubernetes
    
     1
  • 观弈道人
    2019-12-19
    我怎么感觉这篇和第四篇说的是一个东西,master/slave,求高手指点迷津

    作者回复: 确实有联系,不过还是有区别。

    集中式架构的显著特点就是集群中的节点有Master也有Slave,我在第9讲中主要讲的是这种体系架构,以及对应的典型代表。

    而在第4讲中主要讲的是如果有若干个节点,除了静态手动指定Master和Slave之外,还有没有什么方法可以动态的去从节点中选出Master节点,这在Master节点故障后,进行业务故障恢复时特别有用。在这些场景下就需要用到第4讲的知识了。

     1
    
  • 人生几度秋凉
    2019-12-04
    老师有个疑问:
    Mesos 对物理资源进行了逻辑抽象,在应用层而不是物理层分配资源,通过容器而不是虚拟机(VM)分配任务。
    1、Borg和kubernetes在资源分配层面也都是通过容器而不是虚拟机吗?
    2、Borg和kubernetes也是对物理资源进行了逻辑抽象么?如何抽象的?谢谢老师!
    
    
  • goolnen
    2019-10-21
    老师后面会对集中式和非集中式进行优缺点的对比么,会不会举一些例子:如redis、elasticsearch、Hadoop...这些系统为什么这么设计?还有我在目录没看到关于分布式一致性这个重要的话题呢,以及相关的一致性算法,这些后面会专门讲讲么

    作者回复: 其实一致性没有单独说成是“一致性”,但是分布式共识、分布式数据里面都会介绍一致性的知识。

    
    
  • W.T
    2019-10-21
    老师,您认为Mesos的未来前景如何?会被K8s取代吗?能谈谈您的看法吗?
     1
    
  • 楚翔style
    2019-10-16
    yarn应该也是集中式的分布式体系吧,,有applicationMaster

    作者回复: Yarn属于集中式的

    
    
  • xfan
    2019-10-15
    能分享一下ceph吗
    
    
  • mt11912
    2019-10-14
    思考题:Slave节点启动一个health check service, 监控节点状态,并以一个固定时间周期向主节点报告其状态。
    老师,YARN和Mesos在设计上是不是类似的?
    
    
  • 易儿易
    2019-10-12
    原话:也正因为此,Mesos 的任务调度框架是双层结构。
    老师,这个因果关系没有看明白……
    不论用户请求还是框架集成,只是api方式不同对吧?Mesos的双层结构是什么效果呢?

    作者回复: Mesos的双层调度我会在“分布式调度架构之两层调度:物质文明、精神文明两手抓”进行介绍

    
    
  • leslie
    2019-10-12
    我觉得国内肯定不久会有自己的版本出来或者只是暂时没放出来而已:不知道又会是什么特性😀
    这几年国内IT的发展速度超快:不坚持学习就被可能淘汰了😃
     1
    
  • 花儿少年
    2019-10-11
    不知道老师你们是怎么判断一个task或者job是已经成功运行了,或者是启动失败了, 我们公司目前基本上是等待超时,很浪费时间
    
    
  • Dale
    2019-10-11
    Master和Slave之间通常维持心跳检测,是slave用来向master报告自己的健康状态的一个机制,或者说是master用来获取slave的健康状态的一个机制。或者借助分布式协调服务,例如zk选举,master和slave节点抢占临时节点。
    
    
  • 随心而至
    2019-10-11
    是心跳机制吗?master定时发请求给slave,看看slave是否还活着。
    
    
我们在线,来聊聊吧