• ASCE1885 置顶
    2018-12-04
    CAP 定理关注的是对数据的读写操作,而不是分布式系统的所有功能,它要求分布式系统节点间是互相连接且有数据共享的,例如 Memcache 的集群中节点相互间没有连接和数据共享,因此不是 CAP 定理讨论的对象,同理 ZooKeeper 的选举机制也不是 CAP 探讨的对象。

    摘自从零开始学架构,大家可以探讨下。

    作者回复: CAP的P如果按字面意思理解,网络分区容错,应该是A的一种情况,这样对设计没有指导意义,所以在9年前第一次看到CAP原理,我就按分片理解,这样所有的分布式系统就可以解释了,不存在不能探讨的分布式对象。这次专栏发布后,很多同学对P的理解提出质疑,我又查了下资料,确实这种理解比较激进,可能会造成误导,这部分内容已经删除,很抱歉。

    memcached和zk是最典型的分布式系统,一个分布式的关键原理不适用于最典型的分布式系统,老实说,很郁闷。

     1
     18
  • shangyu
    2018-12-04
    请问老师 对于文中这句话不太理解:“但是 ZooKeeper 系统中所有服务器都存储相同的数据,也就是数据没有分片存储,因此不满足分区耐受性”。zk没有分片但是都存储了相同数据,也就是有冗余备份,一定是要数据有分片才满足P吗
    
     10
  • M
    2018-12-04
    P和数据分不分片并没有任何关系吧。在分布式系统中P就是满足的,否则就是单机了。所以一般考虑的是CP和AP,CP是指在网络分区形成(分布式节点之间不能互相通信)的情况下,牺牲可用性,满足一致性,只有等到数据同步完成后才能恢复可用。而AP是指在网络分区形成的情况下,向外部继续提供使用,但是数据可能不一致(因为节点之间不能通信,所有节点的数据可能不一致)
    
     8
  • 忠厚
    2018-12-21
    ZooKeeper 集群的性能会随着服务器数量的增加而下降
    这个描述不准确,ZK中有三种角色 leader Follower observer ,而observer不参与投票,增加observer性能上不会有太大损失(在投票通过后leader结点会通知其他所有结点进行数据更新,这个过程是通过广播的形式完成,而且leader并不等待更新的结果)
    
     5
  • 纯洁的憎恶
    2018-12-04
    “CAP 定理关注的是对数据的读写操作,而不是分布式系统的所有功能,它要求分布式系统节点间是互相连接且有数据共享的,例如 Memcache 的集群中节点相互间没有连接和数据共享,因此不是 CAP 定理讨论的对象,同理 ZooKeeper 的选举机制也不是 CAP 探讨的对象。

    摘自从零开始学架构,大家可以探讨下。”

    有道理!我个人的理解是ZooKeeper本身确实不熟CAP探讨的对象。但是ZooKeeper的很多应用场景,如分布式系统的数据一致性,才是CAP探讨对象。解决问题的钥匙不是问题本身,我理解的对么?
    展开
    
     4
  • Jowin
    2018-12-04
    zookeeper提供的数据读写服务是cp模型,也就是强一致性。老师这里说的是zookeeper节点间的数据同步模型,如果非要套用cap的话,应该也是cp模型,容忍少于半数的节点故障,一旦多余半数的节点故障,就无法达成一致,系统就不可用性了。
     1
     4
  • Kaer
    2018-12-04
    P跟是指网络出现分区,不是数据分区。数据的分区是:shareding
     1
     4
  • cc_hust
    2018-12-04
    个人理解,CAP 中的P跟是否分片存储没有关系。在分布式环境中,P是必选项,需要权衡多副本的一致性和可用性, 单机系统才是放弃了P。
    
     4
  • dancer
    2018-12-04
    老师,P的释义感觉不是很准确,查了一下维基百科的定义,
    Partition tolerance: The system continues to operate despite an arbitrary number of messages being dropped (or delayed) by the network between nodes
    
     3
  • godtrue
    2019-09-28
    估计是删除了部分内容,看评论好多都在聊CAP,看正文没见CAP什么事,不过之前学习过ZK是属于CP的。
    另外,感觉老师这个讲的浅,随便一个zk的讲解都比这多,我自己百度过分布式一致性协议,感觉2PC/3PC还能理解,对于ZAB的简单说明也能理解,不过paxos确实理解不了,很期待有人能通俗易懂的将所有分布式一致性协议都对比讲解清楚一下!
    
     2
  • aof
    2018-12-21
    老师能专门讲一下zookeeper的leader选举机制吗
    
     2
  • galen
    2018-12-04
    如何保证从Zookeep节点中读取的数据,是最新的数据?
    Zookeep节点可能还在同步数据,当前节点的数据不是最新的数据
    
     2
  • Zend
    2019-11-18
    是否可以在分布式系统中不信任的机器加入黑名单,放在ZooKeeper上。

    作者回复: 如果连zookeeper集群本身的机器就不可信任,黑名单也是不可信任的。

    可以参考区块链的实现机制。我在《后端技术》专栏会讲区块链技术架构。

     1
     1
  • A:春哥大魔王
    2019-09-01
    zk集群可用性怎么保证呢?这不又回到原始的问题了?
    
     1
  • 老范
    2019-06-10
    但是 ZooKeeper 系统中所有服务器都存储相同的数据,也就是数据没有分片存储,因此不满足分区耐受性

    建议老师修改下上处:我们用 sharding 表示分片,用 partition 表示网络分区,partion tolerance 和 sharding 二者是不同概念,并没有如老师您所述的关系。 在 CAP 理论中,当网络分区发生时,ZK 选择了 Consistence,舍弃了 Availability。

    作者回复: 谢谢老范

    
     1
  • 阿里巴巴骊骅
    2018-12-06
    请问老师 对于文中这句话不太理解:“但是 ZooKeeper 系统中所有服务器都存储相同的数据,也就是数据没有分片存储,因此不满足分区耐受性”。zk没有分片但是都存储了相同数据,也就是有冗余备份,一定是要数据有分片才满足P吗
    
     1
  • 欧嘉权Felix
    2018-12-05
    不是很理解老师说的不符合p的原因 zk是cp系统吧
    
     1
  • Any Hello mino
    2018-12-04
    Zookeeper是cp吧?选举的时候不是都是不可用的
    
     1
  • 阿巍-豆夫
    2018-12-04
    paxos 怎么实现强一致性,有点晕了?
    
     1
  • 阿巍-豆夫
    2018-12-04
    zk是最终一致性吧,这个没说清楚啊。

    作者回复: 强一致,回复client的时候,zk服务器就已经一致了

    
     1
我们在线,来聊聊吧