作者回复: 1. 设计方面:ZooKeeper需要把所有的数据(它的data tree)加载到内存中。这就决定了ZooKeeper存储的数据量受内存的限制。这一点ZooKeeper和Redis比较像。一般的数据库系统例如MySQL(使用InnoDB存储引擎的话)可以存储大于内存的数据,这是因为InnoDB是基于B-Tree的存储引擎。B-tree存储引擎和LSM存储引擎都可以存储大于内存的数据量。 2. 工程方面:ZooKeeper的设计目标是为协同服务提供数据存储,数据的高可用性和性能是最重要的系统指标,处理大数量不是ZooKeeper的首要目标。因此,ZooKeeper不会对大数量存储做太多工程上的优化。
作者回复: 好的,后面的章节我讲得细一些。
作者回复: 会话主要是为实现临时节点这个特性。临时节点在会话过期以后要被删除。 etcd就没有会话的机制,但是可以通过lease来实现类似的机制。 按你说的那种方式,ZooKeeper节点不知道你的客户端是否还在正常运行。对于一个TCP连接,ZooKeeper节点没有办法区分是另一端已经失败还是另一端没有失败只是没有发送数据。TCP的keepalive机制可以探测TCP是否断掉,但是Keepalive time的时间很长。另外TCP的keepalive机制只能判断TCP层是否出错,没有办法知道客户端是否失败。
作者回复: 谢谢