• 密码123456
    2024-06-28 来自北京
    受到的限制应该就是带宽了。文件写入hdfs,本身也是一个服务,不会像硬盘那么快。从hdfs读取也是,也会占用一定的资源。 有个问题,正常服务都是预写日志,memstore,没有提交。预写的日志,没有上传到hdfs,服务故障了,其他服务接替这个分区后,数据是不是就丢失了?
    
    
  • lufofire
    2024-06-28 来自广东
    思考题: 1. 读写性能影响:一个client请求,如果查询找到真正负责读取RegionServer,本身就是代理转发过程,有一定网络延迟。 2. 增加master和ZK管理压力:RegionServer状态监控,元数据管理,更多RegionServer意味着更多的元数据读写。 另外一个关于HBase的高并发, 文章简单说了扩缩容, 没有详细说明在扩容后,HBase如何做了哪些事情来保证高可用,比如服务发现和节点故障后如何处理。另外,只是通过依赖CK来着保活和元数据管理, 本身是不够的,毕竟从ZK组件也有缺陷,比如ZooKeeper 集群的性能受到其最慢节点的影响,在大规模的读写操作下,性能可能会成为瓶颈。再比如相比etcd, zk本身没有很好的watcher机制,如何进行服务状态监控呢?
    
    