作者回复: 1. 压缩我们使用的是按时间周期模式,一般5分钟 2. 备份我们基于etcd-backup-operator支持了cos对象存储,会定时备份到对象存储上,一般在集群正常,数据差异不大的场景下,在一个节点上备份即可。etcd节点性能若较差,备份若影响到服务性能的,可优先选择follower节点备份,或者通过learner节点来备份,不过目前社区版learner节点并不支持备份snapshot命令,我将提交一个issue和pr来讨论、支持这个。 3.建议敏感场景、大集群最好分开部署,之前我们遇到了多个磁盘io异常case就是因为受节点上其他组件影响。 4.目前没看到合适
作者回复: 哈哈,巡检和混沌工程搞好了的确很好用的,能帮助大家提高工作效率,避免不必要线上问题
作者回复: 你好,基于你们现状,我建议在c园区部署learner节点更加靠谱点,开源社区点make-mirror还达不到生产环境的要求,存在各种问题,详细参考这篇文章分析。 https://mp.weixin.qq.com/s/_Ee9J7x73gM_GJ6-8MEl2w 如果同城有3个园区,最好将etcd集群部署在3个园区中,2、2、1,这样就可以容忍1个园区故障。
作者回复: 集群规模小,可以的,event最好独立下,注意其他master组件日志级别,不要打印大量日志
作者回复: 目前还没开源,后面腾讯云会提供etcd跨城复制能力。
作者回复: etcd是k8s集群核心控制组件,部署其他控制组件时先部署etcd,可以参考下k8s这个文档 https://kubernetes.io/docs/setup/production-environment/tools/kubeadm/setup-ha-etcd-with-kubeadm/
作者回复: 嗯,做好备份工作