作者回复: 1.Doris没有做数据压缩
2.Doris当时版本没有做完整性(正确性)验证,但是可以简单做多读,然后进行数据对比验证,不过这样要求的数据备份数要更多。
3.不会,路由算法保证负载均衡,但是如果虚拟节点数和物理节点数相差不大时,会有数据倾斜,所以要求一开始设计的虚拟节点要足够多,是未来最大物理节点数的十倍以上
作者回复: 分片在group内分片,这里节点1,2分属不同group,存放的是同一份数据的两个拷贝
作者回复: 虚拟节点数分别是3333 3333 3334
作者回复: 有公式,具体可以参考专利文献 http://www2.soopat.com/Patent/201110294092?lx=FMSQ 或者项目源码。
这个算法相对一致性hash的优势文中有比较。
作者回复: 谢谢😄
作者回复: 在临时失效和恢复过程中,同一份数据的值在不同服务器上可能是不同的,不满足CAP中的C。但是Doris会选择正确的服务器读取数据,保证用户访问的数据是一致的,即用户一致性,失效恢复结束,多个数据拷贝的值也会恢复一致,即最终一致性。