极客时间-轻松学习，高效学习-极客邦

yu

2019-08-19

老师，我觉得doc_count_error_upper_bound=4+2不是4+3？？？

 4

 5
eureka

2019-09-24

老师，右边的为什么遗漏数是3？最大可能数，不应该是2吗？



 3
godtrue

2019-09-21

本节好玩，刷新了认知
1：size和shard_size的区别？
size是最终返回多少个buckt的数量。
shard_size是每个bucket在一个shard上取回的bucket的总数。然后，每个shard上的结果，会在coordinate节点上在做一次汇总，返回总数。
2：doc_count_error_upper_bound：被遗漏的term分桶里面包含的文档有可能的最大值——千万注意“可能的最大值”！
文中的例子 4+3没毛病，因为取回的三个的最小的桶里面是4个。所以遗漏的最大的可能数值是4。注意是“可能最大”而不是“实际最大值”。
3：关于coordinate的注意事项？
任何节点都具备coordinate的能力，也就是说你无法配置一个节点，不具备coordinate的角色。但是你可以配置只负责coordinate的节点。数据存储，都保存在数据节点上。——一个节点如果是数据节点，则必然具备存储数据的能力，而ES中任何节点都天生具备路由的能力。

展开



 3
氧气🌙 🐟 🌺

2019-08-20

doc_count_error_upper_bound：被遗漏的term分桶里面包含的文档有可能的最大值
左边分片返回分桶ABC，剩下的有可能遗漏的term的总数最大只可能是4，这里不明白。明明遗漏的是3嘛

作者回复: 因为取回的三个的最小的桶里面是4个。所以遗漏的最大的可能数值是4。注意是“可能最大”而不是“实际最大值”

 1

 3
冷冽

2019-11-30

这个termsaggs的例子里面的 doc_count_error_upper_bound经过我实际操作，elasticsearch返回的结果就是6，所以应该是分片1的可能最大遗漏值是4，分片2的可能最大遗漏值是2.加起来是6。经过实际操作可以了解更多细节内容，比如实际操作的时候如果要实现错误场景还需要使用到 size和shard_size两个参数。size表示最终结果返回的数量，shard_size表示从每个分片中聚合的结果返回的数量。shard_size设置为3时结果就不准确了，可以将这个值设置大一点，就可以让结果跟准确



 1
Geek_5b11b8

2019-10-04

关于4+3等于7是遗漏的数据量，我的理解是这样的，首先在左边因为全部在结果里面包含，所以遗漏的最大可能值就是左边数量最小的那个也就是4，而右边因为AB都在结果里面(这也是为什么不是2的原因)，所以不能算遗漏而D在合并后丢掉了，所以取值是3，所以和为7，应该是这样的。



 1
Pantheon

2019-08-15

老师,,没明白shard_size的原理,获取更多的bucket吗?那和size有啥区别

作者回复: size是最终返回多少个buckt的数量。
shard_size是每个bucket在一个shard上取回的bucket的总数。然后，每个shard上的结果，会在coordinate节点上在做一次汇总，返回总数



 1
tisson

2020-02-07

老师，我发现即使只有1个primary shard，如果记录较多，设置返回的size很小，那么默认不设置shard_size的情况下，结果仍然会不准确，sum_other_doc_count的值仍然会很大，请问这是正常的吗？那么我还是需要把shard_size设置得很大？




PLADahuzi

2019-12-20

这个shard_size还是没理解的了，能帮忙说的在详细些吗？




PLADahuzi

2019-12-20

但是我有个疑问，coordinate节点是怎么知道整个索引的文档数的总数的，




PLADahuzi

2019-12-20

看了对下面同学的恢复后，我的理解是，doc_count_error_upper_bound这个值是在coordinate节点上面推算出来的，不是各个分片返回了遗漏的桶的文档数，所以所再coordinate节点上面只能拿到各个分片返回的桶中文档数，而coorditnate节点要推算的话，只能取各个分片返回的桶中文档数最小的数进行累加，得到的值就是推算出来的有可能遗漏的最大的文档数；这样对不




PLADahuzi

2019-12-20

关于doc_count_error_upper_bound这个参数，我觉得老师你讲的很难理解，我这么理解你看对不对：
首先是各个分片自己聚合分桶返回结果，遗漏了D（3），右边的分片遗漏了C（1），然后是再coordinate节点上进行二次聚合的时候遗漏了右边分片返回的D（3），所以最后这个被遗漏的分桶包含的文档有可能的最大值是 3 + 1 + 3 = 7
老师我这么理解对不对？？？希望能得到恢复，感谢




踮脚时光

2019-11-07

没有说明白为什么是 4+3

 1


Frode

2019-10-02

老师请教一下您建议使用rest api 的意思是什么？例如我用java开发，使用resttemplate来发送dsl语法，获取json数据么？我现在用的是springdata的api，用的像是9300的端口呢，并且不熟悉api的用法，操作很麻烦。

作者回复: 9300是transport API。9200是rest api。rest api就是基于http的。支持使用全部的es的dsl。你可以看一下后面关于java调用es的相关课程。你可以调用hlrc。在全部课程的倒数几个视频中




Geek_0ac7f5

2019-09-16

老师，cardinality可以精确统计吗？




Ryoma

2019-09-05

一个分区可以支持多少文档数或文档大小，或者老师可以给个经验标准

作者回复: 一个shard的存储容量控制在30gb 以内，后面容量规划中有相关的讲解




Jayden

2019-08-28

能否增加集群性能优化的讲解。现在我们遇到查询性能问题，TP99怎么能够优化提升




RXTM

2019-08-18

老师，我想问一下coordinate节点和普通的节点一样会存储数据么？还是它只负责协调？

作者回复: 任何节点都具备coordinate的能力，也就是说你无法配置一个节点，不具备coordinate的角色。但是你可以配置只负责coordinate的节点。数据存储，都保存在数据节点上



