极客时间-轻松学习，高效学习-极客邦

Geek_c52e59

2019-11-06

請教老師,我們目前在生產環境使用的protocol是transport的方式,不是RESTFul API,請問這樣的狀況下增加coordinate node 做查詢的load banlancer是有用嗎的?

作者回复: lb是基于9200走的http。transport走的是9300，估计你是通过将一组node的ip加入配置文件来实现的吧？这种情况下，通过增加节点也可以实现水平扩展



 1
张红泽

2019-10-17

老师我们现在一个索引10个主分片，现在每个主分片80g，现在我们需要增加分片数量，增加到 100个，会造成集群查询变慢吗

作者回复: 单个分片的尺寸最好控制在50G以下。单台机器，每一个G的内存，分配20个以下的分片。

你现在突然将主分片扩到100个，每个上面只有8g，这肯定是over sharding了



 1
亚伦王

2019-12-21

老师，我想问了一下es中的数据是怎么存储的，是主要的数据都存储在磁盘里吗？那内存里是会存储什么类型的数据吗？或者举个列子一个集群3个节点每台配置都是32核64G 内存 500G磁盘，那理论上这个集群是可以存储1500G左右的数据吗？




godtrue

2019-09-22

还未做过类似的工作，不过感觉和关系型数据库的容量规划是类似的，老师讲解的挺好，大体原则清楚了。目前组内的另一个同事其实就遇到了关于ES写入慢的问题，不过具体的mapping和es集群的配置不太清楚，是一个定时任务跑一次会产生大量的数据，她会将产生的数据写入ES集群用于后期的展示，一次会产生7.4T的数据，跑一次任务需要一两个小时，是日志性数据，也许可以利用老师的讲解稍微优化一下。




金hb.Ryan 冷空氣...

2019-09-19

请问hot warm架构会介绍么

作者回复: 有介绍的




飞飞

2019-09-09

请教老师，我们的项目上单表已经达到6t，目前是250多个分片，有什么好的机制能实现更快的数据入库么?

作者回复: 数据入库如果为了提高写性能，可以参考提高写性能一节。总体来说可以通过修改refresh和translog，牺牲查询实时性和数据稳定性提高tps。

单表数据6t 如果要写入索引，如果是时间序列数据，可以建立timebase的index。如果不是，可以考虑按照字段进行划分索引，例如按照订单的地区，cn，us，划分不同的索引。然后，当然索引得主分片，确保单个分片的尺寸在30g以下

 1

