理解elasticsearch的分片、副片

2020-06-01 00:00:00 索引 集群 分布式 分片 副本

elasticsearch,曾经的官网是如此定义的:一款近实时的分布式全文索引引擎。可能现在为了更好地宣传,把近去掉了。但新的6.x在性能和插入速度的提升,也引起了广泛关注。

今天个人回顾一下elasticsearch的原理,分片和副本。

既然讲到ES是一款分布式、可拓展引擎,必然离不开它完美的设计,分片便是ES令人折服的设计。

分片作用:1更好的分布式存储、扩展。2高效地平行查询。

对于索引来说,一旦创建完成的索引,主分片不可更改。

加机器并不能解决旧分片的索引效率,索引当集群中某些索引在进行插入、搜索遇到硬件瓶颈时,单纯地加机器无外乎想当然。

副本、副片:es为了更好地稳定性和容灾,除了进行必要的索引备份外,副本的添加可以更好地维持集群数据完整性。当出现某个节点从集群脱离,在集群其他节点的副本,此时会选举出主分片,所以这里就有主分片和副本之间的数据同步问题。

es主分片和副本之间的同步,某人方式是当client请求,增删改时,主分片处理后,将信号并发如各个副本,每个副本完成相应操作后,主分片接受处理完成信号后,向client发送处理结果信息。

那么副本也就和主分片数据实时保证一致,所以副本的作用

1:保证数据完整性,节点出现异常时,充当主分片。

2:优化查询效率,副本的数据和主分片一致,可以充分发挥查询时的效率。

当集群索引出现创建慢、搜索慢时,加机器、加副本并不一定提高查询效率,索引在出现此类问题时,除了在硬件上进行节点的增加,还需要重建索引,重新划分主分片数量,使用别名处理,来替换旧的索引,这样才可以更好地优化性能问题。

相关文章