ElasticSearch 介绍
整体介绍
ElasticSearch,官网上对它的定义为:
Elasticsearch is a distributed, RESTful search and analytics engine capable of solving a growing number of use cases.
说它是一个分布式的,具有Restful编程风格的,可解决不断出现的用例的一个分析搜索引擎。搜索这点大家认识都很深刻,它的分析能力,其实也很强。目前我们这边做过命中量为1.2亿的聚合(简单的聚合统计)运算,时间只需要5s左右。很给力!
它具有以下四个特征:
速度特别快
200亿的数据量,一个查询命中量有210w,只取1w,仅需93ms。可扩展性很好
理论上任何机器都可以,大到高性能服务器,小到普通台式电脑。还是建议统一的配置较好,如果集群中既有ssd,又有普通硬盘,普通硬盘的查询和导入会拉慢整体的性能。弹性很好
如果你的索引都是多备份,即使挂了台节点,系统依然可以正常运行。灵活性很好
支持结构化和非结构化的数据。All data * are welcome.
概念介绍
1、准实时(Near Realtime)
默认情况下,插入的数据1s后可查询,所示称其为准实时系统。
2、集群(Cluster)
由一个或多个节点组成,能保存数据,且所有节点提供索引和搜索功能。
3、节点(Node)
集群的单个server,可存储数据,并提供集群的索引和搜索功能。
- Master 节点:管理集群,向其他节点同步集群状态。
- Data 节点:存储数据的节点。
-
Client节点:为外部提供检索的节点。
相关文章