Elasticsearch(Elastic)开源搜索与分析

2020-05-29 00:00:00 分析 分布式 开源 搜索引擎 实时

Elasticsearch 是一个分布式的 RESTful 搜索和分析引擎,可用来集中存储您的数据,以便您对形形色色、规模不一的数据进行搜索、索引和分析。

ElasticSearch 是构建在Apache Lucene 之上的开源(Apache v2)、分布式、RESTful 的搜索引擎。

Elasticsearch 和 Apache Solr 是流行的企业搜索引擎,都基于Apache Lucene。

Elasticsearch 不仅仅是 Lucene,并且也不仅仅只是一个全文搜索引擎。 它还是:

  • 一个分布式的实时文档存储,每个字段可以被索引与搜索
  • 一个分布式实时分析搜索引擎
  • 能胜任上百个服务节点的扩展,并支持 PB 级别的结构化或者非结构化数据

Elasticsearch 的前生是 Compass。当时,开发者 Shay 获得了一份工作,主要是高性能,分布式环境下的内存数据网格。这个对于高性能,实时,分布式搜索引擎的需求尤为突出,他决定重写 Compass,把它变为一个独立的服务并取名 Elasticsearch。

GitHub使用 Elasticsearch 搜索超过20 TB的数据——包括13亿文件和1300亿行代码,而且这个数字还在疯狂的增加。 基于 Elasticsearch 的通用搜索是蚂蚁内部大的搜索产品,目前拥有上万亿文档,服务了上百个业务方。而通用搜索的发展主要分为两个阶段:平台化和中台化。

elasticgithub.com

相关文章