[11]elasticsearch源码深入分析——文档(document)的落地

2022-01-20 00:00:00 索引 创建 字段 文档 类型

本篇为elasticsearch源码分析系列文章的第十一篇,本篇开始进入索引有关操作的讲解。以后的若干篇我们会连续讨论文档的创建,检索,更新,删除,版本控制等一系列内容。

文档

ElasticSearch存储系统中的实体叫做文档,document。如果用关系型数据库来类比的话,一个文档相当于数据库中的一行记录。ElasticSearch中的文档有个特点,相同字段必须是相同的类型,也就是说所有包含title字段的文档,title字段类型都必须一样,要么同为string,要么同为int。

文档由多个字段组成,每个字段的类型可以是,文本,数值,日期,还可以是字符串数组这种复杂的类型。字段类型在ElasticSearch中非常重要,它涉及到各种分析和排序操作如何被执行的信息。Elastic官方推荐我们使用Mapping映射来干预字段的类型。与关系型数据库不同,ElasticSearch不需要有固定的结构,每个文档可以有不同的字段,此外,在程序开发期间,不必确定有哪些字段。

文档的类型

在ElasticSearch中,文档类型可以让程序员轻松的区分单个索引中的不同对象。每个文档可以有不同的结构,但在实际生产环境中我们还是推荐将文档中的类型详细化,这样对以后的开发会有很大的帮助。

文档类型的映射

上面提到的映射,指的是ElasticSearch在映射中存储有关字段的信息,这种类型信息就是映射Mapping。每个文档类型都有自己的映射,即使在初始化时没有提前定义。在涉及到全文搜索和倒排索引的内容中,会有对文档分析的过程,在这个过程中每个字段都必须根据不同类型作相应的分析。举例来说,对数值字段和文本字段的分析肯定是不同的分析过程,数字的分析就不应该是按照字母的排序来分析。

使用ElasticSearch的ResultAPI来新建文档

在ElasticSearch中,所有文档都是数据,所有数据都有定义好的索引和类型。现在我们通过一个比较常见的例子来建立文档:

相关文章