快速网站空间,网站建设公司外包,网站建设结论,新网企业邮箱本文主要是介绍 ElasticSearch 的文档增删改查和批量操作#xff0c;同时会介绍一些 REST API 返回状态码的具体含义。
我们先来看下这个表#xff1a; 这个表包含了 Index、Create、Read、Update、Delete 这五种方法#xff0c;我们先来看下 CRUD 操作的 HTTP 请求都长什么…本文主要是介绍 ElasticSearch 的文档增删改查和批量操作同时会介绍一些 REST API 返回状态码的具体含义。
我们先来看下这个表 这个表包含了 Index、Create、Read、Update、Delete 这五种方法我们先来看下 CRUD 操作的 HTTP 请求都长什么样子
首先是提供一个 HTTP 的 method后面是索引名字在 7.0 之后所以的 Type 都用 _doc 表示后面是文档 id。
再简单了解了 CURD 操作的 HTTP 请求后那么让我们先来了解下如何创建文档
1 创建文档 Create 支持两种方式一种是指定文档 id 创建文档像上面这张图就是另一种是通过调用 post /users/_doc 去让 ES 自动生成文档 id。 自己指定文档 id创建文档需要考虑 id 的均衡性避免产生分配不均衡的问题。ES 的 hash 函数会确保文档 id 被均匀分配到不同的分片。 当我们执行刚才的命令可以返回如下结果 其中 _version 每一次操作都会 1它是一个锁的机制当并行修改文档的时候更新的版本号比文档当前的版本号小时就会报错不允许做修改。
创建文档时如果索引不存在ES 会自动创建对应的 index 和 type。
接下来看下另一种创建文档的方式不指定 id 创建文档HTTP 请求也变为了 POST具体的请求如下 返回的结果如下 Index 和 Create 区别为如果文档不存在就索引新的文档否则现有文档就会被删除新的文档被索引版本信息 _version 1。
2 查询文档
Get 方法比较简单只需要 Get 索引名称/_doc/文档 id通过执行这个命令就可以知道文档的具体信息了。 当执行这条语句后会返回 HTTP 200具体返回结果如下 其中 _index 为索引_type 为类型_id 为文档 id_version 为版本信息_source 存储了文档的完整原始数据。
当查询的文档 id 不存在的时候会返回 HTTP 404且 found 为 false具体结果如下 2 更新文档
Update 方法采用 HTTP POST在请求体中必须指明 doc在把具体文档提供在 HTTP 的 body 里。Update 和 Index 方法不同Update 方法不会删除原来的文档而是实现真正的数据更新。
比如在原来的文档 id 为 1 的文档上增加字段具体请求如下 执行后版本信息 _version 1让我们再去查询下该文档 可以看到新增字段已经成功了。
3 删除文档
Delete 方法也很简单Delete 索引名称/_doc/文档 id 就可以了在这里就不再做代码演示了。
在介绍完文档的基本 CRUD 操作后让我们来看看批量操作吧
4 Bulk API
在一个 REST 请求中重新建立网络开销是十分损耗性能的因此 ES 提供 Bulk API支持在一次 API 调用中对不同的索引进行操作从而减少网络传输开销提升写入速率。
它支持 Index、Create、Update、Delete 四种类型操作可以在 URI 中指定索引也可以在请求的方法体中进行。
同时多条操作中如果其中有一条失败也不会影响其他的操作并且返回的结果包括每一条操作执行的结果。
比如输入如下代码 当我们执行命令后结果如下 took 表示消耗了 93 毫秒errors 为 true 表示在这些操作中错误发生发现是 update 操作发生了错误id 为 2 的文档不存在所以报错了。
在使用 Bulk API 的时候当 errors 为 true 时需要把错误的操作修改掉防止存到 ES 的数据有缺失。
5 批量查询文档
批量查询需要指明要查询文档的 id可以在一个 _mget 操作里查询不同索引的数据可以减少网络连接所产生的开销提高性能。
下面我们来实际操作下输入以下代码执行就可以得到文档 id 为 1,3 的数据。 运行结果如下 在介绍完文档的一些操作最后让我们看下 REST API 常见错误返回有哪些吧
6 REST API 常见错误返回
刚才在演示中当查询文档 id 不存在的时候就会报 404 错误而且 ES 还有各种各样的返回下面通过一个表格了解下 7 总结
本文主要介绍了文档的 CRUD 操作还有 Bulk API、_mget API这些批量操作可以提高 API 调用性能但是不要一次发送过多数据也有可能会对 ES 集群产生过大的压力导致性能有所下降。一般建议是 1000-5000 个文档如果你的文档很大可以适当减少队列大小建议是 5-15 MB默认不能超过 100 M。