湖北网站建设贴吧,中文在线 在线,如何把代码放在网站首页教程,洛可可设计公司估值这一篇笔记介绍如何使用 Python 对数据进行更新操作。
对于 es 的更新的操作#xff0c;不用到 Search() 方法#xff0c;而是直接使用 es 的连接加上相应的函数来操作#xff0c;本篇笔记目录如下#xff1a;
获取连接update()update_by_query()批量更新UpdateByQuery()…这一篇笔记介绍如何使用 Python 对数据进行更新操作。
对于 es 的更新的操作不用到 Search() 方法而是直接使用 es 的连接加上相应的函数来操作本篇笔记目录如下
获取连接update()update_by_query()批量更新UpdateByQuery()
1、获取连接
如果使用的是之前的全局创建连接的方式
from elasticsearch_dsl import connections
connections.configure(default{hosts: localhost:9200},
)我们可以根据别名获取相应的连接
conn connections.connections.get_connection(default)或者我们直接使用 elasticsearch.Elasticsearch 模块来重新建立一个连接
from elasticsearch import Elasticsearchconn Elasticsearch(hostslocalhost:9200)前面介绍过我们安装 elasticsearch_dsl 依赖的时候会自动为我们安装上相应的 elasticsearch 模块我们这里直接使用即可。
然后通过 conn 连接可以直接对数据进行更新可用的方法有 update()update_by_query() 以及一个批量的 bulk() 方法。
2、update()
update() 函数一般只用于指定 id 的更新操作如果我们知道一条数据的 id我们可以直接使用 update()。
比如对于 exam 这个 index 下 id18 的数据我们想要更新它的 name 字段和 address 字段分别为 王五和湖南省我们可以如下操作
conn.update(indexexam,id18,body{doc: {name: 王五2,address: 湖南省,}}
)在上面的操作中index 为指定的索引id 参数为我们需要更新的 idbody 内 doc 下的字段即为我们要更新的数据。
3、update_by_query()
update_by_query() 函数不局限于 id 的查询更新我们可以更新任意符合条件的数据以下是一个简单的示例
conn.update_by_query(indexexam,body{query: {term: {name: 张三丰}},script: {source: ctx._source.address params.address,params: {address: 新地址,}}}
)在这里index 参数还是指向对应的索引body 内包含了需要更新查询的条件这里都在 query 参数内需要更新的数据在 script 下通过脚本的形式来操作更新。
这里注意下我这里用到的是 7.6.0 版本所以 script 下使用的 source更低一点版本用的字段可能是 inline这里使用对应版本的参数即可。
在 script.source 中内容为 ctx._source.address params.address意思是将符合条件数据的 address 字段内容更新为 params 的 address 的数据。
如果想要更改其他字段内容注意前面 ctx._source 为固定写法只需要更改后面的字段名即可。
在 script.params 中我们则可以定义各种对应的字段及其内容。
更新多个字段
如果我们想同时更新多个字段比如说符合条件的数据将 address 改为 新地址将 age 字段改为 28我们则需要将多个条件在 script.source 中使用分号 ; 连接起来示例如下
conn.update_by_query(indexexam,body{query: {term: {name: 新张三丰2}},script: {source: ctx._source.address params.address; ctx._source.age params.age,params: {address: 新地址3,age: 28}}}
)虽然这里更新多个字段需要使用分号连接但是在实际的代码中我们不用这么写死比如说我们需要更改三个字段为 [address, name, age]我们如下操作
field_list [address, name, age]
source_list [fctx._source.{key}params.{key} for key in field_list]params {address: 新地址3,age: 28,name: new name
}conn.update_by_query(indexexam,body{query: {term: {name: 新张三丰3}},script: {source: ;.join(source_list),params: params}}
)4、批量更新
如果我们想批量更新一批数据这批数据各个字段的值都不一致自定义的程度很大使用 update_by_query() 函数已经不现实了怎么办
好解决我们可以使用 helpers.bulk() 批量更新方法。
首先引入这个模块
from elasticsearch import helpers假设我们系统里现在有 id 为 212324 的几条数据还是在 exam 这个索引下我们来构造几条需要更新的数据来操作
action_1 {_op_type: update,_index: exam,_id: 21,doc: {age: 19, name: 令狐冲, address: 华山派},
}action_2 {_op_type: update,_index: exam,_id: 23,doc: {age: 20, name: 杨过, address: 终南山},
}action_3 {_op_type: update,_index: exam,_id: 24,doc: {age: 21, name: 张无忌, address: 武当},
}
action_list [action_1, action_2, action_3]
helpers.bulk(conn, actionsaction_list)对于每一条需要更新的数据有这几个参数
_op_type如果是更新操作其值则是 update
_index表示需要更新的数据所在的索引这里是 exam
_id表示这条需要更新的数据的 id
doc是一个 dict 数据其下包含了需要更新的字段及其对应的值
至此一条需要更新的数据的结构就构造完毕了。
然后对于 helpers.bulk() 函数接收的第一个参数为 es 连接actions 参数是一个列表其内容就是我们前面构造的数据的集合。
然后执行这个操作就可以发现 es 中对应的值已经更改了。
5、UpdateByQuery()
UpdateByQuery() 函数来源于 elasticsearch_dsl 模块它的使用和 Search() 方法差不多都是通过 using 和 index 参数来获取 es 连接和索引
from elasticsearch_dsl import connections
from elasticsearch_dsl import UpdateByQuery
from elasticsearch_dsl import Q as ES_Qconnections.configure(default{hosts: localhost:9200},
)ubq UpdateByQuery(usingdefault, indexexam)使用这个方法更新数据的具体语法和 update_by_query 差不多都是通过 script 的方式来操作以下是一个简单示例
ubq UpdateByQuery(usingdefault, indexexam)q1 ES_Q(term, name郭靖)ubq ubq.query(q1)ubq ubq.script(sourcectx._source.addressparams.address,params{address: 襄阳城}
)ubq.execute()与 Search() 函数一样都需要通过 execute() 函数来向 es 提交数据。
原文链接Python连接es笔记三之es更新操作