有网站做淘宝天猫优惠券代理,vi设计怎么做,路由器设置虚拟主机,wordpress注册跳过邮箱验证码前言在集群情况下#xff0c;数据写入可以有写本地表和写分布式表2种方案#xff0c;但是面向集群查询时#xff0c;只能通过Distributed表引擎实现。本文主要介绍分布式查询多副本的路由规则。该配置项为#xff1a;load_balancerandom/nearest_hostname/in_order/first_o…前言在集群情况下数据写入可以有写本地表和写分布式表2种方案但是面向集群查询时只能通过Distributed表引擎实现。本文主要介绍分布式查询多副本的路由规则。该配置项为load_balancerandom/nearest_hostname/in_order/first_or_random一、多副本的路由规则查询数据时如果一个分片shard有多个副本repIica那么Distributed表引擎就需要面对副本选择的问题选择查询究竟在哪个副本上执行。ck的负载均衡算法有以下四种randomnearest_hostnamein_orderfirst_or_randomrandom这是默认的负载均衡算法。在ck的服务节点中有一个errors_count全局计数器当服务发生任何异常时技术器加1。randdom算法会选择errors_count最小的那个repIica如果多个repIica的errors_count相同则在这几个里随机选择一个。nearest_hostname选择errors_count最小的那个如果多个errors_count相同则选择集群配置中host名称和当前host名称最相似的那个。相似比较的规则是与当前host的名称按字节进行逐位对比找到不同字节最少的那个。 例如当前host是a.bc.de那么a.bc.df就比a.bf.hh要更加相似。 a.bc.de a.bc.df a.bf.hhin_order选择errors_count最小的那个如果多个errors_count相同则按照集群配置顺序选择。first_or_random选择errors_count最小的那个如果多个errors_count相同则按照集群配置顺序选择第一个如果第一个不可用则随意选择一个其他的。总结起来其实这4个负载算法中都是优先选择errors_count最小的那个如果多个errors_count相同时再根据不同的负载算法来选择。拓展对于集群的每一个查询errors_count 都会更新一次但 estimated_recovery_time 会根据需求重新计算所以可能会出现这样的情况当 errors_count 非零、estimated_recovery_time 为零时下次查询会把 errors_count 置为零并且尝试使用副本就好像没有错误一样。二、如何设置errors_count确保生效errors_count默认不开启Hedged requests for remote queries. When setting use_hedged_requests enabled (off by default), allow to establish many connections with different replicas for query. New connection is enabled in case existent connection(s) with replica(s) were not established within hedged_connection_timeout or no data was received within receive_data_timeout. Query uses the first connection which send non empty progress packet (or data packet, if allow_changing_replica_until_first_data_packet); other connections are cancelled. Queries with max_parallel_replicas 1 are supported. #19291 (Kruglov Pavel). This allows to significantly reduce tail latencies on very large clusters.翻译远程查询的对冲请求。当将use_hedged_requests设置为启用默认情况下为禁用时允许与不同副本建立多个连接以进行查询。如果在hedged_connection_timeout内未建立与副本的现有连接或在receive_data_timeout中未接收到数据则启用新连接。查询使用发送非空进度包或数据包如果allow_changing_replica_until_first_data_packet的第一个连接其他连接被取消。支持max_paralle_replicas1的查询。这允许在非常大的集群上显著减少尾部延迟。使用场景若将一个CK集群中的某个分片的某个副本停服或者挂起使之处于一个假死状态无法对外提供服务无法接受插入、查询请求等如果未设置use_hedged_requests1还是会有1/副本数 的概率往停服的副本上发送从而导致请求超时报错等问题