全国建筑人才求职招聘网站,免手机微网站,网站的默认首页,北京网站设计制作关键词优化当有消息被生产出来的时候#xff0c;如果没有指定分区或者指定 key #xff0c;那么消费会按照【轮询】的方式均匀地分配到所有可用分区中#xff0c;但不一定按照分区顺序来分配 我们知道#xff0c;在 Kafka 中消费者可以订阅一个或多个主题#xff0c;并被分配一个或多…当有消息被生产出来的时候如果没有指定分区或者指定 key 那么消费会按照【轮询】的方式均匀地分配到所有可用分区中但不一定按照分区顺序来分配 我们知道在 Kafka 中消费者可以订阅一个或多个主题并被分配一个或多个分区 如果一个消费者消费了多个分区某些场景下消费者需要顺序地消费消息但消息并不是按照顺序分配给分区的所以就不一定能够保证消息消费的全局顺序性
比如下图中 Msg0002 消息并不是在 Msg0001 消息之后的就有可能导致消费者先把 Msg0002 消息给消费 Msg0001 消息才被消费 那么这种情况该怎么解决如何尽可能地保证消息消费的全局顺序性即这些消息具有因果关系要想消费消息 B 必须先消费消息 A
要注意的是Kafka 的设计目标是提供高吞吐量和低延迟而不是强制保证全局有序性
所以这篇文章探讨的是需要强调全局顺序性场景下的 Kafka 应用
单分区
最简单粗暴的方法虽然 Kafka 不能保证全局消费顺序性但是能够保证分区内的消息顺序性 所以我们可以只创建一个分区并让消费者消费这个分区这样就能够保证消费的消息是有序的
但是这样做大大降低了吞吐量和处理效率容易使得性能出现瓶颈
基于 key
在 Kafka 中基于 key 的消息分配策略是通过消息中的键key来确定消息发送到哪个分区
当生产者发送消息时可以指定一个键keyKafka 使用这个键通过哈希算法来确定消息被发送到哪个分区 由于相同的 key 就发送到同一分区这样就能够保证了消费的消息是有序的
然而如果只有一个消费者消费相同 key 的消息那么与单分区相比基于 key 的消息分配策略不会提高吞吐量
因为即使相同 key 的消息在多个分区中但同一消费者依然只能从一个分区中消费这并不会增加整体的处理能力。
但如果有多个消费者消费相同 key 的消息基于 key 的分区策略可以提高消费者并行消费的能力 因为这些消费者可以同时从不同分区中读取消息从而增加整体的处理速度。这种情况下基于 key 的消息分配可以提高整体吞吐量
最后总结一下 Kafka 的设计目标是提供高吞吐量和低延迟而不是强制保证全局有序性所以Kafka使用多分区的概念并且只保证单分区有序 如果想要实现消息的全局有序 单分区策略 一个主题下只创建一个分区一个消费者只消费一个分区但这样做毫无并发性可言极大降低系统性能 基于 key 的消息分配策略 由于相同的 key 就发送到同一分区这样就能够保证了消费的消息是有序的。然而如果只有一个消费者消费相同 key 的消息与前面单分区相比没有什么区别