大庆建设大厦网站,室内设计效果图的网站,wordpress中的类,上海龙腾vs山东鲁能目录 1、面试官#xff1a;Kafka是如何保证消息不丢失 2、面试官#xff1a;Kafka中消息的重复消费问题如何解决的 3、面试官#xff1a;Kafka是如何保证消费的顺序性 4、面试官#xff1a;Kafka的高可用机制有了解过嘛 5、面试官#xff1a;解释一下复制机制中的ISR 6、面… 目录 1、面试官Kafka是如何保证消息不丢失 2、面试官Kafka中消息的重复消费问题如何解决的 3、面试官Kafka是如何保证消费的顺序性 4、面试官Kafka的高可用机制有了解过嘛 5、面试官解释一下复制机制中的ISR 6、面试官Kafka数据清理机制了解过嘛 7、面试官Kafka中实现高性能的设计有了解过嘛 1、面试官Kafka是如何保证消息不丢失 候选人 嗯这个保证机制很多在发送消息到消费者接收消息在每个阶段都有可能会丢失消息所以我们解决的话也是从多个方面考虑 第一个是生产者发送消息的时候可以使用异步回调发送如果消息发送失败我们可以通过回调获取失败后的消息信息可以考虑重试或记录日志后边再做补偿都是可以的。同时在生产者这边还可以设置消息重试有的时候是由于网络抖动的原因导致发送不成功就可以使用重试机制来解决 第二个在broker中消息有可能会丢失我们可以通过kafka的复制机制来确保消息不丢失在生产者发送消息的时候可以设置一个acks就是确认机制。我们可以设置参数为all这样的话当生产者发送消息到了分区之后不仅仅只在leader分区保存确认在follwer分区也会保存确认只有当所有的副本都保存确认以后才算是成功发送了消息所以这样设置就很大程度了保证了消息不会在broker丢失 第三个有可能是在消费者端丢失消息kafka消费消息都是按照offset进行标记消费的消费者默认是自动按期提交已经消费的偏移量默认是每隔5s提交一次如果出现重平衡的情况可能会重复消费或丢失数据。我们一般都会禁用掉自动提价偏移量改为手动提交当消费成功以后再报告给broker消费的位置这样就可以避免消息丢失和重复消费了 2、面试官Kafka中消息的重复消费问题如何解决的 候选人 kafka消费消息都是按照offset进行标记消费的消费者默认是自动按期提交已经消费的偏移量默认是每隔5s提交一次如果出现重平衡的情况可能会重复消费或丢失数据。我们一般都会禁用掉自动提价偏移量改为手动提交当消费成功以后再报告给broker消费的位置这样就可以避免消息丢失和重复消费了 为了消息的幂等我们也可以设置唯一主键来进行区分或者是加锁数据库的锁或者是redis分布式锁都能解决幂等的问题 3、面试官Kafka是如何保证消费的顺序性 候选人 kafka默认存储和消费消息是不能保证顺序性的因为一个topic数据可能存储在不同的分区中每个分区都有一个按照顺序的存储的偏移量如果消费者关联了多个分区不能保证顺序性 如果有这样的需求的话我们是可以解决的把消息都存储同一个分区下就行了有两种方式都可以进行设置第一个是发送消息时指定分区号第二个是发送消息时按照相同的业务设置相同的key因为默认情况下分区也是通过key的hashcode值来选择分区的hash值如果一样的话分区肯定也是一样的 4、面试官Kafka的高可用机制有了解过嘛 候选人 嗯主要是有两个层面第一个是集群第二个是提供了复制机制 kafka集群指的是由多个broker实例组成即使某一台宕机也不耽误其他broker继续对外提供服务 复制机制是可以保证kafka的高可用的一个topic有多个分区每个分区有多个副本有一个leader其余的是follower副本存储在不同的broker中所有的分区副本的内容是都是相同的如果leader发生故障时会自动将其中一个follower提升为leader保证了系统的容错性、高可用性 5、面试官解释一下复制机制中的ISR 候选人 ISR的意思是in-sync replica就是需要同步复制保存的follower 其中分区副本有很多的follower分为了两类一个是ISR与leader副本同步保存数据另外一个普通的副本是异步同步数据当leader挂掉之后会优先从ISR副本列表中选取一个作为leader因为ISR是同步保存数据数据更加的完整一些所以优先选择ISR副本列表 6、面试官Kafka数据清理机制了解过嘛 候选人 嗯了解过~~ Kafka中topic的数据存储在分区上分区如果文件过大会分段存储segment 每个分段都在磁盘上以索引(xxxx.index)和日志文件(xxxx.log)的形式存储这样分段的好处是第一能够减少单个文件内容的大小查找数据方便第二方便kafka进行日志清理。 在kafka中提供了两个日志的清理策略 第一根据消息的保留时间当消息保存的时间超过了指定的时间就会触发清理默认是168小时 7天 第二是根据topic存储的数据大小当topic所占的日志文件大小大于一定的阈值则开始删除最久的消息。这个默认是关闭的 这两个策略都可以通过kafka的broker中的配置文件进行设置 7、面试官Kafka中实现高性能的设计有了解过嘛 候选人 Kafka 高性能是多方面协同的结果包括宏观架构、分布式存储、ISR 数据同步、以及高效的利用磁盘、操作系统特性等。主要体现有这么几点 消息分区不受单台服务器的限制可以不受限的处理更多的数据 顺序读写磁盘顺序读写提升读写效率 页缓存把磁盘中的数据缓存到内存中把对磁盘的访问变为对内存的访问 零拷贝减少上下文切换及数据拷贝 消息压缩减少磁盘IO和网络IO 分批发送将消息打包批量发送减少网络开销