news 2026/4/23 17:08:12

Kafka消费者消费失败问题的深度解码与治理实践

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Kafka消费者消费失败问题的深度解码与治理实践

一、背景

kafka消息总量10亿/天,每分钟生成70万条消息,生成环境部署了12个服务,消费2个Topic,每个Topic部署12个分区

二、现象问题

  • 消费者方面

1、单个服务,同时消费2个不同Topic的2个分区,一个分区消费正常,一个分区停止消费,异常分区的Lag出现积压,出现异常没有时间规律。

2、消费者的配置参数,如下图

  • kafka服务器方面

1、查询消费组状态,发现Topic的分区4发生积压

2、在此期间,kafka、zk的集群状态正常,服务端日志无相关报错信息

3、积压恢复后相关日志排查,发现消费者ID(consumer-3-5b6d2a-6989-377409)在过程中无法继续发送心跳,被判断为消费者已经下线,从该消费组中移除。如果消费者下线一段时间后,在这期间没有其他消费者从该分区中消费消息,那Lag将发生积压。

三、排查思路和过程

1、查看资料,消费者配置参数(max.poll.interval.ms)设置为10分钟,此参数的作用定义了消费者处理单个调用poll()方法的最大时间,如果在此时间内未调用poll(),则kafka服务器会认为消费者已经死亡,并将其标记为离线,同时触发rebalance,将分区进行重新分配,但是实际情况是kakfa服务器没有出发rebalance,造成分区没有被其他正常消费者继续消费,最终导致分区消息积压。

四、分析总结

1、经过不断尝试验证,以及出问题前后时间节点上,各个方面的调整分析,最后初步判断是kafka服务器版本升级后,不兼容springboot kafka clietn版本导致,于是升级将spring-kafka从2.3.7升级到2.4.1,同时建kafka-clients升级到2.4.1,问题解决。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 16:09:02

LLaMA-Factory 推理全攻略:从配置到实战优化

LLaMA-Factory 推理全链路实战:从配置到部署的工程化指南 在大模型应用日益深入业务场景的今天,如何快速、稳定地将一个预训练模型转化为可用的服务,已经成为开发者的核心能力之一。面对动辄几十亿参数的模型,传统“加载—推理—输…

作者头像 李华
网站建设 2026/4/23 14:07:48

LangFlow + GPU算力加速:打造高性能AI流水线

LangFlow GPU算力加速:打造高性能AI流水线 在大语言模型(LLM)日益渗透到智能客服、知识问答、内容生成等核心业务场景的今天,如何快速构建可调试、可复用的AI应用,已成为研发团队面临的关键挑战。传统开发模式依赖大量…

作者头像 李华
网站建设 2026/4/23 10:41:47

USB设备厂商与产品ID大全(2018年更新)

USB设备厂商与产品ID大全&#xff08;2018年更新&#xff09; # # List of USB IDs # # Maintained by Stephen J. Gowdy <linux.usb.idsgmail.com> # If you have any new entries, please submit them via # http://www.linux-usb.org/usb-ids.html # o…

作者头像 李华
网站建设 2026/4/23 13:36:59

C/C++“智慧药房”叫号大屏系统[2025-12-16]

C/C“智慧药房”叫号大屏系统[2025-12-16] 题目7 “智慧药房”叫号大屏系统 问题描述&#xff1a;某中医院的药方&#xff0c;传统人工叫号易出现漏号、过号、处理混乱、排队人数不透明等问题&#xff0c;导致患者取药等待体验差&#xff0c;药房工作效率低下。为了提升药房配…

作者头像 李华
网站建设 2026/4/23 13:30:14

C++Bank Deposit System (银行存款系统)[2025-12-16]

CBank Deposit System (银行存款系统)[2025-12-16] &#x1f3af; 作业基本要求 项目名称&#xff1a; Bank Deposit System (银行存款系统) 文件名称&#xff1a; BDS.cpp Due Date&#xff1a; 2025年12月1日 23:59 小组规模&#xff1a; 5-6人 &#x1f4cb; 必须实现的…

作者头像 李华
网站建设 2026/4/23 12:08:14

Qwen-Image-Edit-2509:Docker一键部署图像编辑AI

Qwen-Image-Edit-2509&#xff1a;Docker一键部署图像编辑AI 你有没有经历过这样的“修图地狱”&#xff1f;运营临时通知&#xff1a;“今晚8点直播&#xff0c;所有商品图的‘现货速发’要改成‘限量抢购’。”设计师手忙脚乱地打开PS&#xff0c;一张张改文案、调字体、对齐…

作者头像 李华