Kafka高水位与日志末端偏移量解析-深圳市維司達科技有限公司

在 Apache Kafka 中，HW（High Watermark，高水位）和LEO（Log End Offset，日志末端偏移量）是两个核心概念，它们共同保障了 Kafka 的数据一致性、可靠性与可见性。理解它们的关系对掌握 Kafka 副本机制至关重要。

概念	含义
LEO（Log End Offset）	表示当前副本（Replica）日志中下一条待写入消息的 offset。即：已有消息的最大 offset + 1。例如 LEO=10 表示已写入 [0, 9] 共 10 条消息。
HW（High Watermark）	表示已被所有 ISR（In-Sync Replicas）副本成功复制的消息的最高 offset。消费者只能消费 offset < HW 的消息，以确保读取的是“已提交”且“多副本一致”的数据。

✅ 简单记忆：
LEO= “我写到哪了”（本地进度）
HW= “大家都确认到哪了”（全局共识）

分区的 HW 就是这些副本 LEO 的最小值。

HW = min(Leader.LEO, Follower1.LEO, Follower2.LEO, ...)

假设一个分区有 3 个副本（1 Leader + 2 Follower），初始状态：

生产者发送消息 offset=0
- Leader 写入，LEO → 1
- Follower 尚未同步 → LEO 仍为 0
- 此时 ISR 中最小 LEO = 0 →HW 保持 0
- 消费者看不到这条消息！
Follower A 和 B 完成同步
- Follower A LEO → 1，Follower B LEO → 1
- ISR 最小 LEO = 1 →HW 更新为 1
- 消费者现在可以消费 offset=0 的消息。

特性	说明
数据可见性控制	HW 决定了消费者能读到哪里，保证“已提交”语义
容错机制	若某个 Follower 落后太多（如网络中断），会被踢出 ISR，不再参与 HW 计算，避免拖慢整体进度
Leader 切换安全	新 Leader 必须截断日志至其 HW（即旧 HW），防止暴露未被确认的数据
HW 更新延迟	HW 通常在 Follower 发起 Fetch 请求时由 Leader 返回并更新，存在一定延迟

Offset: 0 1 2 3 4 5 6 [==== committed ====][-- uncommitted --] ↑ ↑ HW=5 LEO=7

HW 是 Kafka 实现“一致性读”和“高可用”的基石，而 LEO 是每个副本的本地写入进度。HW 由 ISR 中最慢的 LEO 决定，消费者只能看到 HW 之前的数据。

这种设计在性能与一致性之间取得了良好平衡，也是 Kafka 能成为高吞吐、可靠消息系统的关键之一。

xilinx fpga千兆以太网＋ddr内存读写测试代码基于kcu105/kc705平台的10/100/1000m 以太网lwip通信＋ddr4 内存读写测试工程代码在FPGA开发的世界里，实现千兆以太网通信与DDR内存读写功能是许多项目的关键需求。今天，咱们就来聊聊基…

李华

MATLAB环境下基于随机减量技术(RDT)的结构阻尼比识别方法，可用于土木，航空航天，机械等领域。本品为程序，已调通，可直接运行，包含参考文献。最近在振动信号分析中发现个挺有意思的技术——随机减量法&#…

李华

我在小米推了两年的方向，字节用豆包手机助手做出来了张和张和专业讲AI 2025年12月14日 13:12 张和｜前小米 8 年 AI 产品负责人｜现 AI 创业公司创始人 （做过手机 OS 级 AI、也做过自动驾驶数据闭环，更早在小米 AI 实…

李华

在人工智能快速发展的今天，AI Agent（智能体）正在从简单的任务执行工具演变为能够自主学习、持续进化的智能系统。这一转变的核心，在于Agent如何通过记忆机制积累经验，并通过自我强化实现真正的智能突破。一、AI Agen…

李华

第一章：EF Core 查询性能优化概述在现代数据驱动的应用程序中，Entity Framework Core（EF Core）作为主流的ORM框架，极大简化了数据库操作。然而，不当的查询使用方式可能导致严重的性能瓶颈，如N1查…

李华

大模型作为AI新时代的"超级引擎"，其关键技术包括Transformer架构作为基础、预训练与微调模型能力、基于人类反馈的强化学习优化输出、模型压缩技术降低资源需求以及安全隐私保护措施。这些技术协同工作，使大模型在自然语言处理、计算机视觉、医…

李华