news 2026/4/23 13:47:14

用 ClickHouse 实现大数据实时监控

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
用 ClickHouse 实现大数据实时监控

用 ClickHouse 实现大数据实时监控:从0到1搭建高可用系统

引言:为什么传统监控系统解决不了大数据实时问题?

1. 你可能遇到的痛点

做过大数据监控的同学,大概率踩过这些坑:

  • 实时性差:用 Elasticsearch 做实时聚合,当数据量超过10亿条时,date_histogram查1分钟窗口的PV要等5秒以上;
  • 资源瓶颈:用 Spark Streaming 做流处理,为了低延迟要开大量Executor,成本高得离谱;
  • 查询能力弱:用 InfluxDB 存时序数据,复杂查询(比如多维度分组、去重计数)直接“卡崩”;
  • 扩展性差:数据量从100万涨到10亿,原来的架构要全部重构。

比如我之前做过一个电商的用户行为监控系统,初期用 ELK 栈:Beats 采集数据→Kafka→Logstash→Elasticsearch→Kibana。上线3个月后,日活用户从10万涨到500万,Elasticsearch 的查询延迟从200ms变成了8秒,Kibana 仪表盘根本刷不出来——传统架构根本扛不住大数据量的实时查询

2. ClickHouse 为什么能解决这些问题?

ClickHouse 是 Yandex 开源的列式存储数据库,天生为大数据实时分析设计,核心优势正好戳中监控场景的痛点:

  • 列式存储:只读取查询需要的字段,比如查PV只读timestamp字段,比行存快10-100倍;
  • 向量执行引擎:批量处理数据,避免逐行解析的 overhead,聚合速度极快;
  • 实时写入:支持每秒百万级写入,配合 Materialized View 实现流批一体化;
  • 丰富的聚合函数:内置uniq(去重计数)、sumIf(条件求和)、topK(Top N)等监控常用函数;
  • 水平扩展:分布式集群支持PB级数据,查询自动分片并行。

3. 最终效果展示

我们将用 ClickHouse 搭建一个用户行为实时监控系统,最终实现:

  • 实时仪表盘:每秒更新PV、UV、Top 10访问页面、错误率(5xx状态码占比);
  • 多维度下钻:比如按城市、浏览器维度查看UV分布;
  • 历史数据回溯:支持查询7天内任意1分钟的指标;
  • 低延迟:从数据产生到仪表盘更新,端到端延迟≤2秒。

准备工作:环境与工具清单

1. 所需环境与工具

工具/组件版本要求作用说明
ClickHouse≥23.8核心存储与查询引擎
Docker/Docker Compose≥20.10快速部署ClickHouse、Kafka、Grafana等组件
Kafka≥2.8实时数据管道(模拟用户行为数据流入)
Grafana≥10.0可视化仪表盘
Python3≥3.8生成测试数据(模拟用户行为)

2. 前置知识要求

  • 了解 ClickHouse 基本概念(MergeTree引擎、主键、分区键、索引);
  • 熟悉 SQL 语法(分组、聚合、窗口函数);
  • 了解 Kafka 基本使用(Topic、Producer、Consumer)。

如果没接触过 ClickHouse,可以先看官方入门文档:ClickHouse Getting Started。

核心步骤:从0到1搭建实时监控系统

步骤1:用Docker Compose快速部署环境

为了避免繁琐的安装配置,我们用 Docker Compose 一键部署所有组件。

1.1 编写docker-compose.yml
version:'3.8'services:# ClickHouse服务clickhouse:image:clickhouse/clickhouse-server:23.8ports:-"8123:8123"# HTTP接口-"9000:9000"# TCP接口volumes:-./clickhouse/data:/var/lib/clickhouse-./clickhouse/logs:/var/log/clickhouse-serverenvironment:-CLICKHOUSE_USER=default-CLICKHOUSE_PASSWORD=123456-CLICKHOUSE_DEFAULT_ACCESS_MANAGEMENT=1# Kafka服务(用于实时数据流入)kafka:image:wurstmeister/kafka:2.13-2.8.1ports:-"9092:9092"environment:-KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://kafka:9092-KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9092-KAFKA_ZOOKEEPER_CONNECT=zookeeper:2181depends_on:-zookeeper# Zookeeper(Kafka依赖)zookeeper:image:wurstmeister/zookeeper:3.4.6ports:-"2181:2181"# Grafana(可视化)grafana:image:grafana/grafana:10.1.0ports:-"3000:3000"volumes:-./grafana/data:/var/lib/grafanaenvironment:-GF_SECURITY_ADMIN_PASSWORD=admin
1.2 启动服务

docker-compose.yml所在目录执行:

docker-composeup -d

验证服务是否启动成功:

  • ClickHouse:访问http://localhost:8123,输入用户名default、密码123456,显示Ok.则正常;
  • Kafka:进入Kafka容器,创建测试Topicuser_events
    dockerexec-it kafka /bin/sh kafka-topics.sh --create --topic user_events --bootstrap-server kafka:9092 --partitions3--replication-factor1
  • Grafana:访问http://localhost:3000,用用户名admin、密码admin登录。

步骤2:设计实时监控的数据模型

数据模型是实时监控的核心,直接决定写入和查询的性能。我们以用户行为数据为例,设计表结构。

2.1 需求分析:需要监控哪些指标?

用户行为数据的核心字段(根据业务调整):

字段名类型说明
timestampDateTime事件发生时间(精确到秒)
user_idUInt64用户ID(去重计数用)
event_typeString事件类型(点击、浏览、下单)
page_urlString访问页面URL
status_codeUInt16HTTP状态码(判断错误)
cityString用户所在城市
browserString用户浏览器类型
2.2 选择合适的ClickHouse引擎

监控场景需要实时写入快速聚合,推荐用以下两种引擎组合:

  1. ReplacingMergeTree:处理重复数据(比如幂等写入失败导致的重复);
  2. AggregatingMergeTree:预聚合数据,减少实时查询的计算量。
2.3 创建原始数据 table(ReplacingMergeTree)

原始表用于存储未聚合的用户行为数据,后续通过 Materialized View 生成预聚合表。

-- 连接ClickHouse(用clickhouse-client或DBeaver)clickhouse-client--host localhost --port 9000 --user default --password 123456
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 22:39:38

深度测评本科生必用的8个AI论文平台

深度测评本科生必用的8个AI论文平台 2026年本科生论文写作工具测评:如何选择高效实用的AI平台 随着人工智能技术在学术领域的深入应用,越来越多的本科生开始借助AI论文平台提升写作效率与质量。然而,面对市场上琳琅满目的工具,如何…

作者头像 李华
网站建设 2026/4/23 8:19:32

网络安全(黑客)自学篇,一文带你从零基础入门到精通!

网络安全(黑客)自学篇,一文带你从零基础入门到精通! 第一阶段:基础操作入门,学习基础知识 入门的第一步是学习一些当下主流的安全工具课程并配套基础原理的书籍,一般来说这个过程在1个月左右比…

作者头像 李华
网站建设 2026/4/23 9:56:14

【必看收藏】LangGraph智能体开发收官之作:网络架构与Swarm架构实战详解

本文详细介绍了LangGraph多智能体系统的网络架构模式,重点解析了Swarm架构的去中心化特性和动态移交能力。通过代码实战展示了如何使用langgraph-swarm库构建智能体协作网络,并对比了主管架构、分层架构与网络架构的适用场景,为开发者提供了构…

作者头像 李华
网站建设 2026/4/23 12:34:00

带货主播记不住卖点台词?一键提词让直播更专业

在带货直播间,无论是新品推荐、产品测评,还是福利秒杀,流程紧凑、信息量大,对主播的临场记忆和表达提出了极高要求。你是不是经常遇到这些场景——产品卖点说一半突然忘词,话术顺序搞混,直播节奏“翻车”&a…

作者头像 李华
网站建设 2026/4/23 11:18:54

【技术干货】必藏!2025年AI智能体元年:从命令执行到协作解决,全面解析AI智能体的核心技术架构

2025年被称为AI智能体元年,AI智能体正将人机交互从命令执行转向协作式问题解决。与普通AI工作流不同,AI智能体具备推理、规划、工具使用和记忆能力,能通过反思、工具使用、规划和多智能体协作模式处理复杂任务。智能体式工作流具有灵活性强、…

作者头像 李华