news 2026/4/23 9:53:46

gops 工具在 Cilium 中的应用指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
gops 工具在 Cilium 中的应用指南

目录

  • gops 工具在 Cilium 中的应用指南
    • 什么是 gops?
    • Cilium 环境中的 gops 实战演示
      • 场景 1: 列出所有 Go 进程
      • 场景 2: 获取进程统计信息
      • 场景 3: 查看内存统计
      • 场景 4: 检查 Goroutine 泄漏
    • Cilium 诊断实战
      • 当前节点 (qfusion2 / .148) 状态
      • 节点对比分析
    • 使用 Prometheus 替代 gops
    • 问题诊断流程
    • 结论
    • 参考链接

gops 工具在 Cilium 中的应用指南

什么是 gops?

gops=Go pprof,Go 语言官方的诊断工具,用于分析运行中的 Go 程序。

安装: go install github.com/google/gops@latest

Cilium 环境中的 gops 实战演示

场景 1: 列出所有 Go 进程

# 使用 gops$ gops983go-test-ci* go1.13.4 /usr/local/bin/go-test-ci52153gops go1.12 /Users/user/go/bin/gops# 在 Linux 上模拟 gops$psaux|grep-E"cilium|etcd|kube-apiserver"|grep-vgreproot1293553.50.5cilium-agent --config-dir=/tmp/cilium/config-map root282783312.20.7etcd --advertise-client-urls=https://... root282837031.25.2kube-apiserver --advertise-address=...

场景 2: 获取进程统计信息

# 使用 gops$ gops stats129355goroutines:32OS threads:32GOMAXPROCS:16# 模拟 gops stats$cat/proc/129355/status|grepThreads Threads:32$ps-p129355-o pid,comm,pcpu,pmem,etime PID COMMAND %CPU %MEM ELAPSED129355cilium-agent3.50.523:47:25

场景 3: 查看内存统计

# 使用 gops$ gops memstats129355alloc:1234567bytes total-alloc:987654321bytes sys:12345678bytes lookups:1234mallocs:56789frees:44444heap-live:1234567bytes# 模拟 gops memstats$cat/proc/129355/status|grep-E"Vm(RSS|Size|Data)"VmSize:934700kB VmRSS:162020kB VmData:211628kB

场景 4: 检查 Goroutine 泄漏

# 正常状态Threads:32✅ 正常(<50)# 警告状态Threads:150⚠️ 轻度增高(50-200)# 异常状态Threads:500❌ Goroutine 泄漏(>200)

Cilium 诊断实战

当前节点 (qfusion2 / .148) 状态

=== Cilium Agent 状态 === PID: 129355 运行时间: 23:47:25 CPU: 3.5% 内存: 162 MB (RSS) Threads: 32 文件描述符: 148 Hubble: 4095/4095 (100%) ⚠️ Flows/s: 186.74

节点对比分析

节点PodsThreads内存Hubble状态
qfusion153--4095/4095 (100%)队列满
qfusion2932162MB4095/4095 (100%)队列满
qfusion352--4095/4095 (100%)队列满

使用 Prometheus 替代 gops

由于 Cilium 默认不暴露 gops 端点,使用 Prometheus metrics:

# 获取运行指标$curlhttp://127.0.0.1:9962/metrics|grep-E"goroutine|gc_duration|memory"# 诊断命令$ kubectlexec-n kube-system cilium-xxx -- cilium status verbose $ kubectl logs -n kube-system cilium-xxx --tail=100

问题诊断流程

1. 发现问题: CPU 高 ↓ 2. 使用 gops/gops.sh 定位进程 ↓ 3. 检查 Threads/Goroutines 数量 ↓ 4. 检查内存使用情况 ↓ 5. 检查文件描述符 ↓ 6. 检查 Hubble 队列状态 ↓ 7. 使用 Prometheus metrics 确认 ↓ 8. 定位根本原因并解决

结论

  1. gops 是强大的 Go 诊断工具,但需要程序支持
  2. Cilium 使用 Prometheus metrics作为主要监控方式
  3. 可以模拟 gops 功能使用 /proc 和 ps 命令
  4. Hubble 队列溢出是导致 CPU 高的主要原因
  5. 解决方法: 增加hubble-event-queue-size参数

参考链接

  • gops GitHub: https://github.com/google/gops
  • Cilium Monitoring: https://docs.cilium.io/en/stable/observability/metrics/
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 9:52:04

刘洋洋《爱在照亮》温暖上线 解锁平凡日常里的爱的模样

刘洋洋《爱在照亮》的封面2026 年 1 月 25 日&#xff0c;歌手刘洋洋全新治愈单曲《爱在照亮》正式全平台上线。这首以 “发现爱、守护爱” 为核心的作品&#xff0c;将视角聚焦于生活里那些被匆忙忽略的细碎温暖&#xff0c;用温柔的旋律与走心的歌词&#xff0c;勾勒出藏在日…

作者头像 李华
网站建设 2026/4/15 20:56:02

智能井盖安全监测系统的设计与实现

目录智能井盖安全监测系统的设计原理系统硬件组成软件架构设计关键技术实现典型应用场景系统优势特点源码文档获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;智能井盖安全监测系统的设计原理 智能井盖安全监测系统通过物联网技术实时监控井盖状…

作者头像 李华
网站建设 2026/4/23 9:52:11

基于传统材料力学势能法的健康齿轮时变啮合刚度数值分析

一、核心结论 传统材料力学势能法是计算健康齿轮时变啮合刚度的经典方法&#xff0c;通过将轮齿简化为变截面悬臂梁&#xff0c;考虑弯曲、剪切、轴向压缩、赫兹接触及基体变形等能量分量&#xff0c;能够准确反映齿轮啮合过程中的刚度变化。该方法具有计算效率高、精度满足工…

作者头像 李华
网站建设 2026/4/10 7:50:28

Simulink双Y-30度六相感应电机模型,matlab18B版本。 六相交流供电

Simulink双Y-30度六相感应电机模型&#xff0c;matlab18B版本。 六相交流供电&#xff0c;做六相电机容错、多自由度控制以及本体设计的同学能用得上&#xff0c;六相感应电机模型电机工作原理参考文献等相关资料 最近在实验室折腾六相感应电机控制&#xff0c;发现Matlab 201…

作者头像 李华
网站建设 2026/4/16 14:14:18

基于MATLAB的TERCOM算法实现与优化

一、TERCOM算法核心流程 TERCOM&#xff08;地形轮廓匹配&#xff09;算法在MATLAB中的实现可分为以下步骤&#xff1a;地形数据预处理加载数字高程模型&#xff08;DEM&#xff09;&#xff0c;生成高斯加权窗口构建地形特征矩阵&#xff08;高度、粗糙度、坡度等&#xff09;…

作者头像 李华