news 2026/6/11 3:19:52

从148Mpps跌到35Mpps:一次未知单播风暴引发的软件交换机性能雪崩

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
从148Mpps跌到35Mpps:一次未知单播风暴引发的软件交换机性能雪崩

一、故障背景

某运营商城域网部署了一套基于DPDK实现的软件交换机集群。

系统承担:

  • 二层交换
  • VLAN转发
  • VXLAN接入网关
  • EVPN接入
  • 用户汇聚

硬件配置如下:

项目配置
CPUIntel Xeon Gold 6338
Socket2
Core64
网卡ConnectX-6 Dx 100G
DPDK23.11
Hugepage1G

系统设计目标:

64B: 148.8Mpps 100G Line Rate

上线半年运行稳定。

某天凌晨,NOC监控告警:

用户时延升高 业务抖动 丢包增加

二、故障现象

监控数据显示:

RX PPS 148Mpps TX PPS 35Mpps

大量报文未能正常转发。

然而查看交换机资源:

show cpu

结果:

PMD-0 100% PMD-1 100% PMD-2 100% ... PMD-31 100%

全部CPU满载。

查看网卡状态:

show interface statistics

结果:

RX CRC Error 0 RX Missed Error 0 RX No Buffer 0 TX Error 0

全部正常。


此时故障变得非常诡异。

因为:

CPU正常工作 NIC正常工作 链路正常工作

但性能却下降了超过75%。


三、第一步:排除DPDK常见性能问题

很多DPDK工程师第一反应会想到:

  • NUMA错误
  • Cache Miss
  • Ring竞争
  • RSS不均衡

因为这些是最常见的性能瓶颈。

首先检查RSS。

统计各队列流量:

show port rss

结果:

Queue0 4.5Mpps Queue1 4.6Mpps Queue2 4.4Mpps ... Queue31 4.5Mpps

负载均衡。

排除RSS倾斜。


继续检查NUMA。

查看:

lspci -vv

确认:

NIC NUMA Node 0

线程绑定:

taskset

确认:

RX PMD Worker TX PMD 全部位于Node0

没有跨NUMA访问。


继续查看:

perf stat

结果:

IPC 2.1 Cache Miss 3.4%

非常健康。

说明:

这次故障不是传统DPDK性能问题。


四、发现异常统计

进一步查看交换机内部统计:

show l2 statistics

结果:

FDB Hit Rate 31%</
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/11 3:14:03

双向耦合机制在家庭环境合成数据生成中的应用

1. 项目概述&#xff1a;双向耦合的家庭环境合成数据生成框架 在智能家居和家庭服务机器人领域&#xff0c;我们长期面临一个根本性挑战&#xff1a;如何获取足够多样化的训练数据来模拟真实家庭环境中复杂的人机交互场景。传统方法往往将环境生成与人类行为建模割裂处理&#…

作者头像 李华
网站建设 2026/6/11 3:12:51

072、局部色调映射:直方图均衡、CLAHE 与 Retinex 在移动端的工程对比

072、局部色调映射:直方图均衡、CLAHE 与 Retinex 在移动端的工程对比 一、从一次夜景人像翻车说起 去年Q3,某款中端机型的夜景人像模式在内部评测中被吐槽“人脸像刷了层白漆,背景却黑成一团”。我拿到log一看,ISP pipeline里全局直方图均衡把暗部提得过猛,导致人脸高光…

作者头像 李华
网站建设 2026/6/11 3:10:57

基于51单片基于51单片机的恒温控制自动报警加热系统(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_可以扫码或者私信

基于51单片机的恒温控制自动报警加热系统 摘 要&#xff1a;系统是基于51单片机的恒温控制自动报警加热系统&#xff0c;主要的核心器件是STC89C52单片机。内容有显示控制、主控制器、报警控制、按键输入、温度调节。在基于51单片机的恒温控制自动报警加热系统硬件设计中&…

作者头像 李华
网站建设 2026/6/11 3:09:05

深度解析ViVeTool-GUI:Windows隐藏功能管理的专业技术指南

深度解析ViVeTool-GUI&#xff1a;Windows隐藏功能管理的专业技术指南 【免费下载链接】ViVeTool-GUI Windows Feature Control GUI based on ViVe / ViVeTool 项目地址: https://gitcode.com/gh_mirrors/vi/ViVeTool-GUI ViVeTool-GUI是一个基于ViVeTool开发的Windows功…

作者头像 李华
网站建设 2026/6/11 3:07:27

手把手教你用Python脚本模拟GBT27930-2015国标充电全流程(附BMS测试代码)

用Python实现GBT27930-2015充电协议自动化测试全解析在新能源汽车BMS开发与测试领域&#xff0c;掌握国标充电协议的自动化验证能力已成为工程师的核心竞争力。本文将从一个实战开发者的视角&#xff0c;带你用Python构建完整的GBT27930-2015充电协议模拟系统&#xff0c;涵盖从…

作者头像 李华