news 2026/6/22 10:21:55

夜莺监控设计思考(二)边缘机房架构思考

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
夜莺监控设计思考(二)边缘机房架构思考

一篇我们遗留了一个话题,就是如果贵司有多个数据中心,而且数据中心之间网络链路较差,此时应该怎么办?

夜莺边缘架构模式

举个例子,假设有北京、上海、美东三个数据中心,北京和上海之间有良好的专线打通,而美东和国内网络链路较差。

北京、上海、美东三地均部署了服务,指标和日志都选择落在本地,而非传输到中心。假设指标使用 VictoriaMetrics 存储,日志使用 ElasticSearch 存储,整体示例如下:

image

北京、上海机房既然网络链路很好,姑且可以看做是同一个机房,用一套夜莺统一处理,比如就把夜莺部署在北京机房,让夜莺读取北京、上海的数据源,做告警判定。那美东呢?让北京机房的夜莺读取美东的数据源做告警是不行的,因为网络链路不好,经常超时。

告警判定是周期性的,比如15秒一次,很频繁,我们需要确保查询时网络链路是好的,最佳实践就是把告警引擎直接部署到美东,这样本机房查询,就没问题了。

所以,夜莺引入了边缘机房部署架构。可以把告警引擎抽离出来作为一个单独的模块,部署到美东。这个模块可以从中心端夜莺同步告警规则,把告警规则存在内存里,然后查询本地数据源的数据,做告警判定。

架构示意图:

image

夜莺中心端的进程叫 n9e,n9e 是 nightingale 的缩写,边缘机房(这里是指美东机房)单独部署了一个 n9e-edge 进程。

n9e-edge 进程要连中心端的 n9e,所以你在 n9e-edge 的配置文件里,需要指定 n9e 的 HTTP 地址和认证信息(如需)。

如果美东和北京的网络临时中断了,影响也不大,美东的 n9e-edge 没法从北京的 n9e 同步告警规则了,不算太大的问题。另外 n9e-edge 产生的告警事件没法写到中心数据库了,所以你在页面上没法看到相关的告警事件,但只要美东的外网出口没问题,n9e-edge 产生的告警事件还是可以推送出去的,因为告警媒介都是走的外网,比如钉钉、企微、Slack,都是外网 SaaS 服务。

预告

本篇先到这里。下一篇预告:夜莺没有自研时序存储,却又提供了 agent,有点拧巴,到底是为啥?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 15:06:06

从零开始:如何用 C# 开发一款媲美 “AnyTxt” 的文件内容搜索工具

起文件内容搜索工具,那么不得不提到“AnyTxt”,号称本地知识库检索的终极答案。唯一的不足可能就是索引更新机制,不能实时监视文件更改从而更新索引,最小定期更新间隔为半小时,容易导致cpu占用率高,毕竟是全…

作者头像 李华
网站建设 2026/6/22 0:45:36

传统代理配置 vs AI生成:GitHub访问效率提升300%

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 生成一个性能对比测试工具,比较不同GitHub代理方案的效率。要求:1. 测试直连、手动配置代理和AI生成代理三种方式 2. 测量连接建立时间、下载速度和稳定性 3…

作者头像 李华
网站建设 2026/6/13 1:34:45

5分钟用ThrottleStop验证CPU超频潜力

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个快速测试工具,只需点击一次即可自动运行ThrottleStop基础性能测试。工具应自动检测CPU型号,应用安全范围内的测试参数,在5分钟内完成稳定…

作者头像 李华
网站建设 2026/6/19 16:58:39

ESP32 CMakeLists.txt 配置实例分析

ESP32 CMakeLists.txt 配置实例分析项目结构my_iot_project/ ├── main/ │ ├── CMakeLists.txt │ ├── main.c │ └── component.mk ├── components/ │ ├── led_driver/ │ │ ├── CMakeLists.txt │ │ ├── include/ │ │ │ …

作者头像 李华
网站建设 2026/6/18 17:06:50

如何用AI自动修复SQL子查询返回多行错误

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个SQL调试助手,能够自动检测Subquery returns more than 1 row错误。功能包括:1) 分析输入的SQL查询语句 2) 识别可能导致多行返回的子查询 3) 提供三…

作者头像 李华
网站建设 2026/6/21 13:38:16

5分钟掌握朴素贝叶斯:机器学习分类的终极入门指南

5分钟掌握朴素贝叶斯:机器学习分类的终极入门指南 【免费下载链接】朴素贝叶斯算法.ppt分享 在人工智能和机器学习的广阔天地里,**朴素贝叶斯算法**占据着不可小觑的地位。作为一种基于概率论的分类方法,它以贝叶斯定理为基础,以其…

作者头像 李华