生产级K8S监控告警方案分享给你

开发 前端
可能有些人有疑问,说VictoriaMetrics兼容Prometheus,可以完全替换掉Prometheus,是的没错,但是我们已经用了Prometheus,目前没有精力去做迁移,等后期有时间逐步过渡到VictoriaMetrics完全替换掉Prometheus​。

最近一直在搞基于K8S的监控告警平台建设,查找了不少资料,也实验了不少次,目前算是有一定的成果了,分享一下,以下是我们的系统架构。

图片图片

采集端

由于Prometheus的生态过于组件丰富,所以k8s以及Prometheus协议的指标采集这些还是拥抱Prometheus,使用开源的 exporter,虽然现在的exporter 是比较多,但是良莠不齐、有的 Exporter 写的非常棒,有的则并不完善,同时写法各异,每次基础不同的expoter 都要研究一遍配置,心累,所以针对常用的中间件,使用categraf 进行监控,比如 kafka、Mysql、Redis、Mongo等。

存储端

使用VictoriaMetrics作为的Prometheus长期存储,因为他性能足够强悍,占用资源小,并且完全兼容Prometheus,如果指标小于100w/s,可以采用他的单机版本,并且安装到k8s集群外,这样也避免k8s集群出问题,无从下手。

报警配置

由于prometheus的告警配置实在繁琐而且对国内的通讯工具支持度不好,需要第三方实现,所以我们放弃使用 altermanager进行报警,直接采用夜莺进行报警配置,这也是目前业内常用玩法。

图片图片

展现层

由于VictoriaMetrics后兼容 PromQL。我们都可以按照理解的 PromQL 语法来进行查询,所以在 Grafana中配置 Prometheus的数据源时,填入VictoriaMetrics的地址即可。

同时这里VictoriaMetrics数据一部分是prometheus 采集的,一部分是categraf,所以针对categraf采集的,需要自行配置报表,因为可能无法与现有 expoter报表兼容,需要微调,不过这种都是一次性的工作。

图片图片

补充

可能有些人有疑问,说VictoriaMetrics兼容Prometheus,可以完全替换掉Prometheus,是的没错,但是我们已经用了Prometheus,目前没有精力去做迁移,等后期有时间逐步过渡到VictoriaMetrics完全替换掉Prometheus。

责任编辑:武晓燕 来源: 架构成长指南
相关推荐

2023-12-20 08:13:54

K8S监控管理

2022-05-05 07:25:03

Supervisor监控Python

2024-04-09 08:00:00

Kubernetes管理系统云原生

2022-07-29 21:23:54

Grafana微服务

2022-04-22 13:32:01

K8s容器引擎架构

2022-07-28 06:50:52

微服务业务系统

2021-04-29 08:43:17

k8s可观测性Metrics

2021-06-21 08:59:55

监控Netflix优化

2021-06-21 08:30:14

Netflix监控系统微服务

2023-11-06 07:16:22

WasmK8s模块

2019-01-17 08:38:03

Redis监控内存

2024-03-27 14:54:21

KubernetesK8S集群

2023-09-06 08:12:04

k8s云原生

2022-09-13 09:04:20

云计算移动办公大数据

2022-09-14 10:49:30

微服务Kubernetes区块链

2022-03-22 08:52:40

KubernetesCPU内存资源

2023-05-25 21:38:30

2023-08-03 08:36:30

Service服务架构

2023-08-04 08:19:02

2022-07-26 09:34:23

监控系统
点赞
收藏

51CTO技术栈公众号