Prometheus监控神器-Alertmanager篇(六)
本章主要对介绍什么是 Silences , 在哪些场景中使用、以及如何设置 警报临时静默 Silences。
静默 Silences 是指让通过设置让警报在指定时间暂时不会发送警报的一种方式。通常静默一般用于解决严重生产故障问题时,因所花费的时间过长,通过静默设置避免接收到过多的无用通知。在已知的例行维护中,为了防止对例行维护的机器发送不必要的警报,可以在 维护期间设置一个时间范围,临时关闭警报发送,等待维护完成,在将静默关闭,另外主要下自己的时区,这里使用的是UTC时间做的测试。
设置 Silences的方式有俩种,一直是通过 WEB UI 配置,一种是通过 amtool 工具在命令行进行设置。
silences-create
Silences 创建信息描述:
通过上面的描述其实可以很容易知道需要制定的参数信息,当输入完成后,直接点击create创建即可,此时去触发警报就会发现,警报不会在通知,下面是已创建好的Silences信息。
silences-create
这个时候我们可以使用 service process_exporter stop 来触发警报,查看静默是否生效,在浏览器我们可以看到,触发的警报已经出现在我们创建的 Silences 中了。
silences-action
这个时候我们可以假设维护,并没有完成,用 Expire 来模拟维护时间达到,然后在 Alerts 中我就可以看到警报了,相关的通知会发送到对应的Receiver中。
silences-expire
silences-expire
silences-expire
欢迎大家关注我的公众号ID:k8stech
文章转自公众号:Kubernetes技术栈