简介
架构
术语
- 报警规则: 与Prometheus中的 概念相同。
- 数据源: Prometheus Server的URL,由Rule Engine将报警规则下发至该URL进行计算。
- 报警接收组: 由多个报警接收人组成的组。
- 报警延迟: 报警触发一段时间后才将报警发送给接收人。
- 报警周期: 报警发送的周期。
- 报警计划: 由多条报警策略组成的集合。
- 报警方式: 对于内部用户,可以通过蓝信、短信和电话的方式进行报警。非内部用户可以采用HOOK的方式将报警转发到自定义的Web Server进行处理。
- 报警策略: 一条报警策略包含报警延迟、报警周期、报警时间段、报警接收组、值班组以及报警方式等配置信息。
- 报警确认: 如果需要短时间的暂停报警,可以通过勾选相应报警并填写暂停时长来确认报警。
- 维护组: 如果希望屏蔽一些固定时间段内某些特定机器的报警,可以通过配置报警维护组策略来实现。