最近更新时间:2023-01-09
Kafka产品提供了告警功能,您可以指定监控某个指标项,一旦指标项达到预设的阀值,就会发出告警短信或邮件来通知您。
使用限制和指导
目前告警方式支持短信告警和邮件告警。发出告警后,如果告警一直没有消除(即实例的指标项一直处于触发告警规则的值),那您将在下一个小时再次收到告警。
操作步骤
1. 在左侧导航栏中,依次选择[产品与服务/大数据/消息队列Kafka]菜单项。
2. 在实例列表界面,单击实例ID,或者单击实例后的<管理>,进入实例基本信息页面。
3. 选择“监控告警”页签,并在页面左侧选择“告警”页签。
4. 单击<创建告警规则>。
5. 在创建告警规则界面,配置告警规则和通知方式。
5.1. 监控实例:选择待监控的节点,可以同时选择多个节点。
5.2. 监控名称:自定义告警监控的名称。监控名称为1~32个字符(可以为字母、数字、中文、下划 线中的一种或多种)。
5.3. 告警规则设置:指定告警的指标项,并将指标项在指定时间内的平均值设置为告警阈值。
图-1 指标项说明
监控指标 | 单位 | 说明 |
CPU使用率 | % | 实例的CPU使用率 |
磁盘使用率 | % | 实例的磁盘使用率 |
内存使用率 | % | 实例的内存使用率 |
无Leader的partition数量 | 个 | 无Leader的分区数量 |
消息数据量 | MB | 实例节点中的日志数据量 |
Topic数量 | 个 | 实例节点中Topic数量 |
失效副本数 | 个 | 实例中失效副本数 |
节点可用性 | bool | 节点是否正常 |
ZooKeeper请求断开时间 | ms | 单位时间ZooKeeper请求断开的时间 |
ZooKeeper请求过期时间 | ms | 单位时间ZooKeeper请求过期的时间 |
ZooKeeper请求延迟时间 | ms | 单位时间ZooKeeper请求的延迟 |
ISR收缩次数 | 次 | 单位时间ISR列表的收缩次数 |
ISR扩展次数 | 次 | 单位时间ISR列表的扩展次数 |
JVM内存 | MB | 单位时间Broker堆内存占用量 |
6. 通知方式:可以选择“邮箱”或“邮件+短信”,并自定义邮件主题和备注说明。
7. 配置完成后,单击<确定>。
图-2 告警设置