用户定义的性能阈值策略的工作原理
在存储对象(例如,聚合和卷)上设置性能阈值策略是为了向存储管理员发送事件,以告知管理员集群出现性能问题。
可通过以下方法为存储对象创建性能阈值策略:
- 选择存储对象
- 选择与该对象关联的性能计数器
- 指定性能计数器的上限值,以定义警告和紧急情况
- 指定一个时间段,以定义计数器必须超出上限值的时长
例如,在卷上设置性能阈值策略后,无论何时,只要该卷的 IOPS 每秒操作数超过 750 且持续 10 分钟,就会收到紧急事件通知。相同的阈值策略也适用于警告事件,即,当 IOPS 每秒操作数超过 500 且持续 10 分钟时,就会发送警告事件。
注
当前版本的阈值被设置为,当计数器值超出阈值设置时发送事件。无法将阈值设置为在计数器值低于阈值设置时发送事件。
此处所示的示例计数器图表示,在 1:00 时违反了警告阈值(黄色图标),在 12:10、12:30 和 1:10 违反了临界阈值(红色图标):

阈值违反情况必须在指定的时间段内连续发生。如因任何原因导致阈值降至限定值以下,后续出现违反情况将被视为新时间段的开始。
某些集群对象和性能计数器可用于创建组合阈值策略,该策略需要两个性能计数器同时超出最大限值,才能生成事件。例如,可使用以下条件创建阈值策略:
集群对象 | 性能计数器 | 警告阈值 | 临界阈值 | 持续时间 |
---|---|---|---|---|
卷 | 延迟 | 10 毫秒 | 20 毫秒 | 15 分钟 |
聚合 | 利用率 | 65% | 85% |
对于使用两个集群对象的阈值策略,只有在同时违反相关条件时才能生成事件。例如,使用表中定义的阈值策略:
如果卷延迟平均为... | 且聚合磁盘占用率为... | 则... |
---|---|---|
15 毫秒 | 50% | 无事件报告。 |
15 毫秒 | 75% | 报告警告事件。 |
25 毫秒 | 75% | 报告警告事件。 |
25 毫秒 | 90% | 报告紧急事件。 |
提供反馈