跳到主要内容

用户定义的性能阈值策略的工作原理

在存储对象(例如,聚合和卷)上设置性能阈值策略是为了向存储管理员发送事件,以告知管理员集群出现性能问题。

可通过以下方法为存储对象创建性能阈值策略:

  • 选择存储对象
  • 选择与该对象关联的性能计数器
  • 指定性能计数器的上限值,以定义警告和紧急情况
  • 指定一个时间段,以定义计数器必须超出上限值的时长

例如,在卷上设置性能阈值策略后,无论何时,只要该卷的 IOPS 每秒操作数超过 750 且持续 10 分钟,就会收到紧急事件通知。相同的阈值策略也适用于警告事件,即,当 IOPS 每秒操作数超过 500 且持续 10 分钟时,就会发送警告事件。

当前版本的阈值被设置为,当计数器值超出阈值设置时发送事件。无法将阈值设置为在计数器值低于阈值设置时发送事件。

此处所示的示例计数器图表示,在 1:00 时违反了警告阈值(黄色图标),在 12:10、12:30 和 1:10 违反了临界阈值(红色图标):



阈值违反情况必须在指定的时间段内连续发生。如因任何原因导致阈值降至限定值以下,后续出现违反情况将被视为新时间段的开始。

某些集群对象和性能计数器可用于创建组合阈值策略,该策略需要两个性能计数器同时超出最大限值,才能生成事件。例如,可使用以下条件创建阈值策略:

集群对象性能计数器警告阈值临界阈值持续时间
延迟10 毫秒20 毫秒15 分钟
聚合利用率65%85%

对于使用两个集群对象的阈值策略,只有在同时违反相关条件时才能生成事件。例如,使用表中定义的阈值策略:

如果卷延迟平均为...且聚合磁盘占用率为...则...
15 毫秒50%无事件报告。
15 毫秒75%报告警告事件。
25 毫秒75%报告警告事件。
25 毫秒90%报告紧急事件。