跳到主要内容

系统定义的性能阈值策略类型

Unified Manager 提供了一些用于监控集群性能并自动生成事件的标准阈值策略。这些策略默认处于启用状态,且会在违反受监控的性能阈值时生成警告或参考事件。

Cloud Volumes ONTAP、ONTAP Edge 或 ONTAP Select 系统上未启用系统定义的性能阈值策略。

如果从任何系统定义的性能阈值策略中收到不必要的事件,则可在“Event Setup(事件设置)”页面禁用单个策略的事件。

集群阈值策略

默认情况下,系统定义的集群性能阈值策略会被分配给受 Unified Manager 监控的每个集群:

集群失衡阈值
识别集群中某个节点的负载远高于其他节点,且可能因此影响工作负载延迟的情况。
方式为:比较集群中所有节点的已用性能容量,以确定任意节点间是否存在 30% 的负载差异。这是警告事件。

节点阈值策略

默认情况下,系统定义的节点性能阈值策略会被分配给受 Unified Manager 监控的集群中的每个节点:

节点资源过度利用
识别单个节点的运行效率超出限制,且可能因此影响工作负载延迟的情况。
方式为:查找性能容量使用率超出 100%,且持续时间超过 12 小时的节点。这是警告事件。
节点 HA 对过度利用
识别 HA 对中节点的运行效率超出 HA 对运行效率限制的情况。
方式为:查看 HA 对中两个节点的已用性能容量值。如果两个节点的组合已用性能容量超出 200%,且持续时间超过 12 小时,那么控制器故障转移就会影响工作负载延迟。这是参考事件。
节点磁盘碎片化
识别由于聚合中一个或多个磁盘碎片化,导致关键系统服务速度降低,且可能影响节点上工作负载延迟的情况。
方式为:查看某个节点上所有聚合的特定读取和写入操作率。该策略也可能在 SyncMirror 再同步期间触发,或在磁盘擦除操作期间发现错误时触发。这是警告事件。
“节点磁盘碎片化”策略只分析硬盘聚合,不分析 Flash Pool、固态硬盘和 FabricPool 聚合。

聚合阈值策略

默认情况下,系统定义的聚合性能阈值策略会被分配给受 Unified Manager 监控的集群中的每个聚合:

聚合磁盘过度利用
识别某个聚合的运行效率超出限制,且可能因此影响工作负载延迟的情况。方式为:查找磁盘利用率超过 95%,且持续时间超过 30 分钟的聚合。随后,此多条件策略将执行以下分析来确定问题的原因:
  • 当前是否在对聚合中的磁盘进行后台维护活动?

    可能对磁盘进行的一些后台维护活动包括磁盘重建、磁盘擦除、SyncMirror 再同步和奇偶再校验。

  • 磁盘架 Fibre Channel 互连中是否存在通信瓶颈?
  • 聚合中的可用空间是否过少?

只有在违反这三个下级策略中的任意一个(或多个)时,才会针对此策略触发警告事件。如果只有聚合中的磁盘利用率超过 95%,将不会触发性能事件。

“聚合磁盘过度利用”策略只分析硬盘聚合,不分析 Flash Pool(混合)聚合、固态硬盘和 FabricPool 聚合。

工作负载延迟阈值策略

系统定义的工作负载延迟阈值策略会被分配给已配置性能服务级别策略(已定义“预期延迟”值)的任何工作负载:

违反根据性能服务级别定义的工作负载卷/LUN 的延迟阈值
识别超出“预期延迟”限制,且正在影响工作负载性能的卷(文件共享)和 LUN。这是警告事件。
方式为:查找在过去一小时 30% 的时间里都超出预期延迟值限制的工作负载。

QoS 阈值策略

系统定义的 QoS 性能阈值策略会被分配给已配置 ONTAP QoS 最大吞吐量策略(IOPS、IOPS/TB 或 MB/s)的任何工作负载。Unified Manager 会在工作负载吞吐量值低于已配置 QoS 值 15% 的情况下触发事件:

QoS 最大 IOPS 或 MB/s 阈值
识别超出 QoS 最大 IOPS 或 MB/s 吞吐量限制,且正在影响工作负载延迟的卷和 LUN。这是警告事件。
将单个工作负载分配给策略组时,其识别方式为:查找在过去一小时的每个收集期内,都超出已分配 QoS 策略组中定义的最大吞吐量阈值的工作负载。
当多个工作负载共享一个 QoS 策略时,其识别方式为:添加策略中所有工作负载的 IOPS 或 MB/s,然后根据阈值检查总计值。
QoS 峰值 IOPS/TB 或包含块大小阈值的 IOPS/TB
识别超出自适应 QoS 峰值 IOPS/TB 吞吐量限制(或包含块大小限制的 IOPS/TB),且正在影响工作负载延迟的卷。这是警告事件。
方式为:根据每个卷的大小,将自适应 QoS 策略中定义的峰值 IOPS/TB 阈值转换为 QoS 最大 IOPS 值,然后查找在过去一小时的每个性能收集期内都超出 QoS 最大 IOPS 的卷。
当自适应 QoS 策略中已定义了“块大小”元素时,该阈值将根据每个卷的大小转换为 QoS 最大 MB/s 值。然后它会查找在过去一小时的每个性能收集期内都超出 QoS 最大 MB/s 的卷。
仅当集群装有 ONTAP 9.5 及更高版本时,该策略才会应用于卷。