系统定义的性能阈值策略类型
Unified Manager 提供了一些用于监控集群性能并自动生成事件的标准阈值策略。这些策略默认处于启用状态,且会在违反受监控的性能阈值时生成警告或参考事件。
注
Cloud Volumes ONTAP、ONTAP Edge 或 ONTAP Select 系统上未启用系统定义的性能阈值策略。
如果从任何系统定义的性能阈值策略中收到不必要的事件,则可在“Event Setup(事件设置)”页面禁用单个策略的事件。
集群阈值策略
默认情况下,系统定义的集群性能阈值策略会被分配给受 Unified Manager 监控的每个集群:
- 集群失衡阈值
- 识别集群中某个节点的负载远高于其他节点,且可能因此影响工作负载延迟的情况。
节点阈值策略
默认情况下,系统定义的节点性能阈值策略会被分配给受 Unified Manager 监控的集群中的每个节点:
- 节点资源过度利用
- 识别单个节点的运行效率超出限制,且可能因此影响工作负载延迟的情况。
- 节点 HA 对过度利用
- 识别 HA 对中节点的运行效率超出 HA 对运行效率限制的情况。
- 节点磁盘碎片化
- 识别由于聚合中一个或多个磁盘碎片化,导致关键系统服务速度降低,且可能影响节点上工作负载延迟的情况。
聚合阈值策略
默认情况下,系统定义的聚合性能阈值策略会被分配给受 Unified Manager 监控的集群中的每个聚合:
- 聚合磁盘过度利用
- 识别某个聚合的运行效率超出限制,且可能因此影响工作负载延迟的情况。方式为:查找磁盘利用率超过 95%,且持续时间超过 30 分钟的聚合。随后,此多条件策略将执行以下分析来确定问题的原因:
当前是否在对聚合中的磁盘进行后台维护活动?
可能对磁盘进行的一些后台维护活动包括磁盘重建、磁盘擦除、SyncMirror 再同步和奇偶再校验。
- 磁盘架 Fibre Channel 互连中是否存在通信瓶颈?
- 聚合中的可用空间是否过少?
只有在违反这三个下级策略中的任意一个(或多个)时,才会针对此策略触发警告事件。如果只有聚合中的磁盘利用率超过 95%,将不会触发性能事件。
注
“聚合磁盘过度利用”策略只分析硬盘聚合,不分析 Flash Pool(混合)聚合、固态硬盘和 FabricPool 聚合。
工作负载延迟阈值策略
系统定义的工作负载延迟阈值策略会被分配给已配置性能服务级别策略(已定义“预期延迟”值)的任何工作负载:
- 违反根据性能服务级别定义的工作负载卷/LUN 的延迟阈值
- 识别超出“预期延迟”限制,且正在影响工作负载性能的卷(文件共享)和 LUN。这是警告事件。
QoS 阈值策略
系统定义的 QoS 性能阈值策略会被分配给已配置 ONTAP QoS 最大吞吐量策略(IOPS、IOPS/TB 或 MB/s)的任何工作负载。Unified Manager 会在工作负载吞吐量值低于已配置 QoS 值 15% 的情况下触发事件:
- QoS 最大 IOPS 或 MB/s 阈值
- 识别超出 QoS 最大 IOPS 或 MB/s 吞吐量限制,且正在影响工作负载延迟的卷和 LUN。这是警告事件。
- QoS 峰值 IOPS/TB 或包含块大小阈值的 IOPS/TB
- 识别超出自适应 QoS 峰值 IOPS/TB 吞吐量限制(或包含块大小限制的 IOPS/TB),且正在影响工作负载延迟的卷。这是警告事件。
提供反馈