跳到主要内容

响应 QoS 策略组性能事件

当工作负载吞吐量(IOPS、IOPS/TB 或 MBps)超过定义的 ONTAP QoS 策略设置,且工作负载延迟受到影响时,Unified Manager 会生成 QoS 策略警告事件。这些系统定义的事件可让您在延迟影响到工作负载之前,及时纠正潜在的性能问题。

  • 您必须具有操作员、应用程序管理员或存储管理员角色。
  • 必须有、已确认或废弃性能事件。

在过去一小时的每个性能收集期内,如果工作负载吞吐量超过定义的 QoS 策略设置,Unified Manager 会生成违反 QoS 策略的警告事件。在每个收集期内,工作负载吞吐量可能仅会在短时间内超过 QoS 阈值,但 Unified Manager 仅在图表上显示该收集期的“平均”吞吐量。因此,您可能会收到 QoS 事件,但工作负载吞吐量可能并未超过图表中显示的策略阈值。

可使用 System Manager 或 ONTAP 命令来管理策略组,包括以下任务:
  • 为工作负载创建新的策略组
  • 在策略组中添加或删除工作负载
  • 在策略组之间移动工作负载
  • 更改策略组的吞吐量限制
  • 将工作负载移动到另一个聚合或节点
  1. 显示“Event(事件)”详细信息页面以查看有关事件的信息。
  2. 查看“Description(描述)”,了解导致事件发生的阈值违反情况。
    例如,消息“vol1_NFS1 上的 IOPS 值达到 1352 IOPS,已触发警告事件来识别工作负载的潜在性能问题”表示,卷 vol1_NFS1 上存在“QoS 最大值 IOPS”事件。
  3. 查看“Event Information(事件信息)”部分,以了解有关事件发生时间及事件活动时长的更多详细信息。
    此外,对于共享 QoS 策略吞吐量的卷或 LUN,还可以看到消耗 IOPS 或 MBps 最多的前三个工作负载的名称。
  4. System Diagnosis(系统诊断) 部分下,查看两个图表:一个为总平均 IOPS 或 MBps 图(取决于事件),一个为延迟图。采用这种布局方式后,可以查看当工作负载接近 QoS 最大限制时哪些集群组件对延迟的影响最大。
    对于共享的 QoS 策略事件,前三个工作负载会显示在吞吐量图表中。如有三个以上的工作负载共享 QoS 策略,则额外的工作负载将一起添加到“其他工作负载”类别中。此外,延迟图中还显示了属于 QoS 策略一部分的所有工作负载的平均延迟。
    请注意,对于自适应 QoS 策略事件,IOPS 和 MBps 图表显示了 ONTAP 根据卷的大小从已分配 IOPS/TB 阈值策略转换而来的 IOPS 或 MBps 值。
  5. 可在 Suggested Actions(建议操作) 部分查看相关建议,并确定应执行哪些操作以避免工作负载延迟增加。
    如果需要,请单击 Help(帮助) 按钮查看有关可以执行的建议操作的更多详细信息,以尝试解决该性能事件。