跳到主要内容

响应由 QoS 策略组调速引起的动态性能事件

可使用 Unified Manager 调查因服务质量(QoS)策略组调速工作负载吞吐量(MB/s)导致的性能事件。调速增加了策略组中卷工作负载的响应时间(延迟)。可使用事件信息确定是否需要对策略组实施新限制,以停止调速。

  • 您必须具有操作员、应用程序管理员或存储管理员角色。
  • 必须有、已确认或废弃性能事件。
  1. 显示“Event details(事件详细信息)”页面以查看有关事件的信息。
  2. 阅读“Description(描述)”,其中显示了受调速影响的工作负载名称。
    描述中可以显示相同的受害者和抢夺者工作负载,因为调速使工作负载本身也成为受害者。
  3. 使用文本编辑器等应用程序记录卷的名称。
    可搜索卷名称以便稍后查找它。
  4. 在工作负载延迟和工作负载利用率图表中,选择Bully Workloads(抢夺者工作负载)
  5. 将光标悬停在图表上以查看影响该策略组的主要用户定义工作负载。
    列表顶部的工作负载偏差最大,也是导致调速的原因。活动是每个工作负载使用的策略组限制的百分比。
  6. “Suggested Actions(建议的操作)”区域中,单击主要工作负载的 分析工作负载按钮
  7. “Workload Analysis(工作负载分析)”页面中,设置延迟图以查看所有集群组件,设置吞吐量图以查看细分图。
    细分图显示在“Latency(延迟)”图和“IOPS”图下方。
  8. 比较“Latency(延迟)”图中的 QoS 限制,以了解事件发生时影响延迟的调速量。
    QoS 策略组的最大吞吐量为每秒 1000 次操作(ops/s),其中的工作负载吞吐量之和不得超出该值。事件发生时,策略组中工作负载的吞吐量之和超过了 1200 ops/s,从而导致策略组将其活动调速回 1000 ops/s。
  9. 比较“Reads/writes latency(读取/写入延迟)”值与“Reads/writes/other(读取/写入/其他)”值。
    这两个图表中均显示出大量带有高延迟的读取请求,但写入请求数及其延迟量较低。这些值可帮助您确定是否存在大量吞吐量或增加了该延迟的操作数。在决定对吞吐量或操作数设置策略组限制时,可以使用这些值。
  10. 使用 ThinkSystem DM 系列存储管理软件将策略组的当前限制增加到 1300 ops/s。
  11. 一天之后,返回 Unified Manager,并在“Workload Analysis(工作负载分析)”页面输入第 3 步中记录的工作负载。
  12. 选择“吞吐量细分”图。
    将显示“Reads/writes/other(读取/写入/其他)”图。
  13. 在页面顶部,将光标指向更改事件图标(更改事件图标),以更改策略组限制。
  14. 比较“Reads/writes/other(读取/写入/其他)”图与“Latency(延迟)”图。
    此时,读取和写入请求将保持一致,但调速已停止,延迟也已减少。