响应由 QoS 策略组调速引起的动态性能事件

可使用 Unified Manager 调查因服务质量（QoS）策略组调速工作负载吞吐量（MB/s）导致的性能事件。调速增加了策略组中卷工作负载的响应时间（延迟）。可使用事件信息确定是否需要对策略组实施新限制，以停止调速。

您必须具有操作员、应用程序管理员或存储管理员角色。
必须有新、已确认或废弃性能事件。

显示“Event details（事件详细信息）”页面以查看有关事件的信息。
阅读“Description（描述）”，其中显示了受调速影响的工作负载名称。
注
描述中可以显示相同的受害者和抢夺者工作负载，因为调速使工作负载本身也成为受害者。
使用文本编辑器等应用程序记录卷的名称。
可搜索卷名称以便稍后查找它。
在工作负载延迟和工作负载利用率图表中，选择Bully Workloads（抢夺者工作负载）。
将光标悬停在图表上以查看影响该策略组的主要用户定义工作负载。
列表顶部的工作负载偏差最大，也是导致调速的原因。活动是每个工作负载使用的策略组限制的百分比。
在“Suggested Actions（建议的操作）”区域中，单击主要工作负载的 分析工作负载按钮。
在“Workload Analysis（工作负载分析）”页面中，设置延迟图以查看所有集群组件，设置吞吐量图以查看细分图。
细分图显示在“Latency（延迟）”图和“IOPS”图下方。
比较“Latency（延迟）”图中的 QoS 限制，以了解事件发生时影响延迟的调速量。
QoS 策略组的最大吞吐量为每秒 1000 次操作（ops/s），其中的工作负载吞吐量之和不得超出该值。事件发生时，策略组中工作负载的吞吐量之和超过了 1200 ops/s，从而导致策略组将其活动调速回 1000 ops/s。
比较“Reads/writes latency（读取/写入延迟）”值与“Reads/writes/other（读取/写入/其他）”值。
这两个图表中均显示出大量带有高延迟的读取请求，但写入请求数及其延迟量较低。这些值可帮助您确定是否存在大量吞吐量或增加了该延迟的操作数。在决定对吞吐量或操作数设置策略组限制时，可以使用这些值。
使用 ThinkSystem DM 系列存储管理软件将策略组的当前限制增加到 1300 ops/s。
一天之后，返回 Unified Manager，并在“Workload Analysis（工作负载分析）”页面输入第 3 步中记录的工作负载。
选择“吞吐量细分”图。
将显示“Reads/writes/other（读取/写入/其他）”图。
在页面顶部，将光标指向更改事件图标（），以更改策略组限制。
比较“Reads/writes/other（读取/写入/其他）”图与“Latency（延迟）”图。
此时，读取和写入请求将保持一致，但调速已停止，延迟也已减少。

提供反馈