响应由 QoS 策略组调速引起的动态性能事件
可使用 Unified Manager 调查因服务质量(QoS)策略组调速工作负载吞吐量(MB/s)导致的性能事件。调速增加了策略组中卷工作负载的响应时间(延迟)。可使用事件信息确定是否需要对策略组实施新限制,以停止调速。
- 您必须具有操作员、应用程序管理员或存储管理员角色。
- 必须有新、已确认或废弃性能事件。
- 显示“Event details(事件详细信息)”页面以查看有关事件的信息。
- 阅读“Description(描述)”,其中显示了受调速影响的工作负载名称。注描述中可以显示相同的受害者和抢夺者工作负载,因为调速使工作负载本身也成为受害者。
- 使用文本编辑器等应用程序记录卷的名称。可搜索卷名称以便稍后查找它。
- 在工作负载延迟和工作负载利用率图表中,选择Bully Workloads(抢夺者工作负载)。
- 将光标悬停在图表上以查看影响该策略组的主要用户定义工作负载。列表顶部的工作负载偏差最大,也是导致调速的原因。活动是每个工作负载使用的策略组限制的百分比。
- 在“Suggested Actions(建议的操作)”区域中,单击主要工作负载的 分析工作负载按钮。
- 在“Workload Analysis(工作负载分析)”页面中,设置延迟图以查看所有集群组件,设置吞吐量图以查看细分图。细分图显示在“Latency(延迟)”图和“IOPS”图下方。
- 比较“Latency(延迟)”图中的 QoS 限制,以了解事件发生时影响延迟的调速量。QoS 策略组的最大吞吐量为每秒 1000 次操作(ops/s),其中的工作负载吞吐量之和不得超出该值。事件发生时,策略组中工作负载的吞吐量之和超过了 1200 ops/s,从而导致策略组将其活动调速回 1000 ops/s。
- 比较“Reads/writes latency(读取/写入延迟)”值与“Reads/writes/other(读取/写入/其他)”值。这两个图表中均显示出大量带有高延迟的读取请求,但写入请求数及其延迟量较低。这些值可帮助您确定是否存在大量吞吐量或增加了该延迟的操作数。在决定对吞吐量或操作数设置策略组限制时,可以使用这些值。
- 使用 ThinkSystem DM 系列存储管理软件将策略组的当前限制增加到 1300 ops/s。
- 一天之后,返回 Unified Manager,并在“Workload Analysis(工作负载分析)”页面输入第 3 步中记录的工作负载。
- 选择“吞吐量细分”图。将显示“Reads/writes/other(读取/写入/其他)”图。
- 在页面顶部,将光标指向更改事件图标(
),以更改策略组限制。
- 比较“Reads/writes/other(读取/写入/其他)”图与“Latency(延迟)”图。此时,读取和写入请求将保持一致,但调速已停止,延迟也已减少。
提供反馈