跳到主要内容

响应由 HA 接管引起的动态性能事件

可使用 Unified Manager 来调查由高可用性(HA)对中集群节点的高数据处理导致的性能事件。还可使用 Unified Manager 检查节点的运行状况,以确定节点上检测到的近期运行状况事件是否为导致该性能事件的原因。

  • 您必须具有操作员、应用程序管理员或存储管理员角色。
  • 必须有、已确认或废弃性能事件。
  1. 显示“Event details(事件详细信息)”页面以查看有关事件的信息。
  2. 阅读“Description(描述)”,其中说明了事件中涉及的工作负载以及处于争用状态的集群组件。
    一个受害者卷的延迟因集群组件处于争用状态而受到影响。从其伙伴节点接管所有工作负载的数据处理节点为处于争用状态的集群组件。在“Component in Contention(争用中的组件)”下,数据处理图标以红色突出显示,事件发生时正在执行数据处理的节点名称括于括号内。
  3. “Description(描述)”中,单击卷的名称。
    将显示“Volume Performance Explorer(卷性能资源管理器)”页面。在页面顶部的“Events(事件)”时间轴中,更改事件图标(更改事件图标)表示 Unified Manager 检测到的 HA 接管开始时间。
  4. 将光标指向 HA 接管的更改事件图标,有关 HA 接管的详细信息就会显示在悬停文本中。
    “Latency(延迟)”图中,事件表示大约在 HA 接管的同一时间,所选卷因出现高延迟而超出了性能阈值。
  5. 单击缩放视图,以在新页面显示延迟图。
  6. 在“查看”菜单中,选择“Cluster Components(集群组件)”以按集群组件查看总延迟。
  7. 将鼠标光标指向用于表示 HA 接管开始的更改事件图标,然后将数据处理延迟与总延迟进行比较。
    HA 接管时,由于对数据处理节点的工作负载需求增加,数据处理出现了峰值。CPU 使用率也随之提高,进而导致延迟并触发事件。
  8. 修复故障节点后,使用 ThinkSystem DM 系列存储管理软件执行 HA 交还,这会将工作负载从伙伴节点移动到已修复的节点。
  9. 在 HA 交还完成及 Unified Manager 发现下一个配置后(大约 15 分钟),在“Event Management(事件管理)”清单页面查找由 HA 接管触发的事件和工作负载。
    由 HA 接管触发的事件现在处于废弃状态,这表示事件已解决。数据处理组件上的延迟减少,使总延迟也得到了相应减少。所选卷当前用于执行数据处理的节点已解决了该事件。