跳到主要内容

对存储故障转移互连链路断开问题执行纠正措施

显示存储故障转移相关事件的“Event(事件)”详细信息页面时,可以查看该页面的摘要信息,以确定事件的紧急性、问题的可能原因以及问题的可能解决方案。

您必须具有操作员、应用程序管理员或存储管理员角色。

在此示例情形中,“Event(事件)”详细信息页面上提供的事件摘要包含有关存储故障转移互连链路断开情况的以下信息:

Event: Storage Failover Interconnect One or More Links Down

Summary

Severity: Warning
State: New
Impact Level: Risk
Impact Area: Availability
Source: aardvark
Source Type: Node
Acknowledged By:
Resolved By:
Assigned To:
Cause: At least one storage failover interconnected link
between the nodes aardvark and bonobo is down.
RDMA interconnect is up (Link0 up, Link1 down)


此示例事件信息指示 HA 对节点 aardvark 和 bonobo 之间的存储故障转移互连链路 Link1 已断开,但是 Apple 和 Boy 之间的 Link0 处于活动状态。因为有一条链路处于活动状态,所以远程动态存储器存取(RDMA)仍可正常工作,并且存储故障转移作业仍然可以成功。

但是,为了防止两条链路都发生故障以及完全禁用存储故障转移保护,您决定进一步诊断 Link1 断开的原因。

  1. “Event(事件)”详细信息页面中,可以单击“源”字段中指定的事件链接,以获取可能与存储故障转移互连链路断开情况有关的其他事件的更多详细信息。

    在此示例中,事件源是名为 aardvark 的节点。单击该节点名称将在“Cluster / Health(集群/运行状况)”详细信息页面“Nodes(节点)”选项卡上显示受影响的 HA 对 aardvark 和 bonobo 的 “HA Details(HA 详细信息)”,并显示最近在受影响的 HA 对上发生的其他事件。
  2. 查看“HA Details(HA 详细信息)”以了解有关事件的更多信息。

    在此示例中,相关信息位于“事件”表中。该表会显示“存储故障转移连接一条或多条链路断开”事件、事件的生成时间以及同样还有事件的来源节点。

使用“HA Details(HA 详细信息)”中的节点位置信息,请求或亲自完成对受影响的 HA 对节点上的存储故障转移问题的物理检查和修复。