跳到主要内容

MetroCluster 切换和切回工作流程

存储管理软件 9.6 开始,在发生导致源集群中的所有节点无法访问并断电的灾难后,可以使用 MetroCluster 切换和切回操作。还可以使用切换工作流程进行协商(计划内)切换,例如执行灾难恢复测试或使站点脱机以便进行维护。

切换和切回工作流程的整个过程包括以下三个阶段:

  1. 切换:切换过程将存储和客户端访问控制权从源集群站点(站点 B)转移到另一个集群站点(站点 A)。此操作可帮助您在测试和维护期间提供无中断运行。此外,这一过程还支持从站点故障中恢复。对于灾难恢复测试或计划内站点维护,可以执行 MetroCluster 切换以将控制权转移到灾难恢复(DR)站点(站点 A)。在开始此过程之前,必须至少有一个幸存站点节点在执行切换之前处于正常运行状态。如果先前在 DR 站点某些节点上的切换操作失败,可以在所有这些节点上重试该操作。
  2. 站点 B 操作:切换完成后,存储管理软件将完成 MetroCluster IP 配置的修复过程。修复属于计划内事件,可让您完全控制每个步骤,以最大限度减少停机时间。修复是在存储和控制器组件上发生的过程,包括两个阶段,目的是准备被修复站点上的节点以便执行切回过程。在第一阶段,该过程通过再同步镜像丛来修复聚合,然后通过将它们切回到灾难站点来修复根聚合。

    在第二阶段,该站点为切回过程做好准备。

  3. 切回:在站点 B 上执行维护和修复后,启动切回操作以将存储和客户端访问控制权从站点 A 返回给站点 B。为了成功切回,必须满足以下条件:
    • 主节点和存储架必须已打开电源并且可由站点 A 中的节点访问。

    • 存储管理软件必须已成功完成修复阶段后才能启动切回操作。
    • 站点 A 中的所有聚合都应处于镜像状态,不能处于降级或再同步状态。

    • 在执行切回操作之前,必须完成先前的所有配置更改。这样可以防止这些更改与协商切换或切回操作发生冲突。

MetroCluster 切换和切回工作流程的流程图

以下流程图说明了启动切换和切回操作时发生的阶段和过程。