MetroCluster 切换和切回工作流程
从存储管理软件 9.6 开始,在发生导致源集群中的所有节点无法访问并断电的灾难后,可以使用 MetroCluster 切换和切回操作。还可以使用切换工作流程进行协商(计划内)切换,例如执行灾难恢复测试或使站点脱机以便进行维护。
切换和切回工作流程的整个过程包括以下三个阶段:
- 切换:切换过程将存储和客户端访问控制权从源集群站点(站点 B)转移到另一个集群站点(站点 A)。此操作可帮助您在测试和维护期间提供无中断运行。此外,这一过程还支持从站点故障中恢复。对于灾难恢复测试或计划内站点维护,可以执行 MetroCluster 切换以将控制权转移到灾难恢复(DR)站点(站点 A)。在开始此过程之前,必须至少有一个幸存站点节点在执行切换之前处于正常运行状态。如果先前在 DR 站点某些节点上的切换操作失败,可以在所有这些节点上重试该操作。
- 站点 B 操作:切换完成后,存储管理软件将完成 MetroCluster IP 配置的修复过程。修复属于计划内事件,可让您完全控制每个步骤,以最大限度减少停机时间。修复是在存储和控制器组件上发生的过程,包括两个阶段,目的是准备被修复站点上的节点以便执行切回过程。在第一阶段,该过程通过再同步镜像丛来修复聚合,然后通过将它们切回到灾难站点来修复根聚合。
在第二阶段,该站点为切回过程做好准备。
- 切回:在站点 B 上执行维护和修复后,启动切回操作以将存储和客户端访问控制权从站点 A 返回给站点 B。为了成功切回,必须满足以下条件:
主节点和存储架必须已打开电源并且可由站点 A 中的节点访问。
- 存储管理软件必须已成功完成修复阶段后才能启动切回操作。
站点 A 中的所有聚合都应处于镜像状态,不能处于降级或再同步状态。
在执行切回操作之前,必须完成先前的所有配置更改。这样可以防止这些更改与协商切换或切回操作发生冲突。
提供反馈