跳到主要内容

恢复 ONTAP 集群

要使集群脱机以恢复到早期的 ONTAP 版本,必须禁用存储故障转移和数据 LIF,满足恢复前提条件,恢复节点上的集群和文件系统配置,然后对集群中的每个其他节点重复此过程。

开始之前

必须事先满足恢复准备要求。

关于本任务

为了恢复集群,必须在恢复期间使集群脱机。
  1. 将权限级别从管理员更改为高级,在提示是否继续时输入 yset -privilege advanced
    随后将显示高级提示符(*>)。
  2. 验证是否已安装目标 ONTAP 软件:system image show

    示例

    以下示例显示版本 9.7 已作为备用映像安装在两个节点上:
    TDC-DM7K::system*> image show
    Is Is Install
    Node Image Default Current Version Date
    -------- ------- ------- ------- ------------------------- -------------------
    TDC-7K-01
    image1 false false 9.7P7 11/5/2020 07:11:58
    image2 true true 9.7P8 11/6/2020 01:50:18
    TDC-7K-02
    image1 false false 9.7P7 11/5/2020 07:12:12
    image2 true true 9.7P8 11/6/2020 01:50:42
    4 entries were displayed.
  3. 禁用集群中的所有数据 LIF:network interface modify {-role data} -status-admin down
  4. 如果集群仅包含两个节点,请禁用集群 HA:cluster ha modify -configured false
  5. 从任一节点上禁用 HA 对中节点的存储故障转移:storage failover modify -node nodename -enabled false

    只需对 HA 对禁用存储故障转移一次。禁用节点的存储故障转移时,也会在节点的伙伴上禁用存储故障转移。
  6. 登录到要恢复的节点。

    要恢复节点,必须通过节点的节点管理 LIF 登录到集群。
  7. 将节点的目标 ONTAP 软件映像设置为默认映像:system image modify -node nodename -image target_image -isdefault true
  8. 验证目标 ONTAP 软件映像是否已设置为要恢复的节点的默认映像:system image show

    示例

    以下示例显示版本 9.7 已设置为 node0 的默认映像:
    TDC-DM7K::system*> image show
    Is Is Install
    Node Image Default Current Version Date
    -------- ------- ------- ------- ------------------------- -------------------
    TDC-7K-01
    image1 false false 9.7P7 11/5/2020 07:11:58
    image2 true true 9.7P8 11/6/2020 01:50:18
    TDC-7K-02
    image1 false false 9.7P7 11/5/2020 07:12:12
    image2 true true 9.7P8 11/6/2020 01:50:42
    4 entries were displayed.
  9. 如果集群仅包含两个节点,请确认节点不包含 epsilon:
    1. 检查节点当前是否包含 epsilon:cluster show -node nodename

      示例

      以下示例显示节点包含 epsilon:
      TDC-DM7K::*> cluster show -node TDC-7K-01

      Node: TDC-7K-01
      UUID: 9df34886-0ead-11eb-99fa-00a098dbdfca
      Epsilon: false
      Eligibility: true
      Health: true
    2. 如果节点包含 epsilon,请在节点上将 epsilon 标记为 false,使 epsilon 可转移到节点的伙伴节点:cluster modify -node nodenameA -epsilon false
    3. 将 epsilon 转移到节点的伙伴节点,方法是在伙伴节点上将 epsilon 标记为 truecluster modify -node nodenameB -epsilon true
  10. 验证是否已准备好恢复节点:system node revert-to -node nodename -check-only true -version 9.x

    check-only 参数用于标识在恢复之前必须满足的所有前提条件,例如:
    • 禁用存储故障转移

    • 禁用快照策略

    • 删除升级到更高 ONTAP 版本后创建的快照拷贝

  11. 验证是否已满足所有前提条件:system node revert-to -node nodename -check-only true -version 9.x
  12. 恢复节点的集群配置:system node revert-to -node nodename -version 9.x

    -version 选项是指目标版本。例如,如果已安装并验证的软件是 ONTAP 9.8,则 -version 选项的正确值为 9.8
    恢复集群配置后,您将从 clustershell 注销。
  13. 重新登录到 clustershell,然后切换到 nodeshell:run -node nodename

    再次登录到 clustershell 后,可能需要几分钟时间才能准备好接受 nodeshell 命令。因此,如果命令失败,请等待几分钟,然后重试。
  14. 恢复节点的文件系统配置:revert_to 9.x

    此命令将验证该节点的文件系统配置是已准备好可进行恢复,然后将其恢复。如果识别到任何前提条件,必须满足这些条件,然后重新运行 revert_to 命令。

    使用系统控制台监控恢复过程时,显示的信息比在 nodeshell 中看到的信息更详细。
    此命令完成后,将显示装入程序提示符。
  15. 在提示符处输入 yes 执行恢复。

    如果 AUTOBOOT 为 true,节点将重新启动到 ONTAP。如果 AUTOBOOT 为 false,节点将暂停。
  16. HA 对的另一节点上重复执行步骤 515
  17. 如果集群仅包含两个节点,请重新启用集群 HA:cluster ha modify -configured true
  18. 在两个节点上重新启用存储故障转移(如果先前已禁用):storage failover modify -node nodename -enabled true
  19. 针对每个其他的 HA 对和 MetroCluster 配置中的两个集群,重复执行步骤 418