跳到主要内容

识别问题并针对失败的保护作业执行纠正操作

您在“Event(事件)”详细信息页面上的“原因”字段中查看作业失败错误消息后,确定作业失败的原因是快照拷贝错误。然后,您继续前往“Volume / Health(卷/运行状况)”详细信息页面以收集更多信息。

您必须具有应用程序管理员角色。

“Event(事件)”详细信息页面上的“原因”字段中提供的错误消息包含有关失败作业的以下文本:

Protection Job Failed. Reason: (Transfer operation for 
relationship 'cluster2_src_svm:cluster2_src_vol2->cluster3_dst_svm:
managed_svc2_vol3' ended unsuccessfully. Last error reported by
Data ONTAP: Failed to create Snapshot copy 0426cluster2_src_vol2snap
on volume cluster2_src_svm:cluster2_src_vol2. (CSM: An operation
failed due to an ONC RPC failure.).)
<em className="ph i">Job Details</em>


此消息提供以下信息:

  • 有一个备份或镜像作业未成功完成。

    该作业涉及虚拟服务器 cluster2_src_svm 上的源卷 cluster2_src_vol2 与虚拟服务器 cluster3_dst_svm 上的目标卷 managed_svc2_vol3 之间的保护关系。

  • 源卷 cluster2_src_svm:/cluster2_src_vol2 上的 0426cluster2_src_vol2snap 的快照拷贝作业失败。

在此情形中,可以确定作业失败的原因和潜在的纠正操作。但是,要解决失败问题,需要访问存储管理软件 Web UI 或 ONTAP CLI 命令。

  1. 您查看错误消息,并确定源卷上的快照拷贝作业失败,其指示源卷可能存在问题。
    您本可以单击错误消息末尾的 Job Details(作业详细信息) 链接,但是此情形中假设您不选择这样做。
  2. 您决定要尝试解决该事件,因此执行以下操作:
    1. 单击 Assign To(分配给) 按钮并从菜单中选择 Me(我)
    2. 单击 Acknowledge(确认) 按钮,这样就不会继续收到重复的警报通知(如果已为事件设置警报)。
    3. 也可以选择添加有关事件的注释。
  3. 单击 “Summary(摘要)” 窗格中的 Source(源) 字段以查看有关源卷的详细信息。
    Source(源)字段包含源对象的名称:在此情形中是计划在其中执行快照拷贝作业的卷。
    此时会显示 cluster2_src_vol2“Volume / Health(卷/运行状况)”详细信息页面,其中显示“Protection(保护)”选项卡的内容。
  4. 查看保护拓扑图,您会看到与拓扑中的第一个卷(该卷是 SnapMirror 关系的源卷)相关联的错误图标。
    还会在源卷图标中看到水平条,其指示为该卷设置的警告阈值和错误阈值。

    级联拓扑作业失败
  5. 将光标放在错误图标上会看到显示阈值设置的弹出对话框,并看到该卷已超出错误阈值,表明存在容量问题。
  6. 单击“Capacity(容量)”选项卡
    此时会显示有关卷 cluster2_src_vol2 的容量信息。
  7. “Capacity(容量)”面板中,您会在条形图中看到一个错误图标,再次表明卷容量已超出为该卷设置的阈值水平。
  8. 在容量图下方,可以看到已禁用卷自动增长并且已设置卷空间保证。
    您本可以决定启用自动增长,但是在此情形中,您决定进行进一步调查,然后再做出关于如何解决容量问题的决定。
  9. 通过向下滚动到“Events(事件)”列表看到生成了“保护作业失败”、“卷满容剩余天数”和“卷空间已满”事件。
  10. “Events(事件)”列表中,单击 Volume Space Full(卷空间已满)事件以获取更多信息,并认定此事件似乎与容量问题最相关。
    “Event(事件)”详细信息页面显示源卷的“卷空间已满”事件。
  11. “Summary(摘要)”区域中,您看到事件的“原因”字段:超出已设置为 90% 的满容阈值。已使用 45.38 MB/47.50 MB(95.54%)。
  12. “Summary(摘要)”区域下,您看到“建议的纠正操作”。
    提示
    “Suggested Corrective Actions(建议的纠正操作)”仅针对某些事件显示,因此并非所有类型的事件都会显示此区域。
    单击可能解决“Volume Space Full(卷空间已满)”事件的建议操作的列表:
    • Enable autogrow on this volume(对此卷启用自动增大)。
    • Resize the volume(调整卷大小)。
    • Enable and run deduplication on this volume(对此卷启用并运行重复数据删除)。
    • Enable and run compression on this volume(对此卷启用并运行压缩)。
  13. 您决定对卷启用自动增大,但要这样做,必须确定父级聚合上的可用空间和当前的卷增长速率:
    1. 查看“Related Devices(相关设备)”窗格中的父聚合 cluster2_src_aggr1
      提示
      可以单击聚合的名称以获取有关聚合的更多详细信息。
      您确定聚合具有足够的空间来启用卷自动增长。
    2. 在页面顶部,查看指示严重事件的图标,然后查看图标下方的文本。
      您确定“满容剩余天数:少于一天 | 每日增长速率:5.4%”。
  14. 转到 存储管理软件 或访问 ONTAP CLI 以启用 volume autogrow 选项。
    提示
    记下卷和聚合的名称,以便在启用自动增长时可以使用。
  15. 解决容量问题后,返回 Unified Manager“Event(事件)”详细信息页面并将事件标记为已解决。