跳到主要内容

监控网络端口的运行状况

ONTAP 的网络端口管理功能包括运行状况自动监控和一组运行状况监控器,可帮助确定可能不适合托管 LIF 的网络端口。

关于本任务

如果运行状况监控器确定网络端口的运行状况不正常,将通过 EMS 消息警告管理员或将端口标记为已降级。如果有运行状况良好的备用故障转移目标可用于托管该 LIF,则 ONTAP 可以避开在已降级的网络端口上托管 LIF。由于发生软故障事件,例如链路摇摆(链路快速上下回弹),端口可能已降级。
  • 在集群 IPspace 中,网络端口如果遇到链路摇摆,或丧失第二层可访问性,无法访问广播域中的其他网络端口,则标记为已降级。

  • 非集群 IPspace 中的网络端口,如果遇到链路摇摆,则标记为已降级。

您必须了解已降级的端口的以下行为:

  • 已降级的端口不能包含在 VLAN 或接口组中。

    如果接口组的成员端口标记为已降级,但该接口组仍标记为运行正常,则 LIF 可在该接口组上托管。

  • LIF 自动从已降级端口迁移到运行正常的端口。

    在发生故障转移事件期间,已降级的端口不能作为故障转移目标。如果没有运行状况良好的端口可用,则已降级的端口将根据常规故障转移策略托管 LIF。

  • 无法在已降级端口上创建、迁移或恢复 LIF。

    您可以将网络端口的 ignore-health-status 设置修改为 true。然后,可以在运行状况良好的端口上托管 LIF。

  1. 登录到高级权限模式:set -privilege advanced
  2. 检查启用了哪些运行状况监控器以监控网络端口运行状况:network options port-health-monitor show

    端口的运行状况状态取决于运行状况监控器的值。以下运行状况监控器可用,并在 ONTAP 中处于默认启用状态:

    • 链路摇摆运行状况监控器:监控链路摇摆

      如果端口在五分钟内发生多次链路摇摆,则此端口标记为已降级。

    • L2 可访问性运行状况监控器:监控在同一个广播域中配置的所有端口是否可以相互进行 L2 访问

      此运行状况监控器可以报告所有的 IPspace 中出现的 L2 可访问性问题;但是,它只将集群 IPspace 中的端口标记为已降级。

    • CRC 监控器:监控报告中的 CRC 统计信息

      此运行状况监控器不会将端口标记为已降级,但是在观察到 CRC 故障率非常高时会生成 EMS 消息。

    示例

    cluster-1::*> network options port-health-monitor show
    IPspace Enabled Port Health Monitors
    ------------- ----------------------------
    Cluster l2_reachability,
    link_flapping
    Default l2_reachability,
    link_flapping
    2 entries were displayed.
  3. 使用 network options port-health-monitor modify 命令,根据需要对 IPspace 启用或禁用任何运行状况监控器。
  4. 查看端口的详细运行状况:network port show -health

    命令输出显示端口的运行状况状态、忽略运行状况状态设置,以及端口标记为已降级的原因列表。端口的运行状况状态可以是运行正常,也可以是已降级。如果忽略运行状况状态设置为 true,则表明管理员已将该端口的运行状况状态从已降级更改为运行正常。如果忽略运行状况状态设置为 false,则端口的运行状况状态将由系统自动确定。

    示例

    cluster-1::> network port show -health                             
    Ignore
    Health Health
    Node Port Link Status Status Degraded Reasons
    -------- --------- ---- -------- ------ -----------------------
    node1
    e0a up healthy false -
    e0b up healthy false -
    e0c up degraded false l2_reachability,
    link_flapping
    e0d up degraded false l2_reachability

    node2
    e0a up healthy false -
    e0b up healthy false -
    e0c up healthy false -
    e0d up degraded false -
    8 entries were displayed.