跳到主要内容

运行状况监控的工作原理

单独的运行状况监控器会有在特定条件发生时触发警报的一组策略。了解运行状况监控的工作原理可帮助您应对问题并控制未来的警报。

运行状况监控包含以下组件:

  • 特定子系统的单个运行状况监控器,每一个都有自己的运行状况

    例如,存储子系统有节点连接性运行状况监控器。

  • 整合了单个运行状况监控器的运行状况的整体系统运行状况监控器

    任何单个子系统的降级状态都会导致整个系统的降级状态。如果子系统不存在警报,整体系统状态是好的。

每个运行状况监控器均由以下关键要素组成:

  • 运行状况监控器可能发出的警报

    每个警报都有定义,其中包括例如警报严重性和可能原因等详细信息。

  • 确定每个警报何时触发的运行状况策略

    每个运行状况策略都有规则表达式,它是触发此警报的具体情况或变化。

运行状况监视器持续监控并验证其子系统中的资源的条件或状态变化。当条件或状态变化匹配运行状况策略中的规则表达式时,运行状况监控器发出警报。警报将导致子系统的运行状况和整体系统运行状况发生降级。