如何使用延迟预测值进行性能分析
Unified Manager 使用延迟预测值来表示受监控工作负载的典型 I/O 延迟(响应时间)活动。当工作负载的实际延迟超出延迟预测值上限,从而触发动态性能事件时,它会发出警报,以便您分析性能问题,并采取纠正措施来解决此问题。
延迟预测值为工作负载设置了性能基准。Unified Manager 会随时间的推移从历史性能测量值中获取相关信息,以预测工作负载的预期性能和活动级别。预期范围的上限建立了动态性能阈值。Unified Manager 会使用这一基准来确定实际延迟何时超出或低于阈值,或超出预期范围限制。实际值与期望值之间的比较结果将用于创建工作负载的性能概要文件。
当工作负载的实际延迟超出动态性能阈值时,由于集群组件处于争用状态,此时延迟将升高,而工作负载的运行速度也会慢于预期。共享同一集群组件的其他工作负载的性能也可能会慢于预期。
Unified Manager 会分析超出阈值的事件,并确定该活动是否为性能事件。如果工作负载活动长时间(例如连续数小时)保持较高水平,Unified Manager 将判定该活动为正常活动,同时动态调整延迟预测值以创建新的动态性能阈值。
某些工作负载可能始终处于低活动水平,此时延迟预测值随时间变化的速率也将保持较低水平。分析性能事件时,为最大限度地减少事件数量,Unified Manager 会仅针对操作和延迟远高于预期的低活动卷触发事件。

在此示例中,卷延迟的延迟预测值(以灰色表示)最低为每次操作 3.5 毫秒(ms/op),最高为 5.5 ms/op。如果因网络流量出现间歇性峰值或集群组件处于争用状态,导致实际延迟(以蓝色表示)突增至 10 ms/op,则该延迟超出了延迟预测值和动态性能阈值。
当网络流量减少或集群组件不再处于争用状态时,延迟会重新降至延迟预测值范围之内。如果延迟长时间保持或超出 10 ms/op,则可能需要采取纠正措施来解决此问题。