Windows Server 中的 System Insights 功能

Windows Server 中的 System Insights 功能使用预测分析来帮助管理员预测资源使用情况并优化服务器性能。 本文介绍默认功能、预测模型以及如何解释其结果。

本文还介绍了用于默认功能的数据源、预测时间线和预测状态。

System Insights 功能概述

System Insights 功能是一种机器学习或统计信息模型,用于分析系统数据,以便更深入地了解部署。 System Insights 包括一组默认功能,你可以在不更新作系统的情况下动态添加新功能。

可用的四种默认功能包括:

  • CPU 容量预测
  • 网络容量预测
  • 总存储消耗预测
  • 量消耗预测

每个功能在 Windows Server 实例上本地运行,你可以单独管理每个功能。

每个功能将分析以往历史数据以预测将来的使用量,所有预测功能用于预测长期趋势而不是短期行为,可帮助管理员正确预配硬件并优化其工作负载,以避免将来发生资源争用。 因为这些功能侧重于长期使用量,因此它们将分析日常数据。

Capability outputs

运行某个功能时,它会提供一个输出来解释其分析或预测的结果。 Each output includes a Status and a Status Description to describe the prediction. 每个结果还可以包含与预测相关的功能特定的数据。 The Status Description gives context for the Status, and the capability reports either an OK, Warning, or Critical status. A capability can also use an Error or None status if it doesn't make a prediction. 以下是功能状态及其基本含义:

  • Ok - Everything looks good.
  • Warning - No immediate attention required, but you should take a look.
  • Critical - You should take a look soon.
  • Error - An unknown problem caused the capability to fail.
  • None - No prediction was made. 这可能是因为缺少数据,或任何其他特定于功能的原因导致未做出预测。

结果中的任何功能特定数据都保存在用户可访问的 JSON 文件中。 可以使用 PowerShell 找到文件路径。 有关详细信息,请参阅 检索功能结果

Forecasting model

默认功能使用预测模型来预测将来的使用量,对于每个预测,将在本地基于计算机的数据训练模型。 该模型旨在帮助检测长期趋势,在每个 Windows Server 实例上重新训练使功能可以适应特定的行为和每台计算机使用量的细微差别。

Note

若要确定使用哪种类型的模型,需要使用包含数万个计算机的数据集测试许多模型。 在分析和调整这些模型后,我们决定使用自动回归预测模型,因为它产生高度准确和直观直观的预测,同时不需要太多时间来训练。 但是,此模型需要三周的训练数据,因此在有三周的数据可用之前,每个功能将使用基本线性趋势。

Forecasting timelines

默认功能根据收集数据的天数预测未来几天。 下表显示了这些功能的预测时间线:

输入数据大小 Forecast length
0-5 days 未做出预测。
6-180 days 1/3 * 输入数据大小
180-365 days 60 days

Forecasting data

每个功能分析每日数据以预测将来的使用量。 但是,CPU、网络甚至存储使用量在一天中可能频繁变化,从而会根据计算机上的工作负载动态调整。 由于一天中的使用量并不恒定,在单个数据点中正确表示每日使用量非常重要。 下表详细说明了特定的数据点以及数据的处理方式:

Capability name Data sources Filtering logic
卷消耗预测 Volume size Maximum daily
总存储消耗预测 卷大小之和,磁盘大小之和 最大每日使用量
CPU 容量预测 处理器时间百分比 每日最多 2 小时的平均值
网络容量预测 Bytes Total/sec 每日最多 2 小时的平均值

在评估筛选逻辑时,请务必注意,每个功能都希望通知管理员,将来的使用情况将有意义地超过可用容量-即使 CPU 暂时达到 100% 利用率,CPU 使用率也可能会导致有意义的性能下降或资源争用。 对于 CPU 和网络,应持续较高的使用率,而不是暂时性峰值。 几个小时的高 CPU 或网络使用率可能会对关键工作负荷的性能产生有意义的影响。 计算每日最多 2 小时的平均值可以避免这些极端情况,并且仍可为每个要分析的功能生成有意义的数据。

但是,对于卷和总存储使用量,存储使用量不能超过可用容量(即使是暂时性的),因此最大每日使用量用于这些功能。

Forecasting statuses

所有系统见解功能都必须输出与每个预测关联的状态。 每个默认功能使用以下逻辑来定义每种预测状态:

  • OK: The forecast doesn't exceed the available capacity.
  • Warning: The forecast exceeds the available capacity in the next 30 days.
  • Critical: The forecast exceeds the available capacity in the next 7 days.
  • Error: The capability ran into an unexpected error.
  • None: There isn't enough data to make a prediction. 这可能是由于缺少数据或最近未报告任何数据。

Note

如果功能在多个实例(例如多个卷或网络适配器)上预测,则状态将反映所有实例中最严重的状态。 每个卷或网络适配器的各种状态显示在 Windows Admin Center 中,或显示在每个功能的输出中包含的数据中。 For instructions on how to parse the JSON output of the default capabilities, visit this blog.

若要详细了解系统见解,请使用以下资源: