分析基础架构

本主题将介绍对环境中基础架构的各个部分执行分析可能采用的过程。本练习中涉及的步骤、视图和数据均以虚拟计算对象为例。对环境中其他资产进行分析的步骤与此类似,并使用与每种具体资产相关的计数器。本练习的目的是让您熟悉 Insight 用于监控的各种选项,以及了解数据中心各个资产的特征。

关于本任务

分析基础架构状态可能采取的一些操作如下:

在每次执行分析时,您都可以使用小工具在信息板中为基础架构中的对象创建所有这些视图。可以保存这些信息板,以便快速访问基础架构中的当前数据。

观察某个对象在一段时间内的行为

您可以观察某个对象的行为以确定此对象是否在预期运行级别运行。

步骤

  1. 使用查询来确定要用作分析主体的虚拟机:Query” > “+ New query” > “Virtual machine” > “name
    如果“name”字段保留为空,则返回所有虚拟机。选择要在本练习中使用的虚拟机。可以通过滚动显示虚拟机列表来进行选择。
  2. 根据要收集的信息创建新信息板。在工具栏中,单击Dashboards” > “+New Dashboard
  3. 在新信息板中,选择Variable” > “Text
    1. 将查询中的虚拟机名称添加为 $var1 值。
    2. 单击相应复选框。
    此变量用于轻松在要分析的不同对象组之间进行切换。您可以在其他分析步骤中重复使用此变量来对您最初选择的单个虚拟机进行额外分析。如果要标识多个对象,则此变量会更有用。
  4. 向新信息板添加折线图小工具:Widget” > “Line chart
    1. 将默认资产类型更改为虚拟机:单击Virtual machine” > “Latency-Total
    2. 单击Filter by” > “Name” > “$var1
    3. 更改信息板上的时间段:Override dashboard time” > “On” > “7 days
    您可以使用任一预设选项或通过指定自定义时间范围来更改显示内容的持续时间。
    此信息板将显示虚拟机在您指定时间段内的 “IOPS-Total” 。
  5. 为此小工具指定一个名称并进行保存。

结果

您的小工具应包含类似于下图的数据:

在所显示的 7 天内,此虚拟机在某个时段表现出异常高的瞬时延迟。

将某个对象的总延迟与排名前 10 位的对象的总延迟进行比较

以下步骤将对某个虚拟机的总延迟与整个虚拟基础架构中总延迟排名前 10 位的虚拟机进行比较。

步骤

  1. 向新信息板添加包含折线图的小工具:Widget” > “Line Chart
    1. 将默认设备更改为虚拟机:单击Storage” > “Virtual machine” > “Latency-total
      此小工具将在一个分区图中显示所有虚拟机在默认 24 小时内的总延迟。
    2. 在此小工具中创建另一个显示区,用于显示所有虚拟机的平均总延迟:Widget” > “Line chart
    3. 将默认设备更改为虚拟机:单击Storage” > “Virtual machine” > “Latency-Total
      此小工具将使用折线图显示默认 24 小时时间段内的总延迟。
    4. 单击 “Roll up” 栏上的 “X” ,然后选择Show” > “Top” > “10
    系统将根据“Latency - Total”显示排名前 10 位的虚拟机。
  2. 添加要与排名前 10 位的虚拟机比较的虚拟机:
    1. 单击 “+Add
    2. 将默认设备更改为虚拟机:单击Storage” > “Virtual machine” > “Latency total
    3. 单击Filter by” > “Name” > “$var1
  3. 单击 “Show legend

结果

可通过一个图例确定正在分析的每个虚拟机。您可以轻松地找出 VM_Exchange_1 并确定它是否存在与环境中排名前 10 位的虚拟机类似的延迟。

将总延迟排名前 10 位的对象与所有类似对象的平均延迟进行比较

您可能希望将总延迟排名前 10 位的虚拟机与平均总延迟进行比较,以确定严重超出平均范围的任何虚拟机。此信息可能有助于确定是否要对虚拟机上的工作负载进行平衡。

步骤

  1. 向新信息板添加包含堆积分区图的小工具:Widget” > “Stacked Area Chart
    1. 将默认设备更改为虚拟机:单击Storage” > “Virtual machine” > “Latency total
      此小工具将在一个堆积分区图中显示所有虚拟机在 24 小时内的总延迟。
    2. 在此小工具中创建另一个显示区,用于显示所有虚拟机的平均总延迟:Widget” > “Line chart
    3. 将默认设备更改为虚拟机:单击Virtual machine” > “Latency-total
      此小工具将使用折线图显示默认 24 小时时间段内的总延迟。
    4. 单击 “Roll up” 栏上的 “X” ,然后选择Show” > “Top” > “10
    系统将根据总延迟显示排名前 10 位的虚拟机。
  2. 要将所有虚拟机的平均总延迟与排名前 10 位的总 IOPS 进行比较,请执行以下步骤:
    1. 单击 “+Add
    2. 将默认设备更改为虚拟机:单击Storage” > “Virtual machine” > “IOPS total
    3. 单击 “Roll up” 栏上的 “X” ,然后选择Show” > “Top” > “10

    系统将在一个折线图中显示延迟较高的 10 个对象并显示平均延迟。

    此平均延迟为 1.6 毫秒,而在排名前 10 位的虚拟机中,有些虚拟机的延迟超过 200 毫秒。

比较指标 A 与指标 B 以显示类别和异常情况

可以使用散点图为每个对象显示两组数据。例如,可以指定为每个对象显示 IOPS 读取和总延迟。通过这种图表,您可以根据 IOPS 和延迟的组合来确定您认为有问题的对象。

步骤

  1. 向新信息板添加包含散点图的小工具:Widget” > “Scatter Plot Chart
  2. 将默认设备更改为虚拟机:单击Storage” > “Virtual machine” > “Latency total” > “IOPS Read
    此时,系统将显示一个类似于下图的散点图:

使用表达式标识备用指标

可以使用表达式来查看 Web UI 未提供的指标,例如代表所产生的系统开销的 IOPS。

关于本任务

您可能希望使用表达式来显示非读取或非写入操作(例如内部卷的开销操作)产生的总 IOPS。

步骤

  1. 向信息板添加一个小工具。选择 “Area chart” 。
  2. 将默认设备更改为内部卷:单击Storage” > “Internal volume” > “IOPS Write
  3. 单击 “Convert to Expression” 按钮。
  4. 此时, “IOPS - Write” 指标将显示在字母变量字段“a”中。
  5. “b”变量字段中,单击 “Select” 并选择“IOPS - Read”。
  6. 在 “Expression” 字段中,键入 “a + b” 。在 “Display” 部分中,为此表达式选择 “Area chart” 。
  7. 在 “Filter by” 字段中,输入要分析的内部卷的名称。
  8. Label” 字段用于标识此表达式。将此标签更改为一个有意义的文字,例如“R + W IOPS”
  9. 单击 “+Add” 向此小工具添加一条表示总 IOPS 的折线。
  10. 将默认设备更改为内部卷:单击Storage” > “Internal volume” > “IOPS Total
  11. 在 “Filter by” 字段中,输入要分析的内部卷的名称。

    此时,此图表会将总 IOPS 显示为一条折线,并以蓝色显示读取和写入 IOPS 的组合。9:30 与 9:45 之间的间隙表示非读取和非写入 IO(开销)操作。