Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

しきい値ベースのSPセンサーの読み取り値とステータスを使用したONTAPノードのヘルスモニタリング

共同作成者 netapp-sumathi netapp-aherbin netapp-dbagwell netapp-mwallis

しきい値ベースのセンサーは、さまざまなシステム コンポーネントの定期的な読み取り値を取得します。SPは、しきい値ベースのセンサーの読み取り値と、事前に設定された制限値(コンポーネントで許容される動作状態を定義)を比較します。

センサーの読み取り値に基づいて、SPにセンサーの状態が表示されるため、コンポーネントの状態を監視するのに役立ちます。

しきい値ベースのセンサーには、システム温度、電圧、電流、ファン速度のセンサーなどがあります。しきい値ベースのセンサーの具体的な構成は、プラットフォームによって異なります。

しきい値ベースのセンサーには次のしきい値があり、SP `system sensors`コマンドの出力に表示されます:

  • Lower critical(LCR)

  • Lower noncritical(LNC)

  • Upper noncritical(UNC)

  • Upper critical(UCR)

センサーの読み取り値がLNCとLCRの間、またはUNCとUCRの間にあるのは、コンポーネントが問題の兆候を示しており、その結果システム障害が発生する可能性があることを意味しています。そのため、コンポーネントの保守計画をすぐに策定する必要があります。

センサーの読み取り値がLCRより低い、またはUCRより高いのは、コンポーネントが誤動作しており、システム障害が発生しつつあることを意味しています。そのため、コンポーネントの問題にすぐに対処する必要があります。

次の図は、しきい値で指定される重大度の範囲を示しています。

しきい値によって指定された重大度の範囲

しきい値ベースセンサーの読み取り値は、 system sensors`コマンド出力の `Current`列に表示されます。 `system sensors get sensor_name`コマンドは、指定されたセンサーの詳細情報を表示します。しきい値ベースセンサーの読み取り値が非クリティカルしきい値とクリティカルしきい値の範囲を超えると、センサーは重大度が上昇する問題を報告します。読み取り値がしきい値を超えると、 `system sensors`コマンド出力におけるセンサーのステータスは、超過したしきい値に応じて `ok`から `nc(非クリティカル)または cr(クリティカル)に変わり、SELイベントログにイベントメッセージが記録されます。

しきい値ベースのセンサーの中には、4つのしきい値レベルをすべて備えていないものがあります。これらのセンサーの場合、不足しているしきい値は `system sensors`コマンド出力で制限値として `na`と表示されます。これは、特定のセンサーが特定のしきい値に対して制限値または重大度の問題を持っておらず、SPがそのしきい値についてセンサーを監視していないことを示します。

system sensorsコマンド出力の例

次の例は、SP CLI の `system sensors`コマンドによって表示される情報の一部を示しています:

SP node1> system sensors

Sensor Name      | Current    | Unit       | Status| LCR       | LNC       | UNC       | UCR
-----------------+------------+------------+-------+-----------+-----------+-----------+-----------
CPU0_Temp_Margin | -55.000    | degrees C  | ok    | na        | na        | -5.000    | 0.000
CPU1_Temp_Margin | -56.000    | degrees C  | ok    | na        | na        | -5.000    | 0.000
In_Flow_Temp     | 32.000     | degrees C  | ok    | 0.000     | 10.000    | 42.000    | 52.000
Out_Flow_Temp    | 38.000     | degrees C  | ok    | 0.000     | 10.000    | 59.000    | 68.000
CPU1_Error       | 0x0        | discrete   | 0x0180| na        | na        | na        | na
CPU1_Therm_Trip  | 0x0        | discrete   | 0x0180| na        | na        | na        | na
CPU1_Hot         | 0x0        | discrete   | 0x0180| na        | na        | na        | na
IO_Mid1_Temp     | 30.000     | degrees C  | ok    | 0.000     | 10.000    | 55.000    | 64.000
IO_Mid2_Temp     | 30.000     | degrees C  | ok    | 0.000     | 10.000    | 55.000    | 64.000
CPU_VTT          | 1.106      | Volts      | ok    | 1.028     | 1.048     | 1.154     | 1.174
CPU0_VCC         | 1.154      | Volts      | ok    | 0.834     | 0.844     | 1.348     | 1.368
3.3V             | 3.323      | Volts      | ok    | 3.053     | 3.116     | 3.466     | 3.546
5V               | 5.002      | Volts      | ok    | 4.368     | 4.465     | 5.490     | 5.636
STBY_1.8V        | 1.794      | Volts      | ok    | 1.678     | 1.707     | 1.892     | 1.911
…
閾値ベースのセンサーのsystem sensors sensor_nameコマンド出力の例

次の例は、しきい値ベース センサー 5V の SP CLI に system sensors get `sensor_name`を入力した結果を示しています。

SP node1> system sensors get 5V

Locating sensor record...
Sensor ID              : 5V (0x13)
 Entity ID             : 7.97
 Sensor Type (Analog)  : Voltage
 Sensor Reading        : 5.002 (+/- 0) Volts
 Status                : ok
 Lower Non-Recoverable : na
 Lower Critical        : 4.246
 Lower Non-Critical    : 4.490
 Upper Non-Critical    : 5.490
 Upper Critical        : 5.758
 Upper Non-Recoverable : na
 Assertion Events      :
 Assertions Enabled    : lnc- lcr- ucr+
 Deassertions Enabled  : lnc- lcr- ucr+