しきい値ベースのSPセンサーの読み取り値とステータスを使用したONTAPノードのヘルスモニタリング
しきい値ベースのセンサーは、さまざまなシステム コンポーネントの定期的な読み取り値を取得します。SPは、しきい値ベースのセンサーの読み取り値と、事前に設定された制限値(コンポーネントで許容される動作状態を定義)を比較します。
センサーの読み取り値に基づいて、SPにセンサーの状態が表示されるため、コンポーネントの状態を監視するのに役立ちます。
しきい値ベースのセンサーには、システム温度、電圧、電流、ファン速度のセンサーなどがあります。しきい値ベースのセンサーの具体的な構成は、プラットフォームによって異なります。
しきい値ベースのセンサーには次のしきい値があり、SP `system sensors`コマンドの出力に表示されます:
-
Lower critical(LCR)
-
Lower noncritical(LNC)
-
Upper noncritical(UNC)
-
Upper critical(UCR)
センサーの読み取り値がLNCとLCRの間、またはUNCとUCRの間にあるのは、コンポーネントが問題の兆候を示しており、その結果システム障害が発生する可能性があることを意味しています。そのため、コンポーネントの保守計画をすぐに策定する必要があります。
センサーの読み取り値がLCRより低い、またはUCRより高いのは、コンポーネントが誤動作しており、システム障害が発生しつつあることを意味しています。そのため、コンポーネントの問題にすぐに対処する必要があります。
次の図は、しきい値で指定される重大度の範囲を示しています。

しきい値ベースセンサーの読み取り値は、 system sensors`コマンド出力の `Current`列に表示されます。 `system sensors get sensor_name`コマンドは、指定されたセンサーの詳細情報を表示します。しきい値ベースセンサーの読み取り値が非クリティカルしきい値とクリティカルしきい値の範囲を超えると、センサーは重大度が上昇する問題を報告します。読み取り値がしきい値を超えると、 `system sensors`コマンド出力におけるセンサーのステータスは、超過したしきい値に応じて `ok`から `nc(非クリティカル)または cr(クリティカル)に変わり、SELイベントログにイベントメッセージが記録されます。
しきい値ベースのセンサーの中には、4つのしきい値レベルをすべて備えていないものがあります。これらのセンサーの場合、不足しているしきい値は `system sensors`コマンド出力で制限値として `na`と表示されます。これは、特定のセンサーが特定のしきい値に対して制限値または重大度の問題を持っておらず、SPがそのしきい値についてセンサーを監視していないことを示します。
次の例は、SP CLI の `system sensors`コマンドによって表示される情報の一部を示しています:
SP node1> system sensors Sensor Name | Current | Unit | Status| LCR | LNC | UNC | UCR -----------------+------------+------------+-------+-----------+-----------+-----------+----------- CPU0_Temp_Margin | -55.000 | degrees C | ok | na | na | -5.000 | 0.000 CPU1_Temp_Margin | -56.000 | degrees C | ok | na | na | -5.000 | 0.000 In_Flow_Temp | 32.000 | degrees C | ok | 0.000 | 10.000 | 42.000 | 52.000 Out_Flow_Temp | 38.000 | degrees C | ok | 0.000 | 10.000 | 59.000 | 68.000 CPU1_Error | 0x0 | discrete | 0x0180| na | na | na | na CPU1_Therm_Trip | 0x0 | discrete | 0x0180| na | na | na | na CPU1_Hot | 0x0 | discrete | 0x0180| na | na | na | na IO_Mid1_Temp | 30.000 | degrees C | ok | 0.000 | 10.000 | 55.000 | 64.000 IO_Mid2_Temp | 30.000 | degrees C | ok | 0.000 | 10.000 | 55.000 | 64.000 CPU_VTT | 1.106 | Volts | ok | 1.028 | 1.048 | 1.154 | 1.174 CPU0_VCC | 1.154 | Volts | ok | 0.834 | 0.844 | 1.348 | 1.368 3.3V | 3.323 | Volts | ok | 3.053 | 3.116 | 3.466 | 3.546 5V | 5.002 | Volts | ok | 4.368 | 4.465 | 5.490 | 5.636 STBY_1.8V | 1.794 | Volts | ok | 1.678 | 1.707 | 1.892 | 1.911 …
次の例は、しきい値ベース センサー 5V の SP CLI に system sensors get `sensor_name`を入力した結果を示しています。
SP node1> system sensors get 5V Locating sensor record... Sensor ID : 5V (0x13) Entity ID : 7.97 Sensor Type (Analog) : Voltage Sensor Reading : 5.002 (+/- 0) Volts Status : ok Lower Non-Recoverable : na Lower Critical : 4.246 Lower Non-Critical : 4.490 Upper Non-Critical : 5.490 Upper Critical : 5.758 Upper Non-Recoverable : na Assertion Events : Assertions Enabled : lnc- lcr- ucr+ Deassertions Enabled : lnc- lcr- ucr+