システムレベルの診断の実行

コントローラを交換するたびに、特定のコンポーネントとサブシステムについて包括的な診断テストまたは集中的な診断テストを実行する必要があります。

開始する前に

タスク概要

診断手順のコマンドは、すべてコンポーネントを交換するノードから実行します。

手順

  1. 作業をするノードにLOADERプロンプトが表示されていない場合は、ノードをリブートします。halt
    コマンドを実行したら、システムがLOADERプロンプトで停止するまで待ちます。
  2. LOADERプロンプトで、システムレベルの診断用に特別に設計されたドライバにアクセスします。boot_diags
    ブート プロセス中、メンテナンス モードのプロンプト(*>)が表示されるまではプロンプトに対して「y」と入力できます。
  3. コントローラ モジュール上の使用可能なデバイスを表示し、メモします。sldiag device show -dev mb
    コントローラ モジュールのデバイスおよびポートとして、次のいくつかが表示されます。
    • bootmediaは、システムのブート デバイスです。
    • cnaは、ネットワークやストレージ デバイスに接続されていない統合ネットワーク アダプタまたはインターフェイスです。
    • fcalは、Fibre Channelネットワークに接続されていないFibre Channel-Arbitrated Loopデバイスです。
    • envは、マザーボード環境です。
    • memはシステム メモリです。
    • nicは、ネットワーク インターフェイス カードです。
    • nvramは、不揮発性RAMです。
    • nvmemは、NVRAMとシステム メモリの組み合わせです。
    • sasは、ディスク シェルフに接続されていないSerial Attached SCSIデバイスです。
  4. 必要に応じて診断を実行します。
    診断テストを実行する対象 操作
    個々のコンポーネント
    1. ステータス ログを消去します。sldiag device clearstatus
    2. 選択したデバイスに対して実行できるテストを表示します。sldiag device show -dev dev_name

      dev_name には、前述の手順で特定したポートとデバイスのいずれかを指定します。

    3. 出力を確認し、必要に応じて実行するテストのみを選択します。sldiag device modify -dev dev_name -selection only

      -selection onlyを指定すると、デバイスに対して実行しないその他のテストがすべて無効になります。

    4. 選択したテストを実行します。sldiag device run -dev dev_name
      テストが完了すると次のメッセージが表示されます。
      *> <SLDIAG:_ALL_TESTS_COMPLETED>
    5. 失敗したテストがないことを確認します。sldiag device status -dev dev_name -long -state failed

      テストに成功した場合は、プロンプトに戻ります。失敗があった場合、そのステータスがすべて表示されます。

    同時に複数のコンポーネント
    1. 前述の手順の出力で有効なデバイスと無効なデバイスを確認し、同時に実行するデバイスを決定します。
    2. デバイスに対して実行できるテストを表示します。sldiag device show -dev dev_name
    3. 出力を確認し、必要に応じて実行するテストのみを選択します。sldiag device modify -dev dev_name -selection only

      -selection onlyを指定すると、デバイスに対して実行しないその他のテストがすべて無効になります。

    4. テストが変更されたことを確認します。sldiag device show
    5. 同時に実行するデバイスごとに上記の手順を繰り返します。
    6. すべてのデバイスの診断を実行します。sldiag device run
      注意: 診断を開始したら、エントリの追加や変更はしないでください。
      テストが完了すると次のメッセージが表示されます。
      *> <SLDIAG:_ALL_TESTS_COMPLETED>
    7. ノードにハードウェアの問題がないことを確認します。sldiag device status -long -state failed

      テストに成功した場合は、プロンプトに戻ります。失敗があった場合、そのステータスがすべて表示されます。

  5. 前述の手順の結果に応じて、次に進みます。
    システムレベルの診断のテスト結果 操作
    失敗なしで完了した場合
    1. ステータス ログを消去します。sldiag device clearstatus
    2. ログが消去されたことを確認します。sldiag device status

      次のデフォルトの応答が表示されます。

      SLDIAG: No log messages are present.
    3. メンテナンス モードを終了します。halt

      LOADERプロンプトが表示されます。

    これで、システムレベルの診断が完了しました。

    いくつかのテストが失敗した場合 問題の原因を特定します。
    1. メンテナンス モードを終了します。halt
    2. クリーン シャットダウンを実行し、電源装置の接続を解除します。
    3. システムレベルの診断を実行するための考慮事項をすべて確認するとともに、ケーブルがしっかりと接続されているか、ハードウェア コンポーネントがストレージ システムに適切に取り付けられているかを確認します。
    4. 電源装置を再接続し、ストレージ システムの電源をオンにします。
    5. システムレベルの診断テストを再実行します。