デバイス障害診断の実行

診断プログラムを実行すると、特定のデバイスへのアクセスが断続的になる理由や、ストレージ システムでデバイスが使用できなくなる理由の特定に役立ちます。

手順

  1. ストレージ システムのプロンプトで、LOADERプロンプトに切り替えます。halt
  2. LOADERプロンプトで、次のコマンドを入力します。boot_diags
    注: システムレベルの診断が正しく機能するためには、このコマンドをLOADERプロンプトから実行する必要があります。boot_diagsコマンドは、システムレベルの診断専用に設計された特別なドライバを実行します。
  3. 次のコマンドを入力して、問題の原因となっているデバイスの診断を実行します。sldiag device run [-dev devtype|mb|slotslotnum] [-name device]
    • -dev devtypeには、テストするデバイスの種類を指定します。
      • ataは、Advanced Technology Attachmentデバイスです。
      • bootmediaは、システムのブート デバイスです。
      • cnaは、ネットワークやストレージ デバイスに接続されていない統合ネットワーク アダプタです。
      • envは、マザーボード環境です。
      • fcacheは、Flash Cacheアダプタです(Performance Acceleration Module 2とも呼ばれます)。
      • fcalは、ストレージ デバイスやファイバチャネル ネットワークに接続されていないFibre Channel-Arbitrated Loopデバイスです。
      • fcviは、ファイバチャネル ネットワークに接続されていないファイバチャネル仮想インターフェイスです。
      • interconnectまたはnvram-ibは、高可用性インターフェイスです。
      • memはシステム メモリです。
      • nicは、ネットワークに接続されていないネットワーク インターフェイス カードです。
      • nvramは、不揮発性RAMです。
      • nvmemは、NVRAMとシステム メモリの組み合わせです。
      • sasは、ディスク シェルフに接続されていないSerial Attached SCSIデバイスです。
      • serviceprocはサービス プロセッサです。
      • storageは、ディスク シェルフに接続されたATA、FC-AL、またはSASインターフェイスです。
      • toeは、TCPオフロード エンジン(NICの一種)です。
    • mbは、すべてのマザーボード デバイスをテストすることを指定します。
    • slot slotnumは、特定のスロット番号のデバイスをテストすることを指定します。
    • -namedeviceでは、特定のデバイス クラスと種類を指定します。
  4. 次のコマンドを入力して、テストのステータスを表示します。sldiag device status
    テストが実行中の間、ストレージ システムは次の出力を表示します。
    There are still test(s) being processed.
    すべてのテストが完了すると、デフォルトで次の応答が表示されます。
    *> <SLDIAG:_ALL_TESTS_COMPLETED>
  5. 次のコマンドを入力して、ハードウェアの問題を特定します。sldiag device status [-dev devtype|mb|slotslotnum] [-name device] -long -state failed
    次の例は、FC-ALアダプタをテストし、障害の完全なステータスを表示する方法を示しています。
    *> sldiag device status fcal -long -state failed
    
    TEST START ------------------------------------------
    DEVTYPE: fcal
    NAME: Fcal Loopback Test
    START DATE: Sat Jan  3 23:10:56 GMT 2009
    
    STATUS: Completed
    Starting test on Fcal Adapter: 0b
    Started gathering adapter info.
    Adapter get adapter info OK 
    Adapter fc_data_link_rate: 1Gib
    Adapter name: QLogic 2532
    Adapter firmware rev: 4.5.2
    Adapter hardware rev: 2
     
    Started adapter get WWN string test.
    Adapter get WWN string OK wwn_str: 5:00a:098300:035309
     
    Started adapter interrupt test
    Adapter interrupt test OK
     
    Started adapter reset test.
    Adapter reset OK
     
    Started Adapter Get Connection State Test.
    Connection State: 5
    Loop on FC Adapter 0b is OPEN 
     
    Started adapter Retry LIP test
    Adapter Retry LIP OK
     
    ERROR: failed to init adaptor port for IOCTL call
    
    ioctl_status.class_type = 0x1
    
    ioctl_status.subclass = 0x3
    
    ioctl_status.info = 0x0
     Started INTERNAL LOOPBACK: 
    INTERNAL LOOPBACK   OK
    Error Count: 2  Run Time: 70 secs
    >>>>> ERROR, please ensure the port has a shelf or plug.
    END DATE: Sat Jan  3 23:12:07 GMT 2009
    
    LOOP: 1/1
    TEST END --------------------------------------------
    
    システムレベルの診断のテスト結果 操作
    いくつかのテストが失敗した場合 問題の原因を特定します。
    1. 次のコマンドを入力してメンテナンス モードを終了します。halt
    2. クリーン シャットダウンを実行し、電源装置の接続を解除します。
    3. ケーブルがしっかりと接続されているかどうか、ハードウェア コンポーネントがストレージ システムに適切に取り付けられているかどうかなど、システムレベルの診断を実行するための考慮事項をすべて確認します。
    4. 電源装置を再接続し、ストレージ システムの電源をオンにします。
    5. デバイス障害診断の実行の手順1~5を繰り返します。
    同じテスト エラーが発生した場合 テクニカル サポートから、一部のテストのデフォルト設定を変更して問題を特定することを推奨される場合があります。
    1. 次のコマンドを入力して、ストレージ システム上で選択するデバイスまたはデバイス タイプを変更します。sldiag device modify [-dev devtype|mb|slotslotnum] [-name device] [-selection enable|disable|default|only]

      -selection enable|disable|default|onlyを使用すると、指定したデバイス タイプまたはデバイスのデフォルトの選択を有効にしたり(enable)、無効にしたり(disable)、そのまま使用したり(default)できます。また、他のすべてのデバイスを無効にし、指定したデバイス タイプまたはデバイスのみを有効にする(only)ことができます。

    2. 次のコマンドを入力して、テストが変更されたことを確認します。sldiag option show
    3. デバイス障害診断の実行の手順3~5を繰り返します。
    4. 問題を特定して解決したら、手順1と2を繰り返してテストをデフォルトの状態にリセットします。
    5. デバイス障害診断の実行の手順1~5を繰り返します。
    失敗なしで完了した場合 ハードウェアに問題はなく、ストレージ システムはプロンプトに戻ります。
    1. 次のコマンドを入力して、ステータス ログをクリアします。sldiag device clearstatus [-dev devtype|mb|slotslotnum]
    2. 次のコマンドを入力して、ログがクリアされたことを確認します。sldiag device status [-dev devtype|mb|slotslotnum]

      次のデフォルトの応答が表示されます。

      SLDIAG: No log messages are present.
    3. 次のコマンドを入力してメンテナンス モードを終了します。halt
    4. Loaderプロンプトで次のコマンドを入力して、ストレージ システムをブートします。boot_ontap

    これで、システムレベルの診断が完了しました。

終了後の操作

同じ手順を繰り返しても問題が解決しない場合は、ハードウェアを交換する必要があります。